Co jsou nástroje dolování dat?
Nástroje pro dolování dat jsou softwarové komponenty a teorie, které umožňují uživatelům extrahovat informace z dat. Tyto nástroje poskytují jednotlivcům a společnostem schopnost shromažďovat velké množství dat a používat je k určování konkrétního uživatele nebo skupin uživatelů. Některé z nejběžnějších způsobů využití nástrojů pro dolování dat jsou v oblasti marketingu, ochrany proti podvodům a dohledu.
Ruční extrakce dat existuje již stovky let. Automatizace dolování dat je však nejčastější od úsvitu věku počítačů. Během 20. století se objevily různé počítačové vědy, které pomáhaly podporovat koncepci vývoje nástrojů pro dolování dat. Celkovým cílem využití nástrojů je odhalit skryté vzorce. Například, pokud marketingová společnost zjistí, že osoba podniká měsíční cestu z New Yorku do Los Angeles, bude pro tuto společnost výhodné, aby inzerentovi poskytla podrobnosti o cíli.
V odvětví těžby dat byly stanoveny standardy pro definování parametrů použití nástrojů pro dolování dat. Každoročně pořádá Asociace pro výpočetní techniku zvláštní zájmovou skupinu pro získávání znalostí a těžbu dat (SIGKDD), aby určila, jaké procesy se používají. Stejná skupina je rovněž odpovědná za posouzení etických důsledků analýzy údajů od jednotlivců a společností. Skupina s názvem SIGKDD Explorations vydává dvouletý časopis .
Nejrozšířenějším nástrojem používaným při těžbě dat je proces zvaný Zjišťování znalostí v databázích (KDD). KDD vyvinula v roce 1989 Gregory Piatetsky-Shapiro. Pomocí tohoto nástroje pro dolování dat mohou uživatelé zpracovat nezpracovaná data, vytěžit data z informací a interpretovat různé výsledky ve formě správy informací.
Jedna z nejdůležitějších forem nástrojů pro dolování dat se používá v boji proti terorismu v 21. století. Ve Spojených státech používá Národní rada pro výzkum koncepty dolování vzorů a dolování dat podle subjektů k identifikaci teroristické činnosti ve velkém množství informací po celém světě. Dolování vzorů je definováno procesem lokalizace vzorů ve velkém objemu dat. Dolování dat podle subjektů se pokouší identifikovat vztahy mezi jednotlivci. Obě techniky lze také využít v běžné obchodní praxi definováním myšlení zákaznické základny a interaktivního vztahu mezi zákazníky.