Co jsou nástroje pro těžbu dat?

Nástroje pro těžbu dat jsou softwarové komponenty a teorie, které umožňují uživatelům extrahovat informace z dat. Nástroje poskytují jednotlivcům a společnostem schopnost shromažďovat velké množství dat a používat je k provedení určení konkrétního uživatele nebo skupin uživatelů. Některé z nejčastějších použití nástrojů pro těžbu dat jsou v oblasti marketingu, ochrany podvodů a dohledu.

Manuální extrakce dat existuje již stovky let. Automatizace těžby dat však byla nejčastější od úsvitu počítačového věku. Během 20. století se objevily různé počítačové vědy, které pomohly podpořit koncept vývoje nástrojů pro těžbu dat. Celkovým cílem využití nástrojů je odhalit skryté vzory. Pokud například marketingová společnost zjistí, že osoba podnikne měsíční výlet z New Yorku do Los Angeles, je pro tuto společnost prospěšné inzerovat podrobnosti o cíli jednotlivci.

V rámci datByly stanoveny standardy těžebního průmyslu pro definování parametrů používání nástrojů pro těžbu dat. Každoročně uspořádá Asociace pro výpočetní strojní zájmová skupina pro objevování znalostí a těžbu dat (SIGKDD), aby určila, jaké procesy se používají. Stejná skupina je také zodpovědná za posouzení etických důsledků analýzy dat jednotlivců a společností. Biannual Journal je publikován skupinou s názvem sigkdd Explorations.

Nejčastějším nástrojem používaným při těžbě dat je proces nazývaný objev znalostí v databázích (KDD). KDD byl vyvinut v roce 1989 Gregory Piatetsky-Shapiro. Pomocí tohoto nástroje pro těžbu dat jsou uživatelé schopni zpracovávat surová data, těžit data pro informace a interpretovat různé výsledky ve formě správy informací.

Jedna z nejdůležitějších forem nástrojů pro těžbu dat se používá pro COMbatování terorismu v 21. století. Ve Spojených státech používá Národní rada pro výzkum koncepty těžby vzorů a těžby dat založené na předmětu k identifikaci teroristické činnosti ve velkém souboru informací po celém světě. Dolování vzorů je definována procesem lokalizace vzorů ve velkém objemu dat. Dolování dat založené na subjektu se pokouší identifikovat vztahy mezi jednotlivci. Obě techniky lze také využít v obecné obchodní praxi definováním myšlení zákaznické základny a interaktivního vztahu mezi zákazníky.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?