Jaké jsou různé metody těžby dat?

Existuje celá řada různých metod těžby dat používaných jak v softwarových možnostech, tak v teoretických koncepcích. Umožňují uživatelům extrahovat informace z údajů shromážděných jednotlivci a společnostmi využívajícími různé nástroje. K určení různých faktorů u jediného subjektu nebo rozmanitosti subjektů lze použít velké množství dat. Tyto metody těžby dat se nejčastěji používají v polích ochrany podvodů, marketingu a dohledu. Moderní techniky však používají automatizované koncepty k poskytování podstatných údajů prostřednictvím počítačových zdrojů. Jak se během 20. století objevilo počítačové vědy, koncept metod těžby dat se vyvinul ve snaze překonat skryté vzorce ve velkých řádcích shromážděných dat. Dobrým příkladem je, když reklamní firma analyzující nákupní vzorce online zákazníka. Tato společnost pak může prodávat určité produkty, kteréJednotlivec může mít zájem o nákup.

Jedna technika těžby dat používaná běžně v oboru se nazývá objev znalostí v databázích (KDD). KDD, vyvinutá v roce 1989 Gregory Piatetsky-Shapiro, umožňuje uživatelům zpracovávat surová data, analyzovat informace pro nezbytná data a interpretovat výsledky. Tato metoda umožňuje uživatelům najít vzorce v algoritmech, ale obecná data však nejsou vždy přesná a mohou být sestavena kompromitujícími způsoby. Toto je známé jako Overfitting .

Metody základní těžby dat zahrnují čtyři konkrétní typy úkolů: klasifikace, shlukování, regrese a asociaci. klasifikace vezme přítomné informace a sloučí je do definovaných seskupení. Clustering odstraňuje definovaná seskupení a umožňuje, aby se data klasifikovala podle podobných položek. regrese se zaměřuje na funkci informací, modelováníúdaje o konceptu. Poslední metoda těžby dat, asociace , se pokouší najít vztahy mezi různými datovými zdroji.

Při použití různých metod těžby dat se určité standardy používají k určení, které parametry lze v procesu použít. Asociace pro výpočetní techniku ​​Machinery's Special Heated Group pro objevování znalostí a těžbu dat (SIGKDD) pořádá výroční schůzku, která určuje, které procesy jsou vhodné. Etické faktory jsou zváženy spolu s praktickými aplikacemi, aby našli nejlepší informace o jednotlivcích a společnostech. Tyto informace jsou zveřejněny v průmyslovém časopise s názvem sigkdd Explorations.

JINÉ JAZYKY

Pomohl vám tento článek? Děkuji za zpětnou vazbu Děkuji za zpětnou vazbu

Jak můžeme pomoci? Jak můžeme pomoci?