Jakie są narzędzia do wydobywania danych?
Narzędzia do eksploracji danych to komponenty oprogramowania i teorie, które pozwalają użytkownikom wyodrębniać informacje z danych. Narzędzia zapewniają osobom i firmom możliwość gromadzenia dużych ilości danych i wykorzystywania ich do ustalenia określonego użytkownika lub grup użytkowników. Niektóre z najczęstszych zastosowań narzędzi wydobywania danych znajdują się w dziedzinie marketingu, ochrony oszustw i nadzoru.
Ręczna ekstrakcja danych istnieje od setek lat. Jednak automatyzacja eksploracji danych była najbardziej rozpowszechniona od zarania wieku komputerowego. W XX wieku pojawiły się różne nauki komputerowe, aby pomóc wesprzeć koncepcję opracowywania narzędzi do wydobywania danych. Ogólnym celem wykorzystania narzędzi jest odkrycie ukrytych wzorców. Na przykład, jeśli firma marketingowa stwierdzi, że dana osoba odbywa miesięczną wycieczkę z Nowego Jorku do Los Angeles, to firma jest korzystna dla tej firmy.
w DatUtworzono standardy branży wydobywczej, aby zdefiniować parametry korzystania z narzędzi wydobywania danych. Co roku stowarzyszenie specjalnej grupy zainteresowań Machinery w sprawie odkrywania wiedzy i wydobywania danych (SIGKDD) organizuje spotkanie w celu ustalenia, jakie procesy są używane. Ta sama grupa jest również odpowiedzialna za ocenę etycznych implikacji analizy danych od osób fizycznych i firm. Dziennik BianNual jest publikowany przez grupę zatytułowaną SIGKDD Explorations.
Najbardziej rozpowszechnionym narzędziem stosowanym w eksploracji danych jest proces zwany odkryciem wiedzy w bazach danych (KDD). KDD został opracowany w 1989 roku przez Gregory'ego Piatetsky-Shapiro. Korzystając z tego narzędzia do eksploracji danych, użytkownicy mogą przetwarzać surowe dane, wydobywać dane do informacji i interpretować różne wyniki w formie zarządzania informacjami.
Jedna z najważniejszych form narzędzi do wydobywania danych jest używana dla COMbating terroryzm w XXI wieku. W Stanach Zjednoczonych Krajowa Rada Badań wykorzystuje pojęcia wydobycia wzorców i wydobycie danych opartych na podmiotach, aby zidentyfikować działalność terrorystyczną w dużej puli informacji na całym świecie. Wydobycie wzorców jest zdefiniowane przez proces lokalizacji wzorów w dużej objętości danych. Oparte na tematyce próby eksploracji danych w celu zidentyfikowania relacji między jednostkami. Obie techniki można również wykorzystać w ogólnej praktyce biznesowej, określając sposób myślenia bazy klientów i interaktywne relacje między klientami.