Co to są narzędzia wyszukiwania danych?
Narzędzia do eksploracji danych to komponenty i teorie oprogramowania, które pozwalają użytkownikom wydobywać informacje z danych. Narzędzia zapewniają osobom i firmom możliwość gromadzenia dużych ilości danych i wykorzystywania ich do ustalania konkretnego użytkownika lub grup użytkowników. Niektóre z najczęstszych zastosowań narzędzi do eksploracji danych dotyczą marketingu, ochrony przed oszustwami i nadzoru.
Ręczne wydobywanie danych istnieje od setek lat. Jednak automatyzacja eksploracji danych jest najbardziej rozpowszechniona od zarania epoki komputerów. W XX wieku pojawiły się różne informatyki, które wspierają koncepcję opracowywania narzędzi do eksploracji danych. Ogólnym celem wykorzystania narzędzi jest odkrycie ukrytych wzorów. Na przykład, jeśli firma marketingowa stwierdzi, że dana osoba wybiera się na comiesięczną podróż z Nowego Jorku do Los Angeles, korzystne jest, aby ta firma reklamowała szczegółowe informacje o miejscu docelowym.
W branży eksploracji danych ustanowiono standardy określające parametry wykorzystania narzędzi do eksploracji danych. Co roku SIGKDD (Association for Computing Machinery Special Group) ds. Odkrywania wiedzy i eksploracji danych (SIGKDD) organizuje spotkanie w celu ustalenia, jakie procesy są wykorzystywane. Ta sama grupa jest również odpowiedzialna za ocenę etycznych konsekwencji analizy danych od osób fizycznych i firm. Co dwa lata czasopismo publikowane jest przez grupę zatytułowaną SIGKDD Explorations.
Najbardziej rozpowszechnionym narzędziem wykorzystywanym w eksploracji danych jest proces o nazwie Knowledge Discovery in Databases (KDD). KDD został opracowany w 1989 roku przez Gregory Piatetsky-Shapiro. Za pomocą tego narzędzia do eksploracji danych użytkownicy mogą przetwarzać surowe dane, wydobywać dane w celu uzyskania informacji i interpretować różne wyniki w postaci zarządzania informacjami.
Jedna z najważniejszych form narzędzi do eksploracji danych służy do zwalczania terroryzmu w XXI wieku. W Stanach Zjednoczonych Narodowa Rada ds. Badań Naukowych wykorzystuje koncepcje eksploracji wzorców i eksploracji danych tematycznych w celu zidentyfikowania działalności terrorystycznej w dużej puli informacji na całym świecie. Eksploracja wzorców jest definiowana przez proces lokalizowania wzorców w dużej ilości danych. Eksploracja danych oparta na podmiotach próbuje zidentyfikować relacje między osobami. Obie techniki można również wykorzystać w ogólnej praktyce biznesowej poprzez zdefiniowanie sposobu myślenia bazy klientów i interaktywnych relacji między klientami.