Was sind Data Mining-Tools?
Data Mining-Tools sind Softwarekomponenten und Theorien, mit denen Benutzer Informationen aus Daten extrahieren können. Die Tools bieten Einzelpersonen und Unternehmen die Möglichkeit, große Datenmengen zu erfassen und anhand dieser Daten Bestimmungen über einen bestimmten Benutzer oder mehrere Benutzergruppen vorzunehmen. Einige der häufigsten Anwendungen von Data Mining-Tools liegen in den Bereichen Marketing, Betrugsschutz und Überwachung.
Die manuelle Datenextraktion existiert seit Hunderten von Jahren. Die Automatisierung des Data Mining war jedoch seit Beginn des Computerzeitalters am weitesten verbreitet. Im 20. Jahrhundert tauchten verschiedene Computerwissenschaften auf, um das Konzept der Entwicklung von Data-Mining-Tools zu unterstützen. Das übergeordnete Ziel der Verwendung der Werkzeuge besteht darin, verborgene Muster aufzudecken. Wenn beispielsweise ein Marketingunternehmen feststellt, dass eine Person eine monatliche Reise von New York City nach Los Angeles unternimmt, ist es für dieses Unternehmen von Vorteil, dem Einzelnen Einzelheiten zum Ziel bekannt zu machen.
Innerhalb der Data Mining-Branche wurden Standards festgelegt, um die Parameter für die Verwendung von Data Mining-Tools zu definieren. Jährlich veranstaltet die Fachgruppe für Wissensermittlung und Data Mining der Association for Computing Machinery (SIGKDD) ein Treffen, um festzulegen, welche Prozesse verwendet werden. Dieselbe Gruppe ist auch dafür verantwortlich, die ethischen Auswirkungen der Analyse von Daten von Einzelpersonen und Unternehmen zu bewerten. Eine halbjährlich erscheinende Zeitschrift wird von der Gruppe SIGKDD Explorations herausgegeben.
Das im Data Mining am häufigsten verwendete Tool ist der Prozess "Knowledge Discovery in Databases" (KDD). KDD wurde 1989 von Gregory Piatetsky-Shapiro entwickelt. Mit diesem Data Mining-Tool können Benutzer Rohdaten verarbeiten, die Daten für Informationen abbauen und die verschiedenen Ergebnisse in Form von Informationsmanagement interpretieren.
Eine der wichtigsten Formen des Data Mining wird zur Bekämpfung des Terrorismus im 21. Jahrhundert eingesetzt. In den Vereinigten Staaten verwendet der National Research Council die Konzepte des Pattern Mining und des subjektbasierten Data Mining, um terroristische Aktivitäten in dem großen Pool von Informationen auf der ganzen Welt zu identifizieren. Pattern Mining wird durch das Auffinden von Mustern innerhalb eines großen Datenvolumens definiert. Das subjektbasierte Data Mining versucht, Beziehungen zwischen Personen zu identifizieren. Beide Techniken können auch in der allgemeinen Geschäftspraxis eingesetzt werden, indem die Denkweise eines Kundenstamms und die interaktive Beziehung zwischen Kunden definiert werden.