Was sind die verschiedenen Data Mining-Methoden?
Es gibt eine Vielzahl unterschiedlicher Data Mining-Methoden, die sowohl in Softwareoptionen als auch in theoretischen Konzepten verwendet werden. Mithilfe dieser Tools können Benutzer Informationen aus Daten extrahieren, die von Einzelpersonen und Unternehmen mithilfe verschiedener Tools gesammelt wurden. Große Datenmengen können verwendet werden, um verschiedene Faktoren in einem einzelnen Subjekt oder einer Vielzahl von Subjekten zu bestimmen. Diese Data-Mining-Methoden werden am häufigsten in den Bereichen Betrugsschutz, Marketing und Überwachung eingesetzt.
Seit Jahrhunderten werden Data-Mining-Methoden verwendet, um Informationen aus Probanden zu extrahieren. Moderne Techniken verwenden jedoch automatisierte Konzepte, um wesentliche Daten über computergestützte Ressourcen bereitzustellen. Mit dem Aufkommen der Informatik im 20. Jahrhundert entwickelte sich das Konzept der Data-Mining-Methoden, um verborgene Muster in großen Mengen gesammelter Daten zu überwinden. Ein gutes Beispiel dafür ist, wenn eine Werbeagentur das Einkaufsverhalten eines Online-Kunden analysiert. Dieses Unternehmen kann dann bestimmte Produkte vermarkten, an deren Kauf die betreffende Person interessiert sein könnte.
Eine in der Branche gebräuchliche Data-Mining-Technik heißt Knowledge Discovery in Databases (KDD). KDD wurde 1989 von Gregory Piatetsky-Shapiro entwickelt und ermöglicht es Benutzern, Rohdaten zu verarbeiten, die Informationen auf erforderliche Daten zu analysieren und die Ergebnisse zu interpretieren. Mit dieser Methode können Benutzer Muster in den Algorithmen finden. Die allgemeinen Daten sind jedoch nicht immer genau und können auf kompromittierende Weise zusammengestellt werden. Dies wird als Überanpassung bezeichnet .
Grundlegende Data Mining-Methoden umfassen vier bestimmte Aufgabentypen: Klassifizierung, Clustering, Regression und Zuordnung. Bei der Klassifizierung werden die vorhandenen Informationen in definierten Gruppierungen zusammengefasst. Durch das Clustering werden die definierten Gruppierungen entfernt, und die Daten können sich nach ähnlichen Elementen klassifizieren. Regression konzentriert sich auf die Funktion der Informationen und modelliert die Daten nach Konzept. Die endgültige Data Mining-Methode, die Zuordnung , versucht, Beziehungen zwischen den verschiedenen Datenfeeds zu finden.
Bei Verwendung der verschiedenen Data Mining-Methoden werden bestimmte Standards verwendet, um zu bestimmen, welche Parameter in dem Prozess verwendet werden können. Die SIGKDD (Association for Computing Machinery Special Interest Group für Knowledge Discovery und Data Mining) hält jährlich eine Sitzung ab, auf der festgelegt wird, welche Prozesse angemessen sind. Ethische Faktoren werden zusammen mit praktischen Anwendungen abgewogen, um die besten Informationen über Einzelpersonen und Unternehmen zu erhalten. Diese Informationen werden in einem Branchenjournal namens SIGKDD Explorations veröffentlicht.