Was sind die wichtigsten Data Mining -Konzepte?
Die wichtigsten Data Mining -Konzepte werden für die Analyse gesammelten Informationen verwendet, insbesondere für die Bemühungen, ein Verhalten zu beobachten. Unbekannte Interaktionen zwischen Daten werden auf verschiedene Weise erforscht, um kritische Beziehungen zwischen Probanden und aggregierten Informationen zu ermitteln. Eine Herausforderung im Data Mining besteht darin, dass die erfassten Informationen möglicherweise nicht an die gesamte Domäne erinnern. Um diese Tatsache anzugehen, können Korrelationen zwischen den Daten durch die verschiedenen Data Mining -Konzepte methodisch gesteuert werden.
Standards für Data Mining -Konzepte werden vom Association for Computing Machinery Special Interest Group zur Wissenskondeckung und Data Mining (SIGKDD) durchgesetzt. Diese Organisation veröffentlicht die „Internationale Zeitschrift für Informationstechnologie und Entscheidungsfindung“ sowie die Journal sigkdd Explorations.> Die Vorverarbeitung der Informationen ist einer der wichtigsten Aspekte des Data Mining. Die Rohdaten müssen abgebaut und interpretiert werden. Um diese Aktion auszuführen, muss ein Prozess ermittelt werden, die Zieldaten sollten zusammengestellt und Muster gefunden werden. Der Prozess wird in Datenbanken als Knowledge Discovery bekannt und wurde 1989 von Gregory Piatetsky-Shapiro entwickelt.
Vier verschiedene Klassen von Data Mining -Konzepten ermöglichen es dem Prozess. clustering verwendet den aus dem Data Mining -Prozess erstellten Algorithmus, um Elemente in ähnliche Gruppen zusammenzustellen. Im Gegensatz zum Clustering ist die -Klassifizierung der Informationen, wenn die Daten in vordefinierte Gruppen zusammengestellt und analysiert werden. Assoziation Versuche, Beziehungen zwischen Variablen zu finden und zu bestimmen, welche Datengruppen üblicherweise zugeordnet sind. Die endgültige Art des Data Mining ist Regression basierend auf der Methode of Identifizieren einer Funktion innerhalb der Datenerfassung.
Die Validierung der Informationen ist der letzte Schritt, um herauszufinden, was die Data Mining -Anwendung darstellt. Wenn nicht alle Algorithmen einen gültigen Datensatz aufweisen, können die auftretenden Muster zu einer Situation führen, die als Überanpassung bezeichnet wird. Um dieses Problem zu überwinden, werden die Daten mit einem Testsatz verglichen. Dies ist ein Konzept, bei dem die Messungen mit einer Reihe von Algorithmen ausgerichtet sind, die einen plausiblen Satz von Datensätzen liefern. Wenn die erfassten Informationen nicht bis zum Testsatz übereinstimmen, müssen die angenommenen Muster in den Daten ungenau sein.
Einige der wichtigsten Data Mining -Konzepte treten in einer Vielzahl von Branchen auf. Spiele, Geschäft, Marketing, Wissenschaft, Ingenieurwesen und Überwachung verwenden alle Data Mining -Techniken. Durch Durchführung dieser Techniken kann jedes Feld Best Practices oder bessere Möglichkeiten ermitteln, um Ergebnisse zu finden.