Was sind die wichtigsten Data Mining-Konzepte?
Die wichtigsten Data-Mining-Konzepte werden zur Analyse gesammelter Informationen verwendet, insbesondere im Hinblick auf die Beobachtung eines Verhaltens. Unbekannte Wechselwirkungen zwischen Daten werden auf verschiedene Weise untersucht, um kritische Beziehungen zwischen Probanden und aggregierten Informationen festzustellen. Eine Herausforderung beim Data Mining besteht darin, dass die tatsächlich gesammelten Informationen möglicherweise nicht an die gesamte Domäne erinnern. Um diesem Umstand Rechnung zu tragen, können Korrelationen zwischen den Daten durch die verschiedenen Data Mining-Konzepte methodisch gesteuert werden.
Die Standards für Data-Mining-Konzepte werden von der Special Interest Group der Association for Computing Machinery für Knowledge Discovery und Data Mining (SIGKDD) umgesetzt. Diese Organisation veröffentlicht das „International Journal of Information Technology and Decision Making“ sowie die Zeitschrift SIGKDD Explorations. Die Durchsetzung von Ethik und Grundprinzipien des Data Mining sorgt dafür, dass die Branche effizient und mit begrenzten rechtlichen Problemen arbeitet.
Die Vorverarbeitung der Informationen ist einer der wichtigsten Aspekte des Data Mining. Die Rohdaten müssen gewonnen und interpretiert werden. Um diese Aktion auszuführen, muss ein Prozess festgelegt werden, die Zieldaten sollten zusammengestellt und Muster gefunden werden. Der Prozess ist als Knowledge Discovery in Databases bekannt und wurde 1989 von Gregory Piatetsky-Shapiro entwickelt.
Vier verschiedene Klassen von Data Mining-Konzepten ermöglichen den Ablauf. Beim Clustering wird der aus dem Data Mining-Prozess erstellte Algorithmus verwendet, um Elemente zu ähnlichen Gruppen zusammenzufassen. Im Gegensatz zum Clustering erfolgt die Klassifizierung der Informationen, wenn die Daten in vordefinierten Gruppen zusammengefasst und analysiert werden. Die Zuordnung versucht, Beziehungen zwischen Variablen zu finden, um festzustellen, welche Datengruppen üblicherweise zugeordnet sind. Der letzte Typ des Data Mining ist die Regression , basierend auf der Methode zum Identifizieren einer Funktion innerhalb der Datenerfassung.
Die Überprüfung der Informationen ist der letzte Schritt, um herauszufinden, was die Data Mining-Anwendung darstellt. Wenn nicht alle Algorithmen einen gültigen Datensatz darstellen, können die auftretenden Muster zu einer Situation führen, die als Überanpassung bezeichnet wird. Um dieses Problem zu lösen, werden die Daten mit einem Testsatz verglichen. Dies ist ein Konzept, bei dem die Messungen mit einer Reihe von Algorithmen abgeglichen werden, die einen plausiblen Datensatz liefern. Wenn die erfassten Informationen nicht mit dem Testsatz übereinstimmen, müssen die angenommenen Muster in den Daten ungenau sein.
Einige der wichtigsten Data Mining-Konzepte kommen in verschiedenen Branchen vor. Gaming, Business, Marketing, Wissenschaft, Technik und Überwachung nutzen alle Data-Mining-Techniken. Durch die Durchführung dieser Techniken kann jedes Fachgebiet bewährte Verfahren oder bessere Methoden zum Erzielen von Ergebnissen ermitteln.