Was ist eine Data Mining -Klassifizierung?

Klassifizierung von Data Mining ist ein Schritt im Prozess des Data Mining. Es wird verwendet, um Elemente basierend auf bestimmten Schlüsselmerkmalen zu gruppieren. Für die Klassifizierung von Data Mining werden verschiedene Techniken verwendet, einschließlich der Klassifizierung des nächsten Nachbarn, Entscheidungsbaumlernen und Support -Vektor -Maschinen. Im Allgemeinen wird eine repräsentative Probe aus dem Datenpool ausgewählt und dann manipuliert und analysiert, um Muster zu finden. Zusätzlich zur Klassifizierung von Data Mining können Forscher auch Clustering-, Regressions- und Regellernen verwenden, um die Daten zu analysieren. Die Klassifizierung der nächsten Nachbarn ist eine der einfachsten der Data Mining -Klassifizierungsalgorithmen. Es basiert auf einem Trainingssatz. Ein Trainingssatz ist eine Reihe von Daten, mit denen der Computer auf bestimmte Variablen geachtet wird. In der nächstgelegenen Nachbarklassifizierung einfach CLA CLASSIFIRIEN ALLE Daten als Teil der Gruppe, die Daten enthält, die im Wert der Eingabe am nächsten stehen. Der Computer stellt im Grunde eine Reihe von Fragen zu den Daten. Wenn die Antwort auf die erste Frage wahr ist, stellt sie Frage 2A. Wenn die Antwort falsch ist, stellt sie Frage 2B. Wenn diese Methode herausgezogen wird, bildet diese Methode einen Baum von Verzweigungspfaden.

Naive Bayes -Klassifizierung hängt von der Wahrscheinlichkeit ab. Es wird eine Reihe von Fragen zu jedem Datenstück gestellt und dann die Antworten verwendet, um die Wahrscheinlichkeit zu bestimmen, dass die Daten in eine bestimmte Klassifizierung gehören. Dies unterscheidet sich vom Lernen des Entscheidungsbaums, da die Antwort auf die erste Frage keinen Einfluss auf die nächste Frage hat.

kompliziertere Methoden der Data Mining -Klassifizierung umfassen neuronale Netze und Support -Vektormaschinen. Diese Methoden sind computergestützt mOdels, die von Hand schwer zu tun wären. Neuronale Netze werden häufig in der Programmierung künstlicher Intelligenz eingesetzt, da es das menschliche Gehirn nachahmt. Es filtert Informationen durch eine Reihe von Knoten, die Muster finden und dann die Informationen klassifizieren.

Support Vector -Maschinen verwenden Schulungsmuster, um ein Modell zu erstellen, das Informationen klassifiziert und normalerweise als Streudiagramm mit einem breiten Raum zwischen den Kategorien visualisiert wird. Wenn neue Informationen in die Maschine eingespeist werden, wird sie im Diagramm aufgetragen. Die Daten werden dann basierend auf der Kategorie klassifiziert, in der die Informationen in der Grafik am nächsten stehen. Diese Methode funktioniert nur, wenn zwei Optionen zur Auswahl stehen.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?