Was ist Data Mining?

Data Mining verwendet eine relativ große Menge an Rechenleistung, die auf einem großen Datensatz arbeitet, um Regelmäßigkeiten und Verbindungen zwischen Datenpunkten zu bestimmen. Algorithmen, die Techniken aus Statistiken, maschinellem Lernen und Mustererkennung anwenden, werden verwendet, um große Datenbanken automatisch durchzuführen. Das Data Mining wird auch als Wissensabdeckung in Datenbanken (KDD) bekannt. In der Unternehmenswelt wird am häufigsten Data Mining verwendet, um die Richtung der Trends zu bestimmen und die Zukunft vorherzusagen. Es wird verwendet, um Modelle und Entscheidungsunterstützungssysteme zu erstellen, die den Menschen Informationen geben, die sie verwenden können. Data Mining spielt im Kampf gegen den Terrorismus eine vordere Rolle. Es wurde angeblich verwendet, um den Anführer der 9/11-Angriffe zu bestimmen.Ring , Holdout-Methode , k-fach Kreuzvalidierung , die Leave-One-Out-Methode usw. Regressionstechniken werden verwendet, um irrelevante Muster zu subtrahieren und nur nützliche Informationen zu hinterlassen. Der Begriff Bayes'sche wird häufig vor Ort gesehen, wobei sich auf eine Klasse von Inferenztechniken bezieht, die die Wahrscheinlichkeit künftiger Ereignisse vorhersagen, indem frühere Wahrscheinlichkeiten und Wahrscheinlichkeiten auf der Grundlage bedingter Ereignisse kombiniert werden. Die Spam -Filterung ist wohl eine Form des Data Mining, die automatisch relevante Nachrichten von einem chaotischen Meer von Phishing -Versuchen und Viagra -Stellplätzen auf die Oberfläche bringt.

Entscheidungsbäume werden verwendet, um Datenberge zu filtern. In einem Entscheidungsbaum werden alle Daten durch einen Eingangsknoten geleitet, wo es einem Filter gegenübersteht, der die Daten in Abhängigkeit von seinen Eigenschaften in Streams auftrennt. Zum Beispiel dürften Daten über das Verbraucherverhalten basierend auf D gefiltert werdenemografische Faktoren. Bei Data Mining geht es nicht in erster Linie um ausgefallene Graphen und Visualisierungstechniken, sondern um sie, um zu zeigen, was es gefunden hat. Es ist bekannt, dass wir statistische Informationen visuell als verbal absorbieren können, und dieses Format zur Präsentation kann sehr überzeugend und leistungsfähig sein, wenn sie im richtigen Kontext verwendet werden.

Da unsere Zivilisation zunehmend zu daten gesättigt wird und Sensoren massenhaft in unsere lokalen Umgebungen verteilt werden, werden wir versehentlich Dinge entdecken, die beim ersten Durchgang möglicherweise übersehen werden könnten. Durch Data Mining können wir diese Fehler korrigieren und neue Erkenntnisse basierend auf früheren Daten ermitteln, wodurch wir mehr für unser Datenspeicherbock geknallt werden.

ANDERE SPRACHEN

War dieser Artikel hilfreich? Danke für die Rückmeldung Danke für die Rückmeldung

Wie können wir helfen? Wie können wir helfen?