Was ist der Unterschied zwischen Data Mining und Data Warehousing?
Die Begriffe Data Mining und Data Warehousing werden oft sowohl von geschäftlichen als auch von technischem Personal verwirrt. Das gesamte Datenmanagementbereich hat ein phänomenales Wachstum mit der Implementierung von Datenerfassungssoftwareprogrammen und den verringerten Kosten des Computerspeichers verzeichnet. Der Hauptzweck dieser beiden Funktionen besteht darin, die Tools und Methoden bereitzustellen, um die Muster und die Bedeutung in einer großen Datenmenge zu untersuchen. Data Mining ist die Verwendung der Mustererkennungslogik für Identitätstrends innerhalb eines Beispieldatensatzes und extrapoliert diese Informationen mit dem größeren Datenpool. Data Warehousing ist das Extrahieren und Speichern von Daten, um eine einfachere Berichterstattung zu ermöglichen.
Data Mining ist ein allgemeiner Begriff, der eine Reihe von Geschäftsprozessen beschreibt, die Muster aus Daten abgeben. In der Regel wird ein statistisches Analyse -Softwarepaket verwendet, um SPE zu identifizierenCific -Muster, basierend auf dem vom Endbenutzer generierten Datensatz und Abfragen. Eine typische Verwendung von Data Mining besteht darin, gezielte Marketingprogramme zu erstellen, Finanzbetrug zu identifizieren und ungewöhnliche Muster im Verhalten im Rahmen einer Sicherheitsüberprüfung zu kennzeichnen.
Ein hervorragendes Beispiel für das Data Mining ist der Prozess, der von Telefonunternehmen verwendet wird, um Produkte an bestehende Kunden zu vermarkten. Die Telefongesellschaft verwendet Data Mining Software, um auf die Datenbank mit Kundeninformationen zuzugreifen. Eine Abfrage wird geschrieben, um Kunden zu identifizieren, die das grundlegende Telefonpaket und den Internetdienst über einen bestimmten Zeitraum abonniert haben. Sobald dieser Datensatz ausgewählt ist, wird eine andere Abfrage geschrieben, um festzustellen, wie viele dieser Kunden während einer Test -Promotion kostenlose zusätzliche Telefonfunktionen ausnutzten. Die Ergebnisse dieser Data Mining -Übung zeigen VerhaltensmusterNutzung zusätzlicher Telefondienste.
Es ist wichtig zu beachten, dass der Hauptzweck des Data Mining darin besteht, Muster in den Daten zu erkennen. Die zur Definition des Probensatzes verwendeten Spezifikationen haben einen enormen Einfluss auf die Relevanz der Ausgabe und die Genauigkeit der Analyse. Wenn der Datensatz in ein bestimmtes geografisches Gebiet beschränkt ist, unterscheiden sich die Ergebnisse und Muster von einem breiteren Datensatz. Obwohl sowohl Data Mining als auch Data Warehousing mit großen Informationsvolumina funktionieren, sind die verwendeten Prozesse sehr unterschiedlich.
Ein Data Warehouse ist ein Softwareprodukt, mit dem große Datenmengen gespeichert und speziell entwickelte Abfragen und Berichte ausgeführt werden. Business Intelligence ist ein wachsendes Studienbereich, das sich auf Data Warehousing und verwandte Funktionen konzentriert. Diese Tools sollen Daten extrahieren und in einer Methode speichern, um eine verbesserte Systemleistung zu erzielen. Ein Großteil der Terminologie in Data Mining und Data WarehOussing ist gleich, was zu mehr Verwirrung führt.