Was ist der Unterschied zwischen Data Mining und Data Warehousing?
Die Begriffe Data Mining und Data Warehousing werden häufig sowohl vom kaufmännischen als auch vom technischen Personal verwechselt. Das gesamte Gebiet der Datenverwaltung hat mit der Implementierung von Datenerfassungssoftwareprogrammen und den verringerten Kosten für Computerspeicher ein phänomenales Wachstum erlebt. Der Hauptzweck dieser beiden Funktionen besteht darin, die Werkzeuge und Methoden bereitzustellen, mit denen die Muster und die Bedeutung einer großen Datenmenge untersucht werden können.
Die Hauptunterschiede zwischen Data Mining und Data Warehousing sind der Systementwurf, die verwendete Methodik und der Zweck. Beim Data Mining wird die Mustererkennungslogik verwendet, um Identitätstrends in einem Beispieldatensatz zu identifizieren und diese Informationen auf den größeren Datenpool zu extrapolieren. Beim Data Warehousing werden Daten extrahiert und gespeichert, um die Berichterstellung zu vereinfachen.
Data Mining ist ein allgemeiner Begriff, der eine Reihe von Geschäftsprozessen beschreibt, die Muster aus Daten ableiten. In der Regel wird ein Softwarepaket für statistische Analysen verwendet, um bestimmte Muster auf der Grundlage des vom Endbenutzer generierten Datensatzes und der Abfragen zu identifizieren. Ein typischer Einsatz von Data Mining besteht darin, gezielte Marketingprogramme zu erstellen, Finanzbetrug zu identifizieren und ungewöhnliche Verhaltensmuster im Rahmen einer Sicherheitsüberprüfung zu kennzeichnen.
Ein hervorragendes Beispiel für Data Mining ist der Prozess, mit dem Telefongesellschaften Produkte an bestehende Kunden vermarkten. Die Telefongesellschaft verwendet Data Mining-Software, um auf ihre Datenbank mit Kundeninformationen zuzugreifen. Es wird eine Abfrage geschrieben, um Kunden zu identifizieren, die das Basistelefonpaket und den Internetdienst über einen bestimmten Zeitraum abonniert haben. Sobald dieser Datensatz ausgewählt ist, wird eine weitere Abfrage geschrieben, um zu ermitteln, wie viele dieser Kunden während einer Testaktion kostenlose zusätzliche Telefonfunktionen in Anspruch genommen haben. Die Ergebnisse dieser Data Mining-Übung zeigen Verhaltensmuster auf, die einen Marketingplan vorantreiben oder verbessern können, um die Nutzung zusätzlicher Telefondienste zu erhöhen.
Es ist wichtig zu beachten, dass der Hauptzweck des Data Mining darin besteht, Muster in den Daten zu erkennen. Die zur Definition des Probensatzes verwendeten Spezifikationen haben einen großen Einfluss auf die Relevanz der Ausgabe und die Genauigkeit der Analyse. Zurück zum obigen Beispiel: Wenn der Datensatz auf Kunden in einem bestimmten geografischen Gebiet beschränkt ist, weichen die Ergebnisse und Muster von einem breiteren Datensatz ab. Obwohl sowohl Data Mining als auch Data Warehousing mit großen Informationsmengen arbeiten, sind die verwendeten Prozesse sehr unterschiedlich.
Ein Data Warehouse ist ein Softwareprodukt, mit dem große Datenmengen gespeichert und speziell gestaltete Abfragen und Berichte ausgeführt werden. Business Intelligence ist ein wachsendes Forschungsgebiet, das sich auf Data Warehousing und damit verbundene Funktionen konzentriert. Mit diesen Tools können Daten extrahiert und in einer Methode gespeichert werden, die für eine verbesserte Systemleistung sorgt. Ein Großteil der Terminologie in Data Mining und Data Warehousing ist identisch, was zu größerer Verwirrung führt.