Was sind die verschiedenen Arten von Data Warehouse-Systemen?
Es gibt zwei Hauptdatenlagersysteme. normalisiert und dimensioniert. In einer normalisierten Struktur beschränken sich die Daten auf eine einfache Darstellung von Sachinformationen. Es gibt keinen Kontext oder Hintergrund für die Daten, der über das hinausgeht, was der Benutzer zu korrelieren bereit ist. In einem dimensionalen System stehen die Informationen im Zusammenhang mit anderen Fakten, die zeigen, was die Daten insgesamt sind. In diesem Fall steht eine Fülle von Informationen zur Verfügung, egal ob Sie diese benötigen oder nicht.
Die beiden wichtigsten Data Warehouse-Systeme sind die beiden Extreme. In den meisten Data Warehouses wird ein Mittelweg zwischen diesen beiden erreicht. Die tatsächlichen Beschreibungen beziehen sich auf die reinste Form des Stils, auch wenn dies nur selten vorkommt.
Normalisierte Daten sind von den beiden Data Warehouse-Systemen einfacher zu implementieren und zu bearbeiten. In diesem Stil werden Informationen auf einzelne Fakten reduziert, ohne dass eine Verbindung zu anderen Daten besteht. Beispielsweise werden die Seriennummer eines Produkts und der Name des Produkts ohne zusätzliche Informationen zusammengestellt. Die Informationen stehen jedem Benutzer zur Verfügung, der sie haben möchte, aber er muss die Arbeit erledigen, damit sie etwas bedeuten.
Um Informationen in normalisierten Data Warehouse-Systemen zu verstehen, sammelt der Benutzer verbundene Informationen, um ein ganzes Bild zusammenzufügen. Um die Telefonnummer eines Kunden zu finden, können die obigen Informationen mit einer Seriennummer und einer Kontonummer der Person verknüpft werden, die den Artikel gekauft hat. Dann könnten die Kontonummer und der Name gefunden werden. Schließlich werden der Name und die Telefonnummer gefunden. Jeder dieser Schritte ist eine separate Datenbankabfrage, die vom Benutzer zum Sammeln von Informationen erstellt wird.
Maßangaben sind das genaue Gegenteil. Im Allgemeinen sind diese Data Warehouse-Systeme für den Menschen am einfachsten zu bedienen, jedoch am schwierigsten zu ändern oder zu manipulieren. Wenn Informationen gesammelt werden, wird alles zu einem großen Datenball zusammengefasst. Anstelle einer Serien- und Produktnummer würde eine gesamte Einkaufsrechnung gleichzeitig eingehen.
Wenn ein Benutzer in einer dimensionalen Datenbank nach einer Telefonnummer suchen würde, wäre der Prozess anders. Die Seriennummer würde einen vollständigen Verlauf für diesen Kunden, Namen und Daten von allem, was jemals gekauft wurde, und etwaige Serviceanrufe oder Rücksendungen ergeben. Außerdem wäre jede Adresse und Telefonnummer, die der Kunde jemals verwendet hat, direkt verfügbar. Das Bild ist sehr vollständig, aber vielleicht so vollständig, dass die erforderlichen Informationen schwer zu finden sind.