Was sind die verschiedenen Arten des Data Warehouse-Designs?
Data Warehouses speichern große Datenmengen zur Verwendung in vielen verschiedenen Bereichen. Es gibt zwei Haupttypen des Data Warehouse-Designs: Top-Down und Bottom-Up. Die beiden Designs haben ihre eigenen Vor- und Nachteile. Bottom-up ist einfacher und billiger zu implementieren, aber weniger vollständig, und die Datenkorrelationen sind sporadischer. In einem Top-Down-Design sind die Verbindungen zwischen Daten offensichtlich und gut etabliert, aber die Daten sind möglicherweise veraltet und die Implementierung des Systems ist kostenintensiv.
Data Marts sind die zentrale Figur im Data Warehouse Design. Ein Data Mart ist eine Sammlung von Daten, die auf einem einzigen Konzept basieren. Jeder Datamart ist eine eindeutige und vollständige Teilmenge von Daten. Jede dieser Sammlungen ist intern vollständig korreliert und verfügt häufig über Verbindungen zu externen Data Marts.
Der Umgang mit Data Marts ist der Hauptunterschied zwischen den beiden Arten des Data Warehouse-Designs. Beim Top-Down-Design treten Data Marts auf natürliche Weise auf, wenn Daten in das System eingegeben werden. Im Bottom-up-Design werden Data Marts direkt erstellt und miteinander verbunden, um das Lager zu bilden. Dies scheint zwar ein kleiner Unterschied zu sein, führt aber zu einem ganz anderen Design.
Die Top-Down-Methode war das ursprüngliche Data-Warehouse-Design. Mit dieser Methode werden alle Informationen, die die Organisation enthält, in das System eingespeist. Jedes breite Thema wird einen eigenen allgemeinen Bereich innerhalb der Datenbanken haben. Während die Daten verwendet werden, werden Verbindungen zwischen korrelativen Datenpunkten und Datenmarts angezeigt. Darüber hinaus bleiben alle Daten im System für immer erhalten - selbst wenn die Daten durch spätere Informationen ersetzt oder trivialisiert werden, bleiben sie als Aufzeichnung vergangener Ereignisse im System.
Die Bottom-up-Methode des Data-Warehouse-Designs funktioniert in die entgegengesetzte Richtung. Ein Unternehmen stellt Informationen als eigenständigen Datamart zur Verfügung. Im Laufe der Zeit werden dem System weitere Datensätze hinzugefügt, entweder als eigener Datamart oder als Teil eines bereits vorhandenen. Wenn zwei Data Marts als ausreichend verbunden angesehen werden, verschmelzen sie zu einer Einheit.
Die beiden Data Warehouse-Entwürfe haben jeweils ihre eigenen Stärken und Schwächen. Die Top-Down-Methode ist ein riesiges Projekt für noch kleinere Datenmengen. Da große Projekte auch teurer sind, ist es das teuerste in Bezug auf Geld und Arbeitskräfte. Wenn das Data Warehouse fertiggestellt und gewartet ist, handelt es sich um eine umfangreiche Sammlung, die alles enthält, was das Unternehmen weiß.
Der Bottom-up-Prozess ist viel schneller und kostengünstiger. Da die Daten jedoch nach Bedarf eingegeben werden, wird die Datenbank nie vollständig sein. Darüber hinaus sind die Korrelationen zwischen Data Marts nur so stark, wie sie durch ihre Verwendung hervorgerufen werden. Wenn eine starke Korrelation besteht, aber kein Benutzer sie sieht, wird die Verbindung getrennt.