Was ist Data Warehouse -Architektur?
Data Warehouse Architecture ist ein Design, das alle Facetten der Data Warehousing für eine Unternehmensumgebung zusammenfasst. Data Warehousing ist die Erstellung einer zentralen Domäne zum Speichern komplexer, dezentraler Unternehmensdaten in einer logischen Einheit, die Data Mining, Business Intelligence und Gesamtzugriff auf alle relevanten Daten innerhalb einer Organisation ermöglicht. Die Data Warehouse -Architektur umfasst alle Berichterstellungsanforderungen, Datenverwaltung, Sicherheitsanforderungen, Bandbreitenanforderungen und Speicheranforderungen. Dieses Design sollte als Blaudruck für die Enterprise -Datenarchitektur betrachtet werden. Insbesondere sollten bei der Berücksichtigung der Data Warehouse -Architektur mehrere Primärbereiche entwickelt werden. Diese Bereiche sind Zugang zum Quellsystem, Prozessbereichsprozess, Datenanreicherungsprozess, Datenarchitektur, Business Intelligence PRVoraussetzungen und Speicheranforderungen.
Data Warehousing erfordert, dass Quelldaten aus einer Transaktions- oder Datenbank mit Datensatz in das Data Warehouse übertragen werden. Dieser Prozess wird in den Begriff Extrahiert Transformation und Last (ETL) vereinfacht, der die Bereiche des Zugriffs, der Datenanreicherung und der Datenarchitektur von Quellensystemen im Grunde genommen zusammenfasst. Aus Gründen der Klarheit ist es besser, diese architektonischen Bereiche im Detail zu entwerfen, wodurch der ETL -Prozess erreicht wird. Während einige Daten aus den Quellsystemen erforderlich sind, sind alle Daten nicht wünschenswert, da sie das Enterprise -Lagerhaus überlasten würden. Die primären Bereiche von Sorge bei der Bekämpfung der Quellsystemschicht sind Datenzugriffsmethoden, Daten, die aus dem Quellsystem erforderlich sind, und die Aktualisierungsanforderungen.
Die nächste Data Warehousing -Architekturschicht ist der Staging -Bereichsprozess. Da die meisten Daten aus Quellsystemen wieder sindQuire -Validierung und Datenreinigung, es ist wichtig, eine Landezone für Quelldaten zu erstellen, die Sie vor dem Laden in die Geschäftsregelnebene des Data Warehouse befinden können. Der Staging -Bereich hält Rohdaten -Feeds von Quellsystemen bei, die in der Regel zeitlich gestempelt sind, um die jüngste Daten zu gewährleisten.
Der Prozess der Datenanreicherung oder des Geschäftsregelns wird von Daten gereinigt, um das gewünschte Ergebnis des Data Warehouse zu erfüllen. Ein gutes Beispiel für diesen Reinigungsansatz ist die Verwendung von Adressreinigungswerkzeugen. Für den Fall, dass das Quellsystem falsche Daten hat, wird der Datenanreicherungsprozess die Adresse aus dem Rohdatensatz in ein Geschäftsregelsystem ausgeführt, das ungültige Adressen korrigiert. Dies ist auch die Zeit, in der ungenaue Daten gelöscht oder geändert werden, um die Vollständigkeit innerhalb des Data Warehouse zu gewährleisten.
Die nächste Schicht ist die Datenarchitekturschicht. In diesem Bereich wird das wahre Design oder das wahre Schema des Enterprise Data Warehouse abgeschlossen. Data Warehousing in nicht aKombination aller Datensätze innerhalb eines Unternehmens, aber stattdessen handelt es sich um eine neu definierte Datenbank, um einen Überblick über alle Geschäftseinrichtungen innerhalb des Unternehmens zu ermöglichen.
Dies erfordert die Datenarchitektur, um die Fragen zu beantworten, die das Unternehmen im Bereich von Business Intelligence und Data Mining gestellt werden. Durch das Erstellen der Datenarchitektur auf diese Weise werden die Rohdatensätze in Fakt-Tabellen umgewandelt, mit denen die Benutzer AD-hoc-Berichterstattung in der gesamten Unternehmensansicht ausführen können, anschließend eine bestimmte Datenbank. Dies ist auch der Bereich, der Metadaten über die Daten aus dem Rohsystem unterhält, die den Namen des Quellsystems oder die Primärschlüssel enthalten können.
Der nächste Bereich ist die Business Intelligence- und Berichtsanforderungen. Diese Ebene kann als die vom Benutzeranwendungen für die Data Warehousing angesehen werden. In der Regel enthält dieser Bereich Dosenberichte, Ad-hoc-Berichtsfunktionen und Enterprise-Dash-Boards oder Warnungen. Das BussinESS-Intelligenzschichten erhalten normalerweise die größte Überlegung, da es die einzige nach außen gerichtete Komponente innerhalb des Data Warehouse ist.
Die endgültige Überlegungen sind die Anforderungen und Wartung der Datenspeicherung und Wartung. Da ein Data Warehouse weiter wächst und erweitert, muss die Datenspeicherung von Benutzerbasis streng verwaltet und gewartet werden. Bei der Erstellung der Data Warehouse -Architektur sollte das Design außerdem realistische Schätzungen darüber vornehmen, was erforderlich ist, um eine Datenspeicherkapazität sowie eine Band mit Datenzugriffskapazität zu erhalten. Diese Anforderungen werden kritisch sein, da das Data Warehouse im gesamten Unternehmen weit verbreitet ist.