Wat is datawarehouse -architectuur?

architectuur voor datawarehouse is een ontwerp dat alle facetten van data warehousing voor een enterprise -omgeving inkapselt. Data Warehousing is het creëren van een centraal domein om complexe, gedecentraliseerde bedrijfsgegevens op te slaan in een logische eenheid die datamining, business intelligence en algemene toegang tot alle relevante gegevens binnen een organisatie mogelijk maakt. Data Warehouse -architectuur is inclusief alle rapportagevereisten, gegevensbeheer, beveiligingsvereisten, bandbreedtevereisten en opslagvereisten.

Bij het maken van een datawarehouse -architectuur is het belangrijk om de architectuur te verbreken in specifieke domeinen die worden verbonden tot een holistisch definitief ontwerp. Dit ontwerp moet worden beschouwd als de blauwe afdruk voor de Enterprise Data Architecture. In het bijzonder moeten verschillende primaire gebieden worden ontwikkeld bij het overwegen van datawarehouse -architectuur. Deze gebieden zijn toegang tot het bronsysteem, het verzamelgebiedsproces, het gegevensverrijkingsproces, de dataarchitectuur, Business Intelligence PRocess en opslagvereisten.

Data Warehousing vereist dat brongegevens worden overgedragen van een transactionele of database van record in het datawarehouse. Dit proces is vereenvoudigd in de term Extract -transformatie en belasting (ETL), die in feite de gebieden van brontoegang, gegevensverrijking en data -architectuur inkapselt. Voor de duidelijkheid is het beter om deze architecturale gebieden in detail te ontwerpen, wat beschrijft hoe het ETL -proces zal worden bereikt. Hoewel sommige gegevens vereist zijn van de bronsystemen, zijn alle gegevens niet wenselijk omdat het het Enterprise Warehouse zou overbelasten. De primaire aandachtsgebieden bij het aanpakken van de bron van de bronsysteem zijn methoden voor gegevenstoegang, gegevens die vereist zijn van het bronsysteem en de vernieuwingsvereisten.

De volgende datawarehousing -architecturale laag om te overwegen is het verzamelgebiedsproces. Zoals de meeste gegevens van bronsystemen zullen zijnQuire -validatie en gegevensreiniging, het is belangrijk om een ​​landingszone te maken voor brongegevens om te verblijven voordat ze in de bedrijfsregelslaag van het datawarehouse worden geladen. Het staging -gebied onderhoudt onbewerkte gegevensfeeds van bronsystemen die doorgaans tijd worden gestempeld om de recentheid van gegevens te waarborgen.

Het procesverrijkings- of bedrijfsregelsproces is waar gegevens worden gereinigd om te voldoen aan de gewenste uitkomst van het datawarehouse. Een goed voorbeeld van deze reinigingsaanpak is het gebruik van adresreinigingsgereedschappen; In het geval dat het bronsysteem onjuiste gegevens heeft, wordt het gegevensverrijkingsproces het adres uitgevoerd van de onbewerkte gegevensset in een bedrijfsregelsysteem dat ongeldige adressen zou corrigeren. Dit is ook het moment waarop onnauwkeurige gegevens worden verwijderd of gewijzigd om de volledigheid binnen het datawarehouse te garanderen.

De volgende laag om te overwegen is de gegevensarchitectuurlaag. Dit gebied is waar het ware ontwerp of schema van het Enterprise Data Warehouse is voltooid. Data warehousing in niet eenCombinatie van alle gegevenssets binnen een onderneming, maar in plaats daarvan is het een nieuw gedefinieerde database die is gebouwd om een ​​overzicht van alle zakelijke entiteiten binnen de onderneming mogelijk te maken.

Dit vereist de gegevensarchitectuur om de vragen te beantwoorden die door het bedrijf zullen worden gesteld op het gebied van business intelligence en datamining. Door de data-architectuur op deze manier te maken, worden de onbewerkte gegevenssets omgezet in feittabellen waarmee gebruikers ad-hocrapportage kunnen uitvoeren over de volledige enterprise-weergave in plaats van een specifieke database. Dit is ook het gebied dat de metagegevens zal behouden over de gegevens van het onbewerkte systeem, waaronder de naam van de bronsysteem of primaire toetsen.

Het volgende gebied dat moet worden overwogen, is de eisen van de business intelligence en rapportages. Deze laag kan worden beschouwd als de gebruikersgerichte vereiste voor de datawarehousing. Doorgaans bevat dit gebied ingeblikte rapporten, ad-hoc rapportagemogelijkheden en bedrijfsstormen of meldingen. De BusinESS Intelligence-lagen worden normaal gesproken de meeste overweging, omdat het de enige naar buiten gerichte component is in het datawarehouse.

De uiteindelijke laag voor overweging is algemene vereisten voor gegevensopslag en onderhoud. Naarmate een datawarehouse blijft groeien en uitbreiden, moet de opslag van gegevens op gebruikersbasis strikt worden beheerd en onderhouden. Bovendien moet het ontwerp tijdens het creëren van de datawarehouse -architectuur realistische schattingen maken over wat nodig is om een ​​capaciteit van gegevensopslag te vormen, evenals een band met capaciteit voor gegevenstoegang. Deze vereisten zullen van cruciaal belang zijn omdat het datawarehouse op grote schaal wordt gebruikt in de hele onderneming.

ANDERE TALEN