Wat zijn de verschillende soorten datawarehouse-ontwerp?

Data warehouses slaan enorme hoeveelheden data op voor gebruik in veel verschillende velden. Er zijn twee hoofdtypen van datawarehouse-ontwerp: top-down en bottom-up. De twee ontwerpen hebben hun eigen voor- en nadelen. Bottom-up is eenvoudiger en goedkoper om te implementeren, maar het is minder compleet en datacorrelaties zijn sporadischer. In een top-down ontwerp zijn verbindingen tussen gegevens duidelijk en goed ingeburgerd, maar de gegevens kunnen verouderd zijn en het systeem is duur om te implementeren.

Datamarts zijn de centrale figuur in het ontwerp van het datawarehouse. Een datamart is een verzameling gegevens op basis van een enkel concept. Elke datamart is een unieke en complete subset van gegevens. Elk van deze collecties is intern volledig gecorreleerd en heeft vaak verbindingen met externe datamarts.

De manier waarop datamarts worden behandeld, is het belangrijkste verschil tussen de twee stijlen van datawarehouse-ontwerp. In het top-down ontwerp komen datamarts op natuurlijke wijze voor als gegevens in het systeem worden geplaatst. In het bottom-up ontwerp worden datamarts rechtstreeks gemaakt en met elkaar verbonden om het magazijn te vormen. Hoewel dit misschien een klein verschil lijkt, zorgt het voor een heel ander ontwerp.

De top-downmethode was het oorspronkelijke ontwerp van het datawarehouse. Met deze methode wordt alle informatie die de organisatie heeft in het systeem ingevoerd. Elk breed onderwerp krijgt een eigen algemeen gebied binnen de databases. Terwijl de gegevens worden gebruikt, verschijnen er verbindingen tussen correlatieve gegevenspunten en verschijnen gegevensmarts. Bovendien blijven alle gegevens in het systeem voor altijd daar - zelfs als de gegevens worden vervangen of gebagatelliseerd door latere informatie, blijven ze in het systeem als een record van gebeurtenissen uit het verleden.

De bottom-up methode voor datawarehouse-ontwerp werkt vanuit de tegenovergestelde richting. Een bedrijf zet informatie in als een zelfstandige datamart. Naarmate de tijd verstrijkt, worden andere datasets aan het systeem toegevoegd, hetzij als hun eigen datamart of als onderdeel van een dat al bestaat. Wanneer twee datamarts als voldoende verbonden worden beschouwd, worden ze samengevoegd tot een enkele eenheid.

De twee datawarehouse-ontwerpen hebben elk hun eigen sterke en zwakke punten. De top-down methode is een enorm project voor nog kleinere gegevenssets. Omdat grote projecten ook duurder zijn, is het het duurst in termen van geld en mankracht. Als het datawarehouse klaar en onderhouden is, is het een uitgebreide verzameling met alles wat het bedrijf weet.

Het bottom-up proces is veel sneller en goedkoper, maar omdat de gegevens naar behoefte worden ingevoerd, zal de database nooit volledig zijn. Bovendien zijn de correlaties tussen datamarts slechts zo sterk als het gebruik ervan maakt. Als er een sterke correlatie bestaat, maar er geen gebruikers zijn, blijft deze los.

ANDERE TALEN

heeft dit artikel jou geholpen? bedankt voor de feedback bedankt voor de feedback

Hoe kunnen we helpen? Hoe kunnen we helpen?