Wat zijn de verschillende soorten datawarehouse-systemen?

Er zijn twee belangrijke datawarehouse-systemen; genormaliseerd en dimensionaal. In een genormaliseerde structuur zijn gegevens beperkt tot een eenvoudige presentatie van feitelijke informatie. Er is geen context of achtergrond aan de gegevens buiten wat de gebruiker bereid is te correleren. In een dimensionaal systeem komt de informatie in een context van andere feiten die laten zien wat de gegevens als geheel zijn. In dit geval is er een schat aan informatie beschikbaar, of u het nu wilt of niet.

De twee belangrijkste datawarehouse-systemen zijn de twee uitersten. In de meeste datawarehouses wordt een tussenweg tussen deze twee bereikt. De feitelijke beschrijvingen zijn voor de zuiverste vorm van de stijl, hoewel dat zelden wordt aangetroffen.

Genormaliseerde gegevens zijn eenvoudiger om de twee datawarehouse-systemen te implementeren en te manipuleren. In deze stijl wordt informatie teruggebracht tot individuele feiten zonder verbindingen met andere gegevens. Het serienummer van een product en de naam van het product worden bijvoorbeeld zonder extra informatie samengevoegd. De informatie is beschikbaar voor elke gebruiker die het wenst, maar zij moeten het werk doen om het alles te laten betekenen.

Om informatie te begrijpen in genormaliseerde datawarehouse-systemen, verzamelt de gebruiker verbonden informatie om een ​​volledige afbeelding aan elkaar te rijgen. Om het telefoonnummer van een klant te vinden, kan de bovenstaande informatie worden gekoppeld aan een serienummer en een accountnummer van de persoon die het item heeft gekocht. Dan kunnen het rekeningnummer en de naam worden gevonden. Ten slotte worden de naam en het telefoonnummer gevonden. Elk van deze stappen is een afzonderlijke databasequery die door de gebruiker wordt ingesteld om informatie te verzamelen.

Dimensionale gegevens zijn precies het tegenovergestelde. Over het algemeen zijn deze datawarehouse-systemen het gemakkelijkst voor mensen om te gebruiken, maar het moeilijkst te veranderen of te manipuleren. Wanneer informatie wordt verzameld, wordt alles gecombineerd tot één grote bal met gegevens. In plaats van een serie- en productnummer zou een volledige inkoopfactuur allemaal tegelijkertijd worden ingevoerd.

Als een gebruiker naar een telefoonnummer in een dimensionale database zou zoeken, zou het proces anders zijn. Het serienummer levert een volledige geschiedenis op voor die klant, namen en datums van alles wat ooit is gekocht en serviceaanvragen of -retouren. Bovendien zou elk adres en telefoonnummer dat de klant ooit heeft gebruikt, ook direct beschikbaar zijn. Het beeld is erg compleet, maar misschien zo compleet dat de benodigde informatie moeilijk te vinden is.

ANDERE TALEN

heeft dit artikel jou geholpen? bedankt voor de feedback bedankt voor de feedback

Hoe kunnen we helpen? Hoe kunnen we helpen?