Hva er de forskjellige typene datavarehusdesign?
Datalager lagrer enorme mengder data for bruk på mange forskjellige felt. Det er to hovedtyper av datavarehusdesign: ovenfra og ned og nederst. De to designene har sine egne fordeler og ulemper. Bottom-up er enklere og billigere å implementere, men det er mindre komplett, og datakorrelasjoner er mer sporadiske. I en top-down design er forbindelser mellom data åpenbare og veletablerte, men dataene kan være utdaterte, og systemet er kostbart å implementere.
Data-marts er den sentrale figuren i datavarehusdesign. En datamart er en samling av data basert på et enkelt konsept. Hver datamart er et unikt og komplett undergruppe av data. Hver av disse samlingene er fullstendig korrelert internt og har ofte tilkoblinger til eksterne datamarter.
Måten Data Marts håndteres er hovedforskjellen mellom de to stilene til datavarehusdesign. I top-down design forekommer datamarter naturlig ettersom data settes inn i systemet. I bunnen opp design, dATA Marts er laget direkte og koblet sammen for å danne lageret. Selv om dette kan virke som en mindre forskjell, gir det en veldig annen design.
Top-down-metoden var den originale datavarehusdesignet. Ved hjelp av denne metoden blir all informasjonen organisasjonen har lagt inn i systemet. Hvert bredt emne vil ha sitt eget generelle område i databasene. Når dataene brukes, vil tilkoblinger vises mellom korrelative datapunkter, og datamarts vises. I tillegg forblir data i systemet der for alltid - selv om dataene blir erstattet eller trivialisert av senere informasjon, vil de holde seg i systemet som en oversikt over tidligere hendelser.
Bottom-up-metoden for datavarehusdesign fungerer fra motsatt retning. Et selskap legger inn informasjon som en frittstående datamart. Når tiden går, blir andre datasett lagt til i systemet, enten som deres egen data mart or som en del av en som allerede eksisterer. Når to datamarter anses som koblet nok, smelter de sammen til en enkelt enhet.
De to datavarehusdesignene har hver sine sterke og svake punkter. Top-down-metoden er et stort prosjekt for enda mindre datasett. Siden store prosjekter også er mer kostbare, er det det dyreste når det gjelder penger og arbeidskraft. Hvis datavarehuset er ferdig og vedlikeholdt, er det en enorm samling, som inneholder alt som selskapet vet.
Bottom-up-prosessen er mye raskere og billigere, men siden dataene er lagt inn etter behov, vil databasen aldri være fullført. I tillegg er korrelasjoner mellom datamarter bare like sterke som bruken gjør dem. Hvis det eksisterer en sterk korrelasjon, men ingen brukere ser det, blir den uten sammenkoblet.