Hvad er de forskellige typer datavarehusdesign?
Datavarehus gemmer store mængder data til brug i mange forskellige felter. Der er to hovedtyper af datalagerdesign: top-down og bottom-up. De to design har deres egne fordele og ulemper. Bottom-up er lettere og billigere at implementere, men det er mindre komplet, og datakorrelationer er mere sporadiske. I et top-down-design er forbindelser mellem data indlysende og veletablerede, men dataene kan være forældede, og systemet er dyrt at implementere.
Datamars er den centrale figur i design af datalager. En datamart er en samling af data, der er baseret på et enkelt koncept. Hver datamart er en unik og komplet undergruppe af data. Hver af disse samlinger er fuldstændigt korreleret internt og har ofte forbindelser til eksterne datamarkter.
Den måde, hvorpå datamarkter håndteres, er den største forskel mellem de to stilarter af datalagerdesign. I top-down-design forekommer datamarkeder naturligt, når data indsættes i systemet. I bottom-up-design oprettes datamark direkte og forbindes sammen for at danne lageret. Selvom dette kan virke som en mindre forskel, skaber det et meget anderledes design.
Top-down metoden var det originale datalagerdesign. Ved hjælp af denne metode indsættes al den information, organisationen har, i systemet. Hvert bredt emne har sit eget generelle område inden for databaserne. Når dataene bruges, vises forbindelser mellem korrelative datapunkter, og datamarker vises. Derudover forbliver alle data i systemet der for evigt - selvom dataene erstattes eller trivialiseres af senere information, forbliver de i systemet som en oversigt over tidligere begivenheder.
Bund-up-metoden til datalagerdesign fungerer i den modsatte retning. Et firma lægger information som en selvstændig datamart. Når tiden går, tilføjes andre datasæt til systemet, enten som deres egen datamart eller som en del af et, der allerede findes. Når to datamarkter betragtes som tilsluttet nok, smelter de sammen til en enkelt enhed.
De to datalagerdesign har hver deres egne stærke og svage punkter. Top-down metoden er et kæmpe projekt til endnu mindre datasæt. Da store projekter også er dyrere, er det det dyreste med hensyn til penge og arbejdskraft. Hvis datavarehuset er færdig og vedligeholdt, er det en enorm samling, der indeholder alt hvad virksomheden ved.
Bund-up-processen er meget hurtigere og billigere, men da dataene indtastes efter behov, vil databasen faktisk aldrig være komplet. Derudover er korrelationer mellem datamarkter kun så stærke, som deres anvendelse gør dem. Hvis der findes en stærk sammenhæng, men ingen brugere ser den, går den uden forbindelse.