Vad är Data Warehouse Architecture?
Data Warehouse Architecture är en design som omsluter alla aspekter av datalagring för en företagsmiljö. Datalager är skapandet av en central domän för att lagra komplexa, decentraliserade företagsdata i en logisk enhet som möjliggör data mining, affärsintelligens och total tillgång till all relevant data inom en organisation. Datalagerarkitektur inkluderar alla rapporteringskrav, datahantering, säkerhetskrav, krav på bandbredd och lagringskrav.
När du skapar en datalagerarkitektur är det viktigt att dela upp arkitekturen i specifika domäner som är förenade i en holistisk slutlig design. Denna design bör betraktas som det blå utskriften för företagets dataarkitektur. I synnerhet bör flera primära områden utvecklas när man överväger datalagerarkitektur. Dessa områden är källsystemåtkomst, iscensättningsprocess, dataanrikningsprocess, dataarkitektur, Business Intelligence PRocess och lagringskrav.
Datalagring kräver att källdata överförs från en transaktionell eller databas med post till datalageret. Denna process förenklas i termen Extract Transform and Load (ETL), som i princip kapslar in områdena för källsystemåtkomst, dataanrikning och dataarkitektur. För tydlighetens skull är det bättre att utforma dessa arkitektoniska områden i detalj, som beskriver hur ETL -processen kommer att uppnås. Medan vissa data krävs från källsystemen, är all data inte önskvärd eftersom de skulle överbelasta företagets lager. De primära områdena som är oroade när man adresserar källsystemskiktet är datatillgångsmetoder, data som krävs från källsystemet och uppdateringskrav.
Nästa datalagring av arkitektoniskt lager att överväga är iscenesättningsområdet. Som de flesta data från källsystem kommer att reQuire Validation and Data Cleansing, det är viktigt att skapa en landningszon för att källdata ska vara bosatta innan de laddas i affärsreglerna i datalageret. Stagningsområdet upprätthåller rådata -flöden från källsystem som vanligtvis är tidsstämpel för att säkerställa att datas nyligen genomförda.
Processen för dataanrikning eller affärsregler är där data rengörs för att möta det önskade resultatet av datalageret. Ett bra exempel på denna rengöringsmetod är att använda adressrengöringsverktyg; I händelse av att källsystemet har felaktiga data kommer datainrikningsprocessen att köra adressen från rådatauppsättningen till ett affärsregelsystem som skulle korrigera ogiltiga adresser. Detta är också tiden där felaktiga data raderas eller modifieras för att säkerställa fullständighet inom datalageret.
Nästa lager att överväga är dataarkitekturlagret. Detta område är där den verkliga designen eller schemat i företagets datalager är klar. Datalagring i inte enKombination av alla datamängder inom ett företag, men istället är det en nyligen definierad databas byggd för att möjliggöra en översikt över alla affärsenheter inom företaget.
Detta kräver att dataarkitekturen svarar på de frågor som kommer att ställas av verksamheten inom området affärsintelligens och data mining. Genom att skapa dataarkitekturen på detta sätt kommer rådatauppsättningarna att omvandlas till fakta tabeller som gör att användarna kan utföra ad-hoc-rapportering om hela företagsvyn snarare än en specifik databas. Detta är också det område som kommer att upprätthålla metadata om data från RAW -systemet, som kan inkludera källsystemnamnet eller primära nycklar.
Nästa område att överväga är kraven på affärsintelligens och rapportering. Detta lager kan betraktas som det användarvända kravet för datalagret. Vanligtvis innehåller detta område konserverade rapporter, ad-hoc-rapporteringskapacitet och företagsstreckbrädor eller varningar. BusinESS Intelligence Layers får normalt mest hänsyn, eftersom det är den enda utåtvända komponenten inom datalageret.
Det slutliga lagret för övervägande är övergripande datalagringskrav och underhåll. När ett datalager fortsätter att växa och expandera måste användarlagring av användarbas hanteras och underhålls strikt. Dessutom, medan du skapar datalagerarkitekturen, bör designen göra realistiska uppskattningar om vad som kommer att krävas från en datalagringskapacitet samt ett band med datatillgångskapacitet. Dessa krav kommer att vara kritiska när datalageret blir allmänt används i hela företaget.