Vad är datalagerarkitektur?
Datalagerarkitektur är en design som innehåller alla aspekter av datalagring för en företagsmiljö. Datalagring är skapandet av en central domän för att lagra komplexa, decentraliserade företagsdata i en logisk enhet som möjliggör datavyvning, affärsinformation och övergripande tillgång till all relevant information inom en organisation. Datalagerarkitektur inkluderar alla rapporteringskrav, datahantering, säkerhetskrav, bandbreddskrav och lagringskrav.
När du skapar en datalagerarkitektur är det viktigt att dela upp arkitekturen i specifika domäner som förenas till en helhetlig slutlig design. Denna design bör betraktas som den blåa texten för företagets dataarkitektur. I synnerhet bör flera primära områden utvecklas när man överväger datalagerarkitektur. Dessa områden är tillgång till källsystem, staging area process, data anriching process, databasarkitektur, business intelligence process och lagringskrav.
Datalagring kräver att källdata överförs från en transaktion eller databas med post till datalageret. Denna process förenklas till termen Extract Transform and Load (ETL), som i princip kapslar in områdena med källsystemets åtkomst, datarikning och dataarkitektur. För tydlighetens skull är det bättre att utforma dessa arkitektoniska områden i detalj, vilket beskriver hur ETL-processen ska uppnås. Medan vissa data krävs från källsystemen, är alla data inte önskvärda eftersom det skulle överbelasta företagets lager. De främsta problemområdena när man adresserar källsystemsskiktet är datatillgångsmetodologier, data som krävs från källsystemet och uppdateringskrav.
Nästa arkitekturlager för datalagring som ska beaktas är processen för iscensättning. Eftersom de flesta data från källsystem kommer att kräva validering och rensning av data, är det viktigt att skapa en landningszon för källdata att ligga innan de laddas i datalagerets affärsreglerlager. Sceneringsområdet upprätthåller rådataflöden från källsystem som vanligtvis är tidsstämplade för att säkerställa datorns nyhet.
Processen för anrikning av data eller affärsregler är där data rengörs för att möta det önskade resultatet av datalageret. Ett bra exempel på denna rengöringsmetod är att använda adressrensningsverktyg; i händelse av att källsystemet har felaktiga data kommer datainrikningsprocessen att köra adressen från rådatauppsättningen till ett affärsregelsystem som skulle korrigera ogiltiga adresser. Detta är också den tid då felaktiga data raderas eller modifieras för att säkerställa fullständighet i datalageret.
Nästa skikt att överväga är dataarkitekturskiktet. Detta område är där den verkliga designen eller schemat för företagets datalager är klar. Datalagring i inte en kombination av alla datauppsättningar i ett företag, utan istället är det en ny definierad databas byggd för att möjliggöra en översikt över alla affärsenheter inom företaget.
Detta kräver dataarkitekturen för att besvara de frågor som kommer att ställas av verksamheten inom området för affärsintelligens och data mining. Genom att skapa dataarkitekturen på detta sätt omvandlas de rådata uppsättningarna till faktatabeller som gör att användarna kan utföra ad-hoc-rapportering på hela företagssynen snarare än en specifik databas. Detta är också det område som kommer att behålla metadata om data från det råa systemet, vilket kan inkludera källsystemets namn eller primära nycklar.
Nästa område att överväga är krav på affärsintelligens och rapportering. Detta lager kan betraktas som det användarvänliga kravet på datalagret. Vanligtvis innehåller detta område konserverade rapporter, ad-hoc-rapporteringsförmåga och företagets instrumentbrädor eller varningar. Business intelligence-lagren får normalt mest övervägande, eftersom det är den enda utåtriktade komponenten i datalageret.
Det sista lagret för övervägande är övergripande krav på datalagring och underhåll. Eftersom ett datalager fortsätter att växa och utvidgas, måste databaslagring av användare baseras strikt och underhållas. Samtidigt som datalagerarkitekturen skapas, bör designen göra realistiska uppskattningar av vad som kommer att krävas från en datalagringskapacitet samt ett band med datatillgångskapacitet. Dessa krav kommer att vara kritiska eftersom datavaruhuset används allmänt i hela företaget.