Co je architektura datového skladu?
Architektura Data Warehouse je design, který zapouzdřuje všechny aspekty skladování dat pro podnikové prostředí. Skladování dat je vytvoření centrální domény pro ukládání komplexních decentralizovaných podnikových dat v logické jednotce, která umožňuje těžbu dat, obchodní inteligenci a celkový přístup ke všem relevantním datům v rámci organizace. Architektura datových skladů zahrnuje všechny požadavky na podávání zpráv, správu dat, požadavky na zabezpečení, požadavky na šířku pásma a požadavky na skladování. Tento návrh by měl být považován za modrý tisk pro architekturu podnikových dat. Zejména by se při zvažování architektury datových skladů mělo rozvíjet zejména několik primárních oblastí. Tyto oblasti jsou přístup ke zdrojovému systému, proces inscenace, proces obohacení dat, architektura dat, obchodní inteligence PRPožadavky na úložiště a úložiště.
Datová skladování vyžaduje přenos zdrojových dat z transakční nebo databáze záznamu do datového skladu. Tento proces je zjednodušen do termínu Transformace a zatížení termínu (ETL), který v podstatě zapouzdřuje oblasti přístupu ke zdrojovému systému, obohacení dat a architektury dat. Pro jasnost je lepší navrhnout tyto architektonické oblasti podrobně, což nastiňuje, jak bude proces ETL dosažen. Zatímco některá data jsou vyžadována ze zdrojových systémů, všechna data nejsou žádoucí, protože by přetížila podnikový sklad. Primárními oblastmi znepokojení při řešení vrstvy zdrojového systému jsou metodiky přístupu k datům, data požadovaná ze zdrojového systému a požadavky na obnovení.
Dalším architektonickou vrstvou skladů dat je zvážit proces inscenace. Protože většina dat ze zdrojových systémů budeOvěření quire a očištění dat je důležité vytvořit zónu přistání pro zdrojová data, která se bude pohybovat před načtením do vrstvy obchodních pravidel datového skladu. Oblast stagingu udržuje surové datové krmivy ze zdrojových systémů, které jsou obvykle časově vyraženy, aby byla zajištěna nedávnost dat.
Proces obohacení dat nebo obchodní pravidla je místem, kde jsou data vyčištěna pro splnění požadovaného výsledku datového skladu. Dobrým příkladem tohoto čisticího přístupu je použití nástrojů pro čištění adresy; V případě, že zdrojový systém má nesprávná data, proces obohacení dat spustí adresu ze sady surových dat do systému obchodních pravidel, který by napravil neplatné adresy. To je také doba, kdy jsou nepřesná data odstraněna nebo upravena, aby byla zajištěna úplnost ve skladu dat.
Další vrstvou, kterou je třeba zvážit, je vrstva architektury dat. Tato oblast je místem, kde je dokončen skutečný design nebo schéma podnikového datového skladu. Sklad dat v neKombinace všech souborů dat v rámci podniku, ale místo toho se jedná o nově definovanou databázi vytvořenou tak, aby umožnila přehled všech obchodních subjektů v rámci podniku.
To vyžaduje, aby datová architektura odpovídala na otázky, které bude obsahovat podnikání v oblasti obchodní inteligence a dolování dat. Vytvořením datové architektury tímto způsobem budou sady dat RAW transformovány na tabulky faktů, které uživatelům umožní provádět ad-hoc hlášení o celém pohledu Enterprise, spíše než konkrétní databázi. Toto je také oblast, která bude udržovat metadata o datech ze surového systému, které by mohly zahrnovat název zdrojového systému nebo primární klíče.
Další oblastí, kterou je třeba zvážit, jsou požadavky obchodní inteligence a podávání zpráv. Tuto vrstvu lze považovat za požadavek na uživatelsky zaměření pro skladování dat. Tato oblast obvykle obsahuje konzervované zprávy, schopnost hlášení ad-hoc a desky nebo upozornění podnikového pomlčky. BusinESS Intelligence Layers obvykle získává nejvíce zvážení, protože je to jediná komponenta směřující ven v datovém skladu.
Poslední vrstvou pro posouzení jsou celkové požadavky na ukládání dat a údržba. Vzhledem k tomu, že datový sklad neustále roste a rozšiřuje, musí být ukládání dat uživatelské základny přísně spravováno a udržováno. Navíc, při vytváření architektury datového skladu by měl návrh provést realistické odhady, co bude vyžadováno, z kapacity ukládání dat a také pás s kapacitou přístupu k datům. Tyto požadavky budou kritické, protože datový sklad se široce používá v celém podniku.