Co je ETL?
Představte si to jako úklid vašich dat. ETL znamená extrakt, transformace a zatížení. ETL je software, který umožňuje podnikům konsolidovat jejich různorodá data a zároveň je přemísťovat z místa na místo, a nezáleží na tom, že tato data jsou v různých formách nebo formátech. Data mohou pocházet z jakéhokoli zdroje. ETL je dostatečně silný, aby zvládl takové datové disparity.
Například finanční instituce může mít informace o zákazníkovi v několika odděleních a každé oddělení může mít informace o zákazníkovi uvedeny jiným způsobem. Členské oddělení může uvést zákazníka podle jména, zatímco účetní oddělení může uvést zákazníka podle čísla. ETL umí spojit všechna tato data a sloučit je do jednotné prezentace, například pro uložení do databáze nebo datového skladu.
Dalším způsobem, jakým společnosti používají ETL, je trvalé přesunutí informací do jiné aplikace. Například data pro zpracování textu mohou být přeložena do čísel a písmen, která lze snáze sledovat v tabulkovém nebo databázovém programu. To je zvláště užitečné při zálohování informací, protože společnosti přecházejí na nový software úplně.
Jednou z důležitých funkcí ETL je „čištění“ dat. Konsolidační protokoly ETL také zahrnují eliminaci duplicitních nebo fragmentárních dat, takže to, co přechází z části E procesu do části L, je snáze asimilovat a / nebo ukládat. Takové operace čištění mohou také zahrnovat vyloučení určitých druhů dat z procesu. Pokud nechcete zahrnout určité informace, můžete si přizpůsobit své ETL tak, aby z vaší transformace byly takové informace vyloučeny.
Část T rovnice je samozřejmě nejsilnější. ETL dokáže transformovat nejen data z různých oddělení, ale také data z různých zdrojů. Například data v e-mailovém programu, jako je Microsoft Outlook, by mohla být transformována přímo spolu s daty z výrobní aplikace SAP, výsledkem by pak byla data společného vlákna. Microsoft samozřejmě vyrábí balíček ETL, stejně jako Oracle a IBM.