Co je ETL?
Přemýšlejte o tom jako o úbytku pro vaše data. ETL znamená extrakt, transformaci a zatížení. ETL je software, který umožňuje podnikům konsolidovat jejich různorodá data při jejich přesunu z místa na místo a nezáleží na tom, že tato data jsou v různých formách nebo formátech. Data mohou pocházet z jakéhokoli zdroje. ETL je dostatečně výkonná, aby zvládla takové nerovnosti dat. Oddělení členství by mohlo seznamu zákazníka podle jména, zatímco účetní oddělení by mohlo zákazníka uvádět podle čísla. ETL může spojit všechna tato data a konsolidovat je do jednotné prezentace, například pro uložení v databázi nebo datovém skladu.
Dalším způsobem, jak společnosti používají ETL k trvalému přesunu informací do jiné aplikace. Například data zpracování slov mohou být převedena do čísel a písmen, které se snadněji sledují v tabulce nebo databázovém programu. To je zvláště užitečné při zálohování informací, když společnosti zcela přecházejí na nový software.
Jednou z důležitých funkcí ETL je data „očištění“. Konsolidační protokoly ETL také zahrnují eliminaci duplicitních nebo fragmentárních dat, takže to, co přechází z části E procesu do části L, se snáze asimiluje a/nebo ukládá. Takové čisticí operace mohou také zahrnovat odstranění určitých druhů dat z procesu. Pokud nechcete zahrnout určité informace, můžete přizpůsobit svůj ETL a odstranit tento druh informací z vaší transformace.
Část T rovnice je samozřejmě nejsilnější. ETL může transformovat nejen data z různých oddělení, ale také data z různých zdrojů. Například data v e -mailovém programu, jako je Microsoft OutlooK by mohla být transformována přímo spolu s daty z aplikace SAP výroby, přičemž výsledkem jsou data společného vlákna nakonec. Microsoft samozřejmě vytvoří balíček ETL, stejně jako Oracle a IBM.