Co to jest ETL?

Pomyśl o tym jak o house -kleining dla swoich danych. ETL oznacza ekstrakt, transformację i obciążenie. ETL to oprogramowanie, które umożliwia firmom konsolidację ich różnych danych podczas przenoszenia ich z miejsca na miejsce, i tak naprawdę nie ma znaczenia, że ​​dane są w różnych formatach lub formatach. Dane mogą pochodzić z dowolnego źródła. ETL jest wystarczająco potężny, aby poradzić sobie z różnicami takich danych.

Na przykład instytucja finansowa może zawierać informacje o kliencie w kilku działach, a każdy dział może mieć informacje o tym klienta wymienione w inny sposób. Dział członkowski może wymienić klienta po nazwie, podczas gdy dział księgowości może wymienić klienta według numeru. ETL może pakować wszystkie te dane i skonsolidować je w jednolitą prezentację, na przykład do przechowywania w bazie danych lub hurtowni danych.

Innym sposobem, w jaki firmy korzystają z ETL, jest trwałe przeniesienie informacji do innej aplikacji. Na przykład dane dotyczące przetwarzania słów mogą być przetłumaczone na liczby i litery, które są łatwiejsze do śledzenia w arkuszu kalkulacyjnym lub programie bazy danych. Jest to szczególnie przydatne w tworzeniu kopii zapasowych informacji, ponieważ firmy całkowicie przechodzą na nowe oprogramowanie.

Jedną ważną funkcją ETL są dane „oczyszczające”. Protokoły konsolidacji ETL obejmują również eliminację duplikatów lub fragmentarycznych danych, tak że to, co przechodzi z części E Proces do części L, jest łatwiejsze do asymilacji i/lub przechowywania. Takie operacje oczyszczania mogą również obejmować wyeliminowanie niektórych rodzajów danych z procesu. Jeśli nie chcesz zawierać określonych informacji, możesz dostosować swój ETL, aby wyeliminować tego rodzaju informacje z transformacji.

Oczywiście część równania jest najpotężniejsza. ETL może przekształcić nie tylko dane z różnych działów, ale także dane z różnych źródeł. Na przykład dane w programie e -mail, takim jak Microsoft OutlooK można przekształcić w samą wraz z danymi z aplikacji produkcyjnej SAP, przy czym wyniki to dane wspólnego wątku na końcu. Microsoft oczywiście tworzy pakiet ETL, podobnie jak Oracle i Ibm.

INNE JĘZYKI