Co to jest ETL?
Pomyśl o tym jak o sprzątaniu domu dla swoich danych. ETL oznacza wyodrębnianie, przekształcanie i ładowanie. ETL to oprogramowanie, które umożliwia firmom konsolidację różnych danych podczas przenoszenia ich z miejsca na miejsce, i nie ma znaczenia, że dane te mają różne formy lub formaty. Dane mogą pochodzić z dowolnego źródła. ETL jest wystarczająco silny, aby poradzić sobie z takimi różnicami w danych.
Na przykład instytucja finansowa może mieć informacje o kliencie w kilku działach, a każdy dział może mieć informacje o kliencie wymienione w inny sposób. Dział członkowski może wyświetlać klienta według nazwy, a dział księgowości może wyświetlać klienta według numeru. ETL może łączyć wszystkie te dane i konsolidować je w jednolitą prezentację, na przykład do przechowywania w bazie danych lub hurtowni danych.
Innym sposobem, w jaki firmy korzystają z ETL, jest trwałe przenoszenie informacji do innej aplikacji. Na przykład dane edytora tekstu mogą zostać przetłumaczone na cyfry i litery, które są łatwiejsze do śledzenia w arkuszu kalkulacyjnym lub programie bazy danych. Jest to szczególnie przydatne przy tworzeniu kopii zapasowych informacji, gdy firmy przechodzą na nowe oprogramowanie całkowicie.
Jedną ważną funkcją ETL jest „czyszczenie” danych. Protokoły konsolidacji ETL obejmują również eliminację zduplikowanych lub fragmentarycznych danych, dzięki czemu to, co przechodzi z części E procesu do części L, jest łatwiejsze do przyswojenia i / lub przechowywania. Takie operacje czyszczenia mogą również obejmować eliminację pewnych rodzajów danych z procesu. Jeśli nie chcesz dołączać pewnych informacji, możesz dostosować ETL, aby wyeliminować tego rodzaju informacje z transformacji.
Część T równania jest oczywiście najsilniejsza. ETL może przetwarzać nie tylko dane z różnych działów, ale także dane z różnych źródeł. Na przykład dane w programie pocztowym, takim jak Microsoft Outlook, mogą zostać przekształcone bezpośrednio wraz z danymi z aplikacji produkcyjnej SAP, w wyniku czego ostatecznie dane będą miały wspólny wątek. Microsoft oczywiście tworzy pakiet ETL, podobnie jak Oracle i IBM.