Che cos'è ETL?
Pensalo come una pulizia della casa per i tuoi dati. ETL significa estrarre, trasformare e caricare. ETL è un software che consente alle aziende di consolidare i loro dati disparati spostandoli da un luogo all'altro e non importa che i dati siano in forme o formati diversi. I dati possono provenire da qualsiasi fonte. ETL è abbastanza potente da gestire tali disparità di dati.
Ad esempio, un istituto finanziario potrebbe disporre di informazioni su un cliente in più dipartimenti e ciascun reparto potrebbe elencare le informazioni di quel cliente in modo diverso. Il dipartimento appartenenza potrebbe elencare il cliente per nome, mentre il reparto contabilità potrebbe elencare il cliente per numero. ETL può raggruppare tutti questi dati e consolidarli in una presentazione uniforme, ad esempio per l'archiviazione in un database o un data warehouse.
Un altro modo in cui le aziende usano ETL è di spostare le informazioni in un'altra applicazione in modo permanente. Ad esempio, i dati di elaborazione testi potrebbero essere tradotti in numeri e lettere, che sono più facili da tracciare in un foglio di calcolo o in un programma di database. Ciò è particolarmente utile nel backup delle informazioni quando le aziende passano del tutto al nuovo software.
Una funzione importante dell'ETL è la "pulizia" dei dati. I protocolli di consolidamento ETL includono anche l'eliminazione di dati duplicati o frammentari, in modo che ciò che passa dalla parte E del processo alla parte L sia più facile da assimilare e / o archiviare. Tali operazioni di pulizia possono anche includere l'eliminazione di determinati tipi di dati dal processo. Se non desideri includere determinate informazioni, puoi personalizzare il tuo ETL per eliminare quel tipo di informazioni dalla tua trasformazione.
La parte T dell'equazione, ovviamente, è la più potente. ETL può trasformare non solo i dati provenienti da dipartimenti diversi, ma anche i dati provenienti da fonti diverse. Ad esempio, i dati in un programma di posta elettronica come Microsoft Outlook potrebbero essere trasformati insieme ai dati di un'applicazione di produzione SAP, con il risultato che alla fine sono dati di un thread comune. Microsoft, ovviamente, crea un pacchetto ETL, così come Oracle e IBM.