¿Qué es el ETL?
Piense en ello como limpieza de sus datos. ETL significa extraer, transformar y cargar. ETL es un software que permite a las empresas consolidar sus datos dispares mientras los mueve de un lugar a otro, y realmente no importa que esos datos estén en diferentes formas o formatos. Los datos pueden provenir de cualquier fuente. ETL es lo suficientemente potente como para manejar tales disparidades de datos.
Por ejemplo, una institución financiera podría tener información sobre un cliente en varios departamentos y cada departamento podría tener la información de ese cliente en una lista diferente. El departamento de membresía puede enumerar al cliente por nombre, mientras que el departamento de contabilidad puede enumerar al cliente por número. ETL puede agrupar todos estos datos y consolidarlos en una presentación uniforme, como el almacenamiento en una base de datos o almacén de datos.
Otra forma en que las empresas usan ETL es mover información a otra aplicación de forma permanente. Por ejemplo, los datos de procesamiento de texto pueden traducirse en números y letras, que son más fáciles de rastrear en una hoja de cálculo o en un programa de base de datos. Esto es particularmente útil para realizar copias de seguridad de la información a medida que las empresas hacen la transición a un nuevo software por completo.
Una función importante de ETL es la "limpieza" de datos. Los protocolos de consolidación ETL también incluyen la eliminación de datos duplicados o fragmentarios, de modo que lo que pasa de la parte E del proceso a la parte L es más fácil de asimilar y / o almacenar. Dichas operaciones de limpieza también pueden incluir la eliminación de ciertos tipos de datos del proceso. Si no desea incluir cierta información, puede personalizar su ETL para eliminar ese tipo de información de su transformación.
La porción T de la ecuación, por supuesto, es la más poderosa. ETL puede transformar no solo datos de diferentes departamentos, sino también datos de diferentes fuentes por completo. Por ejemplo, los datos en un programa de correo electrónico como Microsoft Outlook podrían transformarse junto con los datos de una aplicación de fabricación de SAP, con el resultado de ser un hilo común al final. Microsoft, por supuesto, crea un paquete ETL, al igual que Oracle e IBM.