O que é ETL?
Pense nisso como uma limpeza doméstica para seus dados. ETL significa extrair, transformar e carregar. O ETL é um software que permite às empresas consolidar seus dados díspares enquanto os movem de um lugar para outro, e realmente não importa que esses dados estejam em diferentes formas ou formatos. Os dados podem vir de qualquer fonte. O ETL é poderoso o suficiente para lidar com essas disparidades de dados.
Por exemplo, uma instituição financeira pode ter informações sobre um cliente em vários departamentos e cada departamento pode ter as informações desse cliente listadas de uma maneira diferente. O departamento de associação pode listar o cliente por nome, enquanto o departamento de contabilidade pode listar o cliente por número. O ETL pode agrupar todos esses dados e consolidá-los em uma apresentação uniforme, como para armazenamento em um banco de dados ou armazém de dados.
Outra maneira que as empresas usam ETL é mover informações para outro aplicativo permanentemente. Por exemplo, os dados do processamento de texto podem ser traduzidos em números e letras, mais fáceis de rastrear em uma planilha ou programa de banco de dados. Isso é particularmente útil no backup de informações à medida que as empresas fazem a transição para o novo software.
Uma função importante do ETL é "limpar" os dados. Os protocolos de consolidação do ETL também incluem a eliminação de dados duplicados ou fragmentados, para que o que passa da parte E do processo para a porção L seja mais fácil de assimilar e / ou armazenar. Essas operações de limpeza também podem incluir a eliminação de certos tipos de dados do processo. Se você não deseja incluir determinadas informações, pode personalizar seu ETL para eliminar esse tipo de informação da sua transformação.
A porção T da equação, é claro, é a mais poderosa. O ETL pode transformar não apenas dados de diferentes departamentos, mas também dados de diferentes origens. Por exemplo, dados em um programa de email como o Microsoft Outlook podem ser transformados junto com dados de um aplicativo de manufatura SAP, com o resultado sendo dados de um encadeamento comum no final. A Microsoft, é claro, faz um pacote ETL, como a Oracle e a IBM.