Vad är ETL?
Tänk på det som städning för dina data. ETL står för extrahera, transformera och ladda. ETL är en mjukvara som gör det möjligt för företag att konsolidera sina olika uppgifter medan de flyttar dem från plats till plats, och det spelar ingen roll att dessa uppgifter finns i olika former eller format. Uppgifterna kan komma från valfri källa. ETL är tillräckligt kraftfull för att hantera sådana datakrav.
Till exempel kan ett finansinstitut ha information om en kund i flera avdelningar och varje avdelning kan ha kundens information listad på ett annat sätt. Medlemskapsavdelningen kanske listar kunden efter namn, medan bokföringsavdelningen kanske listar kunden efter nummer. ETL kan paketera all denna information och konsolidera dem till en enhetlig presentation, till exempel för lagring i en databas eller datavarehus.
Ett annat sätt som företag använder ETL är att flytta information till en annan applikation permanent. Till exempel kan ordbehandlingsdata översättas till siffror och bokstäver, som är lättare att spåra i ett kalkylblad eller databasprogram. Detta är särskilt användbart för att säkerhetskopiera information när företag övergår till ny programvara helt och hållet.
En viktig funktion för ETL är "rensning" av data. ETL-konsolideringsprotokollen inkluderar också eliminering av duplicerade eller fragmenterade data, så att det som går från E-delen av processen till L-delen är lättare att assimilera och / eller lagra. Sådana rengöringsoperationer kan också omfatta eliminering av vissa typer av data från processen. Om du inte vill inkludera viss information kan du anpassa din ETL för att eliminera den typen av information från din omvandling.
Ekvationen T är naturligtvis den mest kraftfulla. ETL kan transformera inte bara data från olika avdelningar utan också data från olika källor helt och hållet. Till exempel kan data i ett e-postprogram som Microsoft Outlook omvandlas till höger tillsammans med data från en SAP-tillverkningsprogram, vilket resulterar i data från en vanlig tråd i slutändan. Microsoft gör naturligtvis ett ETL-paket, liksom Oracle och IBM.