Hvad er ETL?
Tænk på det som husrensning for dine data. ETL står for ekstrakt, transformation og belastning. ETL er software, der gør det muligt for virksomheder at konsolidere deres forskellige data, mens de flytter dem fra sted til sted, og det betyder ikke rigtig noget, at data er i forskellige former eller formater. Dataene kan komme fra enhver kilde. ETL er kraftig nok til at håndtere sådanne dataforskelle.
For eksempel kan en finansiel institution have oplysninger om en kunde i flere afdelinger, og hver afdeling kan have den kundens oplysninger, der er anført på en anden måde. Medlemskabsafdelingen viser muligvis kunden ved navn, mens regnskabsafdelingen muligvis viser kunden efter nummer. ETL kan bundle alle disse data og konsolidere dem til en ensartet præsentation, f.eks. Til lagring i en database eller datavarehus.
En anden måde, som virksomheder bruger ETL på, er at flytte information til en anden applikation permanent. For eksempel kan ordbehandlingsdata oversættes til tal og breve, som er lettere at spore i et regneark eller databaseprogram. Dette er især nyttigt til sikkerhedskopiering af oplysninger, når virksomhederne helt overgår til ny software.
En vigtig funktion af ETL er "rensning" -data. ETL -konsolideringsprotokollerne inkluderer også eliminering af duplikat- eller fragmentariske data, så det, der passerer fra E -delen af processen til L -delen, er lettere at assimilere og/eller gemme. Sådanne rensningsoperationer kan også omfatte eliminering af visse slags data fra processen. Hvis du ikke vil medtage visse oplysninger, kan du tilpasse din ETL til at eliminere den slags oplysninger fra din transformation.
T -delen af ligningen er selvfølgelig den mest kraftfulde. ETL kan transformere ikke kun data fra forskellige afdelinger, men også data fra forskellige kilder. For eksempel data i et e -mail -program såsom Microsoft OutlooK kunne transformeres lige sammen med data fra en SAP -fremstillingsapplikation, hvor resultatet var data om en fælles tråd til sidst. Microsoft laver selvfølgelig en ETL -pakke, ligesom Oracle og IBM.