Was ist ETL?
Stellen Sie sich das als eine Hausreinigung für Ihre Daten vor. ETL steht für Extrahieren, Transformieren und Laden. ETL ist eine Software, mit der Unternehmen ihre unterschiedlichen Daten konsolidieren können, während sie von Ort zu Ort verschoben werden. Dabei spielt es keine Rolle, ob diese Daten in unterschiedlichen Formen oder Formaten vorliegen. Die Daten können aus beliebigen Quellen stammen. ETL ist leistungsfähig genug, um mit solchen Datenunterschieden umzugehen.
Beispielsweise verfügt ein Finanzinstitut möglicherweise über Informationen zu einem Kunden in mehreren Abteilungen, und in jeder Abteilung werden die Informationen zu diesem Kunden möglicherweise auf unterschiedliche Weise aufgelistet. Die Mitgliederabteilung listet den Kunden möglicherweise nach Namen auf, während die Buchhaltungsabteilung den Kunden möglicherweise nach Nummer auflistet. ETL kann all diese Daten bündeln und zu einer einheitlichen Präsentation zusammenfassen, beispielsweise zum Speichern in einer Datenbank oder einem Data Warehouse.
Eine weitere Möglichkeit für Unternehmen, ETL zu verwenden, besteht darin, Informationen permanent in eine andere Anwendung zu verschieben. Beispielsweise können Textverarbeitungsdaten in Zahlen und Buchstaben übersetzt werden, die in einem Tabellenkalkulations- oder Datenbankprogramm leichter zu verfolgen sind. Dies ist besonders nützlich bei der Sicherung von Informationen, wenn Unternehmen auf neue Software umsteigen.
Eine wichtige Funktion von ETL ist das "Bereinigen" von Daten. Die ETL-Konsolidierungsprotokolle umfassen auch die Eliminierung doppelter oder fragmentarischer Daten, so dass der Übergang vom E-Teil des Prozesses zum L-Teil leichter zu assimilieren und / oder zu speichern ist. Solche Bereinigungsvorgänge können auch das Entfernen bestimmter Arten von Daten aus dem Prozess umfassen. Wenn Sie bestimmte Informationen nicht einschließen möchten, können Sie Ihre ETL anpassen, um diese Art von Informationen aus Ihrer Umwandlung zu entfernen.
Der T-Teil der Gleichung ist natürlich der mächtigste. ETL kann nicht nur Daten aus verschiedenen Abteilungen, sondern auch Daten aus verschiedenen Quellen insgesamt transformieren. Beispielsweise können Daten in einem E-Mail-Programm wie Microsoft Outlook direkt zusammen mit Daten aus einer SAP-Fertigungsanwendung umgewandelt werden, so dass am Ende die Daten eines allgemeinen Threads vorliegen. Microsoft stellt natürlich ein ETL-Paket her, genauso wie Oracle und IBM.