ETLとは何ですか?
データのハウスクリーニングと考えてください。 ETLは、抽出、変換、およびロードの略です。 ETLは、企業がさまざまなデータを場所から場所に移動しながら統合できるようにするソフトウェアであり、そのデータが異なる形式または形式であることは実際には問題ではありません。 データは任意のソースから取得できます。 ETLは、このようなデータ格差を処理するのに十分強力です。
たとえば、金融機関が複数の部門の顧客に関する情報を持ち、各部門がその顧客の情報を異なる方法でリストする場合があります。 メンバーシップ部門は顧客を名前でリストするかもしれませんが、会計部門は顧客を番号でリストするかもしれません。 ETLは、このすべてのデータをバンドルし、データベースやデータウェアハウスに保存するなど、統一されたプレゼンテーションに統合できます。
企業がETLを使用するもう1つの方法は、情報を別のアプリケーションに永続的に移動することです。 たとえば、ワードプロセッシングデータは数字や文字に変換される場合があり、スプレッドシートやデータベースプログラムで追跡しやすくなります。 これは、企業が新しいソフトウェアに完全に移行する際の情報のバックアップに特に役立ちます。
ETLの重要な機能の1つは、「クレンジング」データです。 ETL統合プロトコルには、重複データまたは断片データの削除も含まれているため、プロセスのE部分からL部分に渡されるものは、同化および/または保存しやすくなります。 このようなクレンジング操作には、プロセスから特定の種類のデータを削除することも含まれます。 特定の情報を含めたくない場合は、ETLをカスタマイズして、その種の情報を変換から排除できます。
もちろん、方程式のT部分が最も強力です。 ETLは、異なる部門のデータだけでなく、異なるソースのデータも完全に変換できます。 たとえば、Microsoft Outlookなどの電子メールプログラムのデータは、SAP製造アプリケーションからのデータと一緒に変換され、最終的には共通のスレッドのデータになります。 マイクロソフトはもちろん、OracleやIBMと同様にETLパッケージを作成します。