ETL คืออะไร

คิดว่าเป็นการทำความสะอาดข้อมูลของคุณ ETL ย่อมาจากสารสกัดแปลงและโหลด ETL เป็นซอฟต์แวร์ที่ช่วยให้ธุรกิจสามารถรวบรวมข้อมูลที่แตกต่างกันในขณะที่ย้ายจากที่หนึ่งไปยังอีกที่หนึ่งและไม่สำคัญว่าข้อมูลนั้นจะอยู่ในรูปแบบหรือรูปแบบที่แตกต่างกัน ข้อมูลสามารถมาจากแหล่งใดก็ได้ ETL นั้นทรงพลังเพียงพอที่จะจัดการกับความไม่เท่าเทียมกันของข้อมูลดังกล่าว

ตัวอย่างเช่นสถาบันการเงินอาจมีข้อมูลเกี่ยวกับลูกค้าในหลายแผนกและแต่ละแผนกอาจมีข้อมูลลูกค้าที่ระบุไว้ในวิธีที่แตกต่างกัน แผนกสมาชิกอาจแสดงรายชื่อลูกค้าตามชื่อในขณะที่แผนกบัญชีอาจแสดงรายชื่อลูกค้าตามหมายเลข ETL สามารถรวมข้อมูลทั้งหมดนี้และรวมเป็นการนำเสนอที่เหมือนกันเช่นสำหรับการจัดเก็บในฐานข้อมูลหรือคลังข้อมูล

อีกวิธีหนึ่งที่ บริษัท ใช้ ETL คือการย้ายข้อมูลไปยังแอปพลิเคชันอื่นอย่างถาวร ตัวอย่างเช่นข้อมูลการประมวลผลคำอาจถูกแปลเป็นตัวเลขและตัวอักษรซึ่งง่ายต่อการติดตามในโปรแกรมสเปรดชีตหรือฐานข้อมูล สิ่งนี้มีประโยชน์อย่างยิ่งในการสำรองข้อมูลเมื่อ บริษัท เปลี่ยนไปใช้ซอฟต์แวร์ใหม่ทั้งหมด

ฟังก์ชั่นที่สำคัญอย่างหนึ่งของ ETL คือการ "ล้างข้อมูล" โปรโตคอลการรวม ETL ยังรวมถึงการกำจัดข้อมูลที่ซ้ำกันหรือส่วนย่อยดังนั้นสิ่งที่ผ่านจากส่วน E ของกระบวนการไปยังส่วน L นั้นง่ายต่อการดูดซึมและ / หรือเก็บ การดำเนินการล้างข้อมูลดังกล่าวอาจรวมถึงการกำจัดข้อมูลบางประเภทออกจากกระบวนการ หากคุณไม่ต้องการรวมข้อมูลบางอย่างคุณสามารถปรับแต่ง ETL ของคุณเพื่อกำจัดข้อมูลประเภทนั้นออกจากการแปลงของคุณ

แน่นอนว่าส่วน T ของสมการนั้นมีพลังมากที่สุด ETL สามารถแปลงข้อมูลจากแผนกต่าง ๆ ไม่เพียง แต่ข้อมูลจากแหล่งต่าง ๆ ทั้งหมด ตัวอย่างเช่นข้อมูลในโปรแกรมอีเมลเช่น Microsoft Outlook อาจถูกแปลงไปพร้อมกับข้อมูลจากแอปพลิเคชันการผลิตของ SAP พร้อมกับผลลัพธ์ที่เป็นข้อมูลของเธรดทั่วไปในตอนท้าย Microsoft แน่นอนสร้างแพ็คเกจ ETL เช่นเดียวกับ Oracle และ IBM