ETL이란 무엇입니까?
데이터를 집안 청소로 생각하십시오. ETL은 추출, 변환 및로드를 나타냅니다. ETL은 기업들이 이질적인 데이터를 다른 곳으로 이동하면서 통합 할 수있게 해주는 소프트웨어이며, 해당 데이터가 다른 형식이나 형식인지는 중요하지 않습니다. 데이터는 모든 소스에서 올 수 있습니다. ETL은 이러한 데이터 불일치를 처리 할 수있을만큼 강력합니다.
예를 들어, 금융 기관은 여러 부서의 고객에 대한 정보를 가질 수 있으며 각 부서는 해당 고객의 정보가 다른 방식으로 나열 될 수 있습니다. 멤버쉽 부서는 고객을 이름별로 나열 할 수 있지만 회계 부서는 고객을 번호별로 나열 할 수 있습니다. ETL은이 모든 데이터를 번들로 묶어 데이터베이스 나 데이터웨어 하우스에 저장하는 등의 균일 한 프리젠 테이션으로 통합 할 수 있습니다.
회사가 ETL을 사용하는 또 다른 방법은 정보를 다른 응용 프로그램으로 영구적으로 옮기는 것입니다. 예를 들어 워드 프로세싱 데이터는 숫자와 문자로 변환되어 스프레드 시트 나 데이터베이스 프로그램에서 쉽게 추적 할 수 있습니다. 회사가 새로운 소프트웨어로 완전히 전환함에 따라 정보를 백업 할 때 특히 유용합니다.
ETL의 중요한 기능 중 하나는 "정화"데이터입니다. ETL 통합 프로토콜은 또한 복제 또는 단편적인 데이터의 제거를 포함하여 프로세스의 E 부분에서 L 부분으로 전달되는 것이 동화 및 / 또는 저장하기가 더 쉽다. 이러한 정화 작업에는 프로세스에서 특정 종류의 데이터를 제거하는 것도 포함될 수 있습니다. 특정 정보를 포함하지 않으려는 경우 변환에서 이러한 종류의 정보를 제거하도록 ETL을 사용자 정의 할 수 있습니다.
물론 방정식의 T 부분이 가장 강력합니다. ETL은 다른 부서의 데이터뿐만 아니라 다른 소스의 데이터도 완전히 변환 할 수 있습니다. 예를 들어, Microsoft Outlook과 같은 전자 메일 프로그램의 데이터는 SAP 제조 응용 프로그램의 데이터와 함께 변환되어 결과적으로 공통 스레드의 데이터가됩니다. 물론 Microsoft는 Oracle 및 IBM과 마찬가지로 ETL 패키지를 만듭니다.