데이터웨어 하우스 아키텍처 란 무엇입니까?
데이터웨어 하우스 아키텍처는 엔터프라이즈 환경에 대한 데이터웨어 하우징의 모든 측면을 캡슐화하는 디자인입니다. 데이터웨어 하우징은 복잡한 분산 된 엔터프라이즈 데이터를 논리적 단위로 저장하기위한 중앙 도메인을 생성하여 데이터 마이닝, 비즈니스 인텔리전스 및 조직 내 모든 관련 데이터에 대한 전체 액세스를 가능하게합니다. 데이터웨어 하우스 아키텍처에는 모든보고 요구 사항, 데이터 관리, 보안 요구 사항, 대역폭 요구 사항 및 스토리지 요구 사항이 포함됩니다.
데이터웨어 하우스 아키텍처를 생성 할 때는 아키텍처를 전체적인 최종 디자인에 결합 된 특정 도메인으로 나누는 것이 중요합니다. 이 디자인은 엔터프라이즈 데이터 아키텍처의 청사진으로 간주되어야합니다. 특히 데이터웨어 하우스 아키텍처를 고려할 때 몇 가지 주요 영역을 개발해야합니다. 이러한 영역은 소스 시스템 액세스, 준비 영역 프로세스, 데이터 보강 프로세스, 데이터 아키텍처, 비즈니스 인텔리전스 프로세스 및 스토리지 요구 사항입니다.
데이터웨어 하우징을 위해서는 트랜잭션 또는 레코드 데이터베이스에서 데이터웨어 하우스로 소스 데이터를 전송해야합니다. 이 프로세스는 기본적으로 소스 시스템 액세스, 데이터 보강 및 데이터 아키텍처 영역을 캡슐화하는 ETL (Extract Transform and Load)이라는 용어로 단순화됩니다. 명확성을 기하기 위해 이러한 아키텍처 영역을 세부적으로 디자인하는 것이 좋으며, 이는 ETL 프로세스가 달성되는 방법을 간략하게 설명합니다. 소스 시스템에서 일부 데이터가 필요하지만 엔터프라이즈웨어 하우스에 과부하가 걸리므로 모든 데이터가 바람직하지 않습니다. 소스 시스템 계층을 처리 할 때 고려해야 할 주요 영역은 데이터 액세스 방법, 소스 시스템에서 필요한 데이터 및 새로 고침 요구 사항입니다.
고려해야 할 다음 데이터웨어 하우징 아키텍처 계층은 준비 영역 프로세스입니다. 소스 시스템의 대부분의 데이터는 유효성 검증 및 데이터 정리가 필요하므로 데이터웨어 하우스의 비즈니스 규칙 계층으로로드하기 전에 소스 데이터가 상주 할 랜딩 영역을 작성하는 것이 중요합니다. 준비 영역은 데이터의 최신 성을 보장하기 위해 일반적으로 타임 스탬프가 지정된 소스 시스템의 원시 데이터 피드를 유지 관리합니다.
데이터 보강 또는 비즈니스 규칙 프로세스는 데이터웨어 하우스의 원하는 결과를 충족시키기 위해 데이터를 정리하는 곳입니다. 이 정리 방법의 좋은 예는 주소 정리 도구를 사용하는 것입니다. 소스 시스템에 잘못된 데이터가있는 경우 데이터 보강 프로세스는 원시 데이터 세트의 주소를 유효하지 않은 주소를 정정하는 비즈니스 규칙 시스템으로 실행합니다. 또한 데이터웨어 하우스 내에서 완전성을 보장하기 위해 부정확 한 데이터가 삭제되거나 수정되는 시간이기도합니다.
다음으로 고려해야 할 계층은 데이터 아키텍처 계층입니다. 이 영역은 엔터프라이즈 데이터웨어 하우스의 실제 설계 또는 스키마가 완성되는 곳입니다. 데이터웨어 하우징은 기업 내의 모든 데이터 세트를 조합 한 것이 아니라 기업 내의 모든 비즈니스 엔터티에 대한 개요를 제공하도록 새롭게 정의 된 데이터베이스입니다.
이를 위해서는 데이터 아키텍처가 비즈니스 인텔리전스 및 데이터 마이닝 영역에서 비즈니스가 제기 할 질문에 대답해야합니다. 이러한 방식으로 데이터 아키텍처를 작성하면 원시 데이터 세트가 팩트 테이블로 변환되어 사용자가 특정 데이터베이스가 아닌 전체 엔터프라이즈보기에서 임시보고를 수행 할 수 있습니다. 원시 시스템의 데이터에 대한 메타 데이터를 유지 관리하는 영역이기도하며 소스 시스템 이름 또는 기본 키를 포함 할 수 있습니다.
다음으로 고려해야 할 영역은 비즈니스 인텔리전스 및보고 요구 사항입니다. 이 계층은 데이터웨어 하우징에 대한 사용자 대면 요구 사항으로 생각할 수 있습니다. 일반적으로이 영역에는 미리 준비된 보고서, 임시보고 기능 및 엔터프라이즈 대시 보드 또는 경고가 포함됩니다. 비즈니스 인텔리전스 계층은 일반적으로 데이터웨어 하우스 내에서 외부를 향한 유일한 구성 요소이므로 가장 많이 고려됩니다.
고려해야 할 마지막 계층은 전체 데이터 스토리지 요구 사항 및 유지 관리입니다. 데이터웨어 하우스가 계속 증가하고 확장함에 따라 사용자 기반 데이터 스토리지는 엄격하게 관리 및 유지 보수되어야합니다. 또한 데이터웨어 하우스 아키텍처를 생성하는 동안 데이터 액세스 용량이있는 대역뿐만 아니라 데이터 스토리지 용량에 필요한 사항을 실제로 예측해야합니다. 데이터웨어 하우스가 전사적으로 널리 사용되기 때문에 이러한 요구 사항이 중요합니다.