Quais são os diferentes tipos de design de data warehouse?

Os data warehouses armazenam grandes quantidades de dados para uso em muitos campos diferentes. Existem dois tipos principais de design de data warehouse: de cima para baixo e de baixo para cima. Os dois projetos têm suas próprias vantagens e desvantagens. De baixo para cima é mais fácil e mais barato de implementar, mas é menos completo e as correlações de dados são mais esporádicas. Em um design de cima para baixo, as conexões entre os dados são óbvias e bem estabelecidas, mas os dados podem estar desatualizados e o sistema é caro para implementar.

Data marts são a figura central no design do data warehouse. Um data mart é uma coleção de dados baseada em um único conceito. Cada data mart é um subconjunto de dados exclusivo e completo. Cada uma dessas coleções é completamente correlacionada internamente e geralmente possui conexões com data marts externos.

A maneira como os data marts são manipulados é a principal diferença entre os dois estilos de design do data warehouse. No design de cima para baixo, os data marts ocorrem naturalmente à medida que os dados são inseridos no sistema. No design de baixo para cima, os data marts são feitos diretamente e conectados juntos para formar o armazém. Embora isso possa parecer uma pequena diferença, cria um design muito diferente.

O método de cima para baixo foi o design original do data warehouse. Usando esse método, todas as informações que a organização mantém são colocadas no sistema. Cada assunto amplo terá sua própria área geral nos bancos de dados. Conforme os dados são usados, as conexões aparecerão entre os pontos de dados correlativos e os data marts serão exibidos. Além disso, quaisquer dados no sistema permanecem lá para sempre - mesmo que sejam substituídos ou banalizados por informações posteriores, eles permanecerão no sistema como um registro de eventos passados.

O método de baixo para cima do design do data warehouse funciona na direção oposta. Uma empresa coloca as informações como um data mart independente. Conforme o tempo passa, outros conjuntos de dados são adicionados ao sistema, como seu próprio data mart ou como parte de um que já existe. Quando dois data marts são considerados conectados o suficiente, eles se fundem em uma única unidade.

Os dois designs de data warehouse têm pontos fortes e fracos. O método de cima para baixo é um projeto enorme para conjuntos de dados ainda menores. Como os grandes projetos também são mais caros, é o mais caro em termos de dinheiro e mão de obra. Se o data warehouse for concluído e mantido, é uma vasta coleção, contendo tudo o que a empresa sabe.

O processo de baixo para cima é muito mais rápido e barato, mas, como os dados são inseridos conforme necessário, o banco de dados nunca estará completo. Além disso, as correlações entre data marts são tão fortes quanto o uso delas. Se existe uma correlação forte, mas nenhum usuário a vê, ela fica desconectada.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?