Quais são os diferentes tipos de design de data warehouse?

Data Warehouses armazenam grandes quantidades de dados para uso em muitos campos diferentes. Existem dois tipos principais de design de data warehouse: de cima para baixo e de baixo para cima. Os dois projetos têm suas próprias vantagens e desvantagens. De baixo para cima é mais fácil e mais barato de implementar, mas é menos completo, e as correlações de dados são mais esporádicas. Em um design de cima para baixo, as conexões entre os dados são óbvias e bem estabelecidas, mas os dados podem estar desatualizados e o sistema é caro de implementar. Um Data Mart é uma coleção de dados baseados em um único conceito. Cada Data Mart é um subconjunto de dados exclusivo e completo. Cada uma dessas coleções está completamente correlacionada internamente e geralmente possui conexões com martes de dados externos. No design de cima para baixo, os dados de dados ocorrem naturalmente à medida que os dados são colocados no sistema. No design de baixo para cima, DO ATA Marts é feito diretamente e conectado para formar o armazém. Embora isso possa parecer uma pequena diferença, é um design muito diferente.

O método de cima para baixo era o design original do Data Warehouse. Usando esse método, todas as informações que a organização possui é colocada no sistema. Cada sujeito amplo terá sua própria área geral dentro dos bancos de dados. À medida que os dados são usados, as conexões aparecerão entre pontos de dados correlativos e os dados de dados aparecerão. Além disso, quaisquer dados no sistema permanecem lá para sempre - mesmo que os dados sejam substituídos ou trivializados por informações posteriores, ele permanecerá no sistema como um registro de eventos anteriores.

O método de baixo para cima do design de data warehouse funciona a partir da direção oposta. Uma empresa coloca informações como um mart de dados independente. À medida que o tempo passa, outros conjuntos de dados são adicionados ao sistema, como seu próprio data mart or Como parte de um que já existe. Quando dois dados de dados são considerados conectados o suficiente, eles se fundem em uma única unidade.

Os dois projetos de data warehouse têm seus próprios pontos fortes e fracos. O método de cima para baixo é um projeto enorme para conjuntos de dados ainda menores. Como os grandes projetos também são mais caros, é o mais caro em termos de dinheiro e mão de obra. Se o data warehouse for concluído e mantido, é uma vasta coleção, contendo tudo o que a empresa sabe.

O processo de baixo para cima é muito mais rápido e mais barato, mas como os dados são inseridos conforme necessário, o banco de dados nunca estará realmente completo. Além disso, as correlações entre os dados de dados são tão fortes quanto o uso deles. Se existe uma forte correlação, mas não há usuários, ela não conecta.

OUTRAS LÍNGUAS

Este artigo foi útil? Obrigado pelo feedback Obrigado pelo feedback

Como podemos ajudar? Como podemos ajudar?