Quais são os diferentes tipos de sistemas de data warehouse?
Existem dois sistemas principais de data warehouse; normalizado e dimensional. Em uma estrutura normalizada, os dados são limitados a uma simples apresentação de informações factuais. Não há contexto ou plano de fundo para os dados além do que o usuário está disposto a correlacionar. Em um sistema dimensional, as informações vêm em um contexto de outros fatos que mostram quais são os dados como um todo. Nesse caso, há uma grande quantidade de informações disponíveis, quer você queira ou não.
Os dois principais sistemas de data warehouse são os dois extremos. Na maioria dos data warehouses, é alcançado um meio termo entre esses dois. As descrições reais são para a forma mais pura do estilo, mesmo que isso raramente seja encontrado.
Dados normalizados são os mais fáceis dos dois sistemas de armazém de dados para implementar e manipular. Nesse estilo, as informações são reduzidas a fatos individuais, sem nenhuma conexão com outros dados. Por exemplo, o número de série e o nome do produto são reunidos sem informações adicionais. As informações estão disponíveis para qualquer usuário que queira, mas eles precisam fazer o trabalho para que isso signifique alguma coisa.
Para entender as informações nos sistemas normalizados de data warehouse, o usuário coleta informações conectadas para agrupar uma imagem inteira. Para encontrar o número de telefone de um cliente, as informações acima podem estar conectadas com um número de série e um número de conta da pessoa que comprou o item. Em seguida, o número e o nome da conta podem ser localizados. Finalmente, o nome e o número de telefone são encontrados. Cada uma dessas etapas é uma consulta separada ao banco de dados, feita pelo usuário para coletar informações.
Os dados dimensionais são exatamente o oposto. Em geral, esses sistemas de armazém de dados são os mais fáceis de usar, mas os mais difíceis de alterar ou manipular. Quando as informações são coletadas, tudo é combinado em uma grande bola de dados. Em vez de um número de série e de produto, uma fatura de compra inteira seria inserida ao mesmo tempo.
Se um usuário procurasse um número de telefone em um banco de dados dimensional, o processo seria diferente. O número de série produziria um histórico completo para esse cliente, nomes e datas de tudo o que já foi comprado e qualquer serviço de ligação ou devolução. Além disso, todos os endereços e números de telefone que o cliente já usou também estarão diretamente disponíveis. A imagem é muito completa, mas talvez tão completa que as informações necessárias sejam difíceis de encontrar.