Como faço para manter a qualidade do data warehouse?
Existem quatro fatores principais a serem considerados quando você deseja manter a qualidade do data warehouse: integridade dos dados, fonte de entrada de dados e metodologia usada, frequência de importação de dados e público. Um data warehouse é um repositório eletrônico de grandes quantidades de dados e é usado cada vez mais por empresas e outras organizações maiores para armazenar dados em uma ferramenta que facilita os requisitos de relatórios e saída de dados. A utilidade de um data warehouse é impulsionada principalmente pela qualidade dos dados e pela capacidade de resposta aos requisitos do usuário.
A integridade dos dados é um conceito comum à qualidade do data warehouse no que se refere às regras que regem as relações entre os dados, datas, definições e regras de negócios que moldam a relevância dos dados para a organização. Manter os dados consistentes e reconciliáveis é a base da integridade dos dados. As etapas usadas para manter a qualidade do data warehouse devem incluir um plano de arquitetura de dados coesos, inspeção regular dos dados e THe uso de regras e processos para manter os dados consistentes sempre que possível.
A fonte de entrada de dados para um data warehouse é normalmente uma ferramenta ou programa de importação. A maneira mais fácil de manter a qualidade do data warehouse é implementar regras e pontos de verificação no próprio programa de importação de dados. Os dados que não seguem o padrão apropriado não serão adicionados ao data warehouse, mas exigirão intervenção do usuário para corrigir, reconciliar ou alterar o programa. Em muitas organizações, esses tipos de alterações podem ser implementados apenas pelo Data Warehouse Architect, o que aumenta muito a qualidade do data warehouse.
A precisão e a relevância dos dados são essenciais para manter a qualidade do data warehouse. O momento da importação e frequência tem um grande impacto na utilidade geral da ferramenta, bem como na qualidade. Por exemplo, se as informações do pedido de compra forem inseridas no armazém BUAs faturas T são atualizadas apenas intermitentemente, a capacidade de relatar com precisão sobre atividade relacionada à compra é comprometida.
A qualidade do data warehouse é mais fácil de manter e apoiar se os usuários tiverem conhecimento e tiverem um entendimento sólido dos processos de negócios. Treinar os usuários a não apenas entender como criar consultas, mas na estrutura de data warehouse subjacente, permite identificar inconsistências muito mais rapidamente e destacar possíveis problemas no início do processo. Quaisquer alterações nas tabelas, estrutura ou ligações de dados e a adição de novos campos de dados devem ser revisadas com toda a equipe de usuários e apoiar os membros da equipe, a fim de garantir um entendimento consistente dos riscos e desafios que podem ocorrer.