O que é redundância de dados?
A redundância de dados é uma situação que ocorre nos sistemas de banco de dados e envolve a criação não intencional de dados duplicados que não são necessários para a função do banco de dados. Embora a redundância geralmente seja uma característica desejável em algumas situações, isso não é verdade quando se trata da função de um banco de dados. A presença de dados duplicados geralmente pode ter um efeito adverso na função do sistema, resultando no retorno de informações em resposta a consultas do sistema que são menos que úteis. Uma das principais funções do gerenciamento de dados é a identificação de dados duplicados e a remoção dessas duplicações.
O potencial de redundância de dados é encontrado em praticamente qualquer tipo de programa de banco de dados. Programas que são considerados simples, como planilhas eletrônicas e dependem da entrada manual de dados, são particularmente suscetíveis à duplicação de informações que podem levar a complicações quando se trata de recuperar as informações desejadas. Bancos de dados de estilo relacional, como bancos de dados de contatos de vendas, geralmente incluem processos que ajudam a minimizar as chances de duplicação não intencional, como a criação de dois arquivos de contatos diferentes no mesmo contato associado à mesma empresa. Mesmo com o uso de verificações do sistema para ajudar a reduzir a incidência de redundância de dados, ainda há o potencial de ocorrer problemas, tornando necessário envolver-se periodicamente na tarefa de limpeza de dados em um banco de dados.
Na melhor das hipóteses, a redundância de dados significa que o banco de dados está repleto de informações que não são essenciais, mas não representam uma ameaça real à capacidade de encontrar os dados quando e conforme necessário. Na pior das hipóteses, a presença dos dados duplicados diminui as funções essenciais do banco de dados e pode complicar o processo de uso do banco de dados para gerenciar determinadas tarefas. Por exemplo, o uso de um banco de dados de clientes que esteja entupido de informações redundantes para gerar etiquetas de endereçamento resultaria na criação de vários níveis duplicados, tornando necessário classificar e descartar as duplicatas antes que as etiquetas pudessem ser usadas ou usar o hora de limpar o banco de dados antes de tentar gerar os rótulos.
Felizmente, monitorar e corrigir a redundância de dados é algo que muitos sistemas de gerenciamento de dados podem realizar com relativa facilidade. Alguns sistemas sinalizam a entrada de dados duplicados, facilitando a revisão da duplicação percebida e a decisão de excluí-la ou permitir que ela permaneça. Existem até programas de software que podem ser usados para verificar se há duplicidades em um banco de dados existente e remover automaticamente essas entradas redundantes com relativa facilidade.