O que é redundância de dados?
A redundância de dados é uma situação que ocorre nos sistemas de banco de dados e envolve a criação não intencional de dados duplicados que não são necessários para a função do banco de dados. Embora a redundância seja frequentemente uma característica desejável em algumas situações, isso não é verdade quando se trata da função de um banco de dados. A presença de dados duplicados geralmente pode ter um efeito adverso na função do sistema, resultando em retornar as informações em resposta às consultas do sistema que são menos que úteis. Uma das principais funções do gerenciamento de dados é a identificação de dados duplicados e a remoção dessas duplicações.
O potencial de redundância de dados é encontrado em praticamente qualquer tipo de programa de banco de dados. Programas considerados estáveis, como planilhas e dependem da entrada manual de dados, são particularmente suscetíveis à duplicação de informações que podem levar a complicações quando se trata de recuperar as informações desejadas. Bancos de dados de estilo relacional, como vendasOs bancos de dados de contato, geralmente incluem processos que ajudam a minimizar as chances de duplicação não intencional, como a criação de dois arquivos de contato diferentes no mesmo contato associados à mesma empresa. Mesmo com o uso de verificações do sistema para ajudar a reduzir a incidência de redundância de dados, ainda há o potencial de ocorrer problemas, tornando necessário se envolver periodicamente na tarefa de limpeza de dados em um banco de dados.
Na melhor das hipóteses, redundância de dados significa que o banco de dados está repleto de informações que não são essenciais, mas não representa uma ameaça real à capacidade de encontrar os dados quando e conforme necessário. Na pior das hipóteses, a presença dos dados duplicados diminui as funções essenciais do banco de dados e pode complicar o processo de uso do banco de dados para gerenciar determinadas tarefas. Por exemplo, usando um banco de dados de cliente que está entupido com informações redundantes para gerar etiquetas de correspondência would result in the creation of a number of duplicated levels, making it necessary to either sort and dispose of the duplicates before the labels could be used, or take the time to clean up the database before attempting to generate the labels.
Felizmente, o monitoramento e a correção da redundância de dados é algo que muitos sistemas de gerenciamento de dados podem realizar com relativa facilidade. Some systems will flag the input of duplicated data, making it easy to review the perceived duplication and decide whether to delete it or allow it to stand. There are even software programs that can be used to scan an existing database for duplications, and automatically remove those redundant entries with relative ease.