O que são dados sujos?
Dirty Data é um termo usado para descrever qualquer tipo de dados eletrônicos desatualizados, incompletos ou não precisos. Os dados desse tipo podem ser criados devido a erros na entrada de dados, uma falha na atualização dos dados regularmente ou mesmo a entrada dos mesmos dados mais de uma vez. Às vezes, os dados incorretos nada mais são do que erros na pontuação no texto dos documentos eletrônicos. Em outros casos, os dados sujos podem ser informações intencionalmente enganosas, como tentativas de modificar os registros contábeis para apresentar uma imagem específica para investidores e outros.
Na maioria das vezes, o acúmulo de dados sujos em qualquer tipo de banco de dados não é intencional. Indivíduos que estão inserindo novas informações no banco de dados podem errar palavras, deixar de fora a pontuação que é importante para entender a intenção do texto ou não seguir uma estratégia de formatação específica. Com situações desse tipo, a correção das informações incorretas é um processo relativamente simplesIsso requer nada mais do que alterar o texto incorreto e salvar as alterações. Às vezes, as empresas gerenciam esse processo revisando os dados após serem inseridos e fazendo as atualizações necessárias.
dados sujos também podem ocorrer devido a uma falha na atualização dos registros existentes quando as informações mudarem. Por exemplo, se os vendedores não atualizam os arquivos do cliente quando as alterações do pessoal ocorrem com um determinado cliente, esses arquivos não são mais precisos e são considerados sujos. Como na correção de erros de ortografia e pontuação, reservar um tempo para remover informações desatualizadas e substituí -las pelos dados atuais ajuda a aumentar a usabilidade geral do banco de dados.
Existem situações em que a criação de dados sujos é intencional. As empresas podem optar por omitir informações específicas de um banco de dados para criar uma percepção específica sobre finanças, como destacar a quantidade de GEReceita negativa por um determinado período, mas optando por não inserir dados relacionados à quantidade de receita coletada no mesmo período. Nesse tipo de dados sujos, as informações apresentadas são precisas, na medida do possível, mas são consideradas incompletas.
Com alguns tipos de dados sujos, a decisão pode ser de não dedicar tempo e esforço para fazer correções. Isso é comum quando os dados incorretos não têm nenhum impacto na capacidade da empresa de funcionar corretamente ou não apresenta potencial para causar grande angústia. Isso significa que praticamente qualquer entidade que mantenha algum tipo de banco de dados provavelmente tenha pelo menos um pouco de dados sujos intercalados com outras informações atuais e precisas.