Qu'est-ce que des données sales?
Données sales est un terme utilisé pour décrire tout type de données électroniques obsolètes, incomplètes ou inexactes. Des données de ce type peuvent être créées en raison d’erreurs lors de la saisie, de l’échec de la mise à jour régulière des données ou même de la saisie répétée des mêmes données. Parfois, les données incorrectes ne sont rien d’autre que des erreurs de ponctuation dans le texte de documents électroniques. Dans d'autres cas, les données altérées peuvent être des informations intentionnellement trompeuses, telles que des tentatives de modification des enregistrements comptables pour présenter une image spécifique aux investisseurs et à d'autres.
Pour l'essentiel, l'accumulation de données modifiées dans tout type de base de données est involontaire. Les personnes qui entrent de nouvelles informations dans la base de données peuvent mal orthographier des mots, omettre les signes de ponctuation qui sont importants pour comprendre l’intention du texte ou ne pas suivre une stratégie de mise en forme spécifique. Avec des situations de ce type, la correction des informations incorrectes est un processus relativement simple qui ne nécessite rien de plus que de modifier le texte incorrect et d'enregistrer les modifications. Les entreprises gèrent parfois ce processus en corrigeant les données après leur saisie et en effectuant les mises à jour nécessaires.
Des données sales peuvent également se produire en raison de l'impossibilité de mettre à jour des enregistrements existants lorsque des informations sont modifiées. Par exemple, si les vendeurs ne parviennent pas à mettre à jour les fichiers client lorsque des changements de personnel ont lieu chez un client donné, ces fichiers ne sont plus précis et sont considérés comme corrompus. Comme pour la correction des erreurs d'orthographe et de ponctuation, prendre le temps de supprimer les informations obsolètes et de les remplacer par les données actuelles contribue à accroître la convivialité de la base de données.
Il existe des situations où la création de données modifiées est intentionnelle. Les entreprises peuvent choisir d'omettre des informations spécifiques dans une base de données afin de créer une perception spécifique en matière de finances, telle que mettre en évidence le montant des revenus générés pour une période donnée, mais en choisissant de ne pas saisir de données relatives au montant des revenus collectés pour ces mêmes données. période. Dans ce type de données altérées, les informations présentées sont exactes dans la mesure du possible, mais sont considérées comme incomplètes.
Avec certains types de données altérées, la décision peut être de ne pas prendre le temps et les efforts nécessaires pour apporter des corrections. Ceci est courant lorsque des données incorrectes n’ont aucune incidence sur la capacité de l’entreprise à fonctionner correctement, ou ne présentent aucun risque de causer une grande détresse. Cela signifie que presque toutes les entités qui maintiennent un type de base de données ont probablement au moins un peu de données sales entremêlées avec d'autres informations actuelles et exactes.