Hvad er beskidte data?
Beskidte data er et udtryk, der bruges til at beskrive enhver type elektroniske data, der er forældede, ufuldstændige eller på anden måde ikke nøjagtige. Data af denne type kan oprettes på grund af fejl i dataregistrering, en manglende opdatering af dataene regelmæssigt eller endda indtastningen af de samme data mere end én gang. Til tider er de forkerte data intet andet end fejl i tegnsætning i teksten til elektroniske dokumenter. I andre tilfælde kan beskidte data være oplysninger, der med vilje er vildledende, såsom forsøg på at ændre regnskabsregistreringer for at præsentere et specifikt billede for investorer og andre.
For det meste er akkumulering af beskidte data i enhver type database utilsigtet. Personer, der indtaster nye oplysninger i databasen, kan stave ord forkert, udelade tegnsætning, der er vigtig for at forstå hensigten med tekst, eller ikke følger en bestemt formateringsstrategi. I situationer af denne type er korrektion af de forkerte oplysninger en relativt simpel proces, der kun kræver andet end at ændre den forkerte tekst og gemme ændringerne. Virksomheder administrerer undertiden denne proces ved at korrekturlæse data, når de er indtastet og foretage de nødvendige opdateringer.
Beskidte data kan også opstå på grund af en manglende opdatering af eksisterende poster, når oplysninger ændres. Hvis for eksempel sælgere ikke opdaterer kundefiler, når der sker personaleændringer med en given kunde, er disse filer ikke længere nøjagtige og betragtes som beskidte. Som med at rette stave- og tegnsætningsfejl, hjælper det at øge databasens brugbarhed ved at tage sig tid til at fjerne forældede oplysninger og erstatte dem med aktuelle data.
Der er situationer, hvor oprettelsen af beskidte data er forsætlig. Virksomheder kan vælge at udelade specifikke oplysninger fra en database for at skabe en specifik opfattelse af økonomi, såsom at fremhæve mængden af genereret indtægt i en given periode, men vælger ikke at indtaste data, der vedrører mængden af indsamlet indtægt for den samme periode. I denne type beskidte data er de oplysninger, der præsenteres, nøjagtige, så vidt de går, men betragtes som ufuldstændige.
Med nogle typer beskidte data kan beslutningen være at ikke tage sig tid og kræfter på at foretage korrektioner. Dette er almindeligt, når de forkerte data ikke har nogen indflydelse på virksomhedens evne til at fungere korrekt eller ikke giver nogen potentiale for at forårsage nogen stor nød. Dette betyder, at næsten enhver enhed, der opretholder en eller anden type database, sandsynligvis har mindst lidt beskidt data ispedd andre oplysninger, der er aktuelle og nøjagtige.