Vad är smutsiga data?

Smutsiga data är en term som används för att beskriva alla typer av elektroniska data som är föråldrade, ofullständiga eller på annat sätt inte korrekta. Data av denna typ kan skapas på grund av fel i datainmatningen, ett fel på att uppdatera uppgifterna regelbundet eller till och med inmatningen av samma data mer än en gång. Ibland är de felaktiga uppgifterna bara annat än fel i skiljetecken i texten till elektroniska dokument. I andra fall kan smutsiga uppgifter vara information som är avsiktligt vilseledande, till exempel försök att ändra redovisningsregister för att presentera en specifik bild för investerare och andra.

För det mesta är ansamlingen av smutsiga data i alla typer av databaser oavsiktliga. Individer som lägger in ny information i databasen kan felstava ord, utelämna skiljetecken som är viktiga för att förstå avsikten med text eller inte följa en specifik formateringsstrategi. I situationer av denna typ är korrigering av felaktig information en relativt enkel process som inte kräver mer än att ändra fel text och spara ändringarna. Företag hanterar ibland denna process genom att korrekturläsa data efter att de har matats in och gjort nödvändiga uppdateringar.

Smutsiga uppgifter kan också uppstå på grund av att det inte går att uppdatera befintliga poster när information ändras. Om till exempel säljare inte uppdaterar kundfiler när personalbyten inträffar med en viss kund, är dessa filer inte längre exakta och anses vara smutsiga. Som med att korrigera stavnings- och skiljeteckenfel, att ta sig tid att ta bort föråldrad information och ersätta den med aktuella data hjälper till att öka databasens allmänna användbarhet.

Det finns situationer där skapandet av smutsiga data är avsiktligt. Företag kan välja att utelämna specifik information från en databas för att skapa en specifik uppfattning om ekonomi, till exempel att belysa mängden genererade intäkter under en viss period, men väljer att inte ange data som hänför sig till mängden insamlade intäkter för samma period. I denna typ av smutsiga data är informationen som presenteras korrekt så långt den går, men anses vara ofullständig.

Med vissa typer av smutsiga data kan beslutet vara att inte ta sig tid och ansträngning för att göra korrigeringar. Detta är vanligt när felaktiga uppgifter inte har någon inverkan på företagets förmåga att fungera korrekt eller inte har någon potential att orsaka någon stor oro. Detta innebär att nästan alla enheter som underhåller någon typ av databas förmodligen har åtminstone lite smutsiga data isär med annan information som är aktuell och korrekt.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?