Vad är dataredundans?
Dataredundans är en situation som inträffar i databassystem och involverar oavsiktlig skapande av duplicerade data som inte är nödvändiga för databasens funktion. Även om redundans ofta är ett önskvärt drag i vissa situationer, är detta inte sant när det gäller funktionen av en databas. Närvaron av duplicerade data kan ofta ha en negativ inverkan på systemets funktion, vilket kan resultera i att information returneras som svar på systemfrågor som är mindre än användbara. En av nyckelfunktionerna för datahantering är att identifiera duplicerade data och ta bort dessa duplikationer.
Potentialen för dataredundans finns i nästan alla typer av databasprogram. Program som betraktas som platt, till exempel kalkylblad, och som är beroende av manuell inmatning av data är särskilt mottagliga för dubblering av information som kan leda till komplikationer när det gäller att hämta önskad information. Relationsstildatabaser, till exempel försäljningskontaktdatabaser, innehåller ofta processer som hjälper till att minimera riskerna för oavsiktlig duplicering, till exempel skapandet av två olika kontaktfiler på samma kontakt som är associerat med samma företag. Även med användning av systemkontroller för att minska förekomsten av dataredundans, finns det fortfarande potentialen att problem uppstår, vilket gör det nödvändigt att regelbundet delta i uppgiften att rensa data i en databas.
I bästa fall innebär dataredundans att databasen är full av information som inte är väsentlig men inte utgör något verkligt hot mot förmågan att hitta informationen när och vid behov. I värsta fall saknar närvaron av duplicerade data databasens viktiga funktioner och kan komplicera processen att använda databasen för att hantera vissa uppgifter. Användning av en kunddatabas som är tilltäppt med redundant information för att generera adressetiketter skulle till exempel resultera i att ett antal duplicerade nivåer skapas, vilket gör det nödvändigt att antingen sortera och bortskaffa duplikaten innan etiketterna kunde användas, eller ta tid att rensa upp databasen innan du försöker skapa etiketter.
Lyckligtvis är övervakning för och korrigering av dataredundans något som många datahanteringssystem kan åstadkomma med relativt enkelhet. Vissa system kommer att flagga inmatningen av duplicerade data, vilket gör det enkelt att granska den upplevda dupliceringen och besluta om den ska raderas eller låta den stå. Det finns till och med program som kan användas för att skanna en befintlig databas för duplikeringar och automatiskt ta bort de redundanta poster med relativt enkelhet.