Hvad er dataredundans?
Dataredundans er en situation, der opstår i databasesystemer og involverer utilsigtet oprettelse af duplikerede data, som ikke er nødvendige for databasens funktion. Mens redundans ofte er et ønskeligt træk i nogle situationer, er dette ikke sandt, når det kommer til databasens funktion. Tilstedeværelsen af duplikerede data kan ofte have en negativ indvirkning på systemets funktion, hvilket resulterer i returnering af information som svar på systemforespørgsler, der er mindre end nyttige. En af nøglefunktionerne i datastyring er identificeringen af duplikerede data og fjernelsen af disse duplikationer.
Potentialet for dataredundans findes i næsten enhver type databaseprogram. Programmer, der betragtes som flade, såsom regneark, og som er afhængige af manuel indtastning af data, er især modtagelige for overlapning af information, der kan føre til komplikationer, når det gælder at indhente de ønskede oplysninger. Relationsstil-databaser, såsom salgskontaktdatabaser, inkluderer ofte processer, der hjælper med at minimere chancerne for utilsigtet duplikering, såsom oprettelse af to forskellige kontaktfiler på den samme kontakt, der er knyttet til det samme firma. Selv med brug af systemcheck for at hjælpe med at reducere forekomsten af dataredundans, er der stadig potentiale for problemer, der gør det nødvendigt med jævne mellemrum at deltage i opgaven med dataoprydning i en database.
I bedste fald betyder dataredundans, at databasen er fyldt med information, der ikke er væsentlig, men ikke udgør nogen reel trussel for evnen til at finde dataene, når og efter behov. I værste fald bremser tilstedeværelsen af de duplikerede data databasens vigtige funktioner og kan komplicere processen med at bruge databasen til at styre visse opgaver. For eksempel vil anvendelse af en kundedatabase, der er tilstoppet med overflødige oplysninger til at generere mailetiketter, resultere i oprettelse af et antal duplikerede niveauer, hvilket gør det nødvendigt at enten sortere og bortskaffe duplikaterne, før etiketterne kunne bruges, eller tage tid til at rydde op i databasen, før du forsøger at generere etiketterne.
Heldigvis er overvågning og korrigering af dataredundans noget, som mange datastyringssystemer kan udføre med relativt lethed. Nogle systemer markerer indtastningen af duplikerede data, hvilket gør det let at gennemgå den opfattede duplikering og beslutte, om de skal slettes eller lade dem stå. Der er endda softwareprogrammer, der kan bruges til at scanne en eksisterende database til duplikationer og automatisk fjerne disse overflødige poster med relativ lethed.