Hva er dataredundans?
Dataredundans er en situasjon som oppstår i databasesystemer og innebærer utilsiktet oppretting av dupliserte data som ikke er nødvendig for databasens funksjon. Mens overflødighet ofte er et ønskelig trekk i noen situasjoner, er dette ikke sant når det gjelder funksjonen til en database. Tilstedeværelsen av dupliserte data kan ofte ha en negativ innvirkning på systemets funksjon, noe som kan resultere i å returnere informasjon som svar på systemforespørsler som er mindre enn nyttige. En av nøkkelfunksjonene for datastyring er identifisering av dupliserte data og fjerning av duplikasjoner.
Potensialet for dataredundans finnes i omtrent enhver type databaseprogram. Programmer som anses som flate, for eksempel regneark, og er avhengige av manuell registrering av data, er spesielt utsatt for duplisering av informasjon som kan føre til komplikasjoner når det gjelder å hente inn ønsket informasjon. Relasjonsstil-databaser, for eksempel salgskontaktdatabaser, inkluderer ofte prosesser som hjelper til med å minimere sjansene for utilsiktet duplisering, for eksempel oppretting av to forskjellige kontaktfiler på den samme kontakten tilknyttet samme selskap. Selv med bruk av systemkontroller for å redusere forekomsten av dataredundans, er det fortsatt potensial for problemer som oppstår, noe som gjør det nødvendig å periodisk delta i oppgaven med dataopprydding i en database.
I beste fall betyr dataredundans at databasen er full av informasjon som ikke er avgjørende, men ikke utgjør noen reell trussel for muligheten til å finne dataene når og etter behov. I verste fall bremser tilstedeværelsen av dupliserte data databasens viktige funksjoner og kan komplisere prosessen med å bruke databasen til å administrere visse oppgaver. Hvis du for eksempel bruker en kundedatabase som er tett med overflødig informasjon for å generere postetiketter, vil det føre til at det opprettes et antall dupliserte nivåer, noe som gjør det nødvendig å enten sortere og avhende duplikatene før etikettene kan brukes, eller ta på tide å rydde opp i databasen før du prøver å generere etikettene.
Heldigvis er overvåking og korrigering av dataredundans noe som mange datahåndteringssystemer kan oppnå med relativt letthet. Noen systemer vil flagge inndata av dupliserte data, noe som gjør det enkelt å se gjennom den opplevde dupliseringen og bestemme om de vil slette eller la den stå. Det er til og med programmer som kan brukes til å skanne en eksisterende database for dupliseringer, og automatisk fjerne de overflødige oppføringene med relativt enkelhet.