Hva er databasegenormalisering?
Database-normalisering brukes i et databasestyringssystem (DBMS), spesielt med relasjonsdatabaser, for å redusere overflødig informasjon og derfor minimere dataaromalier. Anomalier kan oppstå fra informasjon som er dårlig gruppert eller overflødig og kan forårsake en rekke effekter, for eksempel feil datainnsetting eller sletting av en hel datagruppe. Ved å bruke database-normalisering unngås disse anomaliene, og minnet frigjøres vanligvis slik at databasen kan fungere mer effektivt. Normaliseringsfunksjoner bør brukes regelmessig, omtrent en gang i uken, for å holde databasen frisk og fri for uventede problemer.
Ingen lager en relasjonsdatabase for å ha overflødige data med vilje, men dette skjer vanligvis til tross for databasedesignerens beste innsats. For eksempel, med en ansattedatabase, kan en ansatt være oppført på flere tabeller. Når overflødighet oppstår i stor skala, oppstår det anomalier. Databaseadministratorer kan vanligvis ikke fange opp alle overflødige data, så databasealternalisering er den beste måten å rette opp dette problemet.
Den første oppgaven med database normalisering er å slette, eller flytte, gjenta informasjon. Hvis informasjonen ikke er nødvendig, vil den bli slettet fra databasen. For data som er nødvendig i andre tabeller, søker normalisering å lage bedre relasjonstabeller. Normaliseringsfunksjoner vil dele opp store tabeller, korrigere og forbedre forholdet mellom dataene og vil isolere informasjon for å gjøre datamodifisering enklere i databasen. Ved å trekke fra gjentatte data frigjøres minne vanligvis, noe som gjør at databasen kan løpe jevnere og raskere.
Avvik oppstår fra å nekte eller glemme å normalisere databasen, og de kan gjøre informasjonen ubrukelig. En oppdateringsavvik er når noen oppdaterer dataene, men i stedet for å endre de målrettede dataene, vil databasen lage en ny post som er svært overflødig. Med en innføringsavvik blir en post lagt til i databasen, men ingenting kan legges til under den nye posten. Sletting avvik vil slette en post tilfeldig. Dette er bare noen få vanlige avvik som oppstår hvis databasen ikke er normalisert.
Det er ingen fast standard som forteller en administrator når han eller hun skal bruke normaliseringsfunksjoner for å sikre databasens effektivitet. Planlegging av databasealternalisering omtrent en gang i uken er vanligvis det beste fordi dette hindrer all den nye informasjonen som er lagt til hele uken, fra å oppleve uregelmessigheter. Mindre databaser kan sannsynligvis normaliseres en gang i måneden, og veldig store databaser bør gjøres to ganger i uken fordi større datamengder har større sjanse for uregelmessigheter. Det er imidlertid ingen standard, så databaseadministratoren vil vanligvis velge en plan som han eller hun mener er best for databasen.