Hva er kanonisering?
Ordet kanonisk betyr noe som samsvarer med en akseptert standard. Kanonisering - eller kanonisering på britisk engelsk - er prosessen der noe bringes i samsvar med den aksepterte standarden. På datamaskinens område brukes begrepet canonicalization for å referere til å møte standarder på flere forskjellige områder. Det blir ofte sett på å være problemet, når det faktisk er løsningen på en rekke problemer. Siden det er et så langt ord, forkortes kanonisering ved å bruke de første og siste bokstavene og antall bokstaver i mellom: c14n.
Canonicalization brukes i IT (informasjonsteknologi) i flere innstillinger. Det refererer til e-post-avsenderadresser, til filnavnkonstruksjon, til strengkoding i Unicode, til bruk av XML (EXtensible Markup Language) og til URL (Uniform Resource Locator) konstruksjon. I alle tilfeller er problemet kapasiteten for flere formater som representerer det samme elementet, og kanonisering er veien til konsistens og standardisering.
Ta XML som eksempel. XML gir mulighet for syntaktiske endringer. Dette betyr at to dokumenter som ikke er identiske, kan ha den samme kanoniske formen, og dermed være funksjonelt likeverdige. Canonical XML-spesifikasjonen ble designet for å adressere dette ved å etablere en metode der identiteten til separate dokumenter kan etableres. Metoden for å generere den kanoniske formen for et gitt XML-dokument kalles XML-kanonikaliseringsmetoden .
For URL-kanonisering er ideen å referere til en spesifikk webside ved en URL. Det enkleste eksemplet er to versjoner av en hjemmeside, hvorav den ene har de tre w -ene og den andre ikke:
http://www.wisegeek.com
mot
http://wisegeek.com
Dette er et problem for SEO (Search Engine Optimization) fordi den deler rapportene for trafikk, som alle faktisk kommer til samme sted. Resultatet er at nettstedet med flere nettadresser for de samme sidene ser ut til å prestere dårligere enn det faktisk er.
Det er andre problemer i tillegg til w 's. Disse inkluderer etterfølgende skråstreker og forskjeller mellom URL-versjoner med store og små bokstaver. Matt Cutts fra Google® anbefaler å adressere dette ved å bruke en permanent (301) viderekobling av alle alternative URL-er til URLen du ønsker, slik at søkemotorer kan bedømme hvilken som er den kanoniske URL-en.