Hvad er kanonisering?
Ordet kanonisk betyder noget, der er i overensstemmelse med en accepteret standard. Kanonisering - eller kanonisering på britisk engelsk - er processen, hvorved noget bringes i overensstemmelse med den accepterede standard. På computereområdet bruges udtrykket kanonikalisering til at henvise til at opfylde standarder på flere forskellige områder. Det anses ofte for at være problemet, når det faktisk er løsningen på forskellige problemer. Da det er et så langt ord, forkortes kanonisering ved hjælp af dets første og sidste bogstaver og antallet af bogstaver derimellem: c14n.
Canonicalization bruges i IT (informationsteknologi) i flere indstillinger. Det henviser til e-mail-afsenderadresser, til filnavnskonstruktion, til strengkodning i Unicode, til brug af XML (EXtensible Markup Language) og til URL (Uniform Resource Locator) konstruktion. I hvert tilfælde er problemet kapaciteten til flere formater, der repræsenterer det samme element, idet kanonisering er vejen til konsistens og standardisering.
Tag XML som et eksempel. XML giver mulighed for syntaktiske ændringer. Dette betyder, at to dokumenter, der ikke er identiske, kunne have den samme kanoniske form og således være funktionelt ækvivalente. Canonical XML-specifikationen blev designet til at tackle dette ved at etablere en metode, hvorpå separate dokumenter kan identificeres. Metoden til generering af den kanoniske form for ethvert givet XML-dokument kaldes XML-kanonikaliseringsmetoden .
Ved URL-kanonisering er ideen at konsekvent henvise til en bestemt webside med en URL. Det enkleste eksempel er to versioner af en hjemmeside, hvoraf den ene har de tre w'er, og den anden ikke:
http://www.wisegeek.com
imod
http://wisegeek.com
Dette er et problem for SEO (Søgemaskineoptimering), fordi det deler rapporterne til trafik, som alle faktisk kommer til det samme sted. Resultatet er, at webstedet med flere webadresser til de samme sider ser ud til at fungere dårligere, end det faktisk er.
Der er andre problemer udover w'erne . Disse inkluderer bageste skråstreg og forskelle mellem URL-versioner med store og små bogstaver. Matt Cutts fra Google® anbefaler at adressere dette ved at bruge en permanent (301) omdirigering af alle alternative URL'er til den ønskede URL, så søgemaskiner kan bedømme, hvilken er den kanoniske URL.