Co je kanonizace?
Slovo kanonický znamená něco, co odpovídá přijatelné normě. Kanonikalizace - nebo kanonikalizace v britské angličtině - je proces, kterým se něco uvádí do souladu s uznávanou normou. V oblasti počítačů se termín kanonikalizace používá k označení splnění standardů v několika různých oblastech. To je často považováno za problém, když je to vlastně řešení různých problémů. Protože je to tak dlouhé slovo, kanonicalization je zkrácena používat jeho první a poslední dopisy a množství dopisů mezi: c14n.
Kanonikalizace se v IT (Information Technology) používá v několika nastaveních. Vztahuje se na adresy odesílatele e-mailu, na konstrukci názvu souboru, na řetězcové kódování v Unicode, na použití XML (EXtensible Markup Language) a na URL (Uniform Resource Locator) konstrukci. V každém případě je problémem kapacita více formátů představujících stejnou položku, přičemž kanonikalizace je cestou konzistence a standardizace.
Vezměme XML jako příklad. XML umožňuje syntaktické změny. To znamená, že dva dokumenty, které nejsou totožné, by mohly mít stejnou kanonickou podobu, a tudíž by mohly být funkčně ekvivalentní. Specifikace Canonical XML byla navržena tak, aby to vyřešila zavedením metody, pomocí níž lze stanovit totožnost samostatných dokumentů. Metoda pro generování kanonického formuláře pro jakýkoli daný dokument XML se nazývá metoda kanonikalizace XML .
V případě kanonikalizace adres URL je myšlenkou odkazovat na konkrétní webovou stránku konzistentně pomocí jedné adresy URL. Nejjednodušším příkladem jsou dvě verze domovské stránky, z nichž jedna má tři a druhá ne:
http://www.wisegeek.com
proti
http://wisegeek.com
To je problém pro SEO (optimalizace pro vyhledávače), protože rozděluje zprávy o provozu, z nichž všechny vlastně směřují na stejné místo. Výsledkem je, že se zdá, že web s více adresami URL na stejných stránkách má slabší výkon, než ve skutečnosti je.
Kromě toho jsou ještě další problémy. Patří sem koncové lomítka a rozdíly mezi verzemi URL velkými a malými písmeny. Matt Cutts of Google® doporučuje tento problém řešit pomocí permanentního (301) přesměrování všech alternativních adres URL na požadovanou adresu URL, což umožňuje vyhledávačům posoudit, která je kanonická adresa URL.