Co to jest kanonizacja?
Słowo kanoniczny oznacza coś, co odpowiada przyjętemu standardowi. Kanonizacja - lub kanonizacja w języku angielskim angielskim - jest procesem, w którym coś dostosowuje się do przyjętej normy. W dziedzinie komputerów termin kanonizacja jest używany w odniesieniu do spełniania standardów w kilku różnych obszarach. Często uważa się, że jest to problem, gdy w rzeczywistości jest rozwiązaniem różnych problemów. Ponieważ jest to tak długie słowo, kanonizacja jest skracana przy użyciu jego pierwszej i ostatniej litery oraz liczby liter pomiędzy: c14n.
Kanonizacja jest stosowana w IT (Information Technology) w kilku ustawieniach. Odnosi się do adresów nadawców wiadomości e-mail, budowy nazw plików, kodowania ciągów znaków w Unicode, używania XML (EXtensible Markup Language) i konstrukcji URL (Uniform Resource Locator). W każdym przypadku problemem jest pojemność wielu formatów reprezentujących ten sam element, przy czym kanonizacja jest drogą do spójności i standaryzacji.
Weź XML jako przykład. XML pozwala na zmiany składniowe. Oznacza to, że dwa dokumenty, które nie są identyczne, mogą mieć tę samą kanoniczną formę, a zatem mogą być funkcjonalnie równoważne. Kanoniczna specyfikacja XML została zaprojektowana w celu rozwiązania tego problemu poprzez ustanowienie metody, dzięki której można ustalić tożsamość oddzielnych dokumentów. Metoda generowania formy kanonicznej dla dowolnego dokumentu XML nazywa się metodą kanonizacji XML .
W przypadku kanonizacji adresów URL ideą jest spójne odwoływanie się do określonej strony internetowej za pomocą jednego adresu URL. Najprostszym przykładem są dwie wersje strony głównej, z których jedna ma trzy w , a druga nie:
http://www.wisegeek.com
przeciw
http://wisegeek.com
Jest to problem dla SEO (Search Engine Optimization), ponieważ dzieli raporty dotyczące ruchu, z których wszystkie trafiają w to samo miejsce. W rezultacie witryna z wieloma adresami URL dla tych samych stron wydaje się działać słabiej niż w rzeczywistości.
Istnieją inne problemy oprócz w . Należą do nich końcowe ukośniki i różnice między wersjami URL dużymi i małymi literami. Matt Cutts z Google® zaleca rozwiązanie tego problemu za pomocą stałego (301) przekierowania wszystkich alternatywnych adresów URL na żądany adres URL, umożliwiając wyszukiwarkom ocenę, który jest kanonicznym adresem URL.