Was ist Kanonisierung?
Das Wort kanonisch bedeutet etwas, das einem akzeptierten Standard entspricht. Kanonisierung - oder Kanonisierung in britischem Englisch - ist der Prozess, bei dem etwas mit dem akzeptierten Standard in Einklang gebracht wird. Im Bereich der Computer bezeichnet der Begriff Kanonisierung das Erfüllen von Standards in verschiedenen Bereichen. Es wird oft als das Problem angesehen, wenn es tatsächlich die Lösung für eine Vielzahl von Problemen ist. Da es sich um ein so langes Wort handelt, wird die Kanonisierung mit dem ersten und letzten Buchstaben und der Anzahl der dazwischen liegenden Buchstaben abgekürzt: c14n.
Die Kanonisierung wird in der IT (Informationstechnologie) in verschiedenen Einstellungen verwendet. Es bezieht sich auf E-Mail-Absenderadressen, die Erstellung von Dateinamen, die Zeichenfolgencodierung in Unicode, die Verwendung von XML (EXtensible Markup Language) und die Erstellung von URLs (Uniform Resource Locator). In jedem Fall ist das Problem die Kapazität für mehrere Formate, die dasselbe Element darstellen, wobei die Kanonisierung der Weg zur Konsistenz und Standardisierung ist.
Nehmen Sie als Beispiel XML. XML ermöglicht syntaktische Änderungen. Dies bedeutet, dass zwei Dokumente, die nicht identisch sind, dieselbe kanonische Form haben und daher funktional äquivalent sein können. Die kanonische XML-Spezifikation wurde entwickelt, um dies zu beheben, indem eine Methode festgelegt wird, mit der die Identität separater Dokumente festgestellt werden kann. Die Methode zum Generieren des kanonischen Formulars für ein bestimmtes XML-Dokument wird als XML-Kanonisierungsmethode bezeichnet .
Bei der URL-Kanonisierung besteht die Idee darin, eine bestimmte Webseite durchgehend mit einer URL zu referenzieren. Das einfachste Beispiel sind zwei Versionen einer Homepage, von denen eine die drei Ws hat und die andere nicht:
http://www.wisegeek.com
gegen
http://wisegeek.com
Dies ist ein Problem für SEO (Search Engine Optimization), da die Berichte für den Datenverkehr aufgeteilt werden, der tatsächlich an derselben Stelle abgelegt wird. Das Ergebnis ist, dass die Website mit mehreren URLs für die gleichen Seiten eine schlechtere Leistung zu erzielen scheint als sie tatsächlich ist.
Neben den W gibt es noch andere Probleme. Dazu gehören abschließende Schrägstriche und Unterschiede zwischen URL-Versionen mit Groß- und Kleinbuchstaben. Matt Cutts von Google® empfiehlt, dies zu beheben, indem eine permanente (301) Weiterleitung aller alternativen URLs zu der gewünschten URL verwendet wird, damit Suchmaschinen beurteilen können, welche URL die kanonische URL ist.