Skip to main content

Что такое канонизация?

Слово канонический означает то, что соответствует принятому стандарту. Каноникализация - или канонизация в британском английском - это процесс, при котором что-то приводится в соответствие с принятым стандартом. В области компьютеров термин канонизация используется для обозначения соответствия стандартам в нескольких различных областях. Это часто считается проблемой, когда на самом деле является решением множества проблем. Поскольку это такое длинное слово, канонизация сокращается с использованием его первых и последних букв и количества букв между ними: c14n.

Каноникализация используется в ИТ (информационных технологиях) в нескольких ситуациях. Он относится к адресам отправителя электронной почты, созданию имени файла, кодированию строк в Unicode, использованию XML (расширяемый язык разметки) и созданию URL (Uniform Resource Locator). В любом случае проблема заключается в возможности нескольких форматов, представляющих один и тот же элемент, а канонизация является способом обеспечения согласованности и стандартизации.

Возьмите XML в качестве примера. XML допускает синтаксические изменения. Это означает, что два неидентичных документа могут иметь одинаковую каноническую форму и, следовательно, быть функционально эквивалентными. Спецификация Canonical XML была разработана для решения этой проблемы путем создания метода, с помощью которого можно установить идентичность отдельных документов. Метод генерации канонической формы для любого данного XML-документа называется методом канонизации XML .

Для канонизации URL идея состоит в том, чтобы ссылаться на определенную веб-страницу последовательно по одному URL. Простейший пример - две версии домашней страницы, одна из которых имеет три буквы , а другая - нет:

http://www.wisegeek.com

против

http://wisegeek.com

Это проблема для SEO (поисковая оптимизация), потому что она делит отчеты по трафику, которые фактически собираются в одном месте. В результате сайт с несколькими URL-адресами для одних и тех же страниц работает хуже, чем на самом деле.

Есть и другие проблемы, кроме w . К ним относятся косые черты и различия между версиями URL с прописными и строчными буквами. Мэтт Каттс из Google® рекомендует решить эту проблему с помощью постоянного (301) перенаправления всех альтернативных URL-адресов на нужный вам URL-адрес, что позволяет поисковым системам судить, какой из них является каноническим.