正規化とは
正規という言葉は、受け入れられた標準に適合するものを意味します。 正規化 -または英国英語の正規化 -は、受け入れられた標準に準拠させるためのプロセスです。 コンピューターの領域では、 正規化という用語は、いくつかの異なる分野で標準を満たすことを指すために使用されます。 それが実際にさまざまな問題の解決策であるとき、それはしばしば問題であると見なされます。 長い単語なので、 正規化は、最初と最後の文字とその間の文字数c14nを使用して省略されます。
正規化は、いくつかの設定でIT(情報技術)で使用されます。 電子メールの送信者アドレス、ファイル名の構成、Unicodeでの文字列エンコード、XML(拡張マークアップ言語)の使用、およびURL(Uniform Resource Locator)の構成を指します。 いずれの場合も、問題は同じアイテムを表す複数の形式の容量であり、正規化は一貫性と標準化への道です。
例としてXMLを取り上げます。 XMLは構文の変更を可能にします。 これは、同一ではない2つのドキュメントが同じ標準形式を持ち、機能的に同等である可能性があることを意味します。 Canonical XML仕様は、個別のドキュメントのIDを確立できる方法を確立することにより、これに対処するように設計されました。 特定のXMLドキュメントの正規形式を生成する方法は、 XML正規化メソッドと呼ばれます 。
URLの正規化の考え方は、特定のWebページを1つのURLで一貫して参照することです。 最も簡単な例は、ホームページの2つのバージョンです。1つには3つのwがあり、もう1つにはありません。
http://www.wisegeek.com
対
http://wisegeek.com
これは、SEO(検索エンジン最適化)の問題です。トラフィックのレポートを分割するため、実際にはすべてが同じ場所に送られます。 その結果、同じページに複数のURLを持つサイトは、実際よりもパフォーマンスが低下しているように見えます。
w以外にも他の問題があります。 これらには、末尾のスラッシュと、大文字と小文字のURLバージョン間の違いが含まれます。 Google®のMatt Cuttsは、すべての代替URLを目的のURLに永続的に(301)リダイレクトすることでこれに対処し、検索エンジンが正規のURLを判断できるようにすることを推奨しています。