検索エンジンはどのように機能しますか？

検索エンジンは基本的に、ユーザーが探している特定の情報を見つけるのに役立つコンピューターアルゴリズムです。文字通り数兆ページのオンライン情報があり、効果的な検索エンジンなしで、インターネット上で何かを見つけることはほとんど不可能です。さまざまな検索エンジンはさまざまな特定の方法で動作しますが、それらはすべて同じ基本原則を利用しています。

検索エンジンが機能するために最初にしなければならないことは、基本的にインターネットのローカルデータベースを作成することです。初期の検索エンジンは、ページのキーワードとタイトルをインデックスしただけですが、現代の検索エンジンはすべてのページのすべてのテキストをインデックスし、そのページの他のページとの関係に関する多くのデータ、および場合によってはページで入手可能なメディアのすべてまたは一部をインデックスします。検索エンジンは、検索クエリが送信されるたびにインターネットを実行する必要があるのではなく、このすべての情報を効率的に実行できるように、このすべての情報をインデックス化する必要があります。

検索エンジンは、インターネットの定期的なクロールを実行することにより、これらのデータベースを作成します。初期の検索エンジンは、多くの場合、それらをcraうためにページを提出する必要がありましたが、現在、ほとんどのページは他のページからのリンクをフォローすることで見つかります。ロボットやクモと呼ばれるもの、インデックスページのために構築されたコンピュータープログラム、ページからページへのフリット、ページ上のすべてのデータの記録、および新しいページへのすべてのリンクに従う。異なる検索エンジンは、常にクロールしているクモの数や、それらのクモがクロールする速さに応じて、異なる間隔でインデックスを更新し、毎日1〜2日にインターネットを介して働いている人もいれば、毎週または1か月だけの定期的な更新をしている人もいます。

クモがこれらのページを通過すると、ページにある単語を記録します。おそらくに基づいて、単語が特定の方法で重み付けされているかどうか、各単語が表示される回数についてメモを作成しますサイズ、場所、またはHTMLマークアップ、およびページに掲載されているリンクとページの一般的なコンテキストに基づいて、単語の関連性がどの程度関連しているかを決定します。

検索エンジンは、各ページの値と、それに表示される単語の各ページの値を重み付けする必要があります。これは、検索エンジンがしなければならないことの中で最も難しい部分ですが、最も重要な部分です。最もシンプルなレベルでは、検索エンジンはページ上のすべての単語を単純に追跡し、そのキーワードでの検索に関連するページを記録できます。ただし、ほとんどのユーザーにとってこれはあまり役に立たないでしょう。必要なことは、検索クエリに最も関連するページであるためです。したがって、さまざまな検索エンジンが重み付けの重要性のさまざまな方法を思いつきます。

さまざまな検索エンジンが使用するアルゴリズムは、人々がより良いランクを得るために特別にページを作成することを防ぐために、または少なくともそれができる程度を制限することを防ぐためによく保護されています。この違いは、異なる検索エンジンが違いをもたらす理由です同じ条件の結果。 Googleは、1つのページが検索用語の最良の結果であると判断する可能性があり、尋ねると、同じページがトップ50にさえないと判断する場合があります。これはすべて、インバウンドリンクとアウトバウンドリンクをどのように評価するか、重要だと思うキーワードの密度、単語の異なる配置、およびいくつかの小さな要因を評価する方法に基づいています。

検索エンジンの最新の傾向、および一般的な検索の将来の可能性は、キーワードベースの検索からコンセプトベースの検索に移行することです。検索を入力するキーワードに検索を制限するのではなく、この新しい形式の検索では、検索エンジンはそれらのキーワードの意味を把握しようとします。これはまだ発展途上の分野ですが、これまでのところ、検索をより関連性の高いものにするために多くの可能性があるようで、あなたが探しているものを正確に見つけるためのさらに簡単な場所になります。

検索エンジンはどのように機能しますか？

他の言語

関連記事

どのように我々は助けることができます？