統計的にあり得ないフレーズとは何ですか?
統計的にありそうもないフレーズ、またはSIPは、Amazon.comによって開発された検索技術で、書籍のコンテンツに含まれているフレーズを検索します。 これは、Amazonの特許取得済みSearch Inside!®テクノロジープログラムの一部です。 基本的に、SearchInside®はAmazonに書籍の一部または全文へのアクセスを提供するため、検索で統計的にありそうもないフレーズが使用されている場合、特定のフレーズを使用してその書籍を識別することができます。
このテクノロジーの名前は少しわかりにくいです。 検索を実行するとき、検索対象を厳密に一致させる必要があります。 本の中で一意のフレーズを識別することにより、そのフレーズを使用して検索する場合、検索で不要なものがリストされることはほとんどありません。 特定の本を探していて、タイトルは覚えられないが、その本からの引用は覚えている場合は、引用を使用して本を検索できます。
または、より大きな主題内で特定の主題を検索することもできます。 たとえば、キャリアに関するアドバイスがある本を検索したいが、本当に読みたいのは、「キャリアに関するアドバイス」ではなく「ネットワーク」を検索するジョブのネットワークを作成する方法でした。検索はAmazonの検索結果ページに表示されます。これには、「のどが渇く前にあなたの健康を掘る:あなたが必要とする唯一のネットワーキングブック
これらのタイプの統計的にありそうもないフレーズで検索した場合、完全に一致しない結果が得られることに注意してください。 たとえば、ネットワーキングの最初の検索結果は、キャリアネットワーキングではなく、コンピューターおよびテクノロジーネットワーク情報です。 より具体的にすることで、統計的にありそうにないフレーズを作成できます。 たとえば、キャリアネットワーキングまたはジョブネットワーキングの下で検索することにより、より良い結果を収集します。
統計的にありそうもないフレーズは、実際には可能性の高いフレーズです。これは、Search Inside!®本に固有のフレーズである可能性が高いため、検索対象のリストの先頭に位置するためです。 たとえば、シェイクスピアのソネットからシェイクスピアの行に出て、シェイクスピアの本を持ち出すことができます。 非常によく知られている引用符が他の多くの本でタイトルとして使用されているため、これは常にうまく機能するとは限りません。 「To be or not to」を検索した場合、 ハムレットは見つかりません。また、「Out!」のような統計的にありそうもないフレーズを含むマクベスも見つかりません。 実際、この後者の用語の下で、最初に見つかるのは汚れの除去に関する本です。
統計的にありそうもないフレーズを使用することもWebコンテンツを検索する方法であり、Webクローラーは同様のテクノロジーを使用して、特定の一意の行を最も効果的かつ具体的に検索できます。 Webクローラーは必ずしもコンテンツを評価するわけではないため、完璧なテクノロジーではありません。 キーワードの繰り返しを探して、人々がより多くのキーワードの繰り返しのある部分を見つけられるようにします。 Amazonのすべての書籍にSearch Inside!®テクノロジーがあるわけではありませんが、これはトレンドのようです。 最終的に、システムがわずかに不完全であっても、検索時間を短縮できます。