Quelles sont les phrases statistiquement improbables?
Statistically Improbable Phrases, ou SIPs, est une technologie de recherche développée par Amazon.com pour rechercher dans le contenu des livres les expressions qui y sont susceptibles d'être uniques ou fréquentes. Cela fait partie du programme technologique breveté Search Inside! ® d'Amazon. Pour l'essentiel, Search Inside® permet à Amazon d'accéder au texte partiel ou intégral d'un livre, de sorte que certaines phrases puissent être utilisées pour identifier ce livre si des phrases statistiquement improbables sont utilisées dans une recherche.
Le nom de cette technologie est un peu déroutant. Lorsque vous effectuez une recherche, vous voulez que ce que vous cherchiez corresponde étroitement. En identifiant une phrase unique dans un livre, si vous utilisez cette phrase pour effectuer une recherche, il est peu probable que votre recherche répertorie quelque chose que vous ne voulez pas. Si vous recherchez un livre spécifique et que vous ne vous souvenez plus du titre mais que vous en retenez une citation, vous pouvez utiliser cette citation pour rechercher le livre.
Vous pouvez également rechercher un sujet spécifique dans un sujet plus vaste. Par exemple, si vous souhaitez rechercher un livre avec des conseils de carrière, mais que vous vouliez vraiment savoir comment créer des réseaux pour des emplois, vous pouvez rechercher «réseau» au lieu de «conseils de carrière». Les recherches apparaissent dans la page de résultats de recherche Amazon, y compris des livres tels que Dig Your Well Before Thirsty: indiquez si vous avez besoin de soif .
Si vous avez cherché avec ces types de phrases statistiquement improbables, vous pouvez noter que vous pouvez obtenir des résultats qui ne correspondent pas exactement. Par exemple, le premier rendement de recherche pour la mise en réseau ne concerne pas la mise en réseau de carrière, mais les informations relatives au réseau informatique et technologique. Vous pouvez faire de meilleures phrases statistiquement improbables en étant plus précis. Par exemple, vous obtenez de meilleurs résultats en effectuant une recherche dans les réseaux de carrière ou de travail.
Les phrases statistiquement improbables sont en fait des phrases probables, car il s'agit probablement d'une phrase propre à un livre Search Inside! ® qui figurera en tête de la liste des éléments que vous recherchez. Vous pouvez par exemple entrer une ligne de Shakespeare d'un sonnet de Shakespeare pour faire apparaître des livres sur Shakespeare. Cela ne fonctionne pas toujours bien, car des citations très connues sont utilisées dans de nombreux autres livres. Vous ne trouverez pas Hamlet si vous recherchez «Être ou ne pas être». Vous ne trouverez pas non plus Macbeth avec des phrases statistiquement improbables telles que «Out! Zut spot. ”En fait, sous ce dernier terme, le premier livre que vous trouverez est celui sur l'élimination des taches.
L'utilisation d'expressions statistiquement improbables constitue également un moyen de rechercher du contenu Web. Les robots d'exploration de sites Web peuvent utiliser une technologie similaire afin que les utilisateurs puissent effectuer une recherche plus efficace et plus spécifique de certaines lignes uniques. Ce n'est pas une technologie parfaite, car un robot d'indexation Web n'évalue pas nécessairement le contenu. Il se peut que la recherche de répétition de mots-clés permette aux utilisateurs de trouver des éléments comportant le plus grand nombre de répétitions de mots-clés. Tous les livres sur Amazon ne sont pas dotés de la technologie Search Inside! ®, mais cela semble être la tendance. En fin de compte, même si le système est légèrement imparfait, il pourrait réduire le temps de recherche.