Skip to main content

Что такое статистически невероятные фразы?

Статистически неправдоподобные фразы, или SIP, - это поисковая технология, разработанная Amazon.com для поиска в содержании книг фраз, содержащихся в них, которые могут быть уникальными или встречаться часто. Это часть запатентованной технологической программы Amazon Inside! ®. По сути, Search Inside® предоставляет Amazon доступ к частичному или полному тексту книги, так что определенные фразы могут использоваться для идентификации этой книги, если в поиске используются статистически недостоверные фразы.

Название этой технологии немного сбивает с толку. Когда вы выполняете поиск, вы хотите, чтобы то, что вы ищете, близко соответствовало. Идентифицируя уникальную фразу в книге, если вы используете эту фразу для поиска, маловероятно, что в вашем поиске будет что-то нежелательное. Если вы ищете конкретную книгу и не можете вспомнить название, но можете вспомнить цитату из нее, вы можете использовать цитату для поиска книги.

С другой стороны, вы можете искать конкретный предмет, в рамках более широкого предмета. Например, если вы хотели найти книгу с советом о карьере, но вы действительно хотели прочитать о том, как создать сеть для работы, вы могли бы искать «сеть» вместо «советы по карьере». Сразу же, некоторые из наиболее актуальных результаты поиска появляются на странице результатов поиска Amazon, включая такие книги, как « Выкопай свой колодец, прежде чем пить»: единственная сетевая книга, которая тебе когда-либо понадобится .

Если вы искали эти типы статистически неправдоподобных фраз, вы можете заметить, что вы можете получить результаты, которые не совсем подходят. Например, первый результат поиска для сетей - не для карьерных сетей, а для информации о компьютерных и технологических сетях. Вы можете сделать лучшие статистически невероятные фразы, если будете более конкретными. Например, вы получаете лучшие результаты, выполняя поиск в сети о работе или работе.

Статистически неправдоподобные фразы на самом деле являются вероятными фразами, так как это, вероятно, фраза, уникальная для книги Search Inside! ®, возглавит список того, что вы ищете. Например, вы можете ввести строку Шекспира из сонета Шекспира, чтобы вызвать книги о Шекспире. Это не всегда хорошо работает, так как некоторые очень известные цитаты используются во многих других книгах в качестве названий. Вы не найдете Гамлета, если будете искать «Быть ​​или не быть». Также вы не найдете Макбета со статистически невероятными фразами, такими как «Out! Чертова точка ». На самом деле, под этим последним термином первая книга, которую вы найдете, - это книга по удалению пятен.

Использование статистически неправдоподобных фраз также является способом поиска веб-контента, и веб-сканеры могут использовать аналогичную технологию, чтобы люди могли наиболее эффективно и конкретно искать определенные уникальные строки. Это не идеальная технология, поскольку сканер не обязательно оценивает контент. Он может искать повторение ключевых слов, которое позволяет людям находить фрагменты с большим количеством повторений ключевых слов. Не все книги на Amazon имеют технологию Search Inside! ®, но, похоже, это тенденция. В конечном счете, даже если система немного несовершенна, это может сократить время поиска.