Was sind statistisch unwahrscheinliche Sätze?
Statistically Improbable Phrases (SIPs) ist eine Suchtechnologie, die von Amazon.com entwickelt wurde, um den Inhalt von Büchern nach Phrasen zu durchsuchen, die wahrscheinlich eindeutig sind oder häufig vorkommen. Dies ist Teil des patentierten Search Inside! ® -Technologieprogramms von Amazon. Im Wesentlichen ermöglicht Search Inside® Amazon den Zugriff auf den Teil- oder Volltext eines Buches, sodass bestimmte Ausdrücke verwendet werden können, um dieses Buch zu identifizieren, wenn statistisch unwahrscheinliche Ausdrücke in einer Suche verwendet werden.
Der Name für diese Technologie ist etwas verwirrend. Wenn Sie eine Suche durchführen, möchten Sie, dass das, wonach Sie suchen, genau übereinstimmt. Wenn Sie eine eindeutige Phrase in einem Buch identifizieren, ist es unwahrscheinlich, dass Ihre Suche etwas auflistet, das Sie nicht möchten, wenn Sie diese Phrase für die Suche verwenden. Wenn Sie nach einem bestimmten Buch suchen und sich nicht an den Titel, sondern an ein Zitat erinnern können, können Sie das Zitat verwenden, um nach dem Buch zu suchen.
Alternativ können Sie auch nach einem bestimmten Thema innerhalb eines größeren Themas suchen. Wenn Sie beispielsweise nach einem Buch mit Berufsberatung suchen möchten, aber wirklich darüber lesen möchten, wie Sie sich für Jobs vernetzen können, suchen Sie möglicherweise nach "Networking" anstelle von "Berufsberatung" Suchanfragen werden auf der Amazon-Suchergebnisseite angezeigt, einschließlich Büchern wie Dig Your Well Before You Thirsty: das einzige Netzwerkbuch, das Sie jemals brauchen werden .
Wenn Sie mit solchen statistisch unwahrscheinlichen Phrasen gesucht haben, stellen Sie möglicherweise fest, dass Sie Ergebnisse erhalten, die nicht genau übereinstimmen. Zum Beispiel ist die erste Suchausbeute für das Networking nicht für das Karriere-Networking, sondern für Computer- und Technologienetzwerkinformationen. Sie können statistisch unwahrscheinliche Ausdrücke verbessern, indem Sie spezifischer vorgehen. Zum Beispiel erzielen Sie bessere Ergebnisse, indem Sie unter Karriere-Networking oder Job-Networking suchen.
Statistisch unwahrscheinliche Ausdrücke sind tatsächlich wahrscheinliche Ausdrücke, da es sich wahrscheinlich um einen Satz handelt, der nur in einem Search Inside! ® -Buch vorkommt und die Liste der gesuchten Elemente enthält. Sie können beispielsweise eine Shakespeare-Zeile aus einem Shakespeare-Sonett eingeben, um Bücher über Shakespeare aufzurufen. Dies funktioniert nicht immer gut, da einige sehr bekannte Zitate in vielen anderen Büchern als Titel verwendet werden. Sie werden Hamlet nicht finden, wenn Sie nach "Sein oder Nichtsein" suchen. Sie werden Macbeth auch nicht mit statistisch unwahrscheinlichen Ausdrücken wie "Out!" Verdammter Punkt. “In der Tat ist das erste Buch, das Sie unter diesem letzteren Begriff finden, ein Buch über Fleckenentfernung.
Die Verwendung von statistisch unwahrscheinlichen Phrasen ist auch eine Möglichkeit, nach Webinhalten zu suchen. Webcrawler verwenden möglicherweise eine ähnliche Technologie, damit die Benutzer möglichst effektiv und spezifisch nach bestimmten eindeutigen Zeilen suchen können. Es ist keine perfekte Technologie, da ein Webcrawler den Inhalt nicht unbedingt bewertet. Möglicherweise wird nach Keyword-Wiederholungen gesucht, mit denen Personen Teile mit der höheren Anzahl an Keyword-Wiederholungen finden können. Nicht alle Bücher bei Amazon haben die Search Inside! ® -Technologie, aber dies scheint der Trend zu sein. Selbst wenn das System geringfügig fehlerhaft ist, kann dies letztendlich zu einer Verkürzung der Suchzeit führen.