Co jsou to statisticky nepravděpodobné fráze?
Statisticky nepravděpodobné fráze neboli SIP jsou vyhledávací technologie vyvinuté společností Amazon.com za účelem hledání obsahu knih, které obsahují věty, které jsou pravděpodobně jedinečné nebo se vyskytují často. Toto je součást patentovaného technologického programu Search Inside! ® společnosti Amazon. Search Inside® v zásadě umožňuje Amazonu přístup k částečnému nebo úplnému textu knihy, takže určité věty lze použít k identifikaci této knihy, pokud se při hledání použijí statisticky nepravděpodobné věty.
Název této technologie je trochu matoucí. Když provádíte vyhledávání, chcete, aby to, co hledáte, přesně odpovídalo. Pokud identifikujete jedinečnou frázi v knize, pokud tuto frázi použijete k vyhledávání, je nepravděpodobné, že vaše hledání zobrazí něco, co nechcete. Pokud hledáte konkrétní knihu a nedokážete si pamatovat název, ale pamatovat si na ni nabídku, můžete ji použít k vyhledání knihy.
Alternativně můžete hledat konkrétní předmět v rámci většího předmětu. Například, pokud jste chtěli hledat knihu s kariérním poradenstvím, ale o čem jste opravdu chtěli číst, bylo, jak síťovat pro zaměstnání, můžete hledat „síť“ místo „kariérového poradenství“. Okamžitě některé z nejdůležitějších vyhledávání se objevují na stránce s výsledky vyhledávání v Amazonu, včetně knih, jako je Dig Your Well Before You Thirsty: jediná síťová kniha, kterou budete kdy potřebovat .
Pokud jste hledali tyto typy statisticky nepravděpodobných frází, můžete si všimnout, že můžete získat výsledky, které nejsou úplně dobré shody. Například první výnos z vyhledávání pro sítě není pro kariérové sítě, ale pro počítačové a technologické síťové informace. Můžete vytvořit lepší statisticky nepravděpodobné fráze tím, že budete konkrétnější. Můžete například dosáhnout lepších výsledků vyhledáváním v rámci kariérového propojení nebo vytváření pracovních míst.
Statisticky nepravděpodobné fráze jsou ve skutečnosti pravděpodobné fráze, protože je pravděpodobné, že se jedná o frázi jedinečnou pro knihu Search Inside! ®, která povede na seznam věcí, které hledáte. Můžete například zadat řádek Shakespeara ze sonetu Shakespeara a vydat knihy o Shakespeareovi. Toto nefunguje vždy dobře, protože některé velmi známé citace se používají v mnoha jiných knihách jako tituly. Hamlet nenajdete, pokud hledáte „Být či nebýt.“ Macbeth nenajdete ani se statisticky nepravděpodobnými frázemi jako „Out! Zatraceně. “Ve skutečnosti, v tomto posledním období je první kniha, kterou najdete, kniha o odstraňování skvrn.
Použití statisticky nepravděpodobných frází je také způsob, jak hledat webový obsah, a prohledávače webů mohou používat podobnou technologii, aby lidé mohli nejefektivněji a konkrétně hledat určité jedinečné řádky. Není to dokonalá technologie, protože webový prohledávač nemusí nutně hodnotit obsah. Může hledat opakování klíčových slov, které lidem umožňuje najít kousky s vyšším počtem opakování klíčových slov. Ne všechny knihy na Amazonu mají technologii Search Inside! ®, ale zdá se, že jde o trend. Nakonec, i když je systém mírně nedokonalý, mohl by zkrátit dobu vyhledávání.