Wat zijn statistisch onwaarschijnlijke zinnen?
Statistisch onwaarschijnlijke zinnen of SIP's is een zoektechnologie die is ontwikkeld door Amazon.com om in de inhoud van boeken te zoeken naar zinnen die waarschijnlijk uniek zijn of vaak voorkomen. Dit maakt deel uit van het gepatenteerde Search Inside! ® -technologieprogramma van Amazon. In wezen geeft Search Inside® Amazon toegang tot de gedeeltelijke of volledige tekst van een boek, zodat bepaalde zinnen kunnen worden gebruikt om dat boek te identificeren als statistisch onwaarschijnlijke zinnen worden gebruikt in een zoekopdracht.
De naam voor deze technologie is een beetje verwarrend. Wanneer u een zoekopdracht uitvoert, wilt u dat wat u zoekt nauw aansluit. Door een unieke zin in een boek te identificeren, is het onwaarschijnlijk dat uw zoekopdracht iets oproept dat u niet wilt gebruiken als u die zin gebruikt om te zoeken. Als u op zoek bent naar een specifiek boek en u de titel niet kunt herinneren, maar u kunt er wel een citaat uit onthouden, kunt u het citaat gebruiken om naar het boek te zoeken.
U kunt ook zoeken naar een specifiek onderwerp, binnen een groter onderwerp. Als je bijvoorbeeld naar een boek met loopbaanadvies wilde zoeken, maar waar je echt over wilde lezen, was hoe je zou kunnen netwerken voor banen, dan zou je kunnen zoeken naar 'netwerken' in plaats van 'loopbaanadvies'. Onmiddellijk zijn enkele van de meest relevante zoekopdrachten verschijnen op de zoekresultatenpagina van Amazon, inclusief boeken als Dig Your Well Before You Dorst: het enige netwerkboek dat u ooit nodig zult hebben .
Als u met dit soort statistisch onwaarschijnlijke zinnen hebt gezocht, merkt u mogelijk dat u resultaten krijgt die niet bepaald een goede match zijn. Het eerste zoekrendement voor netwerken is bijvoorbeeld niet voor loopbaannetwerken, maar voor computer- en technologienetwerkinformatie. U kunt betere statistisch onwaarschijnlijke frasen maken door specifieker te zijn. U krijgt bijvoorbeeld betere resultaten door te zoeken onder loopbaannetwerken of jobnetwerken.
Statistisch onwaarschijnlijke zinnen zijn eigenlijk waarschijnlijke zinnen, omdat het waarschijnlijk een uitdrukking is die uniek is voor een Search Inside! ® -boek bovenaan de lijst met dingen waarnaar u zoekt. Je kunt bijvoorbeeld een rij Shakespeare van een Shakespeare-sonnet invoeren om boeken over Shakespeare te openen. Dit werkt niet altijd goed omdat een aantal zeer bekende citaten in veel andere boeken als titels worden gebruikt. U zult Hamlet niet vinden als u zoekt naar "Zijn of niet zijn". Noch zult u Macbeth vinden met statistisch onwaarschijnlijke zinnen als "Uit! Verdomme plek. ”In feite, onder deze laatste term, is het eerste boek dat je tegenkomt er een over het verwijderen van vlekken.
Het gebruik van statistisch onwaarschijnlijke zinnen is ook een manier om naar webinhoud te zoeken, en webcrawlers kunnen vergelijkbare technologie gebruiken zodat mensen het meest effectief en specifiek naar bepaalde unieke regels kunnen zoeken. Het is geen perfecte technologie, omdat een webcrawler niet noodzakelijkerwijs de inhoud beoordeelt. Het kan zoeken naar trefwoordherhaling waarmee mensen stukken kunnen vinden met het hogere aantal trefwoordherhalingen. Niet alle boeken op Amazon hebben Search Inside! ® -technologie, maar dit lijkt de trend te zijn. Uiteindelijk, zelfs als het systeem enigszins onvolmaakt is, kan dit de zoektijd verkorten.