Hva er statistisk usannsynlige setninger?
Statistisk usannsynlige setninger, eller SIPs, er en søketeknologi utviklet av Amazon.com for å søke i innholdet i bøker etter setninger i dem som sannsynligvis vil være unike eller ofte forekomme. Dette er en del av Amazons patenterte Search Inside! ® -teknologiprogram. I hovedsak gir Search Inside® Amazon tilgang til den delvise eller fullteksten til en bok, slik at visse setninger kan brukes til å identifisere den boken hvis det brukes statistisk usannsynlige setninger i et søk.
Navnet på denne teknologien er litt forvirrende. Når du utfører et søk, vil du at det du søker etter skal samsvare tett. Ved å identifisere en unik frase i en bok, hvis du bruker den frasen til å søke, er det usannsynlig at søket ditt vil liste opp noe du ikke vil ha. Hvis du leter etter en bestemt bok og ikke kan huske tittelen, men kan huske et sitat fra den, kan du bruke sitatet til å søke etter boken.
Alternativt kan det være lurt å søke etter et bestemt emne, innenfor et større emne. For eksempel, hvis du ønsket å søke etter en bok med karriereråd, men det du virkelig ønsket å lese om var hvordan du nettverk etter jobber, kan du søke etter "nettverk" i stedet for "karriereråd." Umiddelbart, noe av det mest relevante søk vises på Amazon-søkeresultatsiden, inkludert bøker som Dig Your Well Before You Thirsty: the Only Networking Book You Ever Need .
Hvis du har søkt med denne typen statistisk usannsynlige setninger, kan du legge merke til at du kan få resultater som ikke akkurat stemmer. For eksempel er det første søkeutbyttet for nettverk ikke for karriere-nettverk, men for datamaskin- og teknologinettverksinformasjon. Du kan lage bedre statistisk usannsynlige setninger ved å være mer spesifikke. For eksempel får du bedre resultater ved å søke i karriere-nettverk eller jobbenettverk.
Statistisk usannsynlige setninger er faktisk sannsynlige setninger, ettersom det sannsynligvis er en frase som er unik for en søk inn! ® -bok som vil lede listen over ting du søker etter. Du kan for eksempel legge inn en linje med Shakespeare fra en Shakespeare-sonett for å få opp bøker om Shakespeare. Dette fungerer ikke alltid bra siden noen veldig kjente sitater blir brukt i mange andre bøker som titler. Du vil ikke finne Hamlet hvis du søker etter “Å være eller ikke være.” Du vil heller ikke finne Macbeth med statistisk usannsynlige uttrykk som “Ut! Damn spot. ”I løpet av dette siste begrepet er den første boken du faktisk finner en om flekkfjerning.
Å bruke statistisk usannsynlige setninger er også en måte å søke etter nettinnhold på, og webcrawlere kan bruke lignende teknologi slik at folk kan søke mest effektivt og spesifikt etter bestemte unike linjer. Det er ikke en perfekt teknologi siden en webcrawler ikke nødvendigvis vurderer innholdet. Det kan se etter repetisjon av nøkkelord som gjør det mulig for folk å finne brikker med det høyere antallet repetisjoner av søkeord. Ikke alle bøker på Amazon har Search Inside! ® -teknologi, men dette ser ut til å være trenden. Til slutt, selv om systemet er litt ufullkommen, kan det kutte ned på søketiden.