Vad är statistiskt osannolika fraser?

Statistiskt osannolika fraser, eller SIPs, är en sökteknik utvecklad av Amazon.com för att söka i innehållet i böcker efter fraser i dem som sannolikt är unika eller förekommer ofta. Detta är en del av Amazons patenterade Search Inside!®-teknologiprogram. I grund och botten ger Search Inside® Amazon tillgång till en del av eller hela texten i en bok, så att vissa fraser kan användas för att identifiera den boken om statistiskt osannolika fraser används i en sökning.

Namnet på denna teknik är lite förvirrande. När du gör en sökning vill du att det du söker efter ska matcha nära. Genom att identifiera en unik fras i en bok, om du använder den frasen för att söka är det osannolikt att din sökning kommer att lista något du inte vill ha. Om du letar efter en specifik bok och inte kommer ihåg titeln men kan komma ihåg ett citat från den, kan du använda citatet för att söka efter boken.

Alternativt kanske du vill söka efter ett specifikt ämne, inom ett större ämne. Till exempel, om du ville söka efter en bok med karriärråd, men det du verkligen ville läsa om var hur du nätverkar för jobb, kan du söka efter ”nätverk” istället för ”karriärråd”. Omedelbart visas några av de mest relevanta sökningarna på Amazons sökresultatsida, inklusive böcker som Dig Your Well Before You’re Thirsty: the Only Networking Book You Ever Need.

Om du har sökt med den här typen av statistiskt osannolika fraser, kanske du noterar att du kan få resultat som inte är direkt en bra matchning. Till exempel är det första sökresultatet för nätverk inte för karriärnätverk, utan för data- och tekniknätverksinformation. Du kan skapa bättre statistiskt osannolika fraser genom att vara mer specifik. Till exempel får du bättre resultat genom att söka under karriärnätverk eller jobbnätverk.

Statistiskt osannolika fraser är faktiskt sannolika fraser, eftersom det sannolikt är en fras som är unik för en Search Inside!®-bok som kommer att leda listan över saker du söker efter. Du kan till exempel skriva in en rad Shakespeare från en Shakespeare-sonett för att få upp böcker om Shakespeare. Detta fungerar inte alltid bra eftersom vissa mycket välkända citat används i många andra böcker som titlar. Du hittar inte Hamlet om du söker efter ”Att vara eller inte vara.” Du kommer inte heller att hitta Macbeth med statistiskt osannolika fraser som ”Ut! jävla plats.” Faktum är att under den senare termen är den första boken du hittar en om fläckborttagning.

Att använda statistiskt osannolika fraser är också ett sätt att söka efter webbinnehåll, och sökrobotar kan använda liknande teknik så att människor kan söka mest effektivt och specifikt efter vissa unika rader. Det är inte en perfekt teknik eftersom en sökrobot inte nödvändigtvis bedömer innehållet. Det kan leta efter nyckelordsupprepning som gör det möjligt för människor att hitta bitar med det högre antalet sökordsupprepningar. Inte alla böcker på Amazon har Search Inside!®-teknik, men detta verkar vara trenden. I slutändan, även om systemet är något ofullkomligt, kan det minska söktiden.