Vad är ett stoppord?
I databehandling och onlineapplikationer är ett stoppord ett ord som filtreras ut under behandlingen av någon typ av text, till exempel under initieringen av en sökning online. Känd som en komponent i naturlig språkbearbetning eller NLP, är tanken bakom denna typ av filtrering att hjälpa till att påskynda sökningar genom att utelämna vanliga talartiklar från begäran. Istället använder sökmotorn en enkel markör för att notera ordets närvaro i textsträngen men hindrar inte närvaron av den markören från att inkludera den sidan i sökresultaten.
Ett sätt att förstå hur stoppord kan komplicera sökmotorns funktion är att beakta det faktum att när man utför en sökning kommer motorn att ta hänsyn till varje ord som ingår i sökbegäran som skickas in av användaren. Som en del av detta övervägande letar motorn efter sidor som innehåller varje ord. Det betyder att om sökbegäran innehåller tre ord, gör motorn tre svep av Internet och så småningom prioriterar sidorna som innehåller alla tre orden.
Till exempel skulle en sökning som "huset på kullen" kräva att motorn gör sökningar på varje ord i sekvensen, medan vissa till och med kör en sökning på stoppordet "the" två gånger. Detta tar tid och resurser som kan avledas för att hjälpa till i andra sökordssökningar som andra slutanvändare för närvarande genomför. Genom att använda markörer för att ersätta "the" och "on" under sökningen kan motorn ägna färre resurser och fortfarande returnera resultat som är mycket troligt att tillfredsställa slutanvändaren.
Medan stoppordet ibland kallas ett giftord , är det verkligen inget särskilt fel med att inkludera talartiklar i texten som används för att göra sökningar. Användning av ett stoppord eller ord som en del av sökbegäran kan komplicera processen för indexering av sökmotorer när man försöker hämta data som uppfyller sökkriterierna. Ändå kommer slutanvändaren sannolikt inte att se någon stor skillnad i informationsutdraget som slutligen returneras.
Det finns ingen hård och snabb stopplista som används universellt av alla sökmotorer. I själva verket använder vissa sökmotorer inte någon typ av stoppordlista som en del av det naturliga språkbearbetningsarbetet alls. Andra motorer kommer dock att använda tillräckligt med stoppordlistan som ett sätt att fördela resurser på ett mer effektivt sätt, medan de fortfarande returnerar sökmotorresultat som är korrekta och sannolikt kommer att vara mycket lämpliga för sökbegäranden som skickas in av någon som använder en viss motor.