Hvad er et stop-ord?
I computere og online applikationer er et stopord et ord, der filtreres ud under behandlingen af en eller anden type tekst, f.eks. Under påbegyndelse af en søgning online. Kendt som en komponent i naturlig sprogbehandling eller NLP, er tanken bag denne type filtrering at hjælpe med at fremskynde søgninger ved at udelade almindelige taleartikler fra anmodningen. I stedet bruger søgemaskinen en simpel markør til at bemærke tilstedeværelsen af ordet i tekststrengen, men forhindrer ikke tilstedeværelsen af markøren i at inkludere den side i søgeresultaterne.
En måde at forstå, hvordan stopord kan komplicere søgemaskinens funktion, er at overveje det faktum, at når motoren udfører en søgning, vil motoren overveje alle ord, der er inkluderet i søgeanmodningen, der er indsendt af brugeren. Som en del af denne overvejelse søger motoren efter sider, der indeholder hvert ord. Det betyder, at hvis søgeforespørgslen indeholder tre ord, foretager motoren tre fejer på Internettet og til sidst prioriterer de sider, der indeholder alle tre af ordene.
For eksempel ville en søgning som ”huset på bakken” kræve, at motoren foretager søgninger på hvert ord i sekvensen, mens nogle endda kører en søgning på stopordet “the” to gange. Dette tager tid og ressourcer, der kan omdirigeres til hjælp i andre søgeordssøgninger, som andre slutbrugere i øjeblikket udfører. Ved at bruge markører til at erstatte “the” og “on” under søgningen, kan motoren afsætte færre ressourcer og stadig returnere resultater, der med stor sandsynlighed vil tilfredsstille slutbrugeren.
Mens stopordet sommetider omtales som et giftord , er der virkelig ikke noget særlig galt med at inkludere ytringer i teksten, der bruges til at udføre søgninger. Brug af et stop-ord eller -ord som en del af søgeanmodningen kan komplicere processen med indeksering af søgemaskiner, når man forsøger at hente data, der opfylder søgekriterierne. Endelig er det ikke sandsynligt, at slutbrugeren vil se meget forskel i den information, der ekstraheres til sidst.
Der er ingen hårdt og hurtigt stop-ordfortegnelse, der bruges universelt af alle søgemaskiner. Faktisk bruger nogle søgemaskiner ikke nogen form for stopordliste som en del af den naturlige sprogbehandlingsopgave overhovedet. Andre motorer vil dog gøre brug af stop-ordelisten som et middel til at allokere ressourcer på en mere effektiv måde, samtidig med at de returnerer søgemaskineresultater, der er nøjagtige og sandsynligvis er meget passende til søgeanmodninger indsendt af alle, der bruger en bestemt motor.