Hva er et stoppord?
I databehandling og online applikasjoner er et stoppord et ord som blir filtrert ut under behandlingen av en eller annen type tekst, for eksempel under oppstarten av et søk på nettet. Kjent som en komponent i naturlig språkbehandling eller NLP, er ideen bak denne typen filtrering å hjelpe til med å fremskynde søk ved å utelate vanlige taleartikler fra forespørselen. I stedet bruker søkemotoren en enkel markør for å merke tilstedeværelsen av ordet i tekststrengen, men forhindrer ikke tilstedeværelsen av den markøren fra å inkludere den siden i søkeresultatene.
En måte å forstå hvordan stoppord kan komplisere søkemotorenes funksjon, er å vurdere det faktum at når du utfører et søk, vil motoren vurdere alle ord som er inkludert i søkeforespørselen som er sendt inn av brukeren. Som en del av vurderingen ser motoren etter sider som inneholder hvert ord. Det betyr at hvis søkeforespørselen inneholder tre ord, gjør motoren tre sveiser av Internett, og til slutt prioriterer sidene som inneholder alle tre ordene.
For eksempel vil et søk som "huset på bakken" kreve at motoren foretar søk på hvert ord i sekvensen, mens noen til og med kjører et søk på stoppordet "the" to ganger. Dette tar tid og ressurser som kan viderekobles til hjelp i andre søkeordsøk som andre sluttbrukere for tiden utfører. Ved å bruke markører for å erstatte “the” og “on” under søket, kan motoren bruke færre ressurser og fremdeles returnere resultater som med stor sannsynlighet vil tilfredsstille sluttbrukeren.
Mens stoppordet noen ganger blir referert til som et giftord , er det egentlig ikke noe spesielt galt med å inkludere taleartikler i teksten som brukes til å gjennomføre søk. Bruken av et stoppord eller ord som en del av søkeforespørselen kan komplisere prosessen med indeksering av søkemotorer når du prøver å hente data som oppfyller søkekriteriene. Det er likevel ikke sannsynlig at sluttbrukeren vil se stor forskjell i informasjonsutvinningen som til slutt blir returnert.
Det er ingen vanskelig og hurtigstoppordlisting som brukes universelt av alle søkemotorer. Noen søkemotorer bruker faktisk ikke noen form for stoppordliste som en del av den naturlige språkbehandlingsoppgaven i det hele tatt. Andre motorer vil imidlertid gjøre rikelig bruk av stoppordlisten som et middel til å tildele ressurser på en mer effektiv måte, samtidig som de returnerer søkemotorresultater som er nøyaktige og sannsynligvis vil være svært passende for søkeforespørsler sendt inn av alle som bruker en bestemt motor.