Wat is een stopwoord?
In computer- en online-toepassingen is een stopwoord een woord dat wordt uitgefilterd tijdens de verwerking van een soort tekst, zoals tijdens het initiëren van een online zoekopdracht. Bekend als een onderdeel van natuurlijke taalverwerking of NLP, is het idee achter dit type filtering om zoekopdrachten te versnellen door gemeenschappelijke spraakartikelen uit het verzoek weg te laten. In plaats daarvan gebruikt de zoekmachine een eenvoudige marker om de aanwezigheid van het woord in de tekstreeks te noteren, maar belet niet dat de aanwezigheid van die marker die pagina in de zoekresultaten opneemt.
Een manier om te begrijpen hoe stopwoorden de functie van zoekmachines kunnen bemoeilijken, is het feit dat de zoekmachine bij het uitvoeren van een zoekopdracht elk woord in overweging neemt dat is opgenomen in de door de gebruiker ingediende zoekopdracht. Als onderdeel van die overweging zoekt de engine naar pagina's die elk woord bevatten. Dat betekent dat als de zoekopdracht drie woorden bevat, de motor drie keer over het internet veegt en uiteindelijk prioriteit geeft aan de pagina's die alle drie de woorden bevatten.
Voor een zoekopdracht zoals "het huis op de heuvel" zou de motor bijvoorbeeld zoeken op elk woord in de reeks, waarbij sommige zelfs twee keer op het stopwoord "de" zoeken. Dit kost tijd en middelen die kunnen worden afgeleid voor het helpen bij andere zoekopdrachten op sleutelwoorden die momenteel door andere eindgebruikers worden uitgevoerd. Door tijdens het zoeken markeringen te gebruiken om "de" en "aan" te vervangen, kan de motor minder middelen besteden en toch resultaten opleveren die zeer waarschijnlijk de eindgebruiker tevreden zullen stellen.
Hoewel het stopwoord soms een gifwoord wordt genoemd , is er echt niets bijzonder mis met het opnemen van artikelen in de tekst die wordt gebruikt voor het uitvoeren van zoekopdrachten. Het gebruik van een stopwoord of woorden als onderdeel van de zoekopdracht kan het indexeringsproces van zoekmachines bemoeilijken wanneer wordt geprobeerd gegevens op te halen die aan de zoekcriteria voldoen. Toch zal de eindgebruiker waarschijnlijk niet veel verschil zien in de informatie-extractie die uiteindelijk wordt geretourneerd.
Er is geen harde en snelle stopwoordenlijst die universeel door alle zoekmachines wordt gebruikt. Sommige zoekmachines gebruiken zelfs helemaal geen stopwoordenlijst als onderdeel van de natuurlijke taalverwerkingstaak. Andere zoekmachines zullen echter ruimschoots gebruik maken van de stopwoordenlijst als een middel om middelen op een efficiëntere manier toe te wijzen, terwijl nog steeds resultaten van zoekmachines worden geretourneerd die accuraat zijn en waarschijnlijk zeer geschikt zijn voor zoekverzoeken ingediend door iemand die een bepaalde motor.