Cos'è una parola di stop?
Nelle applicazioni di calcolo e online, A Stop Word è una parola che viene filtrata durante l'elaborazione di un tipo di testo, come durante l'inizio di una ricerca online. Conosciuta come un componente dell'elaborazione del linguaggio naturale o della PNL, l'idea alla base di questo tipo di filtraggio è di aiutare ad accelerare le ricerche omettendo articoli di discorso comuni dalla richiesta. Invece, il motore di ricerca utilizza un semplice marcatore per notare la presenza della parola nella stringa di testo ma non impedisce alla presenza di quel marcatore di includere quella pagina nei risultati di ricerca.
Un modo per capire come le parole di arresto possono complicare la funzione dei motori di ricerca è quello di considerare il fatto che quando conduce una ricerca, il motore prenderà in considerazione ogni parola inclusa nella richiesta di ricerca inviata dall'utente. Come parte di tale considerazione, il motore cerca pagine contenenti ogni parola. Ciò significa che se la richiesta di ricerca contiene tre parole, il motore fa tre spazzate di Internet, EDare la priorità venzialmente alle pagine che includono tutte e tre le parole.
Ad esempio, una ricerca come "The House on the Hill" richiederebbe al motore di effettuare ricerche su ogni parola nella sequenza, con alcuni addirittura che eseguono una ricerca sulla parola di arresto "la" due volte. Questo richiede tempo e risorse che potrebbero essere deviate ad aiutare in altre ricerche di parole chiave che altri utenti finali stanno attualmente conducendo. Utilizzando i marcatori per sostituire "The" e "On" durante la ricerca, il motore può dedicare meno risorse e restituire comunque risultati che hanno molto probabilità di soddisfare l'utente finale.
Mentre la parola di arresto viene talvolta definita una parola velenosa , non c'è davvero nulla di particolarmente sbagliato nel includere articoli di discorso nel testo usato per condurre ricerche. L'uso di una parola di arresto o parole come parte della richiesta di ricerca può complicare il processo di indicizzazione dei motori di ricerca quando Attempting per recuperare i dati che soddisfino i criteri di ricerca. Tuttavia, è probabile che l'utente finale non vedrà molta differenza nell'estrazione delle informazioni che alla fine viene restituita.
Non esiste un elenco di parole di arresto rapido che viene utilizzato universalmente da tutti i motori di ricerca. In effetti, alcuni motori di ricerca non utilizzano affatto alcun tipo di elenco di Word di arresto come parte dell'attività di elaborazione del linguaggio naturale. Altri motori, tuttavia, faranno ampio uso dell'elenco di Stop Word come mezzo per allocare le risorse in modo più efficiente, pur restituendo i risultati dei motori di ricerca accurati e probabilmente altamente appropriati per le richieste di ricerca presentate da chiunque utilizzi un particolare motore.