Qu'est-ce qu'un mot d'arrêt?
En informatique et dans les applications en ligne, un mot vide est un mot filtré lors du traitement d'un type de texte, par exemple lors du lancement d'une recherche en ligne. Connu comme l'un des composants du traitement du langage naturel ou PNL, ce filtre a pour objectif de faciliter les recherches en omettant les articles de conversation courants de la requête. Au lieu de cela, le moteur de recherche utilise un simple marqueur pour noter la présence du mot dans la chaîne de texte mais n'empêche pas la présence de ce marqueur d'inclure cette page dans les résultats de la recherche.
Une façon de comprendre en quoi les mots vides peuvent compliquer la fonction des moteurs de recherche est de prendre en compte le fait que lors de la recherche, le moteur prend en compte chaque mot inclus dans la demande de recherche soumise par l'utilisateur. Dans le cadre de cette considération, le moteur recherche les pages contenant chaque mot. Cela signifie que si la requête de recherche contient trois mots, le moteur effectue trois balayages d’Internet, en donnant éventuellement la priorité aux pages contenant les trois mots.
Par exemple, une recherche telle que «la maison sur la colline» nécessiterait que le moteur effectue des recherches sur chaque mot de la séquence, certains même effectuant une recherche sur le mot précédent «le» deux fois. Cela prend du temps et des ressources qui pourraient être détournées pour faciliter d'autres recherches par mot clé actuellement effectuées par d'autres utilisateurs finaux. En utilisant des marqueurs pour remplacer «le» et «activé» pendant la recherche, le moteur peut consacrer moins de ressources tout en renvoyant des résultats très susceptibles de satisfaire l'utilisateur final.
Bien que le mot vide soit parfois désigné comme un poison , il n’ya vraiment rien de mal à inclure des articles de style dans le texte utilisé pour effectuer des recherches. L'utilisation d'un ou de plusieurs mots vides dans la requête de recherche peut compliquer le processus d'indexation des moteurs de recherche lors de la tentative d'extraction de données répondant aux critères de recherche. Néanmoins, l'utilisateur final ne verra probablement pas beaucoup de différences dans l'extraction d'informations renvoyée.
Il n'y a pas de liste de mots vides qui soit utilisée de manière universelle par tous les moteurs de recherche. En fait, certains moteurs de recherche n'utilisent aucun type de liste de mots vides dans le cadre de la tâche de traitement du langage naturel. Cependant, d'autres moteurs utiliseront largement la liste de mots vides pour allouer les ressources de manière plus efficace, tout en renvoyant des résultats de moteur de recherche précis et susceptibles de convenir parfaitement aux demandes de recherche soumises par toute personne utilisant un document particulier. moteur.