Comment fonctionnent les moteurs de recherche?
Les moteurs de recherche sont essentiellement des algorithmes informatiques qui aident les utilisateurs à trouver les informations spécifiques qu'ils recherchent. Avec littéralement des milliards de pages d'informations en ligne, sans moteurs de recherche efficaces, trouver quoi que ce soit sur Internet serait presque impossible. Différents moteurs de recherche fonctionnent de différentes manières spécifiques, mais ils utilisent tous les mêmes principes de base.
La première chose que les moteurs de recherche doivent faire pour fonctionner est de faire une base de données locale, en gros, Internet. Les premiers moteurs de recherche indexent des mots clés et des titres de pages, mais les moteurs de recherche contemporains indexent tout le texte sur chaque page, ainsi que de nombreuses autres données sur la relation de cette page avec d'autres pages, et dans certains cas, tout ou une partie des médias disponibles sur la page. Les moteurs de recherche doivent indexer toutes ces informations afin qu'ils puissent effectuer des recherches efficacement, plutôt que d'avoir à courir sur Internet chaque fois qu'une requête de recherche est envoyée.
Les moteurs de recherche créent ces bases de données en effectuant des rampes périodiques d'Internet. Les premiers moteurs de recherche exigeaient souvent que les pages leur soient soumises afin de les ramper, mais maintenant la plupart des pages sont trouvées en suivant les liens d'autres pages. Ce qu'on appelle les robots ou les araignées, les programmes informatiques conçus pour indexer les pages, passer de page à la page, enregistrer toutes les données de la page et suivre chaque lien vers de nouvelles pages. Différents moteurs de recherche rafraîchissent leurs index à différents intervalles, selon le nombre d'araignées qu'ils ont constamment rampant, et à quelle vitesse ces araignées rampent, certains travaillant sur Internet tous les jours ou deux, et d'autres ne font qu'un actualisation périodique chaque semaine ou chaque mois.
Alors que l'araignée passe par ces pages, il enregistre les mots qu'il trouve sur les pages. Il prend des notes sur combien de fois chaque mot apparaît, que les mots soient pondérés de certaines manières, peut-être sur la baseTaille, emplacement ou balisage HTML, et décide à quel point les mots sont pertinents sur les liens qui arrivent sur la page et sur le contexte général de la page.
Les moteurs de recherche doivent alors pondérer la valeur de chaque page et la valeur de chaque page pour les mots qui y apparaissent. C'est la partie la plus délicate de ce qu'un moteur de recherche doit faire, mais aussi le plus important. Au niveau le plus simple, un moteur de recherche pourrait simplement garder une trace de chaque mot de la page et enregistrer cette page comme pertinente pour les recherches avec ce mot-clé. Cependant, cela ne ferait pas grand-chose de bien à la plupart des utilisateurs, car ce qui est souhaité est la page la plus pertinente pour leur requête de recherche. Les moteurs de recherche différents élaborent donc différentes façons de pondérer l'importance.
Les algorithmes que divers moteurs de recherche utilisent sont bien protégés, pour empêcher les gens de créer spécifiquement des pages pour obtenir de meilleurs rangs, ou du moins pour limiter le degré auquel ils peuvent le faire. Cette différence est la raison pour laquelle différents moteurs de recherche donnent des différencest RÉSULTATS pour les mêmes termes. Google pourrait déterminer qu'une page est le meilleur résultat pour un terme de recherche, et Ask pourrait déterminer que la même page n'est même pas dans le top 50. Tout cela est simplement basé sur la façon dont ils apprécient les liens entrants et sortants, la densité des mots clés qu'ils trouvent importants, comment ils apprécient le placement différent des mots, et tout nombre de facteurs plus petits.
La dernière tendance des moteurs de recherche, et probablement l'avenir de la recherche en général, consiste à s'éloigner des recherches basées sur des mots clés aux recherches basées sur le concept. Dans cette nouvelle forme de recherche, plutôt que de limiter une recherche aux mots clés que les entrées du chercheur, le moteur de recherche essaie de déterminer ce que signifient ces mots clés, afin qu'il puisse suggérer des pages qui ne peuvent pas inclure le mot exact, mais qui sont néanmoins accessibles à la recherche. C'est toujours un domaine en développement, mais jusqu'à présent, il semble avoir beaucoup de potentiel pour rendre les recherches plus pertinentes, ce qui rend le Web un endroit encore plus facile pour trouver exactement ce que vous recherchez.