¿Cómo funcionan los motores de búsqueda?
Los motores de búsqueda son básicamente algoritmos informáticos que ayudan a los usuarios a encontrar la información específica que están buscando. Con literalmente billones de páginas de información en línea, sin motores de búsqueda efectivos, encontrar algo en Internet sería casi imposible. Los diferentes motores de búsqueda funcionan de diferentes maneras específicas, pero todos utilizan los mismos principios básicos.
Lo primero que deben hacer los motores de búsqueda para funcionar es crear una base de datos local de, básicamente, Internet. Los primeros motores de búsqueda solo indexaron palabras clave y títulos de páginas, pero los motores de búsqueda contemporáneos indexan todo el texto en cada página, así como una gran cantidad de otros datos sobre la relación de esa página con otras páginas, y en algunos casos todo o una parte de los medios disponibles en la página también. Los motores de búsqueda deben indexar toda esta información para poder realizar búsquedas de manera eficiente, en lugar de tener que correr por Internet cada vez que se envía una consulta de búsqueda.
Los motores de búsqueda crean estas bases de datos realizando rastreos periódicos de Internet. Los primeros motores de búsqueda a menudo requerían que se les enviaran páginas para rastrearlos, pero ahora la mayoría de las páginas se encuentran siguiendo los enlaces de otras páginas. Los llamados robots o arañas, programas informáticos creados para indexar páginas, pasar de una página a otra, registrar todos los datos en la página y seguir cada enlace a nuevas páginas. Diferentes motores de búsqueda actualizan sus índices a diferentes intervalos, dependiendo de cuántas arañas tienen constantemente rastreando y qué tan rápido se arrastran esas arañas, algunas de ellas se abren camino a través de Internet todos los días o dos, y otras solo realizan una actualización periódica cada semana o mes.
A medida que la araña pasa por estas páginas, registra las palabras que encuentra en las páginas. Toma notas sobre cuántas veces aparece cada palabra, si las palabras se ponderan de cierta manera, tal vez en función del tamaño, la ubicación o el marcado HTML, y decide qué tan relevantes son las palabras en función de los enlaces que entran en la página, y en el contexto general de la página.
Los motores de búsqueda deben ponderar el valor de cada página y el valor de cada página para las palabras que aparecen en ella. Esta es la parte más complicada de lo que debe hacer un motor de búsqueda, pero también la más importante. En el nivel más simple, un motor de búsqueda podría simplemente hacer un seguimiento de cada palabra en la página y registrar esa página como relevante para las búsquedas con esa palabra clave. Sin embargo, esto no sería muy bueno para la mayoría de los usuarios, ya que lo que se desea es la página más relevante para su consulta de búsqueda. Entonces, diferentes motores de búsqueda surgen con diferentes formas de ponderar la importancia.
Los algoritmos que utilizan varios motores de búsqueda están bien protegidos, para evitar que las personas creen páginas específicamente para obtener mejores clasificaciones, o al menos para limitar el grado en que pueden hacerlo. Esta diferencia es la razón por la cual diferentes motores de búsqueda producen resultados diferentes para los mismos términos. Google podría determinar que una página es el mejor resultado para un término de búsqueda, y Ask podría determinar que esa misma página ni siquiera se encuentra entre las 50 principales. Todo esto se basa solo en cómo valoran los enlaces entrantes y salientes, la densidad de las palabras clave que encuentran importante cómo valoran la colocación diferente de las palabras y cualquier número de factores más pequeños.
La tendencia más reciente en los motores de búsqueda, y probablemente el futuro de la búsqueda en general, es alejarse de las búsquedas basadas en palabras clave a las búsquedas basadas en conceptos. En esta nueva forma de búsqueda, en lugar de limitar una búsqueda a las palabras clave que ingresa el buscador, el motor de búsqueda trata de descubrir qué significan esas palabras clave, de modo que pueda sugerir páginas que pueden no incluir la palabra exacta, pero que de todos modos son de actualidad. la búsqueda. Esto todavía es un campo en desarrollo, pero hasta ahora parece tener mucho potencial para hacer que las búsquedas sean más relevantes, haciendo que la web sea un lugar aún más fácil para encontrar exactamente lo que está buscando.