¿Cómo funcionan los motores de búsqueda?
Los motores de búsqueda son básicamente algoritmos de computadora que ayudan a los usuarios a encontrar la información específica que están buscando. Con literalmente billones de páginas de información en línea, sin motores de búsqueda efectivos, encontrar cualquier cosa en Internet sería casi imposible. Diferentes motores de búsqueda funcionan de diferentes maneras específicas, pero todos utilizan los mismos principios básicos.
Lo primero que tienen que hacer los motores de búsqueda para funcionar es hacer una base de datos local de, básicamente, Internet. Los primeros motores de búsqueda simplemente indexaron palabras clave y títulos de páginas, pero los motores de búsqueda contemporáneos indexan todo el texto en cada página, así como una gran cantidad de datos sobre la relación de esa página con otras páginas, y en algunos casos también todas o una parte de los medios disponibles en la página. Los motores de búsqueda deben indexar toda esta información para que puedan ejecutar búsquedas en ella de manera eficiente, en lugar de tener que ejecutarse por Internet cada vez que se envía una consulta de búsqueda.
Los motores de búsqueda crean estas bases de datos realizando rastreos periódicos de Internet. Los primeros motores de búsqueda a menudo requerían que las páginas se les enviaran para rastrearlos, pero ahora la mayoría de las páginas se encuentran siguiendo enlaces de otras páginas. Lo que se llaman robots o arañas, programas de computadora creados para indexar páginas, pasar de una página a otra, grabar todos los datos en la página y seguir cada enlace a nuevas páginas. Diferentes motores de búsqueda refrescan sus índices a intervalos diferentes, dependiendo de cuántas arañas tienen constantemente gatear, y qué tan rápido se arrastran esas arañas, y algunas se abren camino a través de Internet todos los días o dos, y otras solo hacen una actualización periódica cada semana o mes.
A medida que la araña pasa por estas páginas, registra las palabras que encuentra en las páginas. Toma notas sobre cuántas veces aparece cada palabra, si las palabras están ponderadas de ciertas maneras, tal vez basadas enTamaño, ubicación o marcado HTML, y decide cuán relevantes son las palabras basadas en los enlaces que entran en la página y en el contexto general de la página.
Los motores de búsqueda deben ponderar el valor de cada página y el valor de cada página para las palabras que aparecen en ella. Esta es la parte más complicada de lo que tiene que hacer un motor de búsqueda, pero también la más importante. En el nivel más simple, un motor de búsqueda podría simplemente realizar un seguimiento de cada palabra en la página y grabar esa página como relevante para las búsquedas con esa palabra clave. Sin embargo, esto no funcionaría mucho para la mayoría de los usuarios, ya que lo que se desea es la página más relevante para su consulta de búsqueda. Por lo tanto, diferentes motores de búsqueda obtienen diferentes formas de ponderar la importancia.
Los algoritmos que usan varios motores de búsqueda están bien protegidos, para evitar que las personas creen páginas específicamente para obtener mejores rangos, o al menos para limitar el grado en que pueden hacerlo. Esta diferencia es la razón por la cual los diferentes motores de búsqueda producen diferentest Resultados para los mismos términos. Google podría determinar que una página es el mejor resultado para un término de búsqueda, y Ask podría determinar que la misma página ni siquiera se encuentra en el Top 50. Todo esto se basa solo en cómo valoran los enlaces entrantes y salientes, la densidad de las palabras clave que consideran importantes, cómo valoran diferentes ubicaciones de las palabras y cualquier cantidad de factores más pequeños.
La tendencia más reciente en los motores de búsqueda, y probablemente el futuro de la búsqueda en general, es alejarse de las búsquedas basadas en palabras clave a las búsquedas basadas en conceptos. En esta nueva forma de búsqueda, en lugar de limitar una búsqueda a las palabras clave que las entradas del buscador, el motor de búsqueda intenta descubrir qué significan esas palabras clave, para que pueda sugerir páginas que pueden no incluir la palabra exacta, pero no obstante son tópicos para la búsqueda. Esto sigue siendo un campo en desarrollo, pero hasta ahora parece tener mucho potencial para hacer que las búsquedas sean más relevantes, lo que hace que la web sea un lugar aún más fácil para encontrar exactamente lo que está buscando.