Come funzionano i motori di ricerca?
I motori di ricerca sono fondamentalmente algoritmi informatici che aiutano gli utenti a trovare le informazioni specifiche che stanno cercando. Con letteralmente trilioni di pagine di informazioni online, senza efficaci motori di ricerca, trovare qualcosa su Internet sarebbe quasi impossibile. Motori di ricerca diversi funzionano in modi specifici diversi, ma utilizzano tutti gli stessi principi di base.
La prima cosa che i motori di ricerca devono fare per funzionare è creare un database locale, fondamentalmente, di Internet. I primi motori di ricerca indicizzavano solo parole chiave e titoli di pagine, ma i motori di ricerca contemporanei indicizzano tutto il testo su ogni pagina, nonché una grande quantità di altri dati sulla relazione di quella pagina con altre pagine, e in alcuni casi tutto o una parte di i media disponibili anche sulla pagina. I motori di ricerca devono indicizzare tutte queste informazioni in modo da poter eseguire ricerche su di esse in modo efficiente, piuttosto che dover correre su Internet ogni volta che viene inviata una query di ricerca.
I motori di ricerca creano questi database eseguendo ricerche periodiche su Internet. I primi motori di ricerca spesso richiedevano l'invio di pagine per poterle sottoporre a scansione, ma ora la maggior parte delle pagine si trova seguendo i collegamenti di altre pagine. Quelli che vengono chiamati robot o spider, programmi per computer creati per indicizzare le pagine, passare da una pagina all'altra, registrare tutti i dati sulla pagina e seguire ogni collegamento a nuove pagine. Diversi motori di ricerca aggiornano i loro indici a intervalli diversi, a seconda di quanti ragni hanno costantemente a gattonare e della velocità con cui questi ragni strisciano, con alcuni che si fanno strada attraverso Internet ogni giorno o due, e altri fanno solo un aggiornamento periodico ogni settimana o mese.
Mentre il ragno passa attraverso queste pagine, registra le parole che trova sulle pagine. Rende note quante volte appare ogni parola, se le parole sono ponderate in determinati modi, forse in base alla dimensione, alla posizione o al markup HTML, e decide quanto siano pertinenti le parole in base ai collegamenti che arrivano alla pagina, e sul contesto generale della pagina.
I motori di ricerca devono quindi ponderare il valore di ciascuna pagina e il valore di ciascuna pagina per le parole che compaiono su di essa. Questa è la parte più difficile di ciò che deve fare un motore di ricerca, ma anche la più importante. Al livello più semplice un motore di ricerca potrebbe semplicemente tenere traccia di ogni parola della pagina e registrare quella pagina come rilevante per le ricerche con quella parola chiave. Ciò non farebbe molto bene alla maggior parte degli utenti, tuttavia, poiché ciò che si desidera è la pagina più pertinente per la propria query di ricerca. Quindi diversi motori di ricerca escogitano modi diversi di ponderare l'importanza.
Gli algoritmi utilizzati da vari motori di ricerca sono ben protetti, per impedire alle persone di creare pagine in modo specifico per ottenere ranghi migliori o almeno per limitare il grado in cui possono farlo. Questa differenza è il motivo per cui diversi motori di ricerca producono risultati diversi per gli stessi termini. Google potrebbe determinare che una pagina è il miglior risultato per un termine di ricerca e Ask potrebbe determinare che la stessa pagina non è nemmeno tra le prime 50. Tutto ciò si basa solo sul modo in cui valutano i link in entrata e in uscita, la densità delle parole chiave che trova importante il modo in cui valutano il diverso posizionamento delle parole e qualsiasi numero di fattori minori.
La tendenza più recente nei motori di ricerca, e probabilmente il futuro della ricerca in generale, è quella di passare dalle ricerche basate su parole chiave alle ricerche basate su concetti. In questa nuova forma di ricerca, piuttosto che limitare una ricerca alle parole chiave immesse dal ricercatore, il motore di ricerca cerca di capire cosa significano quelle parole chiave, in modo che possa suggerire pagine che potrebbero non includere la parola esatta, ma che comunque sono attuali la ricerca. Questo è ancora un campo in via di sviluppo, ma finora sembra avere un grande potenziale nel rendere le ricerche più pertinenti, rendendo il Web un posto ancora più semplice per trovare esattamente quello che stai cercando.