Come funzionano i motori di ricerca?
I motori di ricerca sono fondamentalmente algoritmi di computer che aiutano gli utenti a trovare le informazioni specifiche che stanno cercando. Con letteralmente trilioni di pagine di informazioni online, senza motori di ricerca efficaci, trovare qualcosa su Internet sarebbe quasi impossibile. Diversi motori di ricerca funzionano in diversi modi specifici, ma tutti utilizzano gli stessi principi di base.
La prima cosa che i motori di ricerca devono fare per funzionare è creare un database locale di, sostanzialmente, di Internet. I primi motori di ricerca hanno appena indicizzato parole chiave e titoli delle pagine, ma i motori di ricerca contemporanei indicizzano tutto il testo su ogni pagina, nonché una grande quantità di altri dati sulla relazione di quella pagina con altre pagine e in alcuni casi tutto o una parte dei media disponibili anche sulla pagina. I motori di ricerca devono indicizzare tutte queste informazioni in modo che possano eseguire ricerche su di esse in modo efficiente, piuttosto che dover correre su Internet ogni volta che viene inviata una query di ricerca.
I motori di ricerca creano questi database eseguendo gattini periodici di Internet. I primi motori di ricerca richiedevano spesso che le pagine fossero presentate a loro per strisciare, ma ora la maggior parte delle pagine si trovano seguendo i collegamenti di altre pagine. Quelli che sono chiamati robot o ragni, programmi per computer costruiti per indicizzare le pagine, flit da pagina a pagina, registrando tutti i dati sulla pagina e seguendo ogni collegamento a nuove pagine. Diversi motori di ricerca aggiornano i loro indici a intervalli diversi, a seconda del numero di ragni costantemente striscianti e della velocità con cui quei ragni strisciano, con alcuni che si fanno strada su Internet ogni giorno o due, e altri fanno solo un aggiornamento periodico ogni settimana o mese.
Mentre il ragno attraversa queste pagine, registra le parole che trova sulle pagine. Fa appunti su quante volte appare ogni parola, se le parole sono ponderate in certi modi, forse in base aDimensioni, posizione o markup HTML e decide quanto sono rilevanti le parole basate sui collegamenti che arrivano alla pagina e sul contesto generale della pagina.
I motori di ricerca devono quindi pesare il valore di ciascuna pagina e il valore di ciascuna pagina per le parole che compaiono su di essa. Questa è la parte più difficile di ciò che un motore di ricerca deve fare, ma anche il più importante. A livello più semplice un motore di ricerca potrebbe semplicemente tenere traccia di ogni parola sulla pagina e registrare quella pagina come rilevante per le ricerche con quella parola chiave. Ciò non farebbe molto bene per la maggior parte degli utenti, tuttavia, poiché ciò che è desiderato è la pagina più pertinente per la loro query di ricerca. Così diversi motori di ricerca escogitano diversi modi di ponderazione dell'importanza.
Gli algoritmi utilizzati da vari motori di ricerca sono ben protetti, per impedire alle persone di creare specificamente pagine per ottenere gradi migliori, o almeno per limitare il grado in cui possono farlo. Questa differenza è il motivo per cui diversi motori di ricerca sono differitiT risultati per gli stessi termini. Google potrebbe determinare che una pagina è il risultato migliore per un termine di ricerca, e chiedi potrebbe determinare che la stessa pagina non è nemmeno nella top 50. Questo è tutto solo in base a come apprezzano i collegamenti in entrata e in uscita, la densità delle parole chiave che trovano importante, come apprezzano il posizionamento diverso delle parole e qualsiasi numero di fattori più piccoli.
La più recente tendenza nei motori di ricerca, e probabilmente il futuro della ricerca in generale, è quella di allontanarsi dalle ricerche basate su parole chiave alle ricerche basate su concetti. In questa nuova forma di ricerca, anziché limitare una ricerca alle parole chiave gli input del ricercatore, il motore di ricerca cerca di capire cosa significano quelle parole chiave, in modo che possa suggerire pagine che potrebbero non includere la parola esatta, ma tuttavia sono attuali alla ricerca. Questo è ancora un campo in via di sviluppo, ma finora sembra avere molto potenziale nel rendere le ricerche più rilevanti, rendendo il web ancora più semplice per trovare esattamente quello che stai cercando.