Hoe werken zoekmachines?

Zoekmachines zijn in principe computeralgoritmen die gebruikers helpen de specifieke informatie te vinden waarnaar ze op zoek zijn. Met letterlijk triljoenen pagina's met informatie online, zonder effectieve zoekmachines, zou het vinden van iets op internet bijna onmogelijk zijn. Verschillende zoekmachines werken op verschillende specifieke manieren, maar ze gebruiken allemaal dezelfde basisprincipes.

Het eerste wat zoekmachines moeten doen om te functioneren is om een ​​lokale database te maken van, in feite, internet. Vroege zoekmachines geïndexeerden zojuist zoekwoorden en titels van pagina's, maar hedendaagse zoekmachines indexeren alle tekst op elke pagina, evenals een groot deel van andere gegevens over de relatie van die pagina met andere pagina's, en in sommige gevallen ook of een deel van de media die beschikbaar zijn op de pagina ook. Zoekmachines moeten al deze informatie indexeren, zodat ze er efficiënt op zoek kunnen gaan naar zoekopdrachten, in plaats van op internet te lopen telkens wanneer een zoekopdracht wordt verzonden.

Zoekmachines maken deze databases door periodieke crawls van internet uit te voeren. Vroege zoekmachines moesten vaak pagina's aan hen worden voorgelegd om ze te kruipen, maar nu worden de meeste pagina's gevonden door links van andere pagina's te volgen. Wat worden robots of spinnen genoemd, computerprogramma's gebouwd om pagina's te indexeren, van pagina naar pagina te flitsen, alle gegevens op de pagina op te nemen en elke link naar nieuwe pagina's te volgen. Verschillende zoekmachines vernieuwen hun indexen met verschillende intervallen, afhankelijk van hoeveel spinnen ze constant hebben gekropen, en hoe snel die spinnen kruipen, met sommigen die elke dag of twee door internet werken, en anderen die alleen elke week of maand een periodieke vernieuwing doen.

Terwijl de spin door deze pagina's gaat, registreert het de woorden die het op de pagina's vindt. Het maakt opmerkingen over hoe vaak elk woord verschijnt, of de woorden op bepaalde manieren worden gewogen, misschien gebaseerd opGrootte, locatie of HTML -opmaak en beslist hoe relevant de woorden zijn gebaseerd op de links die naar de pagina komen en op de algemene context van de pagina.

Zoekmachines moeten dan de waarde van elke pagina wegen en de waarde van elke pagina voor de woorden die erop verschijnen. Dit is het lastigste deel van wat een zoekmachine te doen heeft, maar ook de belangrijkste. Op het meest eenvoudige niveau kan een zoekmachine eenvoudigweg elk woord op de pagina bijhouden en die pagina registreren als relevant voor zoekopdrachten met dat trefwoord. Dit zou echter niet veel goeds doen voor de meeste gebruikers, want wat gewenst is, is de meest relevante pagina voor hun zoekopdracht. Dus verschillende zoekmachines komen met verschillende manieren om belang te wegen.

De algoritmen die verschillende zoekmachines gebruiken, zijn goed beschermd, om te voorkomen dat mensen specifiek pagina's maken om betere rangen te krijgen, of op zijn minst om de mate te beperken waarin ze dat kunnen. Dit verschil is de reden waarom verschillende zoekmachines verschillen opleverent resultaten voor dezelfde voorwaarden. Google kan bepalen dat één pagina het beste resultaat is voor een zoekterm, en vragen kan bepalen dat dezelfde pagina niet eens in de top 50 staat. Dit is allemaal alleen gebaseerd op hoe ze inkomende en uitgaande links waarderen, de dichtheid van de trefwoorden die ze belangrijk vinden, hoe ze een andere plaatsing van woorden waarderen, en een aantal kleinere factoren.

De nieuwste trend in zoekmachines, en waarschijnlijk de toekomst van zoeken in het algemeen, is om af te stappen van zoekopdrachten op zoek naar conceptgebaseerde zoekopdrachten. In deze nieuwe vorm van zoekopdracht, in plaats van een zoekopdracht te beperken tot de zoekwoorden, probeert de input van de zoeker de zoekmachine erachter te komen wat die zoekwoorden betekenen, zodat het pagina's kan suggereren die mogelijk niet het exacte woord bevatten, maar toch actueel zijn voor de zoekopdracht. Dit is nog steeds een ontwikkelend veld, maar lijkt tot nu toe veel potentieel te hebben om zoekopdrachten relevanter te maken, waardoor het web een nog eenvoudigere plek is om precies te vinden wat u zoekt.

ANDERE TALEN