Jak fungují vyhledávače?
Vyhledávače jsou v podstatě počítačové algoritmy, které uživatelům pomáhají najít konkrétní informace, které hledají. S doslova biliony stránek s informacemi online, bez efektivních vyhledávačů, by bylo na Internetu možné najít cokoli. Různé vyhledávače pracují různými specifickými způsoby, ale všechny používají stejné základní principy.
První, co vyhledávací nástroje musí udělat, aby fungovaly, je vytvoření lokální databáze, v podstatě internetu. Počáteční vyhledávače pouze indexovaly klíčová slova a názvy stránek, ale současné vyhledávače indexují veškerý text na každé stránce, stejně jako velké množství dalších údajů o vztahu této stránky k jiným stránkám a v některých případech všech nebo částech média dostupná na stránce. Vyhledávače musí indexovat všechny tyto informace, aby na nich mohly efektivně spouštět vyhledávání, místo aby museli spouštět internet vždy, když je odeslán vyhledávací dotaz.
Vyhledávače vytvářejí tyto databáze prováděním pravidelných procházení Internetu. Rané vyhledávače často vyžadovaly, aby jim byly stránky předkládány, aby je bylo možné procházet, ale nyní je většina stránek nalezena pomocí odkazů z jiných stránek. Co se nazývají roboty nebo pavouci, počítačové programy vytvořené pro indexování stránek, flitování ze stránky na stránku, zaznamenávání všech dat na stránce a sledování každého odkazu na nové stránky. Různé vyhledávače aktualizují své indexy v různých intervalech, v závislosti na tom, kolik pavouků neustále procházejí, a jak rychle tito pavouci procházejí, někteří pracují na internetu každý den nebo dva a jiní pouze každý týden pravidelně obnovují nebo Měsíc.
Jak pavouk prochází těmito stránkami, zaznamenává slova, která na stránkách nalezne. Zaznamenává, kolikrát se každé slovo objevuje, zda jsou slova vážena určitým způsobem, například na základě velikosti, umístění nebo značky HTML, a rozhoduje o tom, jak jsou slova relevantní na základě odkazů, které přicházejí na stránku, a v obecném kontextu stránky.
Vyhledávače pak musí zvážit hodnotu každé stránky a hodnotu každé stránky pro slova, která se na ní objevují. To je nejzložitější část toho, co musí vyhledávač udělat, ale také nejdůležitější. Na nejjednodušší úrovni by vyhledávací stroj mohl jednoduše sledovat každé slovo na stránce a zaznamenat tuto stránku jako relevantní pro vyhledávání pomocí tohoto klíčového slova. Pro většinu uživatelů by to však nebylo moc dobré, protože je žádoucí nejdůležitější stránka pro jejich vyhledávací dotaz. Takže různé vyhledávače přicházejí s různými způsoby vážení důležitosti.
Algoritmy, které různé vyhledávače používají, jsou dobře chráněny, aby zabránily lidem v konkrétním vytváření stránek, aby získali lepší hodnosti, nebo alespoň omezili míru, v jaké to mohou udělat. Tento rozdíl je důvod, proč různé vyhledávače přinášejí různé výsledky za stejných podmínek. Google může určit, že jedna stránka je nejlepším výsledkem vyhledávacího dotazu, a Ask může zjistit, že stejná stránka není ani v top 50. To vše je založeno pouze na tom, jak si cení příchozích a odchozích odkazů, hustoty klíčových slov, která používají. najít důležité, jak si cení různého umístění slov a libovolného počtu menších faktorů.
Nejnovějším trendem ve vyhledávačích a pravděpodobně budoucností vyhledávání obecně je přechod od vyhledávání založeného na klíčových slovech na vyhledávání založená na konceptu. V této nové formě vyhledávání se vyhledávací stroj snaží omezit vyhledávání na klíčová slova, která vyhledávač zadává, a snaží se zjistit, co tato klíčová slova znamenají, takže může navrhnout stránky, které nemusí obsahovat přesné slovo, ale přesto jsou aktuální výzkum. Toto je stále rozvíjející se obor, ale zdá se, že prozatím má velký potenciál pro větší relevantnost vyhledávání, díky čemuž je web ještě snadnějším místem k nalezení přesně toho, co hledáte.