Jak działają wyszukiwarki?
Wyszukiwarki to w zasadzie algorytmy komputerowe, które pomagają użytkownikom znaleźć określone informacje, których szukają. Przy dosłownie bilionach stron informacji w Internecie, bez skutecznych wyszukiwarek, znalezienie czegokolwiek w Internecie byłoby prawie niemożliwe. Różne wyszukiwarki działają na różne konkretne sposoby, ale wszystkie wykorzystują te same podstawowe zasady.
Pierwszą rzeczą, jaką muszą zrobić wyszukiwarki, aby funkcjonować, jest utworzenie lokalnej bazy danych, w zasadzie Internetu. Wczesne wyszukiwarki indeksowały tylko słowa kluczowe i tytuły stron, ale współczesne wyszukiwarki indeksują cały tekst na każdej stronie, a także wiele innych danych na temat relacji tej strony do innych stron, aw niektórych przypadkach całości lub części media dostępne również na stronie. Wyszukiwarki muszą zindeksować wszystkie te informacje, aby mogły wydajnie wyszukiwać je, zamiast konieczności wyszukiwania w Internecie za każdym razem, gdy zapytanie jest wysyłane.
Wyszukiwarki tworzą te bazy danych poprzez okresowe przeszukiwanie Internetu. Wczesne wyszukiwarki często wymagały przesyłania stron w celu ich zaindeksowania, ale teraz większość stron można znaleźć, podążając za linkami z innych stron. Roboty lub pająki to programy komputerowe tworzone do indeksowania stron, przechodzenia między stronami, rejestrowania wszystkich danych na stronie i podążania za każdym linkiem do nowych stron. Różne wyszukiwarki odświeżają swoje indeksy w różnych odstępach czasu, w zależności od liczby pająków, które stale indeksują, oraz szybkości indeksowania tych pająków, niektóre z nich poruszają się przez Internet codziennie lub dwa, a inne tylko okresowo odświeżają co tydzień lub miesiąc.
Gdy pająk przechodzi przez te strony, zapisuje słowa znalezione na stronach. Robi notatki o tym, ile razy każde słowo się pojawia, czy słowa są ważone w określony sposób, być może na podstawie rozmiaru, lokalizacji lub znaczników HTML, i decyduje o tym, jak trafne są słowa na podstawie linków wchodzących na stronę, oraz w ogólnym kontekście strony.
Wyszukiwarki muszą następnie wyważyć wartość każdej strony oraz wartość każdej strony dla słów, które się na niej wyświetlają. Jest to najtrudniejsza część tego, co musi zrobić wyszukiwarka, ale także najważniejsza. Na najprostszym poziomie wyszukiwarka może po prostu śledzić każde słowo na stronie i rejestrować tę stronę jako odpowiednią dla wyszukiwań z tym słowem kluczowym. Nie przyniosłoby to wiele dobrego większości użytkowników, ponieważ pożądana jest najbardziej odpowiednia strona dla wyszukiwanego hasła. Różne wyszukiwarki mają różne sposoby ważenia.
Algorytmy używane przez różne wyszukiwarki są dobrze chronione, aby uniemożliwić ludziom tworzenie stron w celu uzyskania lepszych pozycji lub przynajmniej ograniczyć stopień, w jakim mogą to zrobić. Różnica polega na tym, że różne wyszukiwarki dają różne wyniki dla tych samych terminów. Google może ustalić, że jedna strona jest najlepszym wynikiem dla wyszukiwanego hasła, a Ask może stwierdzić, że tej samej strony nie ma nawet w pierwszej 50. Wszystko to zależy tylko od tego, jak cenią linki przychodzące i wychodzące, a także gęstość słów kluczowych znaleźć ważne, jak cenią różne umiejscowienie słów i dowolną liczbę mniejszych czynników.
Najnowszym trendem w wyszukiwarkach i prawdopodobnie przyszłością wyszukiwania jest przejście od wyszukiwań opartych na słowach kluczowych do wyszukiwań opartych na koncepcji. W tej nowej formie wyszukiwania, zamiast ograniczać wyszukiwanie do słów kluczowych wprowadzanych przez wyszukiwarkę, wyszukiwarka próbuje dowiedzieć się, co oznaczają te słowa kluczowe, aby sugerować strony, które mogą nie zawierać dokładnego słowa, ale mimo to są aktualne poszukiwanie. Jest to wciąż dziedzina rozwijająca się, ale jak dotąd wydaje się, że ma duży potencjał w zakresie trafniejszych wyszukiwań, dzięki czemu Internet jest jeszcze łatwiejszym miejscem do znalezienia dokładnie tego, czego szukasz.