Co to jest Deep Web?
Głęboka sieć to część Internetu, która jest poza standardowymi metodami wyszukiwania. Standardowa wyszukiwarka wyszukuje strony internetowe, wyświetlając jedną stronę i klikając wszystkie linki. To pozwala im rozciągać się z jednej strony, jak gigantyczna sieć pająka, znajdując stronę za stroną poprzez linkowanie. Ten proces przechwytuje tylko ułamek stron istniejących w Internecie; ogromne ilości danych są całkowicie niesklasyfikowane z jednego z wielu powodów. Strony te nigdy nie pojawią się w standardowej wyszukiwarce i dlatego są niewidoczne dla większości użytkowników sieci.
Sieć powierzchniowa to część Internetu, którą zna większość użytkowników. Ta część zawiera standardowe strony internetowe i usługi sieciowe, o których wie większość użytkowników. Głęboka sieć składa się z informacji, które tylko określone części użytkowników Internetu są świadome lub mają do nich dostęp. Głęboka sieć jest ogromna w porównaniu do sieci powierzchniowej; w 2000 roku był prawie 50 razy większy niż wstęga powierzchniowa.
Powodem istnienia głębokiej sieci jest głównie ograniczenie wyszukiwarek. Wyszukiwarki przeglądające linki nie mogą uzyskać dostępu do niektórych rodzajów stron internetowych. Strony te nigdy nie wchodzą do systemu i dlatego nigdy nie są indeksowane. Gdy użytkownik szuka jednej z tych stron, nigdy jej nie znajdzie, ponieważ wyszukiwarka nie rejestruje jej istnienia lub braku dostępu do niej.
Istnieje wiele różnych typów stron, które są trudne lub niemożliwe do zaindeksowania przez wyszukiwarkę. Dynamiczne i oparte na bazach danych strony internetowe są praktycznie niemożliwe, ponieważ wymagają konkretnych danych wejściowych. Te strony internetowe są tworzone na miejscu, często poprzez wkład użytkownika. Ponieważ strona dynamiczna nie istnieje, dopóki nie jest potrzebna, wyszukiwarki ją pomijają, ponieważ nie wiedzą, o co prosić.
Prywatne lub bramkowe strony internetowe stanowią kolejną dużą część głębokiej sieci. Ponieważ strony te wymagają poświadczeń lub danych logowania, a wyszukiwarka ich nie ma, dostęp do informacji po drugiej stronie logowania jest zablokowany. Mimo tego problemu niektóre witryny oparte na logowaniu są częścią sieci powierzchniowej. Witryna zawiera specjalne przepisy umożliwiające wyszukiwarkom przeszukiwanie jej stron. Jest to powszechne wśród stron, które mają otwartą rejestrację i chcą wygenerować dodatkowy ruch.
Kolejna duża część głębokiej sieci składa się z niepowiązanych lub ograniczonych stron internetowych. Strony te nie posiadają żadnych linków do zasobów zewnętrznych ani nie aktywnie blokują istniejących linków. Zapobiega to wpadaniu przez wyszukiwarki na stronę, więc nigdy nie jest dodawana do żadnych ofert. Kiedyś było to powszechne na osobistych stronach internetowych, ale zmiany we współczesnym korzystaniu z Internetu spowodowały, że większość osobistych stron została połączona i zindeksowana.