Hvad er det dybe web?
Den dybe web er den del af Internettet, der ligger uden for standard søgemetoder. En standard søgemaskine finder websider ved at oprette en enkelt side og klikke på alle linkene. Dette gør det muligt for dem at strække sig ud fra en enkelt side som et kæmpe edderkopweb og finde side efter side gennem link. Denne proces fanger kun en brøkdel af de sider, der findes på Internettet; store mængder data er helt uklassificerede af en af mange grunde. Disse sider kommer aldrig op i en standard søgemaskine og er derfor usynlige for de fleste webbrugere.
Overfladewebet er den del af Internettet, som de fleste brugere er bekendt med. Denne del indeholder de standardwebsider og webservices, som de fleste brugere ved om. Den dybe web består af information, som kun bestemte dele af internetbrugere er opmærksomme på eller også har adgang til. Den dybe bane er enorm i forhold til overfladen. i år 2000 var det næsten 50 gange større end overfladen.
Årsagen til, at det dybe web findes, skyldes hovedsageligt begrænsninger på søgemaskiner. Når søgemaskiner kigger gennem links, er de ikke i stand til at få adgang til bestemte typer websider. Disse sider kommer aldrig ind i systemet og indekseres derfor aldrig. Når en bruger søger på en af disse sider, vil han eller hun aldrig finde den, da søgemaskinen ikke registrerer dens eksistens eller manglende adgang til den.
Der er en række forskellige sidetyper, der er vanskelige eller umulige for en søgemaskine at indeksere. Dynamiske og databasebaserede websider er praktisk talt umulige, da de kræver specifik input for at eksistere. Disse websider består af stedet ofte gennem brugerinput. Da en dynamisk side ikke findes, før den er nødvendig, springer søgemaskiner over dem, fordi de ikke ved, hvad de skal bede om.
Private eller lukkede websider udgør en anden stor del af den dybe web. Da disse sider kræver legitimationsoplysninger eller loginoplysninger, og søgemaskinen ikke har nogen, blokeres det for adgang til oplysninger på den anden side af login. Selv med dette problem er nogle login-baserede websteder en del af overfladeweben. Webstedet opstiller særlige bestemmelser for at give motorer mulighed for at søge på siderne. Dette er almindeligt blandt sider, der har åben registrering og ønsker at generere yderligere trafik.
En anden stor del af det dybe web er lavet af ikke-linkede eller begrænsede websteder. Disse sider har ikke nogen links til eksterne ressourcer eller blokerer aktivt for eksisterende links. Dette forhindrer, at søgemaskinerne nogensinde snubler over siden, så den føjes aldrig til nogen lister. Dette var tidligere almindeligt blandt personlige websider, men ændringer i moderne webbrug har gjort de fleste personlige sider til linket og indekseret.