Cos'è il Deep Web?
Il deep web è la parte di Internet che è al di fuori dei metodi di ricerca standard. Un motore di ricerca standard trova pagine Web aprendo una singola pagina e facendo clic su tutti i collegamenti. Ciò consente loro di estendersi da una singola pagina come una ragnatela gigante, trovando pagina dopo pagina attraverso il collegamento. Questo processo acquisisce solo una parte delle pagine esistenti su Internet; enormi quantità di dati sono completamente non classificati per una delle molte ragioni. Queste pagine non verranno mai visualizzate in un motore di ricerca standard e sono quindi invisibili per la maggior parte degli utenti Web.
Il web di superficie è la parte di Internet con cui la maggior parte degli utenti ha familiarità. Questa parte contiene le pagine Web standard e i servizi Web di cui la maggior parte degli utenti è a conoscenza. Il deep web comprende informazioni di cui solo parti specifiche degli utenti di Internet sono a conoscenza o hanno accesso. Il deep web è enorme rispetto al web di superficie; nel 2000 era quasi 50 volte più grande del nastro di superficie.
Il motivo per cui esiste il deep web è principalmente dovuto alle limitazioni dei motori di ricerca. Poiché i motori di ricerca guardano attraverso i collegamenti, non sono in grado di accedere a determinati tipi di pagine Web. Queste pagine non entrano mai nel sistema e, pertanto, non vengono mai indicizzate. Quando un utente cerca una di queste pagine, non la troverà mai, in quanto il motore di ricerca non registra la sua esistenza o il suo mancato accesso.
Esistono diversi tipi di pagina difficili o impossibili da indicizzare per un motore di ricerca. Le pagine Web dinamiche e basate su database sono praticamente impossibili, poiché richiedono l'esistenza di input specifici. Queste pagine Web sono costituite sul posto, spesso attraverso l'input dell'utente. Poiché una pagina dinamica non esiste fino a quando non è necessaria, i motori di ricerca le saltano perché non sanno cosa chiedere.
Le pagine web private o con gated costituiscono un'altra grande porzione del deep web. Dato che queste pagine richiedono credenziali o informazioni di accesso e che il motore di ricerca non ha, non è possibile accedere alle informazioni sull'altro lato dell'accesso. Anche con questo problema, alcuni siti basati sull'accesso fanno parte del Web di superficie. Il sito web stabilisce disposizioni speciali per consentire ai motori di effettuare ricerche nelle proprie pagine. Questo è comune tra le pagine che hanno una registrazione aperta e vogliono generare traffico aggiuntivo.
Un'altra grande porzione del deep web è costituita da siti Web non collegati o soggetti a restrizioni. Queste pagine non possiedono alcun link a risorse esterne o bloccano attivamente link esistenti. Questo impedisce ai motori di ricerca di inciampare sulla pagina, quindi non viene mai aggiunto a nessun elenco. Questo era comune tra le pagine web personali, ma i cambiamenti nell'uso del web moderno hanno reso la maggior parte delle pagine personali collegate e indicizzate.