¿Cuál es la web profunda?
La web profunda es la parte de Internet que está fuera de los métodos de búsqueda estándar. Un motor de búsqueda estándar encuentra páginas web al mencionar una sola página y hacer clic en todos los enlaces. Esto les permite extenderse desde una sola página como una red de araña gigante, encontrando la página tras página a través del enlace. Este proceso solo captura una fracción de las páginas que existen en Internet; Enormes cantidades de datos no se clasifican por una de las muchas razones. Estas páginas nunca aparecerán en un motor de búsqueda estándar y, por lo tanto, son invisibles para la mayoría de los usuarios web.
La Surface Web es la parte de Internet con la que la mayoría de los usuarios están familiarizados. Esta parte contiene las páginas web estándar y los servicios web que la mayoría de los usuarios conocen. La web profunda se compone de información que solo las porciones específicas de los usuarios de Internet también conocen o tienen acceso. La red profunda es enorme en comparación con la red de superficie; En el año 2000, fue casi 50 veces más grande que la Web Surface.
La razónLa web profunda existe se debe principalmente a limitaciones en los motores de búsqueda. A medida que los motores de búsqueda miran a través de los enlaces, no pueden acceder a ciertos tipos de páginas web. Estas páginas nunca ingresan al sistema y, por lo tanto, nunca están indexadas. Cuando un usuario busca una de estas páginas, él o ella nunca lo encontrará, ya que el motor de búsqueda no registra su existencia o su falla en el acceso a ella.
Hay varios tipos de página diferentes que son difíciles o imposibles de indexar para un motor de búsqueda. Las páginas web dinámicas y basadas en la base de datos son prácticamente imposibles, ya que requieren una entrada específica para existir. Estas páginas web están formadas en el acto, a menudo a través de la entrada del usuario. Dado que una página dinámica no existe hasta que sea necesaria, los motores de búsqueda los omiten porque no saben qué pedir.
Las páginas web privadas o cerradas constituyen otra gran parte de la red profunda. Dado que estas páginas requieren credenciales oLa información de inicio de sesión y el motor de búsqueda tampoco, se bloquea para acceder a la información en el otro lado del inicio de sesión. Incluso con este problema, algunos sitios basados en inicio de sesión son parte de la Surface Web. El sitio web establece disposiciones especiales para permitir que los motores busquen en sus páginas. Esto es común entre las páginas que tienen registro abierto y desean generar tráfico adicional.
Otra gran parte de la red profunda está hecha de sitios web no vinculados o restringidos. Estas páginas no poseen ningún enlace a recursos externos o bloquean activamente los enlaces existentes. Esto evita que los motores de búsqueda se topen con la página, por lo que nunca se agrega a ningún listado. Esto solía ser común entre las páginas web personales, pero los cambios en el uso moderno de la web han hecho que la mayoría de las páginas personales se vinculen e indexan.
.