딥 웹이란 무엇입니까?
딥 웹은 표준 검색 방법을 벗어난 인터넷 부분입니다. 표준 검색 엔진은 단일 페이지를 불러오고 모든 링크를 클릭하여 웹 페이지를 찾습니다. 이를 통해 거대한 스파이더 웹과 같은 단일 페이지에서 확장되어 링크를 통해 페이지별로 페이지를 찾을 수 있습니다. 이 프로세스는 인터넷에 존재하는 일부 페이지 만 캡처합니다. 방대한 양의 데이터는 여러 가지 이유 중 하나로 완전히 분류되지 않습니다. 이 페이지는 표준 검색 엔진에 나타나지 않으므로 대부분의 웹 사용자에게는 보이지 않습니다.
Surface 웹은 대부분의 사용자에게 친숙한 인터넷의 일부입니다. 이 부분에는 대부분의 사용자가 알고있는 표준 웹 페이지 및 웹 서비스가 포함되어 있습니다. 딥 웹은 인터넷 사용자의 특정 부분 만 알고 있거나 액세스 할 수있는 정보로 구성됩니다. 딥 웹은 표면 웹과 비교하여 엄청나 다; 2000 년에는 표면 웹보다 거의 50 배 더 컸습니다.
딥 웹이 존재하는 이유는 주로 검색 엔진의 제한 때문입니다. 검색 엔진은 링크를 살펴보면서 특정 유형의 웹 페이지에 액세스 할 수 없습니다. 이 페이지는 시스템에 들어 가지 않으므로 색인이 생성되지 않습니다. 사용자가 이러한 페이지 중 하나를 검색하면 검색 엔진이 존재하지 않거나 페이지 액세스에 실패한 것으로 기록되지 않으므로 해당 페이지를 찾지 못할 것입니다.
검색 엔진에서 색인을 생성하기 어렵거나 불가능한 여러 페이지 유형이 있습니다. 동적 및 데이터베이스 기반 웹 페이지는 특정 입력이 필요하기 때문에 실제로 불가능합니다. 이러한 웹 페이지는 종종 사용자 입력을 통해 즉시 구성됩니다. 동적 페이지는 필요할 때까지 존재하지 않기 때문에 검색 엔진은 무엇을 요청해야할지 모르기 때문에이를 건너 뜁니다.
개인 또는 게이트 웹 페이지는 딥 웹의 또 다른 부분을 구성합니다. 이 페이지에는 자격 증명이나 로그인 정보가 필요하고 검색 엔진에는 정보가 없으므로 로그인 반대쪽의 정보에 액세스 할 수 없습니다. 이 문제가 발생하더라도 일부 로그인 기반 사이트는 Surface 웹의 일부입니다. 웹 사이트는 엔진이 페이지를 검색 할 수 있도록 특별 조항을 설정합니다. 이것은 공개 등록이 있고 추가 트래픽을 생성하려는 페이지에서 일반적입니다.
딥 웹의 또 다른 부분은 연결되지 않거나 제한된 웹 사이트로 구성됩니다. 이 페이지에는 외부 리소스에 대한 링크가 없거나 기존 링크를 적극적으로 차단합니다. 이렇게하면 검색 엔진이 페이지를 넘어 뜨리는 것을 방지 할 수 있으므로 목록에 추가되지 않습니다. 이것은 개인 웹 페이지에서 공통적이지만 현대 웹 사용의 변화로 인해 대부분의 개인 페이지가 연결되고 색인이 생성되었습니다.