เว็บลึกคืออะไร?

เว็บลึกคือส่วนของอินเทอร์เน็ตที่อยู่นอกวิธีการค้นหามาตรฐาน เครื่องมือค้นหามาตรฐานค้นหาหน้าเว็บโดยนำขึ้นหน้าเดียวและคลิกที่ลิงก์ทั้งหมด สิ่งนี้ทำให้พวกเขาสามารถขยายออกไปจากหน้าเดียวเช่นใยแมงมุมยักษ์ค้นหาหน้าต่อจากการเชื่อมโยง กระบวนการนี้รวบรวมเฉพาะส่วนของหน้าที่มีอยู่บนอินเทอร์เน็ต ข้อมูลจำนวนมากไม่ได้ถูกจัดประเภทอย่างสมบูรณ์ด้วยเหตุผลหลายประการ หน้าเหล่านี้จะไม่เกิดขึ้นในเสิร์ชเอ็นจิ้นมาตรฐานดังนั้นผู้ใช้เว็บส่วนใหญ่จึงมองไม่เห็น

เว็บพื้นผิวเป็นส่วนหนึ่งของอินเทอร์เน็ตที่ผู้ใช้ส่วนใหญ่คุ้นเคย ส่วนนี้มีหน้าเว็บมาตรฐานและบริการบนเว็บที่ผู้ใช้ส่วนใหญ่รู้ เว็บลึกประกอบด้วยข้อมูลที่มีเพียงบางส่วนของผู้ใช้อินเทอร์เน็ตเท่านั้นที่ตระหนักถึงหรือมีการเข้าถึงด้วย เว็บลึกเป็นอย่างมากเมื่อเทียบกับเว็บพื้นผิว; ในปี 2000 มันมีขนาดใหญ่กว่าเว็บพื้นผิวเกือบ 50 เท่า

เหตุผลที่เว็บลึกอยู่เป็นส่วนใหญ่เนื่องจากข้อ จำกัด ในเครื่องมือค้นหา เนื่องจากเครื่องมือค้นหาดูลิงค์พวกเขาไม่สามารถเข้าถึงหน้าเว็บบางประเภทได้ หน้าเหล่านี้ไม่เคยเข้าสู่ระบบดังนั้นจึงไม่มีการจัดทำดัชนี เมื่อผู้ใช้ค้นหาหนึ่งในหน้าเหล่านี้เขาหรือเธอจะไม่พบมันเพราะเครื่องมือค้นหาไม่ได้บันทึกการมีอยู่หรือความล้มเหลวในการเข้าถึง

มีประเภทหน้าที่แตกต่างกันจำนวนหนึ่งซึ่งเป็นเรื่องยากหรือเป็นไปไม่ได้ที่เครื่องมือค้นหาจะจัดทำดัชนี หน้าเว็บแบบไดนามิกและฐานข้อมูลเป็นไปไม่ได้ในทางปฏิบัติเนื่องจากต้องมีการป้อนข้อมูลเฉพาะ หน้าเว็บเหล่านี้ถูกสร้างขึ้นในจุดที่มักจะผ่านการป้อนข้อมูลของผู้ใช้ เนื่องจากหน้าเว็บแบบไดนามิกไม่มีอยู่จนกว่าจะมีความจำเป็นเครื่องมือค้นหาจึงข้ามไปเพราะพวกเขาไม่รู้ว่าจะขออะไร

หน้าเว็บส่วนตัวหรือที่มีรั้วรอบขอบชิดเป็นส่วนใหญ่ของเว็บชั้นลึก เนื่องจากหน้าเหล่านี้ต้องการข้อมูลประจำตัวหรือข้อมูลการเข้าสู่ระบบและเครื่องมือค้นหาไม่มีดังนั้นจึงถูกปิดกั้นไม่ให้เข้าถึงข้อมูลในอีกด้านหนึ่งของการเข้าสู่ระบบ แม้จะมีปัญหานี้บางเว็บไซต์ที่ใช้การเข้าสู่ระบบเป็นส่วนหนึ่งของเว็บพื้นผิว เว็บไซต์จัดทำข้อกำหนดพิเศษเพื่อให้เครื่องมือค้นหาหน้าเว็บ นี่เป็นเรื่องปกติในบรรดาเพจที่มีการลงทะเบียนแบบเปิดและต้องการสร้างการรับส่งข้อมูลเพิ่มเติม

ส่วนลึกของเว็บส่วนใหญ่ทำจากเว็บไซต์ที่ไม่ได้เชื่อมโยงหรือถูก จำกัด หน้าเหล่านี้ไม่มีลิงค์ไปยังแหล่งข้อมูลภายนอกหรือบล็อกการเชื่อมโยงที่มีอยู่ การทำเช่นนี้จะป้องกันไม่ให้เสิร์ชเอ็นจิ้นสะดุดกับหน้าเว็บดังนั้นจึงไม่เคยถูกเพิ่มเข้าไปในรายชื่อใด ๆ สิ่งนี้เคยเป็นเรื่องปกติในหน้าเว็บส่วนบุคคล แต่การเปลี่ยนแปลงในการใช้งานเว็บสมัยใหม่ทำให้หน้าส่วนบุคคลส่วนใหญ่เชื่อมโยงและจัดทำดัชนี