บางครั้งเรียกว่าการดึงข้อมูลการดึงข้อมูล (IE) เป็นกระบวนการที่ใช้กับระบบคอมพิวเตอร์เพื่อให้สามารถดึงข้อมูลที่เกี่ยวข้องจากแหล่งข้อมูลขนาดใหญ่โดยใช้เกณฑ์ที่กำหนดไว้ล่วงหน้าบางชุด แนวคิดเบื้องหลังการดึงข้อมูลคือการทำให้สามารถระบุและดูดซึมข้อมูลที่เกี่ยวข้องกับกิจกรรมเฉพาะได้อย่างง่ายดายโดยไม่จำเป็นต้องผ่านข้อมูลจำนวนมากด้วยตนเองเพื่อค้นหาข้อมูลที่ต้องการ กระบวนการนี้คล้ายกับแนวคิดของการขุดแนวคิดหรือการขูดเว็บซึ่งวิธีการทั้งหมดนี้พยายามรวบรวมข้อมูลที่เป็นประโยชน์จากแหล่งข้อมูลที่มีอยู่ในวงกว้าง
วิธีการทั่วไปในการดึงข้อมูลเรียกใช้โปรแกรมที่สามารถสแกนแหล่งข้อมูลที่พิจารณาว่าสามารถอ่านได้ด้วยเครื่อง ซึ่งอาจรวมถึงเอกสารสำเนาที่ถูกสแกนลงในไฟล์อิเล็กทรอนิกส์บางประเภทเอกสารที่เตรียมไว้เป็นสเปรดชีตหรือเอกสารประมวลผลคำหรือแม้แต่ข้อมูลที่อยู่ในเขตข้อมูลที่อ่านได้ในฐานข้อมูล โดยทั่วไปแล้วพารามิเตอร์จะถูกตั้งค่าซึ่งทำให้โปรแกรมซอฟต์แวร์สามารถเข้าถึงแหล่งข้อมูลเหล่านี้ได้และสามารถสแกนได้อย่างรวดเร็วโดยใช้เกณฑ์เฉพาะเพื่อจัดลำดับความสำคัญและดึงข้อมูลบางประเภทจากพูลที่มีอยู่ โดยทั่วไปแล้วกระบวนการนี้จะแตกต่างจากกระบวนการค้นหาอย่างง่ายโดยที่วิธีการนั้นไม่ต้องการจับคู่คำหรือวลีที่เฉพาะเจาะจง แต่ใช้กระบวนการที่เรียกว่าการประมวลผลภาษาธรรมชาติซึ่งแทนที่จะช่วยในการประเมินคำที่แท้จริง แต่ยังรวมถึงบริบทและ ความหมายโดยนัยโดยบริบทนั้น
ความซับซ้อนที่เกี่ยวข้องกับการดึงข้อมูลทำให้การใช้วิธีนี้ค่อนข้างยากในการจัดการในระดับโลกแม้ว่าจะมีเครื่องมือ IE ที่ทำงานได้ดีกับข้อมูลจำนวน จำกัด เท่านั้นเช่นแหล่งข้อมูลที่เกี่ยวข้องกับไฟล์อิเล็กทรอนิกส์ที่อยู่ใน เซิร์ฟเวอร์ของ บริษัท หรือแม้แต่แหล่งรวมที่เกี่ยวข้องกับฟีดข่าวจำนวน จำกัด ด้วยวิธีนี้มันเป็นไปได้ที่จะระบุประเภทของเหตุการณ์บางอย่างอาจเป็นไปได้ที่จะ จำกัด การกลับมาของการรวมจำนวนผู้เข้าร่วมในเหตุการณ์และมีการจัดเรียงข้อมูลตามวันที่
เช่นเดียวกับเทคโนโลยีหลายรูปแบบเครื่องมือที่ใช้ในการดึงข้อมูลกำลังได้รับการปรับปรุงอย่างต่อเนื่อง ตั้งแต่จุดเริ่มต้นของศตวรรษที่ 21 ความสามารถในการตั้งค่าพารามิเตอร์และใช้ประโยชน์จากแหล่งข้อมูลอิเล็กทรอนิกส์ที่เพิ่มมากขึ้นซึ่งเป็นส่วนหนึ่งของการค้นหาข้อมูลที่เกี่ยวข้องได้เพิ่มขึ้นอย่างมีนัยสำคัญ ซึ่งรวมถึงความสามารถในการจัดการกับข้อมูลจำนวนมากที่ไม่มีโครงสร้างและใช้พารามิเตอร์เหล่านั้นเพื่อนำคำสั่งหรือโครงสร้างบางอย่างมาให้กับข้อมูลทำให้มีประโยชน์มากขึ้นสำหรับการค้นหาในอนาคต


