การขุดดาต้าสตรีมคืออะไร?

การขุดดาต้าสตรีมเป็นกลยุทธ์ที่เกี่ยวข้องกับการระบุและแยกข้อมูลจากสตรีมข้อมูลที่ใช้งานอยู่ ด้วยวิธีการนี้ความคิดคือการดึงข้อมูลโดยไม่สร้างการหยุดชะงักใด ๆ ในสตรีมเองทำให้ผู้อื่นสามารถใช้ข้อมูลได้แม้ในขณะที่การสกัดเกิดขึ้น การขุดสตรีมข้อมูลประเภทนี้สามารถเกี่ยวข้องกับข้อมูลทุกประเภทตั้งแต่การส่งข้อมูลเสียงไปยังวิดีโอผ่านอินเทอร์เน็ตและงานประจำวันเช่นการถอนเงินจากบัญชีธนาคารโดยใช้เครื่องถอนเงินอัตโนมัติหรือการสนทนาทางโทรศัพท์

หนึ่งในลักษณะของ data mining mining คือความสามารถในการคาดการณ์อย่างแม่นยำหรือทำนายวิธีการค้นหาข้อมูลที่ต้องการและเครื่องมือการค้นพบความรู้ประเภทใดที่จะช่วยในการค้นหาและแยกข้อมูลที่ต้องการได้สำเร็จ ตัวอย่างเช่นเมื่อลูกค้าเริ่มต้นการทำธุรกรรมโดยใช้เครื่องถอนเงินอัตโนมัติการเขียนโปรแกรมสำหรับเครื่องจะเริ่มต้นค้นหาข้อมูลบัญชีที่เกี่ยวข้องค้นหาข้อมูลแล้วกำหนดว่าจำนวนธุรกรรมจะลดยอดคงเหลือในบัญชีต่ำกว่าจำนวนที่อนุญาตหรือไม่ ขึ้นอยู่กับวิธีการจัดโครงสร้างบัญชี จากนั้นโปรแกรมสามารถส่งคืนข้อมูลที่เกี่ยวข้องไปยังผู้ใช้เช่นการบันทึกความสำเร็จของการทำธุรกรรมที่ร้องขอและให้ยอดเงินคงเหลือในบัญชีหลังจากเครดิตหรือเดบิตที่เกี่ยวข้องกับการทำธุรกรรมถูกบันทึกไว้

อีกตัวอย่างทั่วไปของ data mining mining คือการค้นเว็บขั้นพื้นฐานโดยใช้เบราว์เซอร์ ด้วยแอปพลิเคชั่นนี้ผู้ใช้ปลายทางป้อนค่าการค้นหาลงในฟิลด์และซอฟต์แวร์ที่ผลักดันให้เบราว์เซอร์พยายามตีความค่าเหล่านั้นและส่งคืนข้อมูลที่มีความเกี่ยวข้องกับเกณฑ์การค้นหา ทั้งนี้ขึ้นอยู่กับการกำหนดค่าเบราว์เซอร์ซึ่งอาจรวมถึงคุณลักษณะที่คาดการณ์ถึงเจตนาของการค้นหาที่กำลังดำเนินการและเสนอคำหรือวลีเพิ่มเติมที่อาจช่วยในการปรับแต่งการค้นหามากขึ้นตามความชอบของผู้ใช้ เมื่อผู้ใช้ตัดสินด้วยวลีค้นหาเบราว์เซอร์จะส่งคืนผลลัพธ์ตามลำดับโดยใช้อัลกอริทึมที่เกี่ยวข้องกับการกำหนดค่าของเบราว์เซอร์เอง

หนึ่งในประโยชน์หลักของการขุดกระแสข้อมูลคือความสามารถในการเข้าถึงและค้นหาข้อมูลโดยไม่ห้ามผู้อื่นให้ใช้ประโยชน์จากข้อมูลเดียวกันนั้น เนื่องจากสตรีมข้อมูลอัปเดตอยู่ตลอดเวลาผลของการแตกไฟล์อาจเปลี่ยนแปลงเป็นครั้งคราว ตัวอย่างเช่นการค้นหาเว็บโดยใช้วลีค้นหาที่เฉพาะเจาะจงอาจให้ผลลัพธ์หนึ่งชุดในวันนี้ แต่ให้ชุดผลลัพธ์ที่แตกต่างกันเล็กน้อยในวันพรุ่งนี้โดยอิงจากข้อมูลใหม่ที่ป้อนในสตรีมข้อมูลและวิธีที่เครื่องมือค้นหาจัดอันดับข้อมูลนั้น