การขุดคลังข้อมูลเป็นการวิเคราะห์ข้อมูลที่มีอยู่ในฐานข้อมูลหนึ่งฐานข้อมูลหรือมากกว่านั้นเพื่อให้ข้อมูลมีประโยชน์ ฐานข้อมูลเหล่านี้หรือคลังข้อมูลเป็นศูนย์กลางการรับฝากข้อมูล บริษัท ต่างๆจะรวบรวมข้อมูลที่พวกเขาเก็บรวบรวมจากลูกค้าในคลังข้อมูล เมื่อมีการรวบรวมข้อมูลแล้วมันจะถูก "ขุด" และข้อมูลที่เป็นประโยชน์จะถูกดึงออกมาเพื่อสร้างข้อมูลที่สามารถช่วย บริษัท ในการตัดสินใจทางธุรกิจที่จะเพิ่มผลกำไรหรือลดต้นทุน ผู้ค้าปลีกมักใช้การขุดคลังข้อมูลเพื่อวิเคราะห์และทำนายพฤติกรรมของลูกค้า
ตัวอย่างเช่นเมื่อนักช้อปไปที่ซุปเปอร์มาร์เก็ตและมอบแคชเชียร์การ์ดนักช้อปของเธอบ่อยครั้งข้อมูลเกี่ยวกับการซื้อของเธอจะถูกรวบรวมและเก็บไว้ในคลังข้อมูลของ บริษัท ห่วงโซ่ซุปเปอร์มาร์เก็ตจะมีข้อมูลหลายล้านชิ้นเกี่ยวกับสิ่งที่ผู้คนซื้อเมื่อใดในปริมาณใดและราคาเท่าไหร่ ร้านค้าอาจรู้ว่า 50,000 ถั่วแช่แข็งขายได้เมื่อปีที่แล้ว แต่ข้อมูลเพียงอย่างเดียวไม่เป็นประโยชน์อย่างยิ่ง หากการขุดคลังข้อมูลเปิดเผยว่า 75% ของถั่วแช่แข็งเหล่านั้นถูกขายในช่วงหลายเดือนที่ไม่มีถั่วสดหรือ 10% ของถั่วถูกขายในสองสัปดาห์ที่นำไปสู่วันขอบคุณพระเจ้า บริษัท อาจจะสามารถ เพื่อใช้ข้อมูลนั้นเพื่อเพิ่มยอดขายประจำปีของถั่วแช่แข็ง
บริษัท สามารถใช้เทคนิคการขุดคลังข้อมูลเพื่อคาดการณ์ยอดขายในอนาคต การทำเหมืองข้อมูลยังสามารถช่วยให้พวกเขาประเมินผลกระทบของการตัดสินใจปล่อยและการกำหนดราคา ที่ซูเปอร์มาร์เก็ตการทำเหมืองข้อมูลอาจทำให้ร้านค้าไม่สามารถใช้ถั่วแช่แข็งในกรณีที่มีการปลูกพืชสดของถั่วสดในปีนั้น ๆ
Data mining regression เป็นเทคนิคการขุดข้อมูลที่ใช้เพื่อแสดงสิ่งที่น่าจะเกิดขึ้นกับค่าข้อมูลหากมีการเปลี่ยนแปลงบางอย่างในสมการ จากตัวอย่างของซุปเปอร์มาร์เก็ตการถดถอยจะทำนายระดับการขายถั่วแช่แข็งหากราคาถั่วสดเพิ่มขึ้น การถดถอยใช้ข้อมูลประวัติและใช้สูตรกับมันซึ่งทำนายพฤติกรรมในอนาคต
บริษัท ต่างๆมักจะใช้แอพพลิเคชั่นซอฟต์แวร์การขุดคลังข้อมูลเพื่อรวบรวมและขุดข้อมูลของพวกเขา แอปพลิเคชันที่ถูกต้องจะถูกกำหนดโดยปริมาณข้อมูลที่พวกเขามีและประเภทของการวิเคราะห์ที่พวกเขาต้องการจะทำ การเลือกเครื่องมือขุดข้อมูลที่ถูกต้องมีความสำคัญต่อการรวบรวมและตีความข้อมูลที่เป็นประโยชน์


