การจับคู่สคีมาเป็นเทคนิคที่ใช้ในการผสานสองฐานข้อมูลที่ซับซ้อนหรือชุดข้อมูลเข้าด้วยกัน เนื่องจากการใช้ฐานข้อมูลและการจัดเก็บข้อมูลอิเล็กทรอนิกส์มีขนาดใหญ่ขึ้นและมีความซับซ้อนมากขึ้นผ่านอินเทอร์เน็ตจึงจำเป็นต้องมีวิธีการที่กำหนดไว้สำหรับการรวมชุดข้อมูลจากฐานข้อมูลหนึ่งไปยังอีกฐานข้อมูลหนึ่งและการจับคู่ schema เป็นเทคนิคหนึ่ง แนวคิดนั้นง่าย แต่ความจริงของการรวมข้อมูลนั้นค่อนข้างซับซ้อน
คำว่า "การจับคู่สคีมา" ถูกนำมาใช้อย่างตรงกันกับ "การจับคู่สคีมา" เนื่องจากผู้ใช้เป็นข้อมูลการจับคู่ที่แท้จริงไม่ใช่จับคู่พวกเขา มีการแม็พสองฐานข้อมูลเข้าด้วยกันและลักษณะที่คล้ายกันของแต่ละฐานข้อมูลถูกแม็พเข้าด้วยกัน วิธีทั่วไปในการรวมข้อมูลคือการใช้การอ้างอิงที่แน่นอน ตัวอย่างของการผสานรูปแบบนี้คือการรวมคอลัมน์ชื่อของฐานข้อมูลหนึ่งกับคอลัมน์ชื่อของฐานข้อมูลอื่น
การผสานมักไม่ใช่เรื่องง่ายสำหรับคนหรือคอมพิวเตอร์ ด้วยข้อมูลจำนวนมากที่จำเป็นต้องกรองรวมและใช้งานการมีฐานข้อมูลเดียวแทนที่จะเป็นฐานข้อมูลหลาย ๆ ตัวเป็นสิ่งจำเป็น การทำแผนที่สคีมามุ่งเน้นที่การทำให้กระบวนการที่น่าเบื่อนี้เป็นไปโดยอัตโนมัติและมีประสิทธิภาพมากขึ้น ตัวอย่างของการจับคู่สคีมาที่จำเป็นเมื่อฐานข้อมูลหนึ่งมีเขตข้อมูล "สำคัญของนักเรียน" และฐานข้อมูลอื่นมีเขตข้อมูล "เขตข้อมูลการศึกษาของนักเรียน" มันเป็นข้อมูลเดียวกัน แต่ชื่อที่ต่างกันเล็กน้อยมีความซับซ้อนในการพยายามผสมผสาน
การจับคู่สคีมาแบ่งกระบวนการที่ซับซ้อนของการรวมฐานข้อมูลออกเป็นสี่ขั้นตอน ได้แก่ การผสานรวมการเปรียบเทียบการทำตามและการผสาน ก่อนที่จะรวมหลายฐานข้อมูลได้พวกเขาต้องวิเคราะห์ความเหมือนและความแตกต่าง ในขอบเขตของการจับคู่สคีมาสิ่งนี้เรียกว่าการรวมล่วงหน้า คอมพิวเตอร์เริ่มตรวจสอบวิธีการรวมที่มีประสิทธิภาพที่สุด
จากนั้นคอมพิวเตอร์จะประเมินโครงร่างโดยเปรียบเทียบกับชุดอื่น ๆ ในระดับรายละเอียดเพิ่มเติม ในขั้นตอนการเปรียบเทียบคอมพิวเตอร์จะดูรายการฐานข้อมูลแต่ละรายการและพิจารณาว่ามีข้อขัดแย้งใดบ้าง ตัวอย่างนี้คือเมื่อฟิลด์ "ความสนใจของนักเรียน" แสดงรายการ "หมอ" และฐานข้อมูลอื่นระบุว่าเป็น "หมอ" บุคคลที่มีแนวโน้มจะรับรู้ข้อมูลที่เป็นเหมือนกัน แต่สำหรับเครื่องมือฐานข้อมูลพวกเขาเป็นสองหน่วยงานที่แยกจากกัน
เมื่อคอมพิวเตอร์ได้พิจารณาข้อขัดแย้งที่อาจเกิดขึ้นทั้งหมดแล้วคอมพิวเตอร์จะสามารถเดินหน้าต่อไปได้โดยพยายามแก้ไขปัญหา สิ่งนี้อาจง่ายเหมือนการเปลี่ยน "หมอ" ทั้งหมดเป็น "หมอ" ในความเป็นจริงกระบวนการมีความซับซ้อนมากขึ้นอย่างมาก
เมื่อแก้ไขข้อขัดแย้งทั้งหมดแล้วคอมพิวเตอร์สามารถดำเนินการผสานข้อมูลในกระบวนการจับคู่สกีมา ในขั้นตอนนี้ฐานข้อมูลสองฐานขึ้นไปจะถูกรวมเข้ากับฐานข้อมูลขนาดใหญ่หนึ่งฐาน หากทุกอย่างเป็นไปด้วยดีจะไม่มีข้อขัดแย้งหรือข้อผิดพลาดเกิดขึ้นระหว่างการรวมและการเข้าถึงฐานข้อมูลในอนาคต


