การจัดกลุ่มความสัมพันธ์จะดำเนินการในฐานข้อมูลและแหล่งข้อมูลขนาดใหญ่อื่น ๆ เพื่อจัดกลุ่มชุดข้อมูลที่คล้ายกันในขณะที่ยังแจ้งเตือนผู้ใช้ไปยังชุดข้อมูลที่แตกต่างกัน สิ่งนี้สามารถทำได้อย่างสมบูรณ์ในกราฟบางขณะที่คนอื่นจะพบข้อผิดพลาดเพราะมันจะยากที่จะแยกความแตกต่างที่คล้ายกันจากข้อมูลที่แตกต่างกัน ในกรณีหลังการจัดกลุ่มที่สัมพันธ์กันจะช่วยลดข้อผิดพลาดโดยอัตโนมัติ มักใช้สำหรับการขุดข้อมูลหรือค้นหาข้อมูลที่ไม่แน่นอนสำหรับความคล้ายคลึงกัน ข้อมูลที่แตกต่างกันจะถูกลบโดยทั่วไปหรือวางไว้ในกลุ่มที่แยกต่างหาก
เมื่อใช้ฟังก์ชันการจัดกลุ่มที่สัมพันธ์กันจะค้นหาข้อมูลตามคำแนะนำของผู้ใช้ ผู้ใช้จะบอกโปรแกรมว่าจะค้นหาและเมื่อพบข้อมูลที่จะวางข้อมูล โดยปกติจะใช้กับแหล่งข้อมูลที่มีขนาดใหญ่มากเมื่อเป็นไปไม่ได้หรือใช้เวลามากเกินไปในการค้นหาข้อมูลด้วยตนเอง อาจมีการจัดกลุ่มที่สมบูรณ์แบบหรือการจัดกลุ่มที่ไม่สมบูรณ์
การจัดกลุ่มที่สมบูรณ์แบบเป็นสถานการณ์ในอุดมคติ ซึ่งหมายความว่ามีข้อมูลเพียงสองประเภทและประเภทหนึ่งคือสิ่งที่ผู้ใช้ค้นหาในขณะที่อีกประเภทหนึ่งไม่จำเป็น ข้อมูลที่เป็นบวกหรือจำเป็นทั้งหมดจะถูกวางไว้ในหนึ่งคลัสเตอร์ในขณะที่ข้อมูลอื่นจะถูกลบหรือย้าย ในสถานการณ์นี้ไม่มีความสับสนและทุกอย่างทำงานได้อย่างสมบูรณ์แบบ
กราฟที่ซับซ้อนส่วนใหญ่ไม่อนุญาตให้มีการจัดกลุ่มที่สมบูรณ์แบบและไม่สมบูรณ์ ตัวอย่างเช่นกราฟมีสามตัวแปร: X, Y และ Z X, Y คล้ายกัน, X, Z คล้ายกัน แต่ Y, Z แตกต่างกัน อย่างไรก็ตามกลุ่มตัวแปรทั้งสามมีความคล้ายคลึงกันอย่างมากอย่างไรก็ตามเป็นไปไม่ได้ที่จะมีการจัดกลุ่มความสัมพันธ์ที่สมบูรณ์แบบ โปรแกรมจะทำงานเพื่อเพิ่มจำนวนความสัมพันธ์ในเชิงบวกให้มากที่สุด แต่ยังคงต้องการการค้นหาด้วยตนเองจากผู้ใช้
ในการขุดข้อมูลโดยเฉพาะอย่างยิ่งเมื่อต้องรับมือกับชุดข้อมูลขนาดใหญ่การจัดกลุ่มที่สัมพันธ์กันจะถูกใช้เพื่อจัดกลุ่มข้อมูลที่คล้ายกันกับข้อมูลที่คล้ายกัน ตัวอย่างเช่นหากธุรกิจขุดข้อมูลสำหรับเว็บไซต์หรือฐานข้อมูลขนาดใหญ่และต้องการทราบเกี่ยวกับบางแง่มุมมันจะใช้เวลาตลอดไปในการค้นหาข้อมูลทั้งหมดสำหรับแง่มุมนั้น โดยใช้สูตรการจัดกลุ่มข้อมูลจะถูกตั้งค่าไว้สำหรับการวิเคราะห์ที่เหมาะสม
ข้อมูลที่ไม่เหมือนกันจะได้รับการจัดการโดยยึดตามคำแนะนำของผู้ใช้เท่านั้น ผู้ใช้สามารถเลือกที่จะส่งข้อมูลที่แตกต่างไปยังกลุ่มที่แตกต่างกันเนื่องจากข้อมูลอาจมีประโยชน์สำหรับโครงการอื่น ๆ หากข้อมูลไม่จำเป็นและเป็นเพียงการสูญเสียความจำข้อมูลที่แตกต่างจะถูกส่งออกไป ในการจัดกลุ่มที่ไม่สมบูรณ์อาจเป็นไปได้ที่ข้อมูลที่แตกต่างกันบางอย่างจะไม่ถูกโยนทิ้งเนื่องจากมีความคล้ายคลึงกับข้อมูลที่ผู้ใช้ค้นหา


