พล็อตเรื่องกล่องคืออะไร?

พล็อตกล่องหรือไดอะแกรมกล่องและมัสสุเป็นวิธีการจัดระเบียบข้อมูลตัวเลขตามบรรทัดหมายเลขเดียวซึ่งสามารถเป็นแนวนอนหรือแนวตั้ง กล่องจริงเมื่อพล็อตเป็นแนวนอนอยู่เหนือเส้นจำนวนเล็กน้อยและประกอบด้วยเส้นแนวตั้งสามเส้นเชื่อมต่อกันด้วยเส้นแนวนอน ขอบเขตแนวนอนของกล่องแสดงควอไทล์ที่หนึ่งและสาม (เปอร์เซนต์ 25 และ 75) คั่นด้วยเส้นตรงกลางซึ่งเป็นค่ามัธยฐานของข้อมูลหรือเปอร์เซ็นไทล์ที่ 50 ที่ด้านใดด้านหนึ่งของพล็อตกล่องจากตรงกลางของเส้นแนวนอนเส้นแนวตั้งบางครั้งเรียกว่าเคราขยาย เมื่อถึงจำนวนขั้นต่ำสุดและสูงสุดของชุดข้อมูลพวกมันจะลงท้ายด้วยเส้นแนวนอนเล็ก ๆ แม้ว่าสิ่งนี้อาจแตกต่างกันเล็กน้อยขึ้นอยู่กับการกระจายของข้อมูล

มีองค์ประกอบที่สำคัญบางอย่างที่ประกอบเป็นพล็อตบ็อกซ์ที่ดีและบางตัวเลขที่ผู้คนจำเป็นต้องรู้เมื่อสร้างแผนภูมิเหล่านี้ ครั้งแรกของสิ่งเหล่านี้เรียกว่าการสรุปห้าจำนวนมักจะเรียกว่าห้า NUM รวม นี่คือรายการของควอไทล์อันดับที่หนึ่งและสามค่ามัธยฐานและจำนวนต่ำสุดและสูงสุดของข้อมูล ในบางแอปพลิเคชันผู้คนจะต้องแสดงรายการเหล่านี้ใกล้กับพล็อตแม้ว่าการวิเคราะห์พล็อตที่มีหมายเลขบรรทัดที่ดีสามารถรับตัวเลขเหล่านี้ได้โดยดูที่สามบรรทัดแนวนอนและหนวดที่ลงท้ายด้วย มันไม่ใช่คำถามไก่ / ไข่สำหรับคนที่วาดพล็อตเพราะตัวเลขห้าตัว รวม จะต้องใช้ในการสร้างพล็อต

ผู้คนยังจำเป็นต้องรู้จำนวนที่เรียกว่าช่วง interquartile (IQR) การลบควอไทล์แรกจากควอไทล์ที่สามนั้นมาจาก IQR และการใช้ซอฟต์แวร์หรือเครื่องคำนวณทางวิทยาศาสตร์ที่แตกต่างกันยังสามารถรับหมายเลขนี้และสรุปหมายเลขห้าได้ด้วยการป้อนข้อมูลทั้งหมด IQR มีความสำคัญเนื่องจากบรรทัดที่ขยายจากกล่องมักขยายได้ถึง 1.5 เท่าของ IQR ข้อมูลที่อยู่เหนือจุดนั้นจะถูกระบุด้วยจุดแทนที่จะเป็นเส้นต่อเนื่อง จุดเหล่านี้มักจะแนะนำว่าข้อมูลมีค่าผิดปกติ

มีการใช้งานหลากหลายสำหรับพล็อตกล่อง หลาย ๆ แปลงสามารถวาดเหนือเส้นหมายเลขหนึ่งและสามารถเปรียบเทียบชุดข้อมูลที่คล้ายคลึงกันซึ่งแตกต่างกันโดยปัจจัยสำคัญบางอย่าง ยกตัวอย่างเช่นนักวิทยาศาสตร์หรือนักสถิติอาจบันทึกอัตราการเต้นของหัวใจของผู้ชายและผู้หญิงแล้วสร้างกล่องสี่เหลี่ยมซ้อนกันสองอันเพื่อค้นหาความแตกต่างที่สำคัญในระยะและควอไทล์

แปลงกล่องไม่ได้ระบุความถี่ของข้อมูล การขาดมาตราส่วนเพิ่มเติม (แนวตั้งหรือแนวนอน) ละเว้นข้อมูลเกี่ยวกับตัวเลขซ้ำขนาดชุดข้อมูลและตัวเลขส่วนใหญ่ คนที่ดูพล็อตกล่องจะเข้าใจข้อมูลสรุปจำนวนช่วงและข้อมูลว่ามีค่าผิดหรือไม่ ขนาดของกล่องความสัมพันธ์ของค่ามัธยฐานถึงควอไทล์และความยาวของหนวดสามารถแสดงได้ว่าข้อมูลนั้นเบ้หรือไม่ แต่ไม่สามารถพูดกับสิ่งต่าง ๆ เช่นค่าเฉลี่ยโหมดหรือค่าเบี่ยงเบนมาตรฐาน แผนภูมิอื่น ๆ เช่นฮิสโทแกรมอาจมีประโยชน์มากกว่าเมื่อผู้คนต้องการแสดงสิ่งต่าง ๆ เช่นความถี่หรือรับภาพที่ดีขึ้นเกี่ยวกับการกระจายข้อมูล