การสรุปข้อมูล 5 ค่า (Five-Number Summary) คืออะไร?
ในการศึกษาสถิติเชิงพรรณนา (Descriptive Statistics) การสรุปข้อมูล 5 ค่า (Five-Number Summary) เป็นชุดของค่าสถิติเชิงปริมาณที่ใช้เพื่อให้ภาพรวมของการแจกแจงข้อมูล (Distribution) ของชุดข้อมูลหนึ่งๆ ซึ่งช่วยให้นักสถิติและนักวิจัยสามารถเข้าใจลักษณะเด่น การกระจายตัว และแนวโน้มศูนย์กลางของข้อมูลได้อย่างรวดเร็ว โดยไม่จำเป็นต้องพิจารณาตัวเลขดิบทุกตัว
องค์ประกอบของสรุป 5 ค่า
การสรุปข้อมูลแบบ 5 ค่า ประกอบไปด้วยค่าทางสถิติ 5 ตัว ซึ่งต้องทำการเรียงลำดับข้อมูลทั้งหมดจากน้อยไปหามากเสียก่อน ได้แก่:
- 1. ค่าต่ำสุด (Minimum): ค่าที่น้อยที่สุดในชุดข้อมูลทั้งหมด บ่งบอกถึงจุดเริ่มต้นของการกระจายตัว
- 2. ควอร์ไทล์ที่ 1 (First Quartile - Q1): คือค่ามัธยฐานของครึ่งล่างของข้อมูล แสดงถึงตำแหน่งที่ข้อมูล 25% แรกมีค่าน้อยกว่าหรือเท่ากับค่านี้
- 3. มัธยฐาน หรือ ควอร์ไทล์ที่ 2 (Median / Q2): ค่าที่อยู่ตรงกลางของชุดข้อมูลพอดี แสดงว่ามีข้อมูล 50% ที่น้อยกว่า และอีก 50% ที่มากกว่าค่านี้ เป็นตัวแทนของค่ากลางชุดข้อมูล
- 4. ควอร์ไทล์ที่ 3 (Third Quartile - Q3): คือค่ามัธยฐานของครึ่งบนของข้อมูล แสดงถึงตำแหน่งที่ข้อมูล 75% แรกมีค่าน้อยกว่าหรือเท่ากับค่านี้ (หรืออีก 25% ที่เหลือมีค่ามากกว่า)
- 5. ค่าสูงสุด (Maximum): ค่าที่มากที่สุดในชุดข้อมูลทั้งหมด บ่งบอกถึงจุดสิ้นสุดของการกระจายตัว
การนำไปประยุกต์ใช้: แผนภาพกล่อง (Box Plot)
ประโยชน์ที่สำคัญที่สุดของการสรุปข้อมูล 5 ค่า คือการนำไปใช้สร้างกราฟที่เรียกว่า แผนภาพกล่อง (Box Plot หรือ Box-and-Whisker Plot)
ในแผนภาพกล่อง กล่องสี่เหลี่ยมตรงกลางจะถูกสร้างขึ้นโดยมีขอบล่างอยู่ที่ Q1 และขอบบนอยู่ที่ Q3 ความกว้างของกล่องนี้เรียกว่า พิสัยระหว่างควอร์ไทล์ (Interquartile Range: IQR = Q3 - Q1) ซึ่งแสดงถึงการกระจายตัวของข้อมูล 50% ตรงกลาง เส้นขีดตรงกลางกล่องคือมัธยฐาน (Median) ส่วนเส้นที่ลากยื่นออกไป (Whiskers) จะลากไปหาค่าต่ำสุดและค่าสูงสุด (หรือในบางกรณีจะลากไปยังค่าที่ไม่ใช่ Outlier หรือ ค่าผิดปกติ)
ความสำคัญในการวิเคราะห์ข้อมูล
การสรุป 5 ค่านี้ มีข้อดีกว่าการใช้แค่ค่าเฉลี่ย (Mean) และส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) อย่างมาก ในกรณีที่ชุดข้อมูลมีการแจกแจงแบบเบ้ (Skewed Distribution) หรือมีค่าผิดปกติ (Outliers) มากเกินไป
ค่าเฉลี่ยมักจะถูกดึงให้บิดเบือนไปตามค่า Outlier ที่สูงมากหรือต่ำมากๆ แต่ค่ามัธยฐานและควอร์ไทล์ (ซึ่งอิงจากตำแหน่งและอันดับของข้อมูล) จะได้รับผลกระทบจากค่าเหล่านี้ได้ยากกว่า (Robustness) การดูว่าค่ามัธยฐานค่อนไปทาง Q1 หรือ Q3 มากกว่ากัน ช่วยให้เราทราบถึงลักษณะความเบ้ซ้าย-ขวาของข้อมูลได้อย่างรวดเร็ว
เครื่องคำนวณออนไลน์นี้สร้างขึ้นเพื่ออำนวยความสะดวกในการหารายละเอียด 5 ค่าทางสถิตินี้โดยอัตโนมัติ ช่วยประหยัดเวลาในการนั่งเรียงลำดับชุดตัวเลขจำนวนมาก และลดข้อผิดพลาดในการหาตำแหน่งของควอร์ไทล์ตามทฤษฎีได้อย่างมีประสิทธิภาพ