ควอไทล์ (Quartile) คืออะไร?
ในทางสถิติและการวิเคราะห์ข้อมูล ควอไทล์ (Quartile หรือสัญลักษณ์ Q) คือค่าวัดตำแหน่งข้อมูลที่แบ่งชุดข้อมูลที่มีการจัดเรียงจากน้อยไปหามากออกเป็น 4 ส่วนเท่าๆ กัน โดยแต่ละส่วนจะมีจำนวนข้อมูลเท่ากับ 25% ของข้อมูลทั้งหมด ดังนั้นการแบ่งในลักษณะนี้จะเกิดจุดตัดหรือค่าควอไทล์ขึ้นมาทั้งหมด 3 ค่า ได้แก่:
- ควอไทล์ที่ 1 ($Q_1$): จุดตัดที่แสดงว่ามีข้อมูล 25% ที่มีค่าน้อยกว่าหรือเท่ากับค่านี้ (เรียกอีกอย่างว่า เปอร์เซ็นต์ไทล์ที่ 25)
- ควอไทล์ที่ 2 ($Q_2$): จุดตัดตรงกลางพอดี ซึ่งแบ่งข้อมูลออกเป็นสองส่วนเท่าๆ กัน (50%) ค่านี้จะตรงกับ ค่ามัธยฐาน (Median) และเปอร์เซ็นต์ไทล์ที่ 50
- ควอไทล์ที่ 3 ($Q_3$): จุดตัดที่แสดงว่ามีข้อมูล 75% ที่มีค่าน้อยกว่าหรือเท่ากับค่านี้ และมี 25% ที่มีค่ามากกว่า (เรียกอีกอย่างว่า เปอร์เซ็นต์ไทล์ที่ 75)
สูตรการหาตำแหน่งควอไทล์ของข้อมูลที่ยังไม่ได้แจกแจงความถี่
ความแตกต่างในการคำนวณควอไทล์อยู่ที่สูตรการหาตำแหน่ง ($Pos$) ซึ่งมี 2 วิธีที่เป็นที่นิยม:
1. สูตรหลักสูตรมัธยมศึกษาไทย (สสวท.)
$\text{ตำแหน่งของ } Q_r = \frac{r(n + 1)}{4}$
ใช้สอนอย่างแพร่หลายในวิชาคณิตศาสตร์ ม.ปลาย ของประเทศไทย
2. สูตรมาตรฐานสากล (Excel PERCENTILE.INC)
$\text{ตำแหน่งของ } Q_r = \frac{r(n - 1)}{4} + 1$
สูตรคำนวณสำหรับโปรแกรมคอมพิวเตอร์และสถิติวิเคราะห์ระดับสูงทั่วไป
คำอธิบายตัวแปร:
- $r$ คือ ลำดับควอไทล์ที่ต้องการหา ซึ่งก็คือ 1, 2 หรือ 3
- $n$ คือ จำนวนรายการข้อมูลที่มีอยู่ทั้งหมด
ขั้นตอนและวิธีการเทียบสัดส่วนคำนวณควอไทล์
เมื่อแทนค่าในสูตรด้านบนเพื่อระบุตำแหน่งแล้ว หากตำแหน่งที่ได้ออกมาเป็นทศนิยม เราจะนำไปเปรียบเทียบเชิงเส้น (Linear Interpolation) เช่นเดียวกับวิธีคำนวณเดไซล์และเปอร์เซ็นต์ไทล์ ตัวอย่างเช่น:
- เรียงลำดับข้อมูลดิบ: จากน้อยไปหามากเสมอ
- ระบุตำแหน่ง: สมมติข้อมูลมี 9 ตัว นำมาหา $Q_3$ ตามสูตรไทย จะได้ตำแหน่ง = $3 \cdot (9 + 1) / 4 = 7.5$
- คำนวณเปรียบเทียบ: เนื่องจากตำแหน่งคือ 7.5 ค่าควอไทล์จะอยู่กึ่งกลางระหว่างตัวเลขลำดับที่ 7 และลำดับที่ 8 ของข้อมูลที่จัดเรียงแล้ว นำสูตรมาแทนค่าดังนี้:
$\text{ค่า } Q_3 = \text{ข้อมูลตัวที่ } 7 + 0.5 \cdot (\text{ข้อมูลตัวที่ } 8 - \text{ข้อมูลตัวที่ } 7)$
การประยุกต์ใช้งานควอไทล์ในสถิติวิเคราะห์
ควอไทล์ถูกใช้อย่างแพร่หลายในการสรุปข้อมูลเชิงพรรณนาและการจัดรูปแบบการกระจายตัวของข้อมูล:
- แผนภาพกล่อง (Box Plot): แผนภูมิชนิดนี้นิยมใช้สำหรับแสดงการกระจายตัวของข้อมูล โดยใช้ค่าต่ำสุด, ค่าสูงสุด, $Q_1$, $Q_2$ (Median) และ $Q_3$ ในการสร้างขอบเขตกล่องและหนวดแมว (Whiskers)
- การวิเคราะห์หาค่านอกเกณฑ์ (Outlier Analysis): ใช้คำนวณระยะห่างระหว่างควอไทล์ (Interquartile Range: $IQR = Q_3 - Q_1$) เพื่อใช้กำหนดเกณฑ์หาข้อมูลที่มีความแปลกแยกหรือสูง/ต่ำผิดปกติ ($1.5 \cdot IQR$)
- การแบ่งกลุ่มการประเมินผลการเรียน: การจัดเกรดหรือการประเมินผลระดับชั้นในหลายหลักสูตรจะอิงการตัดยอดคะแนนที่เปอร์เซ็นไทล์หรือควอไทล์ต่าง ๆ
เว็บเครื่องคิดเลขควอไทล์นี้ถูกสร้างขึ้นเพื่ออำนวยความสะดวกแก่นักเรียน นักศึกษา และนักสถิติ เพื่อการประมวลผลตำแหน่งควอไทล์อย่างแม่นยำ ปราศจากความเสี่ยงในการคำนวณทศนิยมผิดพลาด