ส่วนเบี่ยงเบนมาตรฐานกลุ่มตัวอย่าง (Sample Standard Deviation) คืออะไร? ความสำคัญของตัวหาร n - 1
ในการศึกษาสถิติเชิงอนุมาน (Inferential Statistics) เรามักไม่สามารถเข้าถึงข้อมูลของประชากรทั้งหมดได้เนื่องจากข้อจำกัดทางเวลาและต้นทุน ด้วยเหตุนี้ นักวิจัยจึงมักใช้ข้อมูลจากการสุ่ม กลุ่มตัวอย่าง (Sample) มาวิเคราะห์ ค่าที่ได้จะนำมาคำนวณส่วนเบี่ยงเบนมาตรฐานกลุ่มตัวอย่าง (Sample Standard Deviation - s) ซึ่งทำหน้าที่ประมาณการค่าเบี่ยงเบนมาตรฐานของประชากรจริง
ทำไมสูตรกลุ่มตัวอย่างต้องหารด้วย n - 1? เจาะลึก Bessel's Correction
หากเราใช้สูตรประชากร (ซึ่งหารด้วยจำนวนข้อมูลทั้งหมด n) มาคำนวณหากลุ่มตัวอย่าง ค่าความแปรปรวนที่ได้มักจะต่ำกว่าความเป็นจริง (Underestimate) เนื่องจากตัวอย่างที่สุ่มออกมามักจะมีค่ากระจุกตัวอยู่ใกล้ค่าเฉลี่ยของตัวเองมากกว่าค่าเฉลี่ยจริงของประชากร เพื่อความถูกต้อง นักคณิตศาสตร์ชื่อ ฟรีดริช เบสเซล (Friedrich Bessel) จึงเสนอสูตรปรับปรุงโดยปรับเปลี่ยนตัวหารให้เป็น n - 1
การลบด้วย 1 ในตัวหารเรียกว่า องศาอิสระ (Degrees of Freedom - df)ซึ่งแสดงถึงจำนวนชิ้นข้อมูลที่มีอิสระในการแปรผันหลังจากการกำหนดค่าเฉลี่ยแล้ว ตัวแก้ไขนี้ช่วยผลักดันให้ผลลัพธ์ของค่าความแปรปรวน (s²) และค่าส่วนเบี่ยงเบนมาตรฐาน (s) สูงขึ้นเล็กน้อย เพื่อสร้างตัวประมาณค่าที่ไม่เอนเอียง (Unbiased Estimator) ของการกระจายตัวในประชากรที่แท้จริง
สูตรการคำนวณหาส่วนเบี่ยงเบนมาตรฐานกลุ่มตัวอย่าง
s = √[ Σ (x_i - x̄)² / (n - 1) ]
อธิบายตัวแปร:
• s = ส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง
• x_i = ข้อมูลกลุ่มตัวอย่างแต่ละตัว
• x̄ (x-bar) = ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง (x̄ = Σx_i / n)
• n = ขนาดกลุ่มตัวอย่าง (จำนวนข้อมูลทั้งหมด)
• n - 1 = ชั้นแห่งความเป็นอิสระ (Degrees of Freedom)
ขั้นตอนการคำนวณส่วนเบี่ยงเบนมาตรฐานกลุ่มตัวอย่างแบบทีละขั้นตอน
ในการคำนวณสถิตินี้ด้วยตนเอง มีขั้นตอนดังต่อไปนี้:
- หาค่าเฉลี่ย (x̄): นำค่าข้อมูลทั้งหมดบวกกันแล้วหารด้วยจำนวนตัวอย่าง (n)
- หาค่าความเบี่ยงเบน: นำข้อมูลแต่ละตัวตั้งแล้วลบด้วยค่าเฉลี่ย (x_i - x̄) สังเกตว่าผลรวมความเบี่ยงเบนดิบของข้อมูลทั้งหมดจะมีค่าเป็น 0 เสมอ
- ยกกำลังสองความเบี่ยงเบน: นำผลต่างที่ได้ยกกำลังสอง (x_i - x̄)² เพื่อเปลี่ยนค่าลบให้เป็นค่าบวกทั้งหมด
- หาผลรวมกำลังสอง: นำค่าผลต่างกำลังสองทั้งหมดมาบวกกัน (Σ (x_i - x̄)²)
- หารด้วย n - 1: นำผลรวมที่ได้หารด้วยจำนวนกลุ่มตัวอย่างลบหนึ่ง จะได้ค่าความแปรปรวนกลุ่มตัวอย่าง (s²)
- ถอดสแควรูท: ถอดรากที่สองของผลหาร จะได้ส่วนเบี่ยงเบนมาตรฐาน (s) ในหน่วยวัดเดียวกับข้อมูลตั้งต้น