ความเบ้ (Skewness) คืออะไร? สุดยอดคู่มือทำความเข้าใจรูปทรงการกระจายของข้อมูล
ในทางสถิติศาสตร์ ความเบ้ (Skewness) คือค่าวัดความไม่สมมาตร (Asymmetry) ของการแจกแจงความน่าจะเป็นของตัวแปรสุ่มรอบค่าเฉลี่ยของตัวมันเอง หากเรานำข้อมูลมาสร้างฮิสโตแกรม (Histogram) หรือเส้นโค้งการแจกแจง เราจะเห็นได้ว่าข้อมูลบางชุดไม่ได้เป็นรูประฆังคว่ำที่สมมาตรกันเป๊ะๆ เสมอไป บางครั้งข้อมูลอาจจะเทไปทางซ้าย หรือเทไปทางขวา การที่เราจะระบุว่ามันเทไปทางไหนและมากเท่าใดนั้น เราใช้ค่า "ความเบ้" ในการระบุนั่นเอง
ประเภทของความเบ้ (Types of Skewness)
ค่าความเบ้สามารถเป็นบวก เป็นลบ หรือเป็นศูนย์ก็ได้ โดยสามารถแบ่งลักษณะของการกระจายข้อมูลได้เป็น 3 ประเภทหลัก ๆ ดังนี้:
- ความเบ้ขวา (Positive Skewness หรือ Right-Skewed): เกิดขึ้นเมื่อหางของกราฟลากยาวไปทางขวามากกว่าทางซ้าย ในกรณีนี้ ส่วนใหญ่ข้อมูลจะกระจุกตัวอยู่ทางซ้าย (ค่าต่ำ) และมีค่าที่สูงผิดปกติ (Outliers) อยู่ทางขวา ส่งผลให้ ค่าเฉลี่ย (Mean) > มัธยฐาน (Median) > ฐานนิยม (Mode)
- ความเบ้ซ้าย (Negative Skewness หรือ Left-Skewed): เกิดขึ้นเมื่อหางของกราฟลากยาวไปทางซ้ายมากกว่าทางขวา ข้อมูลส่วนใหญ่จะกระจุกตัวอยู่ทางขวา (ค่าสูง) และมีค่าต่ำที่ดึงกราฟไปทางซ้าย ส่งผลให้ ค่าเฉลี่ย (Mean) < มัธยฐาน (Median) < ฐานนิยม (Mode)
- สมมาตร (Symmetrical Distribution หรือ Zero Skewness): รูปทรงกราฟจะเป็นระฆังคว่ำสมมาตรกันทั้งซ้ายและขวา ค่าความเบ้จะเท่ากับ 0 (หรือใกล้เคียง 0 มากๆ) ในกรณีนี้ ค่าเฉลี่ย = มัธยฐาน = ฐานนิยม
สูตรการคำนวณค่าความเบ้ (Formulas for Skewness)
ในการคำนวณ เราสามารถแบ่งเป็น 2 กรณีคือ การคำนวณสำหรับ "ประชากร (Population)" และ "กลุ่มตัวอย่าง (Sample)"
1. ความเบ้ของประชากร (Population Skewness):
Skewness (Population) = Σ(xi - μ)³ / (N × σ³)
โดยที่ μ คือค่าเฉลี่ยของประชากร, σ คือส่วนเบี่ยงเบนมาตรฐานของประชากร, และ N คือจำนวนข้อมูลทั้งหมดของประชากร
2. ความเบ้ของกลุ่มตัวอย่าง (Sample Skewness): (มักเป็นค่าที่โปรแกรมอย่าง Excel, SPSS หรือเครื่องมือนี้ใช้เป็นหลัก)
Skewness (Sample) = [n / ((n-1)(n-2))] × Σ( (xi - x̄) / s )³
โดยที่ x̄ คือค่าเฉลี่ยของกลุ่มตัวอย่าง, s คือส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง, และ n คือขนาดของกลุ่มตัวอย่าง สูตรนี้มีการปรับแก้ (Bias correction) ทำให้เหมาะสมกับการประมาณค่าของประชากรจากกลุ่มตัวอย่าง
ความสำคัญและการนำไปใช้งาน
การทราบค่าความเบ้มีประโยชน์อย่างมหาศาลในการวิเคราะห์ข้อมูล โดยเฉพาะในสายงานวิทยาศาสตร์ข้อมูล (Data Science) สถิติ และการเงิน ตัวอย่างเช่น:
- ด้านการเงินและการลงทุน: ผลตอบแทนของหุ้นมักมีการแจกแจงที่ไม่สมมาตร นักลงทุนมักชอบพอร์ตการลงทุนที่มีความเบ้เป็นบวก (Positive Skewness) เพราะหมายถึงมีโอกาสที่จะได้ผลตอบแทนสูงปรี๊ด ในขณะที่ความเสี่ยงทางลบถูกจำกัดไว้
- การประเมินความเหมาะสมของโมเดลสถิติ: โมเดลสถิติหรือ Machine Learning หลายแบบมีสมมติฐานว่าข้อมูลต้องมีการแจกแจงแบบปกติ (Normal Distribution) หากเราพบว่าข้อมูลมีความเบ้สูง เราอาจจะต้องทำการแปลงข้อมูล (Data Transformation) เช่น การหาค่า Log, Square Root หรือ Box-Cox Transformation เพื่อลดความเบ้ลงก่อนนำไปสร้างโมเดล
เครื่องมือคำนวณหาค่าความเบ้ (Skewness Calculator) ของเราออกแบบมาให้ใช้งานง่าย เพียงแค่ใส่ชุดข้อมูลลงไป ระบบก็จะคำนวณหาทั้งความเบ้ของประชากรและความเบ้ของกลุ่มตัวอย่าง พร้อมทั้งแปลผลให้อัตโนมัติ ทำให้ผู้ใช้งานทุกระดับสามารถนำผลลัพธ์ไปใช้งานได้อย่างมั่นใจ ไม่ว่าจะนำไปใช้ในการเรียน ทำวิจัย หรือวิเคราะห์ข้อมูลเชิงลึกในธุรกิจก็ตาม