ส่วนเบี่ยงเบนมาตรฐาน เป็นแนวคิดที่ถูกเข้าใจผิดมากที่สุดในสถิติเบื้องต้น คนรู้ว่ามัน "วัดการกระจาย" แต่นิ่งงันเมื่อถูกถามว่าตัวเลขนั้นหมายความว่าอะไรกันแน่ คู่มือนี้อธิบายมันสามแบบ — เชิงเรขาคณิต เชิงการคำนวณ และเชิงสัญชาตญาณ — เพื่อว่าครั้งต่อไปที่คุณเห็น $\sigma$ ในบทความหรือรายงาน คุณจะเข้าใจจริงๆ ว่ามันคืออะไร

นิยามแบบภาษาที่เข้าใจง่าย

ส่วนเบี่ยงเบนมาตรฐานตอบว่า: โดยเฉลี่ยแล้ว ข้อมูลแต่ละจุดอยู่ห่างจากค่าเฉลี่ยเท่าใด?

ในเชิงสัญลักษณ์ สำหรับประชากร $N$ ค่า $x_1, \ldots, x_N$ ที่มีค่าเฉลี่ย $\mu$ :

$\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^N (x_i - \mu)^2}$

อ่านออกเสียง: "ค่าเฉลี่ยของส่วนเบี่ยงเบนยกกำลังสอง แล้วถอดรากที่สอง"

ทำไมต้องยกกำลังสอง แล้วถอดรากที่สอง?

ความพยายามแรกที่สมเหตุสมผลของ "ระยะห่างเฉลี่ยจากค่าเฉลี่ย" อาจเป็น $\frac{1}{N}\sum |x_i - \mu|$ — ส่วนเบี่ยงเบนสัมบูรณ์เฉลี่ย มันใช้ได้ และนักสถิติก็ใช้บ้างเป็นครั้งคราว (มันทนทานต่อค่าผิดปกติมากกว่า)

แต่ค่าสัมบูรณ์นั้นยุ่งยากในเชิงคณิตศาสตร์ — มันหาอนุพันธ์ที่ศูนย์ไม่ได้ อนุพันธ์ระเบิด และคุณทำแคลคูลัสกับมันอย่างสะอาดไม่ได้ การยกกำลังสอง เลี่ยงทั้งหมดนั้น และรากที่สองตอนท้ายนำหน่วยกลับมาสู่สเกลเดิม (ดังนั้น $\sigma$ อยู่ในหน่วยดอลลาร์ถ้า $x$ อยู่ในหน่วยดอลลาร์ ไม่ใช่ดอลลาร์²)

นี่คือเหตุผลเดียวกับที่การเรียนรู้ของเครื่องใช้ กำลังสองของการสูญเสีย (ค่าคลาดเคลื่อนกำลังสองเฉลี่ย) — การยกกำลังสองหาอนุพันธ์ได้ เข้ากันได้ดีกับแคลคูลัส และตัวประมาณค่าที่ได้มักเหมาะสมที่สุด

ประชากร vs ตัวอย่าง — เรื่อง $n-1$ vs $n$

มีสองสูตร และความแตกต่างนั้นสำคัญ:

ประชากร (คุณมีข้อมูลทั้งหมด): หารด้วย $N$ สัญลักษณ์ $\sigma$
ตัวอย่าง (คุณมีตัวอย่าง ต้องการประมาณค่าประชากร): หารด้วย $n - 1$ สัญลักษณ์ $s$

$n - 1$ ในสูตรตัวอย่างคือการแก้ไขของเบสเซล (Bessel's correction) ทำไม? การใช้ $n$ จะประเมินต่ำส่วนเบี่ยงเบนมาตรฐานของประชากรอย่างเป็นระบบ เพราะคุณใช้ค่าเฉลี่ยตัวอย่าง (ซึ่งโดยโครงสร้างเป็นค่าที่พอดีที่สุดสำหรับตัวอย่าง) ทำให้ส่วนเบี่ยงเบนเล็กกว่าที่ควรจะเป็นเมื่อเทียบกับค่าเฉลี่ยประชากรจริง การหารด้วย $n - 1$ แทน $n$ ชดเชยสิ่งนั้นได้พอดี

เครื่องคิดเลขและซอฟต์แวร์ส่วนใหญ่ตั้งค่าเริ่มต้นเป็นสูตรตัวอย่าง ใส่ใจให้ดี

ตัวอย่างที่แก้แล้ว 1: ชุดข้อมูลสมมาตรขนาดเล็ก

ข้อมูล: $\{2, 4, 4, 4, 5, 5, 7, 9\}$ (8 ค่า; ตัวอย่างคลาสสิกในตำราเรียน)

ค่าเฉลี่ย: $\bar{x} = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5$
ส่วนเบี่ยงเบนจากค่าเฉลี่ย: $-3, -1, -1, -1, 0, 0, 2, 4$
ส่วนเบี่ยงเบนยกกำลังสอง: $9, 1, 1, 1, 0, 0, 4, 16$
ผลรวม: $32$
ประชากร ( $N = 8$ ): ความแปรปรวน $= 32/8 = 4$ , $\sigma = 2$
ตัวอย่าง ( $n - 1 = 7$ ): ความแปรปรวน $= 32/7 \approx 4.57$ , $s \approx 2.14$

กฎ 68-95-99.7 (เฉพาะการแจกแจงปกติเท่านั้น)

ถ้าข้อมูลของคุณเป็นปกติโดยประมาณ (รูประฆัง):

$\approx 68\%$ ของค่าตกอยู่ภายใน $1\sigma$ จากค่าเฉลี่ย
$\approx 95\%$ ภายใน $2\sigma$
$\approx 99.7\%$ ภายใน $3\sigma$

นี่คือเหตุผลที่ " $\pm 2\sigma$ " หรือ "สองซิกมา" เป็นนิยามแบบลำลองเริ่มต้นของ "ผิดปกติในเชิงสถิติ"

⚠️ คำเตือน: กฎนี้ใช้ได้กับการแจกแจงปกติเท่านั้น สำหรับข้อมูลที่เบ้หรือมีหางหนา (รายได้ เวลาตอบสนอง) $1\sigma$ อาจครอบคลุม 80% ของข้อมูล — หรือ 50% ตรวจสอบรูปร่างการแจกแจงเสมอ (ฮิสโตแกรม กราฟ QQ) ก่อนอ้างตัวเลข 68-95-99.7

ส่วนเบี่ยงเบนมาตรฐาน vs ความแปรปรวน

ความแปรปรวนก็คือ $\sigma^2$ ทั้งคู่มีข้อมูลเหมือนกัน แล้วทำไมต้องมีทั้งสอง?

ส่วนเบี่ยงเบนมาตรฐาน มีหน่วยเดียวกับข้อมูล — ตีความได้
ความแปรปรวน แยกส่วนแบบบวกได้สำหรับตัวแปรอิสระ ( $\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y)$ เมื่ออิสระ) ทำให้มันเป็นปริมาณที่สะดวกในเชิงพีชคณิตสำหรับการพิสูจน์ ค่าคาดหมาย และ ANOVA

ใช้ $\sigma$ เมื่อรายงาน; ใช้ $\sigma^2$ เมื่อทำการคำนวณ

ข้อผิดพลาดที่พบบ่อย

อ้าง $\sigma$ โดยไม่มีบริบท " $\sigma = 5$ " ไม่มีความหมายถ้าคุณไม่รู้ค่าเฉลี่ย จับคู่เสมอ: "ค่าเฉลี่ย $= 100$ , $\sigma = 5$ "
ปนสูตรประชากรและตัวอย่าง กับตัวอย่างขนาดเล็กมันสร้างความแตกต่างจริง กับตัวอย่างขนาดใหญ่ ( $n > 100$ ) ความแตกต่างเล็กน้อยจนละเลยได้
ลืมความไวต่อค่าผิดปกติ ค่าสุดขั้วเพียงค่าเดียวอาจทำให้ $\sigma$ พองโต สำหรับข้อมูลหางหนา ให้รายงานส่วนเบี่ยงเบนสัมบูรณ์มัธยฐาน (MAD) ด้วยเพื่อความทนทาน
ใช้ 68-95-99.7 กับข้อมูลที่ไม่ปกติ ดูด้านบน

ลองด้วยตัวคุณเอง

ใส่ชุดข้อมูลใดๆ ลงในเครื่องคำนวณส่วนเบี่ยงเบนมาตรฐานฟรี ของเรา — เลือกประชากรหรือตัวอย่าง ดูการคำนวณทีละขั้นตอน และตรวจสอบกับคู่มือนี้

เนื้อหาที่เกี่ยวข้อง:

เข้าใจส่วนเบี่ยงเบนมาตรฐานแบบไม่ต้องน้ำตาตก