statistics

เข้าใจส่วนเบี่ยงเบนมาตรฐานแบบไม่ต้องน้ำตาตก

ส่วนเบี่ยงเบนมาตรฐานในภาษาที่เข้าใจง่าย: มันวัดอะไรกันแน่ ความแตกต่างระหว่างประชากรกับตัวอย่าง กฎ 68-95-99.7 และตัวอย่างที่แก้แล้วสามข้อที่คุณตรวจสอบได้
AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

ส่วนเบี่ยงเบนมาตรฐาน เป็นแนวคิดที่ถูกเข้าใจผิดมากที่สุดในสถิติเบื้องต้น คนรู้ว่ามัน "วัดการกระจาย" แต่นิ่งงันเมื่อถูกถามว่าตัวเลขนั้นหมายความว่าอะไรกันแน่ คู่มือนี้อธิบายมันสามแบบ — เชิงเรขาคณิต เชิงการคำนวณ และเชิงสัญชาตญาณ — เพื่อว่าครั้งต่อไปที่คุณเห็น σ\sigma ในบทความหรือรายงาน คุณจะเข้าใจจริงๆ ว่ามันคืออะไร

นิยามแบบภาษาที่เข้าใจง่าย

ส่วนเบี่ยงเบนมาตรฐานตอบว่า: โดยเฉลี่ยแล้ว ข้อมูลแต่ละจุดอยู่ห่างจากค่าเฉลี่ยเท่าใด?

ในเชิงสัญลักษณ์ สำหรับประชากร NN ค่า x1,,xNx_1, \ldots, x_N ที่มีค่าเฉลี่ย μ\mu:

σ=1Ni=1N(xiμ)2\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^N (x_i - \mu)^2}

อ่านออกเสียง: "ค่าเฉลี่ยของส่วนเบี่ยงเบนยกกำลังสอง แล้วถอดรากที่สอง"

ทำไมต้องยกกำลังสอง แล้วถอดรากที่สอง?

ความพยายามแรกที่สมเหตุสมผลของ "ระยะห่างเฉลี่ยจากค่าเฉลี่ย" อาจเป็น 1Nxiμ\frac{1}{N}\sum |x_i - \mu|ส่วนเบี่ยงเบนสัมบูรณ์เฉลี่ย มันใช้ได้ และนักสถิติก็ใช้บ้างเป็นครั้งคราว (มันทนทานต่อค่าผิดปกติมากกว่า)

แต่ค่าสัมบูรณ์นั้นยุ่งยากในเชิงคณิตศาสตร์ — มันหาอนุพันธ์ที่ศูนย์ไม่ได้ อนุพันธ์ระเบิด และคุณทำแคลคูลัสกับมันอย่างสะอาดไม่ได้ การยกกำลังสอง เลี่ยงทั้งหมดนั้น และรากที่สองตอนท้ายนำหน่วยกลับมาสู่สเกลเดิม (ดังนั้น σ\sigma อยู่ในหน่วยดอลลาร์ถ้า xx อยู่ในหน่วยดอลลาร์ ไม่ใช่ดอลลาร์²)

นี่คือเหตุผลเดียวกับที่การเรียนรู้ของเครื่องใช้ กำลังสองของการสูญเสีย (ค่าคลาดเคลื่อนกำลังสองเฉลี่ย) — การยกกำลังสองหาอนุพันธ์ได้ เข้ากันได้ดีกับแคลคูลัส และตัวประมาณค่าที่ได้มักเหมาะสมที่สุด

ประชากร vs ตัวอย่าง — เรื่อง n1n-1 vs nn

มีสองสูตร และความแตกต่างนั้นสำคัญ:

  • ประชากร (คุณมีข้อมูลทั้งหมด): หารด้วย NN สัญลักษณ์ σ\sigma
  • ตัวอย่าง (คุณมีตัวอย่าง ต้องการประมาณค่าประชากร): หารด้วย n1n - 1 สัญลักษณ์ ss

n1n - 1 ในสูตรตัวอย่างคือการแก้ไขของเบสเซล (Bessel's correction) ทำไม? การใช้ nn จะประเมินต่ำส่วนเบี่ยงเบนมาตรฐานของประชากรอย่างเป็นระบบ เพราะคุณใช้ค่าเฉลี่ยตัวอย่าง (ซึ่งโดยโครงสร้างเป็นค่าที่พอดีที่สุดสำหรับตัวอย่าง) ทำให้ส่วนเบี่ยงเบนเล็กกว่าที่ควรจะเป็นเมื่อเทียบกับค่าเฉลี่ยประชากรจริง การหารด้วย n1n - 1 แทน nn ชดเชยสิ่งนั้นได้พอดี

เครื่องคิดเลขและซอฟต์แวร์ส่วนใหญ่ตั้งค่าเริ่มต้นเป็นสูตรตัวอย่าง ใส่ใจให้ดี

ตัวอย่างที่แก้แล้ว 1: ชุดข้อมูลสมมาตรขนาดเล็ก

ข้อมูล: {2,4,4,4,5,5,7,9}\{2, 4, 4, 4, 5, 5, 7, 9\} (8 ค่า; ตัวอย่างคลาสสิกในตำราเรียน)

  1. ค่าเฉลี่ย: xˉ=2+4+4+4+5+5+7+98=5\bar{x} = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5
  2. ส่วนเบี่ยงเบนจากค่าเฉลี่ย: 3,1,1,1,0,0,2,4-3, -1, -1, -1, 0, 0, 2, 4
  3. ส่วนเบี่ยงเบนยกกำลังสอง: 9,1,1,1,0,0,4,169, 1, 1, 1, 0, 0, 4, 16
  4. ผลรวม: 3232
  5. ประชากร (N=8N = 8): ความแปรปรวน =32/8=4= 32/8 = 4, σ=2\sigma = 2
  6. ตัวอย่าง (n1=7n - 1 = 7): ความแปรปรวน =32/74.57= 32/7 \approx 4.57, s2.14s \approx 2.14

กฎ 68-95-99.7 (เฉพาะการแจกแจงปกติเท่านั้น)

ถ้าข้อมูลของคุณเป็นปกติโดยประมาณ (รูประฆัง):

  • 68%\approx 68\% ของค่าตกอยู่ภายใน 1σ1\sigma จากค่าเฉลี่ย
  • 95%\approx 95\% ภายใน 2σ2\sigma
  • 99.7%\approx 99.7\% ภายใน 3σ3\sigma

นี่คือเหตุผลที่ "±2σ\pm 2\sigma" หรือ "สองซิกมา" เป็นนิยามแบบลำลองเริ่มต้นของ "ผิดปกติในเชิงสถิติ"

⚠️ คำเตือน: กฎนี้ใช้ได้กับการแจกแจงปกติเท่านั้น สำหรับข้อมูลที่เบ้หรือมีหางหนา (รายได้ เวลาตอบสนอง) 1σ1\sigma อาจครอบคลุม 80% ของข้อมูล — หรือ 50% ตรวจสอบรูปร่างการแจกแจงเสมอ (ฮิสโตแกรม กราฟ QQ) ก่อนอ้างตัวเลข 68-95-99.7

ส่วนเบี่ยงเบนมาตรฐาน vs ความแปรปรวน

ความแปรปรวนก็คือ σ2\sigma^2 ทั้งคู่มีข้อมูลเหมือนกัน แล้วทำไมต้องมีทั้งสอง?

  • ส่วนเบี่ยงเบนมาตรฐาน มีหน่วยเดียวกับข้อมูล — ตีความได้
  • ความแปรปรวน แยกส่วนแบบบวกได้สำหรับตัวแปรอิสระ (Var(X+Y)=Var(X)+Var(Y)\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) เมื่ออิสระ) ทำให้มันเป็นปริมาณที่สะดวกในเชิงพีชคณิตสำหรับการพิสูจน์ ค่าคาดหมาย และ ANOVA

ใช้ σ\sigma เมื่อรายงาน; ใช้ σ2\sigma^2 เมื่อทำการคำนวณ

ข้อผิดพลาดที่พบบ่อย

  1. อ้าง σ\sigma โดยไม่มีบริบท "σ=5\sigma = 5" ไม่มีความหมายถ้าคุณไม่รู้ค่าเฉลี่ย จับคู่เสมอ: "ค่าเฉลี่ย =100= 100, σ=5\sigma = 5"
  2. ปนสูตรประชากรและตัวอย่าง กับตัวอย่างขนาดเล็กมันสร้างความแตกต่างจริง กับตัวอย่างขนาดใหญ่ (n>100n > 100) ความแตกต่างเล็กน้อยจนละเลยได้
  3. ลืมความไวต่อค่าผิดปกติ ค่าสุดขั้วเพียงค่าเดียวอาจทำให้ σ\sigma พองโต สำหรับข้อมูลหางหนา ให้รายงานส่วนเบี่ยงเบนสัมบูรณ์มัธยฐาน (MAD) ด้วยเพื่อความทนทาน
  4. ใช้ 68-95-99.7 กับข้อมูลที่ไม่ปกติ ดูด้านบน

ลองด้วยตัวคุณเอง

ใส่ชุดข้อมูลใดๆ ลงในเครื่องคำนวณส่วนเบี่ยงเบนมาตรฐานฟรี ของเรา — เลือกประชากรหรือตัวอย่าง ดูการคำนวณทีละขั้นตอน และตรวจสอบกับคู่มือนี้

เนื้อหาที่เกี่ยวข้อง:

AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

A small team of engineers, mathematicians, and educators behind AI-Math, focused on making step-by-step math help accessible to every student.