statistics

ความแปรปรวน

ความแปรปรวนวัดการกระจายตัวของชุดข้อมูลรอบค่าเฉลี่ย คือค่าเฉลี่ยของผลต่างกำลังสอง ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน

ความแปรปรวน วัดว่าค่าในชุดข้อมูลกระจายห่างจากค่าเฉลี่ยแค่ไหน สำหรับประชากรที่มีค่า NN ค่า x1,,xNx_1, \ldots, x_N ที่มีค่าเฉลี่ย μ\mu:

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

สำหรับตัวอย่างที่มี nn ค่าและค่าเฉลี่ยตัวอย่าง xˉ\bar{x} ให้หารด้วย n1n - 1 แทน nn (การแก้ไขของเบสเซล ซึ่งเป็นตัวประมาณค่าที่ไม่มีอคติ)

ความแปรปรวนน้อยหมายความว่าค่าต่าง ๆ กระจุกตัวอยู่ใกล้ค่าเฉลี่ย ส่วนความแปรปรวนมากหมายความว่าค่าเหล่านั้นกระจัดกระจาย ความแปรปรวนมีหน่วยเป็นกำลังสองของหน่วยของข้อมูลเดิม (เช่น kg² ถ้าข้อมูลเป็น kg) — นั่นคือเหตุผลที่เรามักรายงานส่วนเบี่ยงเบนมาตรฐาน σ=σ2\sigma = \sqrt{\sigma^2} ซึ่งมีหน่วยเดียวกับข้อมูล

ความแปรปรวนเป็นพื้นฐานของสถิติเชิงอนุมานทั้งหมด: ช่วงความเชื่อมั่น การทดสอบสมมติฐาน และการถดถอยล้วนขึ้นอยู่กับการประมาณความแปรปรวน การแลกเปลี่ยนระหว่างอคติและความแปรปรวน ในการเรียนรู้ของเครื่องได้รับการตั้งชื่อตามความแปรปรวนนี้