statistics

표준편차

표준편차는 데이터 집합이 평균을 중심으로 얼마나 흩어져 있는지를 측정한다. 표준편차가 작으면 값들이 모여 있고, 크면 흩어져 있다.

평균 μ\mu 를 갖는 NN 개의 값 x1,,xNx_1, \ldots, x_N 으로 이루어진 모집단에 대해, 모표준편차 σ\sigma

σ=1Ni=1N(xiμ)2.\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2}.

표본평균 xˉ\bar{x} 를 갖는 nn 개의 표본에서는 nn 대신 n1n - 1 로 나눈다 — 베셀 보정으로, 모분산의 불편 추정량이다.

표준편차는 원자료와 같은 단위를 가지므로(분산은 제곱 단위) 직접 해석할 수 있다. 이는 정규분포의 자연스러운 "자"이다: 값의 약 68%가 평균에서 1표준편차 이내, 95%가 2표준편차 이내, 99.7%가 3표준편차 이내에 들어온다.