statistics

標準偏差

標準偏差は、データ集合が平均の周りにどれだけ散らばっているかを測る。小さければ値は密集し、大きければ散らばっている。

平均 μ\mu をもつ NN 個の値 x1,,xNx_1, \ldots, x_N の母集団に対して、母標準偏差 σ\sigma

σ=1Ni=1N(xiμ)2.\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2}.

標本平均 xˉ\bar{x} をもつ nn 個の値の標本では、nn ではなく n1n - 1 で割る——ベッセル補正であり、母分散の不偏推定量となる。

標準偏差は元のデータと同じ単位をもつ(分散は平方単位)ため、直接解釈できる。これは正規分布の自然な「ものさし」である:値の約68%が平均から1標準偏差以内、95%が2標準偏差以内、99.7%が3標準偏差以内に入る。