statistics

標準差

標準差衡量資料集圍繞其平均值的分散程度。標準差小表示數值緊密聚集;標準差大表示數值分散。

對於含 NN 個值 x1,,xNx_1, \ldots, x_N、平均值為 μ\mu 的母體,母體標準差 σ\sigma

σ=1Ni=1N(xiμ)2.\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2}.

對於含 nn 個值、樣本平均為 xˉ\bar{x} 的樣本,改除以 n1n - 1 而非 nn——這是貝索校正,是母體變異數的不偏估計量。

標準差與原始資料單位相同(不同於變異數的平方單位),因此可直接解讀。它是常態分布的天然「尺規」:約 68% 的值落在平均值一個標準差內,95% 落在兩個標準差內,99.7% 落在三個標準差內。