statistics

标准差

标准差衡量数据集围绕其平均值的分散程度。标准差小表示数值紧密聚集;标准差大表示数值分散。

对于含 NN 个值 x1,,xNx_1, \ldots, x_N、平均值为 μ\mu 的总体,总体标准差 σ\sigma

σ=1Ni=1N(xiμ)2.\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2}.

对于含 nn 个值、样本均值为 xˉ\bar{x} 的样本,改除以 n1n - 1 而非 nn——这是贝塞尔校正,是总体方差的无偏估计量。

标准差与原始数据单位相同(不同于方差的平方单位),因此可直接解读。它是正态分布的天然“尺子”:约 68% 的值落在平均值一个标准差内,95% 落在两个标准差内,99.7% 落在三个标准差内。