statistics

方差

方差衡量数据集相对于平均值的离散程度。它是偏差平方的平均值。标准差是方差的平方根。

方差衡量数据集的数值相对于平均值的离散程度。对于含有 NN 个数值 x1,,xNx_1, \ldots, x_N、均值为 μ\mu 的总体:

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

对于含有 nn 个数值、样本均值为 xˉ\bar{x}样本,要除以 n1n - 1 而非 nn(贝塞尔校正,一个无偏估计量)。

方差小说明数值聚集在均值附近;方差大说明数值分散。方差的单位是原始数据单位的平方(若数据单位为 kg,则为 kg²)——这正是我们通常改报与数据具有相同单位的标准差 σ=σ2\sigma = \sqrt{\sigma^2} 的原因。

方差是全部推断统计的基础:置信区间、假设检验与回归都依赖于对方差的估计。机器学习中的偏差—方差权衡便是因它而得名。