statistics

平均数(均值)

平均数——又称算术平均——是一组数值的总和除以数值的个数。它是数据集最常用的单一数值摘要。

x1,x2,,xnx_1, x_2, \ldots, x_n算术平均

xˉ=1ni=1nxi.\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i.

它是使平方偏差之和 (xic)2\sum (x_i - c)^2 最小的值——这就是为何平方损失在统计与机器学习中无处不在:最小化平方损失即是在估计平均数。

平均数对离群值敏感:单一极端值就能把平均数拉离大多数数据所在之处。当数据偏斜(收入、响应时间、文件大小)时,中位数通常是更佳的摘要。其他平均——几何平均、调和平均、加权平均——适用于特定情境(复利增长、并联电阻、加权民调)。