statistics

平均(算術平均)

平均(算術平均)とは、値の集合の総和を値の個数で割ったものである。データ集合を1つの数で要約する最も一般的な指標である。

x1,x2,,xnx_1, x_2, \ldots, x_n算術平均

xˉ=1ni=1nxi.\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i.

これは二乗偏差の和 (xic)2\sum (x_i - c)^2 を最小化する値である——だからこそ統計と機械学習のいたるところに二乗損失が現れる:二乗損失の最小化は平均の推定を意味する。

平均は外れ値に敏感である:1つの極端な値だけで、平均はデータの大半がある場所から大きく引き離されうる。データが歪んでいる場合(収入、応答時間、ファイルサイズ)は中央値のほうが良い要約となることが多い。その他の平均——幾何平均、調和平均、加重平均——は特定の文脈(複利成長、並列抵抗、加重投票)で用いられる。