statistics

平均數

平均數——又稱算術平均——是一組數值的總和除以數值的個數。它是資料集最常用的單一數值摘要。

x1,x2,,xnx_1, x_2, \ldots, x_n算術平均

xˉ=1ni=1nxi.\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i.

它是使平方偏差之和 (xic)2\sum (x_i - c)^2 最小的值——這就是為何平方損失在統計與機器學習中無所不在:最小化平方損失即是在估計平均數。

平均數對離群值敏感:單一極端值就能把平均數拉離大多數資料所在之處。當資料偏斜(收入、回應時間、檔案大小)時,中位數通常是更佳的摘要。其他平均——幾何平均、調和平均、加權平均——適用於特定情境(複利成長、並聯電阻、加權民調)。