の算術平均は
これは二乗偏差の和 を最小化する値である——だからこそ統計と機械学習のいたるところに二乗損失が現れる:二乗損失の最小化は平均の推定を意味する。
平均は外れ値に敏感である:1つの極端な値だけで、平均はデータの大半がある場所から大きく引き離されうる。データが歪んでいる場合(収入、応答時間、ファイルサイズ)は中央値のほうが良い要約となることが多い。その他の平均——幾何平均、調和平均、加重平均——は特定の文脈(複利成長、並列抵抗、加重投票)で用いられる。
の算術平均は
これは二乗偏差の和 を最小化する値である——だからこそ統計と機械学習のいたるところに二乗損失が現れる:二乗損失の最小化は平均の推定を意味する。
平均は外れ値に敏感である:1つの極端な値だけで、平均はデータの大半がある場所から大きく引き離されうる。データが歪んでいる場合(収入、応答時間、ファイルサイズ)は中央値のほうが良い要約となることが多い。その他の平均——幾何平均、調和平均、加重平均——は特定の文脈(複利成長、並列抵抗、加重投票)で用いられる。