中央値は、順序付けられたデータセットの真ん中の値である。 個のデータを昇順に並べたとき:
- が奇数なら、中央値は 番目の値である。
- が偶数なら、中央値は 番目と 番目の値の平均である。
中央値は標準的な代表値の中で最も頑健である。平均値は1つの極端な外れ値で大きく動くが、中央値は影響を受けない。だからこそ経済学者は平均ではなく中央値の世帯所得を報告する——ベゾスが街の一区画に現れれば平均所得は何百万にもなるが、中央値は変わらない。
歪んだ分布(所得、応答時間、ファイルサイズ)には中央値を使う。データがほぼ対称で外れ値がまれな場合は平均を使う。中央値は絶対偏差の和 を最小にする値でもあり、平均が二乗偏差を最小にすることと対応している。