statistics

Médiane

La médiane est la valeur centrale d'un jeu de données trié. Pour un effectif pair, elle est la moyenne des deux valeurs centrales. Elle est robuste aux valeurs aberrantes.

La médiane est la valeur centrale d'un jeu de données ordonné. Avec nn valeurs triées par ordre croissant :

  • Si nn est impair, la médiane est la (n+12)\left(\frac{n+1}{2}\right)-ième valeur.
  • Si nn est pair, la médiane est la moyenne de la n2\frac{n}{2}-ième et de la (n2+1)\left(\frac{n}{2}+1\right)-ième valeur.

La médiane est la plus robuste des mesures de tendance centrale usuelles. Alors que la moyenne se déplace radicalement sous l'effet d'une seule valeur aberrante extrême, la médiane n'en est pas affectée. C'est pourquoi les économistes rapportent le revenu médian des ménages plutôt que la moyenne — si Bezos s'installait dans un pâté de maisons, le revenu moyen grimperait à des millions, tandis que la médiane resterait inchangée.

Utilisez la médiane pour les distributions asymétriques (revenu, temps de réponse, taille de fichier). Utilisez la moyenne lorsque les données sont à peu près symétriques et que les valeurs aberrantes sont rares. La médiane est aussi la valeur qui minimise la somme des écarts absolus xic\sum |x_i - c|, en parallèle avec la minimisation des écarts quadratiques opérée par la moyenne.