La moyenne, la médiane et le mode sont trois manières différentes de résumer "le milieu" d'un ensemble de données. En choisir le mauvais peut rendre votre analyse extrêmement trompeuse.
Moyenne (moyenne arithmétique)
La moyenne utilise chaque point de données, ce qui est sa force et sa faiblesse. Force : minimise la perte quadratique, s'accorde bien avec l'analyse, sous-tend la régression / la variance / les distributions gaussiennes. Faiblesse : une seule valeur aberrante extrême peut la tirer loin du gros des données.
Utilisez la moyenne quand les données sont à peu près symétriques et que les valeurs aberrantes sont rares ou déjà retirées.
Médiane (valeur centrale)
La médiane est l'observation du milieu après tri. Pour le revenu, le temps de réponse, la taille de fichier et d'autres distributions à queue lourde, la médiane est bien plus représentative que la moyenne — Bill Gates entrant dans un bar élève le revenu moyen mais bouge à peine la médiane.
Utilisez la médiane pour des données asymétriques, pour rapporter une valeur "typique" ou quand la robustesse importe.
Mode (valeur la plus fréquente)
Le mode est la valeur qui apparaît le plus souvent. Surtout utile pour les données catégorielles (couleur préférée, type de navigateur) où la moyenne et la médiane ne s'appliquent même pas. Pour des données numériques continues, le mode n'existe souvent dans aucun sens significatif — chaque observation est unique.
Lequel utiliser
| Scénario | Meilleure mesure |
|---|---|
| Numérique symétrique sans valeurs aberrantes | Moyenne |
| Numérique asymétrique (revenu, latence) | Médiane |
| Catégoriel | Mode |
| Rapporter une valeur "typique" à un public général | Médiane |
| Base pour davantage d'analyse / de statistiques | Moyenne |
Si vous débutez en statistiques, intériorisez ceci : moyenne pour les maths, médiane pour les récits.
Essayez vous-même
Collez n'importe quel ensemble de données dans notre calculatrice de moyenne, médiane et mode et voyez les trois d'un coup.
At a glance
| Feature | Moyenne | Médiane (vs mode) |
|---|---|---|
| Affectée par les valeurs aberrantes | Fortement | À peine |
| Fonctionne pour les données catégorielles | Non | Non (utiliser le mode) |
| Sous-tend la variance / régression | Oui | Non |
| Idéale pour les distributions asymétriques | Non | Oui |
Utilisez la moyenne pour des données numériques symétriques et propres ; la médiane pour les distributions asymétriques ou pour rapporter une valeur "typique" ; le mode pour les données catégorielles.