Compare

Moyenne vs médiane vs mode

La moyenne, la médiane et le mode sont trois manières différentes de résumer "le milieu" d'un ensemble de données. En choisir le mauvais peut rendre votre analyse extrêmement trompeuse.

Moyenne (moyenne arithmétique)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

La moyenne utilise chaque point de données, ce qui est sa force et sa faiblesse. Force : minimise la perte quadratique, s'accorde bien avec l'analyse, sous-tend la régression / la variance / les distributions gaussiennes. Faiblesse : une seule valeur aberrante extrême peut la tirer loin du gros des données.

Utilisez la moyenne quand les données sont à peu près symétriques et que les valeurs aberrantes sont rares ou déjà retirées.

Médiane (valeur centrale)

La médiane est l'observation du milieu après tri. Pour le revenu, le temps de réponse, la taille de fichier et d'autres distributions à queue lourde, la médiane est bien plus représentative que la moyenne — Bill Gates entrant dans un bar élève le revenu moyen mais bouge à peine la médiane.

Utilisez la médiane pour des données asymétriques, pour rapporter une valeur "typique" ou quand la robustesse importe.

Mode (valeur la plus fréquente)

Le mode est la valeur qui apparaît le plus souvent. Surtout utile pour les données catégorielles (couleur préférée, type de navigateur) où la moyenne et la médiane ne s'appliquent même pas. Pour des données numériques continues, le mode n'existe souvent dans aucun sens significatif — chaque observation est unique.

Lequel utiliser

ScénarioMeilleure mesure
Numérique symétrique sans valeurs aberrantesMoyenne
Numérique asymétrique (revenu, latence)Médiane
CatégorielMode
Rapporter une valeur "typique" à un public généralMédiane
Base pour davantage d'analyse / de statistiquesMoyenne

Si vous débutez en statistiques, intériorisez ceci : moyenne pour les maths, médiane pour les récits.

Essayez vous-même

Collez n'importe quel ensemble de données dans notre calculatrice de moyenne, médiane et mode et voyez les trois d'un coup.

At a glance

FeatureMoyenneMédiane (vs mode)
Affectée par les valeurs aberrantesFortementÀ peine
Fonctionne pour les données catégoriellesNonNon (utiliser le mode)
Sous-tend la variance / régressionOuiNon
Idéale pour les distributions asymétriquesNonOui
Verdict

Utilisez la moyenne pour des données numériques symétriques et propres ; la médiane pour les distributions asymétriques ou pour rapporter une valeur "typique" ; le mode pour les données catégorielles.