statistics

Moyenne

La moyenne — aussi appelée moyenne arithmétique — est la somme d’un ensemble de valeurs divisée par le nombre de valeurs. C’est le résumé en un seul nombre le plus courant d’un jeu de données.

La moyenne arithmétique de x1,x2,,xnx_1, x_2, \ldots, x_n est

xˉ=1ni=1nxi.\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i.

C’est la valeur qui minimise la somme des écarts au carré (xic)2\sum (x_i - c)^2 — voilà pourquoi la perte quadratique est partout en statistique et en apprentissage automatique : minimiser la perte quadratique revient à estimer des moyennes.

La moyenne est sensible aux valeurs aberrantes : une seule valeur extrême peut éloigner la moyenne de l’endroit où se trouve la plupart des données. Lorsque les données sont asymétriques (revenu, temps de réponse, taille de fichier), la médiane est souvent un meilleur résumé. D’autres moyennes — géométrique, harmonique, pondérée — s’appliquent dans des contextes précis (croissance composée, résistances en parallèle, sondages pondérés).