statistics

Comprendre l'écart-type sans pleurer

L'écart-type en langage clair : ce qu'il mesure vraiment, la différence entre population et échantillon, la règle 68-95-99,7 et trois exemples résolus que vous pouvez vérifier.
AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

L'écart-type est le concept le plus mal compris des statistiques d'introduction. Les gens savent qu'il « mesure la dispersion » mais se figent quand on leur demande ce que le nombre signifie réellement. Ce guide l'explique de trois façons — géométrique, calculatoire et intuitive — pour que la prochaine fois que vous verrez σ\sigma dans un article ou un rapport, vous compreniez vraiment ce qui s'y trouve.

Définition en langage clair

L'écart-type répond à : en moyenne, à quelle distance chaque point de données se situe-t-il de la moyenne ?

Symboliquement, pour une population de NN valeurs x1,,xNx_1, \ldots, x_N de moyenne μ\mu :

σ=1Ni=1N(xiμ)2\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^N (x_i - \mu)^2}

À lire à voix haute : « écart quadratique moyen, puis racine carrée ».

Pourquoi élever au carré, puis prendre la racine carrée ?

Une première tentative raisonnable pour « la distance moyenne à la moyenne » pourrait être 1Nxiμ\frac{1}{N}\sum |x_i - \mu| — l'écart absolu moyen. Cela fonctionne, et les statisticiens l'utilisent parfois (il est plus robuste face aux valeurs aberrantes).

Mais la valeur absolue est mathématiquement malcommode — elle n'est pas dérivable en zéro, les dérivées explosent, et on ne peut pas faire d'analyse proprement avec elle. Élever au carré contourne tout cela, et la racine carrée à la fin ramène les unités à l'échelle d'origine (donc σ\sigma est en dollars si xx est en dollars, et non en dollars²).

C'est la même raison pour laquelle l'apprentissage automatique utilise la perte quadratique (erreur quadratique moyenne) — élever au carré est dérivable, se marie bien avec l'analyse, et les estimateurs qui en résultent sont souvent optimaux.

Population vs échantillon — l'histoire du n1n-1 vs nn

Deux formules existent, et la différence compte :

  • Population (vous avez toutes les données) : divisez par NN. Symbole σ\sigma.
  • Échantillon (vous avez un échantillon et voulez estimer la population) : divisez par n1n - 1. Symbole ss.

Le n1n - 1 de la formule d'échantillon est la correction de Bessel. Pourquoi ? Utiliser nn sous-estimerait systématiquement l'écart-type de la population, parce que vous avez utilisé la moyenne de l'échantillon (qui est par construction le meilleur ajustement pour l'échantillon), comprimant les écarts pour qu'ils soient plus petits qu'ils ne le seraient par rapport à la vraie moyenne de la population. Diviser par n1n - 1 au lieu de nn compense exactement cela.

La plupart des calculatrices et logiciels utilisent par défaut la formule d'échantillon. Soyez attentif.

Exemple résolu 1 : petit jeu de données symétrique

Données : {2,4,4,4,5,5,7,9}\{2, 4, 4, 4, 5, 5, 7, 9\}. (8 valeurs ; exemple classique de manuel.)

  1. Moyenne : xˉ=2+4+4+4+5+5+7+98=5\bar{x} = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.
  2. Écarts à la moyenne : 3,1,1,1,0,0,2,4-3, -1, -1, -1, 0, 0, 2, 4.
  3. Écarts au carré : 9,1,1,1,0,0,4,169, 1, 1, 1, 0, 0, 4, 16.
  4. Somme : 3232.
  5. Population (N=8N = 8) : variance =32/8=4= 32/8 = 4, σ=2\sigma = 2.
  6. Échantillon (n1=7n - 1 = 7) : variance =32/74.57= 32/7 \approx 4.57, s2.14s \approx 2.14.

La règle 68-95-99,7 (uniquement pour les distributions normales)

Si vos données sont approximativement normales (en forme de cloche) :

  • 68%\approx 68\% des valeurs tombent à moins de 1σ1\sigma de la moyenne.
  • 95%\approx 95\% à moins de 2σ2\sigma.
  • 99.7%\approx 99.7\% à moins de 3σ3\sigma.

C'est pourquoi « ±2σ\pm 2\sigma » ou « deux sigmas » est la définition informelle par défaut de « statistiquement inhabituel ».

⚠️ Attention : cette règle ne s'applique qu'aux distributions normales. Pour des données asymétriques ou à queues lourdes (revenu, temps de réponse), 1σ1\sigma pourrait couvrir 80 % des données — ou 50 %. Vérifiez toujours la forme de la distribution (histogramme, diagramme QQ) avant de citer les chiffres 68-95-99,7.

Écart-type vs variance

La variance n'est que σ2\sigma^2. Ils contiennent une information identique, alors pourquoi avoir les deux ?

  • L'écart-type a les mêmes unités que les données — interprétable.
  • La variance se décompose de manière additive pour des variables indépendantes (Var(X+Y)=Var(X)+Var(Y)\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) lorsqu'elles sont indépendantes), ce qui en fait la quantité algébriquement commode pour les démonstrations, les espérances et l'ANOVA.

Utilisez σ\sigma pour communiquer ; utilisez σ2\sigma^2 pour les calculs.

Erreurs courantes

  1. Citer σ\sigma sans contexte. « σ=5\sigma = 5 » ne signifie rien si vous ne connaissez pas la moyenne. Indiquez toujours les deux : « moyenne =100= 100, σ=5\sigma = 5 ».
  2. Mélanger les formules de population et d'échantillon. Avec de petits échantillons, cela fait une réelle différence. Avec de grands échantillons (n>100n > 100), la différence est négligeable.
  3. Oublier la sensibilité aux valeurs aberrantes. Une seule valeur extrême peut faire gonfler σ\sigma. Pour des données à queues lourdes, indiquez aussi l'écart absolu médian (MAD) pour la robustesse.
  4. Appliquer 68-95-99,7 à des données non normales. Voir ci-dessus.

Essayez vous-même

Déposez n'importe quel jeu de données dans notre Calculatrice d'écart-type gratuite — choisissez population ou échantillon, voyez le calcul étape par étape, et vérifiez-le par rapport à ce guide.

Documentation connexe :

AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

A small team of engineers, mathematicians, and educators behind AI-Math, focused on making step-by-step math help accessible to every student.