What does standard deviation measure?

Standard deviation measures the average amount each data point deviates from the mean. A small standard deviation indicates data clustered tightly around the mean; a large one indicates the data is spread out.

What is the difference between population and sample standard deviation?

Population standard deviation (σ) divides by N (the total count), while sample standard deviation (s) divides by N−1. The N−1 correction (Bessel's correction) gives an unbiased estimate when working with a sample drawn from a larger population.

How is standard deviation related to variance?

Variance is the square of standard deviation (σ² or s²). Standard deviation is the square root of variance and is expressed in the same units as the original data, making it more interpretable in context.

AI-Math - Comprendre l'écart-type sans pleurer

L'écart-type est le concept le plus mal compris des statistiques d'introduction. Les gens savent qu'il « mesure la dispersion » mais se figent quand on leur demande ce que le nombre signifie réellement. Ce guide l'explique de trois façons — géométrique, calculatoire et intuitive — pour que la prochaine fois que vous verrez $\sigma$ dans un article ou un rapport, vous compreniez vraiment ce qui s'y trouve.

Définition en langage clair

L'écart-type répond à : en moyenne, à quelle distance chaque point de données se situe-t-il de la moyenne ?

Symboliquement, pour une population de $N$ valeurs $x_1, \ldots, x_N$ de moyenne $\mu$ :

$\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^N (x_i - \mu)^2}$

À lire à voix haute : « écart quadratique moyen, puis racine carrée ».

Pourquoi élever au carré, puis prendre la racine carrée ?

Une première tentative raisonnable pour « la distance moyenne à la moyenne » pourrait être $\frac{1}{N}\sum |x_i - \mu|$ — l'écart absolu moyen. Cela fonctionne, et les statisticiens l'utilisent parfois (il est plus robuste face aux valeurs aberrantes).

Mais la valeur absolue est mathématiquement malcommode — elle n'est pas dérivable en zéro, les dérivées explosent, et on ne peut pas faire d'analyse proprement avec elle. Élever au carré contourne tout cela, et la racine carrée à la fin ramène les unités à l'échelle d'origine (donc $\sigma$ est en dollars si $x$ est en dollars, et non en dollars²).

C'est la même raison pour laquelle l'apprentissage automatique utilise la perte quadratique (erreur quadratique moyenne) — élever au carré est dérivable, se marie bien avec l'analyse, et les estimateurs qui en résultent sont souvent optimaux.

Population vs échantillon — l'histoire du $n-1$ vs $n$

Deux formules existent, et la différence compte :

Population (vous avez toutes les données) : divisez par $N$ . Symbole $\sigma$ .
Échantillon (vous avez un échantillon et voulez estimer la population) : divisez par $n - 1$ . Symbole $s$ .

Le $n - 1$ de la formule d'échantillon est la correction de Bessel. Pourquoi ? Utiliser $n$ sous-estimerait systématiquement l'écart-type de la population, parce que vous avez utilisé la moyenne de l'échantillon (qui est par construction le meilleur ajustement pour l'échantillon), comprimant les écarts pour qu'ils soient plus petits qu'ils ne le seraient par rapport à la vraie moyenne de la population. Diviser par $n - 1$ au lieu de $n$ compense exactement cela.

La plupart des calculatrices et logiciels utilisent par défaut la formule d'échantillon. Soyez attentif.

Exemple résolu 1 : petit jeu de données symétrique

Données : $\{2, 4, 4, 4, 5, 5, 7, 9\}$ . (8 valeurs ; exemple classique de manuel.)

Moyenne : $\bar{x} = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5$ .
Écarts à la moyenne : $-3, -1, -1, -1, 0, 0, 2, 4$ .
Écarts au carré : $9, 1, 1, 1, 0, 0, 4, 16$ .
Somme : $32$ .
Population ( $N = 8$ ) : variance $= 32/8 = 4$ , $\sigma = 2$ .
Échantillon ( $n - 1 = 7$ ) : variance $= 32/7 \approx 4.57$ , $s \approx 2.14$ .

La règle 68-95-99,7 (uniquement pour les distributions normales)

Si vos données sont approximativement normales (en forme de cloche) :

$\approx 68\%$ des valeurs tombent à moins de $1\sigma$ de la moyenne.
$\approx 95\%$ à moins de $2\sigma$ .
$\approx 99.7\%$ à moins de $3\sigma$ .

C'est pourquoi « $\pm 2\sigma$ » ou « deux sigmas » est la définition informelle par défaut de « statistiquement inhabituel ».

⚠️ Attention : cette règle ne s'applique qu'aux distributions normales. Pour des données asymétriques ou à queues lourdes (revenu, temps de réponse), $1\sigma$ pourrait couvrir 80 % des données — ou 50 %. Vérifiez toujours la forme de la distribution (histogramme, diagramme QQ) avant de citer les chiffres 68-95-99,7.

Écart-type vs variance

La variance n'est que $\sigma^2$ . Ils contiennent une information identique, alors pourquoi avoir les deux ?

L'écart-type a les mêmes unités que les données — interprétable.
La variance se décompose de manière additive pour des variables indépendantes ( $\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y)$ lorsqu'elles sont indépendantes), ce qui en fait la quantité algébriquement commode pour les démonstrations, les espérances et l'ANOVA.

Utilisez $\sigma$ pour communiquer ; utilisez $\sigma^2$ pour les calculs.

Erreurs courantes

Citer $\sigma$ sans contexte. « $\sigma = 5$ » ne signifie rien si vous ne connaissez pas la moyenne. Indiquez toujours les deux : « moyenne $= 100$ , $\sigma = 5$ ».
Mélanger les formules de population et d'échantillon. Avec de petits échantillons, cela fait une réelle différence. Avec de grands échantillons ( $n > 100$ ), la différence est négligeable.
Oublier la sensibilité aux valeurs aberrantes. Une seule valeur extrême peut faire gonfler $\sigma$ . Pour des données à queues lourdes, indiquez aussi l'écart absolu médian (MAD) pour la robustesse.
Appliquer 68-95-99,7 à des données non normales. Voir ci-dessus.

Essayez vous-même

Déposez n'importe quel jeu de données dans notre Calculatrice d'écart-type gratuite — choisissez population ou échantillon, voyez le calcul étape par étape, et vérifiez-le par rapport à ce guide.

Documentation connexe :

Comprendre l'écart-type sans pleurer

L'écart-type en langage clair : ce qu'il mesure vraiment, la différence entre population et échantillon, la règle 68-95-99,7 et trois exemples résolus que vous pouvez vérifier.

Définition en langage clair

Pourquoi élever au carré, puis prendre la racine carrée ?

Population vs échantillon — l'histoire du $n-1$ vs $n$

Exemple résolu 1 : petit jeu de données symétrique

La règle 68-95-99,7 (uniquement pour les distributions normales)

Écart-type vs variance

Erreurs courantes

Essayez vous-même

Frequently Asked Questions

What does standard deviation measure?

What is the difference between population and sample standard deviation?

How is standard deviation related to variance?

Comprendre l'écart-type sans pleurer

L'écart-type en langage clair : ce qu'il mesure vraiment, la différence entre population et échantillon, la règle 68-95-99,7 et trois exemples résolus que vous pouvez vérifier.

Définition en langage clair

Pourquoi élever au carré, puis prendre la racine carrée ?

Population vs échantillon — l'histoire du n−1n-1n−1 vs nnn

Exemple résolu 1 : petit jeu de données symétrique

La règle 68-95-99,7 (uniquement pour les distributions normales)

Écart-type vs variance

Erreurs courantes

Essayez vous-même

Frequently Asked Questions

What does standard deviation measure?

What does standard deviation measure?

What is the difference between population and sample standard deviation?

What is the difference between population and sample standard deviation?

How is standard deviation related to variance?

How is standard deviation related to variance?

Population vs échantillon — l'histoire du $n-1$ vs $n$