statistics

Cote z (score standardisé)

Une cote z mesure de combien d'écarts-types une valeur se situe au-dessus ou en dessous de la moyenne. z = (x − μ) / σ. Sert à comparer des valeurs entre distributions et à consulter des probabilités.

Une cote z (score standardisé) est la distance d'une valeur à la moyenne exprimée en unités d'écarts-types :

z=xμσz = \frac{x - \mu}{\sigma}

(utiliser xˉ\bar{x} et ss pour des données d'échantillon).

Une cote z de +2+2 signifie « deux écarts-types au-dessus de la moyenne » ; 1.5-1.5 signifie « 1,5 en dessous ».

Les cotes z permettent de :

  • Comparer des valeurs issues de distributions différentes — un élève obtenant 80 au test A (μ=70,σ=5\mu=70, \sigma=5) est plus remarquable (z=2) qu'un 80 au test B (μ=75,σ=10\mu=75, \sigma=10, z=0,5).
  • Consulter des probabilités dans une table de la loi normale centrée réduite — P(Z<1.96Z < 1.96) ≈ 0,975, base de l'IC à 95 %.
  • Repérer les valeurs aberrantes — par convention, z>3|z| > 3 signale une observation inhabituelle dans des données approximativement normales.

La standardisation (calcul de la cote z) est aussi une étape fondamentale de prétraitement en apprentissage automatique : ramener les entrées à une moyenne de 0 et un écart-type de 1 aide la descente de gradient à converger et empêche que des variables aux unités plus grandes (p. ex. un revenu en dollars contre un âge en années) ne dominent les modèles fondés sur la distance.