Une cote z (score standardisé) est la distance d'une valeur à la moyenne exprimée en unités d'écarts-types :
(utiliser et pour des données d'échantillon).
Une cote z de signifie « deux écarts-types au-dessus de la moyenne » ; signifie « 1,5 en dessous ».
Les cotes z permettent de :
- Comparer des valeurs issues de distributions différentes — un élève obtenant 80 au test A () est plus remarquable (z=2) qu'un 80 au test B (, z=0,5).
- Consulter des probabilités dans une table de la loi normale centrée réduite — P() ≈ 0,975, base de l'IC à 95 %.
- Repérer les valeurs aberrantes — par convention, signale une observation inhabituelle dans des données approximativement normales.
La standardisation (calcul de la cote z) est aussi une étape fondamentale de prétraitement en apprentissage automatique : ramener les entrées à une moyenne de 0 et un écart-type de 1 aide la descente de gradient à converger et empêche que des variables aux unités plus grandes (p. ex. un revenu en dollars contre un âge en années) ne dominent les modèles fondés sur la distance.