Le k-ième centile est la valeur en dessous de laquelle se situent des observations d'un jeu de données. Centiles courants :
- 25e centile (Q1) : quartile inférieur.
- 50e centile (Q2) : médiane.
- 75e centile (Q3) : quartile supérieur.
- 90e, 95e, 99e : queues — utilisés pour les valeurs extrêmes.
Écart interquartile (IQR) = , une mesure robuste de dispersion (insensible aux valeurs aberrantes, contrairement à l'écart-type).
Calcul : on trie les données, on calcule le rang , puis on prend la -ième observation (en interpolant entre les rangs entiers). Il existe plusieurs définitions légèrement différentes — Excel, R et NumPy utilisent des conventions distinctes.
Applications : notes de tests standardisés, courbes de croissance pédiatriques, latence P99 en ingénierie, boîtes à moustaches. Les centiles sont non paramétriques — ils ne font aucune hypothèse sur la forme de la distribution.