statistics

Centile

Le k-ième centile est la valeur en dessous de laquelle se situent k % des observations. Le 50e centile est la médiane ; les 25e et 75e sont les quartiles.

Le k-ième centile PkP_k est la valeur en dessous de laquelle se situent k%k\% des observations d'un jeu de données. Centiles courants :

  • 25e centile (Q1) : quartile inférieur.
  • 50e centile (Q2) : médiane.
  • 75e centile (Q3) : quartile supérieur.
  • 90e, 95e, 99e : queues — utilisés pour les valeurs extrêmes.

Écart interquartile (IQR) = Q3Q1Q3 - Q1, une mesure robuste de dispersion (insensible aux valeurs aberrantes, contrairement à l'écart-type).

Calcul : on trie les données, on calcule le rang r=(k/100)(n+1)r = (k/100)(n+1), puis on prend la rr-ième observation (en interpolant entre les rangs entiers). Il existe plusieurs définitions légèrement différentes — Excel, R et NumPy utilisent des conventions distinctes.

Applications : notes de tests standardisés, courbes de croissance pédiatriques, latence P99 en ingénierie, boîtes à moustaches. Les centiles sont non paramétriques — ils ne font aucune hypothèse sur la forme de la distribution.