第 k パーセンタイル は、データセットの観測値のうち がそれより下に位置する値である。よく使うパーセンタイル:
- 第 25 パーセンタイル(Q1):下側四分位数。
- 第 50 パーセンタイル(Q2):中央値。
- 第 75 パーセンタイル(Q3):上側四分位数。
- 第 90、95、99 パーセンタイル:裾——極値に用いる。
四分位範囲(IQR) = 。ばらつきの頑健な尺度であり(標準偏差と違って外れ値に影響されにくい)。
計算:データを並べ替え、順位 を計算し、 番目の観測値をとる(整数の順位の間は補間する)。わずかに異なる複数の定義が存在する——Excel、R、NumPy はそれぞれ異なる規約を用いる。
応用:標準化テストの得点、小児の成長曲線、工学における P99 レイテンシ、箱ひげ図。パーセンタイルはノンパラメトリックである——分布の形について何も仮定しない。