statistics

パーセンタイル

第 k パーセンタイルとは、観測値の k% がそれより下に位置する値である。第 50 パーセンタイルは中央値、第 25 と第 75 は四分位数である。

第 k パーセンタイル PkP_k は、データセットの観測値のうち k%k\% がそれより下に位置する値である。よく使うパーセンタイル:

  • 第 25 パーセンタイル(Q1):下側四分位数。
  • 第 50 パーセンタイル(Q2):中央値。
  • 第 75 パーセンタイル(Q3):上側四分位数。
  • 第 90、95、99 パーセンタイル:裾——極値に用いる。

四分位範囲(IQR) = Q3Q1Q3 - Q1。ばらつきの頑健な尺度であり(標準偏差と違って外れ値に影響されにくい)。

計算:データを並べ替え、順位 r=(k/100)(n+1)r = (k/100)(n+1) を計算し、rr 番目の観測値をとる(整数の順位の間は補間する)。わずかに異なる複数の定義が存在する——Excel、R、NumPy はそれぞれ異なる規約を用いる。

応用:標準化テストの得点、小児の成長曲線、工学における P99 レイテンシ、箱ひげ図。パーセンタイルはノンパラメトリックである——分布の形について何も仮定しない。