statistics

四分位数

四分位数はデータセットを 4 つの等しい部分に分ける。Q1(第 25 パーセンタイル)、Q2(中央値、第 50 パーセンタイル)、Q3(第 75 パーセンタイル)。四分位範囲 Q3−Q1 はばらつきの頑健な指標である。

四分位数は、整列したデータセットを 4 つの同じ大きさの部分に分ける。

  • Q1(第 25 パーセンタイル):4 分の 1 が下にある。
  • Q2(中央値、第 50 パーセンタイル):半分が下にある。
  • Q3(第 75 パーセンタイル):4 分の 3 が下にある。

四分位範囲(IQR) =Q3Q1= Q3 - Q1 は、ばらつきの頑健な指標である。

  • 外れ値の影響を受けにくい(σ\sigma とは異なる)。
  • データの「中央 50%」を覆う。

5 数要約min,Q1,Q2,Q3,max\min, Q1, Q2, Q3, \max)は箱ひげ図の基礎である。Q1 から Q3 までの箱に中央値の線を引き、ひげは 1.5IQR1.5 \cdot IQR 以内で最も極端な値まで伸ばし、それを超える点は外れ値として示す。

四分位数は、すべてのパーセンタイルと同様にノンパラメトリックである——分布の形について何も仮定しないため、歪んだ分布や未知の分布に対して平均・標準偏差より安全である。