statistics

四分位數

四分位數將資料集分成四等份。Q1(第 25 百分位數)、Q2(中位數,第 50 百分位數)、Q3(第 75 百分位數)。四分位距 Q3−Q1 是穩健的離散度量。

四分位數將排序後的資料集分成四個大小相等的部分:

  • Q1(第 25 百分位數):四分之一的資料低於它。
  • Q2(中位數,第 50 百分位數):一半的資料低於它。
  • Q3(第 75 百分位數):四分之三的資料低於它。

四分位距(IQR) =Q3Q1= Q3 - Q1,是一種穩健的離散度量:

  • 對離群值不敏感(不同於 σ\sigma)。
  • 涵蓋資料的「中間 50%」。

五數摘要min,Q1,Q2,Q3,max\min, Q1, Q2, Q3, \max)是盒鬚圖的基礎:箱體由 Q1 到 Q3 並標出中位數線,鬚線延伸至 1.5IQR1.5 \cdot IQR 範圍內最極端的值,超出者標記為離群值。

四分位數與所有百分位數一樣屬於無母數方法——不對分布形狀作任何假設,因此對偏態或未知分布而言,比平均數/標準差更為穩妥。