statistics

百分位數

第 k 百分位數是有 k% 的觀測值落在其以下的數值。第 50 百分位數即中位數;第 25 與第 75 百分位數即四分位數。

第 k 百分位數 PkP_k 是資料集中有 k%k\% 觀測值落在其以下的數值。常見的百分位數:

  • 第 25 百分位數(Q1):下四分位數。
  • 第 50 百分位數(Q2):中位數。
  • 第 75 百分位數(Q3):上四分位數。
  • 第 90、95、99 百分位數:尾部——用於極端值。

四分位距(IQR) = Q3Q1Q3 - Q1,是一個穩健的離散程度量數(與標準差不同,不受離群值影響)。

計算方式:將資料排序,計算名次 r=(k/100)(n+1)r = (k/100)(n+1),取第 rr 個觀測值(整數名次之間以內插法處理)。存在多種略有差異的定義——Excel、R、NumPy 採用不同的慣例。

應用:標準化測驗分數、兒科生長曲線、工程上的 P99 延遲、盒鬚圖。百分位數是無母數的——對分布形狀不作任何假設。