statistics

眾數

眾數是資料集中出現最頻繁的數值。一個資料集可以有一個眾數、多個眾數或沒有眾數。對於類別型資料相當有用。

眾數是資料集中出現最多次的數值(或數個數值)。與平均數和中位數不同,眾數對於算術運算沒有意義的類別型資料(最喜歡的顏色、瀏覽器類型、血型)也能有意義地適用。

一個資料集可以是:

  • 單峰——只有一個眾數(例如 {1, 2, 2, 3, 4})
  • 雙峰——有兩個眾數(例如 {1, 1, 2, 3, 3})
  • 多峰——有兩個以上的眾數
  • 無眾數——所有數值出現次數相同(未經四捨五入的連續資料常見此情形)

對於連續分布,「眾數」推廣為機率密度函數的峰值。常態分布在其平均數處呈單峰;混合模型可能是多峰的,這表示存在不同的子母體。

眾數對離群值最為穩健(單一極端值絕不會成為眾數),但它忽略了大部分資料——對於對稱的數值資料,它是較差的集中趨勢量數,此時平均數或中位數能提供更多資訊。