變異數衡量資料集的數值相對於平均數的離散程度。對於含有 個數值 、平均數為 的母體:
對於含有 個數值、樣本平均數為 的樣本,要除以 而非 (貝索校正,一個不偏估計量)。
變異數小代表數值聚集在平均數附近;變異數大代表數值分散。變異數的單位是原始資料單位的平方(若資料單位為 kg,則為 kg²)——這正是我們通常改報標準差 的原因,因為它與資料具有相同的單位。
變異數是所有推論統計的基礎:信賴區間、假設檢定與迴歸全都仰賴對變異數的估計。機器學習中的偏差─變異數權衡便是因它而得名。
變異數衡量資料集的數值相對於平均數的離散程度。對於含有 個數值 、平均數為 的母體:
對於含有 個數值、樣本平均數為 的樣本,要除以 而非 (貝索校正,一個不偏估計量)。
變異數小代表數值聚集在平均數附近;變異數大代表數值分散。變異數的單位是原始資料單位的平方(若資料單位為 kg,則為 kg²)——這正是我們通常改報標準差 的原因,因為它與資料具有相同的單位。
變異數是所有推論統計的基礎:信賴區間、假設檢定與迴歸全都仰賴對變異數的估計。機器學習中的偏差─變異數權衡便是因它而得名。