描述性統計
平均數(母體)
母體所有取值的平均。
平均數(樣本)
樣本的平均。
變異數(母體)
離散程度的平方,除以 N。
變異數(樣本)
貝塞爾校正:除以 。
標準差
變異數的平方根——與資料單位相同。
全距
最簡單的離散度量。
機率法則
加法法則
A 或 B 的機率(排容原理)。
乘法法則
A 且 B 的機率;獨立時簡化為乘積。
條件機率
在 A 發生的條件下 B 的機率。
貝氏定理
反轉條件機率——診斷檢測、機器學習。
獨立性
當且僅當 與 獨立時成立。
計數
排列
順序重要:從 個中排 個。
組合
順序無關:從 個中選 個。
離散分布
二項分布 PMF
次獨立試驗中 次成功,單次成功機率為 。
二項分布平均數
期望的成功次數。
二項分布變異數
二項分布的離散程度。
卜瓦松分布 PMF
稀有事件計數,平均速率為 。
常態分布
機率密度函數
鐘形曲線,平均數 ,標準差 。
Z 分數
標準化以便跨分布比較。
標準常態
Z 分數變換之後。
68-95-99.7 法則
對於 ——僅對常態資料有效。
推論統計
平均數標準誤
作為估計量的 的標準差。
信賴區間(平均數,已知 $\sigma$)
95% 信賴區間時 。
t 統計量(單樣本)
當 未知時檢定平均數 = 。
卡方統計量
分類資料的適合度 / 獨立性檢定。
線性迴歸
斜率
最佳擬合斜率(最小平方)。
截距
使迴歸線經過 。
皮爾森相關係數
線性關係的強度與方向,。
決定係數
的變異數中由 解釋的比例。