statistics

信頼区間

信頼区間は母集団のパラメータについて妥当な値の範囲を与える。明示された信頼水準(例:95%)は、その手順の長期的な信頼性を表す。

信頼区間(CI)は、標本データから構成される、母集団のパラメータ(例:平均、割合)について妥当な値の範囲であり、明示された信頼水準(一般に 95%)を伴う。

σ\sigma が既知の母平均に対する 95% 信頼区間は

xˉ±1.96σn\bar{x} \pm 1.96 \cdot \frac{\sigma}{\sqrt{n}}

ここで 1.961.96 は標準正規分布の 97.5 パーセンタイル(95% に対応)である。

正しい解釈:「この標本抽出の手順を何度も繰り返して毎回 CI を作ると、それらの CI のうち約 95% が真のパラメータを含む。」これは特定の区間についてではなく、手順の長期的な信頼性についての主張である。

よくある誤解(どの統計の教師も口を酸っぱくして言う):「真の値がこの特定の区間に入る確率が 95% である。」これは誤り。パラメータは固定されており、区間のほうがランダムである。

信頼水準にはトレードオフがある:

  • 99% CI:より高い信頼度、より広い区間。
  • 90% CI:より狭く、より低い信頼度。

CI は p 値の現代的な代替手段である。統計的有意性に関する同じ情報に加えて、効果の大きさも伝える。