statistics

カイ二乗(χ²)検定

カイ二乗検定はカテゴリデータにおいて観測度数と期待度数を比較する。χ² = Σ(O−E)²/E。適合度検定や独立性の検定に用いられる。

カイ二乗(χ2\chi^2)検定カテゴリデータのための標準的な手法である。検定統計量は次のとおり。

χ2=i(OiEi)2Ei\chi^2 = \sum_i \frac{(O_i - E_i)^2}{E_i}

ここで OiO_i は観測度数、EiE_iH0H_0 のもとでの期待度数である。

よく使われる 3 つの形:

  • 適合度:観測された分布は理論的な分布と一致するか?(サイコロは公正か?)。df=k1df = k - 1
  • 独立性:2 つのカテゴリ変数は独立か?(性別は投票傾向と独立か?)。r×cr \times c 分割表に対して df=(r1)(c1)df = (r-1)(c-1)
  • 分散の検定:あまり使われない。

前提:期待度数は十分に大きくなければならない(通常は各セルで 5\geq 5)。標本が小さい場合は代わりにフィッシャーの正確確率検定を用いる。

カイ二乗分布それ自体は、標準正規分布に従う変数の二乗の和の分布であり、棄却限界値の構成に用いられる。