カイ二乗()検定はカテゴリデータのための標準的な手法である。検定統計量は次のとおり。
ここで は観測度数、 は のもとでの期待度数である。
よく使われる 3 つの形:
- 適合度:観測された分布は理論的な分布と一致するか?(サイコロは公正か?)。。
- 独立性:2 つのカテゴリ変数は独立か?(性別は投票傾向と独立か?)。 分割表に対して 。
- 分散の検定:あまり使われない。
前提:期待度数は十分に大きくなければならない(通常は各セルで )。標本が小さい場合は代わりにフィッシャーの正確確率検定を用いる。
カイ二乗分布それ自体は、標準正規分布に従う変数の二乗の和の分布であり、棄却限界値の構成に用いられる。