Le test du khi-deux ( $\chi^2$ ) est l'outil standard pour les données catégorielles. La statistique de test :

$\chi^2 = \sum_i \frac{(O_i - E_i)^2}{E_i}$

où $O_i$ sont les effectifs observés et $E_i$ les effectifs attendus sous $H_0$ .

Trois variantes courantes :

Adéquation : la distribution observée correspond-elle à une distribution théorique ? (Un dé est-il équilibré ?). $df = k - 1$ .
Indépendance : deux variables catégorielles sont-elles indépendantes ? (Le sexe est-il indépendant de la préférence de vote ?). $df = (r-1)(c-1)$ pour les tableaux de contingence $r \times c$ .
Test de variance : moins courant.

Hypothèse : les effectifs attendus doivent être suffisamment grands (typiquement $\geq 5$ dans chaque case). Pour de petits échantillons, utiliser plutôt le test exact de Fisher.

La loi du khi-deux elle-même est la loi d'une somme de carrés de variables normales centrées réduites — elle sert à construire les valeurs critiques.

Test du khi-deux (χ²)

Le test du khi-deux compare les effectifs observés aux effectifs attendus pour des données catégorielles. χ² = Σ(O−E)²/E. Utilisé pour les tests d'adéquation et d'indépendance.