Le test du khi-deux () est l'outil standard pour les données catégorielles. La statistique de test :
où sont les effectifs observés et les effectifs attendus sous .
Trois variantes courantes :
- Adéquation : la distribution observée correspond-elle à une distribution théorique ? (Un dé est-il équilibré ?). .
- Indépendance : deux variables catégorielles sont-elles indépendantes ? (Le sexe est-il indépendant de la préférence de vote ?). pour les tableaux de contingence .
- Test de variance : moins courant.
Hypothèse : les effectifs attendus doivent être suffisamment grands (typiquement dans chaque case). Pour de petits échantillons, utiliser plutôt le test exact de Fisher.
La loi du khi-deux elle-même est la loi d'une somme de carrés de variables normales centrées réduites — elle sert à construire les valeurs critiques.