Le test d'hypothèse est le cheval de bataille de l'inférence statistique, utilisé partout, des essais cliniques aux tests A/B sur les sites web. Pourtant, c'est aussi le sujet le plus mal compris de la statistique. Ce guide parcourt l'ensemble du processus une fois — clairement — afin que vous compreniez ce que signifie réellement une valeur p.
Les cinq étapes
- Énoncez et : l'hypothèse nulle (statu quo) et l'alternative (l'affirmation que vous voulez étayer).
- Choisissez un niveau de signification : généralement 0,05 ou 0,01.
- Calculez la statistique de test à partir de vos données (, , , etc.).
- Déterminez la valeur p : la probabilité d'observer des données aussi extrêmes si était vraie.
- Décidez : si , rejetez ; sinon, ne rejetez pas.
Remarque : « ne pas rejeter » ≠ « accepter ». Vous n'avez simplement pas assez de preuves contre elle.
Test z à un échantillon (exemple résolu)
Une usine affirme que ses ampoules durent en moyenne 1000 heures (). Vous testez 25 ampoules et mesurez . L'affirmation est-elle réfutée à ?
- , .
- , bilatéral.
- Statistique de test : .
- valeur p : .
- Comme , rejetez . La durée de vie moyenne diffère significativement de 1000 heures.
Choisir le bon test
| Situation | Test |
|---|---|
| Une moyenne, connu | test z à un échantillon |
| Une moyenne, inconnu, n petit | test t à un échantillon |
| Deux moyennes, échantillons indépendants | test t à deux échantillons |
| Deux moyennes appariées | test t apparié |
| Proportion(s) | test z pour une proportion |
| Adéquation / contingence | khi-deux |
Erreur de type I vs erreur de type II
- Type I : rejeter un vrai. Probabilité = .
- Type II : ne pas rejeter un faux. Probabilité = .
- Puissance = : probabilité de détecter correctement un effet réel.
Ces trois grandeurs évoluent ensemble : réduire augmente pour une taille d'échantillon fixe ; augmenter la taille d'échantillon réduit les deux.
Erreurs courantes
- « valeur p = probabilité que soit vraie » — faux. La valeur p est , et non .
- Comparaisons multiples — réaliser 20 tests à garantit en moyenne ≈1 faux positif. Utilisez une correction.
- Confondre signification et importance — un effet minuscule avec un énorme peut être hautement significatif tout en étant pratiquement sans intérêt.
Essayez avec le solveur de test d'hypothèse IA
Utilisez le solveur de test d'hypothèse pour saisir vos données et obtenir la statistique de test, la valeur p et la décision.
Références connexes :
- Calculateur de score z — la brique de base de tout test z
- Calculateur d'écart-type — l'entrée de variabilité
- Calculateur de loi normale — ce que les tests z présupposent