Calculatrice de valeur p
Calculez et interprétez les valeurs p pour les tests d'hypothèses avec des solutions étape par étape propulsées par l'IA
Glissez-déposez ou cliquez pour ajouter des images ou un PDF
Qu'est-ce qu'une valeur p ?
Une valeur p est la probabilité d'observer des résultats de test aussi extrêmes que, ou plus extrêmes que, les résultats réels — en supposant que l'hypothèse nulle est vraie.
Formellement, pour une statistique de test de valeur observée :
- Unilatéral à droite :
- Unilatéral à gauche :
- Bilatéral :
Interprétation : une petite valeur p signifie que les données observées seraient surprenantes si était vraie, on a donc des preuves contre . Une grande valeur p signifie que les données sont compatibles avec — mais ne prouve pas que est vraie.
Règle de décision : comparer à un seuil de signification préchoisi (typiquement 0,05) :
- → rejeter (« statistiquement significatif »)
- → ne pas rejeter (preuves insuffisantes)
Ce que la valeur p n'est PAS :
- Ce n'est pas la probabilité que soit vraie.
- Ce n'est pas la probabilité que l'alternative soit vraie.
- Ce n'est pas une mesure de la taille d'effet.
- Elle ne distingue pas la « significativité pratique » de la « significativité statistique ».
Comment calculer et utiliser les valeurs p
Étape par étape
- Énoncer les hypothèses et .
- Choisir un test approprié aux données (test z, test t, khi-deux, test F, ...).
- Calculer la statistique de test à partir des données.
- Déterminer la ou les queues selon : unilatéral à droite (), unilatéral à gauche () ou bilatéral ().
- Trouver la valeur p à partir de la distribution du test.
- Comparer à et conclure.
Valeurs p à partir d'une statistique Z
Pour une loi normale centrée réduite :
- Unilatéral à droite :
- Unilatéral à gauche :
- Bilatéral :
Référence rapide : → bilatéral. → bilatéral.
Valeurs p à partir d'une statistique T
Utiliser la loi de Student à degrés de liberté (ou selon ce que spécifie le test). Même logique de queues que pour z, mais la distribution a des queues légèrement plus lourdes pour un petit nombre de degrés de liberté.
Valeurs p à partir d'une statistique du khi-deux
Les tests du khi-deux sont intrinsèquement unilatéraux à droite car et des valeurs plus grandes indiquent un moins bon ajustement à :
Unilatéral ou bilatéral : lequel utiliser ?
- Bilatéral : quand vous vous souciez d'un écart à dans les deux directions. Par défaut dans la plupart des contextes académiques.
- Unilatéral : quand l'hypothèse alternative est directionnelle et préspécifiée (, et non ). Divise par deux la valeur p si la direction correspond.
Ne choisissez jamais la queue après avoir vu les données — c'est du p-hacking.
Seuils de signification courants
| Étiquette courante | |
|---|---|
| 0.10 | suggestif |
| 0.05 | standard |
| 0.01 | fort |
| 0.001 | très fort |
L'American Statistical Association a mis en garde contre le traitement de comme une ligne nette — le contexte et la taille d'effet importent plus que le franchissement d'un seuil.
Erreurs courantes à éviter
- « La valeur p est la probabilité que soit vraie » : FAUX. La valeur p est calculée en supposant vraie ; elle ne mesure pas la probabilité que le soit.
- Traiter et comme fondamentalement différents : ils ne le sont pas. Le seuil de 0,05 est une convention, pas une transition de phase.
- Choisir la queue après avoir vu les données : si vous voyez et passez à un test unilatéral à gauche, vous avez doublé votre taux de faux positifs. Préspécifiez.
- Confondre signification et taille d'effet : un effet minuscule avec un énorme échantillon peut être « hautement significatif » tout en étant pratiquement non pertinent. Rapportez toujours les tailles d'effet avec les valeurs p.
- Inflation par comparaisons multiples : en exécutant 20 tests à , un faux positif est attendu par hasard. Utilisez les corrections de Bonferroni ou FDR.
- « prouve » : NON. Ne pas rejeter n'est pas la même chose qu'accepter. Cela signifie juste que les données n'ont pas assez de preuves contre à cette taille d'échantillon.
Examples
Frequently Asked Questions
Cela signifie que les données observées (ou des données plus extrêmes) se produiraient dans moins de 5 % des échantillons répétés si l'hypothèse nulle était vraie. Par convention, c'est traité comme « statistiquement significatif » — mais cela ne signifie pas que l'hypothèse nulle est nécessairement fausse, et cela ne mesure pas la taille de l'effet.
La valeur p est calculée *en supposant* H₀ vraie — elle est conditionnelle à H₀. Calculer P(H₀ vraie | données) requiert des méthodes bayésiennes avec une probabilité a priori pour H₀, que la valeur p fréquentiste n'utilise pas.
Uniquement quand la question de recherche est véritablement directionnelle et préspécifiée avant de voir les données — par ex. un nouveau médicament doit faire *mieux* qu'un placebo pour être utile, une moins bonne performance équivalant à aucun effet. Choisir la queue a posteriori est du p-hacking.
Le p-hacking est la pratique consistant à exécuter de nombreuses analyses (différents sous-ensembles, transformations, exclusions) et à ne rapporter que les significatives, ou à changer la direction du test après avoir vu les données. Il gonfle les taux de faux positifs et contribue largement à la crise de la réplication.
Related Solvers
Try AI-Math for Free
Get step-by-step solutions to any math problem. Upload a photo or type your question.
Start Solving