Calculatrice de valeur p

Calculez et interprétez les valeurs p pour les tests d'hypothèses avec des solutions étape par étape propulsées par l'IA

Glissez-déposez ou cliquez pour ajouter des images ou un PDF

Math Input
p-value for z = 2.1 two-tailed
p-value for t = 1.8 with 19 degrees of freedom, right-tailed
p-value for chi-square = 7.5 with 3 df
Is p = 0.03 significant at alpha = 0.05?

Qu'est-ce qu'une valeur p ?

Une valeur p est la probabilité d'observer des résultats de test aussi extrêmes que, ou plus extrêmes que, les résultats réels — en supposant que l'hypothèse nulle H0H_0 est vraie.

Formellement, pour une statistique de test TT de valeur observée tt :

  • Unilatéral à droite : p=P(TtH0)p = P(T \geq t \mid H_0)
  • Unilatéral à gauche : p=P(TtH0)p = P(T \leq t \mid H_0)
  • Bilatéral : p=2P(TtH0)p = 2 \cdot P(T \geq |t| \mid H_0)

Interprétation : une petite valeur p signifie que les données observées seraient surprenantes si H0H_0 était vraie, on a donc des preuves contre H0H_0. Une grande valeur p signifie que les données sont compatibles avec H0H_0 — mais ne prouve pas que H0H_0 est vraie.

Règle de décision : comparer pp à un seuil de signification préchoisi α\alpha (typiquement 0,05) :

  • p<αp < \alpha → rejeter H0H_0 (« statistiquement significatif »)
  • pαp \geq \alpha → ne pas rejeter H0H_0 (preuves insuffisantes)

Ce que la valeur p n'est PAS :

  • Ce n'est pas la probabilité que H0H_0 soit vraie.
  • Ce n'est pas la probabilité que l'alternative H1H_1 soit vraie.
  • Ce n'est pas une mesure de la taille d'effet.
  • Elle ne distingue pas la « significativité pratique » de la « significativité statistique ».

Comment calculer et utiliser les valeurs p

Étape par étape

  1. Énoncer les hypothèses H0H_0 et H1H_1.
  2. Choisir un test approprié aux données (test z, test t, khi-deux, test F, ...).
  3. Calculer la statistique de test à partir des données.
  4. Déterminer la ou les queues selon H1H_1 : unilatéral à droite (>>), unilatéral à gauche (<<) ou bilatéral (\neq).
  5. Trouver la valeur p à partir de la distribution du test.
  6. Comparer à α\alpha et conclure.

Valeurs p à partir d'une statistique Z

Pour une loi normale centrée réduite ZZ :

  • Unilatéral à droite : p=1Φ(z)p = 1 - \Phi(z)
  • Unilatéral à gauche : p=Φ(z)p = \Phi(z)
  • Bilatéral : p=2(1Φ(z))p = 2(1 - \Phi(|z|))

Référence rapide : z=1.96z = 1.96p0.05p \approx 0.05 bilatéral. z=2.576z = 2.576p0.01p \approx 0.01 bilatéral.

Valeurs p à partir d'une statistique T

Utiliser la loi de Student à n1n - 1 degrés de liberté (ou selon ce que spécifie le test). Même logique de queues que pour z, mais la distribution a des queues légèrement plus lourdes pour un petit nombre de degrés de liberté.

Valeurs p à partir d'une statistique du khi-deux

Les tests du khi-deux sont intrinsèquement unilatéraux à droite car χ20\chi^2 \geq 0 et des valeurs plus grandes indiquent un moins bon ajustement à H0H_0 :

p=P(χdf2observed)p = P(\chi^2_{df} \geq \text{observed})

Unilatéral ou bilatéral : lequel utiliser ?

  • Bilatéral : quand vous vous souciez d'un écart à H0H_0 dans les deux directions. Par défaut dans la plupart des contextes académiques.
  • Unilatéral : quand l'hypothèse alternative est directionnelle et préspécifiée (H1:μ>0H_1: \mu > 0, et non μ0\mu \neq 0). Divise par deux la valeur p si la direction correspond.

Ne choisissez jamais la queue après avoir vu les données — c'est du p-hacking.

Seuils de signification courants

α\alphaÉtiquette courante
0.10suggestif
0.05standard
0.01fort
0.001très fort

L'American Statistical Association a mis en garde contre le traitement de α=0.05\alpha = 0.05 comme une ligne nette — le contexte et la taille d'effet importent plus que le franchissement d'un seuil.

Erreurs courantes à éviter

  • « La valeur p est la probabilité que H0H_0 soit vraie » : FAUX. La valeur p est calculée en supposant H0H_0 vraie ; elle ne mesure pas la probabilité que H0H_0 le soit.
  • Traiter p=0.049p = 0.049 et p=0.051p = 0.051 comme fondamentalement différents : ils ne le sont pas. Le seuil de 0,05 est une convention, pas une transition de phase.
  • Choisir la queue après avoir vu les données : si vous voyez z=2z = -2 et passez à un test unilatéral à gauche, vous avez doublé votre taux de faux positifs. Préspécifiez.
  • Confondre signification et taille d'effet : un effet minuscule avec un énorme échantillon peut être « hautement significatif » tout en étant pratiquement non pertinent. Rapportez toujours les tailles d'effet avec les valeurs p.
  • Inflation par comparaisons multiples : en exécutant 20 tests à α=0.05\alpha = 0.05, un faux positif est attendu par hasard. Utilisez les corrections de Bonferroni ou FDR.
  • « p>0.05p > 0.05 prouve H0H_0 » : NON. Ne pas rejeter n'est pas la même chose qu'accepter. Cela signifie juste que les données n'ont pas assez de preuves contre H0H_0 à cette taille d'échantillon.

Examples

Step 1: Chercher Φ(2.1)0.9821\Phi(2.1) \approx 0.9821
Step 2: Probabilité de queue droite : 10.9821=0.01791 - 0.9821 = 0.0179
Step 3: Valeur p bilatérale : 2×0.0179=0.03582 \times 0.0179 = 0.0358
Answer: p0.0358p \approx 0.0358 (significant at α=0.05\alpha = 0.05)

Step 1: Utiliser la loi de Student avec df=19df = 19
Step 2: D'après les tables de Student : P(T191.8)0.0438P(T_{19} \geq 1.8) \approx 0.0438
Step 3: Comparer aux seuils courants : significatif à α=0.05\alpha = 0.05, pas à α=0.01\alpha = 0.01
Answer: p0.044p \approx 0.044 (significant at α=0.05\alpha = 0.05)

Step 1: Le khi-deux est unilatéral à droite
Step 2: P(χ327.5)P(\chi^2_3 \geq 7.5) depuis la table du khi-deux
Step 3: Valeurs critiques pour df = 3 : χ0.102=6.25\chi^2_{0.10} = 6.25, χ0.052=7.81\chi^2_{0.05} = 7.81
Step 4: 7.57.5 se situe entre, donc 0.05<p<0.100.05 < p < 0.10
Step 5: Plus précisément, p0.058p \approx 0.058
Answer: p0.058p \approx 0.058 (not significant at α=0.05\alpha = 0.05, suggestive at α=0.10\alpha = 0.10)

Frequently Asked Questions

Cela signifie que les données observées (ou des données plus extrêmes) se produiraient dans moins de 5 % des échantillons répétés si l'hypothèse nulle était vraie. Par convention, c'est traité comme « statistiquement significatif » — mais cela ne signifie pas que l'hypothèse nulle est nécessairement fausse, et cela ne mesure pas la taille de l'effet.

La valeur p est calculée *en supposant* H₀ vraie — elle est conditionnelle à H₀. Calculer P(H₀ vraie | données) requiert des méthodes bayésiennes avec une probabilité a priori pour H₀, que la valeur p fréquentiste n'utilise pas.

Uniquement quand la question de recherche est véritablement directionnelle et préspécifiée avant de voir les données — par ex. un nouveau médicament doit faire *mieux* qu'un placebo pour être utile, une moins bonne performance équivalant à aucun effet. Choisir la queue a posteriori est du p-hacking.

Le p-hacking est la pratique consistant à exécuter de nombreuses analyses (différents sous-ensembles, transformations, exclusions) et à ne rapporter que les significatives, ou à changer la direction du test après avoir vu les données. Il gonfle les taux de faux positifs et contribue largement à la crise de la réplication.

Related Solvers

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving