Calcolatrice del valore p

Calcola e interpreta i valori p per i test di ipotesi con soluzioni passo passo basate sull'AI

Trascina e rilascia oppure fai clic per aggiungere immagini o PDF

Math Input
p-value for z = 2.1 two-tailed
p-value for t = 1.8 with 19 degrees of freedom, right-tailed
p-value for chi-square = 7.5 with 3 df
Is p = 0.03 significant at alpha = 0.05?

Che cos'è un valore p?

Un valore p è la probabilità di osservare risultati del test tanto estremi quanto, o più estremi dei, risultati effettivi — assumendo vera l'ipotesi nulla H0H_0.

Formalmente, per una statistica test TT con valore osservato tt:

  • Coda destra: p=P(TtH0)p = P(T \geq t \mid H_0)
  • Coda sinistra: p=P(TtH0)p = P(T \leq t \mid H_0)
  • Bilaterale: p=2P(TtH0)p = 2 \cdot P(T \geq |t| \mid H_0)

Interpretazione: un valore p piccolo significa che i dati osservati sarebbero sorprendenti se H0H_0 fosse vera, quindi abbiamo evidenza contro H0H_0. Un valore p grande significa che i dati sono coerenti con H0H_0 — ma non dimostra che H0H_0 sia vera.

Regola decisionale: confronta pp con un livello di significatività scelto in anticipo α\alpha (tipicamente 0,05):

  • p<αp < \alpha → rifiuta H0H_0 ('statisticamente significativo')
  • pαp \geq \alpha → non rifiutare H0H_0 (evidenza insufficiente)

Cosa il valore p NON è:

  • Non è la probabilità che H0H_0 sia vera.
  • Non è la probabilità che l'alternativa H1H_1 sia vera.
  • Non è una misura della dimensione dell'effetto.
  • Non distingue la 'significatività pratica' dalla 'significatività statistica'.

Come calcolare e usare i valori p

Passo per passo

  1. Formula le ipotesi H0H_0 e H1H_1.
  2. Scegli un test appropriato per i dati (test z, test t, chi-quadro, test F, ...).
  3. Calcola la statistica test dai dati.
  4. Determina la/le coda/e in base a H1H_1: coda destra (>>), coda sinistra (<<) o bilaterale (\neq).
  5. Trova il valore p dalla distribuzione del test.
  6. Confronta con α\alpha e concludi.

Valori p da una statistica Z

Per una normale standard ZZ:

  • Coda destra: p=1Φ(z)p = 1 - \Phi(z)
  • Coda sinistra: p=Φ(z)p = \Phi(z)
  • Bilaterale: p=2(1Φ(z))p = 2(1 - \Phi(|z|))

Riferimento rapido: z=1.96z = 1.96pp bilaterale 0.05\approx 0.05. z=2.576z = 2.576pp bilaterale 0.01\approx 0.01.

Valori p da una statistica T

Usa la distribuzione t con n1n - 1 gradi di libertà (o come specificato dal test). Stessa logica di code di z, ma la distribuzione ha code leggermente più pesanti per gdl piccoli.

Valori p da una statistica Chi-quadro

I test chi-quadro sono intrinsecamente a coda destra perché χ20\chi^2 \geq 0 e valori maggiori indicano un adattamento peggiore a H0H_0:

p=P(χdf2osservato)p = P(\chi^2_{df} \geq \text{osservato})

Unilaterale vs bilaterale: quale usare?

  • Bilaterale: quando ti interessa la deviazione da H0H_0 in entrambe le direzioni. Predefinito nella maggior parte dei contesti accademici.
  • Unilaterale: quando l'ipotesi alternativa è direzionale e pre-specificata (H1:μ>0H_1: \mu > 0, non μ0\mu \neq 0). Dimezza il valore p se la direzione corrisponde.

Non scegliere mai la coda dopo aver visto i dati — è p-hacking.

Soglie di significatività comuni

α\alphaEtichetta comune
0.10suggestivo
0.05standard
0.01forte
0.001molto forte

L'American Statistical Association ha messo in guardia contro il trattare α=0.05\alpha = 0.05 come una linea netta — il contesto e la dimensione dell'effetto contano più del superamento di una soglia.

Errori comuni da evitare

  • 'Il valore p è la probabilità che H0H_0 sia vera': SBAGLIATO. Il valore p è calcolato assumendo vera H0H_0; non misura quanto sia probabile H0H_0.
  • Trattare p=0.049p = 0.049 e p=0.051p = 0.051 come fondamentalmente diversi: non lo sono. La soglia di 0,05 è una convenzione, non una transizione di fase.
  • Scegliere la coda dopo aver visto i dati: se vedi z=2z = -2 e passi a un test a coda sinistra, hai raddoppiato il tasso di falsi positivi. Pre-specifica.
  • Confondere significatività e dimensione dell'effetto: un effetto minuscolo con un campione enorme può essere 'altamente significativo' ma praticamente irrilevante. Riporta sempre la dimensione dell'effetto insieme ai valori p.
  • Inflazione da confronti multipli: eseguendo 20 test con α=0.05\alpha = 0.05, un falso positivo è atteso per caso. Usa le correzioni di Bonferroni o FDR.
  • 'p>0.05p > 0.05 dimostra H0H_0': NO. Non rifiutare non equivale ad accettare. Significa solo che i dati non hanno evidenza sufficiente contro H0H_0 con questa dimensione campionaria.

Examples

Step 1: Cerca Φ(2.1)0.9821\Phi(2.1) \approx 0.9821
Step 2: Probabilità di coda destra: 10.9821=0.01791 - 0.9821 = 0.0179
Step 3: Valore p bilaterale: 2×0.0179=0.03582 \times 0.0179 = 0.0358
Answer: p0.0358p \approx 0.0358 (significativo a α=0.05\alpha = 0.05)

Step 1: Usa la distribuzione t con df=19df = 19
Step 2: Dalle tabelle t: P(T191.8)0.0438P(T_{19} \geq 1.8) \approx 0.0438
Step 3: Confronta con le soglie comuni: significativo a α=0.05\alpha = 0.05, non a α=0.01\alpha = 0.01
Answer: p0.044p \approx 0.044 (significativo a α=0.05\alpha = 0.05)

Step 1: Il chi-quadro è a coda destra
Step 2: P(χ327.5)P(\chi^2_3 \geq 7.5) dalla tabella chi-quadro
Step 3: Valori critici per df = 3: χ0.102=6.25\chi^2_{0.10} = 6.25, χ0.052=7.81\chi^2_{0.05} = 7.81
Step 4: 7.57.5 è compreso tra i due, quindi 0.05<p<0.100.05 < p < 0.10
Step 5: Più precisamente, p0.058p \approx 0.058
Answer: p0.058p \approx 0.058 (non significativo a α=0.05\alpha = 0.05, suggestivo a α=0.10\alpha = 0.10)

Frequently Asked Questions

Significa che i dati osservati (o dati più estremi) si verificherebbero in meno del 5% dei campioni ripetuti se l'ipotesi nulla fosse vera. Per convenzione, questo è trattato come 'statisticamente significativo' — ma non significa che l'ipotesi nulla sia necessariamente falsa, e non misura la dimensione dell'effetto.

Il valore p è calcolato *assumendo* vera H₀ — è condizionato a H₀. Calcolare P(H₀ vera | dati) richiede metodi bayesiani con una probabilità a priori per H₀, che il valore p frequentista non usa.

Solo quando la domanda di ricerca è genuinamente direzionale e pre-specificata prima di vedere i dati — ad es. un nuovo farmaco deve performare *meglio* del placebo per essere utile, con una performance peggiore equivalente a nessun effetto. Scegliere la coda a posteriori è p-hacking.

Il p-hacking è la pratica di eseguire molte analisi (diversi sottoinsiemi, trasformazioni, esclusioni) e riportare solo quelle significative, o cambiare la direzione del test dopo aver visto i dati. Gonfia i tassi di falsi positivi ed è un grande contributore alla crisi della replicabilità.

Related Solvers

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving