Calcolatrice del valore p
Calcola e interpreta i valori p per i test di ipotesi con soluzioni passo passo basate sull'AI
Trascina e rilascia oppure fai clic per aggiungere immagini o PDF
Che cos'è un valore p?
Un valore p è la probabilità di osservare risultati del test tanto estremi quanto, o più estremi dei, risultati effettivi — assumendo vera l'ipotesi nulla .
Formalmente, per una statistica test con valore osservato :
- Coda destra:
- Coda sinistra:
- Bilaterale:
Interpretazione: un valore p piccolo significa che i dati osservati sarebbero sorprendenti se fosse vera, quindi abbiamo evidenza contro . Un valore p grande significa che i dati sono coerenti con — ma non dimostra che sia vera.
Regola decisionale: confronta con un livello di significatività scelto in anticipo (tipicamente 0,05):
- → rifiuta ('statisticamente significativo')
- → non rifiutare (evidenza insufficiente)
Cosa il valore p NON è:
- Non è la probabilità che sia vera.
- Non è la probabilità che l'alternativa sia vera.
- Non è una misura della dimensione dell'effetto.
- Non distingue la 'significatività pratica' dalla 'significatività statistica'.
Come calcolare e usare i valori p
Passo per passo
- Formula le ipotesi e .
- Scegli un test appropriato per i dati (test z, test t, chi-quadro, test F, ...).
- Calcola la statistica test dai dati.
- Determina la/le coda/e in base a : coda destra (), coda sinistra () o bilaterale ().
- Trova il valore p dalla distribuzione del test.
- Confronta con e concludi.
Valori p da una statistica Z
Per una normale standard :
- Coda destra:
- Coda sinistra:
- Bilaterale:
Riferimento rapido: → bilaterale . → bilaterale .
Valori p da una statistica T
Usa la distribuzione t con gradi di libertà (o come specificato dal test). Stessa logica di code di z, ma la distribuzione ha code leggermente più pesanti per gdl piccoli.
Valori p da una statistica Chi-quadro
I test chi-quadro sono intrinsecamente a coda destra perché e valori maggiori indicano un adattamento peggiore a :
Unilaterale vs bilaterale: quale usare?
- Bilaterale: quando ti interessa la deviazione da in entrambe le direzioni. Predefinito nella maggior parte dei contesti accademici.
- Unilaterale: quando l'ipotesi alternativa è direzionale e pre-specificata (, non ). Dimezza il valore p se la direzione corrisponde.
Non scegliere mai la coda dopo aver visto i dati — è p-hacking.
Soglie di significatività comuni
| Etichetta comune | |
|---|---|
| 0.10 | suggestivo |
| 0.05 | standard |
| 0.01 | forte |
| 0.001 | molto forte |
L'American Statistical Association ha messo in guardia contro il trattare come una linea netta — il contesto e la dimensione dell'effetto contano più del superamento di una soglia.
Errori comuni da evitare
- 'Il valore p è la probabilità che sia vera': SBAGLIATO. Il valore p è calcolato assumendo vera ; non misura quanto sia probabile .
- Trattare e come fondamentalmente diversi: non lo sono. La soglia di 0,05 è una convenzione, non una transizione di fase.
- Scegliere la coda dopo aver visto i dati: se vedi e passi a un test a coda sinistra, hai raddoppiato il tasso di falsi positivi. Pre-specifica.
- Confondere significatività e dimensione dell'effetto: un effetto minuscolo con un campione enorme può essere 'altamente significativo' ma praticamente irrilevante. Riporta sempre la dimensione dell'effetto insieme ai valori p.
- Inflazione da confronti multipli: eseguendo 20 test con , un falso positivo è atteso per caso. Usa le correzioni di Bonferroni o FDR.
- ' dimostra ': NO. Non rifiutare non equivale ad accettare. Significa solo che i dati non hanno evidenza sufficiente contro con questa dimensione campionaria.
Examples
Frequently Asked Questions
Significa che i dati osservati (o dati più estremi) si verificherebbero in meno del 5% dei campioni ripetuti se l'ipotesi nulla fosse vera. Per convenzione, questo è trattato come 'statisticamente significativo' — ma non significa che l'ipotesi nulla sia necessariamente falsa, e non misura la dimensione dell'effetto.
Il valore p è calcolato *assumendo* vera H₀ — è condizionato a H₀. Calcolare P(H₀ vera | dati) richiede metodi bayesiani con una probabilità a priori per H₀, che il valore p frequentista non usa.
Solo quando la domanda di ricerca è genuinamente direzionale e pre-specificata prima di vedere i dati — ad es. un nuovo farmaco deve performare *meglio* del placebo per essere utile, con una performance peggiore equivalente a nessun effetto. Scegliere la coda a posteriori è p-hacking.
Il p-hacking è la pratica di eseguire molte analisi (diversi sottoinsiemi, trasformazioni, esclusioni) e riportare solo quelle significative, o cambiare la direzione del test dopo aver visto i dati. Gonfia i tassi di falsi positivi ed è un grande contributore alla crisi della replicabilità.
Related Solvers
Try AI-Math for Free
Get step-by-step solutions to any math problem. Upload a photo or type your question.
Start Solving