Calculadora de Valor-p
Calcule e interprete valores-p para testes de hipótese com soluções passo a passo geradas por IA
Arraste e solte ou clique para adicionar imagens ou PDF
O que é um Valor-p?
Um valor-p é a probabilidade de observar resultados de teste tão extremos quanto, ou mais extremos que, os resultados reais — supondo que a hipótese nula seja verdadeira.
Formalmente, para uma estatística de teste com valor observado :
- Cauda direita:
- Cauda esquerda:
- Bicaudal:
Interpretação: um valor-p pequeno significa que os dados observados seriam surpreendentes se fosse verdadeira, então temos evidência contra . Um valor-p grande significa que os dados são consistentes com — mas não prova que é verdadeira.
Regra de decisão: compare a um nível de significância pré-escolhido (tipicamente 0,05):
- → rejeitar ('estatisticamente significativo')
- → não rejeitar (evidência insuficiente)
O que o valor-p NÃO é:
- Não é a probabilidade de ser verdadeira.
- Não é a probabilidade de a alternativa ser verdadeira.
- Não é uma medida de tamanho de efeito.
- Não distingue 'significância prática' de 'significância estatística'.
Como Calcular e Usar Valores-p
Passo a Passo
- Enuncie as hipóteses e .
- Escolha um teste apropriado para os dados (teste z, teste t, qui-quadrado, teste F, ...).
- Calcule a estatística de teste a partir dos dados.
- Determine a(s) cauda(s) com base em : cauda direita (), cauda esquerda () ou bicaudal ().
- Encontre o valor-p a partir da distribuição do teste.
- Compare a e conclua.
Valores-p de uma Estatística Z
Para uma normal padrão :
- Cauda direita:
- Cauda esquerda:
- Bicaudal:
Referência rápida: → bicaudal . → bicaudal .
Valores-p de uma Estatística T
Use a distribuição t com graus de liberdade (ou conforme especificado pelo teste). A mesma lógica de cauda do z, mas a distribuição tem caudas ligeiramente mais pesadas para gl pequeno.
Valores-p de uma Estatística Qui-Quadrado
Testes qui-quadrado são inerentemente de cauda direita porque e valores maiores indicam pior ajuste a :
Unicaudal vs Bicaudal: Qual Usar?
- Bicaudal: quando você se importa com desvios de em qualquer direção. Padrão na maioria dos contextos acadêmicos.
- Unicaudal: quando a hipótese alternativa é direcional e pré-especificada (, não ). Reduz o valor-p pela metade se a direção corresponder.
Nunca escolha a cauda depois de ver os dados — isso é p-hacking.
Limiares Comuns de Significância
| Rótulo comum | |
|---|---|
| 0.10 | sugestivo |
| 0.05 | padrão |
| 0.01 | forte |
| 0.001 | muito forte |
A American Statistical Association alertou contra tratar como uma linha rígida — o contexto e o tamanho do efeito importam mais que cruzar um limiar.
Erros Comuns a Evitar
- 'O valor-p é a probabilidade de ser verdadeira': ERRADO. O valor-p é calculado supondo que é verdadeira; ele não mede quão provável é.
- Tratar e como fundamentalmente diferentes: não são. O limiar de 0,05 é uma convenção, não uma transição de fase.
- Escolher a cauda depois de ver os dados: se você vê e muda para um teste de cauda esquerda, você dobrou sua taxa de falsos positivos. Pré-especifique.
- Confundir significância com tamanho de efeito: um efeito minúsculo com uma amostra enorme pode ser 'altamente significativo' mas praticamente irrelevante. Sempre reporte tamanhos de efeito junto com os valores-p.
- Inflação por comparações múltiplas: rodar 20 testes em , um falso positivo é esperado por acaso. Use correções de Bonferroni ou FDR.
- ' prova ': NÃO. Não rejeitar não é o mesmo que aceitar. Significa apenas que os dados não têm evidência suficiente contra neste tamanho de amostra.
Examples
Frequently Asked Questions
Significa que os dados observados (ou dados mais extremos) ocorreriam em menos de 5% das amostras repetidas se a hipótese nula fosse verdadeira. Por convenção, isso é tratado como 'estatisticamente significativo' — mas não significa que a hipótese nula seja necessariamente falsa, e não mede o tamanho do efeito.
O valor-p é calculado *supondo* que H₀ é verdadeira — ele é condicional a H₀. Calcular P(H₀ verdadeira | dados) requer métodos bayesianos com uma probabilidade a priori para H₀, que o valor-p frequentista não usa.
Apenas quando a pergunta de pesquisa é genuinamente direcional e pré-especificada antes de ver os dados — ex.: um novo medicamento precisa ter desempenho *melhor* que o placebo para ser útil, com desempenho pior equivalente a nenhum efeito. Escolher a cauda post-hoc é p-hacking.
P-hacking é a prática de rodar muitas análises (subconjuntos diferentes, transformações, exclusões) e reportar apenas as significativas, ou trocar a direção do teste após ver os dados. Isso infla as taxas de falsos positivos e é um grande contribuinte para a crise de replicação.
Related Solvers
Try AI-Math for Free
Get step-by-step solutions to any math problem. Upload a photo or type your question.
Start Solving