Calculadora de valor p

Calcula e interpreta valores p para pruebas de hipótesis con soluciones paso a paso impulsadas por IA

Arrastra y suelta o haz clic para añadir imágenes o PDF

Math Input
p-value for z = 2.1 two-tailed
p-value for t = 1.8 with 19 degrees of freedom, right-tailed
p-value for chi-square = 7.5 with 3 df
Is p = 0.03 significant at alpha = 0.05?

¿Qué es un valor p?

Un valor p es la probabilidad de observar resultados de la prueba tan extremos como, o más extremos que, los resultados reales, suponiendo que la hipótesis nula H0H_0 es verdadera.

Formalmente, para un estadístico de prueba TT con valor observado tt:

  • De cola derecha: p=P(TtH0)p = P(T \geq t \mid H_0)
  • De cola izquierda: p=P(TtH0)p = P(T \leq t \mid H_0)
  • De dos colas: p=2P(TtH0)p = 2 \cdot P(T \geq |t| \mid H_0)

Interpretación: un valor p pequeño significa que los datos observados serían sorprendentes si H0H_0 fuera verdadera, así que tenemos evidencia en contra de H0H_0. Un valor p grande significa que los datos son coherentes con H0H_0, pero no demuestra que H0H_0 sea verdadera.

Regla de decisión: compara pp con un nivel de significancia preseleccionado α\alpha (normalmente 0.05):

  • p<αp < \alpha → rechaza H0H_0 ('estadísticamente significativo')
  • pαp \geq \alpha → no se rechaza H0H_0 (evidencia insuficiente)

Lo que el valor p NO es:

  • No es la probabilidad de que H0H_0 sea verdadera.
  • No es la probabilidad de que la alternativa H1H_1 sea verdadera.
  • No es una medida del tamaño del efecto.
  • No distingue la 'significancia práctica' de la 'significancia estadística'.

Cómo calcular y usar los valores p

Paso a paso

  1. Plantea las hipótesis H0H_0 y H1H_1.
  2. Elige una prueba adecuada para los datos (prueba z, prueba t, chi-cuadrado, prueba F, ...).
  3. Calcula el estadístico de prueba a partir de los datos.
  4. Determina la(s) cola(s) según H1H_1: de cola derecha (>>), de cola izquierda (<<) o de dos colas (\neq).
  5. Halla el valor p a partir de la distribución de la prueba.
  6. Compara con α\alpha y concluye.

Valores p a partir de un estadístico z

Para una normal estándar ZZ:

  • De cola derecha: p=1Φ(z)p = 1 - \Phi(z)
  • De cola izquierda: p=Φ(z)p = \Phi(z)
  • De dos colas: p=2(1Φ(z))p = 2(1 - \Phi(|z|))

Referencia rápida: z=1.96z = 1.96pp de dos colas 0.05\approx 0.05. z=2.576z = 2.576pp de dos colas 0.01\approx 0.01.

Valores p a partir de un estadístico t

Usa la distribución t con n1n - 1 grados de libertad (o según especifique la prueba). La misma lógica de colas que con z, pero la distribución tiene colas algo más pesadas para grados de libertad pequeños.

Valores p a partir de un estadístico chi-cuadrado

Las pruebas de chi-cuadrado son inherentemente de cola derecha porque χ20\chi^2 \geq 0 y los valores mayores indican peor ajuste a H0H_0:

p=P(χdf2observado)p = P(\chi^2_{df} \geq \text{observado})

Una cola frente a dos colas: ¿cuál usar?

  • De dos colas: cuando te importa la desviación de H0H_0 en cualquier dirección. Predeterminado en la mayoría de los entornos académicos.
  • De una cola: cuando la hipótesis alternativa es direccional y está preespecificada (H1:μ>0H_1: \mu > 0, no μ0\mu \neq 0). Reduce el valor p a la mitad si la dirección coincide.

Nunca elijas la cola tras ver los datos: eso es p-hacking.

Umbrales de significancia comunes

α\alphaEtiqueta común
0.10sugerente
0.05estándar
0.01fuerte
0.001muy fuerte

La American Statistical Association ha advertido contra tratar α=0.05\alpha = 0.05 como una línea divisoria rígida: el contexto y el tamaño del efecto importan más que cruzar un umbral.

Errores comunes que debes evitar

  • 'El valor p es la probabilidad de que H0H_0 sea verdadera': INCORRECTO. El valor p se calcula suponiendo que H0H_0 es verdadera; no mide cuán probable es H0H_0.
  • Tratar p=0.049p = 0.049 y p=0.051p = 0.051 como fundamentalmente distintos: no lo son. El umbral de 0.05 es una convención, no una transición de fase.
  • Elegir la cola tras ver los datos: si ves z=2z = -2 y cambias a una prueba de cola izquierda, has duplicado tu tasa de falsos positivos. Preespecifica.
  • Confundir la significancia con el tamaño del efecto: un efecto diminuto con una muestra enorme puede ser 'altamente significativo' y a la vez prácticamente irrelevante. Informa siempre del tamaño del efecto junto al valor p.
  • Inflación por comparaciones múltiples: al realizar 20 pruebas con α=0.05\alpha = 0.05, se espera un falso positivo por azar. Usa correcciones de Bonferroni o FDR.
  • 'p>0.05p > 0.05 demuestra H0H_0': NO. No rechazar no es lo mismo que aceptar. Solo significa que los datos no tienen suficiente evidencia contra H0H_0 con este tamaño muestral.

Examples

Step 1: Busca Φ(2.1)0.9821\Phi(2.1) \approx 0.9821
Step 2: Probabilidad de cola derecha: 10.9821=0.01791 - 0.9821 = 0.0179
Step 3: Valor p de dos colas: 2×0.0179=0.03582 \times 0.0179 = 0.0358
Answer: p0.0358p \approx 0.0358 (significativo en α=0.05\alpha = 0.05)

Step 1: Usa la distribución t con df=19df = 19
Step 2: De las tablas t: P(T191.8)0.0438P(T_{19} \geq 1.8) \approx 0.0438
Step 3: Compara con los umbrales comunes: significativo en α=0.05\alpha = 0.05, no en α=0.01\alpha = 0.01
Answer: p0.044p \approx 0.044 (significativo en α=0.05\alpha = 0.05)

Step 1: El chi-cuadrado es de cola derecha
Step 2: P(χ327.5)P(\chi^2_3 \geq 7.5) de la tabla de chi-cuadrado
Step 3: Valores críticos para df = 3: χ0.102=6.25\chi^2_{0.10} = 6.25, χ0.052=7.81\chi^2_{0.05} = 7.81
Step 4: 7.57.5 está entre medias, así que 0.05<p<0.100.05 < p < 0.10
Step 5: Más precisamente, p0.058p \approx 0.058
Answer: p0.058p \approx 0.058 (no significativo en α=0.05\alpha = 0.05, sugerente en α=0.10\alpha = 0.10)

Frequently Asked Questions

Significa que los datos observados (o datos más extremos) ocurrirían en menos del 5% de las muestras repetidas si la hipótesis nula fuera verdadera. Por convención, esto se trata como 'estadísticamente significativo', pero no significa que la hipótesis nula sea necesariamente falsa, ni mide el tamaño del efecto.

El valor p se calcula *suponiendo* que H₀ es verdadera: está condicionado a H₀. Calcular P(H₀ verdadera | datos) requiere métodos bayesianos con una probabilidad a priori para H₀, que el valor p frecuentista no usa.

Solo cuando la pregunta de investigación es genuinamente direccional y está preespecificada antes de ver los datos; p. ej., un nuevo fármaco debe tener un *mejor* desempeño que el placebo para ser útil, siendo un peor desempeño equivalente a ningún efecto. Elegir la cola a posteriori es p-hacking.

El p-hacking es la práctica de realizar muchos análisis (distintos subconjuntos, transformaciones, exclusiones) y reportar solo los significativos, o cambiar la dirección de la prueba tras ver los datos. Infla las tasas de falsos positivos y es un contribuyente importante a la crisis de replicación.

Related Solvers

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving