Калькулятор p-значения

Вычисляйте и интерпретируйте p-значения для проверки гипотез с пошаговыми решениями на основе ИИ

Перетащите или нажмите , чтобы добавить изображения или PDF

Math Input
p-value for z = 2.1 two-tailed
p-value for t = 1.8 with 19 degrees of freedom, right-tailed
p-value for chi-square = 7.5 with 3 df
Is p = 0.03 significant at alpha = 0.05?

Что такое p-значение?

P-значение — это вероятность наблюдать результаты критерия столь же или более экстремальные, чем фактические результаты — при условии, что нулевая гипотеза H0H_0 истинна.

Формально для статистики критерия TT с наблюдаемым значением tt:

  • Правосторонний: p=P(TtH0)p = P(T \geq t \mid H_0)
  • Левосторонний: p=P(TtH0)p = P(T \leq t \mid H_0)
  • Двусторонний: p=2P(TtH0)p = 2 \cdot P(T \geq |t| \mid H_0)

Интерпретация: малое p-значение означает, что наблюдаемые данные были бы удивительны, если бы H0H_0 была истинна, поэтому у нас есть свидетельство против H0H_0. Большое p-значение означает, что данные согласуются с H0H_0 — но не доказывает, что H0H_0 истинна.

Правило принятия решения: сравните pp с заранее выбранным уровнем значимости α\alpha (обычно 0,05):

  • p<αp < \alpha → отвергнуть H0H_0 («статистически значимо»)
  • pαp \geq \alpha → не отвергать H0H_0 (недостаточно свидетельств)

Чем p-значение НЕ является:

  • Это не вероятность того, что H0H_0 истинна.
  • Это не вероятность того, что альтернатива H1H_1 истинна.
  • Это не мера размера эффекта.
  • Оно не различает «практическую значимость» и «статистическую значимость».

Как вычислять и использовать p-значения

Пошагово

  1. Сформулируйте гипотезы H0H_0 и H1H_1.
  2. Выберите критерий, подходящий для данных (z-критерий, t-критерий, хи-квадрат, F-критерий, ...).
  3. Вычислите статистику критерия по данным.
  4. Определите хвост(ы) на основе H1H_1: правосторонний (>>), левосторонний (<<) или двусторонний (\neq).
  5. Найдите p-значение из распределения критерия.
  6. Сравните с α\alpha и сделайте вывод.

P-значения из z-статистики

Для стандартного нормального ZZ:

  • Правосторонний: p=1Φ(z)p = 1 - \Phi(z)
  • Левосторонний: p=Φ(z)p = \Phi(z)
  • Двусторонний: p=2(1Φ(z))p = 2(1 - \Phi(|z|))

Быстрая справка: z=1.96z = 1.96 → двусторонний p0.05p \approx 0.05. z=2.576z = 2.576 → двусторонний p0.01p \approx 0.01.

P-значения из t-статистики

Используйте распределение Стьюдента с n1n - 1 степенями свободы (или как указано в критерии). Та же логика хвостов, что и у z, но распределение имеет немного более тяжёлые хвосты при малом df.

P-значения из статистики хи-квадрат

Критерии хи-квадрат по своей сути правосторонние, потому что χ20\chi^2 \geq 0, а большие значения указывают на худшее соответствие H0H_0:

p=P(χdf2наблюдаемое)p = P(\chi^2_{df} \geq \text{наблюдаемое})

Односторонний или двусторонний: какой использовать?

  • Двусторонний: когда вас интересует отклонение от H0H_0 в любом направлении. По умолчанию в большинстве академических контекстов.
  • Односторонний: когда альтернативная гипотеза направленная и заранее заданная (H1:μ>0H_1: \mu > 0, а не μ0\mu \neq 0). Уменьшает p-значение вдвое, если направление совпадает.

Никогда не выбирайте хвост после просмотра данных — это p-хакинг.

Распространённые пороги значимости

α\alphaРаспространённая метка
0.10предполагающая
0.05стандартная
0.01сильная
0.001очень сильная

Американская статистическая ассоциация предостерегала от трактовки α=0.05\alpha = 0.05 как чёткой границы — контекст и размер эффекта важнее, чем пересечение порога.

Типичные ошибки, которых следует избегать

  • «P-значение — это вероятность того, что H0H_0 истинна»: НЕВЕРНО. P-значение вычисляется в предположении, что H0H_0 истинна; оно не измеряет, насколько вероятна H0H_0.
  • Трактовка p=0.049p = 0.049 и p=0.051p = 0.051 как принципиально разных: это не так. Порог 0,05 — это соглашение, а не фазовый переход.
  • Выбор хвоста после просмотра данных: если вы видите z=2z = -2 и переключаетесь на левосторонний критерий, вы удвоили частоту ложноположительных результатов. Задавайте заранее.
  • Путают значимость с размером эффекта: крошечный эффект при огромной выборке может быть «высокозначимым», но практически нерелевантным. Всегда сообщайте размеры эффекта вместе с p-значениями.
  • Инфляция от множественных сравнений: при 20 критериях с α=0.05\alpha = 0.05 один ложноположительный результат ожидается по случайности. Используйте поправки Бонферрони или FDR.
  • «p>0.05p > 0.05 доказывает H0H_0»: НЕТ. Неотвержение не то же самое, что принятие. Это лишь означает, что данных недостаточно против H0H_0 при данном объёме выборки.

Examples

Step 1: Найдите Φ(2.1)0.9821\Phi(2.1) \approx 0.9821
Step 2: Вероятность правого хвоста: 10.9821=0.01791 - 0.9821 = 0.0179
Step 3: Двустороннее p-значение: 2×0.0179=0.03582 \times 0.0179 = 0.0358
Answer: p0.0358p \approx 0.0358 (значимо при α=0.05\alpha = 0.05)

Step 1: Используйте распределение Стьюдента с df=19df = 19
Step 2: Из таблиц t: P(T191.8)0.0438P(T_{19} \geq 1.8) \approx 0.0438
Step 3: Сравните с распространёнными порогами: значимо при α=0.05\alpha = 0.05, не значимо при α=0.01\alpha = 0.01
Answer: p0.044p \approx 0.044 (значимо при α=0.05\alpha = 0.05)

Step 1: Хи-квадрат правосторонний
Step 2: P(χ327.5)P(\chi^2_3 \geq 7.5) из таблицы хи-квадрат
Step 3: Критические значения для df = 3: χ0.102=6.25\chi^2_{0.10} = 6.25, χ0.052=7.81\chi^2_{0.05} = 7.81
Step 4: 7.57.5 лежит между ними, поэтому 0.05<p<0.100.05 < p < 0.10
Step 5: Точнее, p0.058p \approx 0.058
Answer: p0.058p \approx 0.058 (не значимо при α=0.05\alpha = 0.05, предполагающее при α=0.10\alpha = 0.10)

Frequently Asked Questions

Это означает, что наблюдаемые данные (или более экстремальные данные) встречались бы менее чем в 5% повторных выборок, если бы нулевая гипотеза была истинна. По соглашению это трактуется как «статистически значимое» — но это не означает, что нулевая гипотеза обязательно ложна, и не измеряет размер эффекта.

P-значение вычисляется *в предположении*, что H₀ истинна — оно условно по H₀. Вычисление P(H₀ истинна | данные) требует байесовских методов с априорной вероятностью для H₀, которую частотное p-значение не использует.

Только когда исследовательский вопрос действительно направленный и заранее задан до просмотра данных — например, новое лекарство должно работать *лучше* плацебо, чтобы быть полезным, при этом худший результат эквивалентен отсутствию эффекта. Выбор хвоста постфактум — это p-хакинг.

P-хакинг — это практика проведения множества анализов (разных подмножеств, преобразований, исключений) и сообщения только значимых из них или переключения направлений критерия после просмотра данных. Это завышает частоту ложноположительных результатов и является основной причиной кризиса воспроизводимости.

Related Solvers

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving