AI-Math - Калькулятор p-значения

Что такое p-значение?

P-значение — это вероятность наблюдать результаты критерия столь же или более экстремальные, чем фактические результаты — при условии, что нулевая гипотеза $H_0$ истинна.

Формально для статистики критерия $T$ с наблюдаемым значением $t$ :

Правосторонний: $p = P(T \geq t \mid H_0)$
Левосторонний: $p = P(T \leq t \mid H_0)$
Двусторонний: $p = 2 \cdot P(T \geq |t| \mid H_0)$

Интерпретация: малое p-значение означает, что наблюдаемые данные были бы удивительны, если бы $H_0$ была истинна, поэтому у нас есть свидетельство против $H_0$ . Большое p-значение означает, что данные согласуются с $H_0$ — но не доказывает, что $H_0$ истинна.

Правило принятия решения: сравните $p$ с заранее выбранным уровнем значимости $\alpha$ (обычно 0,05):

$p < \alpha$ → отвергнуть $H_0$ («статистически значимо»)
$p \geq \alpha$ → не отвергать $H_0$ (недостаточно свидетельств)

Чем p-значение НЕ является:

Это не вероятность того, что $H_0$ истинна.
Это не вероятность того, что альтернатива $H_1$ истинна.
Это не мера размера эффекта.
Оно не различает «практическую значимость» и «статистическую значимость».

Как вычислять и использовать p-значения

Пошагово

Сформулируйте гипотезы $H_0$ и $H_1$ .
Выберите критерий, подходящий для данных (z-критерий, t-критерий, хи-квадрат, F-критерий, ...).
Вычислите статистику критерия по данным.
Определите хвост(ы) на основе $H_1$ : правосторонний ( $>$ ), левосторонний ( $<$ ) или двусторонний ( $\neq$ ).
Найдите p-значение из распределения критерия.
Сравните с $\alpha$ и сделайте вывод.

P-значения из z-статистики

Для стандартного нормального $Z$ :

Правосторонний: $p = 1 - \Phi(z)$
Левосторонний: $p = \Phi(z)$
Двусторонний: $p = 2(1 - \Phi(|z|))$

Быстрая справка: $z = 1.96$ → двусторонний $p \approx 0.05$ . $z = 2.576$ → двусторонний $p \approx 0.01$ .

P-значения из t-статистики

Используйте распределение Стьюдента с $n - 1$ степенями свободы (или как указано в критерии). Та же логика хвостов, что и у z, но распределение имеет немного более тяжёлые хвосты при малом df.

P-значения из статистики хи-квадрат

Критерии хи-квадрат по своей сути правосторонние, потому что $\chi^2 \geq 0$ , а большие значения указывают на худшее соответствие $H_0$ :

$p = P(\chi^2_{df} \geq \text{наблюдаемое})$

Односторонний или двусторонний: какой использовать?

Двусторонний: когда вас интересует отклонение от $H_0$ в любом направлении. По умолчанию в большинстве академических контекстов.
Односторонний: когда альтернативная гипотеза направленная и заранее заданная ( $H_1: \mu > 0$ , а не $\mu \neq 0$ ). Уменьшает p-значение вдвое, если направление совпадает.

Никогда не выбирайте хвост после просмотра данных — это p-хакинг.

Распространённые пороги значимости

$\alpha$	Распространённая метка
0.10	предполагающая
0.05	стандартная
0.01	сильная
0.001	очень сильная

Американская статистическая ассоциация предостерегала от трактовки $\alpha = 0.05$ как чёткой границы — контекст и размер эффекта важнее, чем пересечение порога.

Типичные ошибки, которых следует избегать

«P-значение — это вероятность того, что $H_0$ истинна»: НЕВЕРНО. P-значение вычисляется в предположении, что $H_0$ истинна; оно не измеряет, насколько вероятна $H_0$ .
Трактовка $p = 0.049$ и $p = 0.051$ как принципиально разных: это не так. Порог 0,05 — это соглашение, а не фазовый переход.
Выбор хвоста после просмотра данных: если вы видите $z = -2$ и переключаетесь на левосторонний критерий, вы удвоили частоту ложноположительных результатов. Задавайте заранее.
Путают значимость с размером эффекта: крошечный эффект при огромной выборке может быть «высокозначимым», но практически нерелевантным. Всегда сообщайте размеры эффекта вместе с p-значениями.
Инфляция от множественных сравнений: при 20 критериях с $\alpha = 0.05$ один ложноположительный результат ожидается по случайности. Используйте поправки Бонферрони или FDR.
« $p > 0.05$ доказывает $H_0$ »: НЕТ. Неотвержение не то же самое, что принятие. Это лишь означает, что данных недостаточно против $H_0$ при данном объёме выборки.

Examples

Step 1: Найдите

\Phi(2.1) \approx 0.9821

Step 2: Вероятность правого хвоста:

1 - 0.9821 = 0.0179

Step 3: Двустороннее p-значение:

2 \times 0.0179 = 0.0358

Answer:

p \approx 0.0358

(значимо при

\alpha = 0.05

)

Step 1: Используйте распределение Стьюдента с

df = 19

Step 2: Из таблиц t:

P(T_{19} \geq 1.8) \approx 0.0438

Step 3: Сравните с распространёнными порогами: значимо при

\alpha = 0.05

, не значимо при

\alpha = 0.01

Answer:

p \approx 0.044

(значимо при

\alpha = 0.05

)

Step 1: Хи-квадрат правосторонний

Step 2:

P(\chi^2_3 \geq 7.5)

из таблицы хи-квадрат

Step 3: Критические значения для df = 3:

\chi^2_{0.10} = 6.25

,

\chi^2_{0.05} = 7.81

Step 4:

7.5

лежит между ними, поэтому

0.05 < p < 0.10

Step 5: Точнее,

p \approx 0.058

Answer:

p \approx 0.058

(не значимо при

\alpha = 0.05

, предполагающее при

\alpha = 0.10

)

Frequently Asked Questions

Это означает, что наблюдаемые данные (или более экстремальные данные) встречались бы менее чем в 5% повторных выборок, если бы нулевая гипотеза была истинна. По соглашению это трактуется как «статистически значимое» — но это не означает, что нулевая гипотеза обязательно ложна, и не измеряет размер эффекта.

P-значение вычисляется *в предположении*, что H₀ истинна — оно условно по H₀. Вычисление P(H₀ истинна | данные) требует байесовских методов с априорной вероятностью для H₀, которую частотное p-значение не использует.

Только когда исследовательский вопрос действительно направленный и заранее задан до просмотра данных — например, новое лекарство должно работать *лучше* плацебо, чтобы быть полезным, при этом худший результат эквивалентен отсутствию эффекта. Выбор хвоста постфактум — это p-хакинг.

P-хакинг — это практика проведения множества анализов (разных подмножеств, преобразований, исключений) и сообщения только значимых из них или переключения направлений критерия после просмотра данных. Это завышает частоту ложноположительных результатов и является основной причиной кризиса воспроизводимости.

Related Guides

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving

Калькулятор p-значения

Вычисляйте и интерпретируйте p-значения для проверки гипотез с пошаговыми решениями на основе ИИ

Что такое p-значение?

Как вычислять и использовать p-значения

Пошагово

P-значения из z-статистики

P-значения из t-статистики

P-значения из статистики хи-квадрат

Односторонний или двусторонний: какой использовать?

Распространённые пороги значимости

Типичные ошибки, которых следует избегать

Examples

Frequently Asked Questions

Что означает p < 0,05?

Почему p-значение не является вероятностью того, что нулевая гипотеза истинна?

Когда следует использовать односторонний критерий?

Что такое p-хакинг?

Related Solvers

Related Guides

Try AI-Math for Free

Калькулятор p-значения

Вычисляйте и интерпретируйте p-значения для проверки гипотез с пошаговыми решениями на основе ИИ

Что такое p-значение?

Как вычислять и использовать p-значения

Пошагово

P-значения из z-статистики

P-значения из t-статистики

P-значения из статистики хи-квадрат

Односторонний или двусторонний: какой использовать?

Распространённые пороги значимости

Типичные ошибки, которых следует избегать

Examples

Problem: Найдитеp−значениедляНайдите p-значение для Найдитеp−значениедляz = 2.1(двустороннийкритерий) (двусторонний критерий)(двустороннийкритерий)

Frequently Asked Questions

Что означает p < 0,05?

Что означает p < 0,05?

Почему p-значение не является вероятностью того, что нулевая гипотеза истинна?

Почему p-значение не является вероятностью того, что нулевая гипотеза истинна?

Когда следует использовать односторонний критерий?

Когда следует использовать односторонний критерий?

Что такое p-хакинг?

Что такое p-хакинг?

Related Solvers

Related Guides

Try AI-Math for Free