Калькулятор p-значения
Вычисляйте и интерпретируйте p-значения для проверки гипотез с пошаговыми решениями на основе ИИ
Перетащите или нажмите , чтобы добавить изображения или PDF
Что такое p-значение?
P-значение — это вероятность наблюдать результаты критерия столь же или более экстремальные, чем фактические результаты — при условии, что нулевая гипотеза истинна.
Формально для статистики критерия с наблюдаемым значением :
- Правосторонний:
- Левосторонний:
- Двусторонний:
Интерпретация: малое p-значение означает, что наблюдаемые данные были бы удивительны, если бы была истинна, поэтому у нас есть свидетельство против . Большое p-значение означает, что данные согласуются с — но не доказывает, что истинна.
Правило принятия решения: сравните с заранее выбранным уровнем значимости (обычно 0,05):
- → отвергнуть («статистически значимо»)
- → не отвергать (недостаточно свидетельств)
Чем p-значение НЕ является:
- Это не вероятность того, что истинна.
- Это не вероятность того, что альтернатива истинна.
- Это не мера размера эффекта.
- Оно не различает «практическую значимость» и «статистическую значимость».
Как вычислять и использовать p-значения
Пошагово
- Сформулируйте гипотезы и .
- Выберите критерий, подходящий для данных (z-критерий, t-критерий, хи-квадрат, F-критерий, ...).
- Вычислите статистику критерия по данным.
- Определите хвост(ы) на основе : правосторонний (), левосторонний () или двусторонний ().
- Найдите p-значение из распределения критерия.
- Сравните с и сделайте вывод.
P-значения из z-статистики
Для стандартного нормального :
- Правосторонний:
- Левосторонний:
- Двусторонний:
Быстрая справка: → двусторонний . → двусторонний .
P-значения из t-статистики
Используйте распределение Стьюдента с степенями свободы (или как указано в критерии). Та же логика хвостов, что и у z, но распределение имеет немного более тяжёлые хвосты при малом df.
P-значения из статистики хи-квадрат
Критерии хи-квадрат по своей сути правосторонние, потому что , а большие значения указывают на худшее соответствие :
Односторонний или двусторонний: какой использовать?
- Двусторонний: когда вас интересует отклонение от в любом направлении. По умолчанию в большинстве академических контекстов.
- Односторонний: когда альтернативная гипотеза направленная и заранее заданная (, а не ). Уменьшает p-значение вдвое, если направление совпадает.
Никогда не выбирайте хвост после просмотра данных — это p-хакинг.
Распространённые пороги значимости
| Распространённая метка | |
|---|---|
| 0.10 | предполагающая |
| 0.05 | стандартная |
| 0.01 | сильная |
| 0.001 | очень сильная |
Американская статистическая ассоциация предостерегала от трактовки как чёткой границы — контекст и размер эффекта важнее, чем пересечение порога.
Типичные ошибки, которых следует избегать
- «P-значение — это вероятность того, что истинна»: НЕВЕРНО. P-значение вычисляется в предположении, что истинна; оно не измеряет, насколько вероятна .
- Трактовка и как принципиально разных: это не так. Порог 0,05 — это соглашение, а не фазовый переход.
- Выбор хвоста после просмотра данных: если вы видите и переключаетесь на левосторонний критерий, вы удвоили частоту ложноположительных результатов. Задавайте заранее.
- Путают значимость с размером эффекта: крошечный эффект при огромной выборке может быть «высокозначимым», но практически нерелевантным. Всегда сообщайте размеры эффекта вместе с p-значениями.
- Инфляция от множественных сравнений: при 20 критериях с один ложноположительный результат ожидается по случайности. Используйте поправки Бонферрони или FDR.
- « доказывает »: НЕТ. Неотвержение не то же самое, что принятие. Это лишь означает, что данных недостаточно против при данном объёме выборки.
Examples
Frequently Asked Questions
Это означает, что наблюдаемые данные (или более экстремальные данные) встречались бы менее чем в 5% повторных выборок, если бы нулевая гипотеза была истинна. По соглашению это трактуется как «статистически значимое» — но это не означает, что нулевая гипотеза обязательно ложна, и не измеряет размер эффекта.
P-значение вычисляется *в предположении*, что H₀ истинна — оно условно по H₀. Вычисление P(H₀ истинна | данные) требует байесовских методов с априорной вероятностью для H₀, которую частотное p-значение не использует.
Только когда исследовательский вопрос действительно направленный и заранее задан до просмотра данных — например, новое лекарство должно работать *лучше* плацебо, чтобы быть полезным, при этом худший результат эквивалентен отсутствию эффекта. Выбор хвоста постфактум — это p-хакинг.
P-хакинг — это практика проведения множества анализов (разных подмножеств, преобразований, исключений) и сообщения только значимых из них или переключения направлений критерия после просмотра данных. Это завышает частоту ложноположительных результатов и является основной причиной кризиса воспроизводимости.
Related Solvers
Try AI-Math for Free
Get step-by-step solutions to any math problem. Upload a photo or type your question.
Start Solving