p-значение — это вероятность (при условии, что нулевая гипотеза верна) наблюдать данные, по крайней мере столь же экстремальные, как фактическая выборка. Малые p-значения означают, что наблюдаемые данные были бы маловероятны, если бы была верна, что даёт свидетельство против .
Соглашение: отвергнуть , если (обычно ). Порог — это уровень ошибки первого рода, который вы допускаете.
Распространённые заблуждения (которые вдалбливает каждый преподаватель статистики):
- — это не «вероятность того, что верна».
- — это не «вероятность того, что результат обусловлен случайностью».
- Малое не означает большой эффект — лишь эффект, маловероятный при . При огромных выборках ничтожно малые эффекты становятся «статистически значимыми».
- — это не доказательство того, что верна, а лишь недостаточное свидетельство, чтобы её отвергнуть.
Американская статистическая ассоциация (2016) прямо предостерегла от трактовки p-значений как бинарных решений «значимо / незначимо»; сообщайте рядом с ними размеры эффекта и доверительные интервалы.