statistics

Проверка гипотез шаг за шагом: от H0 к p-значению

Практическое руководство по проверке гипотез — определение H0 и H1, выбор подходящего критерия, вычисление статистики критерия и интерпретация p-значения без злоупотреблений.
AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-01

Проверка гипотез — рабочая лошадка статистического вывода, применяемая повсюду: от клинических испытаний до A/B-тестов на сайтах. И всё же это самая неправильно понимаемая тема в статистике. Это руководство один раз — внятно — проходит весь конвейер, чтобы вы поняли, что на самом деле означает p-значение.

Пять шагов

  1. Сформулируйте H0H_0 и H1H_1: нулевую гипотезу (статус-кво) и альтернативную (утверждение, которое вы хотите подтвердить).
  2. Выберите уровень значимости α\alpha: обычно 0,05 или 0,01.
  3. Вычислите статистику критерия по вашим данным (zz, tt, χ2\chi^2 и т. д.).
  4. Найдите p-значение: вероятность увидеть данные настолько экстремальные, если бы H0H_0 была верна.
  5. Примите решение: если p<αp < \alpha, отвергаем H0H_0; иначе не можем отвергнуть.

Замечание: «не можем отвергнуть» ≠ «принимаем H0H_0». У вас просто недостаточно доказательств против неё.

Одновыборочный z-критерий (разобранный пример)

Завод утверждает, что его лампочки служат в среднем 1000 часов (σ=50\sigma = 50). Вы тестируете 25 лампочек и измеряете xˉ=980\bar x = 980. Опровергается ли утверждение при α=0.05\alpha = 0.05?

  1. H0:μ=1000H_0: \mu = 1000, H1:μ1000H_1: \mu \ne 1000.
  2. α=0.05\alpha = 0.05, двусторонний.
  3. Статистика критерия: z=xˉμ0σ/n=980100050/25=2010=2z = \frac{\bar x - \mu_0}{\sigma / \sqrt{n}} = \frac{980 - 1000}{50/\sqrt{25}} = \frac{-20}{10} = -2.
  4. p-значение: 2P(Z<2)20.0228=0.04562 \cdot P(Z < -2) \approx 2 \cdot 0.0228 = 0.0456.
  5. Поскольку 0.0456<0.050.0456 < 0.05, отвергаем H0H_0. Среднее время службы значимо отличается от 1000 часов.

Выбор подходящего критерия

СитуацияКритерий
Одно среднее, σ\sigma известнаодновыборочный z-критерий
Одно среднее, σ\sigma неизвестна, n малоодновыборочный t-критерий
Два средних, независимые выборкидвухвыборочный t-критерий
Два связанных среднихпарный t-критерий
Доля(и)z-критерий для доли
Согласие / таблица сопряжённостихи-квадрат

Ошибка I рода vs ошибка II рода

  • I рода: отвергнуть верную H0H_0. Вероятность = α\alpha.
  • II рода: не отвергнуть ложную H0H_0. Вероятность = β\beta.
  • Мощность = 1β1 - \beta: вероятность правильно обнаружить реальный эффект.

Эти три величины движутся вместе: уменьшение α\alpha повышает β\beta при фиксированном объёме выборки; увеличение объёма выборки снижает оба.

Частые ошибки

  • «p-значение = вероятность того, что H0H_0 верна» — ложь. p-значение — это P(dataH0)P(\text{data} \mid H_0), а не P(H0data)P(H_0 \mid \text{data}).
  • Множественные сравнения — проведение 20 тестов при α=0.05\alpha = 0.05 гарантирует ≈1 ложноположительный результат в среднем. Используйте поправку.
  • Смешение значимости с важностью — крошечный эффект при огромном nn может быть высоко значимым, но практически несущественным.

Попробуйте с ИИ-решателем проверки гипотез

Используйте решатель проверки гипотез, чтобы ввести свои данные и получить статистику критерия, p-значение и решение.

Связанные материалы:

AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-01

A small team of engineers, mathematicians, and educators behind AI-Math, focused on making step-by-step math help accessible to every student.