What are the steps of a hypothesis test?

(1) State the null hypothesis H₀ and alternative H₁; (2) choose a significance level α (commonly 0.05); (3) collect data and compute the test statistic; (4) calculate the p-value; (5) reject H₀ if p < α, otherwise fail to reject.

What does a p-value mean?

The p-value is the probability of observing a result as extreme as (or more extreme than) the computed statistic, assuming H₀ is true. A small p-value (below α) provides evidence against H₀, but does not prove H₁ is true.

What is the difference between Type I and Type II errors?

A Type I error (false positive) is rejecting H₀ when it is true; its probability equals α. A Type II error (false negative) is failing to reject H₀ when it is false; its probability is β. Statistical power is 1 − β.

AI-Math - Проверка гипотез шаг за шагом: от H0 к p-значению

Проверка гипотез — рабочая лошадка статистического вывода, применяемая повсюду: от клинических испытаний до A/B-тестов на сайтах. И всё же это самая неправильно понимаемая тема в статистике. Это руководство один раз — внятно — проходит весь конвейер, чтобы вы поняли, что на самом деле означает p-значение.

Пять шагов

Сформулируйте $H_0$ и $H_1$ : нулевую гипотезу (статус-кво) и альтернативную (утверждение, которое вы хотите подтвердить).
Выберите уровень значимости $\alpha$ : обычно 0,05 или 0,01.
Вычислите статистику критерия по вашим данным ( $z$ , $t$ , $\chi^2$ и т. д.).
Найдите p-значение: вероятность увидеть данные настолько экстремальные, если бы $H_0$ была верна.
Примите решение: если $p < \alpha$ , отвергаем $H_0$ ; иначе не можем отвергнуть.

Замечание: «не можем отвергнуть» ≠ «принимаем $H_0$ ». У вас просто недостаточно доказательств против неё.

Одновыборочный z-критерий (разобранный пример)

Завод утверждает, что его лампочки служат в среднем 1000 часов ( $\sigma = 50$ ). Вы тестируете 25 лампочек и измеряете $\bar x = 980$ . Опровергается ли утверждение при $\alpha = 0.05$ ?

$H_0: \mu = 1000$ , $H_1: \mu \ne 1000$ .
$\alpha = 0.05$ , двусторонний.
Статистика критерия: $z = \frac{\bar x - \mu_0}{\sigma / \sqrt{n}} = \frac{980 - 1000}{50/\sqrt{25}} = \frac{-20}{10} = -2$ .
p-значение: $2 \cdot P(Z < -2) \approx 2 \cdot 0.0228 = 0.0456$ .
Поскольку $0.0456 < 0.05$ , отвергаем $H_0$ . Среднее время службы значимо отличается от 1000 часов.

Выбор подходящего критерия

Ситуация	Критерий
Одно среднее, $\sigma$ известна	одновыборочный z-критерий
Одно среднее, $\sigma$ неизвестна, n мало	одновыборочный t-критерий
Два средних, независимые выборки	двухвыборочный t-критерий
Два связанных средних	парный t-критерий
Доля(и)	z-критерий для доли
Согласие / таблица сопряжённости	хи-квадрат

Ошибка I рода vs ошибка II рода

I рода: отвергнуть верную $H_0$ . Вероятность = $\alpha$ .
II рода: не отвергнуть ложную $H_0$ . Вероятность = $\beta$ .
Мощность = $1 - \beta$ : вероятность правильно обнаружить реальный эффект.

Эти три величины движутся вместе: уменьшение $\alpha$ повышает $\beta$ при фиксированном объёме выборки; увеличение объёма выборки снижает оба.

Частые ошибки

«p-значение = вероятность того, что $H_0$ верна» — ложь. p-значение — это $P(\text{data} \mid H_0)$ , а не $P(H_0 \mid \text{data})$ .
Множественные сравнения — проведение 20 тестов при $\alpha = 0.05$ гарантирует ≈1 ложноположительный результат в среднем. Используйте поправку.
Смешение значимости с важностью — крошечный эффект при огромном $n$ может быть высоко значимым, но практически несущественным.

Попробуйте с ИИ-решателем проверки гипотез

Используйте решатель проверки гипотез, чтобы ввести свои данные и получить статистику критерия, p-значение и решение.

Связанные материалы:

Калькулятор z-оценки — строительный блок любого z-критерия
Калькулятор стандартного отклонения — входной показатель изменчивости
Калькулятор нормального распределения — то, что предполагают z-критерии

Проверка гипотез шаг за шагом: от H0 к p-значению

Пять шагов

Одновыборочный z-критерий (разобранный пример)

Выбор подходящего критерия

Ошибка I рода vs ошибка II рода

Частые ошибки

Попробуйте с ИИ-решателем проверки гипотез

Frequently Asked Questions

What are the steps of a hypothesis test?

What are the steps of a hypothesis test?

What does a p-value mean?

What does a p-value mean?

What is the difference between Type I and Type II errors?

What is the difference between Type I and Type II errors?