Проверка статистических гипотез — это схема использования выборочных данных для выбора между двумя конкурирующими утверждениями о генеральной совокупности:
- Нулевая гипотеза : утверждение по умолчанию / «ничего интересного» (например, монета честная, лекарство не действует).
- Альтернативная гипотеза : то, что мы подозреваем / хотим продемонстрировать.
Процедура:
- Сформулировать и .
- Выбрать уровень значимости (обычно 0,05) — вероятность ошибочного отклонения (ошибка I рода).
- Вычислить статистику критерия по данным (z-оценка, t-статистика, хи-квадрат, F-отношение).
- Вычислить p-значение — вероятность при получить данные не менее экстремальные.
- Принять решение: если , отвергнуть ; иначе не отвергать.
Два типа ошибок:
- Ошибка I рода: отклонение истинной (вероятность ).
- Ошибка II рода: неотклонение ложной (вероятность ); — это мощность критерия.
Распространённое смешение понятий: «не отвергнуть» ≠ «принять ». Отсутствие доказательств не есть доказательство отсутствия — малые объёмы выборки могут скрывать реальные эффекты.
Эта схема лежит в основе клинических испытаний, A/B-тестов, контроля качества и большинства публикуемых утверждений о «статистической значимости».