statistics

Проверка статистических гипотез

Проверка статистических гипотез выбирает между двумя конкурирующими утверждениями о генеральной совокупности на основе выборочных данных. Мы вычисляем статистику критерия и отвергаем нулевую гипотезу, если p-значение мало.

Проверка статистических гипотез — это схема использования выборочных данных для выбора между двумя конкурирующими утверждениями о генеральной совокупности:

  • Нулевая гипотеза H0H_0: утверждение по умолчанию / «ничего интересного» (например, монета честная, лекарство не действует).
  • Альтернативная гипотеза HaH_a: то, что мы подозреваем / хотим продемонстрировать.

Процедура:

  1. Сформулировать H0H_0 и HaH_a.
  2. Выбрать уровень значимости α\alpha (обычно 0,05) — вероятность ошибочного отклонения (ошибка I рода).
  3. Вычислить статистику критерия по данным (z-оценка, t-статистика, хи-квадрат, F-отношение).
  4. Вычислить p-значение — вероятность при H0H_0 получить данные не менее экстремальные.
  5. Принять решение: если p<αp < \alpha, отвергнуть H0H_0; иначе не отвергать.

Два типа ошибок:

  • Ошибка I рода: отклонение истинной H0H_0 (вероятность α\alpha).
  • Ошибка II рода: неотклонение ложной H0H_0 (вероятность β\beta); 1β1 - \beta — это мощность критерия.

Распространённое смешение понятий: «не отвергнуть» ≠ «принять H0H_0». Отсутствие доказательств не есть доказательство отсутствия — малые объёмы выборки могут скрывать реальные эффекты.

Эта схема лежит в основе клинических испытаний, A/B-тестов, контроля качества и большинства публикуемых утверждений о «статистической значимости».