statistics

Доверительный интервал

Доверительный интервал даёт диапазон правдоподобных значений для параметра генеральной совокупности с заявленным уровнем доверия (например, 95 %), который описывает долгосрочную надёжность процедуры.

Доверительный интервал (ДИ) — это диапазон правдоподобных значений для параметра генеральной совокупности (например, среднего, доли), построенный по выборочным данным с заявленным уровнем доверия (обычно 95 %).

Для среднего совокупности при известном σ\sigma 95-процентный ДИ равен

xˉ±1.96σn\bar{x} \pm 1.96 \cdot \frac{\sigma}{\sqrt{n}}

где 1.961.96 — 97,5-й процентиль стандартного нормального распределения (соответствует 95 %).

Правильная интерпретация: «Если бы мы повторили эту процедуру выборки много раз и каждый раз строили ДИ, то примерно 95 % этих ДИ содержали бы истинный параметр». Это утверждение о долгосрочной надёжности процедуры, а не о конкретном интервале.

Распространённое заблуждение (которое вдалбливает каждый преподаватель статистики): «Вероятность того, что истинное значение лежит в этом конкретном интервале, равна 95 %». Неверно — параметр фиксирован; случаен именно интервал.

Уровень доверия задаёт компромисс:

  • 99-процентный ДИ: больше уверенности, более широкий интервал.
  • 90-процентный ДИ: уже, меньше уверенности.

ДИ — современная альтернатива p-значениям: они передают ту же информацию о статистической значимости плюс величину эффекта.