Колоколообразная кривая — самый часто используемый паттерн во всей статистике: рост, баллы IQ, шум измерений и десятки природных явлений группируются вокруг среднего и симметрично сужаются по краям. Эта статья сначала даёт вам интуицию, а затем формулы, которые действительно нужны.
Что означает «нормальное»
Случайная величина распределена нормально со средним и стандартным отклонением , когда её плотность подчиняется:
Не заучивайте это — важна форма: симметричная относительно , с пиком в этой точке, быстро убывающая, причём два сигма уже заметно редки.
Почему она повсюду? Центральная предельная теорема
Причина — центральная предельная теорема (ЦПТ). Она утверждает: среднее многих независимых случайных воздействий стремится к нормальному распределению, независимо от того, как выглядит каждое отдельное воздействие.
Рост, например, определяется сотнями генетических и средовых факторов, каждый из которых вносит крошечный независимый вклад. Сумма приближается к колоколообразной кривой.
Правило 68-95-99,7
Для любого нормального распределения, независимо от или :
- 68 % данных попадает в
- 95 % в
- 99,7 % в
Это эмпирическое правило. Запомните его — оно отвечает на большинство экзаменационных вопросов за 10 секунд.
Разобранный пример
Рост взрослых мужчин в США имеет дюймов и дюйма. Какая доля мужчин имеет рост от 64 до 76 дюймов?
Этот диапазон равен , то есть 95 %.
Z-оценки: стандартизация любого нормального распределения
Чтобы сравнивать значения из разных нормальных распределений, переведите их в z-оценку:
Z-оценка — это «на сколько стандартных отклонений от среднего». Она позволяет использовать стандартное нормальное распределение для всех задач с помощью таблиц (или нашего калькулятора).
Пример z-оценки
Балл за тест взят из . Его z-оценка равна . По эмпирическому правилу лишь баллов превосходят этот.
Типичные ошибки
- Путаница между и : стандартное отклонение против дисперсии.
- Предположение, что все данные нормальны: это не так! Доход, размеры файлов и магнитуды землетрясений сильно скошены. Сначала всегда стройте гистограмму.
- Подстановка сырых чисел в эмпирическое правило — сначала переведите в z-оценки.
Попробуйте с ИИ-решателем нормального распределения
Используйте решатель нормального распределения для вычисления точных вероятностей — это лучше, чем читать таблицу на глаз.
Связанные материалы:
- Калькулятор стандартного отклонения — параметр разброса
- Калькулятор z-оценки — для стандартизации
- Среднее / медиана / мода — основы мер центральной тенденции