statistics

Z-оценка (стандартизированная оценка)

Z-оценка показывает, на сколько стандартных отклонений значение находится выше или ниже среднего. z = (x − μ) / σ. Используется для сравнения значений между распределениями и поиска вероятностей.

Z-оценка (стандартизированная оценка) — это расстояние значения от среднего, выраженное в единицах стандартного отклонения:

z=xμσz = \frac{x - \mu}{\sigma}

(для выборочных данных используйте xˉ\bar{x} и ss).

Z-оценка +2+2 означает «на два стандартных отклонения выше среднего»; 1.5-1.5 — «на 1,5 ниже».

Z-оценки позволяют:

  • Сравнивать значения из разных распределений — ученик, набравший 80 на тесте A (μ=70,σ=5\mu=70, \sigma=5), показывает более впечатляющий результат (z=2), чем 80 на тесте B (μ=75,σ=10\mu=75, \sigma=10, z=0,5).
  • Находить вероятности по таблице стандартного нормального распределения — P(Z<1.96Z < 1.96) ≈ 0,975, основа 95-процентного ДИ.
  • Выявлять выбросы — по соглашению z>3|z| > 3 помечает необычное наблюдение в приблизительно нормальных данных.

Стандартизация (вычисление z-оценок) — также фундаментальный шаг предобработки в машинном обучении: масштабирование входных данных к среднему 0 и стандартному отклонению 1 помогает градиентному спуску сходиться и не даёт признакам с более крупными единицами измерения (например, доход в долларах против возраста в годах) доминировать в моделях, основанных на расстоянии.