Z-оценка (стандартизированная оценка) — это расстояние значения от среднего, выраженное в единицах стандартного отклонения:

$z = \frac{x - \mu}{\sigma}$

(для выборочных данных используйте $\bar{x}$ и $s$ ).

Z-оценка $+2$ означает «на два стандартных отклонения выше среднего»; $-1.5$ — «на 1,5 ниже».

Z-оценки позволяют:

Сравнивать значения из разных распределений — ученик, набравший 80 на тесте A ( $\mu=70, \sigma=5$ ), показывает более впечатляющий результат (z=2), чем 80 на тесте B ( $\mu=75, \sigma=10$ , z=0,5).
Находить вероятности по таблице стандартного нормального распределения — P( $Z < 1.96$ ) ≈ 0,975, основа 95-процентного ДИ.
Выявлять выбросы — по соглашению $|z| > 3$ помечает необычное наблюдение в приблизительно нормальных данных.

Стандартизация (вычисление z-оценок) — также фундаментальный шаг предобработки в машинном обучении: масштабирование входных данных к среднему 0 и стандартному отклонению 1 помогает градиентному спуску сходиться и не даёт признакам с более крупными единицами измерения (например, доход в долларах против возраста в годах) доминировать в моделях, основанных на расстоянии.

Z-оценка (стандартизированная оценка)