Z-оценка (стандартизированная оценка) — это расстояние значения от среднего, выраженное в единицах стандартного отклонения:
(для выборочных данных используйте и ).
Z-оценка означает «на два стандартных отклонения выше среднего»; — «на 1,5 ниже».
Z-оценки позволяют:
- Сравнивать значения из разных распределений — ученик, набравший 80 на тесте A (), показывает более впечатляющий результат (z=2), чем 80 на тесте B (, z=0,5).
- Находить вероятности по таблице стандартного нормального распределения — P() ≈ 0,975, основа 95-процентного ДИ.
- Выявлять выбросы — по соглашению помечает необычное наблюдение в приблизительно нормальных данных.
Стандартизация (вычисление z-оценок) — также фундаментальный шаг предобработки в машинном обучении: масштабирование входных данных к среднему 0 и стандартному отклонению 1 помогает градиентному спуску сходиться и не даёт признакам с более крупными единицами измерения (например, доход в долларах против возраста в годах) доминировать в моделях, основанных на расстоянии.