Una puntuación z (puntuación estándar) es la distancia de un valor a la media expresada en unidades de desviaciones estándar:
(usa y para datos muestrales).
Una puntuación z de significa "dos desviaciones estándar por encima de la media"; significa "1,5 por debajo".
Las puntuaciones z permiten:
- Comparar valores de distintas distribuciones — un estudiante que saca 80 en el examen A () es más destacable (z=2) que un 80 en el examen B (, z=0,5).
- Consultar probabilidades en una tabla normal estándar — P() ≈ 0,975, la base del IC del 95 %.
- Identificar valores atípicos — por convención, señala una observación inusual en datos aproximadamente normales.
La estandarización (cálculo de la puntuación z) también es un paso fundamental de preprocesamiento en aprendizaje automático: escalar las entradas a media 0 y desviación 1 ayuda a que el descenso de gradiente converja y evita que las características con unidades mayores (p. ej. ingresos en dólares frente a edad en años) dominen los modelos basados en distancia.