Um escore z (escore padrão) é a distância de um valor até a média expressa em unidades de desvios padrão:
(use e para dados amostrais).
Um escore z de significa "dois desvios padrão acima da média"; significa "1,5 abaixo".
Os escores z permitem:
- Comparar valores de distribuições diferentes — um aluno que tira 80 na Prova A () é mais impressionante (z=2) do que 80 na Prova B (, z=0,5).
- Consultar probabilidades em uma tabela normal padrão — P() ≈ 0,975, a base do IC de 95%.
- Identificar valores atípicos — por convenção, sinaliza uma observação incomum em dados aproximadamente normais.
A padronização (cálculo do escore z) também é uma etapa fundamental de pré-processamento em aprendizado de máquina: escalar as entradas para média 0 e desvio padrão 1 ajuda o gradiente descendente a convergir e impede que características com unidades maiores (por exemplo, renda em dólares versus idade em anos) dominem modelos baseados em distância.