Un punteggio z (punteggio standard) è la distanza di un valore dalla media espressa in unità di deviazioni standard:
(usa e per i dati campionari).
Un punteggio z di significa "due deviazioni standard sopra la media"; significa "1,5 sotto".
I punteggi z permettono di:
- Confrontare valori di distribuzioni diverse — uno studente che prende 80 al Test A () è più notevole (z=2) di un 80 al Test B (, z=0,5).
- Cercare probabilità in una tavola normale standard — P() ≈ 0,975, la base dell'IC al 95%.
- Individuare valori anomali — per convenzione segnala un'osservazione insolita in dati approssimativamente normali.
La standardizzazione (calcolo del punteggio z) è anche un passo fondamentale di pre-elaborazione nel machine learning: scalare gli input a media 0 e deviazione standard 1 aiuta la discesa del gradiente a convergere e impedisce che caratteristiche con unità più grandi (per es. reddito in dollari vs età in anni) dominino i modelli basati sulla distanza.