statistics

Punteggio z (punteggio standard)

Un punteggio z misura di quante deviazioni standard un valore si trova sopra o sotto la media. z = (x − μ) / σ. Usato per confrontare valori tra distribuzioni e per ricerche di probabilità.

Un punteggio z (punteggio standard) è la distanza di un valore dalla media espressa in unità di deviazioni standard:

z=xμσz = \frac{x - \mu}{\sigma}

(usa xˉ\bar{x} e ss per i dati campionari).

Un punteggio z di +2+2 significa "due deviazioni standard sopra la media"; 1.5-1.5 significa "1,5 sotto".

I punteggi z permettono di:

  • Confrontare valori di distribuzioni diverse — uno studente che prende 80 al Test A (μ=70,σ=5\mu=70, \sigma=5) è più notevole (z=2) di un 80 al Test B (μ=75,σ=10\mu=75, \sigma=10, z=0,5).
  • Cercare probabilità in una tavola normale standard — P(Z<1.96Z < 1.96) ≈ 0,975, la base dell'IC al 95%.
  • Individuare valori anomali — per convenzione z>3|z| > 3 segnala un'osservazione insolita in dati approssimativamente normali.

La standardizzazione (calcolo del punteggio z) è anche un passo fondamentale di pre-elaborazione nel machine learning: scalare gli input a media 0 e deviazione standard 1 aiuta la discesa del gradiente a convergere e impedisce che caratteristiche con unità più grandi (per es. reddito in dollari vs età in anni) dominino i modelli basati sulla distanza.