La varianza misura quanto i valori di un insieme di dati si disperdono rispetto alla media. Per una popolazione di valori con media :
Per un campione di valori con media campionaria , si divide per invece che per (correzione di Bessel, uno stimatore non distorto).
Una varianza piccola significa che i valori si raggruppano vicino alla media; una varianza grande significa che sono dispersi. La varianza è espressa nelle unità al quadrato dei dati originali (kg² se i dati sono in kg) — ecco perché di solito si riporta la deviazione standard , che ha le stesse unità dei dati.
La varianza è alla base di tutta la statistica inferenziale: intervalli di confidenza, test di ipotesi e regressione dipendono tutti dalla stima della varianza. Il compromesso distorsione-varianza nel machine learning prende il nome da essa.