Die Varianz misst, wie weit die Werte eines Datensatzes vom Mittelwert streuen. Für eine Grundgesamtheit aus Werten mit Mittelwert :
Für eine Stichprobe aus Werten mit Stichprobenmittel teilt man durch statt durch (Bessel-Korrektur, ein erwartungstreuer Schätzer).
Eine kleine Varianz bedeutet, dass die Werte nahe am Mittelwert liegen; eine große Varianz bedeutet, dass sie gestreut sind. Die Varianz hat die quadrierten Einheiten der ursprünglichen Daten (kg², wenn die Daten in kg vorliegen) — deshalb berichten wir gewöhnlich die Standardabweichung , die dieselben Einheiten wie die Daten hat.
Die Varianz liegt der gesamten schließenden Statistik zugrunde: Konfidenzintervalle, Hypothesentests und Regression hängen alle von der Schätzung der Varianz ab. Der Verzerrung-Varianz-Kompromiss im maschinellen Lernen ist nach ihr benannt.