La variance mesure à quel point les valeurs d'un jeu de données s'écartent de la moyenne. Pour une population de valeurs de moyenne :
Pour un échantillon de valeurs de moyenne empirique , on divise par au lieu de (correction de Bessel, un estimateur sans biais).
Une variance faible signifie que les valeurs sont regroupées près de la moyenne ; une variance élevée signifie qu'elles sont dispersées. La variance s'exprime dans les unités au carré des données d'origine (kg² si les données sont en kg) — c'est pourquoi on rapporte habituellement l'écart-type , qui a les mêmes unités que les données.
La variance est à la base de toute la statistique inférentielle : les intervalles de confiance, les tests d'hypothèses et la régression dépendent tous de l'estimation de la variance. Le compromis biais-variance en apprentissage automatique tient son nom d'elle.