Die Standardabweichung ist das am häufigsten missverstandene Konzept der einführenden Statistik. Die Leute wissen, dass sie „die Streuung misst“, erstarren aber, wenn man fragt, was die Zahl eigentlich bedeutet. Dieser Leitfaden erklärt sie auf drei Arten — geometrisch, rechnerisch und intuitiv —, damit du beim nächsten Mal, wenn du $\sigma$ in einer Arbeit oder einem Bericht siehst, wirklich verstehst, was dort steht.

Definition in klarer Sprache

Die Standardabweichung beantwortet: Wie weit liegt im Durchschnitt jeder Datenpunkt vom Mittelwert entfernt?

Symbolisch, für eine Grundgesamtheit von $N$ Werten $x_1, \ldots, x_N$ mit Mittelwert $\mu$ :

$\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^N (x_i - \mu)^2}$

Laut vorgelesen: „mittlere quadrierte Abweichung, dann Quadratwurzel.“

Warum quadrieren und dann die Wurzel ziehen?

Ein vernünftiger erster Versuch für „durchschnittlicher Abstand vom Mittelwert“ wäre $\frac{1}{N}\sum |x_i - \mu|$ — die mittlere absolute Abweichung. Sie funktioniert, und Statistiker verwenden sie manchmal (sie ist robuster gegenüber Ausreißern).

Aber der Betrag ist mathematisch unhandlich — er ist bei null nicht differenzierbar, Ableitungen explodieren, und man kann damit nicht sauber Analysis betreiben. Das Quadrieren umgeht all das, und die Quadratwurzel am Ende bringt die Einheiten zurück auf die ursprüngliche Skala (sodass $\sigma$ in Euro angegeben wird, wenn $x$ in Euro ist, nicht in Euro²).

Aus demselben Grund verwendet maschinelles Lernen den quadratischen Verlust (mittlerer quadratischer Fehler) — das Quadrieren ist differenzierbar, harmoniert mit der Analysis, und die resultierenden Schätzer sind oft optimal.

Grundgesamtheit vs. Stichprobe — die Sache mit $n-1$ vs. $n$

Es gibt zwei Formeln, und der Unterschied ist wichtig:

Grundgesamtheit (du hast alle Daten): teile durch $N$ . Symbol $\sigma$ .
Stichprobe (du hast eine Stichprobe und willst die Grundgesamtheit schätzen): teile durch $n - 1$ . Symbol $s$ .

Das $n - 1$ in der Stichprobenformel ist die Bessel-Korrektur. Warum? Mit $n$ würde man die Standardabweichung der Grundgesamtheit systematisch unterschätzen, weil man den Stichprobenmittelwert verwendet hat (der konstruktionsbedingt die beste Anpassung an die Stichprobe ist), wodurch die Abweichungen kleiner ausfallen, als sie gegenüber dem wahren Mittelwert der Grundgesamtheit wären. Das Teilen durch $n - 1$ statt $n$ gleicht das genau aus.

Die meisten Taschenrechner und Programme verwenden standardmäßig die Stichprobenformel. Achte darauf.

Durchgerechnetes Beispiel 1: kleiner symmetrischer Datensatz

Daten: $\{2, 4, 4, 4, 5, 5, 7, 9\}$ . (8 Werte; klassisches Lehrbuchbeispiel.)

Mittelwert: $\bar{x} = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5$ .
Abweichungen vom Mittelwert: $-3, -1, -1, -1, 0, 0, 2, 4$ .
Quadrierte Abweichungen: $9, 1, 1, 1, 0, 0, 4, 16$ .
Summe: $32$ .
Grundgesamtheit ( $N = 8$ ): Varianz $= 32/8 = 4$ , $\sigma = 2$ .
Stichprobe ( $n - 1 = 7$ ): Varianz $= 32/7 \approx 4{,}57$ , $s \approx 2{,}14$ .

Die 68-95-99,7-Regel (nur für Normalverteilungen)

Wenn deine Daten näherungsweise normalverteilt (glockenförmig) sind:

$\approx 68\%$ der Werte liegen innerhalb von $1\sigma$ um den Mittelwert.
$\approx 95\%$ innerhalb von $2\sigma$ .
$\approx 99{,}7\%$ innerhalb von $3\sigma$ .

Deshalb ist „ $\pm 2\sigma$ “ oder „zwei Sigma“ die übliche umgangssprachliche Definition von „statistisch ungewöhnlich“.

⚠️ Warnung: Diese Regel gilt nur für Normalverteilungen. Bei schiefen oder schwerschwänzigen Daten (Einkommen, Reaktionszeit) könnte $1\sigma$ 80 % der Daten abdecken — oder 50 %. Prüfe immer die Form der Verteilung (Histogramm, QQ-Plot), bevor du die 68-95-99,7-Zahlen zitierst.

Standardabweichung vs. Varianz

Die Varianz ist einfach $\sigma^2$ . Sie enthalten identische Informationen — warum also beide?

Die Standardabweichung hat dieselben Einheiten wie die Daten — interpretierbar.
Die Varianz zerlegt sich additiv für unabhängige Variablen ( $\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y)$ bei Unabhängigkeit), was sie zur algebraisch bequemen Größe für Beweise, Erwartungswerte und Varianzanalyse macht.

Verwende $\sigma$ beim Berichten; verwende $\sigma^2$ beim Rechnen.

Häufige Fehler

$\sigma$ ohne Kontext zitieren. „ $\sigma = 5$ “ bedeutet nichts, wenn man den Mittelwert nicht kennt. Gib stets beides an: „Mittelwert $= 100$ , $\sigma = 5$ .“
Formeln für Grundgesamtheit und Stichprobe vermischen. Bei kleinen Stichproben macht es einen echten Unterschied. Bei großen Stichproben ( $n > 100$ ) ist der Unterschied vernachlässigbar.
Empfindlichkeit gegenüber Ausreißern vergessen. Ein einziger Extremwert kann $\sigma$ aufblähen. Bei schwerschwänzigen Daten gib zusätzlich die mittlere absolute Abweichung um den Median (MAD) für Robustheit an.
68-95-99,7 auf nicht normalverteilte Daten anwenden. Siehe oben.

Probiere es selbst

Gib einen beliebigen Datensatz in unseren kostenlosen Standardabweichungsrechner ein — wähle Grundgesamtheit oder Stichprobe, sieh die schrittweise Berechnung und prüfe sie gegen diesen Leitfaden.

Verwandtes Material:

Die Standardabweichung verstehen — ohne Tränen

Die Standardabweichung in klarer Sprache: was sie wirklich misst, der Unterschied zwischen Grundgesamtheit und Stichprobe, die 68-95-99,7-Regel und drei durchgerechnete Beispiele, die du nachprüfen kannst.

Definition in klarer Sprache

Warum quadrieren und dann die Wurzel ziehen?

Grundgesamtheit vs. Stichprobe — die Sache mit $n-1$ vs. $n$

Durchgerechnetes Beispiel 1: kleiner symmetrischer Datensatz

Die 68-95-99,7-Regel (nur für Normalverteilungen)

Standardabweichung vs. Varianz

Häufige Fehler

Probiere es selbst

Die Standardabweichung verstehen — ohne Tränen

Die Standardabweichung in klarer Sprache: was sie wirklich misst, der Unterschied zwischen Grundgesamtheit und Stichprobe, die 68-95-99,7-Regel und drei durchgerechnete Beispiele, die du nachprüfen kannst.

Definition in klarer Sprache

Warum quadrieren und dann die Wurzel ziehen?

Grundgesamtheit vs. Stichprobe — die Sache mit n−1n-1n−1 vs. nnn

Durchgerechnetes Beispiel 1: kleiner symmetrischer Datensatz

Die 68-95-99,7-Regel (nur für Normalverteilungen)

Standardabweichung vs. Varianz

Häufige Fehler

Probiere es selbst

Grundgesamtheit vs. Stichprobe — die Sache mit $n-1$ vs. $n$