statistics

Die Standardabweichung verstehen — ohne Tränen

Die Standardabweichung in klarer Sprache: was sie wirklich misst, der Unterschied zwischen Grundgesamtheit und Stichprobe, die 68-95-99,7-Regel und drei durchgerechnete Beispiele, die du nachprüfen kannst.
AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

Die Standardabweichung ist das am häufigsten missverstandene Konzept der einführenden Statistik. Die Leute wissen, dass sie „die Streuung misst“, erstarren aber, wenn man fragt, was die Zahl eigentlich bedeutet. Dieser Leitfaden erklärt sie auf drei Arten — geometrisch, rechnerisch und intuitiv —, damit du beim nächsten Mal, wenn du σ\sigma in einer Arbeit oder einem Bericht siehst, wirklich verstehst, was dort steht.

Definition in klarer Sprache

Die Standardabweichung beantwortet: Wie weit liegt im Durchschnitt jeder Datenpunkt vom Mittelwert entfernt?

Symbolisch, für eine Grundgesamtheit von NN Werten x1,,xNx_1, \ldots, x_N mit Mittelwert μ\mu:

σ=1Ni=1N(xiμ)2\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^N (x_i - \mu)^2}

Laut vorgelesen: „mittlere quadrierte Abweichung, dann Quadratwurzel.“

Warum quadrieren und dann die Wurzel ziehen?

Ein vernünftiger erster Versuch für „durchschnittlicher Abstand vom Mittelwert“ wäre 1Nxiμ\frac{1}{N}\sum |x_i - \mu| — die mittlere absolute Abweichung. Sie funktioniert, und Statistiker verwenden sie manchmal (sie ist robuster gegenüber Ausreißern).

Aber der Betrag ist mathematisch unhandlich — er ist bei null nicht differenzierbar, Ableitungen explodieren, und man kann damit nicht sauber Analysis betreiben. Das Quadrieren umgeht all das, und die Quadratwurzel am Ende bringt die Einheiten zurück auf die ursprüngliche Skala (sodass σ\sigma in Euro angegeben wird, wenn xx in Euro ist, nicht in Euro²).

Aus demselben Grund verwendet maschinelles Lernen den quadratischen Verlust (mittlerer quadratischer Fehler) — das Quadrieren ist differenzierbar, harmoniert mit der Analysis, und die resultierenden Schätzer sind oft optimal.

Grundgesamtheit vs. Stichprobe — die Sache mit n1n-1 vs. nn

Es gibt zwei Formeln, und der Unterschied ist wichtig:

  • Grundgesamtheit (du hast alle Daten): teile durch NN. Symbol σ\sigma.
  • Stichprobe (du hast eine Stichprobe und willst die Grundgesamtheit schätzen): teile durch n1n - 1. Symbol ss.

Das n1n - 1 in der Stichprobenformel ist die Bessel-Korrektur. Warum? Mit nn würde man die Standardabweichung der Grundgesamtheit systematisch unterschätzen, weil man den Stichprobenmittelwert verwendet hat (der konstruktionsbedingt die beste Anpassung an die Stichprobe ist), wodurch die Abweichungen kleiner ausfallen, als sie gegenüber dem wahren Mittelwert der Grundgesamtheit wären. Das Teilen durch n1n - 1 statt nn gleicht das genau aus.

Die meisten Taschenrechner und Programme verwenden standardmäßig die Stichprobenformel. Achte darauf.

Durchgerechnetes Beispiel 1: kleiner symmetrischer Datensatz

Daten: {2,4,4,4,5,5,7,9}\{2, 4, 4, 4, 5, 5, 7, 9\}. (8 Werte; klassisches Lehrbuchbeispiel.)

  1. Mittelwert: xˉ=2+4+4+4+5+5+7+98=5\bar{x} = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.
  2. Abweichungen vom Mittelwert: 3,1,1,1,0,0,2,4-3, -1, -1, -1, 0, 0, 2, 4.
  3. Quadrierte Abweichungen: 9,1,1,1,0,0,4,169, 1, 1, 1, 0, 0, 4, 16.
  4. Summe: 3232.
  5. Grundgesamtheit (N=8N = 8): Varianz =32/8=4= 32/8 = 4, σ=2\sigma = 2.
  6. Stichprobe (n1=7n - 1 = 7): Varianz =32/74,57= 32/7 \approx 4{,}57, s2,14s \approx 2{,}14.

Die 68-95-99,7-Regel (nur für Normalverteilungen)

Wenn deine Daten näherungsweise normalverteilt (glockenförmig) sind:

  • 68%\approx 68\% der Werte liegen innerhalb von 1σ1\sigma um den Mittelwert.
  • 95%\approx 95\% innerhalb von 2σ2\sigma.
  • 99,7%\approx 99{,}7\% innerhalb von 3σ3\sigma.

Deshalb ist „±2σ\pm 2\sigma“ oder „zwei Sigma“ die übliche umgangssprachliche Definition von „statistisch ungewöhnlich“.

⚠️ Warnung: Diese Regel gilt nur für Normalverteilungen. Bei schiefen oder schwerschwänzigen Daten (Einkommen, Reaktionszeit) könnte 1σ1\sigma 80 % der Daten abdecken — oder 50 %. Prüfe immer die Form der Verteilung (Histogramm, QQ-Plot), bevor du die 68-95-99,7-Zahlen zitierst.

Standardabweichung vs. Varianz

Die Varianz ist einfach σ2\sigma^2. Sie enthalten identische Informationen — warum also beide?

  • Die Standardabweichung hat dieselben Einheiten wie die Daten — interpretierbar.
  • Die Varianz zerlegt sich additiv für unabhängige Variablen (Var(X+Y)=Var(X)+Var(Y)\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) bei Unabhängigkeit), was sie zur algebraisch bequemen Größe für Beweise, Erwartungswerte und Varianzanalyse macht.

Verwende σ\sigma beim Berichten; verwende σ2\sigma^2 beim Rechnen.

Häufige Fehler

  1. σ\sigma ohne Kontext zitieren. „σ=5\sigma = 5“ bedeutet nichts, wenn man den Mittelwert nicht kennt. Gib stets beides an: „Mittelwert =100= 100, σ=5\sigma = 5.“
  2. Formeln für Grundgesamtheit und Stichprobe vermischen. Bei kleinen Stichproben macht es einen echten Unterschied. Bei großen Stichproben (n>100n > 100) ist der Unterschied vernachlässigbar.
  3. Empfindlichkeit gegenüber Ausreißern vergessen. Ein einziger Extremwert kann σ\sigma aufblähen. Bei schwerschwänzigen Daten gib zusätzlich die mittlere absolute Abweichung um den Median (MAD) für Robustheit an.
  4. 68-95-99,7 auf nicht normalverteilte Daten anwenden. Siehe oben.

Probiere es selbst

Gib einen beliebigen Datensatz in unseren kostenlosen Standardabweichungsrechner ein — wähle Grundgesamtheit oder Stichprobe, sieh die schrittweise Berechnung und prüfe sie gegen diesen Leitfaden.

Verwandtes Material:

AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

A small team of engineers, mathematicians, and educators behind AI-Math, focused on making step-by-step math help accessible to every student.