statistics

Konfidenzintervall

Ein Konfidenzintervall gibt einen Bereich plausibler Werte für einen Populationsparameter an, mit einem angegebenen Konfidenzniveau (z. B. 95 %), das die langfristige Zuverlässigkeit des Verfahrens beschreibt.

Ein Konfidenzintervall (KI) ist ein Bereich plausibler Werte für einen Populationsparameter (z. B. Mittelwert, Anteil), der aus Stichprobendaten mit einem angegebenen Konfidenzniveau (üblicherweise 95 %) konstruiert wird.

Für einen Populationsmittelwert mit bekanntem σ\sigma lautet das 95-%-KI

xˉ±1.96σn\bar{x} \pm 1.96 \cdot \frac{\sigma}{\sqrt{n}}

wobei 1.961.96 das 97,5-Perzentil der Standardnormalverteilung ist (entspricht 95 %).

Korrekte Deutung: „Würden wir dieses Stichprobenverfahren viele Male wiederholen und jedes Mal ein KI bilden, so enthielten etwa 95 % dieser KIs den wahren Parameter.“ Es ist eine Aussage über die langfristige Zuverlässigkeit des Verfahrens, nicht über das konkrete Intervall.

Häufige Fehldeutung (von jedem Statistiklehrer eingebläut): „Mit 95 % Wahrscheinlichkeit liegt der wahre Wert in diesem konkreten Intervall.“ Falsch — der Parameter ist fest; das Intervall ist zufällig.

Das Konfidenzniveau steuert einen Kompromiss:

  • 99-%-KI: zuversichtlicher, breiteres Intervall.
  • 90-%-KI: schmaler, weniger zuversichtlich.

KIs sind die moderne Alternative zu p-Werten: Sie vermitteln dieselbe Information über die statistische Signifikanz plus die Größe des Effekts.