Der Hypothesentest ist ein Rahmen, um mit Stichprobendaten zwischen zwei konkurrierenden Aussagen über eine Population zu entscheiden:

Nullhypothese $H_0$ : die voreingestellte / „nichts Interessantes“-Aussage (z. B. die Münze ist fair, das Medikament hat keine Wirkung).
Alternativhypothese $H_a$ : was wir vermuten / zeigen möchten.

Vorgehen:

$H_0$ und $H_a$ formulieren.
Ein Signifikanzniveau $\alpha$ wählen (üblicherweise 0,05) — die Wahrscheinlichkeit einer fälschlichen Ablehnung (Fehler 1. Art).
Eine Teststatistik aus den Daten berechnen (z-Wert, t-Statistik, Chi-Quadrat, F-Verhältnis).
Den p-Wert berechnen — die Wahrscheinlichkeit unter $H_0$ , mindestens so extreme Daten zu beobachten.
Entscheiden: falls $p < \alpha$ , $H_0$ verwerfen; andernfalls nicht verwerfen.

Zwei Fehlerarten:

Fehler 1. Art: eine wahre $H_0$ verwerfen (Wahrscheinlichkeit $\alpha$ ).
Fehler 2. Art: eine falsche $H_0$ nicht verwerfen (Wahrscheinlichkeit $\beta$ ); $1 - \beta$ ist die Teststärke (Power).

Häufige Verwechslung: „nicht verwerfen“ ≠ „ $H_0$ annehmen“. Fehlende Evidenz ist keine Evidenz für Abwesenheit — kleine Stichprobenumfänge können echte Effekte verbergen.

Dieser Rahmen liegt klinischen Studien, A/B-Tests, der Qualitätskontrolle und den meisten veröffentlichten Aussagen über „statistische Signifikanz“ zugrunde.

Hypothesentest

Der Hypothesentest entscheidet anhand von Stichprobendaten zwischen zwei konkurrierenden Aussagen über eine Population. Wir berechnen eine Teststatistik und verwerfen die Nullhypothese, wenn der p-Wert klein ist.