Der Hypothesentest ist ein Rahmen, um mit Stichprobendaten zwischen zwei konkurrierenden Aussagen über eine Population zu entscheiden:
- Nullhypothese : die voreingestellte / „nichts Interessantes“-Aussage (z. B. die Münze ist fair, das Medikament hat keine Wirkung).
- Alternativhypothese : was wir vermuten / zeigen möchten.
Vorgehen:
- und formulieren.
- Ein Signifikanzniveau wählen (üblicherweise 0,05) — die Wahrscheinlichkeit einer fälschlichen Ablehnung (Fehler 1. Art).
- Eine Teststatistik aus den Daten berechnen (z-Wert, t-Statistik, Chi-Quadrat, F-Verhältnis).
- Den p-Wert berechnen — die Wahrscheinlichkeit unter , mindestens so extreme Daten zu beobachten.
- Entscheiden: falls , verwerfen; andernfalls nicht verwerfen.
Zwei Fehlerarten:
- Fehler 1. Art: eine wahre verwerfen (Wahrscheinlichkeit ).
- Fehler 2. Art: eine falsche nicht verwerfen (Wahrscheinlichkeit ); ist die Teststärke (Power).
Häufige Verwechslung: „nicht verwerfen“ ≠ „ annehmen“. Fehlende Evidenz ist keine Evidenz für Abwesenheit — kleine Stichprobenumfänge können echte Effekte verbergen.
Dieser Rahmen liegt klinischen Studien, A/B-Tests, der Qualitätskontrolle und den meisten veröffentlichten Aussagen über „statistische Signifikanz“ zugrunde.