Der Hypothesentest ist das Arbeitspferd der statistischen Inferenz und wird überall eingesetzt, von klinischen Studien bis zu A/B-Tests auf Websites. Dennoch ist er auch das am meisten missverstandene Thema der Statistik. Dieser Leitfaden durchläuft die gesamte Abfolge einmal — klar —, damit du verstehst, was ein p-Wert wirklich bedeutet.
Die fünf Schritte
- Stelle und auf: die Nullhypothese (Status quo) und die Alternative (die Behauptung, die du stützen möchtest).
- Wähle ein Signifikanzniveau : meist 0,05 oder 0,01.
- Berechne die Teststatistik aus deinen Daten (, , usw.).
- Bestimme den p-Wert: die Wahrscheinlichkeit, derart extreme Daten zu sehen, falls wahr wäre.
- Entscheide: Wenn , verwirf ; andernfalls kann nicht verworfen werden.
Hinweis: "nicht verwerfen" ≠ " akzeptieren". Du hast lediglich nicht genug Evidenz dagegen.
Einstichproben-z-Test (durchgerechnetes Beispiel)
Eine Fabrik behauptet, ihre Glühbirnen halten im Mittel 1000 Stunden (). Du testest 25 Glühbirnen und misst . Wird die Behauptung bei widerlegt?
- , .
- , zweiseitig.
- Teststatistik: .
- p-Wert: .
- Da , verwirf . Die mittlere Lebensdauer unterscheidet sich signifikant von 1000 Stunden.
Den richtigen Test wählen
| Situation | Test |
|---|---|
| Ein Mittelwert, bekannt | Einstichproben-z-Test |
| Ein Mittelwert, unbekannt, n klein | Einstichproben-t-Test |
| Zwei Mittelwerte, unabhängige Stichproben | Zweistichproben-t-Test |
| Zwei gepaarte Mittelwerte | gepaarter t-Test |
| Anteil(e) | z-Test für Anteile |
| Anpassungsgüte / Kontingenz | Chi-Quadrat |
Fehler 1. Art vs. Fehler 2. Art
- Fehler 1. Art: ein wahres verwerfen. Wahrscheinlichkeit = .
- Fehler 2. Art: ein falsches nicht verwerfen. Wahrscheinlichkeit = .
- Trennschärfe = : Wahrscheinlichkeit, einen realen Effekt korrekt zu erkennen.
Diese drei bewegen sich gemeinsam: Verkleinert man bei festem Stichprobenumfang, steigt ; vergrößert man den Stichprobenumfang, sinken beide.
Häufige Fehler
- "p-Wert = Wahrscheinlichkeit, dass wahr ist" — falsch. Der p-Wert ist , nicht .
- Mehrfachvergleiche — 20 Tests bei durchzuführen, garantiert im Mittel ≈1 falsch Positives. Verwende eine Korrektur.
- Signifikanz mit Bedeutsamkeit verwechseln — ein winziger Effekt mit riesigem kann hochsignifikant und doch praktisch irrelevant sein.
Mit dem KI-Hypothesentest-Löser ausprobieren
Verwende den Hypothesentest-Löser, um deine Daten einzugeben und Teststatistik, p-Wert und Entscheidung zu erhalten.
Verwandte Verweise:
- Z-Wert-Rechner — der Baustein jedes z-Tests
- Standardabweichungsrechner — die Streuungseingabe
- Normalverteilungsrechner — was z-Tests voraussetzen