p-Wert-Rechner

Berechne und interpretiere p-Werte für Hypothesentests mit KI-gestützten Schritt-für-Schritt-Lösungen

Ziehen und ablegen oder klicken , um Bilder oder PDF hinzuzufügen

Math Input
p-value for z = 2.1 two-tailed
p-value for t = 1.8 with 19 degrees of freedom, right-tailed
p-value for chi-square = 7.5 with 3 df
Is p = 0.03 significant at alpha = 0.05?

Was ist ein p-Wert?

Ein p-Wert ist die Wahrscheinlichkeit, Testergebnisse zu beobachten, die so extrem oder extremer sind als die tatsächlichen Ergebnisse — unter der Annahme, dass die Nullhypothese H0H_0 wahr ist.

Formal, für eine Teststatistik TT mit beobachtetem Wert tt:

  • Rechtsseitig: p=P(TtH0)p = P(T \geq t \mid H_0)
  • Linksseitig: p=P(TtH0)p = P(T \leq t \mid H_0)
  • Zweiseitig: p=2P(TtH0)p = 2 \cdot P(T \geq |t| \mid H_0)

Interpretation: Ein kleiner p-Wert bedeutet, dass die beobachteten Daten überraschend wären, wenn H0H_0 wahr wäre, also haben wir Belege gegen H0H_0. Ein großer p-Wert bedeutet, dass die Daten mit H0H_0 vereinbar sind — beweist aber nicht, dass H0H_0 wahr ist.

Entscheidungsregel: Vergleiche pp mit einem vorab gewählten Signifikanzniveau α\alpha (typischerweise 0,05):

  • p<αp < \alphaH0H_0 verwerfen ('statistisch signifikant')
  • pαp \geq \alphaH0H_0 nicht verwerfen (nicht genügend Belege)

Was der p-Wert NICHT ist:

  • Er ist nicht die Wahrscheinlichkeit, dass H0H_0 wahr ist.
  • Er ist nicht die Wahrscheinlichkeit, dass die Alternative H1H_1 wahr ist.
  • Er ist kein Maß für die Effektgröße.
  • Er unterscheidet nicht 'praktische Signifikanz' von 'statistischer Signifikanz'.

So berechnet und verwendet man p-Werte

Schritt für Schritt

  1. Stelle die Hypothesen H0H_0 und H1H_1 auf.
  2. Wähle einen Test, der für die Daten geeignet ist (z-Test, t-Test, Chi-Quadrat, F-Test, ...).
  3. Berechne die Teststatistik aus den Daten.
  4. Bestimme die Schwänze anhand von H1H_1: rechtsseitig (>>), linksseitig (<<) oder zweiseitig (\neq).
  5. Finde den p-Wert aus der Verteilung des Tests.
  6. Vergleiche mit α\alpha und schließe.

p-Werte aus einer z-Statistik

Für eine standardnormalverteilte ZZ:

  • Rechtsseitig: p=1Φ(z)p = 1 - \Phi(z)
  • Linksseitig: p=Φ(z)p = \Phi(z)
  • Zweiseitig: p=2(1Φ(z))p = 2(1 - \Phi(|z|))

Schnellreferenz: z=1.96z = 1.96 → zweiseitig p0.05p \approx 0.05. z=2.576z = 2.576 → zweiseitig p0.01p \approx 0.01.

p-Werte aus einer t-Statistik

Nutze die t-Verteilung mit n1n - 1 Freiheitsgraden (oder wie vom Test vorgegeben). Gleiche Schwanz-Logik wie bei z, aber die Verteilung hat bei kleinen Freiheitsgraden etwas schwerere Schwänze.

p-Werte aus einer Chi-Quadrat-Statistik

Chi-Quadrat-Tests sind von Natur aus rechtsseitig, da χ20\chi^2 \geq 0 und größere Werte eine schlechtere Anpassung an H0H_0 anzeigen:

p=P(χdf2beobachtet)p = P(\chi^2_{df} \geq \text{beobachtet})

Einseitig vs. zweiseitig: Welcher ist zu verwenden?

  • Zweiseitig: wenn dich eine Abweichung von H0H_0 in beide Richtungen interessiert. Standard in den meisten akademischen Kontexten.
  • Einseitig: wenn die Alternativhypothese gerichtet und vorab festgelegt ist (H1:μ>0H_1: \mu > 0, nicht μ0\mu \neq 0). Halbiert den p-Wert, wenn die Richtung übereinstimmt.

Wähle den Schwanz nie nach dem Betrachten der Daten — das ist p-Hacking.

Häufige Signifikanzschwellen

α\alphaÜbliche Bezeichnung
0.10hinweisend
0.05Standard
0.01stark
0.001sehr stark

Die American Statistical Association hat davor gewarnt, α=0.05\alpha = 0.05 als scharfe Grenze zu behandeln — Kontext und Effektgröße sind wichtiger als das Überschreiten einer Schwelle.

Häufige Fehler, die man vermeiden sollte

  • 'Der p-Wert ist die Wahrscheinlichkeit, dass H0H_0 wahr ist': FALSCH. Der p-Wert wird unter der Annahme berechnet, dass H0H_0 wahr ist; er misst nicht, wie wahrscheinlich H0H_0 ist.
  • p=0.049p = 0.049 und p=0.051p = 0.051 als grundlegend verschieden behandeln: Sind sie nicht. Die 0,05-Schwelle ist eine Konvention, kein Phasenübergang.
  • Den Schwanz nach dem Betrachten der Daten wählen: Wenn du z=2z = -2 siehst und zu einem linksseitigen Test wechselst, hast du deine Falsch-Positiv-Rate verdoppelt. Lege es vorab fest.
  • Signifikanz mit Effektgröße verwechseln: Ein winziger Effekt mit einer riesigen Stichprobe kann 'hochsignifikant' sein, aber praktisch irrelevant. Berichte immer Effektgrößen zusammen mit p-Werten.
  • Inflation bei multiplen Vergleichen: Führt man 20 Tests bei α=0.05\alpha = 0.05 durch, ist ein Falsch-Positiv zufällig zu erwarten. Nutze Bonferroni- oder FDR-Korrekturen.
  • 'p>0.05p > 0.05 beweist H0H_0': NEIN. Nicht-Verwerfen ist nicht dasselbe wie Akzeptieren. Es bedeutet nur, dass die Daten bei diesem Stichprobenumfang nicht genug Belege gegen H0H_0 haben.

Examples

Step 1: Schlage Φ(2.1)0.9821\Phi(2.1) \approx 0.9821 nach
Step 2: Rechtsseitige Wahrscheinlichkeit: 10.9821=0.01791 - 0.9821 = 0.0179
Step 3: Zweiseitiger p-Wert: 2×0.0179=0.03582 \times 0.0179 = 0.0358
Answer: p0.0358p \approx 0.0358 (signifikant bei α=0.05\alpha = 0.05)

Step 1: Nutze die t-Verteilung mit df=19df = 19
Step 2: Aus t-Tabellen: P(T191.8)0.0438P(T_{19} \geq 1.8) \approx 0.0438
Step 3: Vergleiche mit gängigen Schwellen: signifikant bei α=0.05\alpha = 0.05, nicht bei α=0.01\alpha = 0.01
Answer: p0.044p \approx 0.044 (signifikant bei α=0.05\alpha = 0.05)

Step 1: Chi-Quadrat ist rechtsseitig
Step 2: P(χ327.5)P(\chi^2_3 \geq 7.5) aus der Chi-Quadrat-Tabelle
Step 3: Kritische Werte für df = 3: χ0.102=6.25\chi^2_{0.10} = 6.25, χ0.052=7.81\chi^2_{0.05} = 7.81
Step 4: 7.57.5 liegt dazwischen, also 0.05<p<0.100.05 < p < 0.10
Step 5: Genauer: p0.058p \approx 0.058
Answer: p0.058p \approx 0.058 (nicht signifikant bei α=0.05\alpha = 0.05, hinweisend bei α=0.10\alpha = 0.10)

Frequently Asked Questions

Es bedeutet, dass die beobachteten Daten (oder extremere Daten) in weniger als 5% wiederholter Stichproben auftreten würden, wenn die Nullhypothese wahr wäre. Konventionsgemäß wird das als 'statistisch signifikant' behandelt — aber es bedeutet nicht, dass die Nullhypothese notwendigerweise falsch ist, und es misst nicht die Größe des Effekts.

Der p-Wert wird *unter der Annahme* berechnet, dass H₀ wahr ist — er ist bedingt auf H₀. Die Berechnung von P(H₀ wahr | Daten) erfordert Bayessche Methoden mit einer A-priori-Wahrscheinlichkeit für H₀, die der frequentistische p-Wert nicht verwendet.

Nur wenn die Forschungsfrage wirklich gerichtet und vor dem Betrachten der Daten festgelegt ist — z. B. muss ein neues Medikament *besser* als ein Placebo abschneiden, um nützlich zu sein, wobei schlechtere Leistung gleichbedeutend mit keinem Effekt ist. Den Schwanz nachträglich zu wählen ist p-Hacking.

p-Hacking ist die Praxis, viele Analysen (verschiedene Teilmengen, Transformationen, Ausschlüsse) durchzuführen und nur die signifikanten zu berichten, oder die Testrichtungen nach dem Betrachten der Daten zu wechseln. Es bläht die Falsch-Positiv-Raten auf und trägt maßgeblich zur Replikationskrise bei.

Related Solvers

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving