AI-Math - p-Wert-Rechner

Was ist ein p-Wert?

Ein p-Wert ist die Wahrscheinlichkeit, Testergebnisse zu beobachten, die so extrem oder extremer sind als die tatsächlichen Ergebnisse — unter der Annahme, dass die Nullhypothese $H_0$ wahr ist.

Formal, für eine Teststatistik $T$ mit beobachtetem Wert $t$ :

Rechtsseitig: $p = P(T \geq t \mid H_0)$
Linksseitig: $p = P(T \leq t \mid H_0)$
Zweiseitig: $p = 2 \cdot P(T \geq |t| \mid H_0)$

Interpretation: Ein kleiner p-Wert bedeutet, dass die beobachteten Daten überraschend wären, wenn $H_0$ wahr wäre, also haben wir Belege gegen $H_0$ . Ein großer p-Wert bedeutet, dass die Daten mit $H_0$ vereinbar sind — beweist aber nicht, dass $H_0$ wahr ist.

Entscheidungsregel: Vergleiche $p$ mit einem vorab gewählten Signifikanzniveau $\alpha$ (typischerweise 0,05):

$p < \alpha$ → $H_0$ verwerfen ('statistisch signifikant')
$p \geq \alpha$ → $H_0$ nicht verwerfen (nicht genügend Belege)

Was der p-Wert NICHT ist:

Er ist nicht die Wahrscheinlichkeit, dass $H_0$ wahr ist.
Er ist nicht die Wahrscheinlichkeit, dass die Alternative $H_1$ wahr ist.
Er ist kein Maß für die Effektgröße.
Er unterscheidet nicht 'praktische Signifikanz' von 'statistischer Signifikanz'.

So berechnet und verwendet man p-Werte

Schritt für Schritt

Stelle die Hypothesen $H_0$ und $H_1$ auf.
Wähle einen Test, der für die Daten geeignet ist (z-Test, t-Test, Chi-Quadrat, F-Test, ...).
Berechne die Teststatistik aus den Daten.
Bestimme die Schwänze anhand von $H_1$ : rechtsseitig ( $>$ ), linksseitig ( $<$ ) oder zweiseitig ( $\neq$ ).
Finde den p-Wert aus der Verteilung des Tests.
Vergleiche mit $\alpha$ und schließe.

p-Werte aus einer z-Statistik

Für eine standardnormalverteilte $Z$ :

Rechtsseitig: $p = 1 - \Phi(z)$
Linksseitig: $p = \Phi(z)$
Zweiseitig: $p = 2(1 - \Phi(|z|))$

Schnellreferenz: $z = 1.96$ → zweiseitig $p \approx 0.05$ . $z = 2.576$ → zweiseitig $p \approx 0.01$ .

p-Werte aus einer t-Statistik

Nutze die t-Verteilung mit $n - 1$ Freiheitsgraden (oder wie vom Test vorgegeben). Gleiche Schwanz-Logik wie bei z, aber die Verteilung hat bei kleinen Freiheitsgraden etwas schwerere Schwänze.

p-Werte aus einer Chi-Quadrat-Statistik

Chi-Quadrat-Tests sind von Natur aus rechtsseitig, da $\chi^2 \geq 0$ und größere Werte eine schlechtere Anpassung an $H_0$ anzeigen:

$p = P(\chi^2_{df} \geq \text{beobachtet})$

Einseitig vs. zweiseitig: Welcher ist zu verwenden?

Zweiseitig: wenn dich eine Abweichung von $H_0$ in beide Richtungen interessiert. Standard in den meisten akademischen Kontexten.
Einseitig: wenn die Alternativhypothese gerichtet und vorab festgelegt ist ( $H_1: \mu > 0$ , nicht $\mu \neq 0$ ). Halbiert den p-Wert, wenn die Richtung übereinstimmt.

Wähle den Schwanz nie nach dem Betrachten der Daten — das ist p-Hacking.

Häufige Signifikanzschwellen

$\alpha$	Übliche Bezeichnung
0.10	hinweisend
0.05	Standard
0.01	stark
0.001	sehr stark

Die American Statistical Association hat davor gewarnt, $\alpha = 0.05$ als scharfe Grenze zu behandeln — Kontext und Effektgröße sind wichtiger als das Überschreiten einer Schwelle.

Häufige Fehler, die man vermeiden sollte

'Der p-Wert ist die Wahrscheinlichkeit, dass $H_0$ wahr ist': FALSCH. Der p-Wert wird unter der Annahme berechnet, dass $H_0$ wahr ist; er misst nicht, wie wahrscheinlich $H_0$ ist.
$p = 0.049$ und $p = 0.051$ als grundlegend verschieden behandeln: Sind sie nicht. Die 0,05-Schwelle ist eine Konvention, kein Phasenübergang.
Den Schwanz nach dem Betrachten der Daten wählen: Wenn du $z = -2$ siehst und zu einem linksseitigen Test wechselst, hast du deine Falsch-Positiv-Rate verdoppelt. Lege es vorab fest.
Signifikanz mit Effektgröße verwechseln: Ein winziger Effekt mit einer riesigen Stichprobe kann 'hochsignifikant' sein, aber praktisch irrelevant. Berichte immer Effektgrößen zusammen mit p-Werten.
Inflation bei multiplen Vergleichen: Führt man 20 Tests bei $\alpha = 0.05$ durch, ist ein Falsch-Positiv zufällig zu erwarten. Nutze Bonferroni- oder FDR-Korrekturen.
' $p > 0.05$ beweist $H_0$ ': NEIN. Nicht-Verwerfen ist nicht dasselbe wie Akzeptieren. Es bedeutet nur, dass die Daten bei diesem Stichprobenumfang nicht genug Belege gegen $H_0$ haben.

Examples

Step 1: Schlage

\Phi(2.1) \approx 0.9821

nach

Step 2: Rechtsseitige Wahrscheinlichkeit:

1 - 0.9821 = 0.0179

Step 3: Zweiseitiger p-Wert:

2 \times 0.0179 = 0.0358

Answer:

p \approx 0.0358

(signifikant bei

\alpha = 0.05

)

Step 1: Nutze die t-Verteilung mit

df = 19

Step 2: Aus t-Tabellen:

P(T_{19} \geq 1.8) \approx 0.0438

Step 3: Vergleiche mit gängigen Schwellen: signifikant bei

\alpha = 0.05

, nicht bei

\alpha = 0.01

Answer:

p \approx 0.044

(signifikant bei

\alpha = 0.05

)

Step 1: Chi-Quadrat ist rechtsseitig

Step 2:

P(\chi^2_3 \geq 7.5)

aus der Chi-Quadrat-Tabelle

Step 3: Kritische Werte für df = 3:

\chi^2_{0.10} = 6.25

,

\chi^2_{0.05} = 7.81

Step 4:

7.5

liegt dazwischen, also

0.05 < p < 0.10

Step 5: Genauer:

p \approx 0.058

Answer:

p \approx 0.058

(nicht signifikant bei

\alpha = 0.05

, hinweisend bei

\alpha = 0.10

)

Frequently Asked Questions

Es bedeutet, dass die beobachteten Daten (oder extremere Daten) in weniger als 5% wiederholter Stichproben auftreten würden, wenn die Nullhypothese wahr wäre. Konventionsgemäß wird das als 'statistisch signifikant' behandelt — aber es bedeutet nicht, dass die Nullhypothese notwendigerweise falsch ist, und es misst nicht die Größe des Effekts.

Der p-Wert wird *unter der Annahme* berechnet, dass H₀ wahr ist — er ist bedingt auf H₀. Die Berechnung von P(H₀ wahr | Daten) erfordert Bayessche Methoden mit einer A-priori-Wahrscheinlichkeit für H₀, die der frequentistische p-Wert nicht verwendet.

Nur wenn die Forschungsfrage wirklich gerichtet und vor dem Betrachten der Daten festgelegt ist — z. B. muss ein neues Medikament *besser* als ein Placebo abschneiden, um nützlich zu sein, wobei schlechtere Leistung gleichbedeutend mit keinem Effekt ist. Den Schwanz nachträglich zu wählen ist p-Hacking.

p-Hacking ist die Praxis, viele Analysen (verschiedene Teilmengen, Transformationen, Ausschlüsse) durchzuführen und nur die signifikanten zu berichten, oder die Testrichtungen nach dem Betrachten der Daten zu wechseln. Es bläht die Falsch-Positiv-Raten auf und trägt maßgeblich zur Replikationskrise bei.

Related Guides

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving

p-Wert-Rechner

Berechne und interpretiere p-Werte für Hypothesentests mit KI-gestützten Schritt-für-Schritt-Lösungen

Was ist ein p-Wert?

So berechnet und verwendet man p-Werte

Schritt für Schritt

p-Werte aus einer z-Statistik

p-Werte aus einer t-Statistik

p-Werte aus einer Chi-Quadrat-Statistik

Einseitig vs. zweiseitig: Welcher ist zu verwenden?

Häufige Signifikanzschwellen

Häufige Fehler, die man vermeiden sollte

Examples

Frequently Asked Questions

Was bedeutet p < 0,05?

Warum ist der p-Wert nicht die Wahrscheinlichkeit, dass die Nullhypothese wahr ist?

Wann sollte ich einen einseitigen Test verwenden?

Was ist p-Hacking?

Related Solvers

Related Guides

Try AI-Math for Free

p-Wert-Rechner

Berechne und interpretiere p-Werte für Hypothesentests mit KI-gestützten Schritt-für-Schritt-Lösungen

Was ist ein p-Wert?

So berechnet und verwendet man p-Werte

Schritt für Schritt

p-Werte aus einer z-Statistik

p-Werte aus einer t-Statistik

p-Werte aus einer Chi-Quadrat-Statistik

Einseitig vs. zweiseitig: Welcher ist zu verwenden?

Häufige Signifikanzschwellen

Häufige Fehler, die man vermeiden sollte

Examples

Problem: Findedenp−Wertfu¨rFinde den p-Wert für Findedenp−Wertfu¨rz = 2.1(zweiseitigerTest) (zweiseitiger Test)(zweiseitigerTest)

Problem: Findedenrechtsseitigenp−Wertfu¨rFinde den rechtsseitigen p-Wert für Findedenrechtsseitigenp−Wertfu¨rt = 1.8mit19Freiheitsgraden mit 19 Freiheitsgradenmit19Freiheitsgraden

Problem: EinChi−Quadrat−TestergibtEin Chi-Quadrat-Test ergibt EinChi−Quadrat−Testergibt\chi^2 = 7.5mit3Freiheitsgraden.Findedenp−Wert mit 3 Freiheitsgraden. Finde den p-Wertmit3Freiheitsgraden.Findedenp−Wert

Frequently Asked Questions

Was bedeutet p < 0,05?

Was bedeutet p < 0,05?

Warum ist der p-Wert nicht die Wahrscheinlichkeit, dass die Nullhypothese wahr ist?

Warum ist der p-Wert nicht die Wahrscheinlichkeit, dass die Nullhypothese wahr ist?

Wann sollte ich einen einseitigen Test verwenden?

Wann sollte ich einen einseitigen Test verwenden?

Was ist p-Hacking?

Was ist p-Hacking?

Related Solvers

Related Guides

Try AI-Math for Free