Ein p-Wert ist die Wahrscheinlichkeit — unter der Annahme, dass die Nullhypothese wahr ist — Daten zu beobachten, die mindestens so extrem sind wie die tatsächliche Stichprobe. Kleine p-Werte bedeuten, dass die beobachteten Daten unwahrscheinlich wären, wenn wahr wäre, und liefern damit Evidenz gegen .
Konvention: ablehnen, wenn (üblicherweise ). Die Schwelle ist die Fehlerrate erster Art, die du in Kauf nimmst.
Häufige Missverständnisse (von jeder Statistikdozentin eingebläut):
- ist nicht "die Wahrscheinlichkeit, dass wahr ist."
- ist nicht "die Wahrscheinlichkeit, dass das Ergebnis dem Zufall geschuldet ist."
- Ein kleines bedeutet keinen großen Effekt — nur einen unter unwahrscheinlichen Effekt. Bei riesigen Stichproben werden selbst verschwindend kleine Effekte "statistisch signifikant."
- ist kein Beweis, dass wahr ist — nur unzureichende Evidenz, sie abzulehnen.
Die American Statistical Association (2016) warnte ausdrücklich davor, p-Werte als binäre "signifikant / nicht signifikant"-Entscheidungen zu behandeln; berichte Effektstärken und Konfidenzintervalle mit an.