p値計算機

AI による step-by-step の解説付きで仮説検定のp値を計算し解釈します

ドラッグ&ドロップ、または クリック して画像や PDF を追加

Math Input
p-value for z = 2.1 two-tailed
p-value for t = 1.8 with 19 degrees of freedom, right-tailed
p-value for chi-square = 7.5 with 3 df
Is p = 0.03 significant at alpha = 0.05?

p値とは何か?

p値は、帰無仮説 H0H_0 が真であると仮定したときに、実際の結果と同じくらい、またはそれ以上に極端な検定結果が観測される確率です。

形式的には、観測値 tt を持つ検定統計量 TT について:

  • 右側p=P(TtH0)p = P(T \geq t \mid H_0)
  • 左側p=P(TtH0)p = P(T \leq t \mid H_0)
  • 両側p=2P(TtH0)p = 2 \cdot P(T \geq |t| \mid H_0)

解釈:小さいp値は、H0H_0 が真なら観測データが驚くべきものであることを意味し、H0H_0 に反する証拠があります。大きいp値はデータが H0H_0 と整合的であることを意味します — しかし H0H_0 が真であることを証明しません

判断規則pp をあらかじめ選んだ有意水準 α\alpha(通常 0.05)と比較します。

  • p<αp < \alphaH0H_0 を棄却(「統計的に有意」)
  • pαp \geq \alphaH0H_0 を棄却できない(証拠が不十分)

p値でないもの

  • H0H_0 が真である確率ではありません
  • 対立仮説 H1H_1 が真である確率ではありません
  • 効果量の尺度ではありません
  • 「実質的有意性」を「統計的有意性」から区別しません

p値の計算と使い方

ステップごと

  1. 仮説 H0H_0H1H_1立てる
  2. データに適した検定を選ぶ(z検定、t検定、カイ二乗、F検定など)。
  3. データから検定統計量を計算する。
  4. H1H_1 に基づいて裾を決める:右側(>>)、左側(<<)、両側(\neq)。
  5. 検定の分布からp値を求める
  6. α\alpha比較して結論する。

Z統計量からのp値

標準正規 ZZ について:

  • 右側:p=1Φ(z)p = 1 - \Phi(z)
  • 左側:p=Φ(z)p = \Phi(z)
  • 両側:p=2(1Φ(z))p = 2(1 - \Phi(|z|))

クイックリファレンス:z=1.96z = 1.96 → 両側 p0.05p \approx 0.05z=2.576z = 2.576 → 両側 p0.01p \approx 0.01

T統計量からのp値

自由度 n1n - 1 のt分布(または検定で指定されたもの)を使います。zと同じ裾の論理ですが、小さい自由度では分布の裾がやや重くなります。

カイ二乗統計量からのp値

カイ二乗検定は本質的に右側です。χ20\chi^2 \geq 0 で、大きい値が H0H_0 への当てはまりの悪さを示すためです。

p=P(χdf2観測値)p = P(\chi^2_{df} \geq \text{観測値})

片側 vs 両側:どちらを使うか?

  • 両側H0H_0 からのどちらの方向への逸脱も気にする場合。ほとんどの学術的設定でのデフォルト。
  • 片側:対立仮説が方向性を持ちあらかじめ指定されている場合(H1:μ>0H_1: \mu > 0μ0\mu \neq 0 ではなく)。方向が一致すればp値が半分になります。

データを見た後で裾を選ばないでください — それはpハッキングです。

よくある有意性のしきい値

α\alphaよくあるラベル
0.10示唆的
0.05標準
0.01強い
0.001非常に強い

米国統計協会は α=0.05\alpha = 0.05 を明確な境界線として扱うことに警告しています — しきい値を越えることより文脈と効果量のほうが重要です。

よくある間違い

  • 「p値は H0H_0 が真である確率」:誤り。p値は H0H_0 が真であると仮定して計算されます。H0H_0 がどれだけ起こりうるかは測りません。
  • p=0.049p = 0.049p=0.051p = 0.051 を根本的に異なるものとして扱う:そうではありません。0.05 のしきい値は慣例であり相転移ではありません。
  • データを見た後で裾を選ぶz=2z = -2 を見て左側検定に切り替えると、偽陽性率が2倍になります。事前に指定してください。
  • 有意性と効果量を混同する:巨大な標本での小さな効果は「高度に有意」でありながら実質的に無関係でありえます。p値とともに常に効果量を報告してください。
  • 多重比較の膨張α=0.05\alpha = 0.05 で20回の検定を行うと、偶然により1件の偽陽性が予想されます。ボンフェローニまたはFDR補正を使ってください。
  • p>0.05p > 0.05H0H_0 を証明する」:いいえ。棄却できないことは受容と同じではありません。この標本サイズで H0H_0 に反する十分な証拠がデータにないことを意味するだけです。

Examples

Step 1: Φ(2.1)0.9821\Phi(2.1) \approx 0.9821 を参照
Step 2: 右側確率:10.9821=0.01791 - 0.9821 = 0.0179
Step 3: 両側p値:2×0.0179=0.03582 \times 0.0179 = 0.0358
Answer: p0.0358p \approx 0.0358α=0.05\alpha = 0.05 で有意)

Step 1: df=19df = 19 のt分布を使う
Step 2: t表から:P(T191.8)0.0438P(T_{19} \geq 1.8) \approx 0.0438
Step 3: よくあるしきい値と比較:α=0.05\alpha = 0.05 で有意、α=0.01\alpha = 0.01 では有意でない
Answer: p0.044p \approx 0.044α=0.05\alpha = 0.05 で有意)

Step 1: カイ二乗は右側
Step 2: カイ二乗表から P(χ327.5)P(\chi^2_3 \geq 7.5)
Step 3: df = 3 の臨界値:χ0.102=6.25\chi^2_{0.10} = 6.25χ0.052=7.81\chi^2_{0.05} = 7.81
Step 4: 7.57.5 はその間にあるので 0.05<p<0.100.05 < p < 0.10
Step 5: より正確には p0.058p \approx 0.058
Answer: p0.058p \approx 0.058α=0.05\alpha = 0.05 で有意でない、α=0.10\alpha = 0.10 で示唆的)

Frequently Asked Questions

帰無仮説が真なら、観測データ(またはより極端なデータ)が繰り返し標本の5%未満で起こることを意味します。慣例により、これは「統計的に有意」として扱われます — しかし帰無仮説が必ずしも偽であることを意味せず、効果の大きさも測りません。

p値は H₀ が真であると*仮定して*計算されます — H₀ を条件としています。P(H₀ 真 | データ) を計算するには H₀ の事前確率を持つベイズ手法が必要で、頻度論のp値はこれを使いません。

研究上の問いが本当に方向性を持ち、データを見る前にあらかじめ指定されている場合のみ — 例えば、新薬が有用であるためにはプラセボより*よく*機能しなければならず、より悪い成績は効果なしと等価。事後に裾を選ぶのはpハッキングです。

pハッキングとは、多くの分析(異なる部分集合、変換、除外)を行い有意なものだけを報告したり、データを見た後で検定の方向を切り替えたりする慣行です。偽陽性率を膨らませ、再現性危機の主要な要因です。

Related Solvers

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving