仮説検定は統計的推測の主役であり、臨床試験から Web サイトの A/B テストまであらゆる場面で使われています。しかし同時に、統計学で最も誤解されているトピックでもあります。このガイドでは全体の流れを一度だけ——明確に——たどり、p 値が本当は何を意味するのかを理解できるようにします。
5 つのステップ
- と を立てる:帰無仮説(現状)と対立仮説(あなたが支持したい主張)。
- 有意水準 を選ぶ:通常は 0.05 または 0.01。
- データから検定統計量を計算する(、、 など)。
- p 値を求める: が真であるとして、これほど極端なデータが得られる確率。
- 判断する: なら を棄却し、そうでなければ棄却しない。
注意:「棄却しない」≠「 を採択する」。単にそれに反する十分な証拠がないだけです。
一標本 z 検定(例題)
ある工場は電球が平均 1000 時間もつと主張しています()。あなたは 25 個の電球を検査し、 を測定しました。 でこの主張は反証されるでしょうか?
- 、。
- 、両側検定。
- 検定統計量:。
- p 値:。
- なので、 を棄却する。平均寿命は 1000 時間と有意に異なります。
適切な検定を選ぶ
| 状況 | 検定 |
|---|---|
| 1 つの平均、 既知 | 一標本 z 検定 |
| 1 つの平均、 未知、n が小さい | 一標本 t 検定 |
| 2 つの平均、独立標本 | 二標本 t 検定 |
| 対応のある 2 つの平均 | 対応のある t 検定 |
| 比率 | 比率の z 検定 |
| 適合度 / 分割表 | カイ二乗 |
第一種の過誤と第二種の過誤
- 第一種の過誤:真の を棄却すること。確率 = 。
- 第二種の過誤:偽の を棄却しないこと。確率 = 。
- 検出力 = :実在する効果を正しく検出する確率。
この 3 つは連動して動きます。標本サイズを固定したまま を小さくすると が大きくなり、標本サイズを大きくすると両方が小さくなります。
よくある間違い
- 「p 値 = が真である確率」 ——誤りです。p 値は であり、 ではありません。
- 多重比較 —— で 20 回の検定を行うと、平均して約 1 件の偽陽性が必ず生じます。補正を使いましょう。
- 有意性と重要性の混同 ——巨大な を伴う微小な効果は、統計的には非常に有意でも実用上は無関係なことがあります。
AI 仮説検定ソルバーで試す
仮説検定ソルバーにデータを入力すると、検定統計量、p 値、判断結果が得られます。
関連リファレンス: