p-값 계산기

AI 기반 단계별 풀이로 가설검정의 p-값을 계산하고 해석합니다

드래그 앤 드롭 또는 클릭 하여 이미지 또는 PDF 추가

Math Input
p-value for z = 2.1 two-tailed
p-value for t = 1.8 with 19 degrees of freedom, right-tailed
p-value for chi-square = 7.5 with 3 df
Is p = 0.03 significant at alpha = 0.05?

p-값이란?

p-값귀무가설 H0H_0이 참이라고 가정할 때, 실제 결과만큼 극단적이거나 더 극단적인 검정 결과를 관측할 확률입니다.

형식적으로, 관측값이 tt인 검정통계량 TT에 대해:

  • 우측 검정: p=P(TtH0)p = P(T \geq t \mid H_0)
  • 좌측 검정: p=P(TtH0)p = P(T \leq t \mid H_0)
  • 양측 검정: p=2P(TtH0)p = 2 \cdot P(T \geq |t| \mid H_0)

해석: 작은 p-값은 H0H_0이 참이라면 관측된 데이터가 놀라울 것이므로 H0H_0에 반하는 증거가 있다는 의미입니다. 큰 p-값은 데이터가 H0H_0과 일관됨을 의미하지만 — H0H_0이 참임을 증명하지는 않습니다.

결정 규칙: pp를 미리 선택한 유의수준 α\alpha(보통 0.05)와 비교합니다.

  • p<αp < \alphaH0H_0 기각 ('통계적으로 유의함')
  • pαp \geq \alphaH0H_0 기각 실패 (증거 부족)

p-값이 아닌 것:

  • H0H_0이 참일 확률이 아닙니다.
  • 대립가설 H1H_1이 참일 확률이 아닙니다.
  • 효과 크기의 측도가 아닙니다.
  • '실용적 유의성'을 '통계적 유의성'과 구별하지 않습니다.

p-값을 계산하고 사용하는 방법

단계별

  1. 가설 H0H_0H1H_1진술합니다.
  2. 데이터에 적합한 검정을 선택합니다(z-검정, t-검정, 카이제곱, F-검정 등).
  3. 데이터로부터 검정통계량을 계산합니다.
  4. H1H_1에 따라 꼬리를 결정합니다: 우측 검정(>>), 좌측 검정(<<), 양측 검정(\neq).
  5. 검정의 분포로부터 p-값을 구합니다.
  6. α\alpha와 비교하고 결론을 내립니다.

Z-통계량으로부터 p-값

표준정규 ZZ에 대해:

  • 우측 검정: p=1Φ(z)p = 1 - \Phi(z)
  • 좌측 검정: p=Φ(z)p = \Phi(z)
  • 양측 검정: p=2(1Φ(z))p = 2(1 - \Phi(|z|))

빠른 참조: z=1.96z = 1.96 → 양측 p0.05p \approx 0.05. z=2.576z = 2.576 → 양측 p0.01p \approx 0.01.

T-통계량으로부터 p-값

자유도 n1n - 1인 t-분포(또는 검정에서 지정한 대로)를 사용합니다. z와 같은 꼬리 논리이지만, 작은 자유도에서는 분포의 꼬리가 약간 더 두껍습니다.

카이제곱 통계량으로부터 p-값

카이제곱 검정은 χ20\chi^2 \geq 0이고 큰 값이 H0H_0에 대한 적합도가 나쁨을 나타내므로 본질적으로 우측 검정입니다.

p=P(χdf2관측값)p = P(\chi^2_{df} \geq \text{관측값})

단측 대 양측: 어느 것을 사용하는가?

  • 양측: H0H_0으로부터의 편차가 어느 방향이든 관심이 있을 때. 대부분의 학술 환경에서 기본값.
  • 단측: 대립가설이 방향성이 있고 미리 지정되었을 때(H1:μ>0H_1: \mu > 0, μ0\mu \neq 0이 아님). 방향이 일치하면 p-값이 절반이 됩니다.

데이터를 본 후에 꼬리를 선택하지 마세요 — 그것은 p-해킹입니다.

흔한 유의성 임계값

α\alpha흔한 표현
0.10시사적
0.05표준
0.01강함
0.001매우 강함

미국통계학회는 α=0.05\alpha = 0.05를 명확한 경계선으로 취급하는 것에 경고했습니다 — 임계값을 넘는 것보다 맥락과 효과 크기가 더 중요합니다.

피해야 할 흔한 실수

  • 'p-값은 H0H_0이 참일 확률이다': 틀림. p-값은 H0H_0이 참이라고 가정하고 계산됩니다; H0H_0이 얼마나 가능한지 측정하지 않습니다.
  • p=0.049p = 0.049p=0.051p = 0.051을 근본적으로 다르게 취급: 다르지 않습니다. 0.05 임계값은 관례이지 상전이가 아닙니다.
  • 데이터를 본 후 꼬리 선택: z=2z = -2를 보고 좌측 검정으로 바꾸면 거짓양성률을 두 배로 한 것입니다. 미리 지정하세요.
  • 유의성과 효과 크기 혼동: 거대한 표본에서 아주 작은 효과는 '매우 유의'할 수 있지만 실용적으로 무관할 수 있습니다. 항상 p-값과 함께 효과 크기를 보고하세요.
  • 다중 비교 부풀림: α=0.05\alpha = 0.05에서 20개의 검정을 실행하면 우연히 하나의 거짓양성이 예상됩니다. 본페로니나 FDR 보정을 사용하세요.
  • 'p>0.05p > 0.05H0H_0을 증명한다': 아니요. 기각 실패는 채택과 같지 않습니다. 단지 이 표본 크기에서 H0H_0에 반하는 증거가 충분하지 않다는 의미입니다.

Examples

Step 1: Φ(2.1)0.9821\Phi(2.1) \approx 0.9821을 찾습니다
Step 2: 우측 꼬리 확률: 10.9821=0.01791 - 0.9821 = 0.0179
Step 3: 양측 p-값: 2×0.0179=0.03582 \times 0.0179 = 0.0358
Answer: p0.0358p \approx 0.0358 (α=0.05\alpha = 0.05에서 유의)

Step 1: 자유도 df=19df = 19인 t-분포 사용
Step 2: t-표에서: P(T191.8)0.0438P(T_{19} \geq 1.8) \approx 0.0438
Step 3: 흔한 임계값과 비교: α=0.05\alpha = 0.05에서 유의, α=0.01\alpha = 0.01에서 유의하지 않음
Answer: p0.044p \approx 0.044 (α=0.05\alpha = 0.05에서 유의)

Step 1: 카이제곱은 우측 검정
Step 2: 카이제곱 표에서 P(χ327.5)P(\chi^2_3 \geq 7.5)
Step 3: 자유도 3의 임계값: χ0.102=6.25\chi^2_{0.10} = 6.25, χ0.052=7.81\chi^2_{0.05} = 7.81
Step 4: 7.57.5가 그 사이에 있으므로 0.05<p<0.100.05 < p < 0.10
Step 5: 더 정확하게는 p0.058p \approx 0.058
Answer: p0.058p \approx 0.058 (α=0.05\alpha = 0.05에서 유의하지 않음, α=0.10\alpha = 0.10에서 시사적)

Frequently Asked Questions

귀무가설이 참이라면 관측된 데이터(또는 더 극단적인 데이터)가 반복 표본의 5% 미만에서 발생한다는 의미입니다. 관례상 이를 '통계적으로 유의함'으로 취급합니다 — 하지만 귀무가설이 반드시 거짓임을 의미하지는 않으며, 효과의 크기를 측정하지 않습니다.

p-값은 H₀이 참이라고 *가정하고* 계산됩니다 — H₀에 조건부입니다. P(H₀ 참 | 데이터)를 계산하려면 H₀에 대한 사전확률을 가진 베이즈 방법이 필요한데, 빈도주의 p-값은 이를 사용하지 않습니다.

연구 질문이 진정으로 방향성이 있고 데이터를 보기 전에 미리 지정되었을 때만 사용합니다 — 예: 신약이 유용하려면 위약보다 *더 나아야* 하며, 더 나쁜 성능은 효과 없음과 동등합니다. 사후에 꼬리를 선택하는 것은 p-해킹입니다.

p-해킹은 많은 분석(다른 부분집합, 변환, 제외)을 실행하고 유의한 것만 보고하거나, 데이터를 본 후 검정 방향을 바꾸는 관행입니다. 거짓양성률을 부풀리며 재현성 위기의 주요 원인입니다.

Related Solvers

Try AI-Math for Free

Get step-by-step solutions to any math problem. Upload a photo or type your question.

Start Solving