가설검정은 통계적 추론의 핵심 도구로, 임상시험부터 웹사이트 A/B 테스트까지 어디에서나 쓰입니다. 하지만 동시에 통계학에서 가장 많이 오해받는 주제이기도 합니다. 이 가이드는 전체 과정을 한 번 — 명확하게 — 따라가며, p-값이 실제로 무엇을 의미하는지 이해하도록 합니다.
다섯 단계
- 와 을 세웁니다: 귀무가설(현 상태)과 대립가설(지지하고 싶은 주장).
- 유의수준 를 고릅니다: 보통 0.05 또는 0.01.
- 데이터로부터 검정통계량을 계산합니다(, , 등).
- p-값을 구합니다: 가 참이라면 이만큼 극단적인 데이터가 나올 확률.
- 판단합니다: 면 을 기각하고, 그렇지 않으면 기각하지 않습니다.
참고: "기각하지 않음" ≠ " 을 채택함". 단지 그것에 반하는 증거가 충분하지 않을 뿐입니다.
일표본 z-검정 (풀이 예제)
어떤 공장은 전구가 평균 1000시간 지속된다고 주장합니다(). 전구 25개를 검사해 을 측정했습니다. 에서 이 주장은 반증되나요?
- , .
- , 양측검정.
- 검정통계량: .
- p-값: .
- 이므로 을 기각합니다. 평균 수명은 1000시간과 유의하게 다릅니다.
올바른 검정 고르기
| 상황 | 검정 |
|---|---|
| 평균 1개, 알려짐 | 일표본 z-검정 |
| 평균 1개, 모름, n 작음 | 일표본 t-검정 |
| 평균 2개, 독립표본 | 이표본 t-검정 |
| 대응되는 평균 2개 | 대응표본 t-검정 |
| 비율 | 비율의 z-검정 |
| 적합도 / 분할표 | 카이제곱 |
제1종 오류와 제2종 오류
- 제1종 오류: 참인 을 기각하는 것. 확률 = .
- 제2종 오류: 거짓인 을 기각하지 않는 것. 확률 = .
- 검정력 = : 실제 효과를 올바르게 검출할 확률.
이 셋은 함께 움직입니다. 표본 크기를 고정한 채 를 줄이면 가 커지고, 표본 크기를 키우면 둘 다 줄어듭니다.
흔한 실수
- "p-값 = 이 참일 확률" — 거짓입니다. p-값은 이며 가 아닙니다.
- 다중비교 — 로 20번 검정하면 평균적으로 약 1건의 거짓양성이 반드시 생깁니다. 보정을 사용하세요.
- 유의성과 중요성의 혼동 — 거대한 을 동반한 미세한 효과는 통계적으로 매우 유의해도 실용적으로는 무관할 수 있습니다.
AI 가설검정 솔버로 해 보기
가설검정 솔버에 데이터를 입력하면 검정통계량, p-값, 판단 결과를 얻을 수 있습니다.
관련 참고: