What are the steps of a hypothesis test?

(1) State the null hypothesis H₀ and alternative H₁; (2) choose a significance level α (commonly 0.05); (3) collect data and compute the test statistic; (4) calculate the p-value; (5) reject H₀ if p < α, otherwise fail to reject.

What does a p-value mean?

The p-value is the probability of observing a result as extreme as (or more extreme than) the computed statistic, assuming H₀ is true. A small p-value (below α) provides evidence against H₀, but does not prove H₁ is true.

What is the difference between Type I and Type II errors?

A Type I error (false positive) is rejecting H₀ when it is true; its probability equals α. A Type II error (false negative) is failing to reject H₀ when it is false; its probability is β. Statistical power is 1 − β.

AI-Math - 가설검정 단계별로: H0에서 p-값까지

가설검정은 통계적 추론의 핵심 도구로, 임상시험부터 웹사이트 A/B 테스트까지 어디에서나 쓰입니다. 하지만 동시에 통계학에서 가장 많이 오해받는 주제이기도 합니다. 이 가이드는 전체 과정을 한 번 — 명확하게 — 따라가며, p-값이 실제로 무엇을 의미하는지 이해하도록 합니다.

다섯 단계

$H_0$ 와 $H_1$ 을 세웁니다: 귀무가설(현 상태)과 대립가설(지지하고 싶은 주장).
유의수준 $\alpha$ 를 고릅니다: 보통 0.05 또는 0.01.
데이터로부터 검정통계량을 계산합니다( $z$ , $t$ , $\chi^2$ 등).
p-값을 구합니다: $H_0$ 가 참이라면 이만큼 극단적인 데이터가 나올 확률.
판단합니다: $p < \alpha$ 면 $H_0$ 을 기각하고, 그렇지 않으면 기각하지 않습니다.

참고: "기각하지 않음" ≠ " $H_0$ 을 채택함". 단지 그것에 반하는 증거가 충분하지 않을 뿐입니다.

일표본 z-검정 (풀이 예제)

어떤 공장은 전구가 평균 1000시간 지속된다고 주장합니다( $\sigma = 50$ ). 전구 25개를 검사해 $\bar x = 980$ 을 측정했습니다. $\alpha = 0.05$ 에서 이 주장은 반증되나요?

$H_0: \mu = 1000$ , $H_1: \mu \ne 1000$ .
$\alpha = 0.05$ , 양측검정.
검정통계량: $z = \frac{\bar x - \mu_0}{\sigma / \sqrt{n}} = \frac{980 - 1000}{50/\sqrt{25}} = \frac{-20}{10} = -2$ .
p-값: $2 \cdot P(Z < -2) \approx 2 \cdot 0.0228 = 0.0456$ .
$0.0456 < 0.05$ 이므로 $H_0$ 을 기각합니다. 평균 수명은 1000시간과 유의하게 다릅니다.

올바른 검정 고르기

상황	검정
평균 1개, $\sigma$ 알려짐	일표본 z-검정
평균 1개, $\sigma$ 모름, n 작음	일표본 t-검정
평균 2개, 독립표본	이표본 t-검정
대응되는 평균 2개	대응표본 t-검정
비율	비율의 z-검정
적합도 / 분할표	카이제곱

제1종 오류와 제2종 오류

제1종 오류: 참인 $H_0$ 을 기각하는 것. 확률 = $\alpha$ .
제2종 오류: 거짓인 $H_0$ 을 기각하지 않는 것. 확률 = $\beta$ .
검정력 = $1 - \beta$ : 실제 효과를 올바르게 검출할 확률.

이 셋은 함께 움직입니다. 표본 크기를 고정한 채 $\alpha$ 를 줄이면 $\beta$ 가 커지고, 표본 크기를 키우면 둘 다 줄어듭니다.

흔한 실수

"p-값 = $H_0$ 이 참일 확률" — 거짓입니다. p-값은 $P(\text{데이터} \mid H_0)$ 이며 $P(H_0 \mid \text{데이터})$ 가 아닙니다.
다중비교 — $\alpha = 0.05$ 로 20번 검정하면 평균적으로 약 1건의 거짓양성이 반드시 생깁니다. 보정을 사용하세요.
유의성과 중요성의 혼동 — 거대한 $n$ 을 동반한 미세한 효과는 통계적으로 매우 유의해도 실용적으로는 무관할 수 있습니다.

AI 가설검정 솔버로 해 보기

가설검정 솔버에 데이터를 입력하면 검정통계량, p-값, 판단 결과를 얻을 수 있습니다.

가설검정 단계별로: H0에서 p-값까지

가설검정 실전 가이드: H0와 H1 정의, 올바른 검정 선택, 검정통계량 계산, 그리고 오용하지 않는 p-값 해석.