Cheat Sheet

통계학 Formulas

입문 통계부터 추론 분석까지 학생이 필요로 하는 모든 통계 공식: 기술 통계량, 확률 규칙, 정규분포, 가설 검정, 선형 회귀. 각 항목에 한 줄짜리 사용 메모 포함. AI-Math 풀이기와 함께 대입 검산하세요.

기술 통계

평균 (모집단)

μ=1Ni=1Nxi\mu = \frac{1}{N}\sum_{i=1}^N x_i

모집단 모든 값의 평균.

평균 (표본)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

표본의 평균.

분산 (모집단)

σ2=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum (x_i - \mu)^2

퍼짐의 제곱, N으로 나눔.

분산 (표본)

s2=1n1(xixˉ)2s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2

베셀 보정: n1n-1 로 나눔.

표준편차

σ=σ2\sigma = \sqrt{\sigma^2}

분산의 제곱근 — 데이터와 같은 단위.

범위

R=xmaxxminR = x_{\max} - x_{\min}

가장 간단한 산포 측도.

확률 규칙

덧셈 규칙

P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)

A 또는 B의 확률 (포함-배제).

곱셈 규칙

P(AB)=P(A)P(BA)P(A \cap B) = P(A) \cdot P(B \mid A)

A 그리고 B의 확률; 독립이면 곱으로 간단해짐.

조건부 확률

P(BA)=P(AB)P(A)P(B \mid A) = \frac{P(A \cap B)}{P(A)}

A가 일어났을 때 B의 확률.

베이즈 정리

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

조건부 확률을 역전 — 진단 검사, 기계 학습.

독립성

P(AB)=P(A)P(B)P(A \cap B) = P(A) P(B)

AABB 가 독립일 때에만 성립.

경우의 수

순열

P(n,r)=n!(nr)!P(n,r) = \frac{n!}{(n-r)!}

순서가 중요: nn 개에서 rr 개 나열.

조합

C(n,r)=(nr)=n!r!(nr)!C(n,r) = \binom{n}{r} = \frac{n!}{r!(n-r)!}

순서 무관: nn 개에서 rr 개 선택.

이산 분포

이항 분포 PMF

P(X=k)=(nk)pk(1p)nkP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}

성공 확률 ppnn 번의 독립 시행에서 kk 번 성공.

이항 분포 평균

μ=np\mu = np

기대되는 성공 횟수.

이항 분포 분산

σ2=np(1p)\sigma^2 = np(1-p)

이항 분포의 산포.

푸아송 분포 PMF

P(X=k)=λkeλk!P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}

평균 발생률 λ\lambda 인 희귀 사건의 개수.

정규 분포

확률 밀도 함수

f(x)=1σ2πexp ⁣((xμ)22σ2)f(x) = \frac{1}{\sigma\sqrt{2\pi}} \exp\!\bigl(-\tfrac{(x-\mu)^2}{2\sigma^2}\bigr)

종 모양 곡선, 평균 μ\mu, 표준편차 σ\sigma.

Z 점수

z=xμσz = \frac{x - \mu}{\sigma}

분포 간 비교를 위해 표준화.

표준 정규

ZN(0,1)Z \sim N(0, 1)

Z 점수 변환 후.

68-95-99.7 규칙

P(Xμ<kσ): 0.68, 0.95, 0.997P(|X - \mu| < k\sigma):\ 0.68,\ 0.95,\ 0.997

k=1,2,3k = 1, 2, 3 에 대해 — 정규 데이터에만 유효.

추론 통계

평균의 표준 오차

SE=snSE = \frac{s}{\sqrt{n}}

추정량으로서 xˉ\bar{x} 의 표준편차.

신뢰구간 (평균, $\sigma$ 알려짐)

xˉ±zα/2σn\bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

95% 신뢰구간일 때 zα/2=1.96z_{\alpha/2} = 1.96.

t 통계량 (단일 표본)

t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}

σ\sigma 가 미지일 때 평균 = μ0\mu_0 검정.

카이제곱 통계량

χ2=(OiEi)2Ei\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}

범주형 데이터의 적합도 / 독립성 검정.

선형 회귀

기울기

b1=(xixˉ)(yiyˉ)(xixˉ)2b_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}

최적 적합 기울기 (최소제곱).

절편

b0=yˉb1xˉb_0 = \bar{y} - b_1 \bar{x}

직선이 (xˉ,yˉ)(\bar{x}, \bar{y}) 를 지나게 함.

피어슨 상관계수

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}

선형 관계의 강도와 방향, r[1,1]r \in [-1, 1].

결정계수

R2=r2R^2 = r^2

xx 가 설명하는 yy 분산의 비율.