기술 통계
평균 (모집단)
모집단 모든 값의 평균.
평균 (표본)
표본의 평균.
분산 (모집단)
퍼짐의 제곱, N으로 나눔.
분산 (표본)
베셀 보정: 로 나눔.
표준편차
분산의 제곱근 — 데이터와 같은 단위.
범위
가장 간단한 산포 측도.
확률 규칙
덧셈 규칙
A 또는 B의 확률 (포함-배제).
곱셈 규칙
A 그리고 B의 확률; 독립이면 곱으로 간단해짐.
조건부 확률
A가 일어났을 때 B의 확률.
베이즈 정리
조건부 확률을 역전 — 진단 검사, 기계 학습.
독립성
와 가 독립일 때에만 성립.
경우의 수
순열
순서가 중요: 개에서 개 나열.
조합
순서 무관: 개에서 개 선택.
이산 분포
이항 분포 PMF
성공 확률 인 번의 독립 시행에서 번 성공.
이항 분포 평균
기대되는 성공 횟수.
이항 분포 분산
이항 분포의 산포.
푸아송 분포 PMF
평균 발생률 인 희귀 사건의 개수.
정규 분포
확률 밀도 함수
종 모양 곡선, 평균 , 표준편차 .
Z 점수
분포 간 비교를 위해 표준화.
표준 정규
Z 점수 변환 후.
68-95-99.7 규칙
에 대해 — 정규 데이터에만 유효.
추론 통계
평균의 표준 오차
추정량으로서 의 표준편차.
신뢰구간 (평균, $\sigma$ 알려짐)
95% 신뢰구간일 때 .
t 통계량 (단일 표본)
가 미지일 때 평균 = 검정.
카이제곱 통계량
범주형 데이터의 적합도 / 독립성 검정.
선형 회귀
기울기
최적 적합 기울기 (최소제곱).
절편
직선이 를 지나게 함.
피어슨 상관계수
선형 관계의 강도와 방향, .
결정계수
가 설명하는 분산의 비율.