Z 점수(표준 점수)는 어떤 값의 평균으로부터의 거리를 표준편차 단위로 표현한 것이다:
(표본 데이터에는 와 를 사용한다).
Z 점수 는 "평균보다 표준편차 2개만큼 위"를, 는 "1.5개만큼 아래"를 뜻한다.
Z 점수를 사용하면 다음을 할 수 있다:
- 서로 다른 분포의 값을 비교한다 — 시험 A()에서 80점을 받은 학생(z=2)이 시험 B(, z=0.5)에서 80점을 받은 경우보다 더 인상적이다.
- 표준정규분포표에서 확률을 조회한다 — P() ≈ 0.975 이며, 이는 95% 신뢰 구간의 기초이다.
- 이상치를 식별한다 — 관례상 거의 정규인 데이터에서 이면 비정상적인 관측을 표시한다.
표준화(z 점수화)는 기계 학습의 기본 전처리 단계이기도 하다. 입력을 평균 0, 표준편차 1로 스케일링하면 경사 하강법의 수렴에 도움이 되고, 단위가 큰 특성(예: 달러 단위의 소득 대 연 단위의 나이)이 거리 기반 모델을 지배하는 것을 막는다.