statistics

평균

평균(산술평균)은 값들의 합을 값의 개수로 나눈 것이다. 데이터 집합을 하나의 수로 요약하는 가장 흔한 지표이다.

x1,x2,,xnx_1, x_2, \ldots, x_n산술평균

xˉ=1ni=1nxi.\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i.

이것은 제곱 편차의 합 (xic)2\sum (x_i - c)^2 을 최소화하는 값이다 — 통계와 기계 학습 어디에나 제곱 손실이 등장하는 이유가 바로 이것이다: 제곱 손실을 최소화하는 것은 평균을 추정하는 것이다.

평균은 이상치에 민감하다: 단 하나의 극단값이 평균을 대부분의 데이터가 있는 곳에서 멀리 끌어당길 수 있다. 데이터가 치우쳐 있을 때(소득, 응답 시간, 파일 크기)는 중앙값이 더 나은 요약인 경우가 많다. 다른 평균들 — 기하평균, 조화평균, 가중평균 — 은 특정 맥락(복리 성장, 병렬 저항, 가중 여론조사)에서 쓰인다.