statistics

사분위수

Quartiles split a dataset into four equal parts. Q1 (25th percentile), Q2 (median, 50th), Q3 (75th). The interquartile range Q3-Q1 is a robust spread measure.

사분위수는 정렬된 데이터셋을 크기가 같은 네 부분으로 나눈다.

  • Q1(제25백분위수): 4분의 1이 아래에 있다.
  • Q2(중앙값, 제50백분위수): 절반이 아래에 있다.
  • Q3(제75백분위수): 4분의 3이 아래에 있다.

사분위 범위(IQR) =Q3Q1= Q3 - Q1 는 산포의 로버스트한 척도이다.

  • 이상치에 둔감하다(σ\sigma 와 달리).
  • 데이터의 "가운데 50%"를 포괄한다.

5수 요약(min,Q1,Q2,Q3,max\min, Q1, Q2, Q3, \max)은 상자 그림의 기초이다. Q1부터 Q3까지의 상자에 중앙값 선을 긋고, 수염은 1.5IQR1.5 \cdot IQR 이내에서 가장 극단적인 값까지 뻗으며, 그 너머의 점은 이상치로 표시한다.

사분위수는 모든 백분위수와 마찬가지로 비모수적이다 — 분포의 형태에 대해 아무것도 가정하지 않으므로, 치우친 분포나 알 수 없는 분포에 대해 평균·표준편차보다 더 안전하다.