제 k 백분위수 는 데이터셋의 관측값 중 가 그보다 아래에 위치하는 값이다. 흔히 쓰는 백분위수:
- 제 25 백분위수(Q1): 하위 사분위수.
- 제 50 백분위수(Q2): 중앙값.
- 제 75 백분위수(Q3): 상위 사분위수.
- 제 90, 95, 99 백분위수: 꼬리 — 극값에 사용한다.
사분위수 범위(IQR) = . 산포의 강건한 척도이다(표준편차와 달리 이상치에 둔감하다).
계산: 데이터를 정렬하고, 순위 를 계산한 뒤, 번째 관측값을 취한다(정수 순위 사이는 보간한다). 약간씩 다른 여러 정의가 존재한다 — Excel, R, NumPy는 서로 다른 관례를 쓴다.
응용: 표준화 시험 점수, 소아 성장 곡선, 공학에서의 P99 지연시간, 상자 수염 그림. 백분위수는 비모수적이다 — 분포의 모양에 대해 아무 가정도 하지 않는다.