statistics

Tứ phân vị

Các tứ phân vị chia một tập dữ liệu thành bốn phần bằng nhau. Q1 (phân vị thứ 25), Q2 (trung vị, thứ 50), Q3 (thứ 75). Khoảng tứ phân vị Q3-Q1 là một thước đo độ phân tán bền vững.

Các tứ phân vị chia một tập dữ liệu đã sắp xếp thành bốn phần có kích thước bằng nhau:

  • Q1 (phân vị thứ 25): một phần tư nằm dưới.
  • Q2 (trung vị, thứ 50): một nửa nằm dưới.
  • Q3 (phân vị thứ 75): ba phần tư nằm dưới.

Khoảng tứ phân vị (IQR) =Q3Q1= Q3 - Q1, một thước đo độ phân tán bền vững:

  • Không nhạy với giá trị ngoại lai (khác với σ\sigma).
  • Bao phủ "50% ở giữa" của dữ liệu.

Tóm tắt năm số (min,Q1,Q2,Q3,max\min, Q1, Q2, Q3, \max) là cơ sở của biểu đồ hộp: hộp từ Q1 đến Q3 với đường trung vị, các râu kéo dài tới các giá trị cực trị nhất nằm trong 1.5IQR1.5 \cdot IQR, các điểm vượt ra ngoài được đánh dấu là ngoại lai.

Tứ phân vị, cũng như mọi phân vị, là phi tham số — không giả định gì về dạng của phân phối, khiến chúng an toàn hơn trung bình/độ lệch chuẩn đối với các phân phối lệch hoặc chưa biết.