statistics

Phân vị

Phân vị thứ k là giá trị mà k% số quan sát nằm dưới nó. Phân vị thứ 50 là trung vị; phân vị thứ 25 và thứ 75 là các tứ phân vị.

Phân vị thứ k PkP_k là giá trị mà k%k\% số quan sát trong một tập dữ liệu nằm dưới nó. Các phân vị thường gặp:

  • Phân vị thứ 25 (Q1): tứ phân vị dưới.
  • Phân vị thứ 50 (Q2): trung vị.
  • Phân vị thứ 75 (Q3): tứ phân vị trên.
  • Thứ 90, 95, 99: phần đuôi — dùng cho các giá trị cực trị.

Khoảng tứ phân vị (IQR) = Q3Q1Q3 - Q1, một thước đo độ phân tán bền vững (không nhạy với giá trị ngoại lai, khác với độ lệch chuẩn).

Cách tính: sắp xếp dữ liệu, tính hạng r=(k/100)(n+1)r = (k/100)(n+1), lấy quan sát thứ rr (nội suy giữa các hạng nguyên). Tồn tại nhiều định nghĩa khác nhau đôi chút — Excel, R, NumPy dùng các quy ước khác nhau.

Ứng dụng: điểm các bài kiểm tra chuẩn hóa, biểu đồ tăng trưởng nhi khoa, độ trễ P99 trong kỹ thuật, biểu đồ hộp. Phân vị là phi tham số — chúng không đưa ra giả định nào về hình dạng của phân phối.