statistics

Trung vị

Trung vị là giá trị ở giữa của một tập dữ liệu đã được sắp xếp. Với dữ liệu có số lượng chẵn, nó là trung bình của hai giá trị ở giữa. Bền vững với các giá trị ngoại lai.

Trung vị là giá trị ở giữa của một tập dữ liệu đã sắp xếp. Với nn điểm dữ liệu được sắp xếp tăng dần:

  • Nếu nn lẻ, trung vị là giá trị thứ (n+12)\left(\frac{n+1}{2}\right).
  • Nếu nn chẵn, trung vị là trung bình của giá trị thứ n2\frac{n}{2} và giá trị thứ (n2+1)\left(\frac{n}{2}+1\right).

Trung vị là đại lượng đo xu hướng trung tâm chuẩn bền vững nhất. Trong khi trung bình dịch chuyển mạnh chỉ vì một giá trị ngoại lai cực đoan, trung vị không bị ảnh hưởng. Đó là lý do các nhà kinh tế báo cáo thu nhập hộ gia đình trung vị thay vì trung bình — nếu Bezos bước vào một khu phố, thu nhập trung bình sẽ bị đẩy lên hàng triệu, trong khi trung vị vẫn nguyên vẹn.

Dùng trung vị cho các phân phối lệch (thu nhập, thời gian phản hồi, kích thước tệp). Dùng trung bình khi dữ liệu xấp xỉ đối xứng và giá trị ngoại lai hiếm gặp. Trung vị cũng là giá trị làm cực tiểu tổng các độ lệch tuyệt đối xic\sum |x_i - c|, song song với việc trung bình làm cực tiểu các độ lệch bình phương.