statistics

Điểm z (điểm chuẩn hóa)

Điểm z đo một giá trị nằm trên hay dưới trung bình bao nhiêu độ lệch chuẩn. z = (x − μ) / σ. Dùng để so sánh các giá trị giữa các phân phối khác nhau và tra cứu xác suất.

Một điểm z (điểm chuẩn hóa) là khoảng cách của một giá trị tới trung bình, biểu diễn theo đơn vị độ lệch chuẩn:

z=xμσz = \frac{x - \mu}{\sigma}

(dùng xˉ\bar{x}ss cho dữ liệu mẫu).

Điểm z bằng +2+2 nghĩa là "cao hơn trung bình hai độ lệch chuẩn"; 1.5-1.5 nghĩa là "thấp hơn 1,5".

Điểm z cho phép bạn:

  • So sánh các giá trị từ các phân phối khác nhau — một học sinh được 80 ở Bài kiểm tra A (μ=70,σ=5\mu=70, \sigma=5) ấn tượng hơn (z=2) so với 80 ở Bài kiểm tra B (μ=75,σ=10\mu=75, \sigma=10, z=0,5).
  • Tra cứu xác suất trong bảng phân phối chuẩn tắc — P(Z<1.96Z < 1.96) ≈ 0,975, nền tảng của khoảng tin cậy 95%.
  • Nhận diện giá trị ngoại lai — theo quy ước z>3|z| > 3 đánh dấu một quan sát bất thường trong dữ liệu xấp xỉ chuẩn.

Chuẩn hóa (tính điểm z) cũng là một bước tiền xử lý cơ bản trong học máy: co giãn các đầu vào về trung bình 0, độ lệch chuẩn 1 giúp hạ gradient hội tụ và ngăn các đặc trưng có đơn vị lớn hơn (ví dụ thu nhập tính bằng đô-la so với tuổi tính bằng năm) chi phối các mô hình dựa trên khoảng cách.