Một điểm z (điểm chuẩn hóa) là khoảng cách của một giá trị tới trung bình, biểu diễn theo đơn vị độ lệch chuẩn:
(dùng và cho dữ liệu mẫu).
Điểm z bằng nghĩa là "cao hơn trung bình hai độ lệch chuẩn"; nghĩa là "thấp hơn 1,5".
Điểm z cho phép bạn:
- So sánh các giá trị từ các phân phối khác nhau — một học sinh được 80 ở Bài kiểm tra A () ấn tượng hơn (z=2) so với 80 ở Bài kiểm tra B (, z=0,5).
- Tra cứu xác suất trong bảng phân phối chuẩn tắc — P() ≈ 0,975, nền tảng của khoảng tin cậy 95%.
- Nhận diện giá trị ngoại lai — theo quy ước đánh dấu một quan sát bất thường trong dữ liệu xấp xỉ chuẩn.
Chuẩn hóa (tính điểm z) cũng là một bước tiền xử lý cơ bản trong học máy: co giãn các đầu vào về trung bình 0, độ lệch chuẩn 1 giúp hạ gradient hội tụ và ngăn các đặc trưng có đơn vị lớn hơn (ví dụ thu nhập tính bằng đô-la so với tuổi tính bằng năm) chi phối các mô hình dựa trên khoảng cách.