statistics

Hiểu độ lệch chuẩn không phải rơi nước mắt

Độ lệch chuẩn bằng ngôn ngữ dễ hiểu: nó thực sự đo điều gì, sự khác biệt giữa tổng thể và mẫu, quy tắc 68-95-99,7, và ba ví dụ giải mẫu bạn có thể kiểm chứng.
AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

Độ lệch chuẩn là khái niệm bị hiểu sai nhiều nhất trong thống kê nhập môn. Người ta biết nó "đo độ phân tán" nhưng đứng hình khi được hỏi con số đó thực sự nghĩa là gì. Hướng dẫn này giải thích nó theo ba cách — hình học, tính toán, và trực giác — để lần tới khi bạn thấy σ\sigma trong một bài báo hay báo cáo, bạn thực sự hiểu nó là gì.

Định nghĩa bằng ngôn ngữ đơn giản

Độ lệch chuẩn trả lời: trung bình, mỗi điểm dữ liệu cách giá trị trung bình bao xa?

Bằng ký hiệu, với một tổng thể gồm NN giá trị x1,,xNx_1, \ldots, x_N có trung bình μ\mu:

σ=1Ni=1N(xiμ)2\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^N (x_i - \mu)^2}

Đọc to: "độ lệch bình phương trung bình, rồi lấy căn bậc hai."

Tại sao bình phương, rồi lấy căn bậc hai?

Một thử nghiệm đầu tiên hợp lý cho "khoảng cách trung bình tới giá trị trung bình" có thể là 1Nxiμ\frac{1}{N}\sum |x_i - \mu|độ lệch tuyệt đối trung bình. Nó hoạt động, và các nhà thống kê đôi khi vẫn dùng (nó bền vững hơn với điểm ngoại lai).

Nhưng giá trị tuyệt đối lại bất tiện về mặt toán học — nó không khả vi tại không, đạo hàm bùng nổ, và bạn không thể làm giải tích với nó một cách gọn gàng. Bình phương né tránh tất cả những điều đó, và căn bậc hai ở cuối đưa đơn vị về lại thang đo ban đầu (nên σ\sigma tính bằng đô la nếu xx tính bằng đô la, không phải đô la²).

Đây cũng chính là lý do học máy dùng hàm mất mát bình phương (sai số bình phương trung bình) — bình phương khả vi, hợp với giải tích, và các ước lượng thu được thường tối ưu.

Tổng thể và mẫu — chuyện n1n-1 so với nn

Tồn tại hai công thức, và sự khác biệt rất quan trọng:

  • Tổng thể (bạn có tất cả dữ liệu): chia cho NN. Ký hiệu σ\sigma.
  • Mẫu (bạn có một mẫu, muốn ước lượng tổng thể): chia cho n1n - 1. Ký hiệu ss.

Số n1n - 1 trong công thức mẫu là hiệu chỉnh Bessel. Tại sao? Dùng nn sẽ ước lượng thiếu độ lệch chuẩn của tổng thể một cách có hệ thống vì bạn đã dùng trung bình mẫu (vốn theo cấu trúc là phù hợp nhất với mẫu), ép các độ lệch nhỏ hơn so với khi dùng trung bình tổng thể thực. Chia cho n1n - 1 thay vì nn bù trừ chính xác điều đó.

Hầu hết máy tính và phần mềm mặc định dùng công thức mẫu. Hãy chú ý.

Ví dụ giải mẫu 1: tập dữ liệu nhỏ đối xứng

Dữ liệu: {2,4,4,4,5,5,7,9}\{2, 4, 4, 4, 5, 5, 7, 9\}. (8 giá trị; ví dụ kinh điển trong giáo trình.)

  1. Trung bình: xˉ=2+4+4+4+5+5+7+98=5\bar{x} = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.
  2. Độ lệch so với trung bình: 3,1,1,1,0,0,2,4-3, -1, -1, -1, 0, 0, 2, 4.
  3. Độ lệch bình phương: 9,1,1,1,0,0,4,169, 1, 1, 1, 0, 0, 4, 16.
  4. Tổng: 3232.
  5. Tổng thể (N=8N = 8): phương sai =32/8=4= 32/8 = 4, σ=2\sigma = 2.
  6. Mẫu (n1=7n - 1 = 7): phương sai =32/74,57= 32/7 \approx 4{,}57, s2,14s \approx 2{,}14.

Quy tắc 68-95-99,7 (chỉ cho phân phối chuẩn)

Nếu dữ liệu của bạn xấp xỉ chuẩn (hình chuông):

  • 68%\approx 68\% giá trị nằm trong 1σ1\sigma quanh trung bình.
  • 95%\approx 95\% trong 2σ2\sigma.
  • 99,7%\approx 99{,}7\% trong 3σ3\sigma.

Đây là lý do "±2σ\pm 2\sigma" hay "hai sigma" là định nghĩa thông thường mặc định của "bất thường về mặt thống kê".

⚠️ Cảnh báo: quy tắc này chỉ áp dụng cho phân phối chuẩn. Với dữ liệu lệch hoặc đuôi nặng (thu nhập, thời gian phản hồi), 1σ1\sigma có thể bao phủ 80% dữ liệu — hoặc 50%. Luôn kiểm tra hình dạng phân phối (biểu đồ tần suất, biểu đồ QQ) trước khi trích các con số 68-95-99,7.

Độ lệch chuẩn và phương sai

Phương sai chỉ là σ2\sigma^2. Chúng chứa thông tin giống hệt nhau, vậy tại sao lại có cả hai?

  • Độ lệch chuẩn có cùng đơn vị với dữ liệu — diễn giải được.
  • Phương sai phân rã cộng tính cho các biến độc lập (Var(X+Y)=Var(X)+Var(Y)\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) khi độc lập), khiến nó là đại lượng thuận tiện về mặt đại số cho các chứng minh, kỳ vọng, và ANOVA.

Dùng σ\sigma khi báo cáo; dùng σ2\sigma^2 khi tính toán.

Những lỗi thường gặp

  1. Trích σ\sigma mà không có ngữ cảnh. "σ=5\sigma = 5" chẳng nghĩa gì nếu bạn không biết trung bình. Luôn ghép cặp: "trung bình =100= 100, σ=5\sigma = 5."
  2. Lẫn lộn công thức tổng thể và mẫu. Với mẫu nhỏ nó tạo khác biệt thực sự. Với mẫu lớn (n>100n > 100) khác biệt không đáng kể.
  3. Quên độ nhạy với điểm ngoại lai. Một giá trị cực trị có thể làm σ\sigma phình to. Với dữ liệu đuôi nặng, hãy báo cáo thêm độ lệch tuyệt đối trung vị (MAD) để bền vững hơn.
  4. Áp dụng 68-95-99,7 cho dữ liệu không chuẩn. Xem ở trên.

Tự thử

Nhập bất kỳ tập dữ liệu nào vào Máy tính Độ lệch chuẩn miễn phí của chúng tôi — chọn tổng thể hoặc mẫu, xem cách tính từng bước, và đối chiếu với hướng dẫn này.

Tài liệu liên quan:

AI-Math Editorial Team

By AI-Math Editorial Team

Published 2026-05-02

A small team of engineers, mathematicians, and educators behind AI-Math, focused on making step-by-step math help accessible to every student.