statistics

Phương sai

Phương sai đo độ phân tán của tập dữ liệu quanh giá trị trung bình. Đây là trung bình của các bình phương độ lệch. Độ lệch chuẩn là căn bậc hai của phương sai.

Phương sai đo mức độ các giá trị trong tập dữ liệu phân tán so với giá trị trung bình. Với tổng thể gồm NN giá trị x1,,xNx_1, \ldots, x_N có trung bình μ\mu:

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

Với mẫu gồm nn giá trị có trung bình mẫu xˉ\bar{x}, chia cho n1n - 1 thay vì nn (hiệu chỉnh Bessel, một ước lượng không chệch).

Phương sai nhỏ có nghĩa các giá trị tập trung gần trung bình; phương sai lớn có nghĩa chúng phân tán. Phương sai có đơn vị bình phương của dữ liệu gốc (kg² nếu dữ liệu tính bằng kg) — đó là lý do ta thường dùng độ lệch chuẩn σ=σ2\sigma = \sqrt{\sigma^2}, có cùng đơn vị với dữ liệu.

Phương sai là nền tảng của toàn bộ thống kê suy luận: khoảng tin cậy, kiểm định giả thuyết và hồi quy đều phụ thuộc vào việc ước lượng phương sai. Đánh đổi độ chệch–phương sai trong học máy được đặt tên theo khái niệm này.