statistics

Kiểm định khi bình phương (χ²)

Kiểm định khi bình phương so sánh tần số quan sát với tần số kỳ vọng trong dữ liệu phân loại. χ² = Σ(O−E)²/E. Dùng cho kiểm định mức độ phù hợp và kiểm định tính độc lập.

Kiểm định khi bình phương (χ2\chi^2) là công cụ chuẩn cho dữ liệu phân loại. Thống kê kiểm định:

χ2=i(OiEi)2Ei\chi^2 = \sum_i \frac{(O_i - E_i)^2}{E_i}

trong đó OiO_i là các tần số quan sát và EiE_i là các tần số kỳ vọng dưới H0H_0.

Ba biến thể thường gặp:

  • Mức độ phù hợp: phân phối quan sát có khớp với một phân phối lý thuyết không? (Con xúc xắc có cân bằng không?). df=k1df = k - 1.
  • Tính độc lập: hai biến phân loại có độc lập không? (Giới tính có độc lập với xu hướng bỏ phiếu không?). df=(r1)(c1)df = (r-1)(c-1) với bảng tiếp liên r×cr \times c.
  • Kiểm định phương sai: ít gặp hơn.

Giả thiết: các tần số kỳ vọng phải đủ lớn (thường 5\geq 5 ở mỗi ô). Với mẫu nhỏ, hãy dùng kiểm định chính xác Fisher thay thế.

Bản thân phân phối khi bình phương là phân phối của tổng các bình phương của các biến chuẩn tắc — được dùng để dựng các giá trị tới hạn.