Cheat Sheet

Thống kê Formulas

Mọi công thức thống kê mà học sinh cần từ thống kê nhập môn đến phân tích suy diễn: các đại lượng mô tả, quy tắc xác suất, phân phối chuẩn, kiểm định giả thuyết và hồi quy tuyến tính. Mỗi công thức kèm ghi chú sử dụng một dòng. Kết hợp với công cụ giải AI-Math để kiểm tra nhanh bằng cách thay số.

Thống kê mô tả

Trung bình (tổng thể)

μ=1Ni=1Nxi\mu = \frac{1}{N}\sum_{i=1}^N x_i

Trung bình của tất cả giá trị tổng thể.

Trung bình (mẫu)

xˉ=1ni=1nxi\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i

Trung bình mẫu.

Phương sai (tổng thể)

σ2=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum (x_i - \mu)^2

Độ phân tán bình phương, chia cho N.

Phương sai (mẫu)

s2=1n1(xixˉ)2s^2 = \frac{1}{n-1}\sum (x_i - \bar{x})^2

Hiệu chỉnh Bessel: chia cho n1n-1.

Độ lệch chuẩn

σ=σ2\sigma = \sqrt{\sigma^2}

Căn bậc hai của phương sai — cùng đơn vị với dữ liệu.

Khoảng biến thiên

R=xmaxxminR = x_{\max} - x_{\min}

Thước đo độ phân tán đơn giản nhất.

Quy tắc xác suất

Quy tắc cộng

P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)

Xác suất A hoặc B (bao hàm-loại trừ).

Quy tắc nhân

P(AB)=P(A)P(BA)P(A \cap B) = P(A) \cdot P(B \mid A)

Xác suất A và B; rút gọn thành tích khi độc lập.

Xác suất có điều kiện

P(BA)=P(AB)P(A)P(B \mid A) = \frac{P(A \cap B)}{P(A)}

Xác suất B khi A đã xảy ra.

Định lý Bayes

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) P(A)}{P(B)}

Đảo ngược xác suất có điều kiện — xét nghiệm chẩn đoán, học máy.

Tính độc lập

P(AB)=P(A)P(B)P(A \cap B) = P(A) P(B)

Đúng khi và chỉ khi AABB độc lập.

Đếm

Hoán vị

P(n,r)=n!(nr)!P(n,r) = \frac{n!}{(n-r)!}

Thứ tự quan trọng: sắp xếp rr từ nn.

Tổ hợp

C(n,r)=(nr)=n!r!(nr)!C(n,r) = \binom{n}{r} = \frac{n!}{r!(n-r)!}

Thứ tự không quan trọng: chọn rr từ nn.

Phân phối rời rạc

Hàm khối xác suất nhị thức

P(X=k)=(nk)pk(1p)nkP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}

kk thành công trong nn phép thử độc lập với xác suất thành công pp.

Trung bình nhị thức

μ=np\mu = np

Số lần thành công kỳ vọng.

Phương sai nhị thức

σ2=np(1p)\sigma^2 = np(1-p)

Độ phân tán của phân phối nhị thức.

Hàm khối xác suất Poisson

P(X=k)=λkeλk!P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}

Đếm sự kiện hiếm với tốc độ trung bình λ\lambda.

Phân phối chuẩn

Hàm mật độ xác suất

f(x)=1σ2πexp ⁣((xμ)22σ2)f(x) = \frac{1}{\sigma\sqrt{2\pi}} \exp\!\bigl(-\tfrac{(x-\mu)^2}{2\sigma^2}\bigr)

Đường cong hình chuông, trung bình μ\mu, độ lệch chuẩn σ\sigma.

Điểm Z

z=xμσz = \frac{x - \mu}{\sigma}

Chuẩn hóa để so sánh giữa các phân phối.

Chuẩn tắc

ZN(0,1)Z \sim N(0, 1)

Sau khi biến đổi điểm Z.

Quy tắc 68-95-99,7

P(Xμ<kσ): 0.68, 0.95, 0.997P(|X - \mu| < k\sigma):\ 0.68,\ 0.95,\ 0.997

Với k=1,2,3k = 1, 2, 3 — chỉ đúng cho dữ liệu chuẩn.

Thống kê suy diễn

Sai số chuẩn của trung bình

SE=snSE = \frac{s}{\sqrt{n}}

Độ lệch chuẩn của xˉ\bar{x} với vai trò ước lượng.

Khoảng tin cậy (trung bình, đã biết $\sigma$)

xˉ±zα/2σn\bar{x} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

zα/2=1.96z_{\alpha/2} = 1.96 cho khoảng tin cậy 95%.

Thống kê t (một mẫu)

t=xˉμ0s/nt = \frac{\bar{x} - \mu_0}{s/\sqrt{n}}

Kiểm định trung bình = μ0\mu_0 khi σ\sigma chưa biết.

Thống kê chi bình phương

χ2=(OiEi)2Ei\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}

Kiểm định độ phù hợp / tính độc lập cho dữ liệu phân loại.

Hồi quy tuyến tính

Hệ số góc

b1=(xixˉ)(yiyˉ)(xixˉ)2b_1 = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sum (x_i - \bar{x})^2}

Hệ số góc khớp tốt nhất (bình phương tối thiểu).

Hệ số chặn

b0=yˉb1xˉb_0 = \bar{y} - b_1 \bar{x}

Buộc đường thẳng đi qua (xˉ,yˉ)(\bar{x}, \bar{y}).

Tương quan Pearson

r=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}}

Cường độ và chiều của quan hệ tuyến tính, r[1,1]r \in [-1, 1].

Hệ số xác định

R2=r2R^2 = r^2

Tỉ lệ phương sai của yy được giải thích bởi xx.