置信区间计算器

用 AI 分步计算均值或比例的置信区间

拖拽或 点击 上传图片或 PDF

Math Input
95% CI for mean with n=30, sample mean=72, sample sd=8
99% CI for proportion with 240 successes in 400 trials
Margin of error for 95% CI, n=100, p_hat=0.55
90% CI for mean with population sd=15, n=64, x_bar=50

什么是置信区间?

**置信区间(CI)**是由样本数据构造的、未知总体参数的一组可信值范围。95% 置信区间意味着:如果你多次重复抽样过程,所构造的区间中约有 95% 会包含真实参数

重要:95% 指的是这个过程,而不是任何单个已算出的区间。一旦由数据构造出某个区间,它要么包含要么不包含真实参数——但我们不知道是哪种。

核心结构:每个置信区间都具有形式

estimate±margin of error\text{estimate} \pm \text{margin of error}

估计量是样本统计量(xˉ\bar{x}p^\hat{p})。误差幅度是临界值乘以估计量的标准误。

置信区间出现在:

  • 选举民调(「52% 支持率,±3%\pm 3\% 误差幅度」)
  • 医学研究(效应量的置信区间)
  • 质量控制(平均缺陷率)
  • 任何想量化估计的不确定性而不只是报告点值的场合。

如何计算置信区间

总体均值的置信区间(Z 区间)

当总体标准差 σ\sigma 已知且抽样分布近似正态(大 nn 或正态总体)时:

xˉ±zσn\bar{x} \pm z^* \cdot \frac{\sigma}{\sqrt{n}}

其中 zz^* 是所选置信水平的临界值。

总体均值的置信区间(T 区间)

σ\sigma 未知(只有样本标准差 ss)时——实践中更常见:

xˉ±tn1sn\bar{x} \pm t^*_{n-1} \cdot \frac{s}{\sqrt{n}}

临界值 tt^* 来自自由度为 n1n - 1 的 t 分布。对于大 nn30\geq 30),tzt^* \approx z^*,两个区间非常接近。

总体比例的置信区间

对于样本比例 p^=x/n\hat{p} = x/n(其中 xx 是成功次数):

p^±zp^(1p^)n\hat{p} \pm z^* \cdot \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}

np^10n\hat{p} \geq 10n(1p^)10n(1 - \hat{p}) \geq 10(成功-失败条件)时有效。

临界值

置信水平zz^*t29t^*_{29}(df = 29)
90%1.6451.699
95%1.962.045
99%2.5762.756

误差幅度

ME=(critical value)×(standard error)\text{ME} = (\text{critical value}) \times (\text{standard error})

增大样本量 nn 会使标准误(从而误差幅度)按 n\sqrt{n} 的因子减小。把 nn 翻四倍会把误差幅度减半。

选择置信水平

  • 更高置信度 = 更宽区间。99% 区间比 95% 区间宽,95% 又比 90% 宽。
  • 95% 是大多数学术和专业场合的默认值。
  • 高风险(医疗、安全)时用 99%;当更窄的点估计比覆盖率更重要时用 90%。

需要避免的常见错误

  • 误解 95%:「真实均值有 95% 的概率落在这个区间内」是错误的(频率派)。正确说法是关于过程:95% 的同样构造的区间包含真实参数。
  • 该用 t 时用了 zσ\sigma 未知时用 tt^*。用 zz^* 会低估不确定性,尤其在小 nn 时。
  • 标准误中忘记 n\sqrt{n}:是 σ/n\sigma/\sqrt{n},不是 σ/n\sigma/n
  • 临界值方向错误95%(双侧)对应 z=1.96z^* = 1.96,而非第 95 百分位的 z=1.645z = 1.645。双侧临界值在每个尾部各截掉 α/2\alpha/2
  • 比例时跳过成功-失败条件:若 np^n\hat{p}n(1p^)<10n(1-\hat{p}) < 10,正态近似失效——改用精确(Clopper-Pearson)或基于得分的区间。
  • 混淆置信区间与预测区间:95% 置信区间以 95% 覆盖率估计均值预测区间估计单个未来观测——要宽得多。

示例题目

Step 1: σ\sigma 未知,n30n \geq 30——用 t 区间,df=29df = 29
Step 2: t2.045t^* \approx 2.045(查 t 表)
Step 3: 标准误:s/n=8/301.461s/\sqrt{n} = 8/\sqrt{30} \approx 1.461
Step 4: 误差幅度:2.045×1.4612.9872.045 \times 1.461 \approx 2.987
Step 5: 置信区间:72±2.987(69.01,74.99)72 \pm 2.987 \approx (69.01, 74.99)
Answer: 95% CI: approximately (69.0,75.0)(69.0, 75.0)

Step 1: p^=240/400=0.6\hat{p} = 240/400 = 0.6
Step 2: 成功-失败检验:4000.6=24010400 \cdot 0.6 = 240 \geq 104000.4=16010400 \cdot 0.4 = 160 \geq 10
Step 3: 标准误:0.60.4/400=0.0006=0.0245\sqrt{0.6 \cdot 0.4 / 400} = \sqrt{0.0006} = 0.0245
Step 4: 99% 对应 z=2.576z^* = 2.576
Step 5: 误差幅度:2.576×0.02450.0632.576 \times 0.0245 \approx 0.063
Step 6: 置信区间:0.6±0.063=(0.537,0.663)0.6 \pm 0.063 = (0.537, 0.663)
Answer: 99% CI for the proportion: approximately (0.537,0.663)(0.537, 0.663)

Step 1: σ\sigma 已知——用 z 区间
Step 2: 90% 对应 z=1.645z^* = 1.645
Step 3: 标准误:σ/n=15/64=15/8=1.875\sigma/\sqrt{n} = 15/\sqrt{64} = 15/8 = 1.875
Step 4: 误差幅度:1.645×1.8753.0841.645 \times 1.875 \approx 3.084
Step 5: 置信区间:50±3.084=(46.92,53.08)50 \pm 3.084 = (46.92, 53.08)
Answer: 90% CI: approximately (46.92,53.08)(46.92, 53.08)

常见问题

它意味着如果你多次重复整个抽样和区间构造过程,得到的区间中约有 95% 会包含真实总体参数。这是关于过程的陈述,而不是关于任何单个区间的概率陈述。

只要总体标准差 σ 未知、你用样本标准差 s 来估计,就用 t——实践中几乎总是如此。只有当 σ 确实已知时才用 z(在课本之外很少见)。

误差幅度按 1/√n 成比例缩小。要把误差幅度减半,需要把样本量翻四倍——收益递减很快出现。

置信区间以给定覆盖率估计总体参数(如均值)。预测区间估计单个未来观测,要宽得多,因为它必须同时考虑均值的不确定性*和*个体值围绕均值的离散程度。

相关求解器

相关学习指南

免费试用 AI-Math

任何数学问题都能获得分步解答。拍照上传或输入问题即可。

开始解题