均值、中位数、众数计算器

为任意数据集计算均值、中位数和众数,提供分步解题过程

拖拽或 点击 上传图片或 PDF

Math Input
求 10, 20, 30, 40, 50 的均值
求 3, 7, 5, 9, 5, 2 的中位数
求 1, 2, 2, 3, 3, 3, 4 的众数

什么是均值、中位数和众数?

均值中位数众数是统计学中三种主要的集中趋势度量指标,它们分别以不同的方式描述数据集的中心位置。

均值(算术平均数)

均值是所有数值的总和除以数值的个数:

xˉ=i=1nxin=x1+x2++xnn\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} = \frac{x_1 + x_2 + \cdots + x_n}{n}

均值对异常值敏感——一个极端的大值或小值可以显著改变均值。

中位数

中位数是数据按升序排列后位于中间的值。对于 nn 个数据点:

  • nn 为奇数:中位数 =xn+12= x_{\frac{n+1}{2}}
  • nn 为偶数:中位数 =xn2+xn2+12= \frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2}

中位数对异常值具有稳健性,更适合偏态分布。

众数

众数是出现频率最高的值。一个数据集可以是:

  • 单峰——一个众数
  • 双峰——两个众数
  • 多峰——多于两个众数
  • 无众数——所有值出现频率相同

这三个指标共同描绘了数据集“中心”位置的全面图景。

如何计算均值、中位数和众数

计算均值

  1. 求和:将所有数据值相加:xi\sum x_i
  2. 除以总数 nn
  3. 结果:xˉ=xin\bar{x} = \frac{\sum x_i}{n}

加权平均数:当数值具有不同权重时:

xˉw=wixiwi\bar{x}_w = \frac{\sum w_i x_i}{\sum w_i}

计算中位数

  1. 将数据按升序排列
  2. 计算数据个数 nn
  3. nn奇数:中位数是第 n+12\frac{n+1}{2} 个位置的值
  4. nn偶数:中位数是第 n2\frac{n}{2} 个和第 n2+1\frac{n}{2}+1 个位置的值的平均

计算众数

  1. 统计每个值出现的频率
  2. 找出频率最高的值
  3. 若所有值都只出现一次,则没有众数

对比表

度量最适用于受异常值影响?唯一性?
均值对称数据总是唯一
中位数偏态数据总是唯一
众数分类数据不一定唯一

何时使用各度量

  • 均值:用于无极端异常值的正态分布数据(如大班级的考试成绩)。
  • 中位数:用于偏态数据或存在异常值时(如家庭收入)。
  • 众数:用于分类数据或寻找最常见的值(如最受欢迎的鞋码)。

均值、中位数、众数之间的关系

对于完美对称的分布:均值 == 中位数 == 众数。

对于右偏分布:均值 >> 中位数 >> 众数。

对于左偏分布:均值 << 中位数 << 众数。

常见错误

  • 求中位数前忘记排序 —— 中位数要求数据有序排列,使用未排序的数据会得到错误结果。
  • 对偏态数据混淆均值和中位数 —— 均值会被异常值拉偏,因此对于偏态分布,中位数是更好的集中趋势度量。
  • 频率相同时错误认为“无众数” —— 如果多个值共享最高频率,它们都是众数(双峰或多峰)。
  • 除以错误的计数 —— 确保除以数据点的总数,而非不同值的个数。
  • 不考虑异常值 —— 始终检查是否存在可能使均值产生误导的极端值。

示例题目

Step 1: 均值:xˉ=3+7+5+9+5+26=3165.167\bar{x} = \frac{3+7+5+9+5+2}{6} = \frac{31}{6} \approx 5.167
Step 2: 排序:2,3,5,5,7,92, 3, 5, 5, 7, 9。因为 n=6n=6(偶数),中位数 =5+52=5= \frac{5+5}{2} = 5
Step 3: 众数:55 出现两次(频率最高)
Answer: 均值5.167, 中位数=5, 众数=5\text{均值} \approx 5.167,\ \text{中位数} = 5,\ \text{众数} = 5

Step 1: 均值:xˉ=12+15+12+18+22+15+127=106715.14\bar{x} = \frac{12+15+12+18+22+15+12}{7} = \frac{106}{7} \approx 15.14
Step 2: 排序:12,12,12,15,15,18,2212, 12, 12, 15, 15, 18, 22。因为 n=7n=7(奇数),中位数 =x4=15= x_4 = 15
Step 3: 众数:1212 出现三次(频率最高)
Answer: 均值15.14, 中位数=15, 众数=12\text{均值} \approx 15.14,\ \text{中位数} = 15,\ \text{众数} = 12

Step 1: 均值:xˉ=100+200+300+400+100005=110005=2200\bar{x} = \frac{100+200+300+400+10000}{5} = \frac{11000}{5} = 2200
Step 2: 数据已排序。因为 n=5n=5(奇数),中位数 =x3=300= x_3 = 300
Step 3: 均值(22002200)远大于中位数(300300),这是因为异常值 1000010000 的影响,说明了为什么偏态数据应使用中位数
Answer: 均值=2200, 中位数=300\text{均值} = 2200,\ \text{中位数} = 300

常见问题

均值是算术平均数(总和除以个数),中位数是数据排序后的中间值,众数是出现频率最高的值。它们分别从不同角度衡量数据集的中心位置。

当数据存在偏态或包含异常值时应使用中位数。例如,中位数家庭收入比平均收入更具代表性,因为少数高收入家庭会拉高均值。

可以。有两个众数的数据集称为双峰,有两个以上众数的称为多峰。如果所有值出现频率相同,则该数据集没有众数。

异常值会强烈影响均值,将其拉向极端值方向。中位数和众数对异常值具有抗性,即使存在极端值也保持稳定。

相关求解器

Standard deviationProbabilityQuadratic
免费试用 AI-Math

任何数学问题都能获得分步解答。拍照上传或输入问题即可。

开始解题