进阶15 分钟未开始

数据的集中趋势

核心概念

三个集中趋势的统计量,用来描述一组数据的"中心位置":

平均数(算术平均):

xˉ=1n(x1+x2++xn)\bar{x} = \dfrac{1}{n}(x_1 + x_2 + \cdots + x_n)

中位数:把数据按大小排序后,处于正中间位置的数。

  • nn 为奇数,中间那个数就是中位数;
  • nn 为偶数,取中间两个数的平均值

众数:数据中出现次数最多的那个值。

  • 一组数据可能有一个、多个、或没有众数。
  • 没有重复的数据没有众数(初中说法)。

加权平均数:不同数据有不同"权重"wiw_i 时:

xˉ=w1x1+w2x2++wnxnw1+w2++wn\bar{x} = \dfrac{w_1 x_1 + w_2 x_2 + \cdots + w_n x_n}{w_1 + w_2 + \cdots + w_n}

何时用哪个:

  • 平均数:利用全部数据,反映总体水平,但易受极端值影响;
  • 中位数:不受极端值影响,适合有少数极端数据(如收入分布)的情形;
  • 众数:反映最常出现的值,适合"哪个码鞋销量最大"这类问题。

直观理解 · 动手试试

拖动数据点,观察平均数(黄色)、中位数(蒙特色)、众数(红色)如何变化。把一个值拉到很远,平均数会跟着大幅移动,但中位数几乎不动 —— 这就是"鲁棒性"差异。

互动演示

拖动数据点,看三个统计量变化

135791113151719平均 8.71中位 8.0众数 7
平均数
8.714
中位数
8.0
众数
7
当前数据:377891215
例题 1计算三个统计量

数据 3,7,7,8,9,12,153, 7, 7, 8, 9, 12, 15,求平均数、中位数、众数。

互动演示平均数 / 中位数 / 众数
0246810121416

平均数=总和÷个数;中位数=排序后正中间那个;众数=出现最多的数(这里 7 出现两次)。

查看解答步骤

答: 均=8.71, 中=8, 众=7

例题 2加权平均

某次考试,语文 8080 分(权重 40%40\%),数学 9090 分(权重 40%40\%),英语 7070 分(权重 20%20\%)。求加权平均分。

互动演示加权平均:权重不同,结果不同
语文80×
40%
32.0
数学90×
40%
36.0
英语70×
20%
14.0
加权平均 = 82

加权平均 = Σ(分数 × 权重)。权重 40/40/20 → 82 分;若按简单平均(各 1/3)则是 80 分。权重大的科目影响更大

查看解答步骤

答: 82 分

即时练习

数据 3,5,5,7,53, 5, 5, 7, 5 的众数是?

55 出现 33 次,最多,众数 =5= 5

数据 4,5,6,7,84, 5, 6, 7, 8 的中位数是?

已排序,55 个数(奇数),中间是第 33 个,即 66

数据 2,4,6,82, 4, 6, 8 的平均数是?

2+4+6+84=204=5\dfrac{2 + 4 + 6 + 8}{4} = \dfrac{20}{4} = 5

某城市居民月收入的分布很不均(少数高收入者),要反映典型居民的月收入水平,最合适的统计量是?

平均数中位数众数极差

平均数易被高收入"拉高",不能代表典型居民。中位数不受极端值影响,更能反映"中间"水平。

    易错点

    • 求中位数忘了先排序。 必须先升序排列,再找中间位置。直接对原始顺序找中间,常错。
    • 偶数个数据时只取中间一个。 nn 为偶数时,中位数 == 中间两个数的算术平均,不是任选一个。
    • 数据完全无重复时强报众数。 若每个值都只出现一次,没有众数(不要写"全部都是众数"或"取一个")。

    下一步

    前置知识点