进阶≈ 15 分钟未开始
数据的集中趋势
核心概念
三个集中趋势的统计量,用来描述一组数据的"中心位置":
平均数(算术平均):
中位数:把数据按大小排序后,处于正中间位置的数。
- 若 为奇数,中间那个数就是中位数;
- 若 为偶数,取中间两个数的平均值。
众数:数据中出现次数最多的那个值。
- 一组数据可能有一个、多个、或没有众数。
- 没有重复的数据没有众数(初中说法)。
加权平均数:不同数据有不同"权重" 时:
何时用哪个:
- 平均数:利用全部数据,反映总体水平,但易受极端值影响;
- 中位数:不受极端值影响,适合有少数极端数据(如收入分布)的情形;
- 众数:反映最常出现的值,适合"哪个码鞋销量最大"这类问题。
直观理解 · 动手试试
拖动数据点,观察平均数(黄色)、中位数(蒙特色)、众数(红色)如何变化。把一个值拉到很远,平均数会跟着大幅移动,但中位数几乎不动 —— 这就是"鲁棒性"差异。
互动演示
拖动数据点,看三个统计量变化
平均数
8.714
中位数
8.0
众数
7
当前数据:377891215
数据 ,求平均数、中位数、众数。
互动演示平均数 / 中位数 / 众数
平均数=总和÷个数;中位数=排序后正中间那个;众数=出现最多的数(这里 7 出现两次)。
▸查看解答步骤
答: 均=8.71, 中=8, 众=7
某次考试,语文 分(权重 ),数学 分(权重 ),英语 分(权重 )。求加权平均分。
互动演示加权平均:权重不同,结果不同
语文80×32.0
40%
数学90×36.0
40%
英语70×14.0
20%
加权平均 = 82 分
加权平均 = Σ(分数 × 权重)。权重 40/40/20 → 82 分;若按简单平均(各 1/3)则是 80 分。权重大的科目影响更大。
▸查看解答步骤
答: 82 分
即时练习
数据 的众数是?
出现 次,最多,众数 。
数据 的中位数是?
已排序, 个数(奇数),中间是第 个,即 。
数据 的平均数是?
。
某城市居民月收入的分布很不均(少数高收入者),要反映典型居民的月收入水平,最合适的统计量是?
平均数中位数众数极差平均数易被高收入"拉高",不能代表典型居民。中位数不受极端值影响,更能反映"中间"水平。
易错点
- 求中位数忘了先排序。 必须先升序排列,再找中间位置。直接对原始顺序找中间,常错。
- 偶数个数据时只取中间一个。 为偶数时,中位数 中间两个数的算术平均,不是任选一个。
- 数据完全无重复时强报众数。 若每个值都只出现一次,没有众数(不要写"全部都是众数"或"取一个")。