入门≈ 12 分钟未开始
直方图
核心概念
直方图(频数分布直方图):把一组连续数据(身高、成绩、温度…)分成若干组,统计每组的频数,用紧挨着的矩形条表示。
关键词:
- 组距:每个分组的宽度。例如把身高按 5 cm 分组,组距就是 5。
- 频数:落在某一组内的数据个数。
- 频率:频数 / 总样本量。
- 频数分布表:把每组的边界、频数、频率列成的表。
画直方图的步骤:
- 找最大值、最小值,计算极差 (max − min)。
- 选组距(经验:总样本 50 个左右时分 5–12 组比较合适)。
- 算组数 = ⌈极差 / 组距⌉。
- 列频数分布表。
- 画图:横轴表示数据(连续刻度),纵轴表示频数 (或频率/组距),矩形紧挨。
直方图 vs 条形图:
| 直方图 | 条形图 | |
|---|---|---|
| 数据类型 | 连续数据(身高、温度) | 分类数据(品牌、爱好) |
| 矩形 | 紧挨没有空隙 | 有空隙 |
| 横轴 | 数值刻度 | 类别标签 |
直观理解 · 动手试试
直方图最能让你一眼看到数据的分布形状 —— 是不是大致呈"中间高两边低"(正态)、还是偏向一侧(偏态)、还是有多个峰?组距选得不同,看到的"分布形状"也会不同。试着拖动组距,体会这个权衡。
互动演示拖动组距 → 看直方图怎么变
5 cm
总样本量:40 个。组距越小,看到的细节越多但容易"忽高忽低";组距越大,趋势越平滑但可能掩盖细节。
观察:组距太小 → 形状碎片化、噪声大;组距太大 → 形状被抹平、细节丢失。一般以"能清楚看到分布趋势又不太抖"为佳。
调查 50 个学生身高,最高 178 cm,最低 152 cm。组距取 5 cm,应分多少组?
互动演示分组数 = ⌈极差 ÷ 组距⌉
极差 = 最大 − 最小 = 178 − 152 = 26
⌈26 ÷ 5⌉ = ⌈5.20⌉ = 6 组
152
157
162
167
172
177
组数要向上取整(⌈⌉):哪怕余数很小也要多分一组,才能把最大值装进去。本题 26÷5=5.2 → 6 组。
▸查看解答步骤
答: 6 组
某直方图中身高 这一组的频数是 12,总样本是 40 人。这一组的频率是?
互动演示读直方图:点一根柱子,算它的频率
160–165 cm 这组: 频率 = 12 / 40 = 0.300 = 30.0%
每根柱子的高度是频数;除以总样本(40)就得到频率。所有柱子的频率加起来 = 1。160–165 这组 12/40 = 0.3。
▸查看解答步骤
答: 频率 = 0.3
即时练习
极差为 35,组距取 5,需要分几组? ,正好整除,分 7 组。
下列哪种数据更适合用直方图(而不是条形图)展示? 各品牌手机的销量 各班级的男女生人数 全班同学的身高 各运动项目最喜欢的人数 身高是连续数据,其他都是分类数据(条形图更合适)。
直方图的矩形之间没有空隙 (紧挨),因为数据是连续的。 这是直方图区别于条形图的核心特征。
某组频数 25,总样本 100。这组频率等于?(请填小数) 。
易错点
- 把直方图和条形图混用 — 连续数据用直方图、分类数据用条形图
- 选组距时太小(形状抖)或太大(看不出分布)
- 各组频率相加应等于 1;如果不等,通常是分组漏数据或重复了
下一步
前置知识点
接下来学习
—