入门12 分钟未开始

直方图

核心概念

直方图(频数分布直方图):把一组连续数据(身高、成绩、温度…)分成若干,统计每组的频数,用紧挨着的矩形条表示。

关键词:

  • 组距:每个分组的宽度。例如把身高按 5 cm 分组,组距就是 5。
  • 频数:落在某一组内的数据个数
  • 频率:频数 / 总样本量。
  • 频数分布表:把每组的边界、频数、频率列成的表。

画直方图的步骤:

  1. 找最大值、最小值,计算极差 (max − min)。
  2. 组距(经验:总样本 50 个左右时分 5–12 组比较合适)。
  3. 组数 = ⌈极差 / 组距⌉。
  4. 频数分布表
  5. 画图:横轴表示数据(连续刻度),纵轴表示频数 (或频率/组距),矩形紧挨。

直方图 vs 条形图:

直方图条形图
数据类型连续数据(身高、温度)分类数据(品牌、爱好)
矩形紧挨没有空隙有空隙
横轴数值刻度类别标签

直观理解 · 动手试试

直方图最能让你一眼看到数据的分布形状 —— 是不是大致呈"中间高两边低"(正态)、还是偏向一侧(偏态)、还是有多个峰?组距选得不同,看到的"分布形状"也会不同。试着拖动组距,体会这个权衡。

互动演示拖动组距 → 看直方图怎么变
0246811451502150155515516081601658165170717017551751804180185身高 (cm)频数
5 cm

总样本量:40 个。组距越小,看到的细节越多但容易"忽高忽低";组距越大,趋势越平滑但可能掩盖细节。

观察:组距太小 → 形状碎片化、噪声大;组距太大 → 形状被抹平、细节丢失。一般以"能清楚看到分布趋势又不太抖"为佳。

例题 1计算组数

调查 50 个学生身高,最高 178 cm,最低 152 cm。组距取 5 cm,应分多少组?

互动演示分组数 = ⌈极差 ÷ 组距⌉
极差 = 最大 − 最小 = 178152 = 26
26 ÷ 5⌉ = ⌈5.20⌉ = 6
152
157
162
167
172
177

组数要向上取整(⌈⌉):哪怕余数很小也要多分一组,才能把最大值装进去。本题 26÷5=5.2 → 6 组。

查看解答步骤

答: 6 组

例题 2读直方图

某直方图中身高 160h<165160 \le h < 165 这一组的频数是 12,总样本是 40 人。这一组的频率是?

互动演示读直方图:点一根柱子,算它的频率
160–165 cm 这组: 频率 = 12 / 40 = 0.300 = 30.0%

每根柱子的高度是频数;除以总样本(40)就得到频率。所有柱子的频率加起来 = 1。160–165 这组 12/40 = 0.3。

查看解答步骤

答: 频率 = 0.3

即时练习

极差为 35,组距取 5,需要分几组? 35/5=735 / 5 = 7,正好整除,分 7 组。

下列哪种数据更适合用直方图(而不是条形图)展示? 各品牌手机的销量 各班级的男女生人数 全班同学的身高 各运动项目最喜欢的人数 身高是连续数据,其他都是分类数据(条形图更合适)。

    直方图的矩形之间没有空隙 (紧挨),因为数据是连续的。 这是直方图区别于条形图的核心特征。

    某组频数 25,总样本 100。这组频率等于?(请填小数) 25/100=0.2525 / 100 = 0.25

    易错点

    • 把直方图和条形图混用 — 连续数据用直方图、分类数据用条形图
    • 选组距时太小(形状抖)或太大(看不出分布)
    • 各组频率相加应等于 1;如果不等,通常是分组漏数据或重复

    下一步

    前置知识点
    接下来学习