高考
第四节 用样本估计总体
【知识重温】
一、必记 3 个知识点
1.频率分布直方图
(1)通常我们对总体作出的估计一般分成两种.一种是用样本的①________估计总体的分
布.另一种是用样本的②________估计总体的数字特征.
(2)在频率分布直方图中,纵轴表示③________,数据落在各小组内的频率用各小长方形的
④________表示.各小长方形的面积总和⑤________.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着⑥
________的增加,作图时所分的⑦________增加,相应的频率分布折线图就会越来越接近于一
条光滑的曲线,统计中称之为⑧________________,它能够更加精细地反映出总体在各个 X 围
内取值的⑨________.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且
可以随时记录,给数据的记录和表示都带来方便.
2.众数,中位数,平均数
(1)众数:在一组数据中,出现次数⑩________的数据叫做这组数据的众数.
(2)中位数:将一组数据按大小依次排列,把处在⑪________位置的一个数据(或最中间两
个数据的平均数)叫做这组数据的⑫________.
(3)平均数:样本数据的算术平均数.即 x =⑬__________.在频率分布直方图中,中位数
左边和右边的直方图的面积应该⑭________.
3.样本方差,标准差
标准差
高考
s=
1
n
[x1- x 2+x2- x 2+…+xn- x 2],
其中 xn 是样本数据的第 n 项,n 是样本容量, x 是⑮________.标准差是反映总体波动大
小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量⑯________
总体容量时,样本方差越接近总体方差.
二、必明 1 个易误点
不要把直方图错认为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频
数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,连续随机变量在某一点上是没
有频率的.
【小题热身】
一、判断正误
1.判断下列说法是否正确(请在括号中打“√”或“×”).
(1)在频率分布直方图中,小矩形的高表示频率.( )
(2)频率分布直方图中各个长方形的面积之和为 1.( )
(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( )
(4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(5)一组数据的方差越大,说明这组数据的波动越大.( )
二、教材改编
2.四名同学各掷骰子 5 次,分别记录每次骰子出现的点数.根据四名同学的统计结果,
可以判断出一定没有出现点数 6 的是( )
A.平均数为 3,中位数为 2
B.中位数为 3,众数为 2
C.平均数为 2,方差为 2.4
D.中位数为 3,方差为 2.8
高考
3.已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
三、易错易混
4.把样本容量为 20 的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),
4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( )
A.0.05 B.0.25
C.0.5 D.0.7
5.若数据 x1,x2,x3,…,xn 的平均数 x-=5,方差 s2=2,则数据 3x1+1,3x2+1,3x3
+1,…,3xn+1 的平均数和方差分别为________.
四、走进高考
6.[2019·全国卷Ⅱ]演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成
绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9
个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
考点一 样本的数字特征[自主练透型]
1.[2018·某某卷]
高考
已知 5 位裁判给某运动员打出的分数的茎叶图如图所示,那么这 5 位裁判打出的分数的
平均数为________.
2.[2021·某某、某某、某某联考]从某小学随机抽取 100 名学生,将他们的身高(单位:
厘米)分布情况汇总如下:
身高 (100,110] (110,120] (120,130] (130,140] (140,150]
频数 5 35 30 20 10
由此表估计这 100 名小学生身高的中位数为(结果保留 4 位有效数字)( )
A.119.3 B.119.7
C.123.3 D.126.7
3.[2021·某某市调研考试试题]某工厂为了解产品的生产情况,随机抽取了 100 个产品
为样本.若样本数据 x1,x2,…,x100 的方差为 8,则数据 2x1-1,2x2-1,…,2x100-1 的方
差为( )
A.8 B.15
C.16 D.32
悟·技法
众数、中位数、平均数及方差的意义及计算公式
(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数
描述数据集中趋势,方差和标准差描述波动的大小.
(2)平均数、方差的公式推广.
高考
①若数据 x1,x2,…,xn 的平均数为 x ,那么 mx1+a,mx2+a,mx3+a,…,mxn+a
的平均数是 m x-+a.
②数据 x1,x2,…,xn 的方差为 s2.
(ⅰ)数据 x1+a,x2+a,…,xn+a 的方差也为 s2;
(ⅱ)数据 ax1,ax2,…,axn 的方差为 a2s2.
(3)方差的简化计算公式.
s2=
1
n
[(x2
1+x2
2+…+x2
n)-n x-2]或写成 s2=
1
n
(x2
1+x2
2+…+x2
n)- x-2,即方差等于原数据平
方的平均数减去平均数的平方.
考点二 茎叶图[自主练透型]
4.[2021·某某、某某某某二中联考]某市重点中学奥数培训班共有 14 人,分为
两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数
是 88,乙组学生成绩的中位数是 89,则 m+n 的值是( )
A.10 B.11
C.12 D.13
5.[2021·某某某某质检]在一次 53.5 千米的自行车个人赛中,25 名参赛选手成绩(单位:
分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为 1~25 号,再用系统抽样的方法
从中选取 5 人,已知选手甲的成绩为 85 分钟,若甲被选取,则被选取的其余 4 名选手的成绩
的平均数为( )
高考
A.95 B.96
C.97 D.98
悟·技法
茎叶图的应用
(1)茎叶图中的“茎”上的数字代表十位上的数字,“叶”上的数字代表个位上的数字(若没有
则表示该数据不存在);
(2)解题时,可把茎叶图中的数字按大小顺序转化为总体的个体数字再求解.
考点三 频率分布直方图[互动讲练型]
[例 1] [2020·某某卷]从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分
为 9 组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分
布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )
A.10 B.18
C.20 D.36
悟·技法
1.绘制频率分布直方图时的 2 个注意点
(1)制作好频率分布表后,可以利用各组的频率之和是否为 1 来检验该表是否正确.
高考
(2)频率分布直方图的纵坐标是
频率
组距
,而不是频率.
2.由频率分布直方图进行相关计算时,需掌握的 2 个关系式
(1)
频率
组距
×组距=频率.
(2)
频数
样本容量
=频率,此关系式的变形为
频数
频率
=样本容量,样本容量×频率=频数.
[变式练]——(着眼于举一反三)
1.[2021·某某市统一模拟考试]某学校对本校高三 500 名学生的视力进行了一次调查,
随机抽取了 100 名学生的体检表,得到的频率分布直方图如图所示,若频率分布直方图后四
组的频数成等差数列,则估计本校高三这 500 名学生中视力在 4.8 以上(含 4.8)的人数为( )
A.185 B.180
C.195 D.200
考点四 扇形图与折线图[互动讲练型]
[例 2] (1)[2018·全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,
实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农
村的经济收入构成比例,得到如下饼状图:
高考
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
(2)[2021·某某某某模拟]如图为某市国庆节 7 天假期的楼房认购量与成交量的折线图,小
明同学根据折线图对这 7 天的认购量(单位:套)与成交量(单位:套)作出如下判断,其中判断
正确的是( )
A.日成交量的中位数是 26
B.日成交量超过日平均成交量的有 2 天
C.认购量与日期正相关
D.10 月 7 日认购量的增幅大于 10 月 7 日成交量的增幅
高考
悟·技法
(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.
(2)折线图可以显示随时间(根据常用比例放置)而变化的数据,因此非常适用于显示在相等
时间间隔下数据的变化趋势.
[变式练]——(着眼于举一反三)
2.[2021·某某市第一次模拟考试]某省普通高中学业水平考试成绩由高分到低分按人数所
占比例依次分为 A,B,C,D,E 五个等级,A 等级 15%,B 等级 30%,C 等级 30%,D,E
等级共 25%.其中 E 等级为不合格,原则上比例不超过 5%.该省某校高二年级学生都参加学业
水平考试,先从中随机抽取了部分学生的考试成绩进行统计,统计结果如图所示.若该校高
二年级共有 1 000 名学生,则估计该年级拿到 C 等级及以上级别的学生人数为( )
A.45 B.660
C.880 D.900
3.某市气象部门根据 2018 年各月的每天最高气温平均值与最低气温平均值(单位:℃)
数据,绘制如下折线图:
那么,下列叙述不正确的是( )
高考
A.各月最高气温平均值与最低气温平均值总体呈正相关
B.全年中,2 月份的最高气温平均值与最低气温平均值的差值最大
C.全年中各月最低气温平均值不高于 10 ℃的月份有 5 个
D.从 2018 年 7 月至 12 月该市每天最高气温平均值与最低气温平均值呈下降趋势
第四节 用样本估计总体
【知识重温】
①频率分布 ②数字特征 ③
频率
组距
④面积
⑤等于 1 ⑥样本容量 ⑦组数 ⑧总体密度曲线 ⑨百分比 ⑩最多 ⑪最中间
⑫中位数 ⑬1
n
(x1+x2+…+xn) ⑭相等
⑮平均数 ⑯接近
【小题热身】
1.答案:(1)× (2)√ (3)× (4)√
(5)√
2.答案:C
3.解析:5 个数的平均数 x-=
4.7+4.8+5.1+5.4+5.5
5
=5.1,所以它们的方差 s2=
1
5
[(4.7
-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
答案:0.1
高考
4.解析:由题意知,在区间[10,50)上的数据的频数是 2+3+4+5=14,故其频率为
14
20
=0.7.
答案:D
5 . 解 析 : ∵ x1 , x2 , x3 , … , xn 的 平 均 数 为 5 , ∴
x1+x2+x3+…+xn
n
= 5 , ∴
3x1+3x2+3x3+…+3xn
n
+1=3×5+1=16,∵x1,x2,x3,…,xn 的方差为 2,∴3x1+1,3x2
+1,3x3+1,…,3xn+1 的方差是 32×2=18.
答案:16,18
6.解析:记 9 个原始评分分别为 a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),
易知 e 为 7 个有效评分与 9 个原始评分的中位数,故不变的数字特征是中位数,故选 A.
答案:A
课堂考点突破
考点一
1.解析:这 5 位裁判打出的分数分别是 89,89,90,91,91,因此这 5 位裁判打出的分数的
平均数为
89+89+90+91+91
5
=90.
答案:90
2.解析:本题考查中位数,体现了数学运算的核心素养.由题意知身高在(100,110],
(110,120],(120,130]的频率依次为 0.05,0.35,0.3,前两组频率和为 0.4,组距为 10,设中
位数为 x,则(x-120)×
0.3
10
=0.1,解得 x≈123.3.故选 C.
答案:C
3.解析:样本数据 x1,x2,…,x100 的方差为 8,则数据 2x1-1,2x2-1,…,2x100-1
的方差为 22×8=32,故选 D.
高考
答案:D
考点二
4.解析:∵甲组学生成绩的平均数是 88,
∴由茎叶图可知 78+86+84+88+95+90+m+92=88×7,∴m=3,
∵乙组学生成绩的中位数是 89,∴n=9,
∴m+n=12.故选 C.
答案:C
5.解析:由系统抽样法及已知条件可知被选中的其他 4 人的成绩分别是 88,94,99,107,
故平均数为
88+94+99+107
4
=97,故选 C.
答案:C
考点三
例 1 解析:由题知[5.43,5.45)与[5.45,5.47)所对应的小矩形的高分别为 6.25,5.00,所
以[5.43,5.47)的频率为(6.25+5.00)×0.02=0.225,所以直径落在区间[5.43,5.47)内的个数为
80×0.225=18,故选 B.
答案:B
变式练
1.解析:由题意得频率分布直方图前三组的频率依次为 0.03,0.07,0.27,所以前三组的
频数依次为 3,7,27,则后四组的频数和为 90,又后四组的频数成等差数列,所以后四组的频
数依次为 27,24,21,18,所以视力在 4.8 以上(含 4.8)的频率为 39%,故本校高三这 500 名学
生中视力在 4.8 以上(含 4.8)的人数约为 500×39%=195.选 C.
答案:C
考点四
例 2 解析:(1)设新农村建设前,农村的经济收入为 a,则新农村建设后,农村的经济收
入为 2a.新农村建设前后,各项收入的对比如下表:
高考
新农村
建设前
新农村
建设后
新农村建设
后变化情况
结论
种植收入 60%a 37%×2a=74%a 增加 A 错
其他收入 4%a 5%×2a=10%a 增加了一倍以上 B 对
养殖收入 30%a 30%×2a=60%a 增加了一倍 C 对
养殖收入
+第三产
业收入
(30%+6%)a
=36%a
(30%+28%)
×2a=116%a
超过经济收
入 2a 的一半
D 对
故选 A.
(2)7 天假期楼房的成交量从小到大依次为 8,13,16,26,32,38,166,所以日成交量的中位数
为 26,所以 A 正确;日平均成交量为
8+13+16+26+32+38+166
7
≈42.7,只有一天日成
交量超过日平均成交量,所以 B 错误;由折线图的起伏变化可知,认购量与日期不是正相关,
所以 C 错误;10 月 7 日认购量的增幅为
276-112
112
×100%≈146.4%,10 月 7 日成交量的增
幅为
166-38
38
≈336.8%,显然 10 月 7 日认购量的增幅小于 10 月 7 日成交量的增幅,所以 D
错误,故选 A.
答案:(1)A (2)A
变式练
2.解析:由题中两图可知 C 等级所占比例为 12÷
10
20%
=24%,所以 C 等级及以上级别
所占比例为 20%+24%+46%=90%,所以 C 等级及以上级别的学生人数为 1 000×90%=
900.故选 D.
答案:D
高考
3.解析:对于 A,根据折线图可以发现除 2 月份外,各月最低气温平均值越高,最高气
温平均值也越高,总体呈正相关,A 正确;对于 B,通过折线图观察,2 月份的两个点距离最
大,B 正确;对于 C,各月最低气温平均值不高于 10 ℃的有 1 月,2 月,3 月,11 月,12
月,共有 5 个月,C 正确;对于 D,观察折线图可知,7 月份到 8 月份气温在上升,D 错误.
答案:D