第
2
讲 用样本估计总体
最新考纲
1.
了解分布的意义和作用
,
能根据频率分布表画频率分布直方图、频率折线图、茎叶图
,体会它们各自的特点;
2.
理解样本数据标准差的意义和作用
,
会计算数据标准差;
3.
能从样本数据中提取基本的数字特征
(
如平均数、标准差
)
,
并作出合理的解释;
4.
会用样本的频率分布估计总体分布
,
会用样本的基本数字特征估计总体的基本数字特征
,
理解用样本估计总体的思想;
5.
会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题
.
知
识
梳
理
极差
分组
(2)
频率分布直方图:反映样本频率分布的直方图
(
如图
)
频率
3.
样本的数字特征
数字特征
定义
众数
在一组数据中,出现
次数
_____
的
数据叫做这组数据的众数
中位数
将一组数据按大小依次排列,把
处在
_______
位置
的一个数据
(
或最中间两个数据
的
_______
)
叫做这组数据的中位数
在频率分布直方图中,中位数左边和右边的直方图的
面积
_____
最多
最中间
平均数
相等
平均数
样本
数据的算术平均数,
即
=
_____________
方差
s
2
=
_________________________________
,
其中
s
为标准差
诊
断
自
测
1.
判断正误
(
在括号内打
“√”
或
“×”
)
精彩
PPT
展示
(1)
平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
.(
)
(2)
一组数据的方差越大,说明这组数据越集中
.(
)
(3)
频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高
.(
)
(4)
茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次
.(
)
解析
(2)
错误
.
方差越大,这种数据越离散
.
(4)
错误
.
相同的数据叶要重复记录,故
(4)
错误
.
答案
(1)
√
(2)
×
(3)
√
(4)
×
2.
(
必修
3P70
改编
)
若某校高一年级
8
个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是
(
)
A.91.5
和
91.5
B.91.5
和
92
C.91
和
91.5
D.92
和
92
答案
A
答案
D
4.
(2016·
江苏卷
)
已知一组数据
4.7
,
4.8
,
5.1
,
5.4
,
5.5
,则该组数据的方差是
________.
答案
0.1
5.
(2017·
济南调研
)
为了研究某药品的疗效,选取若干名志愿者进行临床试验
.
所有志愿者的舒张压数据
(
单位:
kPa)
的分组区间为
[12
,
13)
,
[13
,
14)
,
[14
,
15)
,
[15
,
16)
,
[16
,
17]
,将其按从左到右的顺序分别编号为第一组,第二组,
……
,第五组
.
下图是根据试验数据制成的频率分布直方图
.
已知第一组与第二组共有
20
人,第三组中没有疗效的有
6
人,则第三组中有疗效的人数为
________.
答案
12
考点一 茎叶图及其应用
【例
1
】
(2014·
全国
Ⅱ
卷
)
某市为了考核甲、乙两部门的工作情况,随机访问了
50
位市民
.
根据这
50
位市民对这两部门的评分
(
评分越高表明市民的评价越高
)
,绘制茎叶图如下:
(1)
分别估计该市的市民对甲、乙两部门评分的中位数;
(2)
分别估计该市的市民对甲、乙两部门的评分高于
90
的概率;
(3)
根据茎叶图分析该市的市民对甲、乙两部门的评价
.
(3)
由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大
.
规律方法
(1)
茎叶图的优点是保留了原始数据
,
便于记录及表示
,
能反映数据在各段上的分布情况
.
(2)
①
作样本的茎叶图时先要根据数据特点确定茎、叶
,
再作茎叶图;作
“
叶
”
时
,
要做到不重不漏
,
一般由内向外
,
从小到大排列
,
便于数据的处理
.
②
根据茎叶图中数据数字特征进行分析判断考查识图能力
,
判断推理能力和创新应用意识;解题的关键是抓住
“
叶
”
的分布特征
,
准确提炼信息
.
【训练
1
】
以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩
(
单位:分
)
已知甲组数据的中位数为
15
,乙组数据的平均数为
16.8
,则
x
+
y
的值为
________.
答案
13
考点二 频率分布直方图
(
多维探究
)
命题角度一 用频率分布直方图求频率、频数
【例
2
-
1
】
(2016·
山东卷
)
某高校调查了
200
名学生每周的自习时间
(
单位:小时
)
,制成了如图所示的频率分布直方图,其中自习时间的范围是
[17.5
,
30]
,样本数据分组为
[17.5
,
20)
,
[20
,
22.5)
,
[22.5
,
25)
,
[25
,
27.5)
,
[27.5
,
30].
根据直方图,这
200
名学生中每周的自习时间不少于
22.5
小时的人数是
(
)
A.56 B.60 C.120 D.140
解析
由频率分布直方图可知每周自习时间不少于
22.5
小时的频率为
(0.16
+
0.08
+
0.04)
×
2.5
=
0.7
,则每周自习时间不少于
22.5
小时的人数为
0.7
×
200
=
140.
答案
D
命题角度二 用频率分布直方图估计总体
【例
2
-
2
】
(2016·
四川卷
)
我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查
.
通过抽样,获得了某年
100
位居民每人的月均用水量
(
单位:吨
)
,将数据按照
[0
,
0.5)
,
[0.5
,
1)
,
……
,
[4
,
4.5]
分成
9
组,制成了如图所示的频率分布直方图
.
(1)
求直方图中
a
的值;
(2)
设该市有
30
万居民,估计全市居民中月均用水量不低于
3
吨的人数,说明理由;
(3)
估计居民月均用水量的中位数
.
解
(1)
由频率分布直方图可知:月均用水量在
[0
,
0.5)
内的频率为
0.08
×
0.5
=
0.04.
同理,在
[0.5
,
1)
,
[1.5
,
2)
,
[2
,
2.5)
,
[3
,
3.5)
,
[3.5
,
4)
,
[4
,
4.5]
等组的频率分别为
0.08
,
0.21
,
0.25
,
0.06
,
0.04
,
0.02.
由
1
-
(0.04
+
0.08
+
0.21
+
0.25
+
0.06
+
0.04
+
0.02)
=
0.5
×
a
+
0.5
×
a
,解得
a
=
0.30.
(2)
由
(1)
知,该市
100
位居民中月均用水量不低于
3
吨的频率为
0.06
+
0.04
+
0.02
=
0.12.
由以上样本的频率分布,可以估计
30
万居民中月均用水量不低于
3
吨的人数为
300 000
×
0.12
=
36 000.
(3)
设中位数为
x
吨
.
因为前
5
组的频率之和为
0.04
+
0.08
+
0.15
+
0.21
+
0.25
=
0.73>0.5.
又前
4
组的频率之和为
0.04
+
0.08
+
0.15
+
0.21
=
0.48