用样本估计总体
授课提示:对应学生用书第 395 页
[A 组 基础保分练]
1.(2021·广东惠州一调)已知数据 x1,x2,…,x10,2 的平均值为 2,方差为 1,则数据 x1,
x2,…,x10 相对于原数据( )
A.一样稳定
C.变得不稳定
解析:数据 x1,x2,…,x10,2 的平均值为 2,方差为 1,故
1
11
[(x1-2)2+(x2-2)2+…
+(x10-2)2+(2-2)2]=1,数据 x1,x2,…,x10 的方差 s2=
1
10
[(x1-2)2+(x2-2)
2+…+(x10-2)2]>1,故相对于原数据变得不稳定.
答案:C
2.样本中共有五个个体,其值分别为 0,1,2,3,m.若该样本的平均值为 1,则其方差为
( )
A.
10
5
B.
30
5
C. 2
解析:依题意得 m=5×1-(0+1+2+3)=-1,样本方差 s2=
1
5
(12+02+12+22+22)
=2,即所求的样本方差为 2.
答案:D
3.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极
差与中位数之和为 61,则被污染的数字为( )
A.1
C.3
解析:由题图可知该组数据的极差为 48-20=28,则该组数据的中位数为 61-28=33,易
得被污染的数字为 2.
答案:B
4.(2020·高考天津卷)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分
为 9 组: [5.31,5.33), [5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如
下频率分布直方图,则在被抽取的零件中,直径落在区间 [5.43,5.47)内的个数为( )
A.10
C.20
解析:根据频率分布直方图,直径落在区间 [5.43,5.47)之间的零件频率为:
(6.25+5.00)×0.02=0.225,
则直径落在区间 [5.43,5.47)内的零件个数为 80×0.225=18.
答案:B
5.(2021·四川五校联考)如图为截至 2019 年 3 月末,我国的外汇储备近 1 年的变化折线图,
由此得到以下说法,其中叙述正确的是( )
A.近 1 年来,我国外汇储备月增长量最大的月份是 2019 年 3 月
B.2018 年 4 月至 10 月,我国外汇储备连续下降
C.2018 年底,我国外汇储备降至近年来最低
,我国外汇储备连续五个月上升
解析:选项 A,由题图知,我国外汇储备月增长量最大的月份是 2019 年 1 月,A 错误;选项
B,2018 年 4 月至 10 月,我国外汇储备有升有降,B 错误;选项 C,由题图无法说明 2018
年底,我国外汇储备降至近年来最低,C 错误;选项 D,我国外汇储备自 2018 年 11 月起连
续上升,2019 年 3 月为第五个月,D 正确.
答案:D
6.(2021·长郡中学模拟)若 x1,x2,…,x2 020 的平均数为 3,标准差为 4,且 yi=-3(xi-
2),i=1,2,…,2 020,则新数据 y1,y2,…,y2 020 的平均数和标准差分别为( )
A.-9,12 B.-9,36
C.3,36 D.-3,12
解析:由平均数和标准差的性质可知,若 x1,x2,x3,…,xn 的平均数为x
-
,标准差为 s,则
kx1+b,kx2+b,kx3+b,…,kxn+b 的平均数为 kx
-
+b,标准差为|k|s,据此结合题意可得,
y1,y2,…,y2 020 的平均数为-3(3-2)=-3,标准差为 3×4=12.
答案:D
7.(2021·湖南湘东五校联考)已知等差数列{an}的公差为 d,若 a1,a2,a3,a4,a5 的方差为
8,则 d 的值为_________.
解析:依题意,由等差数列的性质得 a1,a2,a3,a4,a5 的平均数为 a3,则由方差公式得
1
5
×
[(a1-a3)2+(a2-a3)2+(a3-a3)2+(a4-a3)2+(a5-a3)2]=8,所以 d=±2.
答案:±2
8.某校女子篮球队 7 名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为
175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为 x,那么 x
的值为_________.
解析:170+
1
7
×(1+2+x+4+5+10+11)=175,
1
7
×(33+x)=5,即 33+x=35,解得 x=2.
答案:2
9.(2021·合肥调研)某保险公司决定每月给推销员确定一个具体的销售目标,对推销员实行
目标管理,销售目标确定的适当与否,直接影响公司的经济效益和推销员的工作积极性,为
此该公司随机抽取了 50 位推销员上个月的月销售额(单位:万元),绘制成如图所示的频率
分布直方图,其中,[14,16)小组对应的数据缺失:
(1)(ⅰ)根据图中数据,求出月销售额在[14,16)内的频率;
(ⅱ)根据频率分布直方图估计月销售额目标定为多少万元时,能够使 70%的推销员完成任
务,说明理由;
(2)该公司决定从月销售额在[22,24)和[24,26]两个小组的推销员中,选取 2 位介绍销
售经验,求选出的推销员来自同一个小组的概率.
解析:(1)(ⅰ)月销售额在[14,16)内的频率为 1-2×(0.03+0.12+0.18+0.07+0.02
+0.02)=0.12.
(ⅱ)若 70%的推销员能完成月销售额目标,则意味着 30%的推销员不能完成该目标,根据
频率分布直方图知,[12,14)和[14,16)两组的频率之和为 0.18,故估计月销售额目标应
定为 16+错误!=17(万元).
(2)根据频率分布直方图可知,[22,24)和[24,26]两组的频率之和为 0.08,由 50×0.08
=4 可知待选的推销员一共有 4 人,设这 4 人分别为 A1,A2,B1,B2,则不同的选择有{A1,
A2},{A1,B1},{A1,B2},{A2,B1},{A2,B2},{B1,B2},一共 6 种情况,每一种情况都是
等可能的,而 2 人来自同一组的情况有 2 种,故选出的推销员来自同一个小组的概率为 P=
2
6
=
1
3
.
[B 组 能力提升练]
1.某位教师 2020 年的家庭总收入为 80 000 元,各种用途占比统计如下面的折线图.2021 年
收入的各种用途占比统计如下面的条形图,已知 2021 年的就医费用比 2017 年增加了 4 750
元,则该教师 2021 年的家庭总收入为( )
A.100 000 元 B.95 000 元
C.90 000 元 D.85 000 元
解析:由已知得,2020 年的就医费用为 80 000×10%=8 000(元),故 2021 年的就医费用
为 8 000+4 750=12 750(元),所以该教师 2021 年的家庭总收入为
12 750
15%
=85 000(元).
答案:D
某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为 5 组,绘制如图
所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第
二小组的频数是 40,则成绩在 80~100 分的学生人数是( )
A.15
C.20
解析:×10=0.4,因为频数是 40,所以样本容量是
40
0.4
=100,又成绩在 80~100 分的频率
是(0.01+0.005)×10=0.15,所以成绩在 80~100 分的学生人数是 100×0.15=15.
答案:A
3.在一次 53.5 千米的自行车个人赛中,25 名参赛选手成绩(单位:分钟)的茎叶图如图所示,
现将参赛选手按成绩由好到差编为 1-25 号,再用系统抽样的方法从中选取 5 人,已知选手
甲的成绩为 85 分钟,若甲被选取,则被选取的其余 4 名选手的成绩的平均数为( )
A.95
C.97
解析:由系统抽样法及已知条件可知被选中的其他 4 人的成绩分别是 88,94,99,107,故
平均数为
88+94+99+107
4
=97.
答案:C
4.在某次赛车中,50 名参赛选手的成绩(单位:min)全部介于 13 到 18 之间(包括 13 和
18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18].其频
率分布直方图如图所示,若成绩在[13,15)内的选手可获奖,则这 50 名选手中获奖的人数
为( )
A.39
C.15
解析:由频率分布直方图知成绩在[15,18]内的频率为(0.38+0.32+0.08)×1=0.78,所
以成绩在[13,15)内的频率为 1-0.78=0.22,则成绩在[13,15)内的选手有 50×0.22=
11(人),即这 50 名选手中获奖的人数为 11.
答案:D
x1,x2,…,x10 的标准差为 8,则数据 2x1-1,2x2-1,…,2x10-1 的标准差为_________.
解析:依题意,x1,x2,x3,…,x10 的方差 s2=64,则数据 2x1-1,2x2-1,…,2x10-1
的方差为 22s2=22×64,所以其标准差为 22×64=2×8=16.
答案:16
6.在一个容量为 5 的样本中,数据均为整数,已测出其平均数为 10,但墨水污损了两个数据,
其中一个数据的十位数字 1 未被污损,即 9,10,11,1■,■,那么这组数据的方差 s2 可能
的最大值是_________.
解析:设这组数据的最后两个分别是 10+x,y,则 9+10+11+(10+x)+y=50,得 x
+y=10,故 y=10-x,故 s2=
1+0+1+x2+(-x)2
5
=
2
5
+
2
5
x2,显然 x 取 9 时,s2 有最大
值 32.8,故答案为 32.8.
答案:
7.(2021·合肥调研)第 24 届冬奥会将于 2022 年在中国北京和张家口举行.为宣传冬奥会,
让更多的人了解、喜爱冰雪项目,某大学举办了冬奥会知识竞赛,并从中随机抽取了 100 名
学生的成绩,绘制成如图所示的频率分布直方图:
(1)试根据频率分布直方图估计,这 100 人的平均成绩(同一组数据用该组区间的中点值代
替);
(2)若采用分层抽样的方法从成绩在[70,80),[80,90),[90,100]的学生中共抽取 6 人,
再将其随机地分配到 3 个社区开展冬奥会宣传活动(每个社区 2 人),求“成绩在同一区间的
学生分配到不同社区”的概率.
解析:(1)平均成绩x
-
××××××95=73.00.
(2)由题意知,从成绩在[70,80),[80,90),[90,100]的学生中分别选取了 3 人,2 人,
1 人.
6 人平均分成 3 组分配到 3 个社区,共有 C2
6C2
4=90 种方法.
成绩在同一区间的学生分配到不同社区的方法有 A3
3A2
3=36(种),
所以“成绩在同一区间的学生分配到不同社区”的概率 P=
36
90
=
2
5
.
[C 组 创新应用练]
某市为了鼓励居民节约用水,拟确定一个合理的月用水量阶梯收费标准,规定一位居民月用
水量不超过 a 吨的部分按平价收费,超出 a 吨的部分按议价收费.为了解居民的月均用水量(单
位:吨),现随机调查 1 000 位居民,并对收集到的数据进行分组,具体情况见下表:
月均用
水量/吨
[0,0.5)
[0.5
,1)
[1,
1.5
)
[1.5,
2)
[2,
2.5)
[2.5
,3)
[3,
3.5
)
[3.
5,
4)
[4,
4.5]
居民数 50 80 5x 220 250 80 60 x 20
(1)求 x 的值,并画出频率分布直方图;
(2)若该市希望使 80%的居民月均用水量不超过 a 吨,试估计 a 的值,并说明理由;
(3)根据频率分布直方图估计该市居民月用水量的平均值.
解析:(1)由已知得 6x=1 000-(50+80+220+250+80+60+20),解得 x
月均用水
量/吨
[0,0.5)
[0.5,
1)
[1,
1.5)
[1.5,
2)
[2,
2.5)
[2.5,
3)
[3,
3.5)
[3.5,
4)
[4,
4.5]
频率
画出频率分布直方图如图所示.
(2)由(1)知前 5 组的频率之和为 0.05+0.08+0.20+0.22+0.25=0.80,故 a=2.5.
(3)由样本估计总体,该市居民月用水量的平均值为×××××××××0.02=1.92.