第一节统 计
本节主要包括2个知识点:
1.随机抽样; 2.用样本估计总体.
突破点(一) 随机抽样
基础联通 抓主干知识的“源”与“流”
1.简单随机抽样
(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数法.
2.系统抽样
在抽样时,将总体分成均衡的几个部分,然后按照事先确定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样).
3.分层抽样
在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
4.三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
均为不放回抽样,且抽样过程中每个个体被抽取的机会相等
从总体中逐个抽取
是后两种方法的基础
总体中的个数较少
系统抽样
将总体均分成几部分,按事先确定的规则在各部分中抽取
在起始部分抽样时采用简单随机抽样
元素个数很多且均衡的总体抽样
分层抽样
将总体分成几层,分层按比例进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
考点贯通 抓高考命题的“形”与“神”
简单随机抽样
1.抽签法的步骤
第一步,将总体中的N个个体编号;
第二步,将这N个号码写在形状、大小相同的号签上;
第三步,将号签放在同一不透明的箱中,并搅拌均匀;
第四步,从箱中每次抽取1个号签,连续抽取k次;
第五步,将总体中与抽取的号签的编号一致的k个个体取出.
2.随机数法的步骤
第一步,将个体编号;
第二步,在随机数表中任选一个数开始;
第三步,从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码.
[例1] (1)以下抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见
D.用抽签方法从10件产品中选取3件进行质量检验
(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.08 B.07
C.02 D.01
[解析] (1)选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样.
(2)由题意知前5个个体的编号为08,02,14,07,01.
[答案] (1)D (2)D
系统抽样
系统抽样的步骤
(1)先将总体的N个个体编号;
(2)确定分段间隔k(k∈N*),对编号进行分段.当(n是样本容量)是整数时,取k=;
(3)在第1段用简单随机抽样确定第1个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
[例2] (1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12
C.13 D.14
(2)中央电视台为了解观众对《中国好歌曲》的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.
[解析] (1)由系统抽样定义可知,所分组距为=20,每组抽取一人,因为包含整数个组,所以抽取个体在区间[481,720]的数目为(720-480)÷20=12.
(2)把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含=10个个体.所以需剔除2个个体,抽样间隔为10.
[答案] (1)B (2)2 10
[易错提醒]
用系统抽样法抽取样本,当不为整数时,取k=,即先从总体中用简单随机抽样的方法剔除(N-nk)个个体,且剔除多余的个体不影响抽样的公平性.
分层抽样
进行分层抽样的相关计算时,常利用以下关系式巧解:
(1)=;
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
[例3] (1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
类别
人数
老年教师
900
中年教师
1 800
青年教师
1 600
合计
4 300
A.90 B.100
C.180 D.300
(2)(2016·东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=( )
A.54 B.90
C.45 D.126
(3)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人).
篮球组
书画组
乐器组
高一
45
30
a
高二
15
10
20
学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.
[解析] (1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得=,故x=180.
(2)依题意得×n=18,解得n=90,即样本容量为90.
(3)由题意知=,解得a=30.
[答案] (1)C (2)B (3)30
[方法技巧]
分层抽样的解题策略
(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
(4)抽样比==.
能力练通 抓应用体验的“得”与“失”
1.某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法
①1,2,3,…,100;
②001,002,…,100;
③00,01,02,…,99;
④01,02,03,…,100.
其中正确的序号是( )
A.②③④ B.③④
C.②③ D.①②
解析:选C 根据随机数法编号可知,①④编号位数不统一.
2.为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A,B,C三所中学抽取60名教师进行调查,已知A,B,C三所学校中分别有180,270,90名教师,则从C学校中应抽取的人数为( )
A.10 B.12
C.18 D.24
解析:选A 根据分层抽样的特征,从C学校中应抽取的人数为×60=10.
3.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号学生在样本中,那么样本中还有一个学生的学号是( )
A.10 B.11
C.12 D.16
解析:选D 从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.
4.某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人.
解析:设A、B、C三所学校高三文科学生人数分别为x,y,z,由题知x,y,z成等差数列,所以x+z=2y,又x+y+z=1 500,所以y=500,用分层抽样方法抽取B校学生人数为×500=40.
答案:40
5.为了了解本班学生对网络游戏的态度,高三(6)班计划在全班60
人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号为:01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.
解析:由最小的两个编号为03,09可知,抽取时的分段间隔是6.即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+9×6=57.
答案:57
突破点(二) 用样本估计总体
基础联通 抓主干知识的“源”与“流”
1.频率分布直方图和茎叶图
(1)作频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组;④列频率分布表;⑤画频率分布直方图.
(2)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(3)茎叶图的优点
茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.
2.样本的数字特征
(1)众数、中位数、平均数
数字特征
定义与求法
优点与缺点
众数
一组数据中重复出现次数最多的数
众数体现了样本数据的最大集中点,不受极端值的影响.但显然它对其他数据信息的忽视使得无法客观地反映总体特征
中位数
把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有n个数据x1,x2,…,xn,那么这n个数的平均数=
平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
(2)标准差、方差
①标准差:样本数据到平均数的一种平均距离,一般用s表示,s= .
②方差:标准差的平方
s2=[(x1-)2+(x2-)2+…+(xn-)2],其中xi(i=1,2,3,…,n)是样本数据,n是样本容量,是样本平均数.
③方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度.
(3)平均数、方差公式的推广
若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
考点贯通 抓高考命题的“形”与“神”
频率分布直方图
[例1] (1)(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60 C.120 D.140
(2)某地政府调查了工薪阶层1 000人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则(30,35](百元)月工资收入段应抽出________人.
[解析] (1)由频率分布直方图知200名学生每周的自习时间不少于22.5小时的频率为1-(0.02+0.10)×2.5=0.7,则这200名学生中每周的自习时间不少于22.5小时的人数为200×0.7=140,故选D.
(2)月工资收入落在(30,35](百元)内的频率为1-(0.02+0.04+0.05+0.05+0.01)×5=1-0.85=0.15,所以(30,35](百元)月工资收入段应抽出100×0.15=15(人).
[答案] (1)D (2)15
[方法技巧]
1.绘制频率分布直方图时需注意的两点
(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;
(2)频率分布直方图的纵坐标是,而不是频率.
2.与频率分布直方图计算有关的两个关系式
(1)×组距=频率;
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
茎叶图
1.茎叶图的绘制需注意:
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;
(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.
2.茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.
[例2] 某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下.
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430
(1)作出数据的茎叶图;
(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
[解] (1)画出茎叶图如图所示:
(2)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.
[方法技巧]
茎叶图问题的求解策略
(1)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表问题时,要充分对这个图表提供的样本数据进行相关的计算或者是对某些问题作出判断.
(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图数据求出样本数据的数字特征,进一步估计总体情况.
样本的数字特征
1.用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,需先计算数据的平均数,分析平均水平,再计算方差(标准差),分析稳定情况.
2.若给出图形,一方面可以由图形得到相应的样本数据,计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性比较方差(标准差)的大小.
考法(一) 与频率分布直方图交汇命题
[例3] (2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图.
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
[解] (1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.
依题意,w至少定为3.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:
组号
1
2
3
4
5
6
7
8
分组
[2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,17]
(17,22]
(22,27]
频率
0.1
0.15
0.2
0.25
0.15
0.05
0.05
0.05
根据题意,该市居民该月的人均水费估计为
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
[方法技巧]
频率分布直方图与众数、中位数、平均数的关系
(1)最高的小长方形底边中点的横坐标为众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
考法(二) 与茎叶图交汇命题
[例4] (1)如图所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.4,则x,y的值分别为( )
甲组
乙组
9
0
9
9 y 6
1
6 6 x
6
2
9
A.7,8 B.5,7 C.8,5 D.7,7
(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
8
7
7
9
4
0
1
0
x
9
1
则7个剩余分数的方差为________.
[解析] (1)甲组数据的中位数为17, 故y=7,
乙组数据的平均数为=17.4,
解得x=7.
(2)由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4.s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
[答案] (1)D (2)
[易错提醒]
在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
考法(三) 与优化决策问题交汇
[例5] 甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲
乙
丙
丁
平均环数
8.3
8.8
8.8
8.7
方差s2
3.5
3.6
2.2
5.4
从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( )
A.甲 B.乙 C.丙 D.丁
[解析] 由题目表格中数据可知,丙平均环数最高,且方差最小,说明成绩好,且技术稳定,选C.
[答案] C
[方法技巧]
利用样本的数字特征解决优化决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
能力练通 抓应用体验的“得”与“失”
1.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的,且样本容量为80,则中间一组的频数为( )
A.0.25 B.0.5 C.20 D.16
解析:选D 设中间一组的频数为x,依题意有=,解得x=16.
2.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )
A.3 B.4 C.5 D.6
解析:选B 35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在20÷5=4个小组中,每组取1人,共取4人.
3.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于( )
A.0.12 B.0.012 C.0.18 D.0.018
解析:选D 依题意,0.054×10+10×x+0.01×10+0.006×10×3=1,解得 x=0.018.
4.如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )
7
9
8
4 4 6 4 7
9
3
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
解析:选C 依题意,所剩数据的平均数是80+×(4×3+6+7)=85,所剩数据的方差是×[3×(84-85)2+(86-85)2+(87-85)2]=1.6.
5.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
甲
10
8
9
9
9
乙
10
10
7
9
9
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.
解析:甲=乙=9,s=×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=,
s=×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=>s,故甲更稳定.
答案:甲
6.(2016·四川高考)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
解:(1)由频率分布直方图可知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.
(2)由(1)知100位居民每人的月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.
所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
7.某车间20名工人年龄数据如下表:
年龄(岁)
工人数(人)
19
1
28
3
29
3
30
5
31
4
32
3
40
1
合计
20
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
解:(1)由题可知,这20名工人年龄的众数是30,极差是40-19=21.
(2)这20名工人年龄的茎叶图如图所示:
(3)这20名工人年龄的平均数为=(19+3×28+3×29+5×30+4×31+3×32+40)=30,
∴这20名工人年龄的方差为s2= (xi-)2===12.6.
[全国卷5年真题集中演练——明规律]
1.(2016·全国丙卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )
A.各月的平均最低气温都在0 ℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20 ℃的月份有5个
解析:选D 由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确;故D错误.
2.(2013·新课标全国卷Ⅰ)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样
C.按学段分层抽样 D.系统抽样
解析:选C 由于该地区的中小学生人数比较多,不能采用简单随机抽样,排除选项A;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除B和D.故选C.
3.(2014·新课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
(1)作出这些数据的频率分布直方图
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
解:(1)如图所示:
(2)质量指标值的样本平均数为
=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为
0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.
4.(2014·新课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.
50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.
(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.
(3)
由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.
5.(2013·新课标全国卷Ⅰ)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5
2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?
A药
B药
0.
1.
2.
3.
解:(1)设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得
=×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
=×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得>,因此可看出A药的疗效更好.
(2)由观测结果可绘制如下茎叶图:
A药
B药
6
0.
5 5 6 8 9
1.
1 2 2 3 4 6 7 8 9
2.
1 4 5 6 7
3.
2
从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.
[课时达标检测] 重点保分课时——一练小题夯双基,二练题点过高考
[练基础小题——强化运算能力]
1.某学校为了了解某年高考数学的考试成绩,在高考后对该校1 200名考生进行抽样调查,其中有400名文科考生,600名理科考生,200名艺术和体育类考生,从中抽取120名考生作为样本,记这项调查为①;从10名家长中随机抽取3名参加座谈会,记这项调查为②,则完成①,②这两项调查宜采用的抽样方法依次是( )
A.分层抽样法,系统抽样法
B.分层抽样法,简单随机抽样法
C.系统抽样法,分层抽样法
D.简单随机抽样法,分层抽样法
解析:选B 在①中,文科考生、理科考生、艺术和体育类考生会存在差异,采用分层抽样法较好;在②中,抽取的样本个数较少,宜采用简单随机抽样法.
2.某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=( )
A.660 B.720 C.780 D.800
解析:选B 由已知条件,抽样比为=,
从而=,解得n=720.
3.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93 B.123 C.137 D.167
解析:选C 初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.
4.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为( )
A.①③ B.①④ C.②③ D.②④
解析:选B ∵甲==29,
乙==30,
∴甲s乙.故可判断结论①④正确.
5.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.
(1)直方图中x的值为________;
(2)在这些用户中,用电量落在区间[100,250)内的户数为________.
解析:(1)由频率分布直方图总面积为1,得(0.001 2+0.002 4×2+0.003 6+x+0.006 0)×50=1,解得x=0.004 4;
(2)用电量在[100,250)内的频率为(0.003 6+0.004 4+0.006 0)×50=0.7,故户数为100×0.7=70.
答案:(1)0.004 4 (2)70
[练常考题点——检验高考能力]
一、选择题
1.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为甲、乙,中位数分别为m甲、m乙,则( )
A.甲m乙 B.甲m乙 D.甲>乙,m甲c B.b>c>a
C.c>a>b D.c>b>a
解析:选D 依题意,a=(15+17+14+10+15+17+17+16+14+12)×=14.7.这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此b=15,c=17,c>b>a.
5.(2016·九江二模)已知一组数据x1,x2,…,xn的方差为2,若数据ax1+b,ax2+b,…,axn+b(a>0)的方差为8,则a的值为( )
A.1 B. C.2 D.4
解析:选C 根据方差的性质可知,a2×2=8,故a=2.
6.(2017·邢台模拟)样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其方差为( )
A. B. C. D.2
解析:选D 依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=(12+02+12+22+2
2)=2,即所求的样本方差为2.
二、填空题
7.某中学高三从甲、乙两个班中各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的众数是85,乙班学生成绩的中位数是83,则x+y的值为________.
解析:由甲班学生成绩的众数是85,知x=5,由乙班学生成绩的中位数是83,得y=3.所以x+y=8.
答案:8
8.某公司300名员工2016年年薪情况的频率分布直方图如图所示,由图可知,员工中年薪在1.4~1.6万元的共有________人.
解析:由频率分布直方图知年薪低于1.4万元或者高于1.6万元的频率为(0.2+0.8+0.8+1.0+1.0)×0.2=0.76,因此,年薪在1.4~1.6万元间的频率为1-0.76=0.24,所以300名员工中年薪在1.4~1.6万元间的员工人数为300×0.24=72.
答案:72
9.某学校共有教师300人,其中中级教师有192人,高级教师与初级教师的人数比为5∶4.为了解教师专业发展需求,现采用分层抽样的方法进行调查,在抽取的样本中有中级教师64人,则该样本中的高级教师人数为________.
解析:由题意可知,高级教师有(300-192)×=60人,抽样比k===.故该样本中高级教师的人数为60×=20.
答案:20
10.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表:
学生
1号
2号
3号
4号
5号
甲班
6
7
7
8
7
乙班
6
7
6
7
9
若以上两组数据的方差中较小的一个为s2,则s2=________.
解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s2=(1+0+0+1+0)=.
答案:
三、解答题
11.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:
248 256 232 243 188 268 278 266 289 312
274 296 288 302 295 228 287 217 329 283
(1)完成下面的频率分布表,并作出频率分布直方图;
分组
频数
频率
频率/组距
[180,200)
[200,220)
[220,240)
[240,260)
[260,280)
[280,300)
[300,320)
[320,340]
合计
0.05
(2)估计8 万台电风扇中有多少台无故障连续使用时限不低于280小时;
(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.
解:(1)频率分布表及频率分布直方图如下所示:
分组
频数
频率
频率/组距
[180,200)
1
0.05
0.002 5
[200,220)
1
0.05
0.002 5
[220,240)
2
0.10
0.005 0
[240,260)
3
0.15
0.007 5
[260,280)
4
0.20
0.010 0
[280,300)
6
0.30
0.015 0
[300,320)
2
0.10
0.005 0
[320,340]
1
0.05
0.002 5
合计
20
1.00
0.05
(2)由题意可得8×(0.30+0.10+0.05)=3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.
(3)由频率分布直方图可知
=190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(小时),所以样本的平均无故障连续使用时限为269小时.
12.随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A和B两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:
(1)试估计使用A款订餐软件的50个商家的“平均送达时间”的众数及平均数;
(2)根据以上抽样调查数据,将频率视为概率,回答下列问题:
①能否认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%?
②如果你要从A和B两款订餐软件中选择一款订餐,你会选择哪款?说明理由.
解:(1)依题意可得,使用A款订餐软件的50个商家的“平均送达时间”的众数为55.
使用A款订餐软件的50个商家的“平均送达时间”的平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.
(2)①使用B款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.04+0.20+0.56=0.80=80%>75%.
故可以认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%.
②使用B款订餐软件的50个商家的“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35