天添资源网 http://www.ttzyw.com/
章末复习课
[整合·网络构建]
[警示·易错提醒]
1.(1)简单随机抽样中易忽视样本是从总体中逐个抽取的,是不放回抽样,且每个个体被抽到的概率相等.
(2)系统抽样中,易忽视抽取的样本数也就是分段的段数,当不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列.
(3)分层抽样中,易忽视每层抽取的个体的比例是相同的,即均为.
(4)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
(5)易忽视频率分布直方图中纵轴表示的应为.
(6)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义.
(7)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过的点是(,),可能所有的样本数据点都不在直线上.
(8)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).
专题一 抽样方法及其应用
随机抽样有简单随机抽样、系统抽样和分层抽样三种.其共同点是在抽样过程中每个个体被抽到的机会相等,当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,多采用系统抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.其中简单随机抽样是最简单、最基本的抽样方法.在进行系统抽样和分层抽样时都要用到简单随机抽样.
[例1] (1)为了解某地区中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样
C.按学段分层抽样 D.系统抽样
(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
A.11 B.12 C.13 D.14
解:(1)因为男女生视力情况差异不大,而各学段学生的视力情况有较大差异,所以应按学段分层抽样,故选C.
(2)因为840∶42=20∶1,故编号在[481,720]内的人数为240÷20=12.
答案:(1)C (2)B
归纳升华
1.系统抽样是将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分抽取一个个体.
2.分层抽样.
从各部分抽取的个体数与该部分个体数的比等于样本容量与总体容量的比.
[变式训练] (2014·天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.
解析:依题意,应从一年级本科生中抽取的学生人数为×300=60.
答案:60
专题二 利用样本的频率分布估计总体分布
本专题主要利用统计表、统计图分析、估计总体的分布规律.要熟练掌握绘制统计图表的方法,明确图表中有关数据的意义是正确分析问题的关键.从图形与图表中获取有关信息并加以整理,是近年来高考命题的热点问题.
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
[例2] (2014·重庆卷改编)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示.
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在[50,60)与[60,70)中的学生人数.
解:(1)据直方图知组距为10,由(2a+3a+7a+6a+2a)×10=1,解得a==0.005.
(2)成绩落在[50,60)中的学生人数为
2×0.005×10×20=2.
成绩落在[60,70)中的学生人数为
3×0.005×10×20=3.
归纳升华
1.已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.
2.已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解.
[变式训练] 学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为________.
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
(2)(2014·江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
解析:(1)支出在[50,60)元的频率为1-0.36-0.24-0.1=0.3,因此=0.3,故n=100.
(2)底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24.
答案:(1)100 (2)24
专题三 利用样本的数字特征估计总体的数字特征
总体的平均数与标准差往往通过样本的平均数、标准差来估计.一般地,样本容量越大,对总体的估计越精确.平均数描述集中趋势,方差、标准差描述波动大小,也可以说方差、标准差反映各个数据与其平均数的离散程度.一组数据的方差或标准差越大,说明这组数据波动越大.方差的单位是原数据单位的平方,标准差的单位与原单位相同.
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
[例3] (2014·课标全国Ⅰ卷)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标
值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
(1)作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
解:(1)由数据可作出如下频率分布直方图:
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.
归纳升华
利用频率分布直方图求数字特征的方法
1.众数是最高的矩形的底边的中点的横坐标.
2.中位数左右两侧直方图的面积相等.
3.平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
4.利用直方图求众数、中位数、平均数均为近似值,
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
往往与实际数据得出的不一致.但它们能粗略估计其众数、中位数和平均数.
[变式训练] 抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员
第1次
第2次
第3次
第4次
第5次
甲
87
91
90
89
93
乙
89
90
91
88
92
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
解析:设甲、乙两位射击运动员的平均成绩分别为甲,乙,方差分别为s,s.
由题意得,甲=90+=90,
s=[(x1-甲)2+(x2-甲)2+…+(x5-甲)2]=×[(-3)2+12+02+(-1)2+32]=4;
乙=90+=90,
s=[(y1-乙)2+(y2-乙)2+…+(y5-乙)2]=×[(-1)2+02+12+(-2)2+22]=2.
因为s>s,所以成绩较为稳定(方差较小)的那位运动员成绩的方差为2.
答案:2
专题四 回归分析及其应用
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.相关性问题是日常生活中普遍存在的问题.生活中有些变量之间存在着明显的函数关系,有些变量之间不满足函数关系,但是它们之间又存在着一种明显的依赖关系.
利用回归分析的方法对两个具有线性相关关系的变量研究的步骤为:
1.画出这两个变量的散点图.
2.求回归直线方程.
3.利用回归直线方程进行预报.
[例4] (2014·课标全国Ⅰ卷)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表所示.
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:
解:(1)由所给数据计算得
=×(1+2+3+4+5+6+7)=4,
=×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
=-=4.3-0.5×4=2.3,
所求回归方程为=0.5t+2.3.
(2)由(1)知,=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入(1)中的回归方程,得=0.5×9+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
归纳升华
对一组数据进行线性回归分析时,应先画出散点图,看其是否呈直线形,再依,的计算公式算出,.
[变式训练] 有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据,如下表所示.
平均气温/℃
-2
-3
-5
-6
销售额/万元
20
23
27
30
根据以上数据,用线性回归的方法,求得销售额y与平均气温x
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
之间的线性回归方程=x+的系数=-2.4.则预测平均气温为-8 ℃时该商品的销售额为( )
A.34.6万元 B.35.6万元
C.36.6万元 D.37.6万元
解:==-4,
==25,
所以25=(-2.4)×(-4)+a.
所以=15.4.
所以回归直线方程为=-2.4x+15.4.
当x=-8时,y=34.6,即预测平均气温为-8 ℃时,该商品的销售额为34.6万元.故选A.
答案:A
专题五 数形结合思想
数形结合思想在本章中的重要应用是通过频率分布的态势对总体进行估计及根据散点图确定两个变量是否具有相关关系,并做出判断.
统计图表(频率分布直方图、茎叶图)与数字特征(平均数、中位数、方差)是高考的重点和热点内容,几乎每年必考,通常以茎叶图和频率分布直方图为载体,考查平均数、中位数、方差等的计算,高考对变量间的相关性的考查呈逐年上升的趋势,主要考查借助散点图直观地分析两个变量间的相关关系,知道回归直线经过样本中心,会求回归方程,并能利用方程对有关变量做出估计.
[例5] 从甲、乙两个城市分别随机抽取16台自动售货机
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则( )
A.甲m乙 B.甲m乙 D.甲>乙,m甲