第二章 统计
章末复习课
1.会根据不同的特点选择适当的抽样方法获得样本数据;
2.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估
计总体;
3.能利用散点图对两个变量是否相关进行初步判断,能用回归方程进行
预测.
知识整合 题型探究 达标检测
学习目标
[知识网络]
知识整合 新知探究 点点落实
答案
[图表梳理]
名称 数 形 结合
频率
分布
直方
图
数据分组及频数:
[40,50),2;
[50,60),3;
[60,70),10;
[70,80),15;
[80,90),12;
[90,100],8
①可求众数:
;
②可求中位数:中位数左边和
右边的直方图 相等;
③可求平均数:每个小长方形
的面积乘以
之和;
④可求落在各个区域内的频率
最高小长方形底
边的中点所对应的数据
面积
小长方形底边中点
的横坐标
答案
总体
密度
曲线
同上
可精确地反映一个总体在各个区域内取
值的百分比,如分数落在(a,b)内的百
分比是左图中阴影部分的
茎叶
图
甲的数据:
95,81,75,89,71,
65,76,88,94;
乙的数据:
83,86,93,99,88,
103,98,114,98
①茎是十位和百位数字,叶是个位数字;
②可以帮助分析样本数据的大致频率分
布;
③可用来求数据的一些数字特征,如中
位数、众数等
面积
散点图 n个数据点(xi,yi)
可以判断两个变量
之间有无相关关系
答案
[知识梳理]
1.抽样方法
(1)当总体容量较小,样本容量也较小时,可采用 .
(2)当总体容量较大,样本容量较小时,可用 .
(3)当总体容量较大,样本容量也较大时,可用 .
(4)当总体由差异明显的几部分组成时,可用 .
2.用样本估计总体
用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率
与频率 .当样本只有两组数据且样本容量比较小时,用
刻画数据比较方便.
抽签法
随机数法
系统抽样法
分层抽样法
分布表 分布直方图
茎叶图
答案
3.样本的数字特征
样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括
、 和 ;另一类是反映样本波动大小的,包括 及
.
4.变量间的相关关系
(1) 两个变量之间的相关关系的研究,通常先作变量的 ,根据散点
图判断这两个变量最接近于哪种确定性关系(函数关系).
众数 中位数 平均数 方差
标准差
散点图
返回
类型一 抽样方法的应用
解析答案反思与感悟
题型探究 重点难点 个个击破
例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干
部70人,干事20人,上级机关为了了解机关人员对政府机构改革意见,
要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?
解 用分层抽样抽取.
即从副处级以上干部中抽取2人,一般干部中抽取14人,干事中抽取4人.
∵副处级以上干部与干事人数都较少,他们分别按1~10编号和1~20编
号,然后采用抽签法分别抽取2人和4人,对一般干部采用00,01,…,
69编号,然后用随机数法抽取14人.
反思与感悟
三种抽样方法并非截然分开,它们都能保证个体被抽到的机会相等.
反思与感悟
解析答案
解析 分层抽样的原理是按照各部分所占的比例抽取样本,
跟踪训练1 某校选修乒乓球课程的学生中,高一年级有30名,高二年级
有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高
一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为(
)
A.6 B.8 C.10 D.12
设从高二年级抽取的学生数为n,
B
类型二 用样本的频率分布估计总体分布
解析答案
例2 有1个容量为100的样本,数据(均为整数)的分组及各组的频数如下:
[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;
[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;
[30.5,33.5),8.
(1)列出样本的频率分布表;
解 样本的频率分布表如下:
分组 频数 频率
[12.5,15.5) 6 0.06
[15.5,18.5) 16 0.16
[18.5,21.5) 18 0.18
[21.5,24.5) 22 0.22
[24.5,27.5) 20 0.20
[27.5,30.5) 10 0.10
[30.5,33.5] 8 0.08
合 计 100 1.00
解析答案
(2)画出频率分布直方图;
解 频率分布直方图如下图.
解析答案
(3)估计数据小于30的数据约占多大百分比.
解 小于30的数据占0.06+0.16+0.18+0.22+0.20+0.10=0.92=92%.
反思与感悟
借助图表,可以把抽样获得的庞杂数据变得直观,凸显其中的规律,
便于信息的提取和交流.
反思与感悟
跟踪训练2 为了了解某校高三学生的视力情况,随机地抽查了该校100名
高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据
丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大
频率为0.32,则a的值为( )
A.64 B.54 C.48 D.27
解析 [4.7,4.8)之间频率为0.32,[4.6,4.7)之间
频率为1-0.62-0.05-0.11=1-0.78=0.22.
∴a=(0.22+0.32)×100=54.
解析答案
B
类型三 用样本的数字特征估计总体的数字特征
解析答案
例3 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中
抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
解析答案反思与感悟
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
解 两台机床所加工零件的直径的平均数相同,
所以乙机床加工零件的质量更稳定.
样本的数字特征就像盲人摸到的象的某一局部特征,只有把它们结合起
来才能看到全貌.
反思与感悟
跟踪训练3 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的
观测值如下:
解析答案
甲 60 80 70 90 70
乙 80 60 70 80 75
问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?
类型四 回归方程的应用
解析答案
例4 下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量
x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图;
解 散点图如图所示:
解析答案
解析答案
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的
回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
∴预测生产100吨甲产品的生产能耗比技改前降低19.65吨标准煤.
反思与感悟
散点图经最小二乘法量化为回归方程后,更便于操作(估计、预测),但得
到的值仍是估计值.
反思与感悟
跟踪训练4 2016年元旦前夕,某市统计局统计了该市2015年10户家庭的
年收入和年饮食支出的统计资料如下表:
解析答案
(1)如果已知y与x成线性相关关系,求回归方程;
年收入x(万元) 2 4 4 6 6 6 7 7 8 10
年饮食支出y(万元) 0.9 1.4 1.6 2.0 2.1 1.9 1.8 2.1 2.2 2.3
解析答案 返回
(2)若某家庭年收入为9万元,预测其年饮食支出.
1.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3个,
4号球1个,则数0.4是指1号球占总体分布的( )
A.频数 B.概率 C.频率 D.累积频率
C
达标检测 1 2 3 4 5
答案
2.为了了解全校1 320名高一学生的身高情况,从中抽取220名学生进行测
量,下列说法正确的是( )
A.样本容量是220 B.个体是每一个学生
C.样本是220名学生 D.总体是1 320
1 2 3 4 5
解析答案
解析 个体是每一个学生的身高;
样本是220名学生的身高;
总体是全校1 320名高一学生的身高.
A
3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
1 2 3 4 5
解析答案
父亲身高x(cm) 174 176 176 176 178
儿子身高y(cm) 175 175 176 177 177
则y对x的回归直线方程为( )C
4.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.
命中个数的茎叶图如图,则下面结论中错误的一个是( )
A.甲的极差是29 B.乙的众数是21
C.甲罚球命中率比乙高 D.甲的中位数是24
1 2 3 4 5
解析 甲的极差是37-8=29;
乙的众数显然是21;
甲的平均数显然高于乙,即C成立;
甲的中位数应该是23.
D
解析答案
1 2 3 4 5
解析答案
解析 由频率分布直方图,得低于60分的频率为(0.01+0.005)×20=0.3.
5.某班的全体学生参加英语测试,成绩的频
率分布直方图如图,数据的分组依次为:
[20,40),[40,60),[60,80),[80,100].若低于
60分的人数是15,则该班的学生人数是(
)
A.45 B.50
C.55 D.60
B
规律与方法
1.应用抽样方法抽取样本时,应注意以下几点:
(1)用随机数法抽样时,对个体所编的号码位数要相等.当问题所给位数不
相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.
2.用样本的频率分布估计总体分布
利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也
利用频率分布折线图和茎叶图对总体情况作出估计.直方图能够很容易地
表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表
中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计
出总体的分布.但是,当总体的个体数较多时,所需抽样的样本容量也不
能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光
滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细
的信息.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以
保留原始信息,而且可以随时记录,这给数据的记录和表示都带来方便.
返回
3.用样本的数字特征估计总体的数字特征
为了从整体上更好地把握总体的规律, 我们还可以通过样本数据的众数、
中位数、平均数和标准差等数字特征对总体的数字特征作出估计.平均数
就是所有样本数据的平均值,用 表示;标准差是反映样本数据分散程度
大小的最常用统计量,有时也用标准差的平方s2—方差来代替标准差,实
质一样.
4.回归方程的应用
分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量
之间是否存在相关关系,还可利用最小二乘法求出回归方程,并利用回
归方程进行估计和预测.