2.3.2 两个变量的线性相关(二)
第二章 §2.3 变量间的相关关系
1.理解两个变量线性相关的概念;
2.了解用最小二乘法建立线性回归方程的思想,会用给出的公式建立回
归方程;
3.理解回归直线与观测数据的关系.
问题导学 题型探究 达标检测
学习目标
知识点一 线性相关
问题导学 新知探究 点点落实
思考 回顾上一节你看到的散点图,大致呈哪些形状?
答案 饼状,曲线状,直线状.
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量
之间具有线性相关关系.
两个变量线性相关是相关关系的一种.
答案
思考 数学上的“回归”是什么意思?
知识点二 回归直线的方程
答案 “回归”一词最早由英国统计学家(Francils Galton)提出的,本意是
子女的身高会向一般人的均值靠拢.现在这个概念引伸到随机变量有向回
归线集中的趋势.即观察值不是全落在回归线上,而是散布在回归线周围.
但离回归线越近,观察值越多,偏离较远的观察值极少,这种不完全呈函
数关系,但又有一定数量关系的现象称回归.
答案
(1)回归直线:如果散点图中点的分布从整体上看大致在 附近,
就称这两个变量之间具有 关系,这条直线叫做回归直线.
(2)回归方程: 对应的方程叫做回归直线的方程,简称回归方程.
一条直线
线性相关
回归直线
知识点三 最小二乘法
返回
思考 具有线性相关关系的散点大致分布在一条直线附近.如何确定这条
直线比较合理?
答案 应该使散点整体上最接近这条直线.最小二乘法是一种求回归直线
的方法,用这种方法求得的回归直线能使样本数据的点到回归直线的距离
的平方和最小.
答案
类型一 线性相关的概念
题型探究 重点难点 个个击破
解析答案反思与感悟
例1 以下是某地搜集到的新房屋的销售价格和房屋面积的数据:
房屋面积(m2) 61 70 115 110 80 135 105
销售价格(万元) 12.2 15.3 24.8 21.6 18.4 29.2 22
画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关
还是负相关.
解 散点图如下:
由上图可看出,销售价格与房屋面积这两个变量是正相关.
反思与感悟
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个
变量之间具有线性相关关系,呈递增趋势,是正相关;反之为负相关.
反思与感悟
跟踪训练1 一个车间为了规定工时定额,需要确定加工零件所花费的时
间,为此进行了10次试验,收集数据如下:
解析答案
零件数x(个) 10 20 30 40 50 60 70 80 90 100
加工时间y(min) 62 68 75 81 89 95 102 108 115 122
(1)画出散点图;
解 散点图如下:
(2)关于加工零件的个数与加工时间,你能得出什么结论?
解析答案
解 加工零件的个数与所花费的时间具有正的线性相关关系.
类型二 回归方程的求法
例2 下表为某地近几年机动车辆数与交通事故数的统计资料.
解析答案
机动车辆数x/千台 95 110 112 120 129 135 150 180
交通事故数y/千件 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13
(1)请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果
不具有线性相关关系,说明理由;
解 在平面直角坐标系中画出数据的散点图,
如图.
直观判断散点在一条直线附近,故具有线性
相关关系.
(2)如果具有线性相关关系,求出回归方程.
解析答案
跟踪训练2 以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
解析答案
房屋面积x(m2) 115 110 80 135 105
销售价格y(万元) 24.8 21.6 18.4 29.2 22
(1)画出数据对应的散点图;
解 数据对应的散点图如图所示:
(2)求回归方程,并在散点图中加上回归直线.
解析答案
解析答案
回归直线如(1)中图所示.
类型三 回归方程的应用
例3 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,
经过统计,得到一个卖出的热饮杯数与当天气温的对比表:
解析答案
摄氏温度/℃ -5 0 4 7 12 15 19 23 27 31 36
热饮杯数 156 150 132 128 130 116 104 89 93 76 54
(1)画出散点图;
解 散点图如图所示:
(2)从散点图中发现气温与热饮销售杯数之间有什么关系;
解析答案
解 从上图看到,各点散布在从左上角到右下角的区域里,
因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮
杯数越少.
(3)求回归方程;
解 从散点图可以看出,这些点大致分布在一条直线的附近,
因此,可用公式求出回归方程的系数.
(4)如果某天的气温是2℃,预测这天卖出的热饮杯数;
解析答案
(5) 气温为2℃时,小卖部一定能够卖出143杯左右热饮吗?为什么?
解 小卖部不一定能够卖出143杯左右热饮,原因如下:①回归方程中的
截距和斜率都是通过样本估计出来的,存在误差,这种误差可以导致预
测结果的偏差.
②即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的
预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,
甚至不能百分之百地保证它落在回归直线的附近.
因此,某天的气温为2℃时,这天大约可以卖出143杯热饮.
解析答案
跟踪训练3 有人统计了同一个省的6个城市某一年的人均国民生产总值(即
人均GDP)和这一年各城市患白血病的儿童数,如下表:
人均GDP/万元 10 8 6 4 3 1
患白血病的儿童数/人 351 312 207 175 132 180
(1)画出散点图,并判定这两个变量是否具有线性相关关系;
解 散点图如图:
根据散点图可以看出,在6个点中,虽然第一个点
离这条直线较远,但其余5个点大致分布在这条直
线的附近,所以这两个变量具有线性相关关系.
解析答案 返回
(2)通过计算可知这两个变量的回归方程为 =23.25x+102.15,假如一个
城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定
超过380人,请问这个断言是否正确?
但381.15是对该城市人均GDP为12万元的情况下所作的一个估计,
该城市患白血病的儿童可能超过380人,也可能低于380人.
1.下列有关线性回归的说法,不正确的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的
关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量
的一组数据的图形叫做散点图
C.回归方程最能代表观测值x、y之间的线性关系
D.任何一组观测值都能得到具有代表意义的回归方程
D
达标检测 1 2 3 4
答案
5
1 2 3 4
解析 回归直线必过样本点的中心.
C
解析答案
5
3.某产品的广告费用x与销售额y的统计数据如下表:
1 2 3 4
解析答案
广告费用x(万元) 4 2 3 5
销售额y(万元) 49 26 39 54
5
1 2 3 4
答案 B
5
1 2 3 4
解析答案
5
1 2 3 4
解析 ①回归方程中x的系数为正,不是负相关;
④回归方程中x的系数为负,不是正相关,
故①④一定不正确.
答案 D
5
1 2 3 4
解析答案
5
1 2 3 4
答案 D
5
规律与方法
1.求回归直线方程时应注意的问题
(1)知道x与y成线性相关关系,无需进行相关性检验,否则应首先进行相关
性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相
关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测
的量也是不可信的.
返回