教学目标:
1. 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直
观认识变量间的相关关系;
2. 在两个变量具有线性相关关系时,会在散点图中作出线性直线,会用线性
回归方程进行预测;
3. 知道最小二乘法的含义,知道最小二乘法的思想,能根据给出的线性回归
方程系数公式建立线性回归方程,了解(线性)相关系数的定义.
教学重点:
散点图的画法,回归直线方程的求解方法.
教学难点:
回归直线方程的求解方法.
教学方法:
引导发现、合作探究.
教学过程:
一、创设情景,揭示课题
客观事物是相互联系的.过去研究的大多数是因果关系,但实际上更多存在
的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联
系的,但不能认为数学是“因”,物理是“果”,或者反过来说 事实上数学和物理
成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函
数关系存在着一种确定性关系,但还存在着另一种非确定性关系——相关关系.
二、学生活动
提出问题:两个变量之间的常见关系有几种?
(1)确定性的函数关系,变量之间的关系可以用函数表示;
(2)相关关系,变量之间有一定的联系,但不能完全用函数来表示.说明:不要认为两个变量间除了函数关系,就是相关关系,事实是,两个变量
间可能毫无关系.比如地球运行的速度与某个人的行走速度 就可认为没有关系.
某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某 6 天
卖出热茶的杯数与当天气温的对照表:
气温/ C 26 18 13 10 4
杯数 20 24 34 38 50 64
如果某天的气温是 ,你能根据这些数据预测这天小卖部卖出热茶的杯数
吗?
从下图可以看出,这些点散布在一条直线的附近,故可用一个线性函数近似地表示
热茶销量与气温之间的关系.
选择怎样的直线近似地表示热茶销量与气温之间的关系?
我们有多种思考方案:
(1)选择能反映直线变化的两个点,例如取 这两点的直线;
(2)取一条直线,使得位于该直线一侧和另一侧的点的个数
基本相同;
(3)多取几组点,确定几条直线方程,再分别算出各条直线
斜率、截距的平均值,作为所求直线的斜率、截距;
……
怎样的直线最好呢?
三、建构数学
1.最小平方法:
用方程为 的直线拟合散点图中的点,应使得该直线
与散点图中的点最接近.那么,怎样衡量直线 与图中六
个点的接近程度呢?
0 1−
5− 0 C
(4,50),(18,24)
ˆy bx a= +
ˆy bx a= +我们将表中给出的自变量 的六个值带入直线方程,得到相应的六个 的值:
.这六个值与表中相应的实际值应该越
接近越好.所以,我们用类似于估计平均数时的思想,考虑离差的平方和
说明: 是直线 与各散点在垂直方向(纵轴方向)上的距离的平
方和,可以用来衡量直线 与图中六个点的接近程度,所以,设法取 的
值,使 达到最小值.这种方法叫做最小平方法(又称最小二乘法)(method
of
least square).
先把 看作常数,那么 是关于 的二次函数.易知,当 时,
取得最小值.同理, 把 看作常数,那么 是关于 的二次函数.当
时, 取得最小值.因此,当 时, 取的最小值,由此解得
.所求直线方程为 .当
时, ,故当气温为 时,热茶销量约为 杯.
2.线性相关关系:
像这样能用直线方程 近似表示的相关关系叫做线性相关关系(liner
correlation).
3.线性回归方程:
一般地,设有 个观察数据如下:
…
…
x ˆy
26 ,18 ,13 ,10 ,4 ,b a b a b a b a b a b a+ + + + + − +
2 2 2 2
2 2
( , ) (26 20) (18 24) (13 34) (10 38)
(4 50) ( 64)
Q a b b a b a b a b a
b a b a
= + − + + − + + − + + − +
+ − + − + −
21286b= 26 140 3820 460 10172a ab b a+ + − − +
( , )Q a b ˆy bx a= +
ˆy bx a= + ,a b
( , )Q a b
a Q b 140 3820
2 1286
ab
−= − × Q
b Q a 140 460
12
ba
−= −
Q
140 3820
2 1286
140 460
12
ab
ba
− = − × − = −
Q
1.6477, 57.5568b a≈ − ≈ ˆ 1.6477 57.5568y x= − + 5x = −
ˆ 66y ≈ 5− 0 C 66
ˆy bx a= +
n
x 1x 2x 3x nx
y 1y 2y 3y ny当 使 取得最小值时,就
称 为拟合这 对数据的线性回归方程(linear regression equation),
该方程所表示的直线称为回归直线.
上述式子展开后,是一个关于 的二次多项式,应用配方法,可求出使 为
最小值时的 的值.即
结论: ,(*) ,
说明:公式(*)的推导比较复杂,这里不作要求.
四、数学运用
例题 下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动
车辆数与交通事故数之间是否有线性相关关系,如果具有线性相关关系,求出线
性回归方程;如果不具有线性相关关系,说明理由.
机动车辆数 /千台 95 110 112 120 129 135 150 180
交通事故数 /千件 6.2 7.5 7.7 8.5 8.7 9.8 10.2 13
1.下面是我国居民生活污水排放量的一组数据(单位:10 t)试分别估计 1996
年和 2004 年我国居民生活污水排放量.
年份 1995 1996 1997 1998 1999 2000 2001 2002
排放量 151 189.1 194.8 203.8 220.9 227.7 232.3
,a b 2 2 2
1 1 2 2( ) ( ) ... ( )n nQ y bx a y bx a y bx a= − − + − − + + − −
ˆy bx a= + n
,a b Q
,a b
1 1 1
2 2
1 1
( )( )
( )
n n n
i i i i
i i i
n n
i i
i i
n x y x y
b
n x x
a y bx
= = =
= =
−
= −
= −
∑ ∑ ∑
∑ ∑
∑
=
=
n
i
ixnx
1
1 ∑
=
=
n
i
iyny
1
1
x
y
32.一个工厂在某年里每月产品的总成本 y(单位:万元)与月产量(单位:万件)
之间有如下一组数据:
x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07
y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50
(1)画出散点图;
(2)求线性回归方程.
五、归纳整理,整体认识
1.对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,
再依系数 的计算公式,算出 .由于计算量较大,所以在计算时应借助技术
手段,认真细致,谨防计算中产生错误.
2.求线性回归方程的步骤:
①计算平均数 ;②计算 的积,求 ;③计算 ;④将结果
代入公式求 ;⑤用 求 ;⑥写出回归方程
,a b ,a b
yx, ii yx 与 ∑ ii yx ∑ 2
ix
a xayb −= b