3.1 回归分析的基
本思想及其初步应用
(第二课时)
1.通过典型案例的探究,进一步了解回归分析的基本思想、
方法及其初步应用.
2.让学生经历数据处理的过程,培养他们对数据的直观感
觉,体会统计方法的特点,认识统计方法的应用,通过使用转化
后的数据,求相关指数,运用相关指数进行数据分析、处理的方
法.
3.从实际问题中发现已有知识的不足,激发好奇心,求知
欲,通过寻求有效的数据处理方法,开拓学生的思路,培养学生
的探索精神和转化能力,通过案例的分析使学生了解回归分析在
实际生活中的应用,增强数学取之生活,用于生活的意识,提高
学习兴趣.
本节课通过例题线性相关关系知识,通过实际问
题中发现已有知识的不足,引导学生寻找解决非线性
回归问题思想与方法,培养学生化归数学思想。通过
知识的整理,通过例题讲解掌握解决非线性回归问题。
本节内容学生内容不易掌握,通过知识整理与比
较引导学生进行区分、理解。通过对典型案例的探究,
练习进行巩固解决非线性回归基本思想方法及初步应
用.
建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量
是预报变量.
(2)画出确定好的解释变量和预报变量的散点图,观察它
们之间的关系(如是否存在线性关系等).
(3)由经验确定回归方程的类型(如我们观察到数据呈线
性关系,则选用线性回归方程).
(4)按一定规则(如最小二乘法)估计回归方程中的参数.
(5)得出结果后分析残差图是否有异常(如个别数据对应
残差过大,或残差呈现不随机的规律性等).若存在异常,
则检查数据是否有误,或模型是否合适等.
(6)参数R2与相关系数r
提示:它们都是刻画两个变量之间的的相关关系的,区
别是R2表示解释变量对预报变量变化的贡献率,其表
达式为R2=1- ;
相关系数r是检验两个变量相关性的强弱程度,
其表达式为
(7)相关系数r与R2
(1)R2是相关系数的平方,其变化范围为[0,1],而相关系
数的变化范围为[-1,1].
(2)相关系数可较好地反映变量的相关性及正相关或负
相关,而R2反映了回归模型拟合数据的效果.
(3)当|r|接近于1时说明两变量的相关性较强,当|r|接
近于0时说明两变量的相关性较弱,而当R2接近于1时,说
明线性回归方程的拟合效果较好.
例:一只红铃虫产卵数y和温度x有关,现收集到的一
组数据如下表1-3表,试建立y与x之间的回归方程。
画出确定好的解释变量
和预报变量的散点图,
观察它们之间的关系.
(1)是否存在线性关系?
(2)散点图具有哪种函数特征?
(3)以指数函数模型为例,如何设模型函数?
非线性关系
指数函数、二次函数、三次函数
cc 21设指数函数曲线 其中 和 是待定参数。ecy xc
1 2=
我们可以通过对数变换把指数关系变为线性关系
( )这样就可以利用线性回归模型来建立z 与x回归模型,
进而找到y与x的非线性回归方程 。
*
则变换后样本点分布在直线的周围。令
)cb,clna(abxz 21 ==+=
ylnz =
现在问题变为如何估计待定参数 和 ?cc 21
非线性回归模型
(6)eyˆ 0.272x-3.843(1) =
另一方面,可以认为图11-4中样本点集中在某二次曲线
因此可以对温度变量做变换,即令 然后建立y与t
之间的线性回归方程,从而得到y与x之间的排线性回
归方程。
,2xt =
的附近,其中 和 为待定参数.43 cc4
2
3 cxcy +=
表1-5是红铃虫的产卵数和对应的温度的平方,图1.1
-6是相应的散点图.
( ) ( )( ) ( ) ,b,xgy~a,xfy~ 21 == 和
对于给定的样本点 ,两个含有
未知数的模型
其中a和b都是未知参数,可以按如下的步骤来比较它们
的拟合效果.
bˆaˆ其中 和 分别是参数a、b的估计值
(1)分别建立对应于两个模型的回归方程
( ) ( ),bˆ,xgyˆ 2 =
( )( ) aˆ,xfyˆ 1 =
( ) ( )( );yˆyQˆ n
1i
22
ii
2 å
=
-=( )Qˆ 1 ( )( )yˆy
n
1i
21
iiå
=
-= 与
(2)分别计算两个回归方程的残差平方和
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) .bˆ,xgyˆaˆ,xfyˆ,;
bˆ,xgyˆaˆ,xfyˆ,QˆQˆ
21
2121
的好的效果不如反之的好
的效果比则(3)若
==
==