第一章 统计案例
1.1 回归分析的基本思想及其初步应用
为农村居民建立健康档案管理系统
标准体重表的制作
假设某地区从2003年到2012
年的人均GDP(单位/美元)
数据如图:
能否根据提供的数据,建立
一个合适的模型,预报2014
年(或2015年)的人均GDP是
多少?
年份 人均GDP
2003 1200
2004 1510
2005 1870
2006 2210
2007 2570
2008 3000
2009 3670
2010 4500
2011 5430
2012 6100
1.了解回归分析的基本思想.
2.会对两个变量进行回归分析. (重点)
3.明确解决回归模型的基本步骤,并对具体问题进
行回归分析以解决实际应用问题.
4.了解最小二乘法的推导,解释残差变量的含义.
5.了解偏差平方和分解的思想,了解判断刻画模型
拟合效果的方法——相关指数和残差分析.
6.掌握利用计算器求线性回归直线方程参数及相关
系数的方法.(难点)
探究点1 回归分析的基本思想
身高/cm
体重
/kg
·
·
思考:如何发现数据中的错误?如何衡量模型的拟
合效果?
可以通过残差发现原始数据中的可疑数据,判
断所建立模型的拟合效果.下表列出了女大学生身
高和体重的原始数据以及相应的残差数据.
从图1.1-4中可以看出,第1个样本点和第6个样本
点的残差比较大,需要确认在采集这两个样本点的过程
中是否有人为的错误.如果数据采集有错误,就予以纠
正,然后再重新利用线性回归模型拟合数据;如果数据
采集没有错误,则需要寻找其他的原因.另外,残差点
比较均匀地落在水平的带状区域中,说明选用的模型比
较合适.这样的带状区域的宽度越窄,说明模型拟合精
度越高,回归方程的预报精度越高.
在研究身高和体重的关系时,求得相关指数
_______,可以叙述为“身高解释了64%的
体重变化,而随机误差贡献了剩余的36%”所以身
高对体重的效应比随机误差的效应大得多.
【即时训练】
探究点2 回归分析的初步应用
产卵数
/
个
①当回归方程不是形如y=bx+a
(a,b∈R)时,称之为
非线性回归方
程.
x
z
t
y
如图四个散点图中,适合用线性回归模型拟合其中两个
变量的是( )
A.①② B.①③ C.②③ D.③④
B
【即时训练】
1.下列有关回归直线方程 = x+ 的叙述:
①反映 与x之间的函数关系;
②反映y与x之间的函数关系;
③表示 与x之间不确定关系;
④表示最接近y与x之间真实关系的一条直线.
其中正确的是( )
A.①② B.②③ C.③④ D.①④
C
2. 有下列说法:①在残差图中,残差点比较均匀地落
在水平的带状区域内,说明选用的模型比较合适.
②用相关指数R2来刻画回归的效果, R2值越大,说明模
型的拟合效果越好.③比较两个模型的拟合效果,可
以比较相关系数的大小,相关系数越大的模型,拟合
效果越好.其中正确命题的个数是( )
A.0 B.1 C.2 D.3
C
3.设变量x,y的回归方程是 ,若变量x
增加1.2个单位时,y平均减少3个单位,则 =( )
A.-2.5 B.2.5
C.-0.4 D.0.4
A
4.对于一组数据的两个函数模型,其残差平方和分别为
85.2和190.5,若从中选取一个拟合程度较好的函数模
型,应选________(填“前者” “后者”).
【解析】残差平方和越小(大)函数模型对数据的拟合
效果越好(差),故选前者.
前者
5.已知方程 是根据女中学生的身
高预报她的体重的回归方程,其中x的单位是cm,
的单位是kg,若某女同学的实际体重为53kg,她的
体重的估计值相对于实际体重的残差是-0.29kg,则
这位女同学的身高是 . 160cm
B
回归分析
统计案例
独立性检验
线 性 非线性 列联表
等高条形图
独立性检验步骤
实现自己既定的目标,必须能耐得住
寂寞单干.