1
.
能通过收集现实问题中两个有关联的变量的数据作出散点图
,
并利用散点图直观认识变量间的相关关系
.
2
.
能根据给出的线性回归方程系数公式建立线性回归方程
.
3
.
能通过相关性检验
,
了解回归分析的基本思想与方法
.
4
.
了解非线性回归问题
,
并能找出解决问题的一般思路
.
1
2
1
.
回归直线方程
名师点拨
(1)
回归直线方程只适用于所研究的样本总体
.
(2)
建立的回归直线方程一般都有时间性
,
如不能用
20
世纪
80
年代的身高、体重数据所建立的回归直线方程来描述现在的身高和体重的关系
.
(3)
样本取值的范围会影响回归直线方程的适用范围
.
(4)
回归直线方程得到的预报值不一定就是预报变量的精确值
,
事实上
,
它是预报变量的可能取值的平均值
.
1
2
2
.
相关性检验
r
具有以下性质
:
|r|
≤1
,
并且
|r|
越接近
1,
线性相关程度越
强
;
|r|
越接近
0,
线性相关程度越
弱
.
1
2
对变量
x
与
Y
进行相关性检验分四步
:
(1)
作统计假设
:
x
与
Y
不具有
线性相关
关系
;
(2)
根据小概率
0
.
05
与
n-
2
在教材附表中查出
r
的一个临界值
r
0
.
05
;
(3)
根据样本相关系数计算公式算出
r
的值
;
(4)
作统计推断
.
如果
|r|>r
0
.
05
,
表明有
95%
的把握认为
x
与
Y
之间具有线性相关关系
.
如果
|r|
≤
r
0
.
05
,
我们没有理由拒绝原来的假设
.
这时寻找回归直线方程是毫无意义的
.
1
2
【做一做】
下列有关样本相关系数的说法不正确的是
(
)
A.
相关系数用来衡量变量
x
与
Y
之间的线性相关程度
B.
|r|
≤1,
且
|r|
越接近
1,
相关程度越强
C.
|r|
≤1,
且
|r|
越接近
0,
相关程度越弱
D.
|r|
≥1,
且
|r|
越接近
1,
相关程度越强
答案
:
D
两个变量具有相关关系和具有函数关系有何区别
?
剖析
相关关系与函数关系不同
,
因为函数关系是一种确定性的关系
;
而相关关系是一种非确定性的关系
,
它包括两种情况
:
一是两个变量中
,
一个变量为可控制变量
,
另一个变量为随机变量
;
二是两个变量均为随机变量
.
而函数关系可以看成是两个非随机变量之间的关系
.
另一方面
,
函数关系是一种因果关系
,
而相关关系不一定是因果关系
,
也可以是伴随关系
.
对两个变量的关系来说
,
在相关关系中
,
例如
,
在水稻产量与施肥量的关系中
,
施肥量是可控制变量
,
而水稻的产量是随机变量
;
在研究一个学生的数学成绩与物理成绩的关系时
,
这两个变量都是不可控制的随机变量
.
而正方形的面积
S
与边长
x
之间的关系是一种函数关系
,
这两个变量就不是随机变量
.
由于相关关系的不确定性
,
我们经常运用统计分析的方法
,
即回归分析法来进行研究
.
我们可以知道
,
相关关系中
,
由部分观测值得到的回归直线
,
可以对两个变量间的线性相关关系进行估计
,
这实际上是将非确定性问题转化成确定性问题来研究
.
由于回归直线将部分观测值所反映的规律性进行了延伸
,
它在情况预报、资料补充等方面有着广泛的应用
,
从某种意义上看
,
函数关系是一种理想的关系模型
,
而相关关系是一种更为一般的情况
.
因此研究相关关系
,
不仅可使我们处理更为广泛的数学应用问题
,
还能使我们对函数关系的认识上升到一个新的高度
.
题型一
题型二
题型三
【例
1
】
假设关于某种设备的使用年限
x
(
单位
:
年
)
与所支出的维修费用
y
(
单位
:
万元
)
有如下统计资料
:
(2)
对
x
,
y
进行线性相关性检验
;
(3)
如果
x
与
y
具有线性相关关系
,
求出回归直线方程
;
(4)
假设使用年限为
10
年时
,
维修费用约是多少万元
?
题型一
题型二
题型三
题型一
题型二
题型三
题型一
题型二
题型三
反思
作相关性检验
,
有时也用作散点图的方法
,
观察所给的数据列成的点是否在一条直线的附近
,
这样做既直观又方便
,
因而对解决相关性检验问题比较常用
,
但在作图中
,
由于存在误差
,
有时又很难说这些点是不是分布在一条直线的附近
,
这时就很难判断两个变量之间是否具有相关关系
,
这时就必须利用样本相关系数对其进行相关性检验
,
计算中应该特别细心
,
不能出现计算的错误
.
题型一
题型二
题型三
【例
2
】
下表是某种旧货物价格的调查资料
,
若以
x
表示该种货物的使用年数
,
y
(
单位
:
元
)
表示相应的年均价格
,
求
y
关于
x
的回归方程
.
分析
作出散点图
,
根据样本点分布情况
,
选择适当的曲线模型拟合
.
题型一
题型二
题型三
解
:
作出
y
关于
x
的散点图
(
如图所示
)
.
由散点图看出
y
与
x
呈指数关系
,
于是令
z=
ln
y.
变换后得数据
:
题型一
题型二
题型三
题型一
题型二
题型三
反思
非线性回归问题有时并不给出经验公式
.
这时我们可以画出已知数据的散点图
,
把它与幂函数、指数函数、对数函数等的图象作比较
,
挑选一种跟这些散点拟合得最好的函数
,
然后采用适当的变量置换
,
把问题化为线性回归分析问题
,
使之得到解决
.
题型一
题型二
题型三
【例
3
】
在一次抽样中测得变量
x
与
Y
的一组样本数据如下表
:
试建立
Y
与
x
之间的回归方程
.
题型一
题型二
题型三
错解
:
由已知条件制成下表
:
题型一
题型二
题型三
题型一
题型二
题型三
错因分析
本题直接取已知数据求回归直线方程
,
没有画出散点图或求相关系数
r
进行线性相关性的检验
,
而本题的两个变量恰好不具有线性相关关系
.
根据散点图
(
如图所示
)
可以发现样本点分布在某一条反比例函数曲线的周围
,
易知
Y
与
呈线性相关关系
.
题型一
题型二
题型三
正解
根据收集的数据作散点图
(
如错因分析中图
)
.
由图可知样本点分布在某一条反比例函数曲线的周围
,
令
t=
,
则原数据变为
:
题型一
题型二
题型三
由散点图
(
如图所示
)
可以看出
Y
与
t
呈近似的线性相关关系
.
列表如下
:
题型一
题型二
题型三
1
2
3
4
5
1.
给出下列说法
:
①
线性回归分析就是由样本点去寻找一条直线
,
使其贴近这些样本点的数学方法
;
②
利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示
;
③
通过回归方程
及其回归系数
,
可以估计和预测变量的取值和变化趋势
;
④
因为由任意一组观测值都可以求得一个回归直线方程
,
所以没有必要进行相关性检验
.
其中正确的说法有
(
)
A.1
个
B.2
个
C.3
个
D.4
个
解析
:
①②③
正确
.
答案
:
C
1
2
3
4
5
2.
观测两相关变量得如下数据
:
则两变量间的回归直线方程为
(
)
答案
:
B
1
2
3
4
5
3.
设某大学的女生体重
y
(
单位
:kg)
与身高
x
(
单位
:cm)
具有线性相关关系
,
根据一组样本数据
(
x
i
,
y
i
)(
i=
1,2,…,
n
),
用最小二乘法建立的回归方程为
=
0
.
85
x-
85
.
71,
则下列结论中不正确的是
(
)
A.
y
与
x
具有正的线性相关关系
B.
回归直线过样本点的中心
C.
若该大学某女生身高增加
1 cm,
则其体重约增加
0.85 kg
D.
若该大学某女生身高为
170 cm,
则可断定其体重必为
58.79 kg
解析
:
D
选项中
,
若该大学某女生身高为
170
cm,
则可断定其体重约为
0
.
85
×
170
-
85
.
71
=
58
.
79(kg)
.
故
D
选项不正确
.
答案
:
D
1
2
3
4
5
4.
对具有线性相关关系的变量
x
和
Y
,
测得一组数据如下表
:
若已求得它们的回归直线方程的斜率为
6
.
5,
则这条回归直线方程为
.
1
2
3
4
5
5.
为了考察两个变量
Y
与
x
的线性相关性
,
测得
x
,
Y
的
13
对数据
,
若
Y
与
x
具有线性相关关系
,
则相关系数
|r|
的取值范围是
.
解析
:
由小概率
0
.
05
与
13
-
2
=
11
在教材附表中查得
r
0
.
05
=
0
.
553,
所以
Y
与
x
若具有线性相关关系
,
则相关系数
r
的取值范围是
(0
.
553,1]
.
答案
:
(0
.
553,1]