变量的相关性
(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.
(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
回归分析
了解回归分析的基本思想、方法及其简单应用.
1.相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫做相关关系.即相关关系是一种非确定性关系.
当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;
当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关.
【注意】相关关系与函数关系的异同点:
共同点:二者都是指两个变量间的关系.
不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.
2.散点图
将样本中的n个数据点描在平面直角坐标系中,所得图形叫做散点图.
从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在从左上角到右下角的区域内,两个变量的相关关系为负相关.
具有正相关关系的两个变量的散点图如图1,具有负相关关系的两个变量的散点图如图2.
3.回归分析
如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线.
回归直线对应的方程叫做回归直线方程(简称回归方程).
4.回归方程的求解
(1)求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.
若变量x与y具有线性相关关系,有n个样本数据,则回归方程中,.
其中,
称为样本点的中心.
(2)线性回归模型,其中称为随机误差,自变量称为解释变量,因变量称为预报变量.
【注意】①回归直线必过样本点的中心,这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.
②利用回归直线方程不但可以预测在x取某一个值时,y的估计值,同时也能知道x每增加1个单位,的变化量.
③在回归直线方程中,既表示直线的斜率,又表示自变量x的取值每增加一个单位时,函数y的改变量.
5.相关系数
(1)样本相关系数r的计算公式
我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为
.
(2)样本相关系数r的性质
①;
②当r>0时,表明两个变量正相关;当r0时,正相关;r