§3.2 回归分析(二)
课时目标
1.进一步理解回归分析的基本思想.
2.了解一些非线性回归问题的解法.
1.对相关系数r进行显著性检验的基本步骤如下:
(1)提出统计假设H0:变量x,y________________________;
(2)如果以95%的把握作出推断,可以根据1-0.95=0.05与n-2在附录2中查出一个r的____________(其中1-0.95=0.05称为____________);
(3)计算________________;
(4)作出统计推断:若____________,则否定H0,表明有________的把握认为x与y之间具有________________;若____________,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有________________.
2.用相关系数可以对两个变量之间的______________进行较为精确的刻画,运用________的方法研究一些非线性相关问题.
一、填空题
1.下列说法正确的是________.(填序号)
①y=2x2+1中的x、y是具有相关关系的两个变量;
②正四面体的体积与其棱长具有相关关系;
③电脑的销售量与电脑的价格之间是一种确定性的关系;
④传染病医院感染甲型H1N1流感的医务人员数与医院收治的甲型流感人数是具有相关关系的两个变量.
2.两个变量成负相关关系时,散点图的点散布特征是________________________.
3.已知x与y之间的一组数据如下表:
x
0
1
2
3
y
1
3
5
7
则y关于x的线性回归直线必过________点.
4.某种产品的广告费支出x与销售额y之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是______.
x/万元
2
4
5
6
8
y/万元
30
40
60
50
70
5.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:
零件数x/个
10
20
30
40
50
60
70
80
90
100
加工时间y/分
62
68
75
81
89
95
102
108
115
122
则加工时间y(分)与零件数x(个)之间的相关系数r=________.(精确到0.000 1)
6.对有关数据的分析可知,每一立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为 =0.30x+9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm2,每立方米混凝土的水泥用量最少应为________kg.(精确到0.1 kg)
7.根据统计资料,我国能源生产自1986年以来发展很快.下面是我国能源生产总量(单位:亿吨标准煤)的几个统计数据:
年份
1986
1991
1996
2001
6
产量
8.6
10.4
12.9
16.1
根据有关专家预测,到2010年我国能源生产总量将达到21.7亿吨左右,则专家所选择的回归模型是下列四种模型中的哪一种________.(填序号)
① = x+ (a≠0);
②y=ax2+bx+c(a≠0);
③y=ax(a>0且a≠1);
④y=logax(a>0且a≠1).
8.下列说法中正确的是________(填序号).
①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数;⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.
二、解答题
9.假设学生在初一和初二的数学成绩是线性相关的.若10名学生的初一(x)和初二(y)数学分数如下:
x
74
71
72
68
76
73
67
70
65
74
y
76
75
71
70
76
79
65
77
62
72
试求初一和初二数学分数间的线性回归方程.
10.在某化学实验中,测得如下表所示的6对数据,其中x(单位:min)表示化学反应进行的时间,y(单位:mg)表示未转化物质的质量.
x/min
1
2
3
4
5
6
y/mg
39.8
32.2
25.4
20.3
16.2
13.3
(1)设y与x之间具有关系y=cdx,试根据测量数据估计c和d的值(精确到0.001);
(2)估计化学反应进行到10 min时未转化物质的质量(精确到0.1).
6
能力提升
11.测得某国家10对父子身高(单位:英寸)如下:
父亲身高(x)
60
62
64
65
66
67
68
70
72
74
儿子身高(y)
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
(1)对变量y与x进行相关性检验;
(2)如果y与x之间具有线性相关关系,求回归直线方程;
(3)如果父亲的身高为73英寸,估计儿子的身高.
12.某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:
x
1
2
3
5
10
20
30
50
100
200
y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
检验每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系?如有,求出y对x的线性回归方程.
1.利用回归分析可对一些实际问题作出预测.
2.非线性回归方程有时并不给出回归模型,这时我们可以画出已知数据的散点图,把它与我们所学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象进行比较,挑选一种拟和比较好的函数,把问题通过变量转换,转化为线性的回归分析问题,使之得到解决.
3.2 回归分析(二)
答案
6
知识梳理
1.(1)不具有线性相关关系 (2)临界值r0.05 检验水平 (3)样本相关系数r
(4)|r|>r0.05 95% 线性相关关系 |r|≤r0.05 线性相关关系
2.线性相关程度 转化
作业设计
1.④
解析 感染的医务人员数不仅受医院收治的病人数的影响,还受防护措施等其他因素的影响.
2.从左上角到右下角区域内
解析 散点图的主要作用是直观判断两个变量之间的相关关系.一般地说,当散点图中的点是呈“由左下角到右上角”的趋势时,则两个变量之间具有正相关关系;而当散点图中的点是呈“由左上角到右下角”的趋势时,则两个变量之间具有负相关关系.
3.(1.5,4)
解析 在本题中,样本点的中心为(1.5,4),所以回归直线过(1.5,4)点.
4.(6,50)
5.0.999 8
解析 =55,=91.7,x=38 500,
y=87 777,xiyi=55 950,
所以r=≈0.999 8.
6.265.7 7.①
8.④⑤
解析 回归分析就是研究两个事件的相关性;回归模型是需要通过散点图模拟的;回归模型有线性和非线性之分.
9.解 因为=71,=50 520,=72.3,iyi=51 467,
所以, =≈1.218 2.
=72.3-1.218 2×71=-14.192 2,
线性回归方程是: =1.218 2x-14.192 2.
10.解 (1)在y=cdx两边取自然对数,令ln y=z,ln c=a,ln d=b,则z=a+bx.由已知数据,得
x
1
2
3
4
5
6
y
39.8
32.2
25.4
20.3
16.2
13.3
z
3.684
3.472
3.235
3.011
2.785
2.588
由公式得 ≈3.905 5, ≈-0.221 9,则线性回归方程为 =3.905 5-0.221 9x.而ln c=3.905 5,ln d=-0.221 9,故c≈49.681,d≈0.801,所以c、d的估计值分别为49.681,0.801.
(2)当x=10时,由(1)所得公式可得y≈5.4(mg).
11.解 (1)=66.8,=67.01,
x=44 794,y=44 941.93. =4 476.27,
6
2=4 462.24,2=4 490.34,xiyi=44 842.4.
所以r=
=
=≈≈0.980 2.
由于r非常接近于1,所以y与x之间具有线性相关关系.
(2)设线性回归方程为 = x+ .
由 ===≈0.4645,
=- =67.01-0.464 5×66.8≈35.98.
故所求的线性回归方程为 =0.464 5x+35.98.
(3)当x=73时, =0.464 5×73+35.98≈69.9,
所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸.
12.解 把置换为z,则有z=,
从而z与y的数据为
z
1
0.5
0.333
0.2
0.1
0.05
0.033
0.02
0.01
0.005
y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
可作出散点图,从图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.
=×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1,
=×(10.15+5.52+4.08+…+1.15)=3.14,
z=12+0.52+0.3332+…+0.012+0.0052
=1.415,
y=10.152+5.522+…+1.212+1.152
=171.803,
ziyi=1×10.15+0.5×5.52+…+0.005×1.15
=15.221 02,
所以 =≈8.976,
=- =3.14-8.976×0.225 1≈1.120,
所以所求的z与y的线性回归方程为
6
=8.976z+1.120.
又因为z=,所以 =+1.120.
6