由莲山课件提供http://www.5ykj.com/ 资源全部免费
课时跟踪检测(一) 回归分析的基本思想及其初步应用
层级一 学业水平达标
1.在对两个变量x,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求线性回归方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤ D.②⑤④③①
解析:选D 对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①, 故选D.
2.有下列说法:
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
②R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;
③比较两个模型的拟合效果, 可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.
其中正确命题的个数是( )
A.0 B.1
C.2 D.3
解析:选D ①选用的模型是否合适与残差点的分布有关; 对于②③, R2的值越大, 说明残差平方和越小, 随机误差越小,则模型的拟合效果越好.
3.下图是根据变量x,y的观测数据(xi,yi)(i=1,2,…,10)得到的散点图,由这些散点图可以判断变量x,y具有相关关系的图是( )
A.①② B.①④
C.②③ D.③④
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
解析:选D 根据散点图中点的分布情况,可判断③④中的变量x,y具有相关的关系.
4.(重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
解析:选A 依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确.
5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
解析:选B 由题意知,==10,
==8,
∴=8-0.76×10=0.4,
∴当x=15时,=0.76×15+0.4=11.8(万元).
6.以下是某地区的降雨量与年平均气温的一组数据:
年平均气温(℃)
12.51
12.84
12.84
13.69
13.33
12.74
13.05
年降雨量(mm)
542
507
813
574
701
432
464
根据这组数据可以推断,该地区的降雨量与年平均气温________相关关系.(填“具有”或“不具有”)
解析:画出散点图,观察可知,降雨量与年平均气温没有相关关系.
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
答案:不具有
7.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
解析:根据样本相关系数的定义可知, 当所有样本点都在直线上时, 相关系数为1.
答案:1
8.下列说法正确的命题是________(填序号).
①回归直线过样本点的中心(,);
②线性回归方程对应的直线=x+至少经过其样本数据点(x1,y1),(x2,y2),…,(xn,yn)中的一个点;
③在残差图中,残差点分布的带状区域的宽度越宽,其模型拟合的精度越高;
④在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好.
解析:由回归分析的概念知①④正确,②③错误.
答案:①④
9.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
8
8.2
8.4
8.6
8.8
9
销量y(件)
90
84
83
80
75
68
(1)求回归直线方程=x+,其中=-20,=-;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
解:(1)=(8+8.2+8.4+8.6+8.8+9)=8.5, =(90+84+83+80+75+68)=80,
从而=+20=80+20×8.5=250,
故=-20x+250.
(2)由题意知, 工厂获得利润
z=(x-4)y=-20x2+330x-1 000=-202+361.25,所以当x==8.25时,zmax=361.25(元).
即当该产品的单价定为8.25元时,工厂获得最大利润.
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
10.关于x与y有以下数据:
x
2
4
5
6
8
y
30
40
60
50
70
已知x与y线性相关,由最小二乘法得=6.5,
(1)求y与x的线性回归方程;
(2)现有第二个线性模型:=7x+17,且R2=0.82.
若与(1)的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.
解:(1)依题意设y与x的线性回归方程为=6.5x+.
==5,
==50,
∵=6.5x+经过(,),
∴50=6.5×5+,∴=17.5,
∴y与x的线性回归方程为=6.5x+17.5.
(2)由(1)的线性模型得yi-i与yi-的关系如下表:
yi-i
-0.5
-3.5
10
-6.5
0.5
yi-
-20
-10
10
0
20
所以(yi-i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155.
(yi-)2=(-20)2+(-10)2+102+02+202=1 000.
所以R=1-=1-=0.845.
由于R=0.845,R2=0.82知R>R2,
所以(1)的线性模型拟合效果比较好.
层级二 应试能力达标
1.在建立两个变量y与x的回归模型中,分别选择4个不同模型,求出它们相对应的
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
R2如表,则其中拟合效果最好的模型是( )
模型
1
2
3
4
R2
0.67
0.85
0.49
0.23
A.模型1 B.模型2
C.模型3 D.模型4
解析:选B 线性回归分析中,相关系数为r,|r|越接近于1, 相关程度越大; |r|越小, 相关程度越小,故其拟合效果最好. 故选B.
2.如果某地的财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入为10亿元,则年支出预计不会超过( )
A.10亿 B.9亿
C.10.5亿 D.9.5亿
解析:选C ∵x=10时,y=0.8×10+2+e=10+e,
又∵|e|≤0.5,∴y≤10.5.
3.某咖啡厅为了了解热饮的销售量y(个)与气温x(℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:
气温(℃)
18
13
10
-1
销售量(个)
24
34
38
64
由表中数据,得线性回归方程=-2x+a.当气温为-4 ℃时,预测销售量约为( )
A.68 B.66
C.72 D.70
解析:选A ∵=(18+13+10-1)=10,= (24+34+38+64)=40,∴40=-2×10+a,∴a=60,当x=-4时,y=-2×(-4)+60=68.
4.甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和(yi-i)2如下表:
甲
乙
丙
丁
散点图
残差平方和
115
106
124
103
哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高( )
A.甲 B.乙
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
C.丙 D.丁
解析:选D 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2的表达式中(yi-)2为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.故选D.
5.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令=ln y,求得回归直线方程为=0.25x-2.58,则该模型的回归方程为________.
解析:因为=0.25x-2.58,=ln y,所以y=e0.25x-2.58.
答案:y=e0.25x-2.58
6.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:以x+1代x,得=0.254(x+1)+0.321,与=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.
答案:0.254
7.下表是某年美国旧轿车价格的调查资料.
使用年数
1
2
3
4
5
6
7
8
9
10
平均价格(美元)
2 651
1 943
1 494
1 087
765
538
484
290
226
204
观察表中的数据,试问平均价格与使用年数间存在什么样的关系?
解:设x表示轿车的使用年数,y表示相应的平均价格,作出散点图.
由散点图可以看出y与x具有指数关系,
令z=ln y,变换得
x
1
2
3
4
5
6
7
8
9
10
z
7.883
7.572
7.309
6.991
6.640
6.288
6.182
5.670
5.421
5.318
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
作出散点图:
由图可知各点基本上处于一直线,由表中数据可求出线性回归方程:
=8.166-0.298x.
因为旧车的平均价格与使用年数具有指数关系,其非线性回归方程为=e8.166-0.298x.
8.某公司利润y(单位:千万元)与销售总额x(单位:千万元)之间有如下对应数据:
x
10
15
17
20
25
28
32
y
1
1.3
1.8
2
2.6
2.7
3.3
(1)画出散点图;
(2)求回归直线方程;
(3)估计销售总额为24千万元时的利润.
解:(1)散点图如图:
(2)列下表,并利用科学计算器进行有关计算.
i
1
2
3
4
5
6
7
xi
10
15
17
20
25
28
32
yi
1
1.3
1.8
2
2.6
2.7
3.3
=21,=2.1
=3 447,iyi=346.3
于是=≈0.104.
=2.1-0.104×21=-0.084,
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
因此回归直线方程为=0.104x-0.084.
(3)当x=24时,y=0.104×24-0.084=2.412(千万元).
由莲山课件提供http://www.5ykj.com/ 资源全部免费