天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
专题十一 概率与统计
第三十三讲 回归分析与独立性检验
一、选择题
1.(2017 山东)为了研究某班学生的脚长 (单位:厘米)和身高 (单位:厘米)的关
系,从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 与 之间有线性相
关关系,设其回归直线方程为 .已知 , ,
.该班某学生的脚长为 24,据此估计其身高为
A. B. C. D.
2.(2015 福建)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区 5 户
家庭,得到如下统计数据表:
收入 (万元) 8.2 8.6 10.0 11.3 11.9
支出 (万元) 6.2 7.5 8.0 8.5 9.8
根据上表可得回归本线方程 ,其中 ,据此估计,该社
区一户收入为 15 万元家庭年支出为
A.11.4 万元 B.11.8 万元 C.12.0 万元 D.12.2 万元
3.(2014 重庆)已知变量 与 正相关,且由观测数据算得样本的平均数 , ,
则由该观测数据算得的线性回归方程可能为
A. B. C. D.
4.(2014 湖北)根据如下样本数据
x 3 4 5 6 7 8
y 4.0 2.5 0.5
得到的回归方程为 ,则
A. , B. , C. , D. ,
5.(2012 新课标)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn 不
x y 3.5y =
x y
y x
ˆˆ ˆy bx a= +
10
1
225i
i
x
=
=∑ 10
1
1600i
i
y
=
=∑
ˆ 4b =
160 163 166 170
x
y
ˆˆ ˆy bx a= + ˆ ˆˆ0.76,b a y bx= = −
3x =
0.4 2.3y x= + 2 2.4y x= − 2 9.5y x= − + 0.3 4.4y x= − +
0.5− 2.0− 3.0−
ˆy bx a= +
0a > 0b < 0a > 0b > 0a < 0b < 0a < 0b >
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线 上,则
这组样本数据的样本相关系数为
A.−1 B.0 C.1
2 D.1
6.(2014 江西)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量之间的关
系,随机抽查 52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最
大的变量是
7.(2012 湖南)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关
系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为
=0.85x 85.71,则下列结论中不正确的是
A.y 与 x 具有正的线性相关关系
B.回归直线过样本点的中心( , )
C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg
D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg
8.(2011 山东)某产品的广告费用 x 与销售额 y 的统计数据如下表
广告费用 x(万元) 4 2 3 5
销售额 y(万元) 49 26 39 54
y
x y
1 12y x= +
−
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
根据上表可得回归方程 中的 为 9.4,据此模型预报广告费用为 6 万元时销
售额为
A.63.6 万元 B.65.5 万元 C.67.7 万元 D.72.0 万元
二、解答题
9.(2018 全国卷Ⅱ)下图是某地区 2000 年至 2016 年环境基础设施投资额 (单位:亿元)
的折线图.
为了预测该地区 2018 年的环境基础设施投资额,建立了 与时间变量 的两个线性回
归模型.根据 2000 年至 2016 年的数据(时间变量 的值依次为 )建立模
型①: ;根据 2010 年至 2016 年的数据(时间变量 的值依次为
)建立模型②: .
(1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
10.(2016 年全国 III)下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)
的折线图
ˆˆ ˆy bx a= + ˆb
y
y t
t 1 2 17, ,… ,
ˆ 30.4 13.5= − +y t t
1 2 7, ,… , ˆ 99 17.5= +y t
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
(Ⅰ)由折线图看出,可用线性回归模型拟合 与 的关系,请用相关系数加以说明;
(Ⅱ)建立 关于 的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾无害化
处理量.
附注:参考数据: , , , Error! No
bookmark name given.≈2.646.
参考公式:相关系数
回归方程 中斜率和截距的最小二乘估计公式分别为:
11.(2015 新课标 1)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费
(单位:千元)对年销售量 (单位:t)和年利润 (单位:千元)的影响,对近 8
年的年宣传费 和年销售量 ( =1,2,···,8)数据作了初步处理,得到下面的
散点图及一些统计量的值.
y t
y t
7
1
9.32i
i
y
=
=∑ 7
1
40.17i i
i
t y
=
=∑ 7
2
1
( ) 0.55i
i
y y
=
− =∑ 7
1
2 2
1 1
( )( )
( ) (y y)
n
i i
i
n n
i i
i i
t t y y
r
t t
=
= =
− −
=
− −
∑
∑ ∑
,
y a bt= +
1
2
1
( )( )
( )
n
i i
i
n
i
i
t t y y
b
t t
=
=
− −
=
−
∑
∑
, = .a y bt−
x
y z
ix iy i
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
46.6 563 6.8 289.8 1.6 1469 108.8
表中 , = .
(Ⅰ)根据散点图判断, 与 哪一个适宜作为年销售量 关于
年宣传费 的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立 关于 的回归方程;
(Ⅲ)已知这种产品的年利率 与 、 的关系为 .根据(Ⅱ)的结果回
答下列问题:
(ⅰ)年宣传费 =49 时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费 为何值时,年利率的预报值最大?
附:对于一组数据 , , , ,其回归线 的斜率和
截距的最小二乘估计分别为
, .
12.(2014 新课标 2)某地区 2007 年至 2013 年农村居民家庭纯收入 y(单位:千元)的数
据如下表:
年份 2007 2008 2009 2010 2011 2012 2013
年份代号 t 1 2 3 4 5 6 7
人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9
x y w
8
2
1
( )i
i
x x
=
−∑ 8
2
1
( )i
i
w w
=
−∑ 8
1
( )( )i i
i
x x y y
=
− −∑ 8
1
( )( )i i
i
w w y y
=
− −∑
i iw x= w 1
8
8
1
i
i
w
=
∑
y a bx= + y c d x= + y
x
y x
z x y 0.2z y x= −
x
x
1 1( , )u v 2 2( , )u v ⋅⋅⋅ ( , )n nu v v uα β= +
1
2
1
( )( )
ˆ
( )
n
i i
i
n
i
i
u u v v
u u
β =
=
− −
=
−
∑
∑
ˆˆ v uα β= −
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
(Ⅰ)求 y 关于 t 的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收
入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:
,
13.(2012 辽宁)电视传媒公司为了解某地区电视观众对某体育节目的收视情况,随机抽取
了 100 名观众进行调查,其中女性有 55 名.下面是根据调查结果绘制的观众日均收看该
体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于 40 分钟的观众称为“体育迷”,已知“体育迷”中有 10
名女性.
(I)根据已知条件完成下面 列联表,并据此资料你是否认为“体育迷”与性别有关?
非体育迷 体育迷 合计
男
女
合计
(II)将日均收看该体育节目不低于 50 分钟的观众称为“超级体育迷”,已知“超级体育
迷”中有 2 名女性.若从“超级体育迷”中任意选取 2 人,求至少有 1 名女性观众的
概率.
附 :
,
22×
2121
2
211222112 )(
++++
−=
nnnn
nnnnnχ
0.05 0.01
3.841 6.635
( )( )
( )
1
2
1
n
i i
i
n
i
i
t t y y
b
t t
∧
=
=
− −
=
−
∑
∑
ˆˆa y bt= −
)( 2 kP ≥χ
k