由莲山课件提供http://www.5ykj.com/ 资源全部免费
第3讲 相关性与最小二乘估计、统计案例
1.已知变量x,y呈线性相关关系,线性回归方程为y=0.5+2x,则变量x,y是( )
A.线性正相关关系 B.由回归方程无法判断其正负相关
C.线性负相关关系 D.不存在线性相关关系
解析:选A.随着变量x增大,变量y有增大的趋势,则x,y称为正相关.
2.(2016·衡水调研)某产品的广告费用x与销售额y的统计数据如下表.根据下表可得回归方程y=bx+a中的b=10.6,据此模型预报广告费用为10万元时销售额为( )
广告费用x(万元)
2
3
4
5
销售额y(万元)
26
39
49
58
A.112.1万元 B.113.1万元
C.111.9万元 D.113.9万元
解析:选C.因为(x,y)在回归直线y=bx+a上,且x=(4+2+3+5)=,y=(49+26+39+58)=43,将代入y=10.6x+a中得a=5.9,所以y=10.6x+5.9,当x=10时,y=106+5.9=111.9.所以广告费用为10万元时销售额为111.9万元.
3.(2016·济南模拟)某餐厅的原料费支出x与销售额y(单位:万元)之间有如下数据,根据表中提供的全部数据,用最小二乘法得出y与x的线性回归方程为y=8.5x+7.5,则表中m的值为( )
x
2
4
5
6
8
y
25
35
m
55
75
A.50 B.55
C.60 D.65
解析:选C.x=(2+4+5+6+8)=5,y=(25+35+m+55+75)=38+m.又回归直线必经过样本中心点,于是有8.5×5+7.5=38+m,解得m=60.
4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由χ2=,
算得χ2=≈7.8.
附表:
P(χ2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
解析:选C.根据独立性检验的定义,由χ2≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.
5.(2016·嘉兴联考)为了判断高中三年级学生是否选修文科与性别的关系,
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
现随机抽取50名学生,得到如下2×2列联表:
理科
文科
男
13
10
女
7
20
已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.
根据表中数据,得到χ2=≈4.844.则认为选修文科与性别有关系出错的可能性为______.
解析:因为χ2≈4.844,根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.
答案:5%
6.春节期间,某销售公司每天销售某种取暖商品的销售额y(单位:万元)与当天的平均气温x(单位:℃)有关.现收集了春节期间这个销售公司4天的x与y的数据列于下表:
平均气温(℃)
-2
-3
-5
-6
销售额(万元)
20
23
27
30
根据以上数据,用线性回归的方法,求得y与x之间的线性回归方程y=bx+a的系数b=-,则a=________.
解析:由表中数据可得=-4,=25,所以线性回归方程y=-x+a过点(-4,25),代入方程得25=-×(-4)+a,解得a=.
答案:
7.(2016·山西省四校联考)近几年出现各种食品安全问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到如下的列联表:
患三高疾病
不患三高疾病
总计
男
6
30
女
总计
36
(1)请将列联表补充完整;若用分层抽样的方法在患三高疾病的人群中抽取9人,其中女性抽取多少人?
(2)为了研究三高疾病是否与性别有关,请计算出统计量χ2,并说明你有多大的把握认为患三高疾病与性别有关?
下面的临界值表供参考:
P(χ2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式χ2=,其中n=a+b+c+d)
解:(1)根据题意可得
患三高疾病
不患三高疾病
总计
男
24
6
30
女
12
18
30
总计
36
24
60
在患三高疾病的人群中抽取9人,则抽取比例为=.
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
故女性应该抽取12×=3人.
(2)因为χ2==10>7.879,
所以有99.5%的把握认为患三高疾病与性别有关.
8.(2016·唐山第一次模拟)为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下实验数据:
天数t(天)
3
4
5
6
7
繁殖个数y(千个)
2.5
3
4
4.5
6
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,预测t=8时,细菌繁殖个数.
解:(1)由表中数据计算得,=5,=4, (ti-)2=10,
b==0.85,a=-b=-0.25.
所以回归方程为y=0.85t-0.25.
(2)将t=8代入(1)的回归方程中得y=0.85×8-0.25=6.55.
故预测t=8时,细菌繁殖个数为6.55千个.
1.(2016·郑州第二次质量预测)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程为y=-4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为( )
A. B.
C. D.
解析:选B.由表中数据得x=6.5,y=80,由y=-4x+a,得a=106,故线性回归方程为y=-4x+106.将(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分别代入回归方程可知有6个基本事件,因84