由莲山课件提供http://www.5ykj.com/ 资源全部免费
课时跟踪检测 (五十七) 变量间的相关关系 统计案例
一抓基础,多练小题做到眼疾手快
1.(2017·重庆适应性测试)为了判定两个分类变量X和Y是否有关系,应用独立性检验法算得K2的观测值为5,又已知P(K2≥3.841)=0.05,P(K2≥6.635)=0.01,则下列说法正确的是( )
A.有95%的把握认为“X和Y有关系”
B.有95%的把握认为“X和Y没有关系”
C.有99%的把握认为“X和Y有关系”
D.有99%的把握认为“X和Y没有关系”
解析:选A 依题意,K2=5,且P(K2≥3.841)=0.05,因此有95%的把握认为“X和Y有关系”,选A.
2.某公司在2016年上半年的收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:
月份
1
2
3
4
5
6
收入x
12.3
14.5
15.0
17.0
19.8
20.6
支出y
5.63
5.75
5.82
5.89
6.11
6.18
根据统计资料,则( )
A.月收入的中位数是15,x与y有正线性相关关系
B.月收入的中位数是17,x与y有负线性相关关系
C.月收入的中位数是16,x与y有正线性相关关系
D.月收入的中位数是16,x与y有负线性相关关系
解析:选C 月收入的中位数是=16,由表可知收入增加,支出增加,故x与y有正线性相关关系,故选C.
3.已知变量x与y之间的回归直线方程为=-3+2x,若i=17,则i的值等于( )
A.3 B.4
C.0.4 D.40
解析:选B 依题意==1.7,而直线=-3+2x一定经过样本点的中心(,),所以=-3+2=-3+2×1.7=0.4,所以i=0.4×10=4.
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
二保高考,全练题型做到高考达标
1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是( )
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
解析:选B 因为散点图呈现上升趋势,故人体脂肪含量与年龄正相关;因为中间两个数据大约介于15%到20%之间,故脂肪含量的中位数小于20%.
2.(2016·河南省八市重点高中质量检测)为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天的销售额的情况如下表所示:
开业天数
10
20
30
40
50
销售额/天(万元)
62
75
81
89
根据上表提供的数据,求得y关于x的线性回归方程为=0.67x+54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )
A.67 B.68
C.68.3 D.71
解析:选B 设表中模糊看不清的数据为m.因为==30,又样本中心(,)在回归直线=0.67x+54.9上,所以==0.67×30+54.9,得m=68,故选B.
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
C. D.1
解析:选D 因为所有样本点都在直线y=x+1上,所以这组样本数据完全正相关,故其相关系数为1.
4.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )
A.66% B.67%
C.79% D.84%
解析:选D ∵y与x具有线性相关关系,满足回归方程=0.6x+1.2,该城市居民人均工资为=5,∴可以估计该城市的职工人均消费水平=0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为=84%.
5.(2017·黄冈模拟)下列说法错误的是( )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
解析:选B 根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好.二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C、D正确,故选B.
6.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:x变为x+1,=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.
答案:0.245
7.在2017年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x
9
9.5
m
10.5
11
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
销售量y
11
n
8
6
5
由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是=-3.2x+40,且m+n=20,则其中的n=________.
解析:==8+,==6+,回归直线一定经过样本点中心(,),即6+=-3.2+40,即3.2m+n=42.
又因为m+n=20,即解得故n=10.
答案:10
8.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
解析:K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.
答案:①
9.(2017·沈阳市教学质量监测)为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:
未发病
发病
总计
未注射疫苗
20
x
A
注射疫苗
30
y
B
总计
50
50
100
现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为.
(1)求2×2列联表中的数据x,y,A,B的值;
(2)绘制发病率的条形统计图,并判断疫苗是否有效?
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
(3)能够有多大把握认为疫苗有效?
附:K2=,n=a+b+c+d
P(K2≥k0)
0.05
0.01
0.005
0.001
k0
3.841
6.635
7.879
10.828
解:(1)设“从所有试验动物中任取一只,取到‘注射疫苗’动物”为事件E,由已知得P(E)==,所以y=10,B=40,x=40,A=60.
(2)未注射疫苗发病率为=,注射疫苗发病率为=.
发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率,且注射疫苗的发病率小,故判断疫苗有效.
(3)K2==≈16.667>10.828.
所以至少有99.9%的把握认为疫苗有效.
10.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i=80,i=20,iyi=184,=720.
(1)求家庭的月储蓄对月收入x的线性回归方程=x+;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
解:(1)由题意知n=10,
=i==8,=i==2,
又-n2=720-10×82=80,
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
iyi-n =184-10×8×2=24,
由此得==0.3,
=-=2-0.3×8=-0.4,
故所求线性回归方程为=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).
三上台阶,自主选做志在冲刺名校
(2016·成都质检)某火锅店为了解气温对营业额的影响,随机记录了该店1月份中5天的日营业额y(单位:千元)与该地当日最低气温x(单位:℃)的数据,如下表:
x
2
5
8
9
11
y
12
10
8
8
7
(1)求y关于x的回归方程=x+;
(2)判定y与x之间是正相关还是负相关;若该地1月份某天的最低气温为6 ℃,用所求回归方程预测该店当日的营业额;
(3)设该地1月份的日最低气温X~N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2,求P(3.8<X<13.4).
附:①回归方程=x+中,=,=-.
②≈3.2,≈1.8.若X~N(μ,σ2),则P(μ-σ<X<μ+σ)=0.682 6,P(μ-2σ<X<μ+2σ)=0.954 4.
解:(1)列表计算如下:
i
xi
yi
x
xiyi
1
2
12
4
24
2
5
10
25
50
3
8
8
64
64
4
9
8
81
72
5
11
7
121
77
∑
35
45
295
287
由莲山课件提供http://www.5ykj.com/ 资源全部免费
由莲山课件提供http://www.5ykj.com/ 资源全部免费
这里n=5,=i==7,=i==9.
又-n2=295-5×72=50,
iyi-n =287-5×7×9=-28,
从而=-=-0.56,
=-=9-(-0.56)×7=12.92,
故所求回归方程为=-0.56x+12.92.
(2)由=-0.56<0知y与x之间是负相关;
将x=6代入回归方程可预测该店当日的营业额=-0.56×6+12.92=9.56(千元).
(3)由(1)知μ==7,
又由σ2=s2=×[(2-7)2+(5-7)2+(8-7)2+(9-7)2+(11-7)2]=10,知σ=3.2,
从而P(3.8<X<13.4)=P(μ-σ<X<μ+2σ)
=P(μ-σ<X<μ)+P(μ<X<μ+2σ)
=P(μ-σ<X<μ+σ)+P(μ-2σ<X<μ+2σ)
=0.818 5.
由莲山课件提供http://www.5ykj.com/ 资源全部免费