第八章成对数据的统计分析
一、单项选择题(本大题共8小题,每小题5分,共40分)1.对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做A.函数关系B.线性关系C.相关关系D.回归关系12345678910111213141516171819202122√
2.下列两个变量之间的关系是相关关系的为A.正方体的体积与棱长的关系B.学生的成绩和体重C.路上酒后驾驶的人数和交通事故发生的多少D.水的体积和重量√12345678910111213141516171819202122
解析A中,由正方体的棱长和体积的公式知,V=a3(a>0),是确定的函数关系,故A错误;B中,学生的成绩和体重,没有关系,故B错误;C中,路上酒后驾驶的人数会影响交通事故发生的多少,但不是唯一因素,它们之间有相关性,故C正确;D中,水的体积V和重量x的关系为V=k·x,是确定的函数关系,故D错误.12345678910111213141516171819202122
3.下列四个图各反映了两个变量的某种关系,其中可以看作具有较强线性相关关系的是解析对于两个变量的散点图,若样本点成带状分布,则两个变量具有线性相关关系,所以两个变量具有线性相关关系的图是①和④.故选B.A.①③B.①④C.②③D.①②√12345678910111213141516171819202122
4.有以下五组变量:①某商品的销售价格与销售量;②学生的学籍号与学生的数学成绩;③坚持每天吃早餐的人数与患胃病的人数;④气温与冷饮销售量;⑤电瓶车的重量和行驶每千米的耗电量.其中两个变量成正相关的是A.①③B.②④C.②⑤D.④⑤√12345678910111213141516171819202122
解析对于①,一般情况下,某商品的销售价格与销售量成负相关关系;对于②,学生的学籍号与学生的数学成绩没有相关关系;对于③,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于④,一般情况下,气温与冷饮销售量成正相关关系;对于⑤,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.综上所述,其中两个变量成正相关的序号是④⑤.12345678910111213141516171819202122
5.每一吨铸铁成本y(元)与铸件废品率x%建立的经验回归方程为=56+8x,下列说法正确的是A.废品率每增加1%,成本每吨增加64元B.废品率每增加1%,成本每吨增加8%C.废品率每增加1%,成本每吨增加8元D.如果废品率增加1%,则每吨成本为56元√12345678910111213141516171819202122
6.对于给定的两个变量的统计数据,下列说法正确的是A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系解析给出一组样本数据,总可以作出相应的散点图,故C正确;但不一定能分析出两个变量的关系,故A错误;更不一定符合线性相关,不一定能用一条直线近似的表示,故B错误;两个变量的统计数据不一定具有函数关系,故D错误.√12345678910111213141516171819202122
7.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用过血清的人一年中的感冒记录进行比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.对此,有以下四个结论,正确的是A.依据小概率值α=0.05的独立性检验,可以认为“这种血清能起到预防感冒的作用”B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒C.这种血清预防感冒的有效率为95%D.这种血清预防感冒的有效率为5%√12345678910111213141516171819202122
解析由题意,因为χ2≈3.918,P(χ2≥3.841)≈0.05,所以依据小概率值α=0.05的独立性检验,可以认为“这种血清能起到预防感冒的作用”.12345678910111213141516171819202122
8.根据如下成对样本数据:x345678y42.5-0.50.5-2-3√12345678910111213141516171819202122
12345678910111213141516171819202122
二、多项选择题(本大题共4小题,每小题5分,共20分.全部选对的得5分,部分选对的得3分,有选错的得0分)9.下列有关样本相关系数r的说法正确的是A.样本相关系数r可用来衡量x与y之间的线性相关程度B.|r|≤1,且|r|越接近0,相关程度越小C.|r|≤1,且|r|越接近1,相关程度越大D.|r|≥1,且|r|越接近1,相关程度越大√√√12345678910111213141516171819202122
解析样本相关系数是来衡量两个变量之间的线性相关程度的,样本相关系数是一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大,故选ABC.12345678910111213141516171819202122
10.已知变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是A.变量x,y之间成负相关关系B.m=4C.可以预测,当x=11时,y约为2.6D.由表格数据知,该经验回归直线必过点(9,4)x681012y6m32√√√12345678910111213141516171819202122
当x=11时,y的预测值为2.6,故C正确;故经验回归直线过(9,4),故D正确;综上,选ACD.12345678910111213141516171819202122
11.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表.经计算χ2≈4.762,则可以推断出A.该学校男生对食堂服务满意的概率的估计值为B.调研结果显示,该学校男生比女生对食堂服务更满意C.依据α=0.05的独立性检验,可以认为男、女生对该食堂服务的评价有差异D.依据α=0.01的独立性检验,可以认为男、女生对该食堂服务的评价有差异满意不满意男3020女4010√√12345678910111213141516171819202122
因为χ2≈4.762>3.841=x0.05,所以依据α=0.05的独立性检验,可以认为男、女生对该食堂服务的评价有差异,故C正确,D错误.故选AC.12345678910111213141516171819202122
12.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有临界值表:α0.0500.010xα3.8416.635A.30人B.54人C.60人D.75人√√12345678910111213141516171819202122
解析设男生的人数为6n(n∈N*),根据题意列出2×2列联表如下表所示:男生女生合计喜欢抖音5n4n9n不喜欢抖音n2n3n合计6n6n12n由于有95%的把握认为是否喜欢抖音和性别有关,则3.841≤χ20,故2013年至2019年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2021年的年份代号t=9代入(1)中的经验回归方程,得=0.5×9+2.3=6.8,故预测该地区2021年农村居民家庭人均纯收入为6.8千元.12345678910111213141516171819202122
20.(12分)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展,下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:年份20152016201720182019销量(万台)81013252412345678910111213141516171819202122
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:车主购车种类合计传统燃油车新能源车男性624女性2合计3012345678910111213141516171819202122
(1)求新能源乘用车的销量y关于年份x的样本相关系数r,并判断y与x是否线性相关;12345678910111213141516171819202122
解依题意,12345678910111213141516171819202122
|r|≈0.94接近于1,故y与x线性相关.12345678910111213141516171819202122
(2)请将上述2×2列联表补充完整,并依据小概率值α=0.1的独立性检验,是否可以推断购车车主是否购置新能源乘用车与性别有关.12345678910111213141516171819202122
解依题意,完善表格如下:车主购车种类合计传统燃油车新能源车男性18624女性246合计201030零假设H0:购车车主是否购置新能源乘用车与性别无关,12345678910111213141516171819202122
根据小概率值α=0.1的独立性检验,我们推断H0不成立,故有90%的把握认为购车车主是否购置新能源乘用车与性别有关.12345678910111213141516171819202122
21.(12分)已知某校5名学生的数学成绩和物理成绩如下表:学生的编号i12345数学成绩xi8075706560物理成绩yi7066686462(1)假设在对这5名学生成绩进行统计时,把这5名学生的物理成绩搞乱了,数学成绩没出现问题,问:恰有2名学生的物理成绩是自己的实际分数的概率是多少?12345678910111213141516171819202122
12345678910111213141516171819202122
解记事件A为“恰有2名学生的物理成绩是自己的实际成绩”,12345678910111213141516171819202122
(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x表示数学成绩,用y表示物理成绩,求y关于x的经验回归方程;12345678910111213141516171819202122
12345678910111213141516171819202122
(3)利用残差分析经验回归方程的拟合效果,若残差和在(-0.1,0.1)范围内,则称经验回归方程为“优拟方程”,问:该经验回归方程是否为“优拟方程”?12345678910111213141516171819202122
因为0∈(-0.1,0.1),所以该方程为“优拟方程”.12345678910111213141516171819202122
22.(12分)混凝土具有原材料丰富、抗压强度高、耐久性好等特点,是目前使用量最大的土木建筑材料.抗压强度是混凝土质量控制的重要技术参数,也是实际工程对混凝土要求的基本指标.为了解某型号某批次混凝土的抗压强度(单位:MPa)随龄期(单位:天)的发展规律,质检部门在标准试验条件下记录了10组混凝土试件在龄期xi(i=1,2,3,…,10)分别为2,3,4,5,7,9,12,14,17,21时抗压强度yi的值,并对数据作了初步处理,得到右面的散点图及一些统计量的值.12345678910111213141516171819202122
12345678910111213141516171819202122
(1)根据散点图判断y=a+bx与y=c+dlnx哪一个适宜作为抗压强度y关于龄期x的回归方程类型?选择其中的一个模型,并根据表中数据,建立y关于x的回归方程;参考数据:ln2≈0.69,ln7≈1.95.12345678910111213141516171819202122
解由散点图可以判断,y=c+dlnx适宜作为抗压强度y关于龄期x的回归方程类型.令w=lnx,先建立y关于w的经验回归方程.12345678910111213141516171819202122
(2)工程中常把龄期为28天的混凝土试件的抗压强度f28视作混凝土抗压强度标准值.已知该型号混凝土设置的最低抗压强度标准值为40MPa.①试预测该批次混凝土是否达标?参考数据:ln2≈0.69,ln7≈1.95.12345678910111213141516171819202122
解由(1)知,当龄期为28天,即x=28时,因为43>40,所以预测该批次混凝土达标.12345678910111213141516171819202122
②由于抗压强度标准值需要较长时间才能评定,早期预测在工程质量控制中具有重要意义.经验表明,该型号混凝土第7天的抗压强度f7与第28天的抗压强度f28具有线性相关关系f28=1.2f7+7,试估计在早期质量控制中,龄期为7天的试件需达到的抗压强度.参考数据:ln2≈0.69,ln7≈1.95.12345678910111213141516171819202122
解令f28=1.2f7+7≥40,得f7≥27.5.所以估计龄期为7天的混凝土试件需达到的抗压强度为27.5MPa.12345678910111213141516171819202122
本课结束