阶段性测试题一第一章 统计案例(时间:120分钟 满分:150分)第Ⅰ卷(选择题,共60分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下表是x和y之间的一组数据,则y关于x的回归方程必过( )x1234y1357A.点(2,3)B.点(1.5,4)C.点(2.5,4)D.点(2.5,5)解析:=×(1+2+3+4)=2.5,=×(1+3+5+7)=4,∴回归方程必过点(2.5,4),故选C.答案:C2.(2019·晋江月考)已知具有线性相关关系的两个变量x,y之间的一组数据如下:x01234y2.24.34.54.86.7回归方程是=x+,其中=0.95,=-.则当x=6时,y的预测值为( )A.8.1B.8.2C.8.3D.8.4解析:由题可知=2,=4.5,=4.5-0.95×2=2.6,∴=0.95x+2.6,当x=6,=0.95×6+2.6=8.3,
∴y的预测值为8.3,故选C.答案:C3.已知变量x与y之间的回归直线方程为=3x-7,若=3,则i的值约等于( )A.2B.10C.16D.20解析:=3×3-7=2,∴i=10×2=20,故选D.答案:D4.(2019·临夏中学月考)有以下五组变量:①某商品的销售价格与销售量;②学生的学籍号与学生的数学成绩;③坚持每天吃早餐的人数与患胃病的人数;④气温与冷饮销售量;⑤电瓶车的重量和行驶每千米的耗电量.其中两个变量成正相关的是( )A.①③B.②④C.②⑤D.④⑤解析:销售价格越高,销售量通常会越低,所以不是正相关,故①错;学生的成绩与学籍号无关,故②错;医学证明不吃早餐的人容易患胃病,因此吃早餐和患胃病之间是负相关,故③错;气温越高,冷饮销量越高,故是正相关,故④正确;电瓶车越重,耗电量越大,所以是正相关,故⑤正确,故选D.答案:D5.对两个变量y和x进行线性相关检验,已知n是观察值组数,r是相关系数,且已知:①n=10,r=0.9533;②n=15,r=0.3012;③n=17,r=0.9991;④n=3,r=0.9950.则变量y和x具有线性相关关系的是( )
A.①和②B.①和③C.②和④D.③和④解析:相关系数r的绝对值越接近于1,变量x,y的线性相关性越强.②中的r太小,④中的n太小,即观察值组数太少,因此①③中的变量y与x具有线性相关关系.答案:B6.以下关于线性回归的判断,正确的个数是( )①若散点图中所有点都在一条直线附近,则这条直线为回归直线 ②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点 ③已知回归直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69 ④回归直线方程的意义是它反映了样本整体的变化趋势A.0 B.1 C.2 D.3解析:能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有用最小二乘法求得的直线=x+才是回归直线,所以①不正确,②正确;当x=25时,=0.50×25-0.81=11.69,故③正确;由回归方程的意义知④正确.答案:D7.下面的等高条形图可以说明的问题是( )A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的
B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C.此等高条形图看不出两种手术有什么不同的地方D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握解析:由等高条形图知,这两种手术虽有不同,但差别不大,因此应选D.答案:D8.(2019·邯郸月考)已知变量x和y的统计数据如下表:x12345y1201051009085根据上表可得回归直线方程为=-8.5x+125.5,则当x=4时,y的残差为( )A.1.5B.-1.5C.2D.-2解析:当x=4时,=-8.5×4+125.5=91.5,所以残差=y-=90-91.5=-1.5,故选B.答案:B9.(2019·南安月考)如图所示,5组数据(x,y)中去掉D(3,10)后,下列说法错误的是( )A.残差平方和变大B.相关系数r变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:去掉D(3,10)后,解释变量x与预报变量y的相关性变强,相关系数r
变大,相关指数R2变大,B、C、D正确,故选A.答案:A10.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.其中一定不正确的结论的序号是( )A.①②B.②③C.③④D.①④答案:D11.两个分类变量X和Y的值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35,若X与Y有关系的可信程度不小于97.5%,则c等于( )附:P(K2≥k0)0.050.025k03.8415.024A.3B.4C.5D.6解析:2×2列联表如下:x1x2合计y1102131y2cd35合计10+c21+d66∴K2==≥5.024.将A,B,C,D代入验证可知选A.答案:A
12.某工科院校对A,B两个专业的男、女生人数进行调查统计,得到以下表格:专业A专业B合计女生12男生4684合计50100如果认为工科院校中“性别”与“专业”有关,那么犯错误的概率不会超过( )A.0.005B.0.01C.0.025D.0.05注:K2=P(K2>k0)0.100.050.0250.0100.005k02.7063.8415.0246.6357.879解析:将列联表补充完整如下:专业A专业B合计女生12416男生384684合计5050100∴K2=≈4.762>3.841,∴认为工科院校中,“性别”与“专业”有关,犯错误的概率不超过0.05.答案:D第Ⅱ卷(非选择题,共90分)二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中横线上)13.下列说法正确的有________.①若r>0,则x增大时,y也相应增大;②若r0时,x与y正相关,y随x的增大而增大,故①正确,②不正确;当|r|=1时,x与y是函数关系,故③正确.答案:①③14.(2019·定远月考)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.809,则最高有________(填百分数)的把握认为“学生性别与是否支持该活动有关系”.附表:P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828解析:由K2=7.809>6.635,∴有99%的把握认为“学生性别与是否支持该活动有关系”.答案:99%15.已知变量x,y之间的回归直线方程为=bx+a(a>0,b>0),且样本点的中心为(4,1),则+的最小值是________.解析:∵由题意得4b+a=1,∴+=(4b+a)=++5≥2+5=9当且仅当=,即a=2b=,b=时等号成立.答案:916.下列命题中,正确的命题有________.①回归直线=x+恒过样本点的中心(,),且至少过一个样本点;②将一组数据的每个数据都加一个相同的常数后,方差不变;③用相关指数R2来刻画回归效果,表示预报变量对解释变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若分类变量X和Y的随机变量K2的观测值k越大,则“X与Y相关”的可信程度越小;⑤对于自变量x和因变量y,当x取值一定时,y的取值具有一定的随机性,x,y间的这种非确定关系叫做函数关系;
⑥残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适;⑦两个模型中残差平方和越小的模型拟合的效果越好.解析:①回归直线=x+恒过样本点的中心(,),可以不过任何一个样本点;②将一组数据中的每个数据都加上同一个常数后,根据方差公式可知方差恒不变;③用相关指数R2来刻画回归效果,表示解释变量对预报变量变化的贡献率,越接近于1,说明模型的拟合效果越好;④若随机变量K2的观测值k越大,则“X与Y相关”的可信程度越大;⑤x,y间的这种非确定关系叫做相关关系;⑥残差图中残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;⑦两个模型中残差平方和越小的模型拟合的效果越好.故正确的有②⑥⑦.答案:②⑥⑦三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)17.(10分)(2019·宁夏育才中学月考)2018年8月16日,中共中央政治局常务委员会召开会议,听取关于吉林长春长生公司问题疫苗案件调查及有关问责情况的汇报,中共中央总书记习近平主持会议并发表重要讲话.会议强调,疫苗关系人民群众健康,关系公共卫生安全和国家安全.因此,疫苗行业在生产、运输、储存、使用等任何一个环节都容不得半点瑕疵,国家规定,疫苗在上市前必须经过严格的检测,并通过临床实验获得相关数据,以保证疫苗使用的安全和有效.某生物制品研究所将某一型号疫苗用在动物小白鼠身上进行科研和临床实验,得到统计数据如下:未感染病毒感染病毒总计未注射疫苗40px注射疫苗60qy总计100100200
现从未注射疫苗的小白鼠中任取1只,取得“感染病毒”的小白鼠的概率为.(1)求2×2列联表中的数据p,q,x,y的值;(2)能否有99.9%把握认为注射此种疫苗有效?解:(1)∵从未注射疫苗的小白鼠中任取1只,取得“感染病毒”的小白鼠的概率为,则未感染的概率为,即x=40,解得x=100,∴p=100-40=60,q=100-60=40,y=100.(2)由列联表中数据,计算K2==8