专题二十 统计与统计案例(解析版)-2021届高三《新题速递 数学》5月刊(江苏专用 适用于高考复习)
加入VIP免费下载
加入VIP免费下载
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天资源网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:403074932
资料简介
专题二十 统计与统计案例 一、单选题 1.(2021·山东济南市·高三二模)第 24 届冬季奥林匹克运动会将于 2022 年在北京举办.为了解某城市居民 对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下 2 2 列联表. 男 女 合计 关注冰雪运动 35 25 60 不关注冰雪运动 15 25 40 合计 50 50 100 根据列联表可知( ) 参考公式:        2 2 n ad bcK a b c d a c b d      ,其中 n a b c d    . 附表:  2 0P K k 0.100 0.050 0.010 0.001 0k 2.706 3.841 6.635 10.828 A.该市女性居民中大约有5%的人关注冰雪运动 B.该市男性届民中大约有95%的人关注冰雪运动 C.有95%的把握认为该市居民是否关注冰雪运动与性别有关 D.有99%的把握认为该市居民是否关注冰雪运动与性别有关 【答案】C 【分析】 计算出 2K 的观测值,结合临界值表可得出结论. 【详解】 由 2 2 列联表中的数据可得  2 2 35 25 15 25 100 4.167 3.84160 40 50 50K         , 因此,有95%的把握认为该市居民是否关注冰雪运动与性别有关. 故选:C. 2.(2021·湖北高三其他模拟)在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了 N 个学生( 100m,N m   N ),其中男女学生各半,男生中 60%表示喜欢该学科,其余表示不喜欢;女 生中 40%表示喜欢该学科,其余表示不喜欢.若有 99.9%把握认为性别与是否喜欢该学科有关,则可以推测 N 的最小值为( ) 附 2 2 ( ) ( )( )( )( ) n ad bcK a b c d a c b d      ,  2P K k… 0.050 0.010 0.001 k 3.841 6.635 10.828 A.400 B.300 C.200 D.100 【答案】B 【分析】 根据题目列出 2 2 列联表,再根据列联表的数据计算 2K 值,进而得到关于 m 的关系式,求解即可. 【详解】 由题可知,男女各 50m人,列联表如下: 喜欢 不喜欢 总计 男 30m 20m 50m 女 20m 30m 50m 总计 50m 50m 100m  22 2 2 4 100 900 400 = 450 50 50 50 m m m K mm     ,  有 99.9%把握认为性别与是否喜欢该学科有关, 4 10.828m  ,解得 2.707m  , m  N , 3m  , min 300N  . 故选:B 3.(2021·辽宁高二期中)利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查 200 名高中生是否爱好某项运动,利用 2 2 列联表,由计算可得 2 7.236K  ,参照下表:得到的正确结论 是( )  2 0P K k 0.1 0.05 0.01 0.005 0.001 k 2.706 3.841 6.635 7.879 10.828 A.有 99%以上的把握认为“爱好该项运动与性别无关” B.有 99%以上的把握认为“爱好该项运动与性别有关” C.在犯错误的概率不超过 0.5%的前提下,认为“爱好该项运动与性别有关" D.在犯错误的概率不超过 0.5%的前提下,认为“爱好该项运动与性别无关” 【答案】B 【分析】 由已知的 2 7.236K  ,对比临界值表可得答案 【详解】 解:因为 2 7.236 6.635K   , 所以有 99%以上的把握认为“爱好该项运动与性别有关”. 故选:B. 4.(2021·宁夏银川市·高三其他模拟(理))下列正确命题的序号有( ) ①若随机变量  ~ 100,X B p ,且   20E X  ,则 1 1 52D X       . ②在一次随机试验中,彼此互斥的事件 A ,B ,C ,D 的概率分别为 0.2 ,0.2 ,0.3,0.3,则 A 与 B C D  是互斥事件,也是对立事件. ③一只袋内装有 m 个白球,n m 个黑球,连续不放回地从袋中取球,直到取出黑球为止,设此时取出了 个白球,     2 32 m n n m AP A    . ④由一组样本数据 1 1,x y , 2 2,x y ,… ,n nx y 得到回归直线方程 y bx a  ,那么直线 y bx a  至少 经过 1 1,x y , 2 2,x y ,… ,n nx y 中的一个点. A.②③ B.①② C.③④ D.①④ 【答案】A 【分析】 直接利用二项分布的期望与方差,互斥事件和对立事件的关系,排列组合,回归直线方程等相关知识对四 个命题的真假判断. 【详解】 对于①:由  100,X B p ,且   20E X  可得 1100 20 5p p   ,所以   1 1100 1 165 5D X         , 则  11 42 4 XD D X      ,故①错; 对于②:因为事件 A 、B 、C 、D 彼此互斥,所以   0.2 0.3 0.3 0.8P B C D      ,又   0.2P A  , 所以, A 与 B C D  是互斥事件,也是对立事件,故②正确; 对于③:依题意, 2  表示“一共取出了 3 个球,且前两次取出的都是白球,第三次取出的是黑球”. 因为 袋内共有 m n m n   个球,从中任取 3 个球共有 3 nA 种不同的方法,“前两次取出的都是白球,第三次取 出的是黑球”有  2 mn m A 种不同的方法,所以     2 32 m n n m AP A    ,故③正确; 对于④:回归直线方程一定过样本中心点 ,x y ,但是不一定经过样本数据中的点,故④错. 故选:A. 5.(2021·湖南高三月考)某种产品的广告支出费用 x (单位:万元)与销售量 y (单位:万件)之间的对 应数据如下表所示: 广告支出费用 x 2.2 2.6 4.0 5.3 5.9 销售量 y 3.8 5.4 7.0 11.6 12.2 根据表中的数据可得回归直线方程  2.27 1.08y x  , 2 0.96R  ,以下说法正确的是( ) A.第三个样本点对应的残差 3 1e   ,回归模型的拟合效果一般 B.第三个样本点对应的残差 3 1e  ,回归模型的拟合效果较好 C.销售量 y 的多少有 96% 是由广告支出费用引起的 D.销售量 y 的多少有 4% 是由广告支出费用引起的 【答案】C 【分析】 由题意得  3 7 2.27 4 1.08 1e       ,与 2 0.96R  作比较可判断 A,B; 销售量 y 的多少有 96% 是由广告支出费用引起的可判断 C D. 【详解】 由题意得  3 7 2.27 4 1.08 1e       , 由于 2 0.96R  ,所以该回归模型拟合的效果比较好,故 A,B 错误; 在线性回归模型中 2R 表示解释变量对于预报变量的贡献率, 2 0.96R  ,则销售量 y 的多少有 96% 是由广 告支出费用引起的,C 正确,D 错误. 故选:C. 6.(2021·全国高三其他模拟)2020 年 4 月,“一盔一带”安全守护行动在全国各地展开.某地交警部门加强执 法管理期间,对某路口不带头盔的骑行者进行了统计,得到如下数据(其中 y 表示第 x 天不戴头盔的人数): x 1 2 4 8 y 115 49 32 5 若 y 关于 x 的回归方程为  120y a x   ,则 a ( ) A. 4 B. 4 C. 6 D. 6 【答案】D 【分析】 设 1t x  ,则回归方程为 120y a t  ,分别计算t 和 y ,代入回归方程可计算 a 的取值. 【详解】 由题意:设 1t x  ,则 y 关于t 的回归方程为 120y a t  ,易知 1 1 1 1 1514 2 4 8 32t          ,  1 201115 49 32 54 4y       ,所以 201 15120 64 32a      . 故选:D. 【点睛】 思路点睛:(1)非线性回归方程需借助运算关系进行转化,转化为线性回归方程;(2)线性回归方程中点  ,x y 必在回归直线上. 7.(2021·山东临沂市·高三二模)在天文学上恒星的亮度一般用星等来表示,直接测量到的天体亮度被称为 视星等 m ,而把天体置于 10 秒差距的距离处所得到的视星等称为绝对星等 M ,它能反映天体的发光本 领.如果我们观测到了恒星的光谱,可以知道一些类型恒星的绝对星等,就可以利用光谱视差法来获得这 些恒星的距离.下表是某校天文爱好者社团在网上收集到一些恒星的相关数据,那么最适合作为星等差 y 关 于距离 x (光年)的回归方程类型的是( ) 星名 天狼星 南河三 织女星 大角星 五车二 水委一 老人星 参宿四 距离 x 8.6 11.46 25 36.71 42.8 139.44 309.15 497.95 y m M  2.89 2.27 0.57 0.26 0.59 3.15 4.88 5.92 A. 2y a bx  B. lg y a b x C. y a b x  D. y a bx  【答案】B 【分析】 由表格数据在直角坐标系中标注点坐标,勾画出大概图象,对比 2 ,lg , ,x x x x 的图象,即可知其回归方程 类型. 【详解】 根据表格数据,在直角坐标系中从左至右依次标注表格数据代表的点,拟合曲线如下图示, 图象左侧无限靠近 y 轴,不与 y 轴相交,故其拟合曲线比较接近 lgy x 的图象, 故选:B. 二、多选题 8.(2021·辽宁高二期中)已知由样本数据点集合   , 1,2, ,i ix y i n ∣ ,求得的回归直线方程为 1.5 0.5y x  ,且 3x  ,现发现两个数据点(1.2,2.2)和(4.8, 7.8) 误差较大,去除后重新求得的回归直 线l 的斜率为 1.2,则( ) A.变量 x 与 y 具有正相关关系 B.去除后 y 的估计值增加速度变快 C.去除后l 方程为 1.2 1.4y x  D.去除后相应于样本点 2,3.75 的残差平方为 0.0025 【答案】ACD 【分析】 根据题意可得原始数据中 3x  , 5y  ,由两个数据点(1.2,2.2)和(4.8,7.8)的平均数为 3 和 5,因此可得 到 3x  , 5y  仍然成立,代入直线方程 1.2y x b  求得 1.4b  ,接着依次判断选项即可. 【详解】 由样本数据点集合   , 1,2, ,i ix y i n ∣ , 回归直线方程为 1.5 0.5y x  ,且 3x  ,得到 5y  , 去除掉两个数据点(1.2,2.2)和(4.8,7.8), 因为 1.2 4.8 2.2 7.83, 52 2    , 所以去除掉两个数据点后, 3x  , 5y  仍然成立, 因为直线方程 1.2y x b  ,将 3x  , 5y  代入求得 1.4b  ; 故 A 选项正确;因为1.2 1.5 ,所以 B 选项错误;由上知 C 选项正确; 去除后,当 2x  , 3.8y  相应于样本点 2,3.75 的残差平方为  23.8 3.75 0.0025  ,故 D 选项正确; 故选:ACD. 【点睛】 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线 性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个 预报值,而不是真实发生的值. 9.(2021·辽宁丹东市·高三二模)晚上睡眠充足是提高学习效率的必要条件,河北衡水某高中的高三年级学 生晚上 10 点 10 分必须休息,另一所同类高中的高三年级学生晚上 11 点休息,并鼓励学生还可以继续进行 夜自习,稍晚再休息.有关人员分别对这两所高中的高三年级学习总成绩前 50 名学生的学习效率进行问卷 调查,其中衡水某高中有 30 名学生的学习效率高,且从这 100 名学生中随机抽取 1 人,抽到学习效率高的 学生的概率是 0.4,则( ) 附:        2 2 n ad bcK a b a c b d c d      ,  2 0P K k 0.050 0.010 0.005 0.001 0k 3.841 6.635 7.879 10.828 A.衡水某高中的前 50 名学生中有 60%的学生学习效率高 B.另一所同类高中的前 50 名学生中有 40%的学生学习效率高 C.有 99.9%的把握认为“学生学习效率高低与晚上睡眠是否充足有关” D.认为“学生学习效率高低与晚上睡眠是否充足有关”的犯错概率超过 0.05 【答案】AC 【分析】 先根据题意求出每一所学校中前 50 名学生中学习效率高的人数,再列出列联表,通过计算就可以对选项作 出判断. 【详解】 设这 100 名学生中学习效率高的人数有 n 人,由题意有 0.4100 n  ,得 40n  . 所以某高中的 50 名学生中有 30 人学习效率高,另一所同类高中的 50 名学生中有 10 人学习效率高,所以 某高中的前 50 名学生中有 30 60%50  的学生学习效率高,故选项 A 正确,另一所同类高中的前 50 名学生中 有 10 20%50  学习效率高,故选项 B 不正确. 根据以上数据得到所下的列联表: 学校晚上休息时间 学习效率高人数 学习效率不高人数 总计 某高中 30 20 50 另一所同类高中 10 40 50 总计 40 60 100 2 2 100 (30 40 20 10) 16.667 10.82840 60 50 50K         , 所以选项 C 正确,选项 D 不正确. 故选:AC. 第 II 卷(非选择题) 三、解答题 10.(2021·千阳县中学高三其他模拟(理))改革开放 40 年间,中国共减少贫困人口 8.5 亿多人,对全球减 贫贡献率超 70%,创造了世界减贫史上的“中国奇迹”.某中学“数学探究”小组为了解某地区脱贫成效,从 1500 户居民(其中平原地区 1050 户,山区 450 户)中,采用分层抽样的方法,收集了 150 户家庭的 2019 年人均纯 收入(单位:万元)作为样本数据. (1)应收集山区家庭的样本数据多少户? (2)根据这 150 个样本数据,得到该地区 2019 年家庭人均纯收入的频率分布直方图(如图所示),其中样本 数据分频率组距组区间为 0,0.5 , 0.5,1 , 1,1.5 , 1.5,2 , 2,2.5 , 2.5,3 .若该地区家庭人均纯收 入在 8000 元以上,称为“小康之家”,如果将频率视为概率,估计该地区 2019 年“小康家庭收入(万元)之家” 的概率; (3)样本数据中,有 5 户山区家庭的人均纯收入超过 2 万元,请完成“2019 年家庭人均纯收入与地区类型” 的列联表,并判断是否有 90%的把握认为“该地区 2019 年家庭年人均纯收入与地区类型有关”? 超过 2 万元 不超过 2 万元 总计 平原地区 山区 5 总计 附 2 2 ( ): ( )( )( )( ) n ad bcK a b c d a c b d       2 0P K k 0.100 0.050 0.010 0.001 0k 2.706 3.841 6.635 10.828 【答案】(1) 45 (户);(2) 0.83;(3)列联表答案见解析,有 90%的把握认为“该地区 2019 年家庭年人均 纯收入与地区有关”. 【分析】 (1)求得平原地区与山区的比为:1050 21=450 9 ,进而求得在 150 户家庭中选山区家庭; (2)记 2019 年家庭人均纯收入为ξ万元,求得相应的概率,即可得到该地区 2019 年“小康之家”的概率. (3)由直方图得到 2 2 联络表,根据公式,求得 2K 的值,结合附表,即可得到结论. 【详解】 (1)由题意,平原地区与山区的比为:1050 21=450 9 , 在 150 户家庭中,应选山区家庭为 9150 4530   (户). (2)记 2019 年家庭人均纯收入为ξ万元, 则 3( 0.8) (0.1 0.4) 0.5 0.175P        , 0.8 1 0( ) ( ).8 1 0.17 0.83P P        . 估计该地区 2019 年“小康之家”的概率为 0.83. (3)由直方图知,150 户家庭的 2019 年人均纯收入在 2 万元以上的概率为:  0.3 0.1 0.5 0.2   ,即超过 2 万元的家庭有 30 户, 可得如下的 2 2 联络表: 超过 2 万元 不超过 2 万元 总计 平原地区 25 80 105 山区 5 40 45 总计 30 120 150 则 2 2 150(25 40 80 5) 5400 3.1746 2.70630 120 45 105 1701K         . 所以有 90%的把握认为“该地区 2019 年家庭年人均纯收入与地区有关”. 11.(2021·四川高三三模(理))某城市为改善保障性租赁住房的品质,对保障性租赁住房进行调研,随机 抽取了 200 名保障性租赁住房的租赁人进行问卷调查,并对租赁房屋的品质进行满意度测评,收集整理得 到如下 2 2 列联表: 30岁及以下 30岁以上 小计 满意 60 110 不满意 30 小计 (1)完成上述列联表;通过计算判断是否有90%的把握认为租赁人对保障性租赁住房品质的满意程度与年 龄段(“30岁及以下”和“30岁以上”)有关系? (2)现从满意度评分为“不满意”的人中按照表中年龄段分层抽取了 6名租赁人进行座谈.若从这 6人中随 机抽取3人给予一定的租赁优惠,记“所抽取的3人中年龄在30岁及以下”的人数为 ,求 的分布列和数学 期望. 附表及公式:        2 2 n ad bcK a b c d a c b d       2 0P K k 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 【答案】(1)填表见解析,有;(2)分布列见解析,期望为 2 . 【分析】 (1)根据题中信息可完善 2 2 列联表,计算出 2K 的观测值,结合临界值表可得出结论; (2)由题意可知随机变量 的可能取值有1、2 、3,计算出随机变量 在不同取值下的概率,可得出随机 变量 的分布列,进而可计算得出  E  的值. 【详解】 (1)列联表如下: 30岁及以下 30岁以上 小计 满意 60 50 110 不满意 60 30 90 小计 120 80 200 由题得  2 2 200 60 30 60 50 100 3.0303 2.706110 90 80 120 33K         , 所以,有90%的把握认为租赁人对保障性租赁住房品质的满意程度与年龄段有关系. (2)所抽取的 6人中,30岁及以下有 4 人, 30岁以上有 2 人. 可知 的可能值为1、 2 、3,   1 2 4 2 3 6 11 5 C CP C     ,   2 1 4 2 3 6 32 5 C CP C     ,   3 0 4 2 3 6 4 13 20 5 C CP C      , 所以,随机变量 的分布列为:  1 2 3 P 1 5 3 5 1 5 所以, 数学期望 1 3 11 2 3 25 5 5E        . 【点睛】 思路点睛:求解随机变量分布列的基本步骤如下: (1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率; (3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公 式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率. 12.(2021·全国高三月考(文))近几年,随着大众鲜花消费习惯的转变,中国进入一个鲜花消费的增长期. 根据以往统计,某地一鲜花店销售某种 B 级玫瑰花,在连续统计的 320 天的玫瑰花售卖中,每天的玫瑰花 的销售量(单位:支)与特殊节日的天数如下表: 非特殊节日的天数 特殊节日的天数 总计 销售量在[120,160]内的 天数 160 销售量在 (160,200]内 的天数 10 40 总计 170 320 (1)填写上表,判断是否有 99%的把握认为“每天的玫瑰花的销售量与特殊节日有关”? (2)若按分层抽样的方式,从上述表格的特殊节日中抽取 5 天作为一个样本,再从这个样本中抽取 2 天加 以分析研究,求这两天玫瑰花的销售量在[120,160]内的概率. 附: 2 2 ( ) ( )( )( )( ) n ad bcK a b c d a c b d      ,其中 n a b c d    .  2P K k 0.050 0.010 0.001 k 3.841 6.635 10.828 【答案】(1)填表答案见解析,有 99%的把握认为“每天的玫瑰花的销售量与特殊节日有关”;(2) 3 5 . 【分析】 (1)先完善列联表,再由公式求解 2K ,对照临界值表,得出答案. (2) 根据分层抽样,抽取销售量在[120,160]内的特殊节日的天数,列出从中抽取 2 天的结果和这两天玫瑰 花的销售量在[120,160]内的结果,从而得出答案. 【详解】 (1)填表如下: 非特殊节日的天数 特殊节日的天数 总计 销售量在[120,160]内的 天数 160 120 280 销售量在 (160,200]内 的天数 10 30 40 总计 170 150 320 2 2 320 (160 30 120 10) 14.521 6.635170 150 40 280K         , 故有 99%的把握认为“每天的玫瑰花的销售量与特殊节日有关”. (2)根据分层抽样,抽取销售量在[120,160]内的特殊节日有 4 天,记为 A , B ,C , D , 销售量在 (160,200]内的特殊节日有 1 天,记为 a , 则从中抽取 2 天的结果为 ( , )A B , (A,C) , ( , )A D , (A,a) , ( , )B C , ( , )B D , ( ,a)B , ( , )C D , (C,a) , ( , )D a ,共 10 种. 其中这两天玫瑰花的销售量在[120,160]内的结果有 ( , )A B , (A,C) , ( , )A D , ( , )B C , ( , )B D , ( , )C D ,共 6 种, 所以所求概率为 6 3 10 5  . 13.(2021·千阳县中学高三其他模拟(理))2017 年 8 月 27 日~9 月 8 日,第 13 届全运会在天津举行.4 年后, 第 14 届全运会将于 2021 年 9 月 15 日~27 日在西安举行.为了宣传全运会,西安某大学在天津全运会开幕后 的第二天,从全校学生中随机抽取了 120 名学生,对是否收看天津全运会开幕式情况进行了问卷调查,统 计数据如下: 收看 没收看 男生 60 20 女生 20 20 (1)根据右表说明,能否有 99%的把握认为,学生是否收看开幕式与性别有关? 附: 2 2 ( ) ( )( )( )( ) n ad bcK a b c d a c b d      ,其中 n a b c d    .  2 0P K k 0.10 0.05 0.025 0.01 0.005 0k 2.706 3.841 5.024 6.635 7.879 (2)现从参与问卷调查且收看了开幕式的学生中,采用按性别分层抽样的方法选取 8 人,参加 2021 年西 安全运会志愿者宜传活动.若从这 8 人中随机选取 2 人到校广播站开展全运会比赛项目宣传介绍, ①求在 2 人中有女生入选的条件下,恰好选到一名男生一名女生的概率; ②记 X 为入选的 2 人中的女生人数,求随机变量 X 的分布列及数学期望. 【答案】(1) 有 99%的把握认为,收看开幕式与性别有关;(2)①12 13 ;②答案见解析. 【分析】 (1)根据题意计算 2 7.5 6.635K   ,故有 99%的把握认为,收看开幕式与性别有关; (2)①根据题意,选取的 8 人中,男生 6人,女生 2 人,进而根据条件概率求解即可; ②根据题意, X 服从超几何分布,进而根据超几何分布求解即可. 【详解】 解:(1)因为  2 2 120 60 20 20 20 7.5 6.63580 40 80 40K         , 所以有 99%的把握认为,收看开幕式与性别有关. (2)①根据分层抽样方法得,选取的 8 人中,男生 3 8 64   人,女生 1 8 24   人, 记事件 A  “选出的两人中有女生”,共有 2 2 8 6 13C C  或 2 1 1 2 6 2 13C C C  种不同的选法, B  “选出的两人为一名男生、一名女生”,共有 1 1 6 2 12C C  种不同的选法, 则       1 1 1 1 6 2 6 2 2 2 2 1 1 8 6 2 6 2 12 13 n AB C C C CP B A n A C C C C C      ②根据题意, X 所有可能取值为 0,1,2   2 6 2 8 150 28 CP X C      1 1 6 2 2 8 12 31 28 7 C CP X C       2 2 2 8 12 28 CP X C    所以 X 的分布列为 X 0 1 2 P 15 28 3 7 1 28   15 12 1 14 10 1 228 28 28 28 2E X         (或 X 服从超几何分布, 8N  , 2M  , 2n  ,   2 12 8 2 ME X n N     .) 【点睛】 本题考查独立性检验,条件概率,超几何概型,考查运算求解能力,是中档题.本题第二问解题的关键在于 根据题意得选取的 8 人中,男生 6人,女生 2 人,进而 X 服从超几何分布,再根据超几何概型求解即可. 14.(2021·安徽高三其他模拟(文))随着工作压力的増大,很多家长下班后要么加班,要么抱着手机,陪 伴孩子的时间逐新减少,为了调査 A 地区家长陪伴孩子的时间,研究人员对 200 名家长一天陪伴孩子的时 间进行统计,所得数据统计如图所示. (1)求这 200 名家长陪伴孩子的平均时间(同一组中的数据用该组区间的中点值代表); (2)若按照分层抽样的方法从陪伴时间在 40,80 的家长中随机抽取 7 人,再从这 7 人中随机抽取 2 人, 求至少有 1 人陪伴孩子的时间在 60,80 的概率; (3)为了研究陪伴时间的多少与家长的性别是否具有相关性,研究人员作出统计如下表所示,判断是否有 99%的把握认为陪伴时间的多少与家长的性别有关. 男性 女性 陪伴时间少于 60 分钟 50 30 陪伴时间不少于 60 分钟 50 70 附:        2 2 n ad bcK a b c d a c b d      ,  n a b c d    .  2 0P K k 0.100 0.050 0.010 0.001 0k 2.706 3.841 6.635 10.828 【答案】(1) 64 分钟;(2) 6 7 ;(3)有  99% 的把握认为陪伴时间的多少与家长的性别有关. 【分析】 (1)由频率分布直方图估计平均数的方法可直接求得结果; (2)根据频率分布直方图计算可得分数在 40,60 的抽取3人,在 60,80 的抽取 4 人,采用列举法,根据 古典概型概率公式可求得结果; (3)根据公式计算可求得 2 8.333 6.635K   ,由此可得结论. 【详解】 (1)这 200 名家长陪伴孩子的平均时间为 30 0.1 50 0.3 70 0.4 90 0.2 64        分钟. (2)由题意知:分数在 40,60 的抽取3人,记为1,2,3;分数在 60,80 的抽取 4 人,记为 , , ,A B C D , 则从中任取 2 人,所有的情况有:                        1,2 , 1,3 , 1, , 1, , 1, , 1, , 2,3 , 2, , 2, , 2, , 2, , 3, ,A B C D A B C D A                  3, , 3, , 3, , , , , , , , , , , , ,B C D A B A C A D B C B D C D ,共 21种; 其中满足条件的为:                       1, , 1, , 1, , 1, , 2, , 2, , 2, , 2, , 3, , 3, , 3, , 3, ,A B C D A B C D A B C D            , , , , , , , , , , ,A B A C A D B C B D C D ,共18 种; 所求概率 18 6 21 7P   . (3)由题意补充后的 2 2 列联表如下: 男性 女性 合计 陪伴时间少于 60 分钟 50 30 80 陪伴时间不少于 60 分钟 50 70 120 合计 100 100 200  2 2 200 50 70 30 50 8.333 6.635100 100 80 120K          , 有99%的把握认为陪伴时间的多少与家长的性别有关. 【点睛】 方法点睛:利用频率分布直方图估计众数、中位数和平均数的基本方法如下: (1)众数:最高矩形横坐标的中点; (2)中位数:将矩形总面积二等分的点的横坐标; (3)平均数:每个小矩形横坐标中点与对应矩形的面积的乘积的总和. 15.(2021·四川凉山彝族自治州·高三三模(理))某品牌汽车 4S 店对 2020 年该市前几个月的汽车成交量进 行统计,用 y 表示 2020 年第 x 月份该店汽车成交量,得到统计表格如下: ix 1 2 3 4 5 6 7 8 iy 14 12 20 20 22 24 30 26 (1)求出 y 关于 x 的线性回归方程 ˆˆ ˆy bx a  ,并预测该店 9 月份的成交量;( ˆa , ˆb 精确到整数) (2)该店为增加业绩,决定针对汽车成交客户开展抽奖活动,若抽中“一等奖”获 5 千元奖金;抽中“二等奖” 获 2 千元奖金;抽中“祝您平安”则没有奖金.已知一次抽奖活动中获得“二等奖”的概率为 1 3 ,没有获得奖金 的概率为 1 6 .现有甲、乙两个客户参与抽奖活动,假设他们是否中奖相互独立,求此二人所获奖金总额 X (千元)的分布列及数学期望. 参考数据及公式: 8 1 850i i i x y   , 8 2 1 204i i x   ,      1 2 1 ˆ n i i i n i i x x y y b x x         , ˆ  a y bx . 【答案】(1) ˆ 2 12y x  ;预计 9 月份的成交量为 30 辆;(2)分布列见解析;期望为 19 3 . 【分析】 (1)先分别求出 ix , iy 的平均数 ,x y ,再利用最小二乘法计算即可得回归直线方程,取 x=9 可得成交量的预 测值; (2)写出随机变量 X 的所有可能值,再计算出 X 取各个值时的概率,列出分布列即可得解. 【详解】 (1)由题意得: 1+2+3+4+5+6+7+8 9=8 2x  , 14+12+20+20+22+24+30+26 =218y  , ∴ 8 1 8 2 22 1 98 850 8 21 942 29 42204 8 ( )8 2 i i i i i x y x y b x x                 ,∴  12a y b x    所以,回归直线方程为 ˆ 2 12y x  , ∴当 9x  时, ˆ 2 9 12=30y    ,即预计 9 月份的成交量为 30 辆; (2)由题意得:获得“一等奖”的概率为 1 2 , 所以 X 的可能取值为 0,2,4,5,7,10, ∴   1 1 10 6 6 36P X     ,   1 1 1 1 12 3 6 6 3 9P X       ,   1 1 14 3 3 9P X     ,   1 1 1 1 15 2 6 6 2 6P X       , ( ) 1 1 1 1 17 2 3 3 2 3P X = = ´ + ´ = ,   1 1 110 2 2 4P X     , 所以 X 的分布列为: X 0 2 4 5 7 10 P 1 36 1 9 1 9 1 6 1 3 1 4 ∴   1 1 1 1 1 1 190 2 4 5 7 1036 9 9 6 3 4 3E X              . 16.(2021·全国高三月考(文))中国是世界上沙漠化最严重的国家之一,沙漠化造成生态系统失衡,可耕 地面积不断缩小,对中国工农业生产和人民生活带来严重影响.随着综合国力逐步增强,西北某地区大力 兴建防风林带,引水拉沙,引洪淤地,开展了改造沙漠的巨大工程,该地区于 2017 年投入沙漠治理经费 2 亿元,从 2018 年到 2020 年连续 3 年每年增加沙漠治理经费 1 亿元,近 4 年沙漠治理经费投入 x(亿元)和 沙漠治理面积 y (万亩)的相关数据如下表所示: 年份 2017 2018 2019 2020 x 2 3 4 5 y 26 39 49 54 (1)通过绘制散点图看出,可用线性回归模型拟合 y 与 x 的关系,请用相关系数加以说明;(结果保留 3 位小数) (2)建立 y 关于 x 的回归方程; (3)若保持以往的沙漠治理经费增加幅度,请预测到哪一年沙漠治理面积突破 100 万亩. 参考数据:  4 2 1 21.4i i y y    , 5 2.2 ; 参考公式:相关系数        1 2 2 1 1 n i i i n n i i i i x x y y r x x y y            ,      1 2 1 n i i i n i i x x y y b x x          , a y bx   . 【答案】(1)答案见解析;(2) ˆ 9.4 9.1y x  ;(3)到 2025 年沙漠治理面积可突破 100 万亩. 【分析】 (1)根据数据,求得 ,x y ,再分别求得    4 1 i i i x x y y    、   4 2 1 i i x x   ,代入公式,即可求得相关系 数 r,分析即可得答案. (2)将数据代入公式,即可求得b ,进而可得 a ,即可得答案. (3)当 9x  ,求得 ˆ 93.7 100y   ,当 10x  时, ˆ 103.1 100y   ,即可得答案. 【详解】 (1)由已知数据和参考数据得 2 3 4 5 3.54x     , 26 39 49 54 424y     ,    4 1 ( 1.5)( 16) ( 0.5)( 3) 0.5 7 1.5 12 47i i i x x y y               ,   4 2 2 2 2 2 1 ( 1.5) ( 0.5) 0.5 1.5 5i i x x          ,则  4 2 1 2.2i i x x    所以 47 0.9982.2 21.4r   . 因为 y 与 x 的相关系数近似为 0.998,说明 y 与 x 的线性相关程度相当高, 从而可以用线性回归模型拟合 y 与 x 的关系. (2)      1 2 1 47 9.45 n i i i n i i x x y y b x x            ,  42 9.4 3.5 9.1a y bx     = . 所以回归方程为 ˆ 9.4 9.1y x  . (3)当 9x  时, ˆ 9.4 9 9.1 93.7 100y      , 当 10x  时, ˆ 9.4 10 9.1 103.1 100y      , 所以到 2025 年沙漠治理面积可突破 100 万亩. 17.(2021·黑龙江哈尔滨市·高三其他模拟(理))2021 年 4 月 23 日我校高三学生参加了高考体 检,为了解我校高三学生中男生的体重 y (单位: kg )与身高 x (单位: cm)是否存在较好的线性关系,体检 机构搜集了 7 位我校男生的数据,得到如下表格: 序号 1 2 3 4 5 6 7 身高 x ( cm) 166 180 174 183 178 173 185 体重 y ( kg ) 57 67 59 75 71 62 78 根据表中数据计算得到 y 关于 x 的线性回归方程为 ˆ ˆ1.15y x a  . (1)求 a ; (2)已知     2 2 1 2 1 ˆ 1 n i i i n i i y y R y y         ,且当 2 0.9R  时,回归方程的拟合效果非常好;当 20.8 0.9R  时, 回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.( 2R 的结果保 留到小数点后两位) 参考数据:   7 2 1 ˆ 52.36i i i y y    . 【答案】(1) 136.55 ;(2)该线性回归方程的拟合效果是良好的,理由见解析. 【分析】 (1)根据数据,求得 x ,  y ,代入回归直线方程,即可求得 a . (2)根据(1),先求得   7 2 1 i i y y   ,结合题中所给数据,代入 2R 公式,可求得 2R 的值,即可得答案. 【详解】 (1)由题中数据可得: 166+180+174+183+178+173+185 =1777x  , 57+67+59+75+71+62+78 7  =67y  所以  1.15 67 1.15 177 136.55a y x       . (2)   7 2 2 2 2 2 2 2 1 ( 10) 0 ( 8) 8 4 ( 5) 11 407i i y y              所以 2 52.361 0.87 0.9407R     所以该线性回归方程的拟合效果是良好的 18.(2021·四川广元市·高三三模(理))广元某中学调查了该校某班全部 40 名同学参加棋艺社团和武术社 团的情况,数据如下表:(单位:人) 参加棋艺社团 未参加棋艺社团 参加武术社团 8 10 未参加武术社团 7 15 (1)能否有95%的把握认为参加棋艺社团和参加武术社团有关? (2)已知既参加棋艺社团又参加武术社团的8 名同学中,有3名男同学,5名女同学.现从这 3名男同学, 5名女同学中随机选 5人参加综合素质大赛,求被选中的女生人数 X 的分布列和期望. 附:        2 2 n ad bcK a b c d a c b d       2 0P K k 0.10 0.05 0.025 0k 2.706 3.841 5.024 【答案】(1)没有;(2)分布列见解析;期望为 25 8 . 【分析】 (1)计算 2K 的观测值,结合临界值表可得出结论; (2)由题意可知,随机变量 X 的可能取值有 2 、3、4 、5,计算出随机变量 X 在不同取值下的概率,可 得出随机变量 X 的分布列,进而可求得随机变量 X 的数学期望. 【详解】 (1)由  2 2 8 15 7 10 40 2500 40 0.673415 25 22 18 15 25 22 18K             , 则 2 3.841K  ,所以没有95%的把握认为参加棋艺社团和参加武术社团有关; (2)由题意可知,随机变量 X 的可能取值有可 2 、3、 4 、5.   2 5 5 8 5 282 CP X C    ,   2 3 3 5 5 8 15 283 C CP X C    ,   1 4 3 5 5 8 154 56 C CP X C    ,   5 5 5 8 15 56 CP X C    所以,随机变量 X 的分布列为: X 2 3 4 5 P 5 28 15 28 15 56 1 56 因此,   5 15 15 1 252 3 4 528 28 56 56 8E X          . 【点睛】 方法点睛:求离散型随机变量均值与方差的基本方法: (1)已知随机变量的分布列求它的均值、方差,按定义求解. (2)已知随机变量 X 的均值、方差,求 X 的线性函数Y aX b  的均值、方差,可直接用 X 的均值、方 差的性质求解; (3)如果所给随机变量是服从常用的分布(如两点分布、二项分布等),利用它们的均值、方差公式求解. 19.(2021·四川德阳市·高三三模(文))为了更好的开展高中数学综合实践课的教学,结合高中数学与物理 紧密联系的特点,某高级中学数学组与物理组进行联合教学实践活动,在一次实践活动中,某班学生分成 五组进行物理实验(研究某物理现象中两个物理量 x 、 y 之间的关系),得到五组数据如下表所示 组号 1 2 3 4 5 物理量 x 12 11 13 10 9 物理量 y 27 25 29 24 20 (1)为了减少一定的运算量,同学们决定用前三组的数据研究两个物理量 x 、 y 的线性回归方程,并由该回 归方程预估第 4,5 组物理量 y 的值,若产生的残差的绝对值不超过 1,则认为本次实践活动成功,请问本 次实践活动是否成功?并说明理由; (2)老师打算从这五组学生中随机选取两组学生进行校本科研课题《数学与物理深度融合研究》的问卷调 查,记组号差的绝对值为 X ,求随机事件“ 2X  ”发生的概率. 参考公式:      1 22 1 1 2 1 n i i i nn i n i i i i i i x y nxy b n x x xx y xx y                 , b y bx   . 【答案】(1)本次实践活动是成功的,理由见解析;(2) 3 10 . 【分析】 (1)结合题目给出的数据求出线性回归方程,算出残差的绝对值与 1 比较即可. (2)用列举法写出基本事件总数,找出满足条件的基本事件个数,用古典概型概率计算公式计算出概率. 【详解】 (1)由题意知 12x  , 27y  所以:      3 1 3 2 1          i i i i i x x y y b x x               2 2 2 11 12 25 27 12 12 27 27 13 12 29 27 2 11 12 12 12 13 12               27 2 12 3b y bx       所以回归方程为:  2 3y x  当 10x  时  2 10 3 23y     ,  1 1y y   ; 当 9x  时  2 9 3 21y     ,  1 1y y   所以本次实践活动是成功的. (2)该随机试验的基本事件有 12,13,14,15,23,24,25,34,35,45 共 10 个. 随机事件“ 2X  ”含有的基本事件有 13,24,35 共 3 个. 故所求概率为 3 10 . 【点睛】 易错点睛: (1)在计算线性回归方程时,一定要确保计算正确,因为一旦计算失误可能会影响后面的题目的解答,考 试中很多回归方程的试题第二问往往需要用到第一问计算出的回归方程去处理,所以务必要计算准确! (2)处理古典概型类的题目时,列举基本事件容易出现遗漏的情况,为了避免这种情况出现,列举基本事 件时一定要做到:确定列举的方法标准或找出列举的规律;如果分类家较多可以采用列表法,树状图法这 些列举方式;检查列举的结果,确保不重不漏. 20.(2021·宁夏银川市·高三三模(理))2016 年 1 月 1 日起全国统一实施全面两孩政策.为了解适 龄民众对放开生育二胎政策的态度,某市选取 70 后和 80 后作为调查对象,随机调查了 100 位,得到数据 如下表: 生二胎 不生二胎 合计 70 后 30 15 45 80 后 45 10 55 合计 75 25 100 (1)根据调查数据,判断是否有 90%以上的把握认为“生二胎与年龄有关”,并说明理由; 参考数据: 2( )P K k 0.15 0.10 0.05 0.025 0.010 0.005 k 2.072 2.706 3.841 5.024 6.635 7.879 (参考公式: 2 2 ( ) ( )( )( )( ) n ad bcK a b c d a c b d      ,其中 n a b c d    ) (2)以这 100 个人的样本数据估计该市的总体数据.且以频率估计概率,若从该市 70 后公民中(人数很多) 随机抽取 3 位.记其中生二胎的人数为 X ,求随机变量 X 的分布列和数学期望. 【答案】(1)有 90%以上的把握认为“生二胎与年龄有关”;(2)分布列见解析;2. 【分析】 (1)根据 2 2 列联表中数据计算 K2 的观测值即可得解; (2)先求出 100 个人的样本中,70 后生二胎的频率即可得对应概率,写出 X 的所有可能值,计算各个值的概 率即可得解. 【详解】 (1)依题意得 K2 的观测值: 2 2 100(30 10 45 15) 100 3.030 2.70675 25 45 55 33K         , 所以有 90%以上的把握认为“生二胎与年龄有关”; (2)100 个人的样本数据中,70 后公民生二胎的频率为 30 2 45 3  ,由此估计从该市 70 后公民中随机抽取 1 人, 生二胎的概率为 2 3 , 随机变量 X 的所有可能值为 0,1,2,3, 2(3, )3X B , 3 3 2 1( ) ( ) ( ) ( 0,1,2,3)3 3 k k kP X k C k     , 所以 1 2 4 8( 0) , ( 1) , ( 2) , ( 3)27 9 9 27P X P X P X P X        , 随机变量 X 的分布列为 X 0 1 2 3 P 1 27 2 9 4 9 8 27 X 的数学期望 1 2 4 8( ) 0 1 2 3 227 9 9 27E X          . 21.(2021·全国高三其他模拟)高品质示范高中建设是某省普通高中教育在星级评估基础上创设的引领性发 展项目,是顺应高中教育改革趋势、助推高中教育品质提升的重要工程.申报学校要想顺利通过高品质示 范高中的评估,必须经过以下几个环节的考核:第一是材料评审;第二是现场答辩;第三是准予立项;第 四是综合评价.其中评价结果分为“通过”“有条件通过”“不通过”三种.结果为“不通过”的学校取消立项;结 果为“有条件通过”的学校可以继续建设一年,一年后评估仍未达标的,取消立项.统计 60 所满足基本申报 条件的高中,其中准予立项率为 1 3 ,县中(学校所在位置为县城或县级市)率为 1 6 ,未准予立项且非县中 的学校有 35 所. (1)若满足基本申报条件的 3 所高中能通过前三个环节考核的概率均分别为 3 4 , 2 3 , 1 2 求恰有一所学校 准予立项的概率. (2)完成下面的 2 2 列联表,并判断是否有 90%的把握认为学校是否准予立项与学校是否是县中有关. 准予立项 为准予立项 合计 县中 非县中 合计 (3)经统计,准予立项的学校中有 70%被评估为“通过”,10%被评估为“有条件通过”,一年后“有条件通过” 的学校中有 50%被重新评估为“通过”.从这 60 所学校中任取 2 所学校,用 X 表示最终被评估为“通过”的学 校数量,求 X 的分布列和数学期望. 附:        2 2 n ad bcK a b c d a c b d      ,其中 n a b c d    .  2 0P K k 0.50 0.40 0.25 0.15 0.10 0.05 0k 0.455 0.708 1.323 2.072 2.706 3.841 【答案】(1) 27 64 ;(2)表格见解析,没有;(3)分布列见解析, 1 2 . 【分析】 (1)由相互独立事件的概率公式计算; (2)求出准予立项学校 20 所,县中 10 所,非县中 50 所,未准予立项学校 40 所得列联表,计算 2K 后可 得结论; (3)最终被评估为“通过”的学校有 15 所,随机交量 X 的所有可能取值为 0,1,2,计算出概率得分布列, 然后由期望公式计算期望. 【详解】 解:(1)由题意知,这 3 所学校中每所学校准予立项的概率均为 3 2 1 1 4 3 2 4    , 所以恰有一所学校准予立项的概率为 2 1 3 1 3 27 4 4 64C       . (2)完成 2 2 列联表如下所示: 准予立项 为准予立项 合计 县中 5 5 10 非县中 15 35 50 合计 20 40 60         2 2 2 60 35 5 15 5 1.5 2.70620 40 10 50 n ad bcK a b c d a c b d               , 故没有 90%的把握认为学校是否准予立项与学校是否是县中有关. (3)由题意知,最终被评估为“通过”的学校有  160 70% 10% 50 15%3     (所). 随机交量 X 的所有可能取值为 0,1,2,   2 45 2 60 330 59 CP X C    ,   1 1 15 45 2 60 451 118 C CP X C    ,   2 15 2 60 72 118 CP X C    , 所以 X 的分布列如下所示: X 0 1 2 P 33 59 45 118 7 118   33 45 7 59 10 1 259 118 118 118 2E X         . 【点睛】 方法点睛:本题考查独立性检验,考查随机变量的分布列和数学期望.独立性检验的步骤: (1)分析数据,得出列联表; (2)计算 2K ; (3)与临界值比较得出结论. 22.(2021·云南红河哈尼族彝族自治州·高三三模(文))某市从 2020 年 5 月 1 日开始,若电子警察抓拍到 机动车不礼让行人的情况后,交警部门将会对不礼让行人的驾驶员进行扣 3 分,罚款 200 元的处罚,并在 媒体上曝光.但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患和机动车 通畅率降低点情况.交警部门在某十字路口根据以往的监测数据,得到行人闯红灯的概率为 0.2,并从穿越该 路口的行人中随机抽取了 200 人进行调查,对是否存在闯红灯的情况进行统计,得到 2×2 列联表如下: 45 岁以下 45 岁以上 合 计 闯红灯人数 25 未闯红灯人 数 85 合计 200 近期,为了整顿“行人闯红灯”这一不文明的违法行为,交警部门在该十字路口试行了对闯红灯的行人进行 5 元以上,50 元以下的经济处罚.在试行经济处罚一段时间后,交警部门再次对穿越该路口的行人中随机抽取 了 200 人进行调查,对是否存在闯红灯的情况进行统计,得到 2×2 列联表如下: 45 岁以下 45 岁以上 合计 闯红灯人数 5 15 20 未闯红灯人 数 95 85 180 合计 100 100 200 将统计数据所得频率视为概率,完成下列问题: (1)将 2×2 列联表填写完整(不需要写出填写过程),并根据表中数据分析,在试行对闯红灯的行人进行 经济处罚前,是否有 90%的把握认为闯红灯行为与年龄有关; (2)在试行对闯红灯的行人进行经济处罚后,闯红灯现象是否有明显改善,请说明理由; (3)结合调查结果,请你对“如何治理行人闯红灯现象”提出合理的建议(至少提出两条建议). 参考公式:        2 2 n ad bcK a b c d a c b d      ,其中 n a b c d    . 参考数据:  2 0P K k 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k 1.132 2.072 2.706 3.841 5.024 6.635 7.897 10.828 【答案】(1)列联表见解析,有把握;(2)有明显改善,理由见解析;(3)答案见解析. 【分析】 (1)根据题意,填写出 2×2 列联表,利用公式求得 2K 的值,结合附表,即可得到结论; (2)求得试行对闯红灯的行人进行经济处罚后,行人闯红灯的概率,结合试行对闯红灯的行人进行经济处 罚前的概率,可得出结论; (3)结合表格中的数据,可针对 45 岁以上人群开展“道路安全”宣传教育;也可进行适当的经济处罚,得到 相应的结论. 【详解】 (1)由题意,可将 2×2 列联表填写完整如下: 45 岁以下 45 岁以上 合计 闯红灯人数 15 25 40 未闯红灯人 数 85 75 160 合计 100 100 200 因为  2 2 200 15 75 25 85 25 3.125 2.706100 100 40 160 8K          所以有 90%的把握认为闯红灯行为与年龄有关. (2)在试行对闯红灯的行人进行经济处罚后,行人闯红灯的概率为 20 0.1200  , 而在试行对闯红灯的行人进行经济处罚前,行人闯红灯的概率为 0.2, 故在试行对闯红灯的行人进行经济处罚后,闯红灯现象有明显改善. (3)①根据调查数据显示,行人闯红灯与年龄有明显关系,故可以针对 45 岁以上人群开展“道路安全”宣传 教育; ②由于经济处罚可以明显降低行人闯红灯的概率,故可以在法律允许范围内进行适当的经济处罚. 23.(2021·全国高三其他模拟)有一种鸡叫五黑鸡,相比于其他鸡,五黑鸡的肉质更好,营养价值更高,随 着人们收入的不断增加,对鸡肉的要求更高了,所以五黑鸡有很大的售卖优势,某养殖户购进一批五黑鸡 鸡苗,养殖一段时间以后准备将该批五黑鸡分批出售,销售后,经统计得到如下数据: 喂养时间/天 160 170 180 190 200 210 220 喂养时间代码 x 1 2 3 4 5 6 7 每只平均售价 y / 元 82 86 92 102 106 112 120 (1)根据表中数据可知可用线性回归模型拟合 y 与 x 的关系,求 y 关于 x 的线性回归方程. (2)若喂养天数不超过 180 天的五黑鸡称为小五黑鸡,超过 180 天的称为大五黑鸡,在购买五黑鸡的人中 随机调查了 100 人,得到如下不完整的 2 2 列联表: 购买小五黑鸡 购买大五黑鸡 合计 年轻人 15 35 非年轻人 55 合计 100 补全 2 2 列联表,并判断是否有 99.5%的把握认为购买的五黑鸡的大小与购买者的年龄有关? (3)在第(2)问的条件下,以频率估计概率,以样本估计总体,为了进一步了解购买者的需求,从所有 购买该批五黑鸡的人中任选 3 人,记购买大五黑鸡的年轻人的人数为 X ,求 X 的分布列及数学期望. 参考公式:回归直线  y a bx   的斜率和截距的最小二乘估计分别为:      1 2 1 n i i i n i i x x y y b x x          , a y bx   ;        2 2 n ad bcK a b c d a c b d      ,其中 n a b c d    .  2P K k 0.11 0.05 0.025 0.010 0.005 0.001 k 2.706 3.841 5.024 6.635 7.879 10.828 【答案】(1)  45 520 7 7y x  ;(2)列联表见解析;有;(3)分布列见解析,数学期望为 3 5 . 【分析】 (1)根据已知数据,利用给出的公式直接求解即可; (2)先补全列联表,再计算 2K 最后与临界值表比较即可得解; (3)先求出 X 的所有可能取值,及从所有购买该批五黑鸡的人中任选 1 人,选到购买大五黑鸡的年轻人的 概率,然后求出 X 取每个值时对应的概率,最后列出分布列并求出数学期望. 【详解】 解:(1)由表中数据得,  1 1 2 3 4 5 6 7 47x          ,  1 82 86 92 102 106 112 120 1007y          , ∴  7 2 1 9 4 1 0 1 4 9 28i i x x           , ∴                7 1 3 18 2 14 1 8 0 2 1 6 2 12 3 20 180i i i x x y y                         , ∴      7 1 7 2 1 180 45 28 7 i i i i i x x y y b x x            , ∴  45 520100 47 7a y bx      , ∴ y 关于 x 线性回归方程为  45 520 7 7y x  . (2)补全的 2 2 列联表如下: 购买小五黑鸡 购买大五黑鸡 合计 年轻人 15 20 35 非年轻人 10 55 65 合计 25 75 100  2 2 100 15 55 10 20 9.158 7.87935 65 25 75K         , 故有 99.5%的把握认为购买的五黑鸡的大小与购买者的年龄有关. (3)依题意可知 X 的所有可能取值为 0,1,2,3, 从所有购买该批五黑鸡的人中任选 1 人,选到购买大五黑鸡的年轻人的概率为 1 5 . ∴   34 640 5 125P X       ,   2 1 3 4 1 481 C 5 5 125P X         ,   2 2 3 4 1 122 C 5 5 125P X         ,   3 3 3 1 13 C 5 125P X       , 故 X 的分布列为 X 0 1 2 3 P 64 125 48 125 12 125 1 125 解法一 数学期望   64 48 12 1 30 1 2 3125 125 125 125 5E X          . 解法二 易知 13, 5X B    : ,得   1 33 5 5E X    . 【点睛】 试题以生活中的实际问题为背景,设计科学、新颖、灵活,设问规范,引导考生对数学的应用价值产生更 深层次的思考,体现数学应用学科素养,考查数学建模能力、运算求解能力.本题第三问解题的关键在于根 据题意知 13, 5X B    : ,进而利用二项分布公式求解. 24.(2021·全国高三其他模拟(理))2021 年是中国共产党成立 100 周年,为庆祝中国共产党的百年华诞, 某单位举行了关于党史知识的书面测试和演讲比赛两阶段团体比赛,最终由 16 名职工组成的初心队夺得第 一名,他们在书面测试与演讲比赛中的个人成绩(单位:分,满分 100 分)统计如下: 职工序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 书面测试成绩 99 99 98 98 97 95 95 95 93 93 92 92 89 89 88 88 演讲比赛成绩 95 92 86 88 91 88 86 91 90 86 85 83 80 80 79 82 (1)设书面测试成绩不低于 90 分为“书面测试优秀”,书面测试成绩低于 90 分为“书面测试一般”,演讲比 赛成绩不低于 85 分为“演讲比赛优秀”,演讲比赛成绩低于 85 分为“演讲比赛一般”,据此完成以下 2×2 列联 表,并判断能否有 99.9%的把握认为书面测试成绩与演讲比赛成绩有关? 书面测试优秀 书面测试一般 总计 演讲比赛优秀 演讲比赛一般 总计 (2)从书面测试成绩不低于 96 分的职工中随机选出 2 名,记选出的 2 名职工中演讲比赛成绩不低于 90 分 的人数为 X ,求 X 的分布列及数学期望. 附:        2 2 n ad bcK a b c d a c b d      ,其中 n a b c d    .  2P K k 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 【答案】(1)列联表见解析,有;(2)分布列见解析, 6 5 . 【分析】 (1)根据数据完善列联表,然后由公式计算 2K 即可判断;(2)书面测试成绩不低于 96 分的有 5 人,其中 演讲比赛成绩不低于 90 分的有 3 人,属于超几何分布问题,计算各个取值的概率然后完成分布列并计算期 望值可得答案. 【详解】 (1)完成的 2×2 列联表如下: 书面测试优秀 书面测试一般 总计 演讲比赛优秀 11 0 11 演讲比赛一般 1 4 5 总计 12 4 16 由表格可得 2 2 16 44 11.73312 4 11 5K     , 由于 11.733>10.828,故有 99.9%的把握认为书面测试成绩与演讲比赛成绩有关. (2)根据题意可知,书面测试成绩不低于 96 分的有 5 人, 其中演讲比赛成绩不低于 90 分的有 3 人, 故 X 的所有可能取值为 0,1,2, 且   2 2 2 5 C 10 C 10P X    ,   1 1 3 2 2 5 C C 31 C 5P X    ,   2 3 2 5 C 32 C 10P X    故 X 的分布列为 X 0 1 2 P 1 10 3 5 3 10 数学期望   1 3 3 60 1 210 5 10 5E X        . 25.(2020·湖北高三期中)自从新型冠状病毒爆发以来,全国范围内采取了积极的措施进行防控,并及时通 报各项数据以便公众了解情况,做好防护.以下是某地区 2020 年 1 月 23 日—31 日这 9 天的新增确诊人数. 日期 23 24 25 26 27 28 29 30 31 时间 x 1 2 3 4 5 6 7 8 9 新增确诊人数 y 16 20 27 32 44 78 57 56 58 经过医学研究,发现新型冠状病毒极易传染,一个病毒的携带者在病情发作之前通常有长达 14 天的潜伏期, 这个期间如果不采取防护措施,则感染者与一位健康者接触时间超过 15 秒,就有可能传染病毒. (1)将 1 月 23 日作为第 1 天,连续 9 天的时间作为变量 x,每天新增确诊人数作为变量 y,通过回归分析, 得到模型 ˆˆ ˆlny b x a  用于对疫情进行分析.对上表的数据作初步处理,得到下面的一些统计量的值(部分数 据已作近似处理):   9 9 1 1 5, 43.11, ln 12.78, ( ) 382i i i ix y x x x y y          ,      9 9 9 22 1 1 1 (ln ln ) 101.36, 60, ln ln 4.14,ln10 2.3i i i i i i i x x y y x x x x              ;根据相关数据, 求该模型的回归方程(结果精确到 0.1),并依据该模型预测第 10 天新增确诊人数. (2)在疫情防控过程中,有 13 名工作人员在餐厅就餐,针对就餐时有防护措施一:场地消毒通风,进入 餐厅前洗手洗脸带口罩手套等等;防护措施二:严格使用公筷、公勺,取餐时排队保持 1.5 米以上的距离, 用餐时保持两米以上的距离,不讲话等等.已知这 13 人中,有一位新冠病毒感染者,若仅要求防护措施一, 感染者传染给他人的概率是 0.3,若仅要求防护措施二,感染者传染给他人的概率是 1 3 .现餐厅同时严格使用 两种措施,记余下的人员中被感染的人数为 X,求 X 最有可能(即概率最大)的值是多少? 附:对于一组数据      1 1 2 2, , , , , ,n nx y x y x y ,其回归直线 ˆˆ ˆy bx a  的斜率和截距的最小二乘估计分别 为:      1 1 2 2 2 1 1 ˆ ˆˆ, n n i i i i i i n n i i i i x x y y x y nx y b a y bx x x x nx                   . 【答案】(1) ˆ 24.5 ln 8.3y x  ,估计第 10 天新增确诊人数为 65 人;(2) 1X  . 【分析】 (1)令 lnz x ,则 ˆˆ ˆy bz a  ,根据公式,求得 ˆ ˆ,b a 的值,得出回归直线方程,代入 10x  ,即可得到 预测值; (2)求得感染者传染给他人的概率是 0.1,得到余下 12 人中被感染的人数 ~ (12, 0.1)X B ,根据独立重复 试验的概率计算公式,列出不等式组,即可求解. 【详解】 (1)令 lnz x ,则 ˆˆ ˆy bz a  ,可得      9 1 9 2 1 101.36ˆ 24.54.14 i i i i i z z y y b z z           , 又由 ˆˆ 43.11 24.5 1.42 8.3a y bz      , 所以,线性回归方程为 ˆ 24.5 8.3y z  ,即 ˆ 24.5 ln 8.3y x  当 10x  时, ˆ 24.5ln10 8.3 64.65 65y     估计第 10 天新增确诊人数为 65 人. (2)同时严格使用两种措施,感染者传染给他人的概率是 10.3 0.13   , 设余下 12 人中被感染的人数为 X,则 ~ (12, 0.1)X B , 可知 12 12( ) (0.1) (0.9) , ( 0,1,2,3 ,12)k k kP X k C k    由 12 1 1 11 12 12 12 1 1 13 12 12 (0.1) (0.9) (0.1) (0.9) (0.1) (0.9) (0.1) (0.9) k k k k k k k k k k k k C C C C           ,解得 0.3 1.3k  , 因为 k N ,所以当 1k  时概率最大,故 1X  . 26.(2021·辽宁丹东市·高三二模)中药藿香产业化种植已经成为某贫困山区农民脱贫攻坚的重要产业之一, 藿香在环境温度为 15~28℃时生长旺盛,环境温度高于 28℃或低于 15℃时生长缓慢或停止.藿香的株高 y (单位: cm)与生长期内环境温度15 x (单位:℃)中的 x 有关,现收集了 13 组藿香生长期内环境温 度中的 ix 和株高 iy ( 1i  ,2,…,13)观测数据,得到如图所示的 ,i ix y 散点图. 根据散点图判断,可以利用模型 y a b x  或 dy c x   建立 y 关于 x 的回归方程,令 s x , 1t x  , 统计处理得到一些数据: ,i is y 的线性相关系数 1 0.8858r  , ,i it y 的线性相关系数 2 0.9953r   . 10.15x  , 109.94y  , 3.04s  , 0.16t  , 13 1 13 13.94i i i s y sy    , 13 1 13 2.10i i i t y ty     , 13 2 2 1 13 11.67i i s s    , 13 2 2 1 13 0.21i i t t    , 13 2 2 1 13 21.22i i y y    .用线性相 关系数说明上面的两种模型哪种适宜作为 y 关于 x 的回归方程,并求这种模型的回归方程,由此预测这种中 药藿香在生长期内的环境温度为 20℃时的株高(株高精确到 1). 附:对于一组数据 i i,u v ( 1i  ,2,3,…, n ),其回归直线 v u   的斜率和截距的最小二乘估计 分别为 1 2 2 1 ˆ n i i i n i i u v nuv u nu         , ˆˆ v u   . 【答案】 dy c x   适宜作为 y 与 x 的回归方程模型; 10ˆ 111.54y x   ;预测这种中药藿香在生长期内的环 境温度为 20℃时的株高为110cm . 【分析】 (1)比较 1 2r r、 的大小关系,判断选择哪个模型; (2)根据题目数据,代入即可求出回归方程,再把 20x = 带入,求出 y 即可. 【详解】 因为 1 0.8858r  , 2 0.9953r   ,所以 1 2 1r r  ,所以 dy c x   适宜作为 y 与 x 的回归方程模型. 因为 13 1 13 2 2 1 13 2.1ˆ 100.2113 i i i i ty ty d t t           , ˆˆ 109.94 10 0.16 111.54c y dt      . 所以 y 关于 x 的回归方程为 10ˆ 111.54y x   . 当 20x = 时, 10ˆ 111.54 111.04 11120y     因此预测这种中药藿香在生长期内的环境温度为 20℃时的株高为111cm . 【点睛】 (1)对于非线性回归问题,可以通过换元代换转化为线性回归问题解决; (2)求线性回归方程的步骤:①求出 ,x y ;②套公式求出 b a、;③写出回归方程 y bx a $ $ $ ;④利用回归 方程 y bx a $ $ $ 进行预报; (3)可以建立多个函数模型时,要对每个模型进行分析比较,选择最优化模型. 27.(2021·全国高三其他模拟)为促进新能源汽车的推广,某市逐渐加大充电基础设施的建设,该市统计了 近五年新能源汽车充电站的数量(单位:个),得到如下表格: 年份编号 x 1 2 3 4 5 年份 2016 2017 2018 2019 2020 新能源汽车充电站数量 y /个 37 104 147 196 226 (1)已知可用线性回归模型拟合 y 与 x 的关系,请用相关系数加以说明; (2)求 y 关于 x 的线性回归方程,并预测 2024 年该市新能源汽车充电站的数量. 参考数据: 5 1 710i i y   , 5 1 2600i i i x y   ,  5 2 1 149.8i i y y    , 10 3.16 . 参考公式:相关系数        1 2 2 1 1 n i i i n n i i i i x x y y r x x y y            , 回归方程 ˆˆ ˆy bx a  中斜率和截距的最小二乘估计公式分别为;      1 2 1 ˆ n i i i n i i x x y y b x x         , ˆˆa y bx  . 【答案】(1)答案见解析;(2) ˆ 47 1y x  ;预测 2024 年该市新能源汽车充电站的数量为 424 个. 【分析】 (1)利用相关系数的计算公式即可得解; (2)先利用已知数据和公式得到 y 关于 x 的线性回归方程,再将 2024 年所对应的年份编号代入线性回归方 程即可得解. 【详解】 解:(1)由已知数据得  1 1 2 3 4 5 35x        , 1 710 1425y    ,      2 2 2 2 1 5 2 1 0 1 2 10i i x x           ,   5 5 1 1 5 2600 5 3 142 470i i i i i i x x y y x y xy             , 所以 470 0.993.16 149.89r   . 因为 y 与 x 的相关系数近似为 0.9,接近 1, 说明 y 与 x 的线性相关程度相当高, 从而可以用线性回归模型拟合 y 与 x 的关系. (2)由(1)得      5 1 2 1 5 470ˆ 4710 i i i i i x x y y b x x           , ˆˆ 142 47 3 1a y bx      , 放所求线性回归方程为 ˆ 47 1y x  . 将 2024 年对应的年份编号 9x  代人回归方程得 ˆ 47 9 1 424y     , 故预测 2024 年该市新能源汽车充电站的数量为 424 个. 28.(2021·黑龙江大庆市·高二期中(理))作为世界最大棉花消费国、第二大棉花生产国,我 国 2020-2021 年度棉花产量约 595 万吨,总需求量约 780 万吨,年度缺口约 185 万吨.其中,新疆棉产量 520 万吨,占国内产量比重约 87%,占国内消费比重约 67%.新疆地区的棉花是世界上最好的棉花之一,新 疆长绒棉,世界顶级,做衣被,暖和、透气、舒适,长年供不应求.评价棉花质量的重要指标之一就是棉花 的纤维长度,新疆农科所在土壤环境不同的 A、B 两块实验地分别种植某品种的棉花,为了评价该品种的棉 花质量,在棉花成熟后,分别从 A、B 两地的棉花中各随机抽取 40 根棉花纤维进行统计,结果如下表:(记 纤维长度不低于 300mm 的为“长纤维”,其余为“短纤维”). 纤维长度 (0,100) [100,200) [200,300) [300,400) [400,500] A 地(根数) 4 9 2 17 8 B 地(根数) 2 1 2 20 15 (1)由以上统计数据,填写下面 2 2 列联表,并判断能否在犯错误概率不超过 0.01 的前提下认为“纤维长 度与土壤环境有关系”( 2K 的观测值精确到 0.001) . A 地 B 地 总计 长纤维 短纤维 总计 附:(1) 2 2 ( ) ( )( )( )( ) n ad bcK a b c d a c b d      (2)临界值表; 2 0( )P K k 0.10 0.05 0.025 0.010 0.005 0.001 0k 2.706 3.841 5.024 6.635 7.879 10.828 (2)现从抽取的 80 根棉花纤维中“短纤维”里任意抽取 2 根做进一步研究,记B地“短纤维”的根数为ξ,求ξ 的分布列和数学期望. (3)根据上述 B 地关于“长纤维”与“短纤维”的调查,将 B 地“长纤维”的频率视为概率,现从 B 地棉花(大 量的棉花)中任意抽取 3 根棉花,记抽取的“长纤维”的根数为 X ,求 X 的分布列及数学期望. 【答案】(1)表格见解析,可以在犯错误的概率不超过 0.01 的前提下认为“纤维长度与土壤环境有关系”;(2) 分布列见解析, 1 2 ;(3)分布列见解析, 21 8 . 【分析】 (1)根据题意纤维长度不低于 300mm 的为“长纤维”,其余为“短纤维”,统计填表即可,再计算观测值 2K , 与附表对照,判断即得结果; (2)依题意随机变量服从超几何分布,先写随机变量取值,再利用组合计算对应概率,即得分布列和数学 期望; (3)依题意随机变量服从二项分布,再根据二项分布的概率分布公式计算概率,得到分布列和数学期望即 可. 【详解】 解:(1)根据已知数据得到如下 2 2 列联表: A 地 B 地 总计 长纤维 25 35 60 短纤维 15 5 20 计 40 40 80 根据 2 2 列联表中的数据,可得 2 2 80 (25 5 15 35) 6.66740 40 20 60K        , 因为 6.667 6.635 , 所以可以在犯错误的概率不超过 0.01 的前提下认为“纤维长度与土壤环境有关系”; (2)由题意可知,抽取的 80 根棉花纤维中“短纤维”有 20 根,A 地 15 根,B 地 5 根,从中任意抽取 2 根做 进一步研究,则B地“短纤维”的根数 的可能取值为:0,1,2, 2 15 2 20 21( 0) 38 CP C     , 1 1 15 5 2 20 15( 1) 38 C CP C     , 2 5 2 20 1( 2) 19 CP C     , 故 的分布列为:  0 1 2 P 21 38 15 38 1 19 所以 21 15 1 1( ) 0 1 238 38 19 2E         ; (3)由表中数据可知,抽到的棉花为“长纤维”的概率为 35 7 40 8  , 依题意,将 B 地“长纤维”的频率视为概率,从 B 地棉花(大量的棉花)中任意抽取 3 根棉花,则抽取的“长 纤维”的根数 7~ 3, 8X B     , 所以 3 0 3 7 1( 0) 1 8 512P X C        , 2 1 3 7 7 21( 1) 18 8 512P X C        , 2 2 3 7 7 147( 2) 18 8 512P X C              , 3 3 3 7 343( 3) 8 512P X C       . 故 X 的分布列为 X 0 1 2 3 P 1 512 21 512 147 512 343 512 故 X 的期望为   7 213 8 8E X    . 【点睛】 思路点睛: 求离散型随机变量的分布列及期望的一般步骤: (1)根据题中条件确定随机变量的可能取值; (2)求出随机变量所有可能取值对应的概率,即可得出分布列; (3)根据期望的概念,结合分布列,即可得出期望(在计算时,要注意随机变量是否服从特殊的分布,如 超几何分布或二项分布等,可结合其对应的概率计算公式及期望计算公式,简化计算).

资料: 1.9万

进入主页

人气:

10000+的老师在这里下载备课资料