高考大题专项(六)概率与统计第十一章2022
【考情分析】从近五年的高考试题来看,在高考的解答题中,对概率、统计与统计案例的考查主要有三个方面:一是统计与统计案例,以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计、判断,其中回归分析、独立性检验、用样本的数据特征估计总体的数据特征是考查重点,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查学生的数据处理能力;二是统计与概率综合,以现实生活为背景,利用频率估计概率,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查;三是古典概型的综合应用,以现实生活为背景,求某些事件发生的概率,常与抽样方法、茎叶图等统计知识交汇考查.
【必备知识】1.统计图表(1)在频率分布直方图中:①各小矩形的面积表示相应各组的频率,各小矩形的高=;②各小矩形面积之和等于1.(2)茎叶图:当数据是两位数时,用中间的数字表示十位数,两边的数字表示个位数;当数据是三位数,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).
2.样本的数字特征(1)众数:是指出现次数最多的数,体现在频率分布直方图中,是指高度最高的小矩形的宽的中点的横坐标;(2)中位数是指从左往右小矩形的面积之和为0.5处的横坐标;
3.变量间的相关关系(1)如果散点图中的点从整体上看大致分布在一条直线的附近,那么我们说变量x和y具有线性相关关系.(2)线性回归方程:若变量x与y具有线性相关关系,有n个样本数据表示两个变量负相关.|r|越接近1,表明两个变量相关性越强;当|r|接近0时,表明两个变量几乎不存在相关性.
4.独立性检验:对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表:
5.概率的基本性质(1)随机事件的概率:0≤P(A)≤1;必然事件的概率是1;不可能事件的概率是0.(2)若事件A,B互斥,则P(A+B)=P(A)+P(B).(3)若事件A,B对立,则P(A+B)=P(A)+P(B)=1.6.两种常见的概率模型(1)古典概型;(2)几何概型.
【典例剖析】题型一样本的数字特征的应用【例1】随机抽取某高中甲、乙两个班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.(1)甲班和乙班同学身高的中位数各是多少?并计算甲班样本的方差;(2)现从乙班这10名同学中随机抽取2名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.
(2)设“身高为176cm的同学被抽中”为事件A.从乙班10名同学中抽取2名身高不低于173cm的同学有(181,173),(181,176),(181,178),(181,179),(179,173),(179,176),(179,178),(178,173),(178,176),(176,173),共10个基本事件,而事件A含有4个基本事件,所以
对点训练1为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值;(2)轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好?
题型二利用回归方程进行回归分析【例2】某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:
(1)从这5天中任选2天,求这2天发芽的种子数均不小于25的概率;(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另外三天的数据,求出y关于x的线性回归方程y=bx+a;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?
解题心得在求两变量相关系数和两变量的回归方程时,由于的计算公式比较复杂,求值时计算量比较大,因此为了计算准确,可将它们分成几个部分分别计算,这样等同于分散难点,各个攻破,提高了计算的准确度.
对点训练2一只药用昆虫的产卵数y与一定范围内的温度x有关,现收集了该种药用昆虫的6组观测数据如表:
题型三频率分布直方图与独立性检验的综合【例3】某企业为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取100件产品作为样本称出它们的质量(单位:毫克),质量值落在(175,225]的产品为合格品,否则为不合格品.如表是甲流水线样本频数分布表,如图是乙流水线样本的频率分布直方图.
(1)根据乙流水线样本的频率分布直方图,求乙流水线样本质量的中位数(结果保留整数);(2)从甲流水线样本中质量在(165,185]的产品中任取2件产品,求两件产品中恰有一件合格品的概率;
(3)由以上统计数据完成下面2×2列联表,能否有90%的把握认为产品的包装合格与两条自动包装流水线的选择有关?下面临界值表仅供参考:
解(1)因为前三组的频率之和10×(0.002+0.009+0.020)=0.310.5,所以中位数在第四组,设为x毫克,由(x-195)×0.034+0.31=0.5,解得x≈201.故乙流水线样本质量的中位数为201毫克.(2)甲流水线样本中质量在(165,185]的产品共有5件,其中合格品有2件,设为A,B;不合格品3件,设为a,b,c,从中任取2件的所有取法有(A,B),(A,a),(A,b),(A,c),(B,a),(B,b),(B,c),(a,b),(a,c),(b,c)共10种,恰有一件合格品的取法有(A,a),(A,b),(A,c),(B,a),(B,b),(B,c)共6种,所以两件产品中恰有一件合格品的概率为
(3)由乙流水线样本的频率分布直方图可知,合格品的个数为100×(1-0.04)=96,所以,2×2列联表是:故不能在犯错误的概率不超过0.15的前提下,认为产品的包装合格与两条自动包装流水线的选择有关.
解题心得有关独立性检验的问题解题步骤:(1)作出2×2列联表;(2)计算随机变量χ2的值;(3)查临界值,检验作答.
对点训练3某市去年外出务工返乡创业人员中有1000名个人年收入在区间[1,41](单位:万元)上,从这1000名中随机抽取100名,得到这100名人员年收入频率分布直方图.这些数据区间是[1,5],…,(37,41].(1)用样本估计总体,试用直方图估算这1000名外出务工返乡创业人员年收入为(33,41]万元的人数;
(2)调查发现这1000名返乡创业人员中有600人接受了职业技术教育,其中340人个人年收入超过17万元.请完成个人年收入与接受职业教育2×2列联表,能否在犯错误的概率不超过0.01的前提下认为该市这1000人返乡创业收入与创业人员是否接受职业技术教育有关?请说明理由.
解(1)收入在(33,41]上的返乡创业人员频率为0.010×4+0.005×4=0.06,估算这1000名外出务工返乡创业人员年收入为(33,41]万元的人数为1000×0.06=60(人).(2)根据题意,这1000名返乡创业人员中年收入超过17万元的人数是1000×[1-(0.01+0.02+0.03+0.04)×4]=600,其中参加职业技术教育的人数是340人.由此填写2×2列联表如下:
题型四频率分布表(图)与概率的综合【例4】(2020湖南怀化高三质检)由于受疫情的影响,某国某市的一个小区505人参加某次核酸检测,根据年龄段使用分层抽样的方法从中随机抽取101人,记录其核酸检测结果(阴性或阳性).现将核酸检测呈阴性的人员,按年龄段分为5组:(0,20],(20,40],(40,60],(60,80],(80,100],得到如图所示频率分布直方图,其中年龄在(20,40]的有20人.(1)估计核酸检测呈阴性人员的年龄的中位数;(2)用样本估计该小区此次核酸检测呈阳性的人数;(3)若此次核酸检测呈阳性的人中,男女比例为3∶2,从中任选两人,求至少选到一名男性的概率.
解(1)由频率直方图可知(0.0075+0.01)×20=0.35,(0.0075+0.01+0.015)×20=0.65,因为0.35