第五章5.1.4用样本估计总体
内容索引0102基础落实•必备知识全过关重难探究•能力素养全提升03学以致用•随堂检测全达标
课标要求1.会用样本的数字特征估计总体的数字特征.2.能用样本的分布来估计总体的分布.
基础落实•必备知识全过关
知识点1用样本的数字特征估计总体的数字特征1.前提样本的容量恰当,抽样方法合理.2.必要性(1)在容许一定误差存在的前提下,可以用样本的数字特征估计总体的数字特征,这样能节省人力和物力.(2)有时候总体的数字特征不可能获得,只能用样本的数字特征估计总体的数字特征.
3.误差估计一般是有误差的.但是,大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能性将越来越大.名师点睛用样本估计总体出现误差的原因样本抽取的方法不合适,导致代表性差;样本容量偏少等.4.一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
5.如果样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.
名师点睛1.用样本估计总体的简单理解就是以样本的平均数、方差等数字特征来估计总体的平均数、方差等数字特征,即用样本来代替总体进行研究(以小窥大).2.样本的数字特征:最值、中位数、百分位数、平均数、方差、标准差等.最值是极端值,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.
3.在刻画样本数据的离散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.极差反映了一组数据的变化幅度,方差或标准差描述了一组数据围绕平均数波动的大小,描述了数据的离散程度.4.用样本平均数和样本方差估计总体的平均数和方差可能出现误差,但大数定律可以保证,当样本容量越大时误差越小.大数定律(大数法则):大量的,在一定条件下重复的“随机现象”将呈现一定的规律和稳定性,这种稳定性即频率的稳定性和平均数的稳定性.
过关自诊如图所示是容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为()A.20B.30C.40D.50答案B解析样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
知识点2用样本的分布来估计总体的分布如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,不等于零.当样本的容量越来越大时,该式很小的可能性将越来越大.名师点睛1.如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.2.如果容许有一定误差,则可以用样本的分布去估计总体的分布.而且,在总体的分布不可能获得时,只能用样本的分布去估计总体的分布.
过关自诊判断正误.(正确的画√,错误的画×)(1)样本的数字特征有随机性.()(2)只要样本抽取合理,样本平均数与总体平均数相等.()(3)一般地,样本容量越大,用样本去估计总体就越准确.()√×√
重难探究•能力素养全提升
探究点一平均数和方差的运用【例1】甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克).甲:203204202196199201205197202199乙:201200208206210209200193194194(1)分别计算两个样本的平均数与方差.(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近200克?哪台包装机包装的10袋糖果的质量比较稳定?
规律方法研究两个样本的波动情况或比较它们的稳定性、可靠性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准.若平均数相等,则再通过比较两个样本方差的大小来作出判断.在计算过程中,要仔细观察所给样本数据的特征,选择恰当的公式来计算平均数和方差,这样可避免计算的烦琐,降低错误率.
变式训练1甲、乙两台机床同时加工直径为100cm的零件,为检验质量,各从中抽取6件测量,数据如下:(单位:cm).甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量比较稳定.
探究点二频率分布直方图与数字特征的综合应用【例2】某校从参加学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.假设同组中的每个数据可以用该组区间的中点值代替.试求:(1)这次测试数学成绩的众数;(2)这次测试数学成绩的中位数.
(2)设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3,即中位数约为73.3.规律方法1.利用频率分布直方图估计数字特征:(1)众数是最高的矩形的底边中点的横坐标.(2)中位数左右两侧直方图面积相等.(3)平均数等于每个小矩形的面积乘小矩形底边中点的横坐标之和.2.利用频率分布直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
变式探究若本例条件不变,求数学成绩的平均数.
探究点三用样本的分布估计总体的分布【例3】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于上一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:≈8.602.
规律方法总体分布的两种情况(1)当总体中的个体取值很少时,可以用茎叶图估计总体的分布;(2)当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
变式训练2已知某人工养殖观赏鱼池塘中养殖着大量的红鲫鱼与中国金鱼.为了估计池塘中这两种鱼的数量,养殖人员从池塘中捕出了红鲫鱼与中国金鱼各1000条,给每条鱼做上不影响其存活的记号,然后放回池塘,经过一定时间,再每次从池塘中随机捕出1000条鱼,分类记录下其中有记号的鱼的数目,随即将它们放回池塘中.这样的记录作了10次,将记录获取的数据绘制成如下所示的茎叶图.根据茎叶图计算有记号的红鲫鱼与中国金鱼数目的平均数,并估计池塘中的红鲫鱼与中国金鱼的数量.
解由茎叶图可求出10次记录下的有记号的红鲫鱼与中国金鱼数目的平均数均为20,故认为池塘中的红鲫鱼与中国金鱼的数目相同,设池塘中两种鱼的总数是x,则有,所以,可估计池塘中的红鲫鱼与中国金鱼的数量均约为25000条.
学以致用•随堂检测全达标
1.依据相关法律可知,车辆驾驶员血液中所含的酒精浓度在80mg/100mL(含80)以上时,属醉酒驾车.某地对涉嫌酒后驾车的28800人进行血液检测,根据检测结果绘制的频率分布直方图如图所示,则这28800人中属于醉酒驾车的人数约为()答案C解析由图可知,血液中酒精浓度在80mg/100mL(含80)以上的频率为0.15.则人数为28800×0.15=4320.A.8640B.5760C.4320D.2880
2.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1020小时、980小时、1030小时,估计这个企业所生产的该产品的平均使用寿命为小时.
答案501015解析第一分厂应抽取的件数为100×50%=50;该产品的平均使用寿命为1020×0.5+980×0.2+1030×0.3=1015(小时).
3.2021年7月29日,中国游泳队获得了女子4×200米自由泳接力决赛冠军并打破世界纪录.受运动精神的鼓舞,某游泳俱乐部组织100名游泳爱好者进行自由泳1500米测试,并记录他们的时间(单位:分钟),将所得数据分成5组:[15,25),[25,35),[35,45),[45,55),[55,65],整理得到如图所示的频率分布直方图.(1)求出直方图中m的值;(2)利用样本估计总体的思想,估计该俱乐部游泳爱好者1500米自由泳测试时间的平均数和中位数(同一组中的数据用该组区间中点值作代表).
解(1)由10×(0.005+m+0.040+0.025+0.008)=1,可得m=0.022.(2)平均数为=20×0.05+30×0.22+40×0.40+50×0.25+60×0.08=40.9,设中位数为n,则0.05+0.22+(n-35)×0.04=0.5,解得n=40.75.
本课结束