第六章3.1从频数到频率3.2频率分布直方图
课标要求1.了解频率与频数对总体的估计情况.2.理解用样本的频率分布估计总体的分布的方法.3.会列频率分布表,画频率分布直方图、频率折线图.4.能够利用频率分布直方图解决实际问题.
内容索引0102基础落实•必备知识全过关重难探究•能力素养全提升03学以致用•随堂检测全达标
基础落实•必备知识全过关
知识点1频率分布表与频率分布直方图1.基本概念名称概念频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫作该组的频数.每组频数除以全体数据个数的商叫作该组的频率.频率反映该组数据在样本中所占比例的大小样本的频率分布根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况)就叫作样本的频率分布极差若一组数据的最小值为a,最大值为b,则b-a的差就叫作极差组距把所有数据分成若干组,每个小组的两个端点之间的距离称为组距
2.频率分布表和频率分布直方图的意义从一个总体得到一个包含大量数据的样本时,我们很难从一个个数据中直接看出样本所含的信息.如果把这些数据整理成频率分布表或频率分布直方图,就可以比较清楚地看出样本数据的频率分布,从而估计总体的分布情况.用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本频率分布对它进行估计.
3.频率分布表与频率分布直方图的制作步骤(1)频率分布是指从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.(2)一般用频率分布直方图反映样本的频率分布.(3)画频率分布直方图的一般步骤为:第一步,求极差.第二步,确定组距和组数.为了方便起见,组距的选择应力求“取整”,极差、组距、组数有如下关系:([x]表示不大于x的最大整数)
第三步,分组.通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.第四步,列频率分布表.统计各组数据的频数,计算频率,填入表格中,完成频率分布表.第五步,依据频率分布表画频率分布直方图.画图时,以横轴表示样本数据,纵轴(小长方形的高)表示频率与组距的比值.
名师点睛频率分布直方图的特征总体分布情况可以通过样本频率分布情况来估计,样本频率分布是总体分布的一种近似表示,频率分布表和频率分布直方图有以下特征:(1)从频率分布直方图可以清楚地看出数据分布的总体趋势.(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(3)频率分布表和频率分布直方图由样本决定,因此它们会随样本的变化而变化.(4)若固定分组数,随着样本容量的增加,频率分布表中各个频率会稳定在某一个值的附近,从而频率分布直方图中的各个小长方形的高度也会稳定在特定的值上.
过关自诊1.判断正误.(正确的画√,错误的画×)(1)一般样本容量越大,所分组数越多;样本容量越小,所分组数越少.()(2)频率分布直方图的纵坐标表示频率.()(3)频率分布直方图中小矩形的面积表示该组的频数.()(4)用样本频率分布估计总体频率分布的过程中,样本容量越大,估计越精确.()√××√
2.绘制频率分布直方图应注意什么问题?提示①各组频率的和等于1,因此各个小长方形面积的总和等于1.②频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律.③在直角
3.频率分布表与频率分布直方图各有什么特点?提示频率分布表反映具体数据在各个不同区间的取值频率,但不直观,数据的总体态势不明显.频率分布直方图能直观地表明数据分布的形状态势,但失去了原始数据.
知识点2频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.名师点睛频率折线图的优点是它反映了数据的变化趋势,随着样本容量的不断增加,分组的不断加密,频率折线就会越来越光滑,最终形成一条光滑的曲线.
过关自诊1.判断正误.(正确的画√,错误的画×)(1)分组越密的频率分布直方图得到的频率折线图越光滑.()(2)频率折线图不能反应数据的变化趋势.()√×
2.拓展:总体密度曲线的特征(1)在样本频率分布直方图中,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计学中称这条光滑曲线为总体密度曲线,如图所示.(2)总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,图中阴影部分的面积,就是总体在区间(a,b)内取值的百分比.
重难探究•能力素养全提升
探究点一频数与频率的有关计算【例1】已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,那么第六组的频数是,频率是.答案40.1解析因为频率=,所以频数=频率×样本容量,因为第五组的频率是0.2,所以频数是0.2×40=8,第六组的频数是40-(5+6+7+10+8)=4,所以第六组的频率是=0.1.
规律方法频数与频率的求解策略对于频数与频率的问题,首先要明确几个等量关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清已知、未知,选择合适的公式进行解题.
变式训练1(多选题)肥胖会增加各种疾病发生的几率.为了了解运动健身减肥的效果,某健身房跟踪调查了20名肥胖者,把健身前后他们的体重(单位:kg)制成如下表格.健身减肥前体重区间[80,90)[90,100)[100,110)[110,120]频率030%50%20%健身减肥后体重区间[80,90)[90,100)[100,110)[110,120]频率10%40%50%0
对比健身前后,关于这20名肥胖者,下面结论正确的是()A.健身后,体重在区间[90,100)内的频数增加值为2B.健身后,原来体重在区间[110,120]内的肥胖者体重都有减少C.原来体重在[80,90)和[90,100)内的人减肥失败D.原来体重在区间[100,110)内的人减肥没有效果
答案AB解析原来体重在区间[90,100)内的频数为20×30%=6,健身后体重在此区间内的频数为20×40%=8,频数增加值为2,A正确;原来体重在区间[110,120]内的频数为20×20%=4,而健身后在此区间内的频数为0,说明此前的肥胖者体重都有减少,B正确;健身后体重在区间[100,110)内的频数没有变化,但是并不能说原来体重在区间[100,110)内的人减肥没有效果,因为健身前后这个区间的人不一定是相同的,同理,也不能说原来体重在[80,90)和[90,100)内的人减肥失败,CD均不正确.故选AB.
探究点二画频率分布直方图、频率折线图【例2】某省为了了解和掌握2021年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下:(单位:分)135981021109912111096100103125971171131109210210910411210512487131971021231041041281091231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100
991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)列出频率分布表;(2)画出频率分布直方图和频率折线图;(3)估计该省考生数学成绩在[100,120)分之间的比例.
解在100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数为=11.(1)频率分布表如下:分组频数频率[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048
分组频数频率[105,110)150.150.030[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135]20.020.004合计1001.000.200
(2)根据频率分布表中的有关信息画出频率分布直方图及频率折线图,如图所示.(3)从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.
规律方法组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响对数据分布情况的了解,若样本容量不超过120个时,按照数据的多少常分为5组~12组,一般样本容量越大,所分组数越多.
变式探究本例条件不变,制成频率分布直方图时分组如下,[80,85),[85,90),[90,95),[95,100),[100,105),[105,110),[110,115),[115,120),[120,125),[125,130),[130,135].若90分或90分以上为及格,请计算该省考生数学成绩的及格率.解列出频率分布表如下分组频数频率[80,85)10.01[85,90)20.02[90,95)40.04[95,100)140.14
分组频数频率[100,105)240.24[105,110)150.15[110,115)120.12[115,120)90.09[120,125)110.11[125,130)60.06[130,135]20.02合计1001.00由表可得,及格(即90分或90分以上)的频率为0.04+0.14+0.24+0.15+0.12+0.09+0.11+0.06+0.02=0.97.故及格率为97%.
探究点三频率分布直方图的应用角度1频率分布直方图中的计算问题【例3】某校在5月份开展了科技月活动.在活动中某班举行了小制作评比,规定作品上交的时间为5月1日到31日,逾期不得参加评比.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数最多,有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?
解(1)设从左到右各长方形的高分别为2x,3x,4x,6x,4x,x.参加评比的作品总数为a件,又(2x+3x+4x+6x+4x+x)×5=1,解得a=60(件).(2)由频率分布直方图可以看出第四组上交的作品数量最多,共有6×x×5×a=18(件).(3)第四组上交的作品数为18件,第六组上交的作品为x×5×a=3(件),则它
规律方法1.频率分布直方图的性质(1)因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;(2)在频率分布直方图中,各小矩形的面积之和等于1;(3)=样本容量.2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内取值的可能性.
变式训练2为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图所示,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110或110以上为达标,试估计该校全体高一学生的达标率是多少?
角度2利用频率分布直方图估计总体分布【例4】一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.56.46.75.85.95.95.24.05.44.65.85.56.06.55.16.55.35.95.55.86.25.45.05.06.86.05.05.76.05.56.86.06.35.55.06.35.26.07.06.46.45.85.95.76.86.66.06.45.77.46.05.46.56.06.85.86.36.06.35.65.36.45.76.76.25.66.06.76.76.0
5.66.26.15.36.26.86.64.75.75.75.85.37.06.06.05.95.46.05.26.06.35.76.86.14.55.66.36.05.86.3根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35cm之间的麦穗所占的百分比.
解(1)计算极差:7.4-4.0=3.4.(2)决定组距与组数:若取组距为0.3,因为≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)分组所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表:分组频数频率[3.95,4.25)10.01[4.25,4.55)10.01[4.55,4.85)20.02[4.85,5.15)50.05
分组频数频率[5.15,5.45)110.11[5.45,5.75)150.15[5.75,6.05)280.28[6.05,6.35)130.13[6.35,6.65)110.11[6.65,6.95)100.10[6.95,7.25)20.02[7.25,7.55]10.01合计1001.00
(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35cm之间的麦穗约占41%.
规律方法1.频率分布表能比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布.2.估计总体分布时,样本容量越大,估计越准确.
变式训练3公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求.为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:分钟):1714201210241817122131928534725182811531121110161291013191012121622172316151611931321822199232815212812111415311621825512152016122820122815832189
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图.(2)候车时间15分钟以上的频率是多少?你能为公交公司提出什么建议?解(1)该数据中最大值为34,最小值为1,两者之差为33,故取组距为5,分为7组.分组频数频率[0,5)60.0750.015[5,10)90.11250.0225[10,15)220.2750.055[15,20)220.2750.055[20,25)100.1250.025[25,30)80.1000.020[30,35]30.03750.0075
频率分布直方图如图所示:频率折线图如图所示:
(2)候车时间不低于15分钟的比例为0.275+0.125+0.100+0.0375=0.5375.建议:公交公司可以适当增加公交车的数量.
本节要点归纳1.知识清单:(1)频数与频率的关系;(2)列频率分布表、画频率分布直方图与频率折线图;(3)频率分布直方图的应用.2.方法归纳:数据分析.3.常见误区:误把频率分布直方图中的纵坐标当成频率,导致计算错误.
学以致用•随堂检测全达标
1.一个容量为20的样本数据,分组及各组的频数如下分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数234542则样本在区间[20,60)上的频率是()A.0.5B.0.6C.0.7D.0.8答案D
2.一个容量为32的样本,已知某组数据的频率为0.125,则该组数据的频数为()A.2B.4C.6D.8答案B解析0.125×32=4.
3.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2700,3000)内的频率为()A.0.1B.0.2C.0.3D.0.4答案C解析0.001×(3000-2700)=0.3.
4.从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为()A.10B.18C.20D.36
答案B解析在[5.43,5.47]的频率为(6.25+5.00)×0.02=0.225,∴0.225×80=18.故选B.
5.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图如图所示.由图中数据可知a=.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数为.
答案0.0303解析∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,∴a=0.030,设身高在[120,130),[130,140),[140,150]三组的人数分别为x,y,z.
本课结束