冀教版九年级数学上册第23章数据分析
加入VIP免费下载

冀教版九年级数学上册第23章数据分析

ID:679337

大小:885.54 KB

页数:111页

时间:2021-04-24

加入VIP免费下载
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天资源网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:403074932
资料简介
23.1 平均数与加权平均数(第 1 课时) 第二十三章 数据分析 张老师乘公交车上班 , 从家到学校有 A , B 两条路线可选择 . 对每条路线 , 各记录了 10 次路上花费的时间 , 依据数据绘制的统计图如图所示 . 根据图形提供的信息 , 你能判断哪条路线平均用时较少 , 哪条路线用时的波动较大吗 ? 如何定量地描述平均用时及数据的波动情况 ? 问题思考 实际问题中平均数的计算 某农科院为了寻找适合本地的优质高产小麦品种 , 将一块长方形试验田分成面积相等的 9 块 , 每块 100 m 2 , 在土壤肥力、施肥、管理等都相同的条件下试种 A , B 两个品种的小麦 . 小麦产量如下表 :   (1) 观察下图 , 哪个品种小麦的产量更高些 ? (3) 如果只考虑产量这个因素 , 哪个品种更适合本地种植 ? (2) 以 100 m 2 为单位 , 如何比较 A , B 两个小麦品种的单位面积产量 ? 5 . 通过计算 , 你认为哪个品种更适合本地种植 ? 引导分析 1 . 通过直观观察 , 你能得到哪个品种小麦的产量更高些吗 ? 2 . 要比较哪个品种的产量高 , 我们通常通过计算什么值定量比较 ? 3 . 如何求一组数据的平均值 ? 4 . 你能求出 A , B 两个小麦品种的单位面积产量吗 ? B 品种小麦的平均产量 : ×(94 + 100 + 105 + 85) = 96(kg) . 解 : A 品种小麦的平均产量 : ×(95 + 93 + 82 + 90 + 100) = 92(kg), 就试验结果来看 , B 品种小麦比 A 品种小麦的平均产量高 , B 品种更适合本地种植 . 1 . 如果有 n 个数 x 1 , x 2 , … , x n , 你如何求它们的平均数 ? 引导思考 : 2 . 每个数与平均数的差的和是多少 ? ( 一组数据中 , 每个数据与平均数的偏差总和为 0) 一般地 , 我们把 n 个数 x 1 , x 2 , … , x n 的和与 n 的比 , 叫做这 n 个数的算术平均数 , 简称平均数 , 记作 , 读作“ x 拔” , 即 算数平均数 ( x 1 + … +x n ) . 因为 所以取平均数可以抵消各数据之间的差异 . 因此 , 平均数是一组数据的代表值 , 它反映了数据的“ 一般水平 ” . 从一批鸭蛋中任意取出 20 个 , 分别称得质量如下 : 80   85   70   75   85   85   80   80   75   85 85   80   75   85   80   75   85   70   80   75 做一做 (1) 整理数据 , 填写统计表 . 质量 /g 70 75 80 85 频数   (2) 求这 20 个鸭蛋的平均质量 . 质量 /g 70 75 80 85 频数 2 5 6 7 解 :(1) ×(70×2+75×5+80×6+85×7) = 79 . 5(g) . 即这 20 个鸭蛋的平均质量是 79 . 5 g . 追问 : 当一组数据中某个数重复出现多次时 , 我们常怎样计算这组数据的平均数 ? ( 先整理数据 , 列出频数分布表 , 用简单方法计算平均数 ) 大家谈谈 小明和小亮分别是这样计算平均数的 . 小明的计算结果 : ×(70 + 75 + 80 + 85) = 77 . 5(g) . 小亮的计算结果 : ×(70×2+75×5+80×6+85×7) = 79 . 5(g) . 你认为他们谁的计算方法正确 ? 请和同学交流你的看法 . 归纳 : 一组数据中某个数重复出现多次时 , 先整理数据 , 列出频数分布表 , 再用简单方法计算平均数 . 用计算器求平均数 求“做一做”中 20 个数据的平均数的步骤 ( 用 A 型计算器 ): 80   85   70   75   85   85   80   80   75   85 85   80   75   85   80   75   85   70   80   75 质量 /g 70 75 80 85 频数 2 5 6 7 步骤 按键 显示 MODE 2 选择统计模式 , 进入一元统计状态 Stat x   0 输入第 1 个数据 70, 频数 2 7 0 , 2 DATA n=2 输入第 2 个数据 75, 频数 5 7 5 , 5 DATA n=7 输入第 3 个数据 80, 频数 6 8 0 , 6 DATA 输入第 4 个数据 85, 频数 7 显示统计结果 8 5 , 7 DATA Rcl n=13 n=20 =79.5 若要了解一组数据的平均水平 , 可计算这组数据的算术平均数 , 算术平均数与一组数据的每一个数据都有关系 , 当一个数据发生变化时 , 会影响整组数据的平均数 , 所以算术平均数的缺点是容易受个别特殊值的影响 , 有时不能代表一组数据的集中趋势 . [ 知识拓展 ]   检测反馈 1 . 2015 年 5 月某日我国部分城市的最高气温统计如下表所示 : 城市 武 汉 成 都 北 京 上 海 海 南 南 京 拉 萨 深 圳 气温 /℃ 27 27 24 25 28 28 23 26 这组数据的平均数是 (    ) A.24 ℃ B.25 ℃ C.26 ℃ D.27 ℃ 解析 :(27+27+24+25+28+28+23+26)÷8=208÷8=26(℃) . 故选 C. C 2 . 在一次青年歌手大奖赛上 , 七位评委为某位歌手打出的分数如下 ( 单位 : 分 ):9 . 5,9 . 4,9 . 6,9 . 9,9 . 3,9 . 7,9 . 0, 去掉一个最高分和一个最低分后 , 所剩数据的平均数是 (    ) A.9 . 2 分 B.9 . 3 分 C.9 . 4 分 D.9 . 5 分 D 3 . 若 8 个数的平均数是 11, 还有 12 个数的平均数是 12, 则这 20 个数的平均数是      .  解析 : 这些数之和为 8×11+12×12 = 232, 故这些数的平均数是 = 11 . 6 . 故填 11 . 6 . 11 . 6 4 . 某老师为了了解学生周末利用网络进行学习的时间 , 在所任教班级随机调查了 10 名学生 , 其统计数据如表 : 时间 / 小时 4 3 2 1 0 人数 / 名 2 4 2 1 1 求这 10 名学生周末利用网络进行学习的平均时间 . 解 : ×(4×2+3×4+2×2+1×1+0×1) = 2 . 5( 时 ) . 即这 10 名学生周末利用网络进行学习的平均时间是 2 . 5 小时 . 23.1 平均数与加权平均数(第 2 课时) 第二十三章 数据分析 在一次数学考试中 , 八年级 (1) 班和 (2) 班的考生人数和平均成绩如下表 : 班级 1 班 2 班 人数 46 54 平均成绩 / 分 86 80 【 问题 】 1 . 表格中“ 86 分”所反映的实际意义是什么 ? 2 . 求这两个班的平均成绩 . 加权平均数的概念 共同探究: 假期里 , 小红和小惠结伴去买菜 , 三次购买的西红柿价格和数量如下表 : 单价 /( 元 / 千克 ) 4 3 2 合计 小红购买的数量 /kg 1 2 3 6 小惠购买的数量 /kg 2 2 2 6 从平均价格看 , 谁买的西红柿要便宜些 ? ≈2 . 67( 元 / 千克 ), = 3( 元 / 千克 ) . 从平均价格看 , 小红买的西红柿要便宜些 . 追加提问 : 1 . 有的同学认为每次购买单价相同 , 购买总量也相同 , 平均价格应该也一样 , 都是 (4 + 3 + 2)÷3 = 3( 元 / 千克 ) . 这样解答是否正确 ? 为什么 ? 2 . 有的学生是这样思考的 : 购买的总量虽然相同 , 但小红花了 16 元 , 小惠花了 18 元 , 所以平均价格不一样 , 小红买的西红柿要便宜些 . 这样的想法正确吗 ? 为什么 ? 3 . 如果小红三次购买的数量分别为 2,1,3, 小惠三次购买的数量分别为 1,3,2, 她们购买的西红柿的平均价格分别是多少 ? 4 . 通过上面的计算 , 小红和小惠每次购买西红柿的数量不同 , 所求的平均数是否相同 ? 已知 n 个数 x 1 , x 2 , … , x n , 若 w 1 , w 2 , … , w n 为一组正数 , 则把 叫做 n 个数 x 1 , x 2 , … , x n 的加权平均数 , w 1 , w 2 , … , w n 分别叫做这 n 个数的 权重 , 简称为 权 . 在“共同探究”中 , 加权平均数是多少 ? 哪些数是权 ? ( 小红购买的西红柿平均价格约为 2 . 67 元 / 千克 , 它是数 4,3,2 的加权平均数 , 三个数的权分别为 1,2,3) 例 1 某学校为了鼓励学生积极参加体育锻炼 , 规定体育科目学期成绩满分 100 分 , 其中平时表现 ( 早操、课外体育活动 ) 、期中考试和期末考试成绩按比例 3∶2∶5 计入学期总成绩 . 甲、乙两名同学的各项成绩如下 : 学生 平时表现 / 分 期中考试 / 分 期末考试 / 分 甲 95 90 85 乙 80 95 88 分别计算甲、乙的学期总成绩 . 解 : 三项成绩按 3∶2∶5 的比例确定 , 就是分别用 3,2,5 作为三项成绩的权 , 用加权平均数作为学期总成绩 . 甲的学期总成绩为 = 89( 分 ), 乙的学期总成绩为 = 87( 分 ) . 1 . 分配的“权”不同 , 甲、乙二人的总成绩是否发生变化 ? 2 . 算术平均数和加权平均数的区别和联系是什么 ? 联系: 算术平均数是加权平均数各项的权都相等的一种特殊情况 . 算术平均数与加权平均数的区别和联系 : 区别: 由于权的不同导致结果不同,所以权的差异对结果有影响 . 做一做 测试 项目 专业 素质 综合 素质 外语 水平 临场应 变能力 测试成 绩 / 分 甲 9.0 8.5 7.5 8.8 乙 8.0 9.2 8.4 9.0 (1) 如果按四项测试成绩的算术平均数排名次 , 名次是怎样的 ? 某电视节目主持人大赛要进行 专业素质、综合素质、外语水平和临场应变能力四项测试 ,各项测试均采用 10 分制,两名选手的各项测试成绩如下表所示: (2) 如果规定按专业素质、综合素质、外语水平和临场应变能力四项测试的成绩各占 60%,20%,10%,10% 计算总成绩 , 名次有什么变化 ? 解 :(1) 甲、乙各项成绩的算术平均数分别为 : = 8 . 45( 分 ), = 8 . 65( 分 ) . 比较算术平均数 , 乙排名第一 , 甲排名第二 . (2) 甲、乙的加权平均成绩分别为 : = 9 . 0×60% + 8 . 5×20% + 7.5×10% + 8 . 8×10% = 8 . 73( 分 ), = 8 . 0×60% + 9 . 2×20% + 8 . 4×10% + 9 . 0×10% = 8 . 38( 分 ) . 比较加权平均数 , 甲排名第一 , 乙排名第二 . 2 . 按算术平均数排名和加权平均数排名有什么区别 ? 提问 : 1 . 按照算术平均数和加权平均数的计算方法分别求平均数 , 对排名有影响吗 ? 归纳 : 按测试成绩的算术平均数排名次 , 实际上是将四项测试成绩同等看待 . 而按加权平均数排名次 , 则是对每项成绩分配不同的权 , 体现每项成绩的重要程度不同 . 如专业素质成绩的权重为 60%, 说明专业素质对主持人最重要 . 当各数据的重要程度不同时 , 一般采用加权平均数作为一组数据的代表值 . 2 . 算术平均数是加权平均数的一种特例 . 加权平均数的实质是考虑不同权重的平均数,当加权平均数的各项权相同时,就变成了算术平均数 . [ 知识拓展 ]   1 . 数据中的“权”反映数据的相对“重要程度”,其表现形式有:数据所占的百分比、各个数据所占的比值,数据出现的次数 . 权越大,该数据所占的比重越大,反之则越小 . 解析 : = 4( 件 ), 即这个兴趣小组平均每人采集标本 4 件 . 故选 B . 检测反馈 1 . 学校生物兴趣小组 11 人到校外采集标本 , 其中有 2 人每人采集 6 件 ,4 人每人采集 3 件 ,5 人每人采集 4 件 , 则这个兴趣小组平均每人采集标本 (    ) A.3 件 B.4 件 C.5 件 D.6 件 B 2 . 某校把学生的纸笔测试、实践能力、成长记录三项成绩分别按 50%,20%,30% 的比例计入学期总评成绩 ,90 分以上为优秀 . 甲、乙、丙三人的各项成绩如下表 ( 单位 : 分 ), 学期总评成绩为优秀的是 (    ) 纸笔测试 实践能力 成长记录 甲 90 83 95 乙 88 90 95 丙 90 88 90 A. 甲 B. 乙、丙 C. 甲、乙 D. 甲、丙 解析:由题意知,甲的总评成绩 = 90×50% + 83×20% + 95×30% = 90 . 1(分), 乙的总评 成绩 = 88×50% + 90×20% + 95×30% = 90 . 5(分), 丙的总评成绩 = 90×50% + 88×20% + 90×30% = 89 . 6(分), ∴甲、乙的学期总评成绩是优秀 . 故选C. C 3 . 某中学随机调查了 50 名学生 , 了解他们一周在校的体育锻炼时间 , 结果如下表所示 : 时间 / 小时 5 6 7 8 人数 / 名 10 15 20 5 则这 50 名学生这一周在校的平均体育锻炼时间是      .  解析:根据题意得(5×10+6×15+7×20+8×5)÷50 = (50+90+140+ 40)÷50=320÷50=6.4(小时) . 故这50名学生这一周在校的平均体育锻炼时间是6 . 4小时 . 故填6 . 4小时 . 6 . 4 小时 4 . 某广告公司欲招广告策划人员一名 , 对甲、乙、丙三名候选人进行三项素质测试 , 它们的各项测试成绩如下表所示 : 测试项目 测试成绩 / 分 甲 乙 丙 创新 能力 72 85 67 综合 知识 50 74 70 计算机操作 88 45 67 请你用所学的统计知识解决下列问题 . (1) 如果根据三项测试的平均成绩确定录用人选 , 那么谁将被录用 ? (2) 根据实际需要 , 公司将创新能力、综合知识、计算机操作三项测试的得分按 4∶3∶1 的比例确定各人的测试成绩 , 那么谁将被录用 ? 解 :(1) 甲的平均成绩是 ×(72 + 50 + 88) = 70( 分 ), 乙的平均成绩是 ×(85 + 74 + 45) = 68( 分 ), 丙的平均成绩是 ×(67 + 70 + 67) = 68( 分 ), 因为 70 > 68 = 68, 所以候选人 甲 将被录用 . 因为 75 . 875 > 68 . 125 > 65 . 75, 所以候选人 乙 将被录用 . (2) 甲的测试成绩 是 = 65 . 75( 分 ), 乙的测试成绩是 = 75 . 875( 分 ), 丙的测试成绩是 = 68 . 125( 分 ), 23.2 中位数和众数(第 1 课时) 第二十三章 数据分析 学 习 新 知 王小龙毕业后去一家肯德基应聘工作 , 经理和他说我们这里工作人员收入很高 , 平均工资有 2500 元 , 王小龙参加工作后 , 过了一个月他拿到了 900 元的工资 , 觉得十分不满 , 他的工资水平远远低于 2500 元 , 于是找到了经理 , 王小龙认为自己受了欺骗 , 经理拿出工作人员的工资表如下 . 你认为经理是否骗人了 ? 人员 经理 店长 员工 A 员工 B 员工 C 员工 D 试用工 月薪 / 元 6000 5000 1800 1500 1200 1100 900 中位数与众数的概念及意义 问题 1 小琴的英语听力成绩一直很好 , 在六次测试中 , 前五次的得分 ( 满分 30 分 ) 分别为 :28 分 ,25 分 ,27 分 ,28 分 ,30 分 . 第六次测试时 , 因耳机出现故障只得了 6 分 . 如何评价小琴英语听力的实际水平呢 ? (1) 用 6 个分数的平均数评价小琴英语听力的实际水平合理吗 ? (2) 如果不合理 , 那么应该用哪个数作为评价结果呢 ? 问题 2 某班用无记名投票的方式选班长 ,5 名候选人分别编为 1 号 ,2 号 ,3 号 ,4 号 ,5 号 . 投票结果如下表 : 在这个问题中 , 我们最关注的是什么 ? (1) 一般地 , 将 n 个数据按大小顺序排列 , 如果 n 为奇数 , 那么把处于中间位置的数据叫做这组数据的中位数 ; 如果 n 为偶数 , 那么把处于中间位置的两个数据的平均数叫做这组数据的 中位数 . 如图所示 , 图 (1) 中 5 个数据的中位数为 x 3 , 图 (2) 中 6 个数据的中位数为 ( x 3 +x 4 ) . 一般地 , 把一组数据中出现次数最多的那个数据叫做 众数 . ( 当数据的个数为 n , n 为奇数时 , 中位数是从小到大 ( 或从大到小 ) 排列的第 个数 ; 当 n 为偶数时 , 中位数是从小到大 ( 或从大到小 ) 排列的第 个数与第 + 1 个数的平均数 . 众数是一组数据中出现次数最多的数 ) 【思考】 1 . 中位数和众数是不是都是唯一的 ? 2 . 如何求一组数据的中位数和众数 ? ( 中位数是唯一的 , 众数不一定是唯一的 ) 解 :45 个数据的平均数为 ×(5×2+10×6+15×14+20×12+25×8+30×3)=18(min). 例 1 统计全班 45 名学生每天上学路上所用的时间 . 如果时间取最接近 5 的倍数的整数 , 那么整理后的数据如下表 : 所 用 时间 / min 5 10 15 20 25 30 合计 人数 / 名 2 6 14 12 8 3 45 求所用时间的平均数、中位数和众数 . 将这 45 个数据由小到大排序 , 第 23 个数据是 20 min, 所以中位数是 20 min . 所用时间出现最多的是 15 min, 所以众数是 15 min . 检测反馈 1 . 实验中学九年级一班十名同学进行定点投篮测试 , 每人投篮六次 , 投中的次数统计如下 :5,4,3,5,5,2,5,3,4,1, 则这组数据的中位数、众数分别为 (    ) A.4,5 B.5,4 C.4,4 D.5,5 解析 : 将这组数据重新排序为 1,2,3,3,4,4,5,5,5,5, 中位数是按从小到大排列后第 5,6 个数的平均数 , 为 4 . 众数是在一组数据中 , 出现次数最多的数据 , 这组数据中 , 出现次数最多的是 5, 故这组数据的众数为 5 . 故选 A. A 2 . 对于数据 3,3,2,3,6,3,10,3,6,3,2 . ① 这组数据的众数是 3;② 这组数据的众数与中位数的数值不等 ;③ 这组数据的中位数与平均数的数值相等 ;④ 这组数据的平均数与众数的数值相等 . 其中正确的结论有 (    ) A.1 个 B.2 个 C.3 个 D.4 个 解析 : 将这组数据从小到大排列为 2,2,3,3,3,3,3,3,6,6,10, 共 11 个数 , 所以第 6 个数据是中位数 , 即中位数为 3 . 数据 3 出现的次数最多 , 所以众数为 3 . 平均数为 (2+2+3+3+3+3+3+3+6+6+10)÷ 11 = 4, 由此可知 ① 正确 ,②③④ 均错误 . 故选 A. A 3 . 一组数据 1,3,2,5,2, a 的众数是 a , 这组数据的中位数是      .  解析 : ∵1,3,2,5,2, a 的众数是 a ,∴ a= 2, 将这组数据从小到大排列为 1,2,2,2,3,5, 中位数为 2 . 故填 2 . 2 4 . 一组数据按照从小到大排列为 2,4,8, x ,10,14 . 若这组数据的中位数为 9, 则这组数据的众数为      .  解析 : 由题意得 (8+ x )÷2 = 9, 解得 x =10, 则这组数据中出现次数最多的是 10, 故众数为 10 . 故填 10 . 10 5 . 某中学初三 (1) 班篮球队有 10 名队员 , 在一次投篮训练中 , 这 10 名队员各投篮 50 次的进球情况如下表 : 进球数 / 个 42 32 26 20 19 18 15 14 人数 1 1 1 1 2 1 2 1 针对这次训练 , 请解答下列问题 : (1) 求这 10 名队员进球数的平均数、中位数和众数 ; (2) 求这支球队整体投篮命中率 ; (3) 若队员小华的投篮命中率为 40%, 请你分析一下小华在这支球队中的投篮水平 . 解 : (1) 平均数 = ×(42+32+26+20+19×2+18+15×2+14)=22( 个 ) . 中位数为 19 个 . 众数为 19 个和 15 个 . (3) 虽然小华的命中率为 40%, 低于整体投篮命中率 44%, 但小华投 50 个球进了 20 个 , 大于中位数 19 个 , 事实上全队有 6 人低于这个水平 , 所以小华在这支队伍中的投篮水平为中等偏上 . (2) 投篮命中率 = ×100%=44% . 23.2 中位数和众数(第 2 课时) 第二十三章 数据分析 学 习 新 知 在一次数学考试中 , 小英得了 78 分 , 全班共 32 人 , 其他同学的成绩为 1 个 100 分 ,4 个 90 分 ,22 个 80 分 ,2 个 62 分 ,1 个 30 分 ,1 个 25 分 . 小英计算出全班的平均分为 77 . 4 分 , 所以小英告诉妈妈说 , 自己这次数学成绩在班上处于“中上水平” . 3 . 若不能 , 你认为用哪个数据表示此次考试的平均水平更合适 ? 为什么 ? 【思考】 1 . 小英对妈妈说的情况属实吗 ? 你对此有何看法 ? 2 . 平均分 77 . 4 分能客观地反映平均水平吗 ? 某公司销售部统计了 14 名销售人员 6 月份销售某商品的数量 , 结果如下表 : 6 月份销量 / 件 1500 1360 500 460 400 人数 / 名 1 1 5 4 3 (2) 根据计算的统计量 , 销售定额定为多少比较合适 ? 说明理由 . (1) 分别求销量数据的平均数、中位数和众数 ; 解 :(1) = 600( 件 ), (2) 销售定额定为 480 件比较合适 . 理由 : 定为中位数 480 件 , 有半数员工能完成定额 , 能调动员工的积极性 . 中位数为 = 480( 件 ), 众数为 500 件 . 取平均数、中位数和众数都是刻画一组数据集中趋势的方法 , 因为方法不同 , 所以得到的结论也可能不同 . 不同的方法没有对错之分 , 只是能够更客观地反映实际背景的方法要更好一些 . 强调 例 2 某企业 50 名职工的月工资分为 5 个档次 , 分布情况如下表 : 月工资额 / 元 2500 3000 3500 4000 4500 人数 / 名 6 12 18 10 4 (1) 求月工资的平均数和中位数 ; (2) 企业经理关心哪个数 ? 普通职工关心哪个数 ? 解 :(1) 月工资的平均数为 ×(2500×6+3000×12+3500×18+4000×10+4500×4)=3440( 元 ) . 50 个数由小到大排列 , 最中间的两个数均为 3500, 所以中位数为 3500 元 . (2) 企业经理关心平均工资 , 知道平均工资就知道了工资总额 . 普通职工关心中位数 , 知道了中位数 , 就知道自己工资水平大概的位置 . 统计量 平均数 中位数 众数 适用 情况 优点 缺点 平均数反映数据的一般水平 , 多用于比较或消除误差 , 是最常用的一个代表值 中位数是一个中间位置量 , 常用于确定定额、制定标准等 众数是出现次数最多的数据 , 反映民意调查等有集中倾向的结果 能利用所有数据的信息 , 意义明确 , 计算方便 , 应用广泛 较少受异常值的影响 较少受异常值的影响 当数据中有异常值时 , 平均数的代表性较差 没有利用所有数据的信息 众数可能不唯一或不存在 , 有时没有意义 2 . 实际问题中求得的平均数、中位数和众数的单位与原数据的单位一致 . [ 知识拓展 ]   1 . 平均数、中位数和众数都是描述一组数据的特征量 , 但最终选用哪一个量来描述这组数据 , 应结合实际情况来确定 . 检测反馈 1 . 某校为了丰富校园文化 , 举行了初中生书法大赛 , 决赛设置了 6 个获奖名额 , 共有 11 名选手进入决赛 , 选手决赛得分均不相同 . 若知道某位选手的决赛得分 , 要判断她能否获奖 , 只需知道这 11 名选手得分的 (    ) A. 中位数 B. 平均数 C. 众数 D. 加权平均数 解析 :11 个不同的分数从小到大排序后 , 中位数及中位数之后共有 6 个数 , 故只要知道自己的分数和中位数就可以知道是否获奖了 . 故选 A. A 解析 : 了解这家公司员工的工资时 , 要全面了解大多数员工的工资水平 , 故最应该关注的数据是中位数 . 故选 C. 2 . 为了解某公司员工的年工资情况 , 小王随机调查了 10 位员工 , 其年工资 ( 单位 : 万元 ) 如下 :3,3,3,4,5,5,6,6,8,20 . 下列统计量中 , 能合理反映该公司员工年工资水平的是 (    ) A. 加权平均数 B. 众数 C. 中位数 D. 平均数 C 解析 : 由于众数是出现次数最多的数 , 故店主最关注的统计量是众数 . 故填众数 . 3 . 一段时间内 , 鞋店为了解某品牌女鞋的销售情况 , 对各种尺码鞋的销量进行了统计分析 , 在“平均数”“中位数”“众数”等统计量中 , 店主最关注的统计量是      .  众数 4 . 某公司销售部有营销人员 15 人 , 销售部为了制定某种商品的月销售定额 , 统计了这 15 人某月的销售量如下 : 销售件数 1800 510 250 210 150 120 人数 1 1 3 5 3 2 (3) 假设你是营销部负责人 , 你会把每位营销人员的月销售额定为多少件 ? 并说明理由 . (1) 这 15 位营销人员该月销售件数的中位数、众数分别是多少 ? (2) 计算这 15 位营销人员该月销售件数的平均数 ; (2) 平均数是 : = 320( 件 ) . 解 : (1) 表中的数据是按从大到小的顺序排列的 , 处于中间位置的是 210, 因而中位数是 210 件 ;210 出现的次数最多 , 所以众数是 210 件 . (3) 销售额定为 210 件合适些 , 因为 210 件既是中位数 , 又是众数 , 是大部分人能达到的定额 . 23.3 方差(第 1 课时) 第二十三章 数据分析 3 . 如何计算一组数据的平均数、中位数和众数 ? 知识复习 1 . 表示一组数据的“集中趋势”的统计量有哪些 ? 2 . 什么是平均数、中位数和众数 ? 观察与思考 甲、乙两名业余射击选手参加了一次射击比赛 , 每人各射 10 发子弹 , 成绩如图所示 . (1) 观察上图 , 甲、乙射击成绩的平均数、中位数各是多少 ? ( 两人射击成绩的平均数和中位数都是 7 环 ) ( 甲射击成绩波动较大 , 波动的大小反映射击的稳定性有差异 ) (2) 甲、乙射击成绩的平均数是否相同 ? 若相同 , 他们的射击水平就一样吗 ? ( 两人射击成绩的平均数相同 , 但并不能说明射击水平一定相同 ) (3) 哪一组数据相对于其平均数波动较大 ? 波动大小反映了什么 ? 1 . 如何描述每个数据与平均数的偏差 ? 3 . 如何防止正负偏差相互抵消 ? 2 . 把所有的偏差直接相加能表示所有数据的总偏差吗 ? ( 不能 , 因为正负偏差会相互抵消 , 偏差总和为 0) ( 将各偏差平方后再求和 ) 4 . 如何消除数据个数的影响 ? ( 将各偏差平方后再求平均数 ) 设 n 个数据 x 1 , x 2 , … , x n 的平均数为 , 各个数据与平均数偏差的平方分别是 偏差平方的平均数叫做这组数据的 方差 , 用 s 2 表示 , 即 思考 4 . 方差为 0 的一组数据有什么特点 ? 1 . 方差的取值范围是什么 ? 2 . 如何求一组数据的方差 ? 3 . 如何用方差的大小衡量离散程度的大小 ? 5 . 你能通过求方差的方法 , 说明上述问题中哪个射击选手的成绩比较稳定吗 ? [(4 - 7) 2 + (5 - 7) 2 + 2(6 - 7) 2 + 3(7 - 7) 2 + (8 - 7) 2 + 2(10 - 7) 2 ] = 3 . 4, [(5 - 7) 2 + 2(6 - 7) 2 + 4(7 - 7) 2 + 2(8 - 7) 2 + (9 - 7) 2 ] = 1 . 2 . 因为 , 所以乙的射击成绩比甲的波动小 , 乙的成绩 更稳定些 . 方差的值为非负数 ; 当方差为 0 时 , 这组数据为相同的一组数值 ; 当数据分布比较分散时 , 方差较大 ; 当数据分布比较集中时 , 方差较小 . 因此 , 方差的大小反映了数据波动 ( 或离散程度 ) 的大小 . 结论 例 1 利用计算器计算下列数据的平均数和方差 . ( 结果精确到 0 . 01) 66   78   81   75   86   82 解 :(1) 进入统计状态 , 选择一元统计 . (2) 输入数据 . (3) 显示结果 . 5 . 一组数据的每一个数据都变为原来的 k 倍 , 则所得的一组新数据的方差将变为原数据方差的 k 2 倍 . [ 知识拓展 ]   1 . 方差是用来衡量一组数据波动大小的重要量 . 2 . 方差反映的是数据在它的平均数附近波动的情况 . 3 . 对于同类问题的两组数据 , 方差较大的波动较大 , 方差较小的波动较小 . 4 . 一组数据的每一个数据加上 ( 或减去 ) 同一个常数 , 所得的一组新数据的方差不变 . 检测反馈 1 . (2015 · 上海中考 ) 下列统计量中 , 能表示一组数据波动程度的是 (    ) A. 平均数 B. 众数 C. 方差 D. 频率 解析 : 表示一组数据波动大小的统计量是方差 . 故选 C. C 2 . 甲、乙两班举行电脑汉字输入比赛 , 参赛学生每分钟输入汉字的个数统计结果如下表 : 班级 参赛人数 中位数 方差 平均数 甲 55 149 191 135 乙 55 151 110 135 某同学分析上表后得出如下结论 : ① 甲、乙两班学生成绩平均水平相同 ;② 乙班优秀的人数多于甲班优秀的人数 ( 每分钟输入汉字 ≥150 个为优秀 );③ 甲班成绩的波动比乙班大 . 上述结论正确的是 (    ) A.①②③ B.①② C.①③ D.②③ A 解析 :∵ ∴① 正确 ;∵ 乙的中位数为 151, 甲的中位数为 149,∴ 乙班优秀的人数多于甲班优秀的人数 ,② 正确 ;∵ ,∴ 甲班成绩的波动比乙班大 ,③ 正确 . 故选 A. 3 . 一名学生军训时连续射靶 10 次 , 命中的环数分别为 4,7,8,6,8,5,9,10,7,6 . 则这名学生射击环数的方差是    .  解析 : 数据 4,7,8,6,8,5,9,10,7,6 的平均数 = = 7, 方差 = (9 + 0 + 1 + 1 + 1 + 4 + 4 + 9 + 0 + 1) = 3 . 故填 3 . 3 4 . 某次射击练习 , 甲、乙二人各射靶 5 次 , 命中的环数如下表 : 甲命中环数 7 8 6 8 6 乙命中环数 9 5 6 7 8 那么射击比较稳定的是      .  解析 : 根据题意得 = (7 + 8 + 6 + 8 + 6)÷5 = 7, = (9 + 5 + 6 + 7 + 8)÷5 = 7, [(7 - 7) 2 + (8 - 7) 2 + (6 - 7) 2 + (8 - 7) 2 + (6 - 7) 2 ] = 0 . 8 , [(9 - 7) 2 + (5 - 7) 2 + (6 - 7) 2 + (7 - 7) 2 + (8 - 7) 2 ] = 2, ∵ ∴ 射击成绩比较稳定的是甲 . 故填甲 . 甲 5 . 已知两组数据 : 甲 :9 . 9   10 . 3   9 . 8   10 . 1   10 . 4   10   9 . 8   9 . 7 乙 :10 . 2   10   9 . 5   10 . 3   10 . 5   9 . 6   9 . 8 10 . 1 分别计算这两组数据的方差 , 并说明数据波动的大小 . ×(9 . 9 + 10 . 3 + 9 . 8 + 10 . 1 + 10 . 4 + 10 + 9 . 8 + 9 . 7) = 10 . ×(10 . 2 + 10 + 9 . 5 + 10 . 3 + 10 . 5 + 9 . 6 + 9 . 8 + 10 . 1) = 10 . 因为 , 所以乙组数据比甲组数据波动大 . ×[(9 . 9 - 10) 2 + (10 . 3 - 10) 2 + … + (9 . 7 - 10) 2 ] ×(0 . 01 + 0 . 09 + … + 0 . 09) = = ×0 . 44 = 0 . 055, ×[(10 . 2 - 10) 2 + (10 - 10) 2 + … + (10 . 1 - 10) 2 ] = ×(0 . 04 + 0 + … + 0 . 01) = ×0 . 84 = 0 . 105 . 23.3 方差(第 2 课时) 第二十三章 数据分析 学 习 新 知 某校在甲、乙两名优秀选手中选一名参加全市中学生运动会跳远比赛 , 该校预先对这两名选手测试了 10 次 , 测试成绩如下表 : 1 2 3 4 5 6 7 8 9 10 选手 甲的 成绩 /cm 585 596 610 598 612 597 604 600 613 601 选手 乙的 成绩 /cm 613 618 580 574 618 593 585 590 598 624 (5) 历届比赛表明 , 成绩达到 610 cm 就能打破纪录 , 你认为为了打破纪录应选谁参加这项比赛 ? (1) 他们的平均成绩分别是多少 ? (2) 甲、乙这 10 次比赛成绩的方差分别是多少 ? (3) 这两名运动员的运动成绩各有什么特点 ? (4) 历届比赛表明 , 成绩达到 596 cm 就很可能夺冠 , 你认为为了夺冠应选谁参加这项比赛 ? 张老师乘公交车上班 , 从家到学校有 A , B 两条路线可选择 , 他做了一番试验 . 第一周 (5 个工作日 ) 选择 A 路线 , 第二周 (5 个工作日 ) 选择 B 路线 , 每天两趟 , 记录所用时间如下表 : 试验序号 1 2 3 4 5 6 7 8 9 10 A 路线所用时间 /min 35 52 35 36 54 38 41 34 55 40 B 路线所用时间 /min 45 49 44 45 47 46 50 48 50 46 根据上表数据绘制的折线统计图如图所示 . (1) 从图形看 , 哪条路线平均用时少 , 哪条路线用时的波动大 ? (2) 用计算器分别计算选择 A , B 两条路线所用时间的平均数和方差 . (3) 如果某天上班可用时间只有 40 min, 应选择走哪条路线 ? (4) 如果某天上班可用时间为 50 min, 又应选择走哪条路线 ? (1) 从直观上看 , A 路线平均用时少 , 但用时的波动较大 , 说明 A 路线通行不顺畅 .B 路线的平均用时较多 , 但用时比较稳定 , 可能 B 路线较长 , 但通行较顺畅 . (2) 经计算得 : (3) 当上班可用时间只有 40 min 时 , 应选择走 A 路线 , 因为在 10 次记录中 , B 路线所有用时都超过 40 min, 而 A 路线有 6 次用时不超过 40 min . (4) 当上班可用时间为 50 min 时 , 应选择走 B 路线 . 由于 , 所以 A 路线平均用时少 , 但用时波动较大 . 例 2 测试甲、乙两个品牌的手表各 50 只 , 根据日走时误差数据绘制的统计图如图所示 . 从日走时误差角度比较这两个品牌手表的优劣 . 5 . 从日走时误差的绝对值不超过 1 s 的手表所占的百分比看 , 如何比较这两个品牌手表的优劣 ? 【思考】 1 . 通过什么统计量可以比较这两个品牌手表的优劣 ? 2 . 如果甲、乙两个品牌的手表的日走时误差的平均数均为 0, 通过什么统计量比较手表的优劣 ? 3 . 如何计算两种品牌手表的方差 ? 4 . 如何用方差的大小比较手表的优劣 ? 因为 , 所以从日走时误差方差的角度看 , 甲品牌优于乙品牌 . 解 : 经计算知 , 甲、乙两个品牌手表日走时误差的平均数均为 0 . 两组数据的方差分别为 : ×[(-2) 2 ×5+(-1) 2 ×11+0 2 ×17+1 2 ×13+2 2 ×4] = 1 . 2, ×[(-3) 2 ×2+(-2) 2 ×6+(-1) 2 ×11+0 2 ×14+1 2 ×8+ 2 2 ×6+3 2 ×3] = 2 . 24 . 从日走时误差的绝对值不超过 1 s 的手表所占的百分比看 , 甲品牌为 82%, 乙品牌为 66%, 甲品牌优于乙品牌 . 检测反馈 1 . 小明与小华本学期都参加了 5 次数学考试 ( 总分均为 100 分 ), 数学老师想判断这两位同学的数学成绩谁更稳定 , 在进行统计分析时 , 老师需比较这两人 5 次数学成绩的 (    ) A. 平均数 B. 方差 C. 众数 D. 中位数 解析 : 由于方差 能反映数据的波动大小 , 故判断两人的数学成绩谁更稳定 , 应比较方差 . 故选 B. B 2 . 一城市准备选购 1000 株高度大约为 2 m 的某种风景树来进行街道绿化 , 有四个苗圃生产基地投标 ( 单株树的价格都一样 ) . 采购小组从四个苗圃中都任意抽查了 20 株树苗的高度 , 得到的数据如下 : 请你帮采购小组出谋划策 , 应选购 (    ) A. 甲苗圃的树苗 B. 乙苗圃的树苗 C. 丙苗圃的树苗 D. 丁苗圃的树苗 D 解析 : 由 , 知甲、丁的方差小 , 波动小 , 树苗较整齐 ; 又丁苗圃树苗的平均高度为 2 m, 大于甲苗圃树苗的平均高度 , 故应选择丁苗圃的树苗 . 故选 D. 解析 : 因为 , 所以乙机床生产的螺丝质量最好 . 3 . 甲、乙、丙三台机床生产直径为 60 mm 的螺丝 , 为了检验产品质量 , 从三台机床生产的螺丝中各抽查了 20 个测量其直径 , 进行数据处理后 , 发现这三组数据的平均数都是 60 mm, 它们的方差依次为 根据以上提供的信息 , 你认为生产螺丝质量最好的是     机床 .  乙 4 . 下面是两天的每隔两个小时的气温数据 ( 单位 :℃) . 8 月 20 日 :25,26,27,27,28,29,30,31,29,28,27,26 . 8 月 21 日 :23,24,24,26,27,28,29,30,29,28,27,26 . (1) 这两天的平均气温 , 哪一天高些 ? (2) 哪一天的气温变化较大 ? 23.4 用样本估计总体 第二十三章 数据分析 学 习 新 知 从甲、乙两种农作物里各抽取 10 株苗 , 分别测得它们的苗高如下 :( 单位 cm) 甲 :9,10,11,12,7,13,10,8,12,8; 乙 :8,13,12,11,10,12,7,7,9,11 . (1) 分别算出甲、乙两种农作物苗高的平均值、中位数、众数和方差 ; (2) 哪种农作物苗长得比较整齐 ? 为了估计全校初中女生的平均身高 , 九年级 ( 一 ) 班 8 个课外学习小组采用随机抽样的方法 , 分别抽取容量为 25 和 100 的样本 , 样本平均数用 和 表示 , 结果 ( 单位 :cm) 如下表 : 小组 序号 1 2 3 4 5 6 7 8 158.5 161.5 160.2 160.0 160.9 160.4 159.0 159.5 160.0 159.0 160.5 159.3 159.8 161.0 159.6 160.8 把得到的样本平均数标在数轴上 , 如图所示 . (1) 对容量相同的不同样本 , 算得的样本平均数相同吗 ? 样本平均数有不确定性 : 相同的样本容量 , 不同样本的平均数一般也不相同 . (2) 观察上图 , 在两组样本平均数中 , 哪一组样本平均数的波动较小 ? 这样体现了什么样的统计规律 ? (3) 如果总体身高的平均数为 160 . 0 cm, 哪一组样本平均数整体上更接近 160 . 0 cm? 样本平均数有稳定性 : 当样本容量较小时 , 差异可能还较大 . 但是当样本容量增大时 , 样本的平均数的波动变小 , 逐渐趋于稳定 , 且与总体的平均数比较接近 . 在实际中经常用样本的平均数估计总体的平均数 , 同样的道理我们也用样本的方差估计总体的方差 . 追问 : 什么样的实际问题中我们可以采用样本平均数、方差估计总体平均数、方差 ? 有破坏性或总体数量较多时 (3) 规定当方差不超过 0 . 05 mm 2 时 , 车床生产情况为正常 . 判断这台车床的生产情况是否正常 . 例 1 工人师傅用车床加工一种直径为 20 mm 的轴 , 从某天加工的轴中随机抽取了 10 件 , 测得其直径 ( 单位 :mm) 如下 : 20 . 1   19 . 9   20 . 3   20 . 2   19 . 8 19 . 7   19 . 9   20 . 3   20 . 0   19 . 8 (1) 计算样本平均数和样本方差 . (2) 求总体平均数和总体方差的估计值 . 解 :(1) 样本平均数为 = ×(20 . 1 + 19 . 9 + … + 19 . 8) = 20(mm) . 样本方差为 s 2 = ×[(20 . 1 - 20) 2 + … + (19 . 8 - 20) 2 ] = 0 . 042(mm 2 ) . (2) 总体平均数和总体方差的估计值分别为 20 mm 和 0 . 042 mm 2 . (3) 由于方差不超过 0 . 05 mm 2 , 所以可以认为车床的生产情况正常 . 例 2 一个苹果园 , 共有 2000 棵树龄相同的苹果树 . 为了估计今年苹果的总产量 , 任意选择了 6 棵苹果树 , 数出它们挂果的数量 ( 单位 : 个 ) 分别为 :260   340   280   420   360   380 根据往年的经验 , 平均每个苹果的质量约为 250 g . 试估计今年苹果园苹果的总产量 . 解 :6 棵苹果树平均挂果的数量为 ×(260+340+280+420+360+380)= 340( 个 ) . 0 . 25×340 = 85(kg),6 棵苹果树平均每棵的产量约为 85 kg . 由样本平均数估计总体平均数 ,2000 棵苹果树平均每棵产量约为 85 kg, 总产量的估计值为 85×2000=170000(kg) . 3 . 样本平均数估计总体平均数结果有不确定性 , 随着样本容量的增加 , 由样本得出的平均数往往会更接近总体的平均数 . 对方差也有相同的结论 . [ 知识拓展 ]   1 . 用样本估计总体是统计的基本思想 , 而总体的平均数和方差是最重要的两个数字特征 . 在统计中 , 我们常用样本平均数 ( 或方差 ) 估计总体平均数 ( 或方差 ) . 2 . 当调查的对象有破坏性或数量较大时 , 常采用样本估计总体的方法解决实际问题 . 检测反馈 1 . 某“中学生暑假环保小组”的同学 , 随机调查了“幸福小区” 10 户家庭一周内使用环保方便袋的数量 , 数据如下 ( 单位 : 只 ):6,5,7,8,7,5,8,10,5,9, 利用上述数据估计该小区 2000 户家庭一周内需要环保方便袋约 (    ) A.2000 只 B.14000 只 C.21000 只 D.98000 只 解析 : ×(6 + 5 + 7 + 8 + 7 + 5 + 8 + 10 + 5 + 9)×2000 = 14000( 只 ) . 故选 B. B 2 . 从总体中抽取一个样本 , 计算出样本方差为 2, 可以估计总体方差 (    ) A. 一定大于 2 B. 约等于 2 C. 一定等于 2 D. 与样本方差无关 解析 : 在总体数目较多的条件下 , 通常选取一个样本 , 样本的情况大体可以反映 总体的趋势 . 故选 B. B 解析 : 先计算 50 名学生的平均植树量 , 然后用样本的平均数估计总体的平均数即可 : 九年级共植树 420× = 1680( 棵 ) . 故填 1680 . 3 . 某校九年级 420 名学生参加植树活动 , 随机调查了 50 名学生植树的数量 , 并根据数据绘制了如下条形统计图 , 请估计该校九年级学生此次植树活动约植树      棵 .  1680 解 :(1) = 14( 吨 ) . (2)14×500 = 7000( 吨 ), 所以估计该小区居民每月共用水 7000 吨 . 4 . 为了了解某小区居民的用水情况 , 随机抽查了该小区 10 户家庭的月用水量 , 结果如下 : 月用水量 / 吨 10 13 14 17 18 户数 2 2 3 2 1 (1) 计算这 10 户家庭的平均月用水量 ; (2) 如果该小区有 500 户家庭 , 根据上面的计算结果估计该小区居民每月共用水多少吨 .

资料: 8611

进入主页

人气:

10000+的老师在这里下载备课资料