第20章 数据的整理与初步处理
20.1 平均数
第1课时
数学是人们在生活、生产实践中产生出来的一门
科学,同时学好数学又是为社会、生活所服务。现代信
息社会中,大量的数据信息统计就是数学知识应用的一
个重要方面。
平均数---是数据分析中常用的一组数据代表。
x1+x2+ x3+ ··· + xn
问题情景1
下表是某户居民2017年下半年的电话费用, 你知道怎样
计算这户居民平均每月花费了多少元电话费吗?
月 份 7 8 9 10 11 12
电话费
(元) 75.80 45.00 76.30 65.90 55.90 45.90
月平均
一组数据的总和与这组数据的个数之比叫做这组
数据的算术平均数.
公式表示: 设有一组数据x1, x2, x3, ··· , xn,
则该组数据的算术平均数为 x = n
60.80
问题情景2
在今年的植树节, 某单位组织职工开展植树竞赛, 下图
反映的是植树量与人数之间的关系. 你能根据图中信息计
3 4 5 6 7 8 棵数
12
10
8
6
4
2
0
人
数
算出植树的总量棵数和人均
植树棵数吗?
利用坐标系的形式用矩形表示各数
表示各数据值(植树棵数)
表示数据的个数(人数)
问题情景3
某校初二年级各班学生人数分布情况如下图所示, 若已
知初二1班有40人, 你能根据图中信息计算出该校初二年级
的班平均人数吗? 各班级的人数又是多少? 会画出各班人
数的条形统计图吗?
解: 年级总人数是 40÷20%=200(人)
班平均人数是 200÷5=40(人)
班级人数是
2班: 200×23%=46(人)
3班: 200×22%=44(人)
4班: 200×17%=34(人)
5班: 200×18%=36(人)
利用扇形的大小来表示部分占有总体百分比大小的统
计图表叫做扇形统计图.
5班
18
%
1班
20%4班
17%3班
22
%
2班
23%
练1
班级 初二1 初二2 初二3 初二4 初二5
人数 40 46 44 34 36
根据表格数据制作各班人数的条形统计图.
超出平
均线的数
量和与低
于平均线
的数量和
相等
练2
某省统计数据显示, 2005年1-6月平均每月进出口总额为
82.445亿美元. 下图是根据该省2005年上半年每月的进出口
总额情况绘制的. 不计算进出口总额, 你能将二月份的一点
在虚线位置补上吗?
75
80
85
90
95
100
一月 二月 三月 四月 五月 六月
1. 算术平均数: 一组数据的总和与这组数据的个数
之比叫做这组数据的算术平均数.
2. 计算公式: x1+x2+ x3+ ··· + xnx =
n
3. 算术平均数是表示一组数据中数据总体的平均大小
的情况,各数据对平均数的上下偏差的总和为零(就
是高出的和等于低落的和).
.
4. 计算器操作: 统计功能使用.
第20章 数据的整理与初步处理
20.1 平均数
第2课时
1. 算术平均数: 一组数据的总和与这组数据的个数
之比叫做这组数据的算术平均数.
2. 计算公式: x = x1+x2+ x3+ ··· + xn
n
3. 算术平均数:
是反映一组数据中数据总体的平均大小情况的量.
4. 计算器操作:
开机、 输数据、 读信息.选择功能、
练1
1. 一组数据 3, 2, 5, 1, 4 的平均数是___.3
2. 计算一组数据: 9.65, 9.70, 9.68, 9.75, 9.72的平均数
是_____.
3. 设一组数据x1, x2, x3, x4的平均数是 , 则数据 x1+3, x
x2+3, x3+3, x4+3的平均数是_____; 数据 3x1- 2,
3x2- 2, 3x3- 2, 3x4- 2的平均数是______.
x +3
3x - 2
4. 已知一组数据 3, a, 4, b, 5, c的平均数是10, 则 a, b, c 的
平均数是_____. 16
5. 已知3名男生的平均身高为170cm, 2名女生的平均身高
为165cm, 则这5名同学的平均身高是_______. 168cm
问题情景
老师对同学们每学期总评成绩是这样做的: 平时练习占
30%, 期中考试占30%, 期末考试占40%. 某同学平时练习93
分, 期中考试87分, 期末考试95分, 那么如何来评定该同学的
学期总评成绩呢?
解: 该同学的学期总评成绩是:
93×30% =92(分) + 95×40% 87×30%+
加权平均数
权 重权重的意义:
各个数据在该组数据中所占有的不同重要性的反映.
加权平均数的意义:
按各个数据的权重来反映该组数据的总体平均大小情况.
考试 平时1 平时2 平时3 期中 期末
成绩 89 78 85 90 87
练2
小明同学在初二年级第一学期的数学成绩如下表格, 请
按图示的平时、期中、期末的权重, 计算小明同学的学期总
评成绩.
解: 先计算小明的平时成绩:
(89+78+85)÷3 = 84
再计算小明的总评成绩:
84×10%+ 90×30%+ 87×60% = 87.6 (分)
问题探索
某公司对应聘者A、B、C、D进行面试时, 按三个方
面给予打分如右表. 项 目 占分 A B C D
专业知识 20 14 18 17 16
工作经验 20 18 16 14 16
仪表形象 20 12 11 14 14
你就公司主事
身份探索下列问题:
⑴总分计算发
现D最高, 故录用D.
这样的录用中,
三个方面的权重各是多少? 合理吗?
⑵若设置上述三个方面的重要性之比为6:3:1, 那么这三
个方面的权重分别是_________________, 该录用谁?
⑶若设置上述三个方面的重要性之比为10:7:3, 那么这
三个方面的权重分别是_________________, 又该录用谁?
例练3
1. 某商场用单价5元的糖果1千克, 单价7元的糖果2千克,单
价8元的糖果5千克, 混合为什锦糖果销售, 那么这种什锦
糖果的单价是______. (保留1位小数)
3. 一辆小车以v1km/h的速度匀速从甲地到达相距的skm
的乙地, 返回时改变速度为v2km/h, 则该车往返两地的平均
速度是______km/h.
2. 某次数学测验成绩统计如下: 得100分3人, 得95分5人,
得90分6人, 得80分12人,得70分16人, 得60分5人, 则该班这
次测验的平均得分是______.
1. 平均数计算:
算术平均数=各数据的和÷数据的个数
2. 平均数的意义:
算术平均数反映一组数据总体的平均大小情况.
加权平均数反映一组数据中按各数据占有的不同
3. 区别:
加权平均数=(各数据×该数据的权重)的和
权重时总体的平均大小情况.
算术平均数中各数据都是同等的重要, 没有相互间差
异; 加权平均数中各数据都有各自不同的权重地位,彼
此之间存在差异性的区别.
第20章 数据的整理与初步处理
20.2 数据的集中趋势
第1课时
例1:据中国气象局2017年某日某时预报,我国大陆各
直辖市和省会城市当日的最高气温(℃)如下表所示,
请分别用平均数(此为算术平均数)、中位数和众数代
表这31个城市当日最高气温这组数据.
2017年某日某时预报的各地当日最高气温(℃)
北京
32
天津
33
石家庄
36
太原
31
呼和浩
特
27
沈阳
27
长春
26
哈尔滨
26
上海
34
南京
32
杭州
32
合肥
32
福州
36
南昌
30
济南
33
郑州
34
武汉
31
长沙
29
广州
35
海口
35
南宁
36
成都
29
重庆
27
贵阳
24
昆明
23
拉萨
21
西安
33
兰州
28
银川
30
西宁
26
乌鲁木
齐
29
解:平均数:32+33+36+31+27+27+26+26+
34+32+32+32+36+30+33+34+31+29+35+
35+36+29+27+24+23+21+33+28+30+26
+29=937,
937÷31≈30.2.
所以这些城市当日预报最高气温的平均数约为30.2 ℃.
(2) 中位数:
如下图,将31个城市的气温数据按由低到高的顺序重新
排列,用去掉两端逐步接近正中心的办法可以找出处在
正中间位置的那个值,即中位数.
所以这些城市当日预报最高气温的中位数是31℃.
思 考
如果是偶数个城市,那么用去掉两端逐步接近正中心的
办法,最后也只剩下唯一一个没被划去的数据吗 ?
如果是偶数个城市,那么最后就将剩下两个处在正中间
的数,这时,为了公正起见,我们取这两个数的算术平
均数作为中位数.
比如:数据1、2、3、4、5、6的中位数是: 5.32
43
(3) 众数:
如下表,统计每一气温在31个城市预报最高气温数据中出
现的频数,可以找出频数最多的那个气温值,它就是众数 .
气
温
℃
21 23 24 26 27 28 29 30 31 32 33 34 35 36
频
数 1 1 1 3 3 1 3 2 2 4 3 2 2 3
由表可知,这些城市当日预报最高气温的众数是32℃.
思 考
若有两个气温(如29℃和32℃)的频数并列最多,则怎
样决定众数呢?
如果这样,那么我们不是取29℃和32℃这两个数的平均
数作为众数,而是说这两个气温值都是众数.
• 我们可以把例1中的平均数、中位数和众数在统计图
上表示出来,如图.
•平均数是概括一组数据的一种常用指标,反映了这组数
据中各数据的平均大小.
•中位数是概括一组数据的另一种指标,如果将一组数据
按由小到大(或由大到小)的顺序排列(即使有相等的数
据也要全部参加排列),那么中位数的左边和右边恰有
一样多的数据.
•众数告诉我们,这个值出现的次数最多.一组数据可以
有不止一个众数(如上面的两个气温值29和32都是众
数),也可以没有(不能说众数是0)众数(当数值出现
的次数都是一样时).
•平均数、中位数和众数从不同的侧面概括了一组数据,
正因为如此,这三个指标都可作为一组数据的代表.
例1 某公司销售部的15位营销人员在4月份的销售量如下:
每人
销售
件数
人数 1 1 4 4 3 2
1800 510 250 210 150 120
那么4月份销售量的众数是 250件和210件
平均数
中位数
众 数
---平均水平
---中等水平
---多数水平
例2:一名警察在高速公路上随机观察了6辆过往车辆,
它们的车速分别为(单位:千米/时):66, 57,71, 54,
69, 58.那么这6辆车车速的中位数和众数是什么呢?
解:将6辆车的速度按从小到大的顺序重新排列,得到
54, 57, 58, 66, 69, 71.位于正中间的数值不是
一个而是两个,所以应取这两个数值的平均数作为中位数,
即中位数是(58+66)÷2=62(千米/时).
因为每辆车的速度都不一样,没有哪个车速出现的次数
比别的多,所以这6辆车的速度没有众数.
1.判断题: (正确的打“√”,不正确的打“×”)
(1) 给定一组数据,那么这组数据的平均数一定只有一个.( )
(2) 给定一组数据,那么这组数据的中位数一定只有一个.( )
(3) 给定一组数据,那么这组数据的众数一定只有一个.( )
(4) 给定一组数据,那么这组数据的平均数一定位于最大
值和最小值之间.( )
(5) 给定一组数据,那么这组数据的中位数一定等于最小值
和最大值的算术平均数.( )
(6) 给定一组数据,如果找不到众数,那么众数一定就是0.( )
练习
2、某商场进了一批苹果,每箱苹果的质量约为5千克.进
入仓库前,从中随机抽出10箱检查,称得10箱苹果的质量
如下(单位:千克):4.8, 5.0,5.1, 4.8,4.9, 4.8,
5.1, 4.9, 4.7, 4.7.
请求出这10箱苹果质量的平均数、中位数和众数.
解:①平均数为(4.8+5.0+5.1+4.8+4.9+4.8+5.1+4.9+4.7+4.7)
÷10=4.88(千克);
②将10箱苹果的质量从小到大重新排列为4.7,4.7,4.8,
4.8,4.8,4.9,4.9,5.0,5.1,5.1,用去掉两端逐步接近
正中心的办法可以找出处在正中间位置的数为4.8和4.9,
所以中位数为(4.8+4.9)÷2=4.85 (千克) ;
③因为上面数据出现次数最多的是4.8(3次,其他为2次、
1次),所以众数为4.8千克。
1、从甲、乙、丙三个厂家生产的同一种产品中抽取8件
产品,对其使用寿命跟踪调查,结果如下:(单位:年)
甲:3,4,5,6,8,8,10,8
乙:4,6,6,6,8,9,12,13
丙:3,3,4,7,9,10,11,12
三个厂家在广告中都称该产品的使用寿命是8年。
(1)请根据结果判断厂家在广告中欺骗了消费者吗?
(2) 厂家在广告中分别运用了平均数、众数、中位数的
哪一种特征数:甲 ,乙 ,丙 .众数 平均数中位数
没有欺骗,只不过三个厂家所用的特征数不同而已.
这节课里你学到了什么?
平均数:反映了这组数据中各数据的平均大小.
中位数:如果将一组数据按由小到大的顺序排列(即
使有相等的数据也要全部参加排列),那么中位数的
左边和右边恰有一样多的数据.
众数:众数告诉我们,这个值出现的次数最多.
一组数据可以有不止一个众数,也可以没有众数.
第20章 数据的整理与初步处理
20.2 数据的集中趋势
第2课时
(1)一组数据中所有数据的平均数叫做这组数椐的
平均数.
)(1
21 nxxxnx
(3)将一组数据按由小到大的顺序排列,把处在最
中间位置的一个数据(或最中间两个数据的平均数)
叫做这组数据的中位数.
一组数据x1,x2,…,xn的平均数是
(2)一组数据中出现次数最多的数据叫做众数.
10 20 70 40 50 90 50 40 50 40
(1)上面数据中,40出现了3次,50也出现了3次,
是出现次数最多的,所以40和50是这组数据的众数.
解:
10 20 70 40 50 90 50 40 50 40
解:(2)将上面10个数据按从小到大的顺序排列得到
10 20 40 40 40 50 50 50 70 90
其中最中间的两个数据分别是40和50,它们的平均
数是45,即这组数据的中位数是45.
所以这组数据的平均数是46.
10 20 70 40 50 90 50 40 50 40
解:(3)10+20+40×3+50×3+70+90=460
460÷10=46
• 1、平均数反映一组数据的( );
中位数反映一组数据的( );
众 数反映一组数据的( )
A.多数水平 B.平均水平 C.中等水
平
B
C
A
例
2
八年级某班级教室里,三个同学正在为谁的数学成绩
最好而争论,他们五次的数学成绩分别是:
小华:62、94、95、98、98
小明:62、62、98、99、100
小丽:40、62、85、99、99
平均数 中位数 众数
小华
小明
小丽
89.4 95 98
84.2 98 62
77 85 99
老师点评:小明的平均分是89.4分(最高),小强的中位数是
98分(最高),但小丽的众数是99分(最高),且小明、小丽的
成绩在不断进步.而小强的成绩有比较大的波动.通常学科
测试成绩主要以总分来衡量高低,由于小华的平均分最
高,即总分最高,所以小华的数学成绩较好.
高一级学校录取新生主要依据是考生的
总分,这与平均数,中位数和众数中的哪个量
关系最大?
想一想
小知识:平均数较敏感,一组数据中任何一个
数据的变化都会引起平均数发生变化,有时变
化很明显.所以评价成绩一般用平均数.
例3 随着汽车的日益普
及,越来越多的城市发生了
令人头疼的交通堵塞问题.
你认为衡量某条交通主干
道的路况用一天中过往车
辆的平均数合适吗?为什
么?
分析:人们上、下班的时候是一天中道路最繁忙的两个
时段,其他时段车流是明显减少,因此,如果用平均数
来衡量道路的拥挤程度,则堵塞问题明显被掩盖,所以,
较为合理的是按道路繁忙的不同程度,将一天分成几个
时段分别计算车数,而主要考虑的就是上、下班两个时
段通过某点的车的平均数量及平均速度,而不能计算整
天的车的数量及平均速度来估计道路的路况.
小知识:平均数虽然常用,但不是万能的.如果不对具体情
况做具体分析,那么得到的数据将不会有大的指导作用.
对平均数,众数和中位数说长道短
◆草地上有六个人在玩游戏,他们的平均年龄是15岁,请猜想
是怎样的年龄的六个人在玩游戏?
◆为筹备班级的新年晚会,班长对全班同学爱吃的几种水果
作了民意调查.最终买什么水果,该由调查的平均数,众数还
是中位数决定呢?
◆八年级有四个班级,如果我想比较在一次测验中四个班的
成绩,应该用平均数、众数还是中位数呢?
做一做
请老师准备一根绳子.面对所有学生,捏住绳子的两端,将绳子拉直,请全班同学目测几秒钟后估计这根
绳子的长度.
•请全班同学设计和完成一张统计表和一张统计图,全面反映每个同学对这根绳子长度的估计值,计算出全班
同学估计值的平均数、中位数和众数.
•在全班同学估计值的基础上,请给出一个最后的估计值,作为全班集体对这根绳子长度的估计值.
•最后,教师重新出示这根绳子,请学生代表当众用尺量出这根绳子的长度.这个测量值与全班同学目测的估
计值接近吗?全班讨论一下比较的结果,为什么测量值与估计值相差不大或者相差较大.
• 练 习
检 验 某 厂 生 产 的 手 表 质 量 时 , 检 查 人 员 随 机 抽 取 了 1 0 只 手 表 , 在 下 表 中 记 下 了 每 只 手 表 的 走 时 误 差 ( 正 数 表 示 比 标 准 时 间 快 , 负 数 表 示 比 标 准 时 间 慢 ) , 你 认 为 用 这 1 0 只
手 表 误 差 的 平 均 数 来 衡 量 这 1 0 只 手 表 的 精 度 合 适 吗 ?
手 表 序 号 1 2 3 4 5 6 7 8 9 1
0
日走时误差
(秒)
-2 0 1 -3 -1 0 2 4 -3 2
解:不合适,虽然这10只手表误差的平均数是0,但从
测得的数据看,10只手表中只有2只不快不慢,显然不
能认为这些手表有很高的精度.
某商场一天中售出某品牌运动鞋20双,其中各种号
码的鞋的销售如下:
请你推测一下,如果你是鞋厂经理,在平均数、中
位数、众数中你最关心哪个数据?最不关心哪个数
据?
问题1:
鞋的尺码
(cm)
23.5 24 24.5 25 25.5 26
销售量(双) 3 2 3 2 8 2
小知识:在不同的事件中,平均数、中位数和众数所起的作
用不同.要反映一组数据的“多数水平”,一般选用众数.
想一想:为组织春游活动,班委会对春游地点进行明意测验,
最终去哪里是由调查数据的平均数,中位数还是众数决定呢?
所以问题1中最关心的数据为众数,最不关心的数据为中
位数.
由众数决定.
公园里有甲、乙两群游客正在做游戏,两群游客的年龄
如下:
甲:13 13 14 15 15 15 15 16 17 17
乙: 3 4 4 5 5 6 6 6 54 57
(1)求甲群游客的年龄的平均数、中位数和众数,其
中较能反映年龄特征的是哪个数据?
(2)求乙群游客的年龄的平均数、中位数和众数,其
中较能反映年龄特征的是哪个数据?
问题2:
解:(1)甲:平均数为15 ,中位数为15 ,众数为15,其中较
能反映年龄特征的数据是众数.
甲:13 13 14 15 15 15 15 16 17 17
乙: 3 4 4 5 5 6 6 6 54 57
(2)乙:平均数为15,中位数为5.5,众数为6,其中较能
反映年龄特征的数据还是众数.
我们看各类比赛,当评委亮分后,主持人总要说去掉一个
最高分,去掉一个最低分,最后得分……为什么一定要去
掉最高分和最低分来求平均分呢?你知道吗?
你知道吗?
小知识:平均数很敏感,当数据中含有极个别特别大
或特别小的数据时,平均数就不能很好的反映一般水
平,所以一定要去掉最高分和最低分来求平均分.
1.通过这节课你学到了什么?
2.请你列举在生活中,有哪些统计需要应用平
均数?哪些需要中位数?哪些需要众数?
课堂小结
第20章 数据的整理与初步处理
20.3 数据的离散程度
平均数、众数、中位数的意义?
众数:数据中出现最多的数值.
中位数:将数据按从小到大的顺序排列处在中间位置
的那个值.数据是偶数个时取中间的两个数的平均数作
为中位数.
= 所有数据之和平均数 数据个数
从表中你能得到哪些信息?
下表显示的是某市2016年2月下旬和2017年同期的每日最
高气温,如何对这两段时间的气温进行比较呢?
2月
21日
2月
22日
2月
23日
2月
24日
2月
25日
2月
26日
2月
27日
2月
28日
2016年 12 13 14 22 6 8 9 12
2017年 13 13 12 9 11 16 12 10
问题一
经过计算可以看出,对于 2 月下旬的这段时间而言,
2016年和2017年该市的平均气温相等,都是12°C.
比较两段时间气温的高低,求平均气温是一种常用的
方法.
这是不是说,两个时段的气温情况没有什么差异呢?
小明和小兵两人参加体育项目训练,近期的五次测试成
绩如下表.谁的成绩较为稳定?为什么?
问题二
所以我们说小明的成绩比较稳定.
通过计算,我们发现两人测试成绩的平均值都是13分.
从图可以看到:相比之下,小明的成绩大部分集中在13分附
近,而小兵的成绩与其平均值的离散程度较大.通常,如果
一组数据与其平均值的离散程度较小,我们就说它比较稳
定.
怎样的数能反映一组数据与其平均值的离散程度?
我们已经看出,小兵的测试成绩与平均值的偏差较大,
而小明的较小.那么如何加以说明呢?可以直接将各
数据与平均值的差进行累加吗?在表中写出你的计算
结果.
1 2 3 4 5 求和
小
明
每次测
试成绩 13 14 13 12 13 65
每次成
绩-平
均成绩
0 0 -1 0 0
小
兵
每次测
试成绩 10 13 16 14 12 65
每次成
绩-平
均成绩
-3 0 3 1 -1 0
通过计算,依据最后求和的结果可以比较两组数据围
绕其平均值的波动情况吗?如果不能,请你提出一个可行
的方案.
1
不能
1 2 3 4 5 求平
方和
小
明
每次测
试成绩 13 14 13 12 13
每次成
绩-平
均成绩
0 1 0 -1 0 2
小
兵
每次测
试成绩 10 13 16 14 12
每次成
绩-平
均成绩
-3 0 3 1 -1 20
如果一共进行了7次测试,小明因故缺席了两次,怎样比较谁
的成绩更稳定?请将你的方法与数据填入表中.
65
平均
13
0 1 0 0 1 2 0.4
91 13
9 9 0 1 1 9 9 38 7
38
2
(每次成绩-
平均成绩)
2
( -每次成绩
平均成绩)
我们可以用“先平均,再求差,然后平方,最后平均”
得到的结果表示一组数据偏离平均值的情况.这个结果通
常称为方差.
通常用s2表示一组数据的方差,用 x 表示一组数据的平均
数,x1,x2,…,xn表示各个数据.
方差
2 2 2 2
1 2 n
1[(x x) (x x) (x x) ]ns L
比较下列两组数据的方差:
A组:0, 10, 5, 5, 5, 5, 5, 5, 5, 5;
B组:4, 6, 3, 7, 2, 8, 1, 9, 5, 5
解: 先求平均数
5)5591827364(10
1
5)5810(10
1
__
__
B
A
x
x
求方差:
【跟踪训练】
6])55(2)59()51()58()52(
)57()53()56()54[(10
1
5])55(8)510()50[(10
1
22222
22222
2222
B
A
s
s
A的方差﹤B的方差
1. 甲、乙、丙、丁四位选手各10次射击成绩的平均数和
方差如下表:
则这四人中成绩发挥最稳定的是( )
A.甲 B.乙 C.丙 D.丁
【解析】选B.在平均数相同的情况下,方差越小越稳定.
由题意可知乙的方差最小,所以这四人中成绩发挥最稳
定的是乙.
2. 甲、乙两人5次射击命中的环数如下:
甲 7 9 8 6 10
乙 7 8 9 8 8
则这两人5次射击命中的环数的平均数 甲= 乙=8,
方差 ____ .(填“>”“