第6章 数据的分析
6.1 平均数、中位数、众数
6.1.1 平均数
在小学阶段,我们对平均数有过一些了
解,知道平均数是对数据进行分析的一
个重要指标.
一个小组10名同学的身高(单位:cm)如下表所示:
编号
身高 151 156 153 158 154 161 155 157 154 157
1 2 3 4 5 6 7 8 9 10
思考
(1) 计算10名同学身高的平均数.
平均数:
= 155.6(cm).
=(151+156+153+158+154+161+155+157
+154+157)÷10
x
编号
身高 151 156 153 158 154 161 155 157 154 157
1 2 3 4 5 6 7 8 9 10
(2)在数轴上标出表示这些同学的身高
及其平均数的点.
x
编号
身高 151 156 153 158 154 161 155 157 154 157
1 2 3 4 5 6 7 8 9 10
(3)考察表示平均数的点与其他的点的
位置关系,你能得出什么结论?
这些点都位于 的两
侧,不会都在平均数
的一侧.
x 可以作为这组同学的
身高的代表值,它反映
了这组同学的身高的平
均水平.
x
编号
身高 151 156 153 158 154 161 155 157 154 157
1 2 3 4 5 6 7 8 9 10
平均数作为一组数据的一个代表值,它
刻画了这组数据的平均水平.
【例1】某农业技术员试种了三个品种的棉花各10
株. 秋收时他清点了这30株棉花的结桃数如下表:
棉花品种 结桃数(个)
甲
84,79,81,84,85,82,83,86,87,
81
乙
85,84,89,79,81,91,79,76,82,
84
丙
83,85,87,78,80,75,82,83,81,
86
哪个品种较好?
棉花品种 结桃数(个)
甲
84,79,81,84,85,82,83,86,87,
81
乙
85,84,89,79,81,91,79,76,82,
84
丙
83,85,87,78,80,75,82,83,81,
86
分析:平均数可以作为一组数据的代表值,它刻画了这组
数据的平均水平.当我们要比较棉花的品种时,可以计算出
这些棉花结桃数的平均数,再通过平均数来进行比较.
则
解:设甲、乙、丙三个品种的平均结
桃数分别 为 ,x x x甲 乙 丙, ,
84+79+81+84+85+82+83+86+87+81 83.210x = =
甲
个 ( ),
85+84+89+79+81+91+79+76+82+84 83.010x = =
乙
个 ( ),
83+85+87+78+80+75+82+83+81+86 82.010x = =
丙
个 ( ),
由于甲种棉花的平均结桃数高于其他两个品种的平均
结桃数,所以我们可以认为甲种棉花较好.
计算器一般有统计功能,我们可以利用该
功能求一组数据的平均数.
不同型号的计算器其操作步骤(按键)可能不同,
操作时需参阅计算器的说明书.
通常先按统计键,使计算器进入统计运算模式,然
后依次输入数据x1 , ,x2, ,…,最后按求平
均数的功能键,即可得到该组数据的平均数.
在一次全校歌咏比赛中,7位评委给一个班级
的打分分别是:
9.00,8.00,9.10,9.10,9.15,
9.00,9.58.
怎样评分比较公正?
思考
我们可以计算该班级歌咏比赛的
平均分
9.00+8.00+9.10+9.10+9.15+9.00+9.58 8.997x= = .
但实际上评委的评判受主观因素影响比较大,评分
也比较悬殊,为了消除极端数对平均数的影响,一
般去掉一个最高分和一个最低分,最后得分取
9.00+9.10+9.10+9.15+9.00 9.075x = = .
这个分数才比较合理地反映了这个班级的
最后得分.
1. 七年级(1)班举行1 min 跳绳比赛,以小组为单
位参赛.第1小组有8名同学,他们初赛和复赛时的成
绩如下表(单位:次):
编
号
初
赛
90 85 85 78 101 105 97 96
复
赛
100 90 86 78 98 100 106 98
1 2 3 4 5 6 7 8
练习
(1)计算这组同学初赛和复赛的平均成
绩.
答:这组同学初赛的平均成绩为
92.125 ,复赛的平均成绩为94.5 .
(2)你认为这组同学的初赛成绩好,还是复
赛成绩好?
答:复赛的成绩好.
2. 某跳水队计划招收一批新运动员.请6位评委给选拔赛
参加者打分,平均分数超过8.5分才能被选上.刘明在比
赛时的成绩为8.30,8.25,8.45,8.20,8.30,9.60,你
认为刘明选得上吗?
答:刘明的平均分数为8.52,所以
刘明能被选上.
3. 小明班上同学的平均身高是1.4m,小强班上
同学的平均身高是1.45m. 小明一定比小强矮吗?
答:不一定.
学校举行运动会,入场式中有七年级的一个队列.
已知这个队列共100人,排成10行,每行10人.其中
前两行同学的身高都是160cm,接着3行同学的身高
都是155cm,最后5行同学的身高都是150cm. 怎样求
这个队列的平均身高?
思考
100名同学的身高有
100个数,把它们加
起来再除以100,就
得到平均数.
这组数据中有许
多相同的数,相
同的数求和可用
乘法来计算.
用 表示平均身高,
则
x
160 20+155 30+150 50 100× × ×x= ÷( )
20 30 50160 +155 +150100 100 100× × ×=
160 0.2+155 0.3+150 0.5× × ×=
1 5 3 . 5 c m = ( ) .
在上面的算式中,0.2,0.3,0.5分别表示160,
155,150这三个数在数据组中所占的比例,分别
称它们为这三个数的权数:
160的权数是0.2,
三个权数之和为0.2+0.3+0.5=1.
153.5是160,155,150分别以0.2,0.3,0.5为权的
加权平均数.
155的权数是0.3,
150的权数是0.5,
有一组数据如下:
(1)计算这组数据的平均数.
1.60,1.60,1.60,1.64,1.64,
1.68,1.68,1.68.
这组数据的平均数为
1.60+1.60+1.60+1.64+1.64+1.68+1.68+1.68 1.64.8 =
思考
(2)这组数据中1.60,1.64,1.68的权数分别
是多少?求出这组数据的加权平均数.
有一组数据如下:
1.60,1.60,1.60,
1.64,1.64,1.68,
1.68,1.68.
31.60 8的权数为 , 11 .6 4 4的 权 数 为 ,
31.68 8 的权数为 .
这组数据的加权平均数为
3 1 31.60 +1.64 +1.688 4 8× × ×
0.6+0.41+0.63=
= 1.64.
(3)这组数据的平均数和加权平均数有什么
关系?
有一组数据如下:
1.60,1.60,1.60,
1.64,1.64,1.68,
1.68,1.68.
这组数据的平均数和加权平均数相等,都等于
1.64,意义也恰好完全相同.
但我们不能把求加权平均数看成是求平均数的简
便方法,在许多实际问题中,权数及相应的加权平均
数都有特殊的含义.
平均数可看做是权数相同的加权平均数.
【例2】某纺织厂订购一批棉花,棉花纤维长短不一,
主要有3cm,5cm,6cm三种长度. 随意地取出10g棉花
并测出三种长度的棉花纤维的含量,得到下面的结果:
纤维长度(cm) 3 5 6
含量(g) 2.5 4 3.5
问:这批棉花纤维的平均长度是
多少?
分析:在取出的10 g棉花中,长度为3cm,5cm,
6cm棉花的纤维各占25%,40%,35%,显然
含量多的棉花纤维的长度对平均长度的影响大,
所以要用求加权平均数的方法来求出这批棉花
纤维的平均长度.
解:这批棉花纤维的平均长
度是
答:这批棉花纤维的平均长度
是4.85cm.
2.5 4 3.53 +5 +6 =4.85 cm10 10 10× × × ( ).
1. 某棒球运动员近50场比赛的得分情况如
下表:
得分 0 1 2 3 4
次数 14 26 7 2 1
求该运动员50场比赛得分的平均数.
答:该运动员50场比赛得分的平均
数为
(14×0+26×1+7×2+2×3+1×4)÷50
=1.
2. 某出版社给一本书的作者发稿费,全书20
万字,其中正文占总字数的 ,每千字50元;
答案部分占总字数的 ,每千字30元.问全书
平均每千字多少元?
4
5
1
5
答:全书平均每千字为46元.
4 120 10 50+20 10 30 20 10 =465 5× × × × × × ÷ ×( ) ( )
通过本节课,你有什么收获?
你还存在哪些疑问,和同伴
交流。
我思 我进步
6.1.2 中位数
张某管理一家餐馆,下面是该餐馆所有工作人员在
2010年10月的工资情况:
张某:15 000元; 会计:1 800元;
厨师甲:2 500元;厨师乙:2 000元;
杂工甲:1 000元; 杂工乙:1 000元;
服务员甲:1 500元;服务员乙:1
200元;服务员丙:1 000元.
计算他们的平均工资,这个平均工资能反映该餐馆
员工在这个月收入的一般水平吗?
思考
解:设餐馆全体员工的平均工资为 ,
则(可用 计算器计算)
x
15000+1800+2500+2000+1000 1000 1500 1200 1000
9
3000
x
(元)
实际上,3000元不能代表餐馆员工在这个月收
入的一般水平,因为员工中除张某外工资最高
的厨师甲的月收入2500元都小于这个平均数.
若不计张某的工资,设8名员工的平均工资为 ,
则(可用计算器计算)
x
1800+2500+2000+1000 1000 1500 1200 1000= 8
= 1500
x
元( )
不计张某的工资,餐馆员工的月平均工资为1500
元,这个数据能代表餐馆员工在这个月收入的一
般水平.
还有没有别的方法
呢?
我们可以把餐馆中人员的月收入按从小到大的顺序
排列:
位于中间的数据,即第5个数据为1 500,
1000,1 000,1000,1200,1500,1800,2000,2500,15000.
它能比较合理地反映该餐馆员工的月收入水平.
1000,1000,1000,1200,1500,1800,2000,
2500,15000
中位数
把一组数据从小到大的顺序
排列,如果数据的个数是奇
数,那么位于中间的数称为
这组数据的中位数.
中间两个数的平
均数
1000,1000,1000,1200,1500,1800,
2000,2500
如果数据的个数是偶数,那
么位于中间的两个数的平均
数称为这组数据的中位数.
【例】求下列两组数据的中位数:
(1)14,11,13,10,17,16,28;
(2)453,442,450,445,446,457,448,449,
451,450
解: 把这组数据从小到大排
列:
10,11,13,14,16,17,28
位于中间的数是14,因此这组数据的
中位数是14.
中位数
把这组数据从小到大排列:
442,445,446,448,449,450,450,
451,453,457
位于中间的两个数是449和450,这两个数的平
均数是 449.5,因此这组数据的中位数是449.5.
中间的两
个数
中位数把一组数据分成相同数目的两部分,
其中一部分都小于或等于中位数,而另一
部分都大于或等于中位数.
因此,中位数常用来描述“中间位置”或“中等
水平”,但中位数没有利用数据组中所有的信息.
1. 求下列各组数据的中位数:
(1)100,75,80,73,50,60,70;
解:把这组数据从小到大排列:
50,60,70,73,75,80,100
位于中间的数是73,因此这组数据的中位数是
73.
练习
(2)120,100,130,200,80,140,
125,180.
解:把这组数据从小到大排列:
80,100,120,125,130,140,180,
200
位于中间的数是125和130,所以这两个
数的平均数是127.5,因此这组数据的中
位数是127.5 .
2. 求下面各组数据的中位数和平均数:
(1)17,12,5,9,5,14;
解:把这组数据从小到大排列:
5,5,9,12,14,17
位于中间的数是9和12,这两个数的
平均数是10.5,因此这组数据的中位
数是10.5;
这组数据的平均数是:
(17+12+5+9+5+14)÷6=10.3
(2)20,2,2,3,9,1,22,11,28,
2,0,8,3,29,8,1,5
解:把这组数据从小到大排列:
0,1,1,2,2,2,3,3,5,8,8,9,11,20,
22,28,29
位于中间的数是5,因此这组数据的中位数是5;
这组数据的平均数是:
(20+2+2+3+9+1+22+11+28+2+0+8+3+29+8
+1+5)÷17=9.06
通过本节课,你有什么收获?
你还存在哪些疑问,和同伴
交流。
我思 我进步
6.1.3 众数
下面是一家鞋店在一段时间内各种尺码的男鞋
的销售情况统计表:
鞋的尺码(cm) 23 23.5 24 24.5 25 25.5 26 26.5
销售量(双) 5 6 6 10 17 10 12 7
思考
这家店销售量最多的男鞋是哪种尺码的?店
主最关心的问题是什么?
这家店销售量最多的是25cm的鞋,店
主最关心的就是销售量,所以店主下
次进货时可以多进这个尺码的鞋.
在一组数据中,把出现次数最多的数叫做这
组数据的众数.
在上面的问题中,25是鞋的尺码中出现次数
最多的数,所以25是这组数据的众数.
当一组数据中某数据多次重复出现时,常可以用众
数作为这组数据的数值的一个代表值.
一组数据的众数可以不止一个.
【例】某公司全体职工的月工资如下:
试求出该公司工资数据中的众数、中位
数和平均数.
月工资
(元) 18000 12000 8000 6000 4000 2500 2000 1500 1200
人数
1
(总经
理)
2
(副总
经理)
3 4 10 20 22 12 6
解: 在上述80个数据中,2000出现了22次,出
现的 次数最多,因此这组数据的众数是2000.
把这80个数据按从小到大的顺序
排列后,可以 发现位于中间的数是
2000,2500,因此这组数据的中位数
是
2000+2500 =2250.2
这组数据的平均数为
.
18000 12000 2 8000 3 6000 4 4000 10 2500 20 2000 22 1500 12 1200 6
80
249200 3115 80
x
我们把这组数据的众数、中位数、平均数
表示在图中:
在例4中,你认为用平均数、中位数或众数中的哪
一个更能反映该公司的工资水平?
工资的平均数3115 偏高,因为大多数员
工的工资都达不到这个平均数,用它来
作为该公司员工工资的代表值并不合适.
众数是2000,中位数是2250,它们代表
了大多数人的工资水平,不偏高也不偏
低,较能反映工资水平的实际情况.
讨论
平均数、中位数和众数都是一组数据的代表,
它们从不同侧面反映了数据的集中趋势.
平均数的计算要用到所有的数据,它能够充分利用数
据提供的信息,因此在现实生活中应用较广,但它容
易受极端值的影响;
中位数对极端值不敏感,但没有利用数据中所
有的信息;
众数只能反映一组数据中出现次数最多的数据,
也没有利用数据中所有的信息.
1. 求下列各组数据的众数:
(1)3,4,4,5,3,5,6,5,
6;
解:根据题意可知,5出现的次数最多,因此,
5是这组数据的众数.
练习
(2)1.0,1.1,1.0,0.9,0.8,
0.9,1.1,0.9
解:根据题意可知,0.9出现的次数最多,
因此,0.9是这组数据的众数.
2. 某班30人所穿运动服尺码的情况为:穿75号码
的有5人,穿80号码的有6人,穿85号码的有15
人,穿90号码的有3人,穿95号码的有1人. 穿
哪一种尺码衣服的人最多?这个数据称为什
么数?
解:根据题意可知,穿85号衣服的人最多.
因此85号是这组衣服尺码数据的众数.
通过本节课,你有什么收获?
你还存在哪些疑问,和同伴
交流。
我思 我进步
第6章 数据的分析
6.2 方差
有两个女声合唱队,各由5名队员组成,她们
的身高为(单位:厘米):
甲队:160,162,159,160,159
乙队:180,160,150,150,160.
如果单从队员的身高考虑,哪队的演出效果好?
不难算出每个队的平均身高都是160厘米,但甲
队身高波动小,乙队身高波动大,单从身高考
虑,甲队比较整齐,演出的效果会好一些.
思考
一组数据中的数与这组数据的平均数的偏离程度是数据
的一个重要特征,它反映了一组数据的分散程度.如何
反映一组数据与数据与其平均数的偏离程度?给定一组
数据:3,3,4,6,8,9,9,其平均数是
3 3 4 6 8 9 9 7 6
这组数据中的每个数与平均数6
的偏差是:
363 363 264 066
268 369 369
将各个数与平均数的偏差相加,
能否得到总偏差?
( -3 )+( -3 )+( -
2 )+0+2+3+3相加的结果
为0,不能反映总偏差,
这是因为偏差有正有负,
相加对正负相消,因而不
能反映总偏差.
你用什么方法可以反映总偏差的大小?
可以考虑先取绝对值再相加.
但在今后的计算中,绝对值用起来不方便.其
实,一个数的绝对值是非负的,一个数的平方
也是非负的;并且绝对值较大的数,它的平方
也较大,因此这组数据的每一个数与平均数的
差的平方也能反映这个数与平均数的偏离程
度.
不如先将基数与平均数之差平方,然后再相加,就不会出现
正负相消的情况.
思考
一组数据中的各数与其平均数的偏差的平方的平均
值,称为这组数据的方差.
例如,上面所给的一组数据的方差是
7
44
我们将上面计算方差的过程用下面的表格来表示:
数据编号 1 2 3 4 5 6 7
数据 3 3 4 6 8 9 9
平均数 (3+3+4+6+8+9+9) ÷7=6
偏差 -3 -3 -2 0 2 3 3
偏差的平
方
9 9 4 0 4 9 9
偏差平方
和
9+9+4+0+4+9+9=44
方差
4444 7
7
计算前面的实例中甲、乙两个女声合唱队各队队
员身高的方差,并说明计算结果的实际意义.
2 2 2 2 2160 160 162 160 159 160 160 160 159 160 5
2 22 2 220 0 10 10 0 5 120
2 22 2 20 2 1 0 1 5 1.2
乙队队员身高的方差是:
2 2 2 2 2180 160 160 160 150 160 150 160 160 160 5
解:甲、乙两队中,每队队员的平均身高都是160
厘米,甲队队员身高的方差是:
计算的结果表明:乙队队员身高的方差(120厘
米2)比甲队队员身高的方差(1.2厘米2)大得多,
即乙队中各队员的身高与她们的平均身高的偏差
大,而甲队中各队员的身高与她们的平均身高的
偏差小,这说明乙队的队员高的高,矮的矮而甲
队队员的身高比较整齐.
方差反映的是一组数据哪个方面的特征?
方差反映的是一组数据与其平均数
的偏离程度,方差越小,数据越集
中;方差越大,数据越分散.
【例】5名篮球队员的身高分别为(单位:厘米)193 ,
182, 187 , 174 , 189,试求出这组数据的极差、方
差、并比较其具体涵义.
193 182 187 174 189 5 185 厘米
2 2 2 2 2193 185 182 185 187 185 174 185 189 185 5
42.8 厘米
极差是最高的队员和最矮的队员身高之差,它只与数据的最
大值和最小值有关而与其他的数据无关,所以没有充分利用
数据提供的信息;但极差很容易计算,用起来特别方便,直
接反映一组数据的所在的范围的跨度,方差是每个队员的身
高与她们的平均身高的偏差的平方的平均值,它涉及数据组
中的每个数据,反映了数据组与其平均数的偏离程度.
解:极差: 193-174=19(厘米)
平均身高:
方差:
1.一个小组有8名同学,分别测量同一根绳子的长度,
测得的数据如下(单位:厘米)
108.5, 110,109.3,108.9
110.8 ,110.5 ,109.4 ,109.2
(1)如何确定这根绳子的长度的近似值?
(2)如何评价测量结果的准确程度?
练习
这根绳子的长度的近似值是109.6厘米
计算其方差,方差越小准确程度越高
解:
2 2 2 2
2
2 2 2 2
105.5 109.6 110 109.6 109.3 109.6 108.9 109.61 2.5
8 110.8 109.6 110.5 109.6 109.4 109.6 109.2 109.6
S
1 108.5 110 109.3 108.9 110.8 110.5 109.4 109.2 109.6
8
x
2.一组数据的方差为0,这组数据有什么特点?方差
可以是负数吗?为什么?
每个数据都等于这组数据的平均数
不可以
2 2 22
1 2
1 ... 0nS x x x x x x
n
因为
通过本节课,你有什么收获?
你还存在哪些疑问,和同伴
交流。
我思 我进步