23.1
平均数与加权平均数(第
1
课时)
第二十三章 数据分析
张老师乘公交车上班
,
从家到学校有
A
,
B
两条路线可选择
.
对每条路线
,
各记录了
10
次路上花费的时间
,
依据数据绘制的统计图如图所示
.
根据图形提供的信息
,
你能判断哪条路线平均用时较少
,
哪条路线用时的波动较大吗
?
如何定量地描述平均用时及数据的波动情况
?
问题思考
实际问题中平均数的计算
某农科院为了寻找适合本地的优质高产小麦品种
,
将一块长方形试验田分成面积相等的
9
块
,
每块
100 m
2
,
在土壤肥力、施肥、管理等都相同的条件下试种
A
,
B
两个品种的小麦
.
小麦产量如下表
:
(1)
观察下图
,
哪个品种小麦的产量更高些
?
(3)
如果只考虑产量这个因素
,
哪个品种更适合本地种植
?
(2)
以
100 m
2
为单位
,
如何比较
A
,
B
两个小麦品种的单位面积产量
?
5
.
通过计算
,
你认为哪个品种更适合本地种植
?
引导分析
1
.
通过直观观察
,
你能得到哪个品种小麦的产量更高些吗
?
2
.
要比较哪个品种的产量高
,
我们通常通过计算什么值定量比较
?
3
.
如何求一组数据的平均值
?
4
.
你能求出
A
,
B
两个小麦品种的单位面积产量吗
?
B
品种小麦的平均产量
: ×(94
+
100
+
105
+
85)
=
96(kg)
.
解
:
A
品种小麦的平均产量
: ×(95
+
93
+
82
+
90
+
100)
=
92(kg),
就试验结果来看
,
B
品种小麦比
A
品种小麦的平均产量高
,
B
品种更适合本地种植
.
1
.
如果有
n
个数
x
1
,
x
2
,
…
,
x
n
,
你如何求它们的平均数
?
引导思考
:
2
.
每个数与平均数的差的和是多少
?
(
一组数据中
,
每个数据与平均数的偏差总和为
0)
一般地
,
我们把
n
个数
x
1
,
x
2
,
…
,
x
n
的和与
n
的比
,
叫做这
n
个数的算术平均数
,
简称平均数
,
记作
,
读作“
x
拔”
,
即
算数平均数
(
x
1
+
…
+x
n
)
.
因为 所以取平均数可以抵消各数据之间的差异
.
因此
,
平均数是一组数据的代表值
,
它反映了数据的“
一般水平
”
.
从一批鸭蛋中任意取出
20
个
,
分别称得质量如下
:
80
85
70
75
85
85
80
80
75
85
85
80
75
85
80
75
85
70
80
75
做一做
(1)
整理数据
,
填写统计表
.
质量
/g
70
75
80
85
频数
(2)
求这
20
个鸭蛋的平均质量
.
质量
/g
70
75
80
85
频数
2
5
6
7
解
:(1)
×(70×2+75×5+80×6+85×7)
=
79
.
5(g)
.
即这
20
个鸭蛋的平均质量是
79
.
5 g
.
追问
:
当一组数据中某个数重复出现多次时
,
我们常怎样计算这组数据的平均数
?
(
先整理数据
,
列出频数分布表
,
用简单方法计算平均数
)
大家谈谈
小明和小亮分别是这样计算平均数的
.
小明的计算结果
:
×(70
+
75
+
80
+
85)
=
77
.
5(g)
.
小亮的计算结果
:
×(70×2+75×5+80×6+85×7)
=
79
.
5(g)
.
你认为他们谁的计算方法正确
?
请和同学交流你的看法
.
归纳
:
一组数据中某个数重复出现多次时
,
先整理数据
,
列出频数分布表
,
再用简单方法计算平均数
.
用计算器求平均数
求“做一做”中
20
个数据的平均数的步骤
(
用
A
型计算器
):
80
85
70
75
85
85
80
80
75
85
85
80
75
85
80
75
85
70
80
75
质量
/g
70
75
80
85
频数
2
5
6
7
步骤
按键
显示
MODE 2
选择统计模式
,
进入一元统计状态
Stat x
0
输入第
1
个数据
70,
频数
2
7 0 , 2 DATA
n=2
输入第
2
个数据
75,
频数
5
7 5 , 5 DATA
n=7
输入第
3
个数据
80,
频数
6
8 0 , 6 DATA
输入第
4
个数据
85,
频数
7
显示统计结果
8 5 , 7 DATA
Rcl
n=13
n=20
=79.5
若要了解一组数据的平均水平
,
可计算这组数据的算术平均数
,
算术平均数与一组数据的每一个数据都有关系
,
当一个数据发生变化时
,
会影响整组数据的平均数
,
所以算术平均数的缺点是容易受个别特殊值的影响
,
有时不能代表一组数据的集中趋势
.
[
知识拓展
]
检测反馈
1
.
2015
年
5
月某日我国部分城市的最高气温统计如下表所示
:
城市
武
汉
成
都
北
京
上
海
海
南
南
京
拉
萨
深
圳
气温
/℃
27
27
24
25
28
28
23
26
这组数据的平均数是
(
)
A.24 ℃ B.25 ℃ C.26 ℃ D.27 ℃
解析
:(27+27+24+25+28+28+23+26)÷8=208÷8=26(℃)
.
故选
C.
C
2
.
在一次青年歌手大奖赛上
,
七位评委为某位歌手打出的分数如下
(
单位
:
分
):9
.
5,9
.
4,9
.
6,9
.
9,9
.
3,9
.
7,9
.
0,
去掉一个最高分和一个最低分后
,
所剩数据的平均数是
(
)
A.9
.
2
分
B.9
.
3
分
C.9
.
4
分
D.9
.
5
分
D
3
.
若
8
个数的平均数是
11,
还有
12
个数的平均数是
12,
则这
20
个数的平均数是
.
解析
:
这些数之和为
8×11+12×12
=
232,
故这些数的平均数是
=
11
.
6
.
故填
11
.
6
.
11
.
6
4
.
某老师为了了解学生周末利用网络进行学习的时间
,
在所任教班级随机调查了
10
名学生
,
其统计数据如表
:
时间
/
小时
4
3
2
1
0
人数
/
名
2
4
2
1
1
求这
10
名学生周末利用网络进行学习的平均时间
.
解
:
×(4×2+3×4+2×2+1×1+0×1)
=
2
.
5(
时
)
.
即这
10
名学生周末利用网络进行学习的平均时间是
2
.
5
小时
.
23.1
平均数与加权平均数(第
2
课时)
第二十三章 数据分析
在一次数学考试中
,
八年级
(1)
班和
(2)
班的考生人数和平均成绩如下表
:
班级
1
班
2
班
人数
46
54
平均成绩
/
分
86
80
【
问题
】
1
.
表格中“
86
分”所反映的实际意义是什么
?
2
.
求这两个班的平均成绩
.
加权平均数的概念
共同探究:
假期里
,
小红和小惠结伴去买菜
,
三次购买的西红柿价格和数量如下表
:
单价
/(
元
/
千克
)
4
3
2
合计
小红购买的数量
/kg
1
2
3
6
小惠购买的数量
/kg
2
2
2
6
从平均价格看
,
谁买的西红柿要便宜些
?
≈2
.
67(
元
/
千克
),
=
3(
元
/
千克
)
.
从平均价格看
,
小红买的西红柿要便宜些
.
追加提问
:
1
.
有的同学认为每次购买单价相同
,
购买总量也相同
,
平均价格应该也一样
,
都是
(4
+
3
+
2)÷3
=
3(
元
/
千克
)
.
这样解答是否正确
?
为什么
?
2
.
有的学生是这样思考的
:
购买的总量虽然相同
,
但小红花了
16
元
,
小惠花了
18
元
,
所以平均价格不一样
,
小红买的西红柿要便宜些
.
这样的想法正确吗
?
为什么
?
3
.
如果小红三次购买的数量分别为
2,1,3,
小惠三次购买的数量分别为
1,3,2,
她们购买的西红柿的平均价格分别是多少
?
4
.
通过上面的计算
,
小红和小惠每次购买西红柿的数量不同
,
所求的平均数是否相同
?
已知
n
个数
x
1
,
x
2
,
…
,
x
n
,
若
w
1
,
w
2
,
…
,
w
n
为一组正数
,
则把
叫做
n
个数
x
1
,
x
2
,
…
,
x
n
的加权平均数
,
w
1
,
w
2
,
…
,
w
n
分别叫做这
n
个数的
权重
,
简称为
权
.
在“共同探究”中
,
加权平均数是多少
?
哪些数是权
?
(
小红购买的西红柿平均价格约为
2
.
67
元
/
千克
,
它是数
4,3,2
的加权平均数
,
三个数的权分别为
1,2,3)
例
1
某学校为了鼓励学生积极参加体育锻炼
,
规定体育科目学期成绩满分
100
分
,
其中平时表现
(
早操、课外体育活动
)
、期中考试和期末考试成绩按比例
3∶2∶5
计入学期总成绩
.
甲、乙两名同学的各项成绩如下
:
学生
平时表现
/
分
期中考试
/
分
期末考试
/
分
甲
95
90
85
乙
80
95
88
分别计算甲、乙的学期总成绩
.
解
:
三项成绩按
3∶2∶5
的比例确定
,
就是分别用
3,2,5
作为三项成绩的权
,
用加权平均数作为学期总成绩
.
甲的学期总成绩为
=
89(
分
),
乙的学期总成绩为
=
87(
分
)
.
1
.
分配的“权”不同
,
甲、乙二人的总成绩是否发生变化
?
2
.
算术平均数和加权平均数的区别和联系是什么
?
联系:
算术平均数是加权平均数各项的权都相等的一种特殊情况
.
算术平均数与加权平均数的区别和联系
:
区别:
由于权的不同导致结果不同,所以权的差异对结果有影响
.
做一做
测试
项目
专业
素质
综合
素质
外语
水平
临场应
变能力
测试成
绩
/
分
甲
9.0
8.5
7.5
8.8
乙
8.0
9.2
8.4
9.0
(1)
如果按四项测试成绩的算术平均数排名次
,
名次是怎样的
?
某电视节目主持人大赛要进行
专业素质、综合素质、外语水平和临场应变能力四项测试
,各项测试均采用
10
分制,两名选手的各项测试成绩如下表所示:
(2)
如果规定按专业素质、综合素质、外语水平和临场应变能力四项测试的成绩各占
60%,20%,10%,10%
计算总成绩
,
名次有什么变化
?
解
:(1)
甲、乙各项成绩的算术平均数分别为
:
=
8
.
45(
分
),
=
8
.
65(
分
)
.
比较算术平均数
,
乙排名第一
,
甲排名第二
.
(2)
甲、乙的加权平均成绩分别为
:
=
9
.
0×60%
+
8
.
5×20%
+
7.5×10%
+
8
.
8×10%
=
8
.
73(
分
),
=
8
.
0×60%
+
9
.
2×20%
+
8
.
4×10%
+
9
.
0×10%
=
8
.
38(
分
)
.
比较加权平均数
,
甲排名第一
,
乙排名第二
.
2
.
按算术平均数排名和加权平均数排名有什么区别
?
提问
:
1
.
按照算术平均数和加权平均数的计算方法分别求平均数
,
对排名有影响吗
?
归纳
:
按测试成绩的算术平均数排名次
,
实际上是将四项测试成绩同等看待
.
而按加权平均数排名次
,
则是对每项成绩分配不同的权
,
体现每项成绩的重要程度不同
.
如专业素质成绩的权重为
60%,
说明专业素质对主持人最重要
.
当各数据的重要程度不同时
,
一般采用加权平均数作为一组数据的代表值
.
2
.
算术平均数是加权平均数的一种特例
.
加权平均数的实质是考虑不同权重的平均数,当加权平均数的各项权相同时,就变成了算术平均数
.
[
知识拓展
]
1
.
数据中的“权”反映数据的相对“重要程度”,其表现形式有:数据所占的百分比、各个数据所占的比值,数据出现的次数
.
权越大,该数据所占的比重越大,反之则越小
.
解析
:
=
4(
件
),
即这个兴趣小组平均每人采集标本
4
件
.
故选
B
.
检测反馈
1
.
学校生物兴趣小组
11
人到校外采集标本
,
其中有
2
人每人采集
6
件
,4
人每人采集
3
件
,5
人每人采集
4
件
,
则这个兴趣小组平均每人采集标本
(
)
A.3
件
B.4
件
C.5
件
D.6
件
B
2
.
某校把学生的纸笔测试、实践能力、成长记录三项成绩分别按
50%,20%,30%
的比例计入学期总评成绩
,90
分以上为优秀
.
甲、乙、丙三人的各项成绩如下表
(
单位
:
分
),
学期总评成绩为优秀的是
(
)
纸笔测试
实践能力
成长记录
甲
90
83
95
乙
88
90
95
丙
90
88
90
A.
甲
B.
乙、丙
C.
甲、乙
D.
甲、丙
解析:由题意知,甲的总评成绩
=
90×50%
+
83×20%
+
95×30%
=
90
.
1(分),
乙的总评
成绩
=
88×50%
+
90×20%
+
95×30%
=
90
.
5(分),
丙的总评成绩
=
90×50%
+
88×20%
+
90×30%
=
89
.
6(分),
∴甲、乙的学期总评成绩是优秀
.
故选C.
C
3
.
某中学随机调查了
50
名学生
,
了解他们一周在校的体育锻炼时间
,
结果如下表所示
:
时间
/
小时
5
6
7
8
人数
/
名
10
15
20
5
则这
50
名学生这一周在校的平均体育锻炼时间是
.
解析:根据题意得(5×10+6×15+7×20+8×5)÷50
=
(50+90+140+
40)÷50=320÷50=6.4(小时)
.
故这50名学生这一周在校的平均体育锻炼时间是6
.
4小时
.
故填6
.
4小时
.
6
.
4
小时
4
.
某广告公司欲招广告策划人员一名
,
对甲、乙、丙三名候选人进行三项素质测试
,
它们的各项测试成绩如下表所示
:
测试项目
测试成绩
/
分
甲
乙
丙
创新
能力
72
85
67
综合
知识
50
74
70
计算机操作
88
45
67
请你用所学的统计知识解决下列问题
.
(1)
如果根据三项测试的平均成绩确定录用人选
,
那么谁将被录用
?
(2)
根据实际需要
,
公司将创新能力、综合知识、计算机操作三项测试的得分按
4∶3∶1
的比例确定各人的测试成绩
,
那么谁将被录用
?
解
:(1)
甲的平均成绩是
×(72
+
50
+
88)
=
70(
分
),
乙的平均成绩是
×(85
+
74
+
45)
=
68(
分
),
丙的平均成绩是
×(67
+
70
+
67)
=
68(
分
),
因为
70
>
68
=
68,
所以候选人
甲
将被录用
.
因为
75
.
875
>
68
.
125
>
65
.
75,
所以候选人
乙
将被录用
.
(2)
甲的测试成绩
是
=
65
.
75(
分
),
乙的测试成绩是
=
75
.
875(
分
),
丙的测试成绩是
=
68
.
125(
分
),
23.2
中位数和众数(第
1
课时)
第二十三章 数据分析
学 习 新 知
王小龙毕业后去一家肯德基应聘工作
,
经理和他说我们这里工作人员收入很高
,
平均工资有
2500
元
,
王小龙参加工作后
,
过了一个月他拿到了
900
元的工资
,
觉得十分不满
,
他的工资水平远远低于
2500
元
,
于是找到了经理
,
王小龙认为自己受了欺骗
,
经理拿出工作人员的工资表如下
.
你认为经理是否骗人了
?
人员
经理
店长
员工
A
员工
B
员工
C
员工
D
试用工
月薪
/
元
6000
5000
1800
1500
1200
1100
900
中位数与众数的概念及意义
问题
1
小琴的英语听力成绩一直很好
,
在六次测试中
,
前五次的得分
(
满分
30
分
)
分别为
:28
分
,25
分
,27
分
,28
分
,30
分
.
第六次测试时
,
因耳机出现故障只得了
6
分
.
如何评价小琴英语听力的实际水平呢
?
(1)
用
6
个分数的平均数评价小琴英语听力的实际水平合理吗
?
(2)
如果不合理
,
那么应该用哪个数作为评价结果呢
?
问题
2
某班用无记名投票的方式选班长
,5
名候选人分别编为
1
号
,2
号
,3
号
,4
号
,5
号
.
投票结果如下表
:
在这个问题中
,
我们最关注的是什么
?
(1)
一般地
,
将
n
个数据按大小顺序排列
,
如果
n
为奇数
,
那么把处于中间位置的数据叫做这组数据的中位数
;
如果
n
为偶数
,
那么把处于中间位置的两个数据的平均数叫做这组数据的
中位数
.
如图所示
,
图
(1)
中
5
个数据的中位数为
x
3
,
图
(2)
中
6
个数据的中位数为
(
x
3
+x
4
)
.
一般地
,
把一组数据中出现次数最多的那个数据叫做
众数
.
(
当数据的个数为
n
,
n
为奇数时
,
中位数是从小到大
(
或从大到小
)
排列的第
个数
;
当
n
为偶数时
,
中位数是从小到大
(
或从大到小
)
排列的第
个数与第
+
1
个数的平均数
.
众数是一组数据中出现次数最多的数
)
【思考】
1
.
中位数和众数是不是都是唯一的
?
2
.
如何求一组数据的中位数和众数
?
(
中位数是唯一的
,
众数不一定是唯一的
)
解
:45
个数据的平均数为
×(5×2+10×6+15×14+20×12+25×8+30×3)=18(min).
例
1
统计全班
45
名学生每天上学路上所用的时间
.
如果时间取最接近
5
的倍数的整数
,
那么整理后的数据如下表
:
所
用
时间
/
min
5
10
15
20
25
30
合计
人数
/
名
2
6
14
12
8
3
45
求所用时间的平均数、中位数和众数
.
将这
45
个数据由小到大排序
,
第
23
个数据是
20 min,
所以中位数是
20 min
.
所用时间出现最多的是
15 min,
所以众数是
15 min
.
检测反馈
1
.
实验中学九年级一班十名同学进行定点投篮测试
,
每人投篮六次
,
投中的次数统计如下
:5,4,3,5,5,2,5,3,4,1,
则这组数据的中位数、众数分别为
(
)
A.4,5 B.5,4 C.4,4 D.5,5
解析
:
将这组数据重新排序为
1,2,3,3,4,4,5,5,5,5,
中位数是按从小到大排列后第
5,6
个数的平均数
,
为
4
.
众数是在一组数据中
,
出现次数最多的数据
,
这组数据中
,
出现次数最多的是
5,
故这组数据的众数为
5
.
故选
A.
A
2
.
对于数据
3,3,2,3,6,3,10,3,6,3,2
.
①
这组数据的众数是
3;②
这组数据的众数与中位数的数值不等
;③
这组数据的中位数与平均数的数值相等
;④
这组数据的平均数与众数的数值相等
.
其中正确的结论有
(
)
A.1
个
B.2
个
C.3
个
D.4
个
解析
:
将这组数据从小到大排列为
2,2,3,3,3,3,3,3,6,6,10,
共
11
个数
,
所以第
6
个数据是中位数
,
即中位数为
3
.
数据
3
出现的次数最多
,
所以众数为
3
.
平均数为
(2+2+3+3+3+3+3+3+6+6+10)÷
11
=
4,
由此可知
①
正确
,②③④
均错误
.
故选
A.
A
3
.
一组数据
1,3,2,5,2,
a
的众数是
a
,
这组数据的中位数是
.
解析
:
∵1,3,2,5,2,
a
的众数是
a
,∴
a=
2,
将这组数据从小到大排列为
1,2,2,2,3,5,
中位数为
2
.
故填
2
.
2
4
.
一组数据按照从小到大排列为
2,4,8,
x
,10,14
.
若这组数据的中位数为
9,
则这组数据的众数为
.
解析
:
由题意得
(8+
x
)÷2
=
9,
解得
x
=10,
则这组数据中出现次数最多的是
10,
故众数为
10
.
故填
10
.
10
5
.
某中学初三
(1)
班篮球队有
10
名队员
,
在一次投篮训练中
,
这
10
名队员各投篮
50
次的进球情况如下表
:
进球数
/
个
42
32
26
20
19
18
15
14
人数
1
1
1
1
2
1
2
1
针对这次训练
,
请解答下列问题
:
(1)
求这
10
名队员进球数的平均数、中位数和众数
;
(2)
求这支球队整体投篮命中率
;
(3)
若队员小华的投篮命中率为
40%,
请你分析一下小华在这支球队中的投篮水平
.
解
:
(1)
平均数
=
×(42+32+26+20+19×2+18+15×2+14)=22(
个
)
.
中位数为
19
个
.
众数为
19
个和
15
个
.
(3)
虽然小华的命中率为
40%,
低于整体投篮命中率
44%,
但小华投
50
个球进了
20
个
,
大于中位数
19
个
,
事实上全队有
6
人低于这个水平
,
所以小华在这支队伍中的投篮水平为中等偏上
.
(2)
投篮命中率
=
×100%=44%
.
23.2
中位数和众数(第
2
课时)
第二十三章 数据分析
学 习 新 知
在一次数学考试中
,
小英得了
78
分
,
全班共
32
人
,
其他同学的成绩为
1
个
100
分
,4
个
90
分
,22
个
80
分
,2
个
62
分
,1
个
30
分
,1
个
25
分
.
小英计算出全班的平均分为
77
.
4
分
,
所以小英告诉妈妈说
,
自己这次数学成绩在班上处于“中上水平”
.
3
.
若不能
,
你认为用哪个数据表示此次考试的平均水平更合适
?
为什么
?
【思考】
1
.
小英对妈妈说的情况属实吗
?
你对此有何看法
?
2
.
平均分
77
.
4
分能客观地反映平均水平吗
?
某公司销售部统计了
14
名销售人员
6
月份销售某商品的数量
,
结果如下表
:
6
月份销量
/
件
1500
1360
500
460
400
人数
/
名
1
1
5
4
3
(2)
根据计算的统计量
,
销售定额定为多少比较合适
?
说明理由
.
(1)
分别求销量数据的平均数、中位数和众数
;
解
:(1)
=
600(
件
),
(2)
销售定额定为
480
件比较合适
.
理由
:
定为中位数
480
件
,
有半数员工能完成定额
,
能调动员工的积极性
.
中位数为
=
480(
件
),
众数为
500
件
.
取平均数、中位数和众数都是刻画一组数据集中趋势的方法
,
因为方法不同
,
所以得到的结论也可能不同
.
不同的方法没有对错之分
,
只是能够更客观地反映实际背景的方法要更好一些
.
强调
例
2
某企业
50
名职工的月工资分为
5
个档次
,
分布情况如下表
:
月工资额
/
元
2500
3000
3500
4000
4500
人数
/
名
6
12
18
10
4
(1)
求月工资的平均数和中位数
;
(2)
企业经理关心哪个数
?
普通职工关心哪个数
?
解
:(1)
月工资的平均数为
×(2500×6+3000×12+3500×18+4000×10+4500×4)=3440(
元
)
.
50
个数由小到大排列
,
最中间的两个数均为
3500,
所以中位数为
3500
元
.
(2)
企业经理关心平均工资
,
知道平均工资就知道了工资总额
.
普通职工关心中位数
,
知道了中位数
,
就知道自己工资水平大概的位置
.
统计量
平均数
中位数
众数
适用
情况
优点
缺点
平均数反映数据的一般水平
,
多用于比较或消除误差
,
是最常用的一个代表值
中位数是一个中间位置量
,
常用于确定定额、制定标准等
众数是出现次数最多的数据
,
反映民意调查等有集中倾向的结果
能利用所有数据的信息
,
意义明确
,
计算方便
,
应用广泛
较少受异常值的影响
较少受异常值的影响
当数据中有异常值时
,
平均数的代表性较差
没有利用所有数据的信息
众数可能不唯一或不存在
,
有时没有意义
2
.
实际问题中求得的平均数、中位数和众数的单位与原数据的单位一致
.
[
知识拓展
]
1
.
平均数、中位数和众数都是描述一组数据的特征量
,
但最终选用哪一个量来描述这组数据
,
应结合实际情况来确定
.
检测反馈
1
.
某校为了丰富校园文化
,
举行了初中生书法大赛
,
决赛设置了
6
个获奖名额
,
共有
11
名选手进入决赛
,
选手决赛得分均不相同
.
若知道某位选手的决赛得分
,
要判断她能否获奖
,
只需知道这
11
名选手得分的
(
)
A.
中位数
B.
平均数
C.
众数
D.
加权平均数
解析
:11
个不同的分数从小到大排序后
,
中位数及中位数之后共有
6
个数
,
故只要知道自己的分数和中位数就可以知道是否获奖了
.
故选
A.
A
解析
:
了解这家公司员工的工资时
,
要全面了解大多数员工的工资水平
,
故最应该关注的数据是中位数
.
故选
C.
2
.
为了解某公司员工的年工资情况
,
小王随机调查了
10
位员工
,
其年工资
(
单位
:
万元
)
如下
:3,3,3,4,5,5,6,6,8,20
.
下列统计量中
,
能合理反映该公司员工年工资水平的是
(
)
A.
加权平均数
B.
众数
C.
中位数
D.
平均数
C
解析
:
由于众数是出现次数最多的数
,
故店主最关注的统计量是众数
.
故填众数
.
3
.
一段时间内
,
鞋店为了解某品牌女鞋的销售情况
,
对各种尺码鞋的销量进行了统计分析
,
在“平均数”“中位数”“众数”等统计量中
,
店主最关注的统计量是
.
众数
4
.
某公司销售部有营销人员
15
人
,
销售部为了制定某种商品的月销售定额
,
统计了这
15
人某月的销售量如下
:
销售件数
1800
510
250
210
150
120
人数
1
1
3
5
3
2
(3)
假设你是营销部负责人
,
你会把每位营销人员的月销售额定为多少件
?
并说明理由
.
(1)
这
15
位营销人员该月销售件数的中位数、众数分别是多少
?
(2)
计算这
15
位营销人员该月销售件数的平均数
;
(2)
平均数是
:
=
320(
件
)
.
解
:
(1)
表中的数据是按从大到小的顺序排列的
,
处于中间位置的是
210,
因而中位数是
210
件
;210
出现的次数最多
,
所以众数是
210
件
.
(3)
销售额定为
210
件合适些
,
因为
210
件既是中位数
,
又是众数
,
是大部分人能达到的定额
.
23.3
方差(第
1
课时)
第二十三章 数据分析
3
.
如何计算一组数据的平均数、中位数和众数
?
知识复习
1
.
表示一组数据的“集中趋势”的统计量有哪些
?
2
.
什么是平均数、中位数和众数
?
观察与思考
甲、乙两名业余射击选手参加了一次射击比赛
,
每人各射
10
发子弹
,
成绩如图所示
.
(1)
观察上图
,
甲、乙射击成绩的平均数、中位数各是多少
?
(
两人射击成绩的平均数和中位数都是
7
环
)
(
甲射击成绩波动较大
,
波动的大小反映射击的稳定性有差异
)
(2)
甲、乙射击成绩的平均数是否相同
?
若相同
,
他们的射击水平就一样吗
?
(
两人射击成绩的平均数相同
,
但并不能说明射击水平一定相同
)
(3)
哪一组数据相对于其平均数波动较大
?
波动大小反映了什么
?
1
.
如何描述每个数据与平均数的偏差
?
3
.
如何防止正负偏差相互抵消
?
2
.
把所有的偏差直接相加能表示所有数据的总偏差吗
?
(
不能
,
因为正负偏差会相互抵消
,
偏差总和为
0)
(
将各偏差平方后再求和
)
4
.
如何消除数据个数的影响
?
(
将各偏差平方后再求平均数
)
设
n
个数据
x
1
,
x
2
,
…
,
x
n
的平均数为
,
各个数据与平均数偏差的平方分别是
偏差平方的平均数叫做这组数据的
方差
,
用
s
2
表示
,
即
思考
4
.
方差为
0
的一组数据有什么特点
?
1
.
方差的取值范围是什么
?
2
.
如何求一组数据的方差
?
3
.
如何用方差的大小衡量离散程度的大小
?
5
.
你能通过求方差的方法
,
说明上述问题中哪个射击选手的成绩比较稳定吗
?
[(4
-
7)
2
+
(5
-
7)
2
+
2(6
-
7)
2
+
3(7
-
7)
2
+
(8
-
7)
2
+
2(10
-
7)
2
]
=
3
.
4,
[(5
-
7)
2
+
2(6
-
7)
2
+
4(7
-
7)
2
+
2(8
-
7)
2
+
(9
-
7)
2
]
=
1
.
2
.
因为
,
所以乙的射击成绩比甲的波动小
,
乙的成绩
更稳定些
.
方差的值为非负数
;
当方差为
0
时
,
这组数据为相同的一组数值
;
当数据分布比较分散时
,
方差较大
;
当数据分布比较集中时
,
方差较小
.
因此
,
方差的大小反映了数据波动
(
或离散程度
)
的大小
.
结论
例
1
利用计算器计算下列数据的平均数和方差
.
(
结果精确到
0
.
01)
66
78
81
75
86
82
解
:(1)
进入统计状态
,
选择一元统计
.
(2)
输入数据
.
(3)
显示结果
.
5
.
一组数据的每一个数据都变为原来的
k
倍
,
则所得的一组新数据的方差将变为原数据方差的
k
2
倍
.
[
知识拓展
]
1
.
方差是用来衡量一组数据波动大小的重要量
.
2
.
方差反映的是数据在它的平均数附近波动的情况
.
3
.
对于同类问题的两组数据
,
方差较大的波动较大
,
方差较小的波动较小
.
4
.
一组数据的每一个数据加上
(
或减去
)
同一个常数
,
所得的一组新数据的方差不变
.
检测反馈
1
.
(2015
·
上海中考
)
下列统计量中
,
能表示一组数据波动程度的是
(
)
A.
平均数
B.
众数
C.
方差
D.
频率
解析
:
表示一组数据波动大小的统计量是方差
.
故选
C.
C
2
.
甲、乙两班举行电脑汉字输入比赛
,
参赛学生每分钟输入汉字的个数统计结果如下表
:
班级
参赛人数
中位数
方差
平均数
甲
55
149
191
135
乙
55
151
110
135
某同学分析上表后得出如下结论
:
①
甲、乙两班学生成绩平均水平相同
;②
乙班优秀的人数多于甲班优秀的人数
(
每分钟输入汉字
≥150
个为优秀
);③
甲班成绩的波动比乙班大
.
上述结论正确的是
(
)
A.①②③ B.①②
C.①③ D.②③
A
解析
:∵
∴①
正确
;∵
乙的中位数为
151,
甲的中位数为
149,∴
乙班优秀的人数多于甲班优秀的人数
,②
正确
;∵
,∴
甲班成绩的波动比乙班大
,③
正确
.
故选
A.
3
.
一名学生军训时连续射靶
10
次
,
命中的环数分别为
4,7,8,6,8,5,9,10,7,6
.
则这名学生射击环数的方差是
.
解析
:
数据
4,7,8,6,8,5,9,10,7,6
的平均数
=
=
7,
方差
=
(9
+
0
+
1
+
1
+
1
+
4
+
4
+
9
+
0
+
1)
=
3
.
故填
3
.
3
4
.
某次射击练习
,
甲、乙二人各射靶
5
次
,
命中的环数如下表
:
甲命中环数
7
8
6
8
6
乙命中环数
9
5
6
7
8
那么射击比较稳定的是
.
解析
:
根据题意得
=
(7
+
8
+
6
+
8
+
6)÷5
=
7,
=
(9
+
5
+
6
+
7
+
8)÷5
=
7,
[(7
-
7)
2
+
(8
-
7)
2
+
(6
-
7)
2
+
(8
-
7)
2
+
(6
-
7)
2
]
=
0
.
8
,
[(9
-
7)
2
+
(5
-
7)
2
+
(6
-
7)
2
+
(7
-
7)
2
+
(8
-
7)
2
]
=
2,
∵
∴
射击成绩比较稳定的是甲
.
故填甲
.
甲
5
.
已知两组数据
:
甲
:9
.
9
10
.
3
9
.
8
10
.
1
10
.
4
10
9
.
8
9
.
7
乙
:10
.
2
10
9
.
5
10
.
3
10
.
5
9
.
6
9
.
8
10
.
1
分别计算这两组数据的方差
,
并说明数据波动的大小
.
×(9
.
9
+
10
.
3
+
9
.
8
+
10
.
1
+
10
.
4
+
10
+
9
.
8
+
9
.
7)
=
10
.
×(10
.
2
+
10
+
9
.
5
+
10
.
3
+
10
.
5
+
9
.
6
+
9
.
8
+
10
.
1)
=
10
.
因为
,
所以乙组数据比甲组数据波动大
.
×[(9
.
9
-
10)
2
+
(10
.
3
-
10)
2
+
…
+
(9
.
7
-
10)
2
]
×(0
.
01
+
0
.
09
+
…
+
0
.
09)
=
=
×0
.
44
=
0
.
055,
×[(10
.
2
-
10)
2
+
(10
-
10)
2
+
…
+
(10
.
1
-
10)
2
]
=
×(0
.
04
+
0
+
…
+
0
.
01)
=
×0
.
84
=
0
.
105
.
23.3
方差(第
2
课时)
第二十三章 数据分析
学 习 新 知
某校在甲、乙两名优秀选手中选一名参加全市中学生运动会跳远比赛
,
该校预先对这两名选手测试了
10
次
,
测试成绩如下表
:
1
2
3
4
5
6
7
8
9
10
选手
甲的
成绩
/cm
585
596
610
598
612
597
604
600
613
601
选手
乙的
成绩
/cm
613
618
580
574
618
593
585
590
598
624
(5)
历届比赛表明
,
成绩达到
610 cm
就能打破纪录
,
你认为为了打破纪录应选谁参加这项比赛
?
(1)
他们的平均成绩分别是多少
?
(2)
甲、乙这
10
次比赛成绩的方差分别是多少
?
(3)
这两名运动员的运动成绩各有什么特点
?
(4)
历届比赛表明
,
成绩达到
596 cm
就很可能夺冠
,
你认为为了夺冠应选谁参加这项比赛
?
张老师乘公交车上班
,
从家到学校有
A
,
B
两条路线可选择
,
他做了一番试验
.
第一周
(5
个工作日
)
选择
A
路线
,
第二周
(5
个工作日
)
选择
B
路线
,
每天两趟
,
记录所用时间如下表
:
试验序号
1
2
3
4
5
6
7
8
9
10
A
路线所用时间
/min
35
52
35
36
54
38
41
34
55
40
B
路线所用时间
/min
45
49
44
45
47
46
50
48
50
46
根据上表数据绘制的折线统计图如图所示
.
(1)
从图形看
,
哪条路线平均用时少
,
哪条路线用时的波动大
?
(2)
用计算器分别计算选择
A
,
B
两条路线所用时间的平均数和方差
.
(3)
如果某天上班可用时间只有
40 min,
应选择走哪条路线
?
(4)
如果某天上班可用时间为
50 min,
又应选择走哪条路线
?
(1)
从直观上看
,
A
路线平均用时少
,
但用时的波动较大
,
说明
A
路线通行不顺畅
.B
路线的平均用时较多
,
但用时比较稳定
,
可能
B
路线较长
,
但通行较顺畅
.
(2)
经计算得
:
(3)
当上班可用时间只有
40 min
时
,
应选择走
A
路线
,
因为在
10
次记录中
,
B
路线所有用时都超过
40 min,
而
A
路线有
6
次用时不超过
40 min
.
(4)
当上班可用时间为
50 min
时
,
应选择走
B
路线
.
由于
,
所以
A
路线平均用时少
,
但用时波动较大
.
例
2
测试甲、乙两个品牌的手表各
50
只
,
根据日走时误差数据绘制的统计图如图所示
.
从日走时误差角度比较这两个品牌手表的优劣
.
5
.
从日走时误差的绝对值不超过
1 s
的手表所占的百分比看
,
如何比较这两个品牌手表的优劣
?
【思考】
1
.
通过什么统计量可以比较这两个品牌手表的优劣
?
2
.
如果甲、乙两个品牌的手表的日走时误差的平均数均为
0,
通过什么统计量比较手表的优劣
?
3
.
如何计算两种品牌手表的方差
?
4
.
如何用方差的大小比较手表的优劣
?
因为
,
所以从日走时误差方差的角度看
,
甲品牌优于乙品牌
.
解
:
经计算知
,
甲、乙两个品牌手表日走时误差的平均数均为
0
.
两组数据的方差分别为
:
×[(-2)
2
×5+(-1)
2
×11+0
2
×17+1
2
×13+2
2
×4]
=
1
.
2,
×[(-3)
2
×2+(-2)
2
×6+(-1)
2
×11+0
2
×14+1
2
×8+
2
2
×6+3
2
×3]
=
2
.
24
.
从日走时误差的绝对值不超过
1 s
的手表所占的百分比看
,
甲品牌为
82%,
乙品牌为
66%,
甲品牌优于乙品牌
.
检测反馈
1
.
小明与小华本学期都参加了
5
次数学考试
(
总分均为
100
分
),
数学老师想判断这两位同学的数学成绩谁更稳定
,
在进行统计分析时
,
老师需比较这两人
5
次数学成绩的
(
)
A.
平均数
B.
方差
C.
众数
D.
中位数
解析
:
由于方差 能反映数据的波动大小
,
故判断两人的数学成绩谁更稳定
,
应比较方差
.
故选
B.
B
2
.
一城市准备选购
1000
株高度大约为
2 m
的某种风景树来进行街道绿化
,
有四个苗圃生产基地投标
(
单株树的价格都一样
)
.
采购小组从四个苗圃中都任意抽查了
20
株树苗的高度
,
得到的数据如下
:
请你帮采购小组出谋划策
,
应选购
(
)
A.
甲苗圃的树苗
B.
乙苗圃的树苗
C.
丙苗圃的树苗
D.
丁苗圃的树苗
D
解析
:
由
,
知甲、丁的方差小
,
波动小
,
树苗较整齐
;
又丁苗圃树苗的平均高度为
2 m,
大于甲苗圃树苗的平均高度
,
故应选择丁苗圃的树苗
.
故选
D.
解析
:
因为
,
所以乙机床生产的螺丝质量最好
.
3
.
甲、乙、丙三台机床生产直径为
60 mm
的螺丝
,
为了检验产品质量
,
从三台机床生产的螺丝中各抽查了
20
个测量其直径
,
进行数据处理后
,
发现这三组数据的平均数都是
60 mm,
它们的方差依次为
根据以上提供的信息
,
你认为生产螺丝质量最好的是
机床
.
乙
4
.
下面是两天的每隔两个小时的气温数据
(
单位
:℃)
.
8
月
20
日
:25,26,27,27,28,29,30,31,29,28,27,26
.
8
月
21
日
:23,24,24,26,27,28,29,30,29,28,27,26
.
(1)
这两天的平均气温
,
哪一天高些
?
(2)
哪一天的气温变化较大
?
23.4
用样本估计总体
第二十三章 数据分析
学 习 新 知
从甲、乙两种农作物里各抽取
10
株苗
,
分别测得它们的苗高如下
:(
单位
cm)
甲
:9,10,11,12,7,13,10,8,12,8;
乙
:8,13,12,11,10,12,7,7,9,11
.
(1)
分别算出甲、乙两种农作物苗高的平均值、中位数、众数和方差
;
(2)
哪种农作物苗长得比较整齐
?
为了估计全校初中女生的平均身高
,
九年级
(
一
)
班
8
个课外学习小组采用随机抽样的方法
,
分别抽取容量为
25
和
100
的样本
,
样本平均数用
和
表示
,
结果
(
单位
:cm)
如下表
:
小组
序号
1
2
3
4
5
6
7
8
158.5
161.5
160.2
160.0
160.9
160.4
159.0
159.5
160.0
159.0
160.5
159.3
159.8
161.0
159.6
160.8
把得到的样本平均数标在数轴上
,
如图所示
.
(1)
对容量相同的不同样本
,
算得的样本平均数相同吗
?
样本平均数有不确定性
:
相同的样本容量
,
不同样本的平均数一般也不相同
.
(2)
观察上图
,
在两组样本平均数中
,
哪一组样本平均数的波动较小
?
这样体现了什么样的统计规律
?
(3)
如果总体身高的平均数为
160
.
0 cm,
哪一组样本平均数整体上更接近
160
.
0 cm?
样本平均数有稳定性
:
当样本容量较小时
,
差异可能还较大
.
但是当样本容量增大时
,
样本的平均数的波动变小
,
逐渐趋于稳定
,
且与总体的平均数比较接近
.
在实际中经常用样本的平均数估计总体的平均数
,
同样的道理我们也用样本的方差估计总体的方差
.
追问
:
什么样的实际问题中我们可以采用样本平均数、方差估计总体平均数、方差
?
有破坏性或总体数量较多时
(3)
规定当方差不超过
0
.
05 mm
2
时
,
车床生产情况为正常
.
判断这台车床的生产情况是否正常
.
例
1
工人师傅用车床加工一种直径为
20 mm
的轴
,
从某天加工的轴中随机抽取了
10
件
,
测得其直径
(
单位
:mm)
如下
:
20
.
1
19
.
9
20
.
3
20
.
2
19
.
8
19
.
7
19
.
9
20
.
3
20
.
0
19
.
8
(1)
计算样本平均数和样本方差
.
(2)
求总体平均数和总体方差的估计值
.
解
:(1)
样本平均数为
=
×(20
.
1
+
19
.
9
+
…
+
19
.
8)
=
20(mm)
.
样本方差为
s
2
=
×[(20
.
1
-
20)
2
+
…
+
(19
.
8
-
20)
2
]
=
0
.
042(mm
2
)
.
(2)
总体平均数和总体方差的估计值分别为
20 mm
和
0
.
042 mm
2
.
(3)
由于方差不超过
0
.
05 mm
2
,
所以可以认为车床的生产情况正常
.
例
2
一个苹果园
,
共有
2000
棵树龄相同的苹果树
.
为了估计今年苹果的总产量
,
任意选择了
6
棵苹果树
,
数出它们挂果的数量
(
单位
:
个
)
分别为
:260
340
280
420
360
380
根据往年的经验
,
平均每个苹果的质量约为
250 g
.
试估计今年苹果园苹果的总产量
.
解
:6
棵苹果树平均挂果的数量为
×(260+340+280+420+360+380)=
340(
个
)
.
0
.
25×340
=
85(kg),6
棵苹果树平均每棵的产量约为
85 kg
.
由样本平均数估计总体平均数
,2000
棵苹果树平均每棵产量约为
85 kg,
总产量的估计值为
85×2000=170000(kg)
.
3
.
样本平均数估计总体平均数结果有不确定性
,
随着样本容量的增加
,
由样本得出的平均数往往会更接近总体的平均数
.
对方差也有相同的结论
.
[
知识拓展
]
1
.
用样本估计总体是统计的基本思想
,
而总体的平均数和方差是最重要的两个数字特征
.
在统计中
,
我们常用样本平均数
(
或方差
)
估计总体平均数
(
或方差
)
.
2
.
当调查的对象有破坏性或数量较大时
,
常采用样本估计总体的方法解决实际问题
.
检测反馈
1
.
某“中学生暑假环保小组”的同学
,
随机调查了“幸福小区”
10
户家庭一周内使用环保方便袋的数量
,
数据如下
(
单位
:
只
):6,5,7,8,7,5,8,10,5,9,
利用上述数据估计该小区
2000
户家庭一周内需要环保方便袋约
(
)
A.2000
只
B.14000
只
C.21000
只
D.98000
只
解析
:
×(6
+
5
+
7
+
8
+
7
+
5
+
8
+
10
+
5
+
9)×2000
=
14000(
只
)
.
故选
B.
B
2
.
从总体中抽取一个样本
,
计算出样本方差为
2,
可以估计总体方差
(
)
A.
一定大于
2 B.
约等于
2
C.
一定等于
2 D.
与样本方差无关
解析
:
在总体数目较多的条件下
,
通常选取一个样本
,
样本的情况大体可以反映
总体的趋势
.
故选
B.
B
解析
:
先计算
50
名学生的平均植树量
,
然后用样本的平均数估计总体的平均数即可
:
九年级共植树
420×
=
1680(
棵
)
.
故填
1680
.
3
.
某校九年级
420
名学生参加植树活动
,
随机调查了
50
名学生植树的数量
,
并根据数据绘制了如下条形统计图
,
请估计该校九年级学生此次植树活动约植树
棵
.
1680
解
:(1)
=
14(
吨
)
.
(2)14×500
=
7000(
吨
),
所以估计该小区居民每月共用水
7000
吨
.
4
.
为了了解某小区居民的用水情况
,
随机抽查了该小区
10
户家庭的月用水量
,
结果如下
:
月用水量
/
吨
10
13
14
17
18
户数
2
2
3
2
1
(1)
计算这
10
户家庭的平均月用水量
;
(2)
如果该小区有
500
户家庭
,
根据上面的计算结果估计该小区居民每月共用水多少吨
.