第二十章 数据的分析
本 章 总 结 提 升
知识框架
知识框架
整合提升
整合提升
本章总结提升
知 识 框 架
数据的集中趋势
平均数
中位数
将一组数据按照由小到大
(
或由大到小
)
的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则称中间两个数据的普宁均属就是这组数据的中位数
众数
一组数据中出现次数最多的数据就是这组数据的众数
本章总结提升
平均数
中位数
众数
用样本估计总体
用样本平均数估计总体平均数
用样本方差估计总体方差
用样本估计总体是统计的根本思想,在生活和生产中,为了了解总体的情况,我们经常采用从总体中抽取样本,通过对样本的调查,获得关于样本的数据和结论,再利用样本结论对总体进行估计
方差
本章总结提升
方差
数据的波动
方差越大,数据的波动越大;方差越小,数据的波动越小
类型之一 求一组数据的平均数
本章总结提升
整 合 提 升
本章总结提升
这里各数据的“权”较强地反映了数据的相对“重要程度”,通常是以下列情形给出的:
(1)
以数据出现的次数
(
即频数
)
给出各数据的“权”;
(2)
以比的形式给出各数据的“权”;
(3)
以百分数的形式给出各数据的“权”.
本章总结提升
例
1
学校准备从甲、乙两位选手中选择一位选手代表学校参加所在地区的汉字听写大赛,学校对两位选手从表达能力、阅读理解、综合素质和汉字听写四个方面分别做了测试,他们各自的成绩
(
百分制
)
如下表:
选手
表达能力
阅读理解
综合素质
汉字听写
甲
85
78
85
73
乙
73
80
82
83
本章总结提升
(1)
由表中成绩已算得甲的平均成绩为
80.25
分,请计算乙的平均成绩,从他们的这一成绩看,应选派哪位选手代表学校参加所在地区的汉字听写大赛?
(2)
如果对表达能力、阅读理解、综合素质和汉字听写分别赋权
2
,
1
,
3
和
4
,请分别计算两名选手的平均成绩,从他们的这一成绩看,应选派哪位选手代表学校参加所在地区的汉字听写大赛?
本章总结提升
本章总结提升
【
针对训练
】
1
.某公司人事部欲从内部招聘管理人员一名,对甲、乙、丙三名候选人进行专业知识测试,成绩如下表所示,并依录用的程序,组织
200
名职工对三人进行民主评议投票推荐,三人得票率如图
20
-
T
-
3
所示.
(
没有弃权票,每位职工只能投
1
票,每得
1
票记
1
分
)
测试项目
测试成绩
甲
乙
丙
专业知识
73
74
67
本章总结提升
图
20
-
T
-
1
本章总结提升
(1)
请填出三人的民主评议得分:甲得
________
分,乙得
________
分,丙得
________
分;
(2)
根据招聘简章,人事部将专业知识、民主评议两项得分按
6∶4
的比例确定个人成绩,成绩较好者将被录用,那么
________
将被录用,他的成绩为
________
分.
70
68
62
甲
71.8
本章总结提升
[
解析
] (1)
由扇形统计图可求三人的民主得分:甲为
35%×200
=
70(
分
)
,乙为
34%×200
=
68(
分
)
,丙为
31%×200
=
62(
分
)
.
(2)
利用加权平均数计算公式计算三人成绩的加权平均数.
本章总结提升
类型之二 平均数、中位数、众数的计算及其应用
平均数、中位数、众数都是一组数据集中趋势的代表,平均数应用最广泛,它反映了一组数据的平均水平,当数据波动不大时,它是一个较好的代表值.但当极端值相差很大时,它易受极端值影响,则不能代表一般水平,这时可以考虑用中位数作为一般水平的代表值.中位数是一个位置值,代表着中间水平.当一组数据中,相同数据重复多次出现时,众数往往是人们关注的一个代表值.实际分析数据时,应视具体情境,按其考察的对象合理使用平均数、中位数或众数.
本章总结提升
例
2
如图
20
-
T
-
2
是某市交警在一个路口统计的某个时段来往车辆的车速情况.
(
单位:千米
/
时
)
(1)
计算这些车的平均速度;
(2)
大多数车以哪一个速度行驶?
(3)
中间的车速是多少?
图
20
-
T
-
2
[
解析
]
先利用加权平均数的计算公式计算出平均数,大多数车的速度其实就是这组数据的众数,中间的车速就是这组数据的中位数.
本章总结提升
本章总结提升
【
归纳总结
】
解决这类问题首先要能从图表中获得有用信息,然后灵活运用所学习的概念解决问题.注意中位数一定是将一组数据从小到大
(
或从大到小
)
排列后中间的一位数
(
数据个数为奇数
)
或中间两个数的平均数
(
数据的个数为偶数
)
.众数是一组数据中出现次数最多的数,一组数据可以有一个众数,也可以有多个众数.
本章总结提升
【
针对训练
】
2
.在一次射击比赛中,
19
名参赛运动员射击
(
每人打
30
发
)
的环数如下表:
环数
24
25
26
27
28
29
30
人数
1
1
2
2
4
7
2
求出中位数、众数、平均数,并说明在这个问题中,中位数、众数、平均数各说明了什么.
(
结果精确到
0.1)
[
解析
]
解答好本题的关键是要分清中位数、众数、平均数在反映一组数据时有各自不同的侧重点.
本章总结提升
本章总结提升
本章总结提升
[
点评
]
我们看到,中位数、众数与平均数从不同的角度描述了一组数据的集中趋势,其中又以平均数的应用最为广泛.
本章总结提升
类型之三 应用数据的代表进行决策
平均数、中位数、众数都是描述一组数据集中趋势的量,但它们描述的角度和适用的范围不尽相同.在具体问题中,究竟用谁来描述一组数据的集中趋势,就要看数据的特点和人们所关心的问题,从而作出科学的选择和决策.
本章总结提升
例
3
某中学对全校学生
60
秒跳绳的次数进行了统计,全校学生
60
秒跳绳的平均次数是
100
,某班体育委员统计了全班
50
名学生
60
秒跳绳的成绩,列出的频数分布直方图如图
20
-
T
-
3
所示
(
每个分组包括左端点,不包括右端点
)
.
(1)
该班学生
60
秒跳绳的平均次数至少是多少?是否超过全校平均次数?
(2)
该班一个学生说:“我的跳绳成绩在我班是中位数.”请你给出该生跳绳成绩所在的范围.
本章总结提升
图
20
-
T
-
3
本章总结提升
解:
(1)
该班学生
60
秒跳绳的平均次数至少是
(60×4
+
80×13
+
100×19
+
120×7
+
140×5
+
160×2)÷50
=
100.8.
因为
100.8>100
,所以一定超过全校平均次数.
(2)
这个学生的跳绳成绩在该班是中位数,由
4
+
13
+
19
=
36
,可知中位数一定在
100
~
120
范围内.
本章总结提升
【
归纳总结
】
“
三数”的选用:平均数、众数、中位数分别从“一般水平”“多数水平”和“中间水平”代表了一组数据的集中趋势,具体应用时应根据实际情况灵活选用,并做出决策.
本章总结提升
3
.某年青岛市春季房交会期间, 某房地产公司对参加本次房交会的消费者进行了随机问卷调查,共发放了
1200
份调查问卷,实际收回了
1000
份.该房地产公司根据问卷情况,作了以下两方面的统计:
(1)
根据被调查消费者年收入情况制成的统计表:
【
针对训练
】
本章总结提升
年收入
(
元
)
各段被调查消费者人数占被
调查消费者总人数的百分比
2
万以下
50%
2
万~
4
万
(
不含
4
万
)
26%
4
万~
6
万
(
不含
6
万
)
14%
6
万~
8
万
(
不含
8
万
)
7%
8
万~
10
万
3%
本章总结提升
(2)
如图
20
-
T
-
6
是根据被调查消费者打算购买不同住房面积的人数情况制成的扇形统计图:
图
20
-
T
-
4
本章总结提升
①80
m
2
以下;
②
80
m
2
~
100
m
2
(
不含
100
m
2
)
;
③
100
m
2
~
120
m
2
(
不含
120
m
2
)
;
④
120
m
2
~
140
m
2
(
不含
140
m
2
)
;
⑤
140
m
2
以上.
本章总结提升
根据上述信息,解决下列问题:
(1)
被调查的消费者平均年收入约为
________
万元;
(2)
打算购买
80 m
2
~
100 m
2
的消费者人数为
________
;
(3)
如果你是该房地产公司的开发商,请你从建房面积等方面谈谈你今后的工作打算
(
不超过
30
字
)
.
2.74
360
解 :
(3)
由
(2)
可估计打算购买
80 m
2
~
100 m
2
的人数最多,应适当增加这类住房的开发建设.
本章总结提升
本章总结提升
本章总结提升
类型之四 方差的计算及其应用
方差是描述一组数据波动大小的量,是衡量一组数据偏离其平均数的大小
(
即波动大小
)
的特征数.在分析数据时,除了关注数据的“平均水平”外,还要关注数据的离散程度,即相对于“平均水平”的离散程度.我们常用方差反映数据的离散程度,方差较小的数据,波动性较小,说明稳定性强;方差较大的数据,波动性较大,说明稳定性差.在生活中经常用方差的大小评估测试成绩、产品质量等的稳定性,以便决断“方案”“选拔”“决策”等问题.
本章总结提升
例
4
已知样本数据
1
,
2
,
4
,
3
,
5
,下列说法不正确的是
(
)
A
.平均数是
3 B
.中位数是
4
C
.这组数据无众数
D
.方差是
2
B
本章总结提升
本章总结提升
【
针对训练
】
4
.林波的妈妈开了一个早餐店,主要经营“油条”“麻团”“包子”等早点,可妈妈经营不善,经常有某种早点滞销或脱销,造成了浪费或亏损.懂事的林波结合所学的统计知识为妈妈统计了
1
至
10
号的销售情况,并绘制了下表:
日期
分类
1
2
3
4
5
6
7
8
9
10
油条
20
10
5
18
28
29
50
43
15
20
麻团
70
40
80
75
84
82
79
86
100
96
包子
40
46
60
50
45
58
34
49
62
72
本章总结提升
(1)
计算各种早点的日平均销量,并说明哪种早点销量更大些;
(2)
计算各种早点销量的方差
(
结果保留两位小数
)
,并比较哪种早点销量稳定;
(3)
假如你是林波,你会给妈妈哪些建议?
本章总结提升
解:
(1)
油条的平均数是
23.8
个,麻团的平均数是
79.2
个,包子的平均数是
51.6
个.故麻团的销量最大.
(2)
油条的方差是
178.36
,麻团的方差是
243.16
,包子的方差是
116.44.
故包子的销量相对稳定些.
(3)
每天做的油条、麻团、包子的个数以各自的日平均数为参照,包子可适当放宽一些.
本章总结提升
类型之五 应用数据的波动进行决策
在解决实际问题时,要同时分析数据的一般水平与波动性,两者之间有着密切的联系,需要通过计算,然后对数据进行全面分析,并结合实际做出合理的判断和决策.
本章总结提升
例
5
为了让广大青少年学生走向操场、走进自然、走进阳光下,积极参加体育锻炼,我国启动了
“全国亿万学生阳光体育运动”活动.
短跑运动,可以锻炼人的灵活性,增强人的爆发力,因此小明和小亮在课外活动中,报名参加了短跑训练小组,在近几次百米训练中,所测成绩如图
20
-
T
-
6
,请根据图中所示解答以下问题.
本章总结提升
(1)
请根据图中信息,补全下面的表格:
测试次数
第
1
次
第
2
次
第
3
次
第
4
次
第
5
次
小明
13.3
13.4
13.3
13.3
小亮
13.2
13.1
13.5
13.3
(2)
从图中看,小明、小亮哪次的成绩最好?
(3)
分别计算他们的平均数、方差,若你是他们的教练,将小明与小亮的成绩比较后,你将分别给予他们怎样的建议?
本章总结提升
图
20
-
T
-
5
本章总结提升
[
解析
] (1)
从折线图中读取要填写的数据;
(2)
由图中点的高低,可说明成绩的好坏,时间越短,成绩越好;
(3)
通过计算,结合特征数进行分析.
本章总结提升
本章总结提升
本章总结提升
【
针对训练
】
5
.某初中数学老师要从甲、乙两位学生中选一名参加数学竞赛,甲、乙两人前
5
学期的数学成绩
(
单位:分
)
如下表:
第一学期
第二学期
第三学期
第四学期
第五学期
甲
75
80
85
90
95
乙
95
87
88
80
75
本章总结提升
(1)
分别求出甲、乙两人前
5
学期的数学平均成绩;
(2)
分别画出甲、乙两人前
5
学期的数学成绩折线图;
(3)
如果你是老师,你认为该选哪位学生参加数学竞赛?请简要说明理由.
解:
(1)
甲:
(75
+
80
+
85
+
90
+
95)÷5
=
85(
分
)
,
乙:
(75
+
80
+
87
+
88
+
95)÷5
=
85(
分
)
.
(2)
如图
20
-
T
-
8
:
本章总结提升
图
20
-
T
-
8
(3)
派甲去,因为甲的成绩呈上升趋势,而乙的成绩呈下降趋势.