第
4
章 数据的收集、整理与描述
4.1
普查和抽样调查
4.1
普查和抽样调查
在社会生产和现实生活中,要对某些问题做出科学合理的判断和决策,通常需要先通过调查,收集一些有关的数据,再进行分析研究。
例如,我国于
1984
~
1996
年对全国土地使用情况进行了大规模的现状调查.这次调查全国组织了
50
万专业人员,采用了航空为主的遥感资料,运用全野外实地调查的方法,查清了每个地块准确的土地数据,获得了全面的资料.
交流和发现
耕 地
18.2574
园 地
1.77
林 地
35.41
牧 草 地
39.27
居民点工矿用地
4.04
交 通 用 地
0.37
其他为水域和未利用土地
全国主要地类面积
单位:亿亩
小资料
《
2008
年国土资源公报
》
参考网站:中华人民共和国国土资源网站 (
www.mlr.gov.cn
)
2009.4.1
像这样,为了特定目的对全部考察对象进行的全面调查叫做
普查
(survey)
.被考察的对象的全体叫做
总体
(population)
,组成总体的每一个被考察的对象叫做
个体
(individual)
.
在上面的普查中,全国土地使用面积是总体,每个地块的面积是个体.你能举出运用普查进行调查的实际例子吗?
运用普查,通过调查与问题有关的每一个个体,可以获得准确全面的数据资料。然而,对于许多问题,没有必要甚至也不可能得到与问题有关的所有数据。
分析下面的三个实际问题:
(
1
)某部门要调查全省七年级学生每周课外活动的时间;
(
2
)质量监督部门要检测某种品牌的复合木地板的耐磨程度;
(
3
)河务部门要了解
7
月份流经某水文站的黄河河水的泥沙含量。
问题(
1
)中的学生人数多,如果采用普查的方法,对全省每个七年级学生每周课外活动都进行调查,不仅调查的范围广,花费的时间长,消费的人力,物力也非常大,并且这种调查的结果也不需要准确值;
问题(2)中对木板的耐磨程度采用普查的方法,需要对该品牌的每块木地板都进行实验,而这种实验是破坏性的;
问题(3)中,不可能将7月份流经该地的黄河河水全部封存,然后让泥沙沉淀,再测出泥沙的质量。因此,问题(1)(2)(3)不能通过普查来收集数据。
对于问题(
1
),可以采取抽取一部分七年级学生(比如
1 000
名)作为代表进行问卷调查。问题(
2
)(
3
)可分别抽取部分木地板样品和
7
月份流经该地的部分水样进行检测。根据获取的数据,估计全部考察对象的情况。
想一想,如果让你负责调查问题(1)(2)(3),应当如何收集数据?
例如,在问题(
1
)中,全省七年级学生的课外活动的时间是总体,每个学生课外活动时间是个体,从中抽取的
1000
名七年级学生的课外活动的时间是总体的一个样本,样本容量是
1000.
在许多情况下,人们常常从总体中抽取部分个体,根据对这一部分个体的调查估计被考察对象的整体情况.这种调查叫做
抽样调查
.从总体中抽取的一部分个体组成总体的一个
样本
,样本中个体的数量叫做
样本容量
。
1、要了解一批新电视机的寿命,从中任意抽取了10台进行试验,在这个问题中的总体、个体、样本,样本容量分别是什么?
总体:这批新电视机的使用寿命
个体:这批新电视机中的每一个电视机的使用寿命
样本:所抽取的10台新电视机的使用寿命
样本容量:10
随堂练习
2.某地区要了解初三毕业生的身高和体重的情况,从中抽测了1 200名学生的身高和体重,在这个问题中,总体、个体、样本分别是什么?
总体:该地区初三毕业生的身高和体重情况
个体:该地区每一名初三毕业生的身高和体重情况
样本:所抽取的
1 200
名初三毕业生的身高和体重情况
(
1
)从一批洗衣机中抽取5台,调查这批洗衣机的使用寿命.
解:该调查是抽样调查.
总体:这批洗衣机的使用寿命。
个体:这批洗衣机中每台洗衣机使用寿命.
样本:从中抽取的5台洗衣机的使用寿命.
样本容量:5 .
3.下列各项调查,是普查还是抽样调查?如果是普查,指出总体和个体。如果是抽样调查,请指出总体、个体、样本和样本容量.
总体
样本
样本容量
个体
总体、个体、样本与样本容量的概念:
被考察的对象的全体.
组成总体的每一个被考察的对象.
从总体中所抽取的一部分个体.
样本中个体的数量.
注意
:
只有抽样调查里
,
才有样本和样本容量
总结
第
4
章 数据的收集、整理与描述
4.2
简单随机抽样
4.2
简单的随机抽样
1.
某
出版社
检查数学课本校样的错别字;
普查
2.
调查
去年全国因交通事故而死亡的人数
普查
复习:
分析下面的问题,你认为应当采用普查还是抽样调查?
为了了解本校学生暑期参加体育活动的情况,学校准备抽取一部分学生进行调查,你认为按下面的调查方法取得的结果能反映全校学生的一般情况吗?如果不能反映,应当如何改进调查方法? 现有四个发放调查问卷的方案
方案
1
:调查学校田径队的
30
名同学;
方案
3
:从每个班随机抽取
1
名同学;
方案
4
:从每个班抽取一半学生进行调查
.
方案
2
:调查每个班的男同学;
交流与发现
方法
1
选取的样本是学校田径队的同学,他们暑假中体育活动较多;
方法
2
只调查男同学,没有调查女同学,这两种调查结果不能反映同学的一般情况
.
方法
3
选取的样本容量太小,不能客观的反映全校同学的情况;
方法
4
的结果虽然能反映全校同学的一般情况,但样本的容量较大,需要花费较多的人力和时间
.
一般地
,
为了获取能够客观反映问题的结果,通常按照总体中每个个体都有相同的被抽取机会的原则抽取样本
,
这种抽取样本的方法叫做
简单随机抽样
.
注
:
随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素
.
思考: 根据你的理解,简单随机抽样有哪些主要特点?
(
4
)每个个体被抽到的机会都相等,抽样具有公平性
.
(
3
)抽取的样本不放回,样本中无重复个体;
(
2
)样本的抽取是逐个进行的,每次只抽取一个个体;
(
1
)总体的个体数有限;
下列抽取样本的方式是属于简单随机抽样的是(
)
①从无限多个个体中抽取
100
个个体作样本;
②盒子里有
80
个零件,从中选出
5
个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里;
③从
8
台电脑中不放回的随机抽取
2
台进行质量检验(假设
8
台电脑已编好号,对编号随机抽取)
A.① B.② C.③ D.
以上都不对
C
实验与探究
班主任老师要统计班里今天骑自行车上学的同学人数占全班到校上课人数的百分比
.
怎样得到你班骑自行车上学的同学人数呢?
1
、某校的黑板报上刊登了一篇题为
《
大部分学生不吃早餐
》
的报道,文章说。“通过对课间学校商品部买小食品的
20
名同学的调查发现
16
人是因为没有吃早餐而去买零食,由此判断,我校
80%
的同学在家不吃早餐”这个说法正确吗?
2
、在某次篮球赛中,解说员介绍了参加美国职业篮球队的
3
名中国籍队员的身高,有位观众把这
3
个人的平均身高与美国人的平均身高进行比较,得出一个结论:“中国人的平均身高比美国人高”。
这个说法正确吗?
在选取样本时
应注意:
1.
所选取的样本必须具有
代表性
.
2.所选取的样本的容量应该
足够大
.
这样所选取的样本才能反映总体的特性
,
才比较合适
.
3
.
样本要
避免遗漏
某一个群体.
由(
1)
和
(2)
,你悟出了什么道理?
例
1
李大伯为了估计一袋大豆种子中大豆的粒数,先从袋中取出
50
粒,做上记号,然后放回袋中
.
将豆搅匀,再从袋中取出
100
粒,从这
100
粒中,找出带记号的大豆
.
如果带记号的大豆有
2
粒,便可以估计出袋中所有大豆的粒数
.
你知道他是怎样估计的吗?
解:第二次取出的大豆中,带记号的大豆占
100
粒大豆的
2℅
,由于经过搅匀,带记号的大豆在袋中是均匀分布的
.
因此,估计袋中有大豆
50÷2℅=2 500
(粒)。
1.
下列调查中抽取的样本合适吗?
(
1
)为了了解全班同学学习数学中存在的困难和问题,数学老师调查该班数学兴趣小组的
10
名同学;
(
2
)为了了解全校学生阅读课外书籍的情况,图书管理员老师随机调查了来馆借阅图书的两位同学
.
(3)
果农王大伯为了估计果园中
50
棵苹果树的总产量,收获前,他将这些果树进行编号,然后对编号为
5
的整数倍的果树进行采摘,称得它们的产量
.
不合适
不合适
合适
2.
为了估计一片森林里的野兔的数量,从森林中捕获
50
只野兔,做上记号,然后放回森林,几天后,再捕获第二批野兔
55
只,发现其中有标记的野兔
5
只,估计这片森林中有野兔多少只?
2.
解:第二批捕获的野兔中,有标记的野兔占
55
只野兔的
1
/
11
,所以估计森林中有野兔:
50 ÷
(
1
/
11
)
=550
(只)
.
简单随机抽样
如何选取样本
用样本估计总体
课堂小结
第4章 数据的收集、整理与描述
4.3
数据的整理
4.3
数据的整理
1
、商场售货员李阿姨一天内售出了
20
双运动鞋,依卖出的
先后顺序记录下每双鞋子的尺码(单位:厘米):
24.5 27 23.5 24 24.5 25 26 26 24 24.5
27 25 24.5 25 24.5 23.5 25 26 24 24.5
为了能够清楚地了解当天各种尺码的
运
动鞋卖出的数量,应当
怎样整理上面的这些数据?请你帮李阿姨填写下表:
鞋的尺码
/
厘米
23.5
24
24.5
25
26
27
划记
销售量
/
双
2
3
6
4
3
2
销售量最多的尺码为
24.5
厘米,其次为
25
厘米和
26
厘米,进货时要多进这些尺码的运动鞋。
2、从上面的表格中,你能得到哪些信息?
第几天
1
2
3
4
5
6
7
8
9
10
人数
183
209
195
178
204
215
191
208
167
197
3.
学校阅览室为了更好地服务同学,管理员老师记录了两
周内(每周
5
天)每天的读者人次,结果如下(单位:人次):
183, 209, 195, 178, 204, 215, 191, 208, 167, 197.
可以看出,
10
天中来阅览室看书的人次,最多的一天为
人次,
最少的一天为
人次。
215
167
想一想
在以上问题中,你还有其他的分组的方法吗?
在问题
1
中,还可以按生产运动鞋的厂家进行分组。
对于问题3,也可以按年级或班级将读者人数进行分组。
由此可以看出,对数据进行
分组整理
,就是将收集到的所有数
据,按照一定的标准划分为若干组。通过对杂乱无章的数据进
行分组整理,可以比较清晰地掌握数据的整体分布情况。
如何分组呢?
1
、
2
、估计该年级在这次测验中,成绩不及格的人数。
解:
(
1
)根据题意,列表如下:
分数段
数据
/
分
划记
人数
/
人
90
分以上(含
90
分)
80
分
~89
分
70
分
~79
分
60
分
~69
分
50
分
~59
分
49
分以下(含
49
分)
97
,
92,
93
,
91
92
5
89,87,80,89,81,88,82
,
85,81,82
;
10
75,73,79,75,76,76,79
,
70,73,70
;
10
61,64,69,60,63,67,64,
62,66,65,63
;
11
54,58,54,52
;
4
0
七年级数学测验抽样统计表
(
2
)在这个样本中,不及格的有
4
人,所以不及格率为:
由此估计七年级在这次测验中,成绩不及格的人数约为:
400×10﹪=40
(人)
4
40
×
100﹪=
10﹪
1.
下列数据是七年级一班
50
名同学的出生月份的调查记录:
2, 12
,
9
,
8
,
11, 5, 7, 11
,
6
,
4
,
11, 8
,
5, 7
,
2, 7
,
2
,
12
,
1, 9
,
9
,
11, 3
,
8
,
6
,
3
,
10
,
8
,
11
,
5
,
12
,
2
,
4
,
7
,
8
,
1
,
9
,
10
,
5
,
3
,
8
,
6
,
12
,
3
,
8
,
10
,
4
,
7
,
9
,
12.
(
1
)请将以上数据重新分组,使全班同学对每个月出生人数的情况一目了然。
(
2
)根据分组整理的结果,请你立即说出该班本月(
10
月份)过生日的同学有多少人?
练习
探索与创新
1
、某商店为了了解顾客对图书的需求情况,对某天售出的图书进行了分类整理,结果如下表:
类别
少儿
科技
文学艺术
教育教辅
生活保健
其他
数量(册)
20
50
40
比例
10﹪
15﹪
30﹪
(
1
)补全上表,并求出当天共售出多少本书;
(
2
)根据调查结果,你认为该书店应多进一些哪一类的图书?
1
、通过本节课的学习,你对收集数据的整理方法有哪些了解?
2
、如何适当的对数据分组?
课堂小结
第
4
章 数据的收集、整理与描述
4.4
扇形统计图
4.4
扇形统计图(
1
)
七一班最喜欢的运动项目统计图
1.
你能获得什么信息?
2.
怎样制作这个扇形统计图呢?需要知道什么条件?
本课将揭晓答案!!!
观察与思考
在“世界杯”足球赛闭幕后,时代中学学生会对本校七年级学生收看比赛电视实况转播的情况用随机抽样方式进行调查,样本容量为
50
,将数据分组整理后,列出下表:
观看场数/场
0
1
2
3
4
5
6
7
观看人数/人
4
5
10
13
8
6
3
1
观看人数占调查人数的百分比
8
10
20
26
16
12
6
2
抽样调查
50
名学生收看世界杯足球赛电视转播情况统计表
校学生会根据统计表,制作扇形统计图(如上图)观察扇形统计图,思考下列问题:
(
1
)在这幅统计图中,整个圆被分成多少个扇形?在这些扇形中,哪个扇形的面积最大?哪个最小?
(
2
)每个扇形的面积与统计表中的数据有怎样的关系?
(
3
)每个扇形的面积各占整个圆面积的百分之几?
(
4
)所有扇形表示的百分比之和是多少?量出每个扇形的圆心角的度数,这些圆心角的度数之和是多少
?
(5)
你能从扇形统计图中得到哪些信息?
例
1
据新华社
2008
年
5
月
5
日报道,截止到
2007
年底,全国共有共青团员
7543.9
万人
.
其中,学生团员
3872.8
万人,农村团员
2032.5
万人,从事第二产业的团员
553.9
万人,第三产业及其他行业中的团员
1084.7
万人
.
试用扇形统计图表示全国共青团员人数的分布情况
.
解
(1)
该则新闻报道,已对全国团员人数按学生、农村、第二产业、第三产业及其其他行业分四组进行了整理,各组人数如下表所示:
学生团员
3 872.8
农村团员
2 032.5
从事第二产业的团员
553.9
第三产业及其他行业中的团员
1 084.7
合计
7 543.9
2007
年全国共青团员人数统计表
单位:万人
(
2
)上述四组团员人数占全国团员总人数的百分比分别为:
学生团员人数占团员总人数的百分比为
3 872.8
/
7 543.9 ≈51.34%
;
农村团员人数占团员总人数的百分比为
2 032.5
/
7 543.9 ≈26.94%
;
第三产业及其他行业中的团员人数占团员总人数的百分比为
1 084.7
/
7 543.9 ≈14.38.%
;
从事第二产业团员人数占团员总人数的百分比为
553.9
/
7 543.9 ≈7.34%
;
(
3)
各扇形的圆心角的读数分别为:
学生团员:
360° ×51.34% ≈185 °
;
农村团员:
360° ×26.94% ≈97 °
;
从事第二产业的团员:
360° ×7.34% ≈26 °
;
第三产业及其他行业中的团员:
360° ×14.38% ≈5 2°.
(
4
)按圆心角的大小在同一个园中画出扇形
.
(5)
把 各部分扇形占整体的百分比标注在相应的扇形上,并在扇形图的上方或下方添加标题
.
这样就制作出
2007
年全国共青团员人数分布的扇形统计图
制作扇形统计图的步骤
(
1
)将数据分组整理,列出统计表;
(
2
)分别计算各部分在整体中所占的百分比;
(
3
)分别计算各部分相应的扇形圆心角的度数;
(
4
)用圆规作圆,再利用量角器画出各圆心角,从而把圆面按百分比分成若干个扇形;
(
5
)分别将各部分占整体百分比及相应的名称标注在扇形上;并填写标题
.
1
2
3
14
15
%
70
%
10
%
5
%
2.
下图是各国土地面积占全球陆地面积的扇形统计图根据图形分别求出各国土地面积所对应的扇形的圆心角是多少
?
解:中国:
360° ×7.2
%
=25.92°
;
美国:
360° ×7.1
%
=25.56°
;
加拿大:
360° ×7.5
%
=27°
;
俄罗斯:
360° ×12.8
%
=46.08°
;
其他:
360° ×65.4
%
=235.44°.
4.4
扇形统计图(
2
)
观察与思考
上面① ②分别是世界四大洲面积的条形图和扇形统计图,观察这两幅统计图,思考下列问题:
(
1
)哪个大洋的面积最大,哪个最小?你从哪幅统计图中看出的?
(
2
)哪个大洋的面积超过
10 000
万平方千米?你从哪幅统计图中看出来的?
(
3
)哪个大洋的面积超过地球海洋面积的
1
/
3
?你是从那幅统计图中看出的?
①
,②
太平洋最大;北冰洋最小
太平洋
①
太平洋
②
(4)
从这两幅统计图中,你还能得到哪些信息?你认为条形统计图和扇形统计图在表达信息时各有什么优势和不足?
条形统计图表达的数据是分散的,但能清晰地表示出各组实际数据
.
扇形统计图能清晰的表达出各个组的数据占整体的百分比,但不能表示各组实际数据
.
例
2
、左右图是某媒体发布的
2050
年世界人口形势预测图
.
小莹根据图中的数据,绘制了三幅统计图(下图的① ② ③请根据统计图,回答下列问题:
①
②
人口/亿
地区
③
(
1
)上图① ② ③分别是哪种类型的统计图?你能分别给它们加上标题吗?
(
2
)从哪幅统计图中,能看出
1957
年后近百年内世界人口的变化趋势?
(
3
)预测
2050
年亚洲人口将大约达到多少亿?非洲呢?你是从
哪
幅图看出来的?
(
4
)
2050
年亚洲人口与其他各洲人口的总和相比,你能得到什么结论?你是从哪幅统计图看出来的?
解:(
1
)图①是扇形统计图,标题为
2050
年世界人口分布预测统计图;图②是条形统计图,标题为
2050
年世界各洲人口预测统计图;图③是折线统计图,标题为
1957
~
2050
年世界人口变化预测统计图
.
(
2
)从折线统计图中可以看出
1957
年后近百年内世界人口的变化趋势
.
(
3
)
2050
年亚洲人口将大约达到
54.45
亿,非洲人口将大约达到
11.61
亿,这是从条形统计图中看出来的
.
(4)2050
年亚洲人口将比其他各洲人口的总和还要多
.
这是从扇形统计图看到的
.
一般来说,对于分组整理后的数据信息可以使用不
同的统计图来表达
.
但是,不同的统计图有不同的特点,因而在表达数据时,应根据需要选用适当的统计图
.
三种统计图的区别
(1)
如果需要表达的数据是分散的,并且需要清晰地表现出各组实际数据,那么使用条形统计图较为适宜
.
(2
)如果需要表达各个组的数据占整体的百分比,那么使用扇形统计图较为适宜
.
(3)
如果需要清晰地显示各组的数据在一段时期内的变化,或分析数据的变化趋势,那么使用折线统计图较为适宜
.
1.
对于下列统计的数据,选用哪种统计图表达较为适宜:
(
1
)我国
2007
年~
2017
年国内生产总值;
(
2
)我国运动员在历届奥运会上获得的金牌总数;
条形统计图或折线统计图
条形统计图或折线统计图
(
3
)银行营业厅调查一周内顾客对工作人员服务态度的评价(满意、一般、差);
扇形统计图
(
4
)学校合唱队队员的年龄
.
条形统计图或扇形统计图