第四章 数据的收集与整理
4.1 喜爱哪种动物的同学最多
——全面调查举例
课前导读
1.收集数据有哪些方式?
2.整理数据我们一般用什么方式?
3.班上要选举三好生,一般采取划“正”字的方法,怎么做的?请与你的同伴交流。
4.描述数据有哪些方式?
课中导学
1.全面调查是指_______________________________________________.
2. 设计一个方案,了解你班同学的视力情况。
【精典例题】 例 1.下图是国家对某沙漠地区植树面积计划的统计图
(1)图中的树高表示什么?从图中能获得哪些些信息?
(2)各年份约种树多少万亩?
(3)若每人每年平均植树 10 亩,在各时间段需要多少人?
【解析】(1)树高表示植树亩数,从图上看,植树面积一年比一年多,说明国家征服沙漠的
决心很大;(2)2002 年种树约 50 万亩,2003 年种树约 75 万亩,2004 年种树约 100 万亩,
2005 年种树约 150 万亩,2006 年种树约 200 万亩;(3)2002 年需 5 万人,2003 年需 7.5 万
人,2004 年需 10 万人,2005 年需 15 万人,2006 年需 20 万人,
课后导练
1.整理数据用表格,描述统计数据可用_____图和_____图来直观表示。
2002 2003 2004 2005 2006
50 万亩
1
3
2
0 1 2 3 4 5
人数
课 外 活 动 次
数
代 表 甲 代表乙班
2.国家人口普查是_______调查,即调查对象包括全国人口。
3.根据下表,回答问题。
动物名称 鸡 鸭 鹅 鸽子 火鸡
孵化时间 21 天 30 天 30 天 16 天 26 天
(1)孵化期最短是_________天,是___________动物;
(2)孵化期最长是_________天,是___________动物。
4.数学兴趣学习小组对本校七年级全校学生每天到校方式进行了一次调查,调查的数据如
下表:
步行 骑自行车 坐公共汽车 其它方式
50 人 100 人 140 人 10 人
(1)这个学校七年级有__________名学生;
(2)采用_____________到校方式的人最多,有______人;
(3)采用_____________到校方式的人最少,有______人;
(4)采用_____________到校方式的人数是采用__________到校方式的人数的两倍。
(5)调查一下你所在班级所有同学每天到校方式,并制作一个统计表整理你的数据。
5.下表是对四位小朋友每天回家看课外书的时间的调查
姓名 小明 小亮 小华 小花
时间(分钟) 30 10 8 5
从这张表中你能获得哪些信息?与你的同伴交流。
6.某市教育局为了了解本市中小学实施素质教育的情况,抽查了某校七年级甲、乙两个班
的部分学生,了解他们在一周内(星期一至星期五)参加课外活动的次数情况,抽查结果统
计如下:
(1)在这次抽查中,甲班被抽查了______人,乙班被抽查了_______人;
(2)在被抽查的学生中,甲班学生参加课外活动的平均次数为_______次,
乙班学生参加课外活动的平均次数为_______次。
(3)从图中你还能得到哪些信息?
7.小华调查了七(2)班 50 名同学最喜欢的足球明星,结果如下:
B B C A A B C D C B
C A D D B A C C B A
A B D A C C A B A C
A B C D A C C A C A
A A A C B C C A A D
其中 A 代表贝克汉姆,B 代表欧文,C 代表罗纳尔多,D 代表巴乔。
(1)填写下表
足球明星 划记 人数 百分比
A
B
C
D
合计
(2)该班同学最喜欢哪位明星?
8.为了调查居民的生活水平,有关部门对某居委会的 50 户居民的家庭存款额进行了调查,
数据(单位:万元)如下:
1.7 3.5 2.3 6.4 2.0 1.9 6.7 4.8 5.0 4.7
2.3 3.4 5.6 3.7 2.2 3.3 5.8 4.3 3.6 3.8
3.0 5.1 7.0 3.1 2.9 4.9 5.8 3.6 3.0 4.2
4.0 3.9 5.1 6.3 1.8 3.2 5.1 5.7 3.9 3.1
2.5 2.8 4.5 4.9 5.3 2.6 7.2 1.9 5.0 3.8
(1)这 50 个家庭存款额的最大值、最小值分别是多少?它们相差多少?
(2)填表:
存款额 x(万元) 划记 户数
1.0≤x<2.0
2.0≤x<3.0
3.0≤x<4.0
4.0≤x<5.0
5.0≤x<6.0
6.0≤x<7.0
7.0≤x<8.0
(3)根据上表谈谈这 50 户家庭存款额的分布情况。
课外导思
9.设计一个调查问卷,调查你班同学喜欢哪一部动画片,并用适当的表格整理数据,看看
有什么结论。请与你的同伴交流。
读一读
“统计”一词的产生
统计已经有几千年的历史。不过在早期还没有出现“统计”这样的用语。
统计语源最早出现于中世界拉丁语的 Status,意思指各种现象的状态和状况。由
这一语根组成意大利语 Stato,表示"国家"的概念,也含有国家结构和国情知识的意思。
根据这一语根,最早作为学名使用的“统计”,是在十八世纪德国政治学教授亨瓦尔
(G.Achenwall) 在 1749 年所著《近代欧洲各国国家学纲要》一书绪言中,把国家学
名定为“Statistika”(统计)这个词。原意是指“国家显著事项的比较和记述”或“国
势学”,认为统计是关于国家应注意事项的学问。此后,各国相继沿用“统计”这个词,
并把这个词译成各国的文字,法国译为 Statistique,意大利译为 Statistica,英国译
为 Statistics,日本最初译为“政表”、“政算”、“国势”、“形势”等,直到 1880
年在太政官中设立了统计院,才确定以“统计”二字正名。1903 年(清光绪廿九年)由
钮永建、林卓南等翻译了四本横山雅南所著的《统计讲义录》一书,把“统计”这个词
从日本传到我国。1907 年(清光绪卅三年)彭祖植编写的《统计学》在日本出版,同时
在国内发行,这是我国最早的一本“统计学”书籍。“统计”一词就成了记述国家和社
会状况的数量关系的总称。
4.2 调查中小学生的视力情况
——抽样调查举例
课前导读
1.某地区要对中小学生的视力情况,请你设计一个调查方案,并与你的同伴交流。
2.要找出保护视力的措施,在设计调查问卷时应考虑调查哪些问题?
3.统计调查是收集数据常用的方法,一般有哪两种调查方式?
课中导学
1.你能区别总体、个体、样本吗?
2.抽样调查是指 。
3.举例说明在什么情况下用全面调查较好?
4.举例说明在什么情况下用抽样调查较好?
【精典例题】
例 1.为了解某市在校学生的身体营养状况,可通过抽取学生的血样进行血色素检测,现随
机抽取该市七年级 8000 名学生进行血色素检测,以此来估计该市在校学生的营养状况,你
认为这种调查是否可行?请说明理由,如果要准确反映该市学生的身体营养状况,你认为应
该怎样调查更合理一些?
【解析】 本例主要考查抽样不同会对结果产生影响。仅有七年级学生的身体情况不足以反
映全市学生的身体状况。因为各年龄层次的学生、城区与农村的学生生活状况是不同的。
解:从该市随机抽取七年级 8000 名学生进行血色素检测,只能反映该市七年级学生的营养
状况,不足以反映全市学生的身体状况的。原因是各年龄层次的学生、城区与农村的学生生
活状况是不同的。为了准确反映该市所有学生的身体营养状况,应从各个年级、不同地区随
机抽取部分学生,用他们的身体营养状况可反映全映学生的身体营养状况。
说明 本例说明抽样调查时应注意样本的代表性和广泛性,不能以偏概全而出现抽样的
不合理性。
例 2.某专业户要出售 100 只羊,现在市场上羊的价格为每千克 11 元,为了估计这 100 只
羊能卖多少钱,该专业户从中随机抽取 5 只羊,每只羊的重量如下(单位:千克):
26 31 32 36 37
⑴试分别指出上述问题中的总体、个体和样本各是什么?
⑵上述问题中的调查方式是全面调查好还是抽样调查好,请说明你的理由;
⑶估计这 100 只羊每只羊的平均重量;
⑷估计这 100 只羊能卖多少钱?
【解析】在⑶中可用样本平均数估计出总体平均数;⑷中问题便迎刃而解。
解:⑴在上述问题中的总体是 100 羊的重量;个体是一只羊的重量;样本是所抽取的 5 只羊
的重量;
⑵在上述问题中的调查方式宜采用抽样调查方式为好。由于羊的头数太多,不宜采用全
面调查方式去调查。
⑶样本平均数为 1
5
(26+31+32+36+37)=32.4(千克),故可以估计这 100 只羊每只羊
的平均重量为 32.4 千克。
⑷32.4×100×11=35640(元),这 100 只羊能卖 35640 元。
课后导练
1.以下调查适合作抽样调查的有( )
(1)了解全班同学期末考试的数学成绩(2)了解夏季冷饮市场上冰淇淋的质量情况 (3)
了解中学生吸烟状况 (4)了解一片森林里有多少只野兔(5)调查全校学生对学校预防“非
典”所采取措施的看法。
(A)1 个 (B)2 个 (C)3 个 (D)4 个
2. 一名交警在高速公路上随机观察了 6 辆车的车速,然后他给出了一份报告,调查结果如
下表:
车序号 1 2 3 4 5 6
车速(千米/时) 56 66 73 58 69 58
⑴交警采用的是__________调查方式;
⑵这个调查的样本是_________________,个体是___________________。
3. 我国 2003 年上半年每日公布非典疫情,其中有关数据的收集所采用的调查方式是
_______ 。
4.某省有 7 万名学生参加初中毕业会考,要想了解这 7 万名学生的数学成绩,从中抽取了 1000
名考生的数学成绩进行统计分析,以下说法正确的是( )
(A)这 1000 名考生是总体的一个样本
(B)每位考生的数学成绩是个体
(C)7 万名考生是总体
(D)这种调查是抽样调查
5.为增强市民的环保意识,配合 6 月 5 日的“世界环境日”活动,某校七年级 50 名学生在
一天调查了各自家庭丢弃废塑料袋的情况,这个问题中 50 名学生各自家庭一天丢弃废塑料
袋的情况是( )
(A)总体 (B)样本 (C)个体 (D)样本的数目
6. 当今,青少年视力水平的下降已引起全社会的关注。为了解某中学毕业年级 500 名学生
的视力情况,从中抽测了 80 名学生的视力,在这个问题中,总体、个体、样本各指什么?
上述问题采用全面调查还是抽样调查?
7.《三国演义》是我国最经典的名著之一。为了解我国阅读过《三国演义》的读者,你认为
采用什么方式调查更合适些,你认为对不同地区、不同年龄、不同文化背景的人所作的调查
结果会一样吗?
8.某瓜农采用大棚栽培技术种植了一亩地的良种西瓜,这亩地产西瓜约 800 个,在西瓜上
市前该瓜农随机摘下了 10 个成熟的西瓜,称重如下:
西瓜质量(单位:千克) 5.5 5.4 5.0 4.9 4.6 4.3
西瓜数量(单位:个) 1 2 3 2 1 1
(1)在这个问题中,总体、个体、样本各指什么?
(2)在这个样本中,平均数是多少?
(3)试估计这亩地的西瓜产量约是多少千克。
课外导思
9.“在一次考试中,考生有 4 万多名,如果为了得到这些考生的数学平均成绩而将他们的成
绩全部相加再除以所有考生总数,那将是十分麻烦的。那么怎样才能了解这些考生的数学平
均成绩呢?”
“通常在考生很多的情况下,我们是从中抽取部分考生(比如说 500 名)的成绩,用他
们的平均成绩去估计所有考生的平均成绩。”
上述文字表述了用样本平均数估计总体平均数的统计思想,其中总体指的是 ,
个体指的是 。
用你用简洁的语言举一个在实际生活中运用同样思想解决问题的例子,同样写出其中的
总体、个体和样本各是什么?并说一说要想了解总体的情况采用哪种调查方式较好?
读一读
大样本一定能保证调查结论准确吗
仅仅调查了 100 位老年人的健康的状况,能据此推断我国所有老年人的健康状况吗?不
能,因为样本太小了。那么,大样本就能保证调查结论准确吗?
1936 年,美国《文学文摘》杂志根据 1000 万户电话和从该杂志订户所收回的意见,断
言兰登将以 370:161 的优势在总统选举中击败罗斯福。但结果是,罗斯福当选了,《文学文
摘》大丢面子,原因何在呢?
原来,1936 年能装电话或订阅《文学文摘》杂志的人,在经济上都相对富裕,而收入
不太高的大多数选民选择了罗斯福。《文学文摘》的教训表明,抽样调查时,既要关注样本
的大小,又要关注样本的代表性。
本章测试题
一、选择题(每小题 4 分,共 28 分)
1. 实验中学七年级进行了一次数学测验,参考人数共 480 人,为了解这次数学测验成绩,
下列所抽取的样本中较为合理的是( )
(A)抽取前 100 名同学的数学成绩
(B)抽取后 100 名同学的数学成绩
(C)抽取(1)、(2)两班同学的数学成绩
(D)抽取各班学号为 3 号的倍数的同学的数学成绩
2. 为了了解某县 30~50 岁成人的健康状况,采取了抽样调查方式获得结果。下面所采取的
抽样合理的是( )
(A)抽查了该县 30~50 岁的男性公民
(B)抽查了该县城区 30~50 岁的成人
(C)随机抽查了该县所有 30~50 岁成人共 400 名
(D)抽查了该县的所有 30~50 岁的工人
3.下列说法正确的是( )
(A)只有通过全面调查才能获取总体的特征
(B)抽样调查是获取数据的唯一途径
(C)全面调查比抽样调查方便得多
(D)抽样调查时的样本应具有随机性
4.某市教育局今年体育测试中,从某校毕业班中抽取男、女学生各 15 人进行三项体育成绩
复查测试.在这个问题中,下列叙述正确的是( )
(A)该校所有毕业班学生是总体 (B)所抽取的 30 名学生是样本
(C)样本的数目是 15 (D)个体指的是毕业班每一个学生的体育测试成绩
5.如图所示,分别是我国 1997 年~2000 年全国初中生在校人数和全国初中学校数的统计
图:
由上图可知,1997 年~2000 年,我国初中生在校人数( )
A.逐年增加,学校数也逐年增加
B.逐年增加,学校数却逐年减少
C.逐年减少,学校数也逐年减少
D.逐年减少,学校数却逐年增加
6.以下调查适合作抽样调查的有( )
(1)了解夏季冷饮市场上冰淇淋的质量情况;(2)了解全班同学期末考试的数学成绩;(3)
了解中学生吸烟状况;(4)了解一片森林里有多少只野鸡;(5)检测某城市的空气质量。
A.1 个 B.2 个 C.3 个 D.4 个
6600
6200
5800
5400
5000
4600
1997 1998 1999 2000 年份
在校人数(万人)
全国初中生在校人数统计图
1997 1998 1999 2000 年份
6.65
6.55
6.45
6.35
6.25
6.15
学校数(万所)
全国初中学校数统计图
7.为了解某城市老年人的健康状况,你可采取以下( )方法去收集数据。
(1)问卷调查; (2)访问调查; (3)查阅资料; (4)关心老年人
A.1 种 B.2 种 C.3 种 D.4 种
二、填空题(每小题 4 分,共 20 分)
8.要了解你班同学的每周平均上网时间,你所采取的调查方式可以是 。
9. 近几年,人们的环保意识逐渐增加,“白色污染”现象越来越受到人们的重视.小亮同
学想了解班上同学家里在一年内丢弃废塑料袋的个数,你认为可采用 调查方式合
适一些.
10.某班若干名女生身高检测结果如下表(单位:米)
身高 1.57 1.58 1.59 1.60 1.61 1.62 1.64 1.65
人数 2 2 3 3 8 7 3 2
则该班女生有________人,身高最高是_______米。
11. 甲、乙两人参加某体育项目训练五次测试成绩得分如下表:
次数 第一次 第二次 第三次 第四次 第五次
甲 20 23 22 24 26
乙 23 24 22 22 24
(1)第_______次甲、乙两人的得分相差最大,相差______分;
(2)第_______次甲、乙两人的得分相同,都是______分
12.美化城市,改善人们的居住环境已成为城市建设的一项重要内容。某市城区近几年来,
通过各种措施,使城市绿地面积不断增加,如下图所示。根据图中所提供的信息,可知 2003
年底的绿地面积为_________公顷,比 2002 年增加了_______公顷,在 2001 年、2002 年、
2003 年这三年中,绿地面积增加最多的一年是_________.
三、解答题(共 52 分)
13. (本题满分 8 分)天津及杭州两城市月降水量统计表(单位:0.1mm)
城市 一
月
二
月
三
月
四
月
五
月
六
月
七
月
八
月
九
月
十
月
十一
月
十二
月
天津
杭州
30
287
58
297
90
482
265
677
287
855
707
960
1755
1592
1820
1830
489
1234
177
946
60
600
63
588
根据上表,回答下列问题:
(1)哪个城市一年的降水量大?哪个城市的降水量幅度大?
(2)两城市在哪个月的降水量相差最大?差是多少?
(3)哪几个月两城市的降水量相差在 30 毫米之内?
60
56
52
48
44
40
绿地面积(公顷)
2000 2001 2002 2003 年份
14.(本题满分 8 分)华山鞋厂为了解初中学生穿鞋的鞋号情况,对永红中学七年级的 20
名男生所穿鞋号统计如下:
23.5 23.5 24 24.5 25 25.5 26 25 24.5 24
24 24.5 25 25 26 24.5 25 24 25.5 25
(1)填写下表
鞋号 23.5 24 24.5 25 25.5 26
人数
(2)根据表中的的信息,你能给该鞋厂有何建议?
15.(本题满分 8 分)光华中学为了解本校中学生的身体发育状况,对某年级同龄的 40 名女
学生的身高进行了测量,结果如下(数据均为整数,单位:厘米):
167,154,159,166,169,159,156,162,158,159,
160,164,160,157,161,158,153,158,164,158,
163,158,160,157,162,159,165,157,151,146,
151,160,165,158,163,162,154,149,168,164
请你填写下表:
16. (本题满分 8 分)下面是小明一天时间安排的统计图:(单位:小时)
(1)小明一天时间安排中,哪方面的安排所花时间最多?是多少?
(2)他一天时间安排中,哪方面的安排所花时间最少?是多少?
分组 划记 人数
144.5~149.5
149.5~154.5
154.5~159.5
159.5~164.5
164.5~169.5
合 计
10
9
8
7
6
5
4
3
2
1
睡觉 学习 活动 吃饭 其它
(3)制作一张表格,表示小明一天的作息时间安排
17.(本题满分 10 分)为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备
对 180 名初中男生的身高作调查,现有三种调查方案:
A.测量少年体校中 180 名男子篮球、排球队员的身高
B.查阅有关外地 180 名男生身高的统计资料
C.在本市的市区和郊县各任选三所初级中学,在这六所学校有关年级的一个班中,由
抽签的方法分别选出 10 名男生,然后测量他们的身高
(1) 为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调
查方案比较合理,为什么?(答案分别填在空格内)
答:选 ,理由: 。
(2)下表中的数据是使用了某种调查方法获得的:
初中男生身高情况抽样调查表
七年级 八年级 九年级 总计
143~153 12 3 0
153~163 18 9 6
163~173 24 33 39
173~183 6 15 12
183~193 0 0 3
1 填写表中的空格;
2 被调查的七年级、八年级、九年级各有多少名学生?
3 请你为生产计划提出建议。
18.(本题满分 10 分)下图是小华作的一周的零用钱的统计图(单位:元)
分析上图,请回答下列问题:
(1)周几小华用的零用钱最多,是多少?他零用钱花得最少的一天是多少元?
(2)哪几天他花的零用钱是一样的?分别是多少?
年
级
人
数
身高/㎝
12
10
8
6
4
2
0
周一 周二 周三 周四 周五 周六 周日
(3)你能帮小华算一算一周平均每天用多少零用钱吗?
(4)估计一下,小华一月用去多少零用钱?(一个月按 30 天计算)
读一读
农村住户调查简介
国家统计局对农民收入的统计是通过“农村住户调查”来完成的。“农村住户调查”是
通过对农村居民家庭的生产、收入、消费、积累和社会活动的调查,全面反映农村居民的收
入和生活质量的变化,对农村居民实现小康和摆脱贫困的进程进行监测,为各级政府制定农
村政策和决策提供依据,也为国民经济核算提供了基础数据。
国际上开展“住户调查”已有很长的历史,我国农村开展住户调查始于 1954 年,在 1954
年至 1977 年间,该调查曾因“人民公社化”运动和“文化大革命”运动两次中断,1977 年
该调查再次恢复。1984 年国家统计局农村社会经济调查队成立以后,农村住户调查获得了
长足发展,调查方法、调查内容逐渐与国际接轨,走上了科学化、规范化和现代化的道路。
“农村住户调查”采用的是抽样调查方法,在全国共抽取了 6.8 万个农户的作为调查样
本,样本分布在全国 31 个省(区、市)的 857 个县中。这套样本对全国和分省的农民收入
水平具有很高的代表性,但是,由于经费和人员的限制,这套样本还不能满足地级以下代表
性的要求。因此,调查结果仅能反映全国和分省的情况。
经过多年的实践,“农村住户调查”逐步完善,现已形成一套完整、科学的方法体系和
严格的管理制度。
1.调查组织。农村住户调查方案由国家统计局统一制订,各地按照统一方案的要求贯
彻执行,省、县农调队负责组织当地的调查工作。为保证调查顺利开展,全国约有 8000 名
专职调查员和近 10000 名辅助调查员参与这项调查工作。
2.网点抽选。实行国家统一方案、统一审批、统一管理的原则。网点抽选方案和实施
细则由国家统计局统一制发,并由农调总队负责组织实施;各省农调队根据统一方案和实施
细则制订本省的实施细则,在得到农调总队批准后负责具体实施;网点的变动和更新必须由
国家统计局批准。现行农村住户调查网点的抽选方法是简单随机抽样、分层随机抽样,有关
标志排队对称等距随机抽样和三相二阶段随机抽样的综合运用。首先以省为总体,国家调查
县所辖行政村编制抽样框,抽选调查村;然后在抽选出的调查村中抽选调查户,抽选调查户
的方法是,首先收集全村每个住户的人均纯收入和每户的常住人口,然后按人均纯收入的高
低将所有户顺序排队,编制抽样框,用对称等距的方法抽选出调查户。
3.调查资料采集。现行方法采用的是农户记帐与一次性调查相结合的方法,反映农户
现金收支和实物收支的资料通过农户记帐获得,其他有关农户的基本情况、劳动力就业情况
等采取一次性调查的方式获得。调查户记帐按照国家统计局统一编制的帐本和要求来记帐。
现金收支帐每日一记,实物收支发生一笔记一笔。县级农调队每月收取调查户的帐本,录入
到计算机中。一次性调查由县级农调队的调查员完成,采取入户面访的调查方式。
4.调查资料审核。为确保调查数据的质量,对调查数据的审核有一套严格的制度规定。
在现场调查结束后,要求采取三种方法对调查资料进行审核:一是人工审核。在调查数据录
入计算机之前,辅助调查员和县农调队必须对农户所记的帐和一次性调查表进行核查。二是
计算机审核。在人工审核完成后,由县农调队将数据录入计算机中,应用统一的程序对数据
进行审核。三是数据评估。县农调队将调查数据录入审核完成后将调查数据上报省农调队,
省农调队再次对数据进行审核,并重点地对调查数据评估。
5.调查资料汇总。对调查资料的汇总实行国家级超级汇总。全国统一使用由农调总队
专门开发的计算机数据处理程序,各地将审核后调查原始数据上报农调总队,由农调总队负
责对各地上报的调查数据进行汇总,并将汇总结果反馈给各省,同时各地也对本地区的调查
数据进行汇总,以便相互监督。
6.调查结果发布。调查结果的发布实行国家统一管理,国家级统计结果由国家统计局
发布,各省统计结果由各省统计局发布。但是,各省发布统计结果之前,必须经国家统计局
审批认定后才能发布,以确保各省发布的统计结果与超级汇总的结果一致。