第
5
章 用样本推断总体
5.1
总体平均数与方差的估计
教学目标
1.
会利用样本的平均数众数中位数方差估计总体的平均数众数中位数方差.
2.
进一步体会用样本估计总体的统计思想方法.
重点:
平均数,加权平均数.方差的计算方法
难点:
在简单随机样本中,会用样本的平均数和方差来估计总体的平均数和
方差
阅读下面的报道,回答问题.
北京市将启动2012年度人口抽样调查工作
新京报讯(记者蒋彥鑫)北京市将启动2012年度人口抽样调查工作,共1289个小区纳入
范畴
.
调查
结果将作为城市规划的依据,并监测人口调控目标的实现
程度
.
从去年起,北京每年开展年度人口抽样调查,以便掌握人口性别、年龄、就业、迁移等基本变化情况,及时监测人口调控目标的实现
程度
.
市
统计局表示,
2012年度
人口抽样调查涉及275个街道和乡镇、646个社区居(村)委会、1289年调查小区。这些小区分布在各个
区县
.
据了解,此次抽样调查是以北京人口普查数据为基数,在每个区按照人口总量2%的比例进行
抽样
.
在
样本选取的过程中,选取的小区需要能在本区县人口结构、人口规模等方面都有
代表性
.
其中
,抽样的核心指标包括流动人口比重、本地区人口出生率和死亡率、城乡属性等 ,以确保抽取样本的
科学性
.
根据该抽样的结果,将推算出每年北京人口总量以及增长的
情况
.
该
结果可以及时反映北京人口调控目标的实现情况,人口增长的特点等,并作为今后城市规划、各项政策颁布实施和人口调控的重要
依据
.
从上述报道可见,北京市统计局进行2012年度人口调查采用的是什么调查方式
?
我们在研究某个总体时,一般用数据表示总体中每个个体的某种数量特性,所以这些数据组成一个总体,而样本则是从总体中抽取的部分数据,因此,样本蕴含着总体的许多信息,这使得我们有可能通过样本的某些特性去推断总体的相应特性.
从总体中抽取样本,然后通过对样本的分析,去推断总体的情况,这是
统计的基本思想.用样本平均数、样本方差分别去估计总体平均数、总体方差就是这一思想的一个体现.
实践和理论都表明:在大多数情况下,当
样本容量足够大
时,这种估计是比较合理的.
(1)如何估计某城市所有家庭一年内平均丢弃的塑料袋个数?
(2)在检查甲、乙两种棉花的纤维长度时,如何估计哪种棉花的纤维长度比较整齐?
可以进行简单随机抽样,
然后用样本去推断总体
.
由于简单随机样本客观地反映了实际情况,能够代表总体,因此我们可用简单随机样本的平均数与方差分别去估计总体的平均数与方差.
例如,我们
可以从某城市所有家庭中抽取一部分家庭,统计他们在一年内丢弃的塑料袋个数,然后求出它们的平均值,再用这个平均值去估计该城市所有家庭一年内平均丢弃的塑料袋个数.同样,我们可以从甲、乙两种棉花中各抽取一定量的棉花,分别统计它们的纤维长度的方差,再用这两个方差分别去估计这两种棉花纤维长度的整齐性,方差小的棉花品种整齐性较好.
某
农科院在某地区选择了自然条件相同的两个试验区,用相同的管理技术试种甲、乙两个品种的水稻各100 亩. 如何确定哪个品种的水稻在该地区更有推广价值呢?
为了选择合适的稻种,我们需要关心这两种水稻的 平均产量及产量的稳定性(即方差).
于是,待水稻成熟后,各自从这
100
亩水稻随机抽取
10
亩水稻,记录它们的亩产量(样本),数据如下
表:
动脑筋
种类
每亩水稻的产量(kg)
甲
865
885
886
876
893
885
870
905
890
895
乙
870
875
884
885
886
888
882
890
895
896
这
10
亩甲、乙品种的水稻的平均产量分别为:
=
(865 + 885 + 886 + 876 + 893 + 885 + 870 + 905 + 890 + 895)= 885,
= (870 + 875 + 884 + 885 + 886 + 888 + 882 + 890 + 895 + 896)= 885.1.
由于这10亩水稻是简单随机抽取的,因此可以分别用这10亩水稻的平均产量去估计这两种水稻大面积种植后的平均产量.
由于在试验区这两种水稻的平均产量相差很小,从而我们可以估计出大面积种植这两种水稻后的平均产量也相差很小,所以,单从平均产量这一角度来考虑,我们还不能确定哪种水稻更有推广价值.因此,我们还需要考虑这两种水稻产量的稳定性.
利用计算器,我们可计算出这10 亩甲、乙品种水稻产量的方差分别为129.6,59.09. 由于59.09