1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;
2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点.
1.抽样方法
抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但
又各有其特点和适用范围.
2.统计中的四个数据特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据
的平均数作为中位数.
(3)平均数:样本数据的算术平均数,即 =
1
n(x1+x2+…+xn).
(4)方差与标准差.
s2=
1
n[(x1- )2+(x2- )2+…+(xn- )2],
s=
1
n[(x1-)2+(x2-)2+…+(xn-)2].
3.直方图的两个结论
(1)小长方形的面积=组距×
频率
组距=频率.
(2)各小长方形的面积之和等于 1.
4.回归分析与独立性检验
(1)回归直线 y^
= b^
x+ a^
经过样本点的中心点( , ),若 x 取某一个值代入回归直线方程 y^
= b^
x+a^
中,可
求出 y 的估计值.
(2)独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量 X 和 Y,其样本频数列联表是:
y1 y2 总计
x1 a b a+b
专题五
第 1 讲 统计与统计案例
概率与统计
考向预测
知识与技巧的梳理
x
x x x
x yx2 c d c+d
总计 a+c b+d n
则 K2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)(其中 n=a+b+c+d 为样本容量).
热点一 用样本估计总体
【例 1】 (2016·四川卷)我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活
用水收费方案,拟确定一个合理的月用水量标准 x(吨),一位居民的月用水量不超过 x 的部分按平价收费,超
出 x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:
吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成 9 组,制成了如图所示的频率分布直方图.
(1)求直方图中 a 的值;
(2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,并说明理由;
(3)若该市政府希望使 85%的居民每月的用水量不超过标准 x(吨),估计 x 的值,并说明理由.
解 (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为 0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为 0.08,0.20,0.26,0.06,
0.04,0.02.
由 0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得 a=0.30.
(2)由(1)可知,100 位居民每人月均用水量不低于 3 吨的频率为 0.06+0.04+0.02=0.12.
由以上样本的频率,可以估计全市 30 万居民中月均用水量不低于 3 吨的人数为 300 000×0.12=36 000.
(3)因为前 6 组的频率之和为 0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,
而前 5 组的频率之和为 0.04+0.08+0.15+0.20+0.26=0.730, b^