第 2 章 统计
§2.1 抽样方法
重难点: 结合实际问题情境,理解随机抽样的必要性和重要性,在参与解决统计问题的过
程中,学会用简单随机抽样方法从总体中抽取样本;通过对实例的分析,了解分层抽样和系
统抽样方法.
考纲要求:①理解随机抽样的必要性和重要性.
②会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
经典例题:某校高中部有三个年级,其中高三有学生 1000 人,现采用分层抽样法抽取一个
容量为 185 的样本,已知在高一年级抽取了 75 人,高二年级抽取了 60 人,则高中部共有多
少学生?
当堂练习:
1.为了了解全校 900 名高一学生的身高情况,从中抽取 90 名学生进行测量,下列说法正
确的是( )
A.总体是 900 B.个体是每个学生 C.样本是 90 名学生 D.样本容量是 90
2.某次考试有 70000 名学生参加,为了了解这 70000 名考生的数学成绩,从中抽取 1000
名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:
①1000 名考生是总体的一个样本;②1000 名考生数学成绩的平均数是总体平均数;
③70000 名考生是总体; ④样本容量是 1000,
其中正确的说法有:( )
A.1 种 B.2 种 C.3 种 D.4 种
3.对总数为 N 的一批零件抽取一个容量为 30 的样本,若每个零件被抽到的概率为 0.25,
则 N 的值为( )
A.120 B.200 C.150 D.100
4.从某鱼池中捕得 120 条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中
捕得 100 条鱼,计算其中有记号的鱼为 10 条,试估计鱼池中共有鱼的条数为( )
A. 1000 B. 1200 C. 130 D.1300
5.要从已编号(1~60)的 60 枚最新研制的某型导弹中随机抽取 6 枚来进行发射试验,用
每部分选取的号码间隔一样的系统抽样方法确定所选取的 6 枚导弹的编号可能是( )
A.5,10,15,20,25,30 B.3,13,23,33,43,53
C.1,2,3,4,5,6 D.2,4,8,16,32,48
6.从 N 个编号中抽取 n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为
( )
A. N
n
B. n C. N
n
D. 1N
n
7.某小礼堂有 25 排座位,每排有 20 个座位。一次心理讲座时礼堂中坐满了学生,会后为
了了解有关情况,留下了座位号是15的所有的25名学生测试。这里运用的抽样方法是( )
A、抽签法 B、随机数表法 C、系统抽样法 D、分层抽样法
8.某校有行政人员、教学人员和教辅人员共 200 人,其中教学人员与教辅人员的比为 101,
行政人员有 24 人,现采取分层抽样容量为 50 的样本,那么行政人员应抽取的人数为( )
A. 3 B. 4 C.6 D. 8
9.某单位有老年人 28 人,中年人 54 人,青年人 81 人,为了调查他们的身体状况的某项
指标,需从他们中间抽取一个容量为 36 样本,则老年人、中年人、青年人分别各抽取的人
数是( )
A.6,12,18 B.7,11,19 C.6,13,17 D.7,12,17
10.现有以下两项调查:①某装订厂平均每小时大约装订图书 362 册,要求检验员每小时抽
取 40 册图书,检查其装订质量状况;②某市有大型、中型与小型的商店共 1500 家,三者数
量之比为 1∶5∶9.为了调查全市商店每日零售额情况,抽取其中 15 家进行调查. 完成①、
②这两项调查宜采用的抽样方法依次是( )
A.简单随机抽样法,分层抽样法 B.分层抽样法,简单随机抽样法
C.分层抽样法,系统抽样法 D.系统抽样法,分层抽样法
11.某单位业务人员、管理人员、后勤服务人员人数之比依次为 15∶3∶2.为了了解该单
位职员的某种情况,采用分层抽样方法抽出一个容量为 n 的样本,样本中业务人员人数为
30,则此样本的容量 n 为( )
A.20 B.30 C.40 D.80
12.某社区有 400 个家庭,其中高等收入家庭 120 户,中等收入家庭 180 户,低收入家庭
100 户.为了调查社会购买力的某项指标,要从中抽取一个容量为 100 的样本记作①;某校
高一年级有 12 名女排球运动员,要从中选出 3 人调查学习负担情况,记作②;那么,完成
上述 2 项调查应采用的抽样方法是( )
A.①用随机抽样法,②用系统抽样法 B.①用分层抽样法,②用随机抽样法
C.①用系统抽样法,②用分层抽样法 D.①用分层抽样法,②用系统抽样法
13.为了了解参加运动会的 2000 名运动员的年龄情况,从中抽取 100 名运动员;就这个问
题,下列说法中正确的有( )个
①2000 名运动员是总体;②每个运动员是个体;③所抽取的 100 名运动员是一个样本;④
样本容量为 100;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率
相等
A.1 B.2 C.3 D.4
14.要了解某产品的使用寿命,从中抽取 10 件产品进行实验,在这个问题中,总体
是 ,个体是 ,样本是 ,样本容量是 .
15.若总体中含有 1650 个个体,现在要采用系统抽样,从中抽取一个容量为 35 的样本,分
段时应从总体中随机剔除 个个体,编号后应均分为 段,每段有
个个体.
16.某城市有学校 500 所,其中大学 10 所,中学 200 所,小学 290 所.现在取 50 所学校作
为一个样本进行一项调查,用分层抽样进行抽样,应该选取大学 所,中学
所,小学 _所.
17.简单随机抽样的基本方法有:① ;② .
18.用简单随机抽样从含有 8 个个体的总体中抽取一个容量为 2 的样本.问:
①总体中的某一个体 a 在第一次抽取时被抽到的概率是多少?
②个体 a 在第 1 次未被抽到,而第 2 次被抽到的概率是多少?
③在整个抽样过程中,个体 a 被抽到的概率是多少?
19.某学校有职工 140 人,其中教师 91 人,教辅行政人员 28 人,总务后勤人员 21 人。为
了解职工的某种情况,利用系统抽样方法从中抽取一个容量为 20 的样本.
20.一个单位的职工有 500 人,其中不到 35 岁的有 125 人,35 岁至 49 岁的有 280 人,50
岁以上的有 95 人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取 100 名
职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
频率
组距
次数49.5 74.5 99.5 124.5149.5
21.用简单随机抽样的方法从含有 10 个个体的总体中,抽取一个容量为 2 的样本,则某一个
体 a“第一次被抽到的概率”、“第一次未被抽到,第二次被抽到的概率”、“在整个抽样过程
中被抽到的概率”分别是多少?
必修 3 第 2 章 统计
§2.2-3 总体估计
重难点:会用样本频率分布去估计总体分布,正确地编制频率分布表并能绘制频率直方图、
条形图、折线图、茎叶图,体会它们的意义和作用;用样本数据的方差和标准差估计总体的
方差与标准差,理解样本数据的方差、标准差的意义和作用,解决一些简单的实际问题.
考纲要求:①了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、
茎叶图,理解它们各自的特点.
②理解样本数据标准差的意义和作用,会计算数据标准差.
③能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.
④会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,
理解用样本估计总体的思想.
⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.
经典例题:为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所
得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分
别是 0.1,0.3,0.4.第一小组的频数是 5.
(1) 求第四小组的频率和参加这次测试的学生人数;(2) 在这次测试中,学生跳绳次数的中
位数落在第几小组内?(3) 参加这次测试跳绳次数在 100 次以上为优秀,试估计该校此年级
跳绳成绩优秀率是多少?
当堂练习:
1.10 名工人某天生产同一零件,生产的件数是 15 ,17 , 14 , 10 , 15 , 17 ,17 , 16, 14 ,
12.
设其平均数为 a,中位数为 b,众数为 c,则有( )
A. cba B. acb C. bac D. abc
2.在用样本估计总体分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确 B.总体容量越小,估计越精确
C.样本容量越大,估计越精确 D.样本容量越小,估计越精确
3.200 辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70]
的汽车大约有( )
0.5
人数(人)
时间(小时)
20
10
5
0 1.0 1.5 2.0
15
A.30 辆 B.40 辆 C.60 辆 D.80 辆
4.对于样本频率直方图与总体密度曲线的关系,下列说法正确的是( )
A.频率分布直方图与总体密度曲线无关 B.频率分布直方图就是总体密度曲线
C.样本容量很大的频率分布直方图就是总体密度曲线
D.如果样本容量无限增大,分组的组距无限的减小,那么频率分布直方图就会无限接近于
总体密度曲线
5.某校为了了解学生的课外阅读情况,随机调查了 50 名学
生,得到他们在某一天各自课外阅读所用时间的数据,结果用
右侧的条形图表示. 根据条形图可得这 50 名学生这一天平
均每人的课外阅读时间为( )
A.0.6 小时 B.0.9 小时
C.1.0 小时 D.1.5 小时
6.今有一组实验数据如下:
t 1.99 3.0 4.0 5.1 6.12
v 1.5 4.04 7.5 12 18.01
现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是( )
A.v=log2t B.v=log
2
1 t C.v=
2
12 t D.v=2t-2
7.已知数据 1 2 nx x x, , , 的平均数为 5x ,则数据 13 7x , 23 7x ,…, 3 7nx 的平均数
为( )
A.18 B.22 C.15 D.21
8.若 M 个数的平均数是 X, N 个数的平均数是 Y,则这 M+N 个数的平均数是( )
A.
2
X Y B. X Y
M N
C. MX NY
M N
D. MX NY
X Y
9.10 个正数的平方和是 370,方差是 33,那么平均数为( )
A.1 B.2 C.3 D.4
10.下列说法正确的是( )
A.甲乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样
B.期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班
好
C.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班大,则数学学习甲班
比乙班好
D.期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班小,则数学学习甲班
比乙班好
11.数据 a1,a2,a3,…,an 的方差为σ2,则数据 2a1,2a2,2a3,…,2an 的方差为( )
A.
2
2 B.σ2 C.2σ2 D.4σ2
12.统计量是指不含有任何未知参数的样本的函数。已知 1 2 3 4, , ,X X X X 是抽自总体 X 的一组
样本,则
① 1X ;② 1X +1;③ 1 2 3 ( , , , )aX bX cX a b c
其中 为未知参数 ④ 2 2 2
1 2 3X X X ,其中是统计
量的有( )个
A.1 B.2 C.3 D.4
13.某题的得分情况如下:其中众数是( ).
得分/分 0 1 2 3 4
[来源:Z.Com]
百分率/(%) 37.0 8.6 6.0 28.2 20.2
A.37.0% B.20.2% C.0 分 D.4 分
14.从存放号码分别为 1,2,…,10 的卡片的盒子中,有放回地取 100 次,每次取一张卡
片并记下号码 统计结果如下:
卡片号码 1 2 3 4 5 6 7 8 9 10
取到的次数 13 8 5 7 6 13 18 10 11 9
则取到号码为奇数的频率是 .
15.为了解某校高三学生的视力情况,
随机地抽查了该校 100 名高三学生的
视力情况,得到频率分布直方图,如
右,由于不慎将部分数据丢失,但知
道前 4 组的频数成等比数列,后 6 组
的频数成等差数列,设最大频率为 a,
视力在 4.6 到 5.0 之间的学生数为 b,
则 a, b 的值分别为 .
16.期中考试以后,班长算出了全班
40 个人数学成绩的平均分为 M,如果
把 M 当成一个同学的分数,与原来的
40 个分数一起,算出这 41 个分数的平均值为 N,那么 M:N 为 .
17.数据 a1,a2,a3,…,an 的方差为σ2,平均数为μ,
则数据 ka1+b,ka2+b,ka3+b,…,kan+b(kb≠0)的
标准差为 ,平均数为 .
18.(1)完成上面的频率分布表.
(2)根据上表,画出频率分布直方图.
(3)根据上表,估计数据落在[10.95,11.35]范围内的
概率约为多少?
19.在参加世界杯足球赛的 32 支球队中,随机抽取 20 名队员,调查其年龄为 25,21,23,
25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28。填写下面的频
率分布表,据此估计全体队员在哪个年龄段的人数最多?占总数的百分之几?并画出频率分
布直方图.
分组 频数 频率
[10.75,10.85] 3
[10.85,10.95] 9
[10.95,11.05] 13
[11.05,11.15] 16
[11.15,11.25] 26
[11.25,11.35] 20
[11.35,11.45] 7
[11.45,11.55] 4[来源:Z.Com]
[11.55,11.65] 2
合计 100
分组 频数 频率
20.5~
22.5
22.5~
24.5
24.5~
26.5
26.5~
0.1
0.3
5.2
5.1
5.0
4.9
4.8
4.7
4.6
4.5
4.4
视力
4.3
频率
组距
o
y
x
20.有一组数据 )(,,,: 2121 nn xxxxxx 的算术平均值为 10,若去掉其中最大的一个,
余下数据的算术平均值为 9;若去掉其中最小的一个,余下数据的算术平均值为 11.
(1) 求出第一个数 1x 关于 n 的表达式及第 n 个数 nx 关于 n 的表达式.
(2)若 nxxx ,,, 21 都是正整数,试求第 n 个数 nx 的最大值,并举出满足题目要求且 nx 取到
最大值的一组数据.
21.高三年级 1000 名学生进行数学其中测试。高三年级组随机调阅了 100 名学生的试卷(满
分为 150 分),成绩记录如下:
成绩
(分) 3 4 5 6 7 8 9 10
人数 6 8 10 15 15 35 8 3
求样本平均数和样本方差.
28.5
28.5~
30.5
合计
必修 3 第 2 章 统计
§2.4 线性回归方程
重难点:散点图的画法,回归直线方程的求解方法,回归直线方程在现实生活与生产中的应.
考纲要求:①会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.
②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
经典例题:10.有 10 名同学高一(x)和高二(y)的数学成绩如下:
高一成绩 x 74 71 72 68 76 73 67 70 65 74
高二成绩 y 76 75 71 70 76 79 65 77 62 72
⑴画出散点图;
⑵求 y 对 x 的回归方程。
当堂练习:
1.下表是某小卖部一周卖出热茶的杯数与 当天气温的
对比表:若热茶杯数 y 与气温 x 近似地满 足线性关系,
则其关系式最接近的是( )
A . 6y x B . 42y x
C. 2 60y x D. 3 78y x
2.线性回归方程 ˆy bx a 表示的直线必经过的一个定点是( )
A. (0,0) B. ( ,0)x C. (0, y) D. ( , y)x
3.设有一个直线回归方程为
^ ^
2 1.5y x ,则变量 x 增加一个单位时 ( )
A. y 平均增加 1.5 个单位 B. y 平均增加 2 个单位
C. y 平均减少 1.5 个单位 D. y 平均减少 2 个单位
4.对于给定的两个变量的统计数据,下列说法正确的是( )
A.都可以分析出两个变量的关系 B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图 D. 都可以用确定的表达式表示两者的关系
5.对于两个变量之间的相关系数,下列说法中正确的是( )
A.|r|越大,相关程度越大
B.|r| 0, ,|r|越大,相关程度越小,|r|越小,相关程度越大
C.|r| 1 且|r|越接近于 1,相关程度越大;|r|越接近于 0,相关程度越小
D.以上说法都不对
6.“吸烟有害健康”,那么吸烟与健康之间存在什么关系( )
A.正相关 B.负相关 C.无相关 D.不确
定
7.下列两个变量之间的关系不是函数关系的是( )
A.角度与它的余弦值 B.正方形的边长与面积
C.正 n 边形的边数和顶点角度之和 D.人的年龄与身高
8.对于回归分析,下列说法错误的是( )
A.变量间的关系若是非确定性关系,则因变量不能由自变量唯一确定
B.线性相关系数可正可负
C.如果 2
1r ,则说明 x 与 y 之间完全线性相关
D.样本相关系数 ( 1,1)r
9.为了考察两个变量 x 和 y 之间的线性相关性,甲、乙两个同学各自独立的做 10 次和 15V
次试验,并且利用线性回归方法,求得回归直线分布为 1l 和 2l ,已知在两人的试验中发现对
变量 x 的观察数据的平均值恰好相等都为 s,对变量 y 的观察数据的平均值恰好相等都为 t,
那么下列说法正确的是( )
A.直线 1l 和 2l 有交点(s,t) B.直线 1l 和 2l 相交,但是交点未必是(s,t)
气温
/℃
18 13 10 4 -
1
杯数 24 34 39 51 63
C. 直线 1l 和 2l 平行 D. 直线 1l 和 2l 必定重合
10.下列两个变量之间的关系是相关关系的是( )
A.正方体的棱长和体积 B.单位圆中角的度数和所对弧长
C.单产为常数时,土地面积和总产量 D.日照时间与水稻的亩产量
11.对于简单随机抽样,下列说法中正确的命题为( )
①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概率进行分析;②它
是从总体中逐个地进行抽取,以便在抽取实践中进行操作;③它是一种不放回抽样;④它是
一种等概率抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在
整个抽样过程中,各个个体被抽取的概率也相等,从而保证了这种方法抽样的公平性.
A.①②③ B.①②④ C.①③④ D.①②③④
12.为了解初一学生的身体发育情况,打算在初一年级 10 个班的某两个班按男女生比例抽
取样本,正确的抽样方法是( )
A.随机抽样 B.分层抽样 C.先用抽签法,再用分层抽样 D.先用分层抽样,再
用随机数表法
13.下列调查中属于样本调查的是( )
①每隔 5 年进行一次人口普查 ②某商品的优劣 ③某报社对某个事情进行舆论调查
④高考考生的体查
A.②③ B.①④ C. ③④ D. ①②
14.现实世界中存在许多情况是两个变量间有密切联系,但这种关系无法用确定的函数关系
式表达出来,这种变量之间的关系称 .
15.江苏某中学高一期中考试后,对成绩进行分析,从 13 班中选出 5 名学生的总成绩和外
语成绩如下表:
学 生
学 科 1 2 3 4 5
总成绩(x) 482 383 421 364 362
外语成绩
(y) 78 65 71 64 61
则外语成绩对总成绩的回归直线方程是 .
16.对于回归方程 y=4.75x+257,当 x=28 时,y 的估计值为 .
17.相应与显著性水平 0.05,观测值为 10 组的相关系数临界值为 .
18.假设关于某设备的使用年限 x(年)和所支出的维修费用 y(万元)有如下统计资料:
x(年) 2 3 4 5 6
y(万元) 2.2 3.8 5.5 6.5 7.0
若由资料知,y 对 x 呈线性相关关系,试求:
(1)回归直线方程;
(2)估计使用年限为 10 年时,维修费用约是多少?
19.假设关于某设备的使用年限 x 和所支出的维修费用 y (万元),有如下的统计数据
( )( 1, 2,3, 4,5),i ix iy 由资料知 y 对 x 呈线性相关,并且统计的五组数据得平均值分别为
4x , 5.4y ,若用五组数据得到的线性回归方程 abxy
去估计,使用 8 年的维修费用
比使用 7 年的维修费用多 1.1 万元,
(1) 求回归直线方程;(2)估计使用年限为 10 年时,维修费用是多少?
20.某连锁经营公司所属 5 个零售店某月的销售额和利润额资料如下表
商店名称 A B C D E
E销售额(x)/千万元 3 5 6 7 9
9利润额(y)/百万元 2 3 3 4 5
(1)画出销售额和利润额的散点图.(2)若销售额和利润额具有相关关系,计算利润额 y 对销
售额 x 的回归直线方程.(3)对计算结果进行简要的分析说明.
21.已知 10 只狗的血球体积及红血球的测量值如下
x 45 42 46 48 42 35 58 40 39 50
y 6.53 6.30 9.25 7.50 6.99 5.90 9.49 6.20 6.55 7.72
x(血球体积,mm),y(血红球数,百万)
(1) 画出上表的散点图;(2)求出回归直线并且画出图形 (3)回归直线必 经过的一点是哪
一点?
必修 3 第 2 章 统计
§2.5 统计单元测试
1.容量为 100 的样本数据,按从小到大的顺序分为 8 组,如下表:
组号 1 2 3 4 5 6 7 8
频数 10 13 x 14 15 13 12 9
第三组的频数和频率分别是 ( )
A.14 和 0.14 B. 0.14 和 14 C. 1
14
和 0.14 D. 1
3
和 1
14
2.已知一组数据为 0,-1,x,15,4,6,且这组数据的中位数为 5,则数据的众数为( )
A.5 B.6 C.4 D.5.5
3.已知一组数据 x1,x2,x3,x4,x5 的平均数是 2,方差是 1
3
,那么另一组数据 3x1
-2,3x2-2,3x3-2,3x4-2,3x5-2 的平均数和方差分别为( )
A.2, 1
3
B.2,1 C.4, 2
3
D.4,3
4. x 是 x1,x2,…,x100 的平均数,a 是 x1,x2,…,x40 的平均数,b 是 x41,x42,…,x100 的
平均数,则下列各式正确的是( )
A. 40 60
100
a bx
B. 60 40
100
a bx
C. x = a+b D. x =
2
a b
5.下列说法中,正确的是( ).
A.数据 5,4,4,3,5,2 的众数是 4
B.一组数据的标准差是这组数据的方差的平方
C.数据 2,3,4,5 的标准差是数据 4,6,8,10 的标准差的一半
D.频率分布直方图中各小长方形的面积等于相应各组的频数
6.从甲、乙两班分别任意抽出 10 名学生进行英语口语测验,其测验成绩的方差分别为 S1
2=
13.2,S2
2=26.26,则( ).
A.甲班 10 名学生的成绩比乙班 10 名学生的成绩整齐
B.乙班 10 名学生的成绩比甲班 10 名学生的成绩整齐
C.甲、乙两班 10 名学生的成绩一样整齐
D.不能比较甲、乙两班 10 名学生成绩的整齐程度
7.生产过程中的质量控制图主要依据( )
A.工艺要求 B.生产条件要求
C.企业标准 D.小概率事件在一次试验中几乎不可能发生
8.某影院有 50 排座位,每排有 60 个座位,一次报告会上坐满了听众,会后留下座号为 18
的听众 50 人进行座谈,这是运用了( )
A. 简单随机抽样 B. 系统抽样 C. 分层抽样 D.放回抽样
9.已知同一总体的两个样本,甲的样本方差为 1
2 1
,乙的样本方差为 3 2 ,
则下列说法正确的是( )
A.甲的样本容量小 B.乙的样本容量小 C.甲的波动较小 D.乙的波动较小
10.下列说法正确的是( ).
A.根据样本估计总体,其误差与所选择的样本容量无关
B.方差和标准差具有相同的单位
C.从总体中可以抽取不同的几个样本
D.如果容量相同的两个样本的方差满足 S1
2