不能正确区分总体、样本、样本容量
为了了解 2019 年参加市运动会的 240 名运动员的身高情况,从中抽取 40 名运动员进行测量.下列
说法正确的是
A.总体是 240 名运动员
B.个体是每一名运动员
C.40 名运动员的身高是一个个体
D.样本容量是 40
【错解】选择 A、B、C 中的一个.
【错因分析】对于选项 A、B,对总体、个体、样本的概念把握不准,误将考察的对象当作运动员;对于选项
C,把个体和样本混淆致误.
【试题解析】选 D.根据统计的相关概念并结合题意可得,此题的总体、个体、样本这三个概念的考察对象
都是运动员的身高,而不是运动员,并且一个个体是指一名运动员的身高,选项 A,B 表达的对象都是运动
员,选项 C 未将个体和样本理解透彻.在这个问题中,总体是 240 名运动员的身高,个体是每名运动员的
身高,样本是 40 名运动员的身高,样本容量是 40.因此选 D.
【参考答案】D.
1.明确相关概念
对总体、个体、样本、样本容量的概念要熟练把握,要明确总体与样本的包含关系及样本与样本容量的
区别,如本例选项 C,是对概念把握不准.
2.注意考察对象
解决考查总体、个体、样本、样本容量的概念问题时,关键是明确考察对象,根据相关的概念可知总体、
个体与样本的考察对象是相同的,如本例中选项 A,B 表达的对象都是运动员的身高而不是运动员.
1.某公司有 350 名员工参加了今年的年度考核.为了了解这 350 名员工的考核成绩,公司决定从中抽取 50
名员工的考核成绩进行统计分析.在这个问题中,50 名员工的考核成绩是
A.总体 B.样本容量
C.个体 D.样本
【答案】D【解析】因为本题是从 350 名员工的考核成绩中抽取 50 名员工的考核成绩,所以 50 名员工的考核成绩
是样本,故选 D.
对随机抽样的概念理解不透彻
对于下列抽样方法:
①运动员从 8 个跑道中随机抽取 1 个跑道;②从 20 个零件中一次性拿出 3 个来检验质量;③某班 50 名学生,
指定其中成绩优异的 2 名学生参加一次学科竞赛;④为了保证食品安全,从某厂提供的一批月饼中,拿出一个
检查后放回,再拿一个检查,反复 5 次,拿了 5 个月饼进行检查.其中,属于简单随机抽样的是_______.(把正
确的序号都填上)
【错解】②③④
【错因分析】对简单随机抽样的概念理解不透彻.
【试题解析】对于②,一次性拿出 3 个来检验质量,违背简单随机抽样特征中的“逐个”抽取;对于③,指定
其中成绩优异的 2 名学生,不满足等可能抽样的要求;对于④,不满足不放回抽样的要求.故填①.
【参考答案】①
1.简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等.
2.应用简单随机抽样应注意的问题:
(1)一个抽样试验能否用抽签法,关键看两点:
一是抽签是否方便;
二是号签是否易搅匀.
一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三
个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.
(3)简单随机抽样需满足:
①被抽取的样本总体的个体数有限;
②逐个抽取;
③是不放回抽取;
④是等可能抽取.2.已知下列抽取样本的方式:
①从无限多个个体中抽取 100 个个体作为样本;
②盒子里共有 80 个零件,从中选出 5 个零件进行质量检验,在抽样操作时,从中任意拿出 1 个零件进行
质量检验后再把它放回盒子里;
③从 20 件玩具中一次性抽取 3 件进行质量检验;
④某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.
其中,不是简单随机抽样的个数是
A.1 B.2
C.3 D.4
【答案】D
【解析】①不是简单随机抽样,原因是简单随机抽样中总体的个数是有限的,而题中是无限的;②不是
简单随机抽样,原因是简单随机抽样是不放回地抽取,而题中是放回地;③不是简单随机抽样,原因是
简单随机抽样是逐个抽取,而题中是一次性抽取;④不是简单随机抽样,原因是个子最高的 5 名同学是 56
名同学中特定的,不存在随机性,不是等可能抽样.
故选择 D.
【名师点睛】简单随机抽样的特征
要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机
抽样的四个特点:有限性、逐一性、不放回性、等可能性.
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平性.
简单随机抽样在抽样过程中每一个个体被抽取的机会都相等(随机抽样的等可能性).若样本容量为 n,总
体的个体数为 N,则用简单随机抽样时,每一个个体被抽到的可能性都是 ,体现了这种抽样方法的客观性
和公平性.
对系统抽样的特点理解不到位
从 2003 名学生中抽取一个容量为 40 的样本,应如何抽取?
n
N【错解】将 2003 名学生按 0001 到 2003 编上号;将号码随机分成 40 份,每一份再用抽签法随机抽取一名学
生,即得到了一个容量为 40 的样本.
【错因分析】由于 2003 不能被 40 整除,误以为只能用简单随机抽样进行抽取,对两种抽样方法的特点理解
不到位.
【试题解析】先将 2003 名学生按 0001 到 2003 编上号,利用随机数表法从中剔除 3 名学生,再对剩余的 2000
名学生重新从 0001 到 2000 编号,按编号顺序分成 40 组,每组 50 人,先在第一组中用抽签法抽出某一号,如
0006,依次在其他组抽取 0056,0106,…,1956,这样就得到了一个容量为 40 的样本.
【参考答案】见试题解析
1.当总体容量较大,总体可以分为均匀的几个部分时,用系统抽样较为合理,但当总体容量除以样本容量不
是整数时,要先在总体中剔除部分个体.
2.系统抽样的操作步骤:
第一步编号:先将总体的 N 个个体编号;
第二步分段:确定分段间隔 k,对编号进行分段,当 (n 是样本容量)是整数时,取 k= ;
第三步确定首个个体:在第 1 段用简单随机抽样确定第一个个体编号 l(l≤k);
第四步获取样本:按照一定的规则抽取样本,通常是将 l 加上间隔 k 得到第 2 个个体编号 ,再加 k
得到第 3 个个体编号 ,依次进行下去,直到获取整个样本.
系统抽样是等距抽样,用系统抽样法抽取样本,当 不为整数时,取 ,即先从总体中用简单随
机抽样的方法剔除(N-nk)个个体,且剔除多余的个体不影响抽样的公平性.
3.某初级中学领导采用系统抽样方法,从该校初一年级全体 800 名学生中抽 50 名学生做牙齿健康检查,
现将 800 名学生从 1 到 800 进行编号,求得间隔数 ,即每 16 人抽取一个人.在 1~16 中
随机抽取一个数,如果抽到的是 7,则从 33~48 这 16 个数中应取的数是
A.40 B.39
C.38 D.37
【答案】B
【解析】由题意,用系统抽样的方法,在 1~16 中随机抽取一个数,抽到的是 7,分组间隔为
N
n
N
n
l k+
2l k+
N
n [ ]Nk n
=
800 1650k = =,所以从 33~48 中抽取的数字为 .
故选 B.
对个体的入样可能性与抽样间隔理解不透
中央电视台动画城节目为了对本周的热心观众给予奖励,要从 2014 名小观众中抽取 50 名幸运小观
众.先用简单随机抽样从 2014 人中剔除 14 人,剩下的 2000 人再按系统抽样方法抽取 50 人,则在 2014 人
中,每个人被抽取的可能性
A.均不相等 B.不全相等
C.都相等,且为
25
1007 D.都相等,且为
1
40
【错解】选 A 或 D.
【错因分析】对于选项 A,误认为剔除 14 人,被抽取到的机会就不相等了,错选 A;
对于选项 D,认为被抽取的机会相等,但利用了剔除后的数据计算,错选 D.
【试题解析】选 C.因为在系统抽样中,若所给的总体个数不能被样本容量整除,则应先剔除几个个体,本
题先剔除 14 人,然后再分组,在剔除过程中,每个个体被剔除的机会相等.所以,每个个体被抽到的机会
都相等,均为
50
2014=
25
1007.
【参考答案】C.
1.明确系统抽样的操作要领
系统抽样操作要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先指定的规则,从每一部
分中抽取一个个体,得到所需样本.系统抽样是等距离抽样,每个个体被抽到的机会是相等的,如本题
中 2000 人要分为 50 段.
2.对系统抽样合理分段
在系统抽样过程中,为将整个编号分段,要确定分段间隔,当在系统抽样过程中比值不是整数时,要从
总体中剔除一些个体(用简单随机抽样),但每一个个体入样的机会仍然相等.如本题中剔除 14 人后,每
个人被抽取的可能性不变.
800 1650k = = 7 2 7 32 39k+ = + =4.采用系统抽样的方法,从个体数为 1 003 的总体中抽取一个容量为 50 的样本,则在抽样过程中,被剔
除的个体数为_________,抽样间隔为_________.
【答案】3,20
【解析】因为 1 003 除以 50 等于 20,且余数为 3,所以应剔除的个体数为 3,抽样间隔为 20.故填
3,20.
忽略分层抽样的特点
某单位有老年人 28 人,中年人 54 人,青年人 81 人,为了调查他们的身体情况,需从中抽取一个容量
为 36 的样本,则适合的抽样方法是
A.简单随机抽样 B.系统抽样
C.直接运用分层抽样 D.先从老年人中剔除 1 人,再用分层抽样
【错解】因为总体由差异明显的三部分组成,所以考虑用分层抽样.因为总人数为 28+54+81=163,样本容量为
36,由于按 抽样,无法得到整数解,因此考虑先剔除 1 人,将抽样比变为 .若从老年人中随机地剔
除 1 人,则老年人应抽取 27× =6(人),中年人应抽取 54× =12(人),青年人应抽取 81× =18(人),从而
组成容量为 36 的样本.故选 D.
【错因分析】如果用简单随机抽样先从老年人中剔除 1 人的话,老年人被抽到的概率显然比其他人群小了,
这不符合随机抽样的特征——每个个体入样的几率相等.注意题干明确地说“先从老年人中剔除 1 人”,这
和以前做的从总体中随机剔除 1 人是不一样的.
【试题解析】直接运用分层抽样,老年人、中年人和青年人中应抽取的人数分别为 ×28≈6,
×54≈12, ×81≈18,故选 C.
【方法点睛】分层抽样的一个很重要的特点是每个个体被抽到的概率是一样的.当按照比例计算出的值不是
整数时,一般是采用四舍五入的方法取值,若四舍五入后得到的样本容量与要求的不尽相同,则可根据问题
的实际意义适当处理,使之相同,这只是细节性问题,并未改变分层抽样的本质.
【参考答案】C.
36
163
36 2
162 9
=
2
9
2
9
2
9
36
163
36
163
36
1631.分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层
中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏
的原则;
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体
数量的比等于抽样比.
2.与分层抽样有关问题的常见类型及解题策略:
(1)求某一层的样本数或总体个数.可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样
本(或总体)数.
(2)求各层的样本数.可依据题意,求出各层的抽样比,再求出各层样本数.
进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样
本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
5.某校有高一学生 n 名,其中男生数与女生数之比为 ,为了解学生的视力情况,现要求按分层抽样的
方法抽取一个样本容量为 的样本,若样本中男生比女生多 12 人,则
A.990 B.1320
C.1430 D.1560
【答案】B
【解析】依题意可得 ,解得 ,故选 B.
【名师点睛】本题考查分层抽样的相关计算,解题时要利用分层抽样的特点列式求解,考查计算能力,
属于基础题.
6:5
10
n n =
6 5 1211 11 10
n − × = 1320n = 在分层抽样中,确定抽样比 k 是抽样的关键.一般地,抽样比 k=푛
푁(N 为总体容量,n 为样本容量),再按抽样比
k
在各层中抽取个体,就能确保抽样的公平性.在每层抽样时,应采用简单随机抽样或系统抽样的方法进行.
误将频率分布直方图的纵坐标当作频率
中小学生的视力状况受到社会的关注.某市有关部门从全市 6 万名高一学生中随机抽取 400 名学生,
对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右五
个小组的频率之比为 5∶7∶12∶10∶6,则该市 6 万名高一学生中视力在[3.95,4.25)范围内的学生约有多少
人?
【错解】由图可知,第五小组的频率为 0.5,所以第一小组的频率为 0.5× .
所以该市 6 万名高一学生中视力在[3.95,4.25)范围内的学生约有 60000× =25000(人).
【错因分析】表面上看本题的回答似乎正确无误,其实答案是错误的,其错因在于没有看懂所提供的频率分
布直方图中的数据的含义,误将该频率分布直方图中的纵坐标(频率与组距的比)看成了频率,从而导致问题
的解答出错.
【试题解析】由图可知,第五小组的频率为 0.5×0.3=0.15,
所以第一小组的频率为 0.15× =0.125.
所以该市 6 万名高一学生中视力在[3.95,4.25)范围内的学生约有 60000×0.125=7500(人).
【参考答案】7500.
在数据的频率分布直方图中,纵坐标表示的是频率与组距的比, 每个小长方形的面积=组距×
频率
组距=频
率,将频率与组距的比错认成频率是初学者经常犯的错误之一,解题过程中要引起足够的重视.
5 5
6 12
=
5
12
5
61.画频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质
(1)落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于 1.
(2)频率分布直方图与众数、中位数与平均数的关系
①最高的小长方形中的某个(些)点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中
点的横坐标之和.
绘制频率分布直方图的注意事项:
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据
越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个
数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
6.某校 200 名学生的数学期中考试成绩频率分布直方图如图所示,其中成绩分组区间是
.70 80 80 90 90100 1001[ [ [ 10 012[ 11[ 0, ) , , ) , , ) , , ) , , )(1)求图中 m 的值;
(2)根据频率分布直方图,估计这 200 名学生的平均分(同一组中的数据用该组区间的中间值作代表)
和中位数(四舍五入取整数);
(3)若这 200 名学生的数学成绩中,某些分数段的人数 x 与英语成绩相应分数段的人数 y 之比如下表所
示,求英语成绩在 的人数.
分数段 [70,80) [80,90) [90,100) [100,110) [110,120)
x:y 1:2 2:1 6:5 1:2 1:1
【答案】(1) ;(2)平均分为 ,中位数为 ;(3)140 人.
【解析】(1)由 ,解得 .
(2)频率分布直方图中每一个小矩形的面积乘以底边中点的横坐标之和即为平均数,即估计平均数为
.
设中位数为 ,则 ,解得 .
(3)由频率分布直方图可求出这 200 名学生的数学成绩在 , , 的分别
有 60 人,40 人,10 人,按照表中给的比例,则英语成绩在 , , 的分别
有 50 人,80 人,10 人,
所以英语成绩在 的有 140 人.
【名师点睛】本题主要考查频率分布直方图的性质,考查频率分布直方图中平均数和中位数的计算,
意在考查学生对这些知识的理解掌握水平,属于基础题.
频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形
式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:
(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与总体的
关系,利用频率和等于 1 就可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.
(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.
对茎叶图的画法规则认识不够
[90120, )
0.005m = 93 92
( )10 2 0.02 0.03 0.04 1m× + + + = 0.005m =
0.05 75 0.4 85 0.3 95 0.2 105 0.05 115 93× + × + × + × + × =
x 0.005 10 0.04 10 0.03 90 0.5x× + × + − =( ) 92x ≈
[ )90,100 [ )100,110 [ )110,120
[ )90,100 [ )100,110 [ )110,120
[ )90,120 某市对上下班情况作了抽样调查,上下班时间各抽测了 12 辆机动车的车速如下(单位:km/h):
上班时间:30,33,18,27,32,40,26,28,21,28,35,20;
下班时间:27,19,32,29,36,29,30,22,25,16,17,30.用茎叶图表示以上数据.
【错解】机动车行驶速度的茎叶图如图所示.
【错因分析】茎叶图对于重复出现的数据要重复记录.
【试题解析】机动车行驶速度的茎叶图如图.
【方法点睛】画茎叶图需要注意,将每个数据分为茎和叶两部分,将表示茎的数字按照大小顺序由上到下排
列,在写每行叶子的时候,重复出现的数字应该按原次数写入叶子部位,不能只按一次写入.
【参考答案】见试题解析.
1.茎叶图将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序
从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
2.绘制茎叶图的关键是分清茎和叶.一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的
数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的
特点合理地选择茎和叶.
3.应用茎叶图对两组数据进行比较时,要从数据分布的对称性、中位数、稳定性等几方面来比较.
4.茎叶图只适用于样本数据较少的情况.在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,
这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据
都要在图中占据一个空间,如果数据很多,枝叶就会很长.
7.某中学要从高一年级甲、乙两个班级中选择一个班参加市电视台组织的“环保知识竞赛”.该校对甲、
乙两班的参赛选手(每班 7 人)进行了一次环境知识测试,他们取得的成绩(满分 100 分)的茎叶图如
图所示,其中甲班学生的平均分是 85 分,乙班学生成绩的中位数是 85.
(1)求 的值;
(2)根据茎叶图,求甲、乙两班同学成绩的方差的大小,并从统计学角度分析,该校应选择甲班还是乙
班参赛.
【答案】(1) ; ;(2)应该选择乙班参赛.
【解析】(1)因为甲班学生的平均分是 85,
所以 ,
解得 .
因为乙班学生成绩的中位数是 85,所以 .
(2)由(1)可知, ,
所以
.
由茎叶图可得, ,
所以
,x y
9x = 5y =
78 75 85 80 80 92 96 857
xx
+ + + + + + += =甲
9x =
5y =
85x =甲
( ) ( ) ( )22 22
1 2 7
1
7S x x x x x x = − + − + + − 甲
2 2 21 360(75 85) (78 85) (96 85)7 7
= × − + − + + − =
75 80 80 85 90 90 95 857x
+ + + + + += =乙
( ) ( ) ( )2 2 22
1 2 7
1
7S x x x x x x = − + − + + − 乙,
所以 .
故该校应该选择乙班参赛.
【名师点睛】本题考查了根据茎叶图求平均数,根据平均数、中位数求原始数据,考查了计算方差,并
利用方差做出统计判断的问题.
忽略方差的统计意义
甲、乙两种冬小麦实验品种连续 5 年的平均单位面积产量如下(单位:t /km2):
品种 第 1 年 第 2 年 第 3 年 第 4 年 第 5 年
甲 9.8 9.9 10.1 10 10.2
乙 9.4 10.3 10.8 9.7 9.8
若某村要从中引进一种冬小麦大量种植,给出你的建议.
【错解】由题意得 ―
푥 甲 = 1
5 × (9.8+9.9+10.1+10+10.2)=10,
―
푥 乙 = 1
5 × (9.4+10.3+10.8+9.7+9.8)=10,
甲、乙两种冬小麦的平均产量都等于 10,所以引进两种冬小麦的任意一种都可以.
【错因分析】上述错误在于只对两种冬小麦的平均产量做了比较,而忽略了对冬小麦产量稳定性的讨论.
【试题解析】由题意得 ―
푥 甲 = 1
5 × (9.8+9.9+10.1+10+10.2)=10,
―
푥 乙 = 1
5 × (9.4+10.3+10.8+9.7+9.8)=10,
푠2甲 = 1
5×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,
푠2乙 = 1
5×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244,
甲、乙两种冬小麦的平均产量都等于 10,且푠2甲 < 푠2乙,
所以产量比较稳定的为甲种冬小麦,推荐引进甲种冬小麦大量种植.
【方法点睛】平均数反映的是样本个体的平均水平,方差和标准差则反映了样本的波动、离散程度.对于形
2 2 21 300(75 85) (80 85) (95 85)7 7
= × − + − + + − =
2 2=x x S S>甲 乙 甲 乙,如“谁发挥更好、谁更稳定、谁更优秀”之类的题目,除比较数据的平均值外,还应该比较方差或标准差的
大小,以作出更为公正、合理的判断.
【参考答案】推荐引进甲种冬小麦大量种植.
用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据
的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.
1.平均数与方差都是重要的数字特征,是对总体的一种简明的描述.
2.众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.平均数反映的是样本个
体的平均水平,众数和中位数则反映样本中个体的“重心”.
3.数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组
数据中的极端值极为敏感.一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑
两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.方差和标准差反映了数据波动程度的大
小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越
稳定.
8.甲、乙两种水稻试验品种连续 5 年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种
水稻品种的产量比较稳定.
品种 第 1 年 第 2 年 第 3 年 第 4 年 第 5 年
甲 9.8 9.9 10.1 10 10.2
乙 9.4 10.3 10.8 9.7 9.8
【答案】甲种水稻的产量比较稳定
【解析】甲品种的样本平均数为 10,样本方差为
[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.
乙品种的样本平均数也为 10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.244.
因为 0.244>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
运用数字特征作评价时考虑不周一次数学知识竞赛中,两组学生成绩如下:
分数 50 60 70 80 90 100
甲组 2 5 10 13 14 6
人数
乙组 4 4 16 2 12 12
经计算,已知两个组的平均分都是 80 分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并
说明理由.
【错解】由于乙组 90 分以上的人数比甲组 90 分以上的人数多,所以乙组更优秀.
【错因分析】对一组数据进行分析的时候,应从平均数、众数、中位数、方差、极差等多个角度进行判断.
【试题解析】(1)甲组成绩的众数为 90 分,乙组成绩的众数为 70 分,从成绩的众数这一角度看,甲组成绩好
些.
(2)푠2甲 = 1
2 + 5 + 10 + 13 + 14 + 6
×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172.
同理푠2乙=256.
因为푠2甲 < 푠2乙,所以甲组的成绩比乙组的成绩稳定.
(3)甲、乙两组成绩的中位数、平均数都是 80 分,其中甲组成绩在 80 分以上(含 80 分)的有 33 人,乙组成绩
在 80 分以上(含 80 分)的有 26 人,从这一角度看,甲组成绩总体较好.
(4)从成绩统计表看,甲组成绩大于或等于 90 分的有 20 人,乙组成绩大于或等于 90 分的有 24 人,所以乙组
成绩在高分段的人数多.同时,乙组满分比甲组多 6 人,从这一角度看,乙组成绩较好.
【参考答案】见解析.
1.平均数受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端
数据时,平均数对总体估计的可靠性较差,往往用众数或中位数去估计总体.有时也采用剔除最大值与最
小值后所得的平均数去估计总体.
2.运用数字特征进行评价时,要全面考虑各数字特征的优缺点,从不同层面或两两综合进行评价,才能得到
较为可靠的估计.9.全国大学生机器人大赛是由共青团中央,全国学联,深圳市人民政府联合主办的赛事,是中国最具影响
力的机器人项目,是全球独创的机器人竞技平台.全国大学生机器人大赛比拼的是参赛选手们的能力,坚
持和态度,展现的是个人实力以及整个团队的力量.2015 赛季共吸引全国 240 余支机器人战队踊跃报名,
这些参赛战队来自全国六大赛区,150 余所高等院校,其中不乏北京大学,清华大学,上海交大,中国
科大,西安交大等众多国内顶尖高校,经过严格筛选,最终由 111 支机器人战队参与到 2015 年全国大学
生机器人大赛的激烈角逐之中,某大学共有“机器人”兴趣团队 1000 个,大一、大二、大三、大四分别
有 100,200,300,400 个,为挑选优秀团队,现用分层抽样的方法,从以上团队中抽取 20 个团队.
(1)应从大三抽取多少个团队?
(2)将 20 个团队分为甲、乙两组,每组 10 个团队,进行理论和实践操作考试(共 150 分),甲、乙两
组的分数如下:
甲:125,141,140,137,122,114,119,139,121,142
乙:127,116,144,127,144,116,140,140,116,140
从甲、乙两组中选一组强化训练,备战机器人大赛.从统计学数据看,若选择甲组,理由是什么?若选择
乙组,理由是什么?
【答案】(1)6 个团队;(2)见解析.
【解析】(1)由题知,大三团队个数占总团队数的 300
1000 = 3
10,
则用分层抽样的方法,应从大三中抽取20 × 3
10 = 6个团队.
(2)甲组数据的平均数푥甲 = 130,乙组数据的平均数푥乙 = 131,
甲组数据的方差푠2甲 = 104.2,乙组数据的方差푠2乙 = 128.8,
选甲队理由:甲、乙两队平均数相差不大,且푠2甲 < 푠2乙,甲组成绩波动小.
选乙队理由: ,且乙队中不低于 140 分的团队多,在竞技比赛中,高分团队获胜的概率大.
本题考查分层抽样的方法,平均数、方差的计算方法以及应用,考查用样本的数据特征估计总体的数据特
征的方法,考查运算求解能力和数据处理能力,考查运用基本知识分析解决实际问题的能力.
平均数:能较好地反映一组数据的总体平均水平,但易受少数极端值的影响;
方差:反映数据的波动程度,方差值越大,数据的波动越大.
弄错回归方程中 , 的位置
x x0 时,两个变量呈正相关关系,含义为:x 每增加一个单位,y 平均增加 个单位数;
当 ⇒ >
× × ×
−= + + + +9.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数
之和是
A.51 B.58
C.61 D.62
【答案】D
【解析】由茎叶图可知,甲的这几场比赛得分的中位数为 27,乙的这几场比赛得分的中位数为 35,
所以甲、乙两人这几场比赛得分的中位数之和是 27+35=62.
10.已知某样本的容量为 50,平均数为 70,方差为 75.现发现在收集这些数据时,其中的两个数据记录有
误,一个错将 80 记录为 60,另一个错将 70 记录为 90.在对错误的数据进行更正后,重新求得样本的
平均数为 ,方差为 ,则
A. B.
C. D.
【答案】A
【解析】由题意,可得 ,
设收集的 48 个准确数据分别记为 ,
则
,
,
所以 .故选 A.
【名师点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数
和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.
x 2s
270, 75x s= < 270, 75x s= >
270, 75x s> < 270, 75x s ><
70 50 80 60 70 90 7050x
× + − + −= =
1 2 48, , ,x x x
2 2 2 2 2
1 2 48
175 [( 70) ( 70) ( 70) (60 70) (90 70) ]50 x x x= − + − + + − + − + −
2 2 2
1 2 48
1 [( 70) ( 70) ( 70) 500]50 x x x= − + − + + − +
2 2 2 2 2 2
1 2 48
1 [( 70) ( 70) ( 70) (80 70) (70 70) ]50s x x x= − + − + + − + − + −
2 2 2
1 2 48
1 [( 70) ( 70) ( 70) 100] 7550 x x x= − + − + + − + × × ×
0.025女顾客 30 20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异?
附: .
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)男、女顾客对该商场服务满意的概率的估计值分别为 , ;(2)有 95%的把握认为
男、女顾客对该商场服务的评价有差异.
【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为 ,
因此男顾客对该商场服务满意的概率的估计值为 .
女顾客中对该商场服务满意的比率为 ,
因此女顾客对该商场服务满意的概率的估计值为 .
(2)由题可得 .
由于 ,
故有95%的把握认为男、女顾客对该商场服务的评价有差异.
21.某校从参加高二年级期末考试的学生中随机抽取了 名学生,已知这 名学生的物理成绩均不低于 60
分(满分为 100 分).现将这 名学生的物理成绩分为四组: , , ,
,得到的频率分布直方图如图所示,其中物理成绩在 内的有 28 名学生,将物理成绩
在 内定义为“优秀”,在 内定义为“良好”.
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
−= + + + +
0.8 0.6
40 0.850
=
0.8
30 0.650
=
0.6
2
2 100 (40 20 30 10) 4.76250 50 70 30K
× × − ×= ≈× × ×
4.762 3.841>
n n
n [60,70) [70,80) [80,90)
[90,100] [90,100]
[80,100] [60,80)男生 女生 合计
优秀
良好 20
合计 60
(1)求实数 的值及样本容量 ;
(2)根据物理成绩是否优秀,利用分层抽样的方法从这 名学生中抽取 10 名,再从这 10 名学生中随
机抽取 3 名,求这 3 名学生的物理成绩至少有 2 名是优秀的概率;
(3)请将 列联表补充完整,并判断是否有 的把握认为物理成绩是否优秀与性别有关?
参考公式及数据:
(其中 ).
0.150 0.100 0.050 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)100;(2) ;(3)见解析
【解析】(1)由题可得 ,解得 ,
又物理成绩在 内的有 名学生,所以 ,解得 .
(2)由题可得,这 名学生中物理成绩良好的有 名,
所以抽取的 名学生中物理成绩良好的有 名,物理成绩优秀的有 名,
故从这 10 名学生中随机抽取 3 名,这 3 名学生的物理成绩至少有 2 名是优秀的概率为
.
(3)补充完整的 列联表如下表所示:
男生 女生 合计
优秀 20 40 60
a n
n
2 2× 95%
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
−= + + + + n a b c d= + + +
( )2P K k≥
k
2
3
10 (0.016 0.024 0.032) 1a× + + + = 0.028a =
[90,100] 28 28 0.028 10n
= × 100n =
100 100 (0.016 0.024) 10 40× + × =
10 4010 4100
× = 10 4 6− =
2 1 3
6 4 6
3
10
C C C 60 20 2
C 120 3P
+ += = =
2 2×良好 20 20 40
合计 40 60 100
则 的观测值 ,
所以没有 的把握认为物理成绩是否优秀与性别有关.
【名师点睛】本题考查了频率分布直方图、分层抽样及独立性检验的应用,考查了学生的计算能力,
属于中档题.
22. 为了调查学生星期天晚上学习时间的利用问题,某校从高二年级 1000 名学生(其中走读生 450 名,住
宿生 550 名)中,采用分层抽样的方法抽取 n 名学生进行问卷调查.根据问卷取得了这 n 名同学星期天
晚上学习时间(单位:分钟)的数据,按照以下区间分为八组:①[0,30),②[30,60),③[60,90),
④[90,120),⑤[120,150),⑥[150,180),⑦[180,210),⑧[210,240),得到频率分布直方图如
图.已知抽取的学生中星期天晚上学习时间少于 60 分钟的人数为 5 人.
(1)求 n 的值并补全频率分布直方图;
(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的 n 名学生,完
成下列 2×2 列联表:
利用时间充分 利用时间不充分 总计
走读生
住宿生 10
总计
2K
2100 (20 20 20 40) 25 2.778 3.84140 60 40 60 9k
× × − ×= = ≈
350 400t< < 0.3 0.0050 ( 350) 0.5t+ × − = 390t =
[450,500) 0.00166 40.0016 0.0008
× =+ a b c d, ,,
[500,550] ,e f
{ , }a b { , }a c { , }a d { , }a e { , }a f { , }b c { , }b d { , }b e
{ , }b f { , }c d { , }c e { , }c f { , }d e { , }d f { , }e f
{ , }a b { , }a c { , }a d { , }b c { , }b d { , }c d { , }e f
7
15P =频率分布直方图的相关性质,合理利用古典概型及其概率的计算公式,准确计算是解答的关键,着重
考查了分析问题和解答问题的能力,属于基础题.
26.“阿曼德比萨”是一个制作和外卖意大利比萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店
铺的销售额与店铺附近大学生人数的关系,随机抽取 10 个分店作为样本,得到数据如下:
店铺编号 附近大学生人数 x/万人 季度销售额 y/万元
1 0.2 5.8
2 0.6 10.5
3 0.8 8.8
4 0.8 11.8
5 1.2 11.7
6 1.6 13.7
7 2 15.7
8 2 16.9
9 2.2 14.9
10 2.6 20.2
(1)画出散点图,并判断 x 与 y 是否具有相关关系?
(2)求回归直线方程,根据回归方程预测一个附近大学生人数为 1 万人的店铺的季度销售额;
(3)若店铺的季度销售额低于 10 万元则亏损,试求附近大学生人数至少约多少人时才适合建店.
【解析】(1)散点图如图所示:由散点图可以看出:这些点分布在一条直线的附近,因此这两个变量具有相关关系.
(2)根据数据可知:푥= 1
10×(0.2+0.6+…+2.6)=1.4,푦= 1
10×(5.8+10.5+…+20.2)=13,
10
∑
푖 = 1
푥2푖 -10푥2=5.68,
10
∑
푖 = 1
xiyi-10푥푦=28.4,
故^
푏=28.4
5.68=5, =13-5×1.4=6.
因此回归直线方程是^
푦=5x+6.
当 x=1 时,^
푦=5×1+6=11,
即附近大学生人数为 1 万人的店铺的季度销售额约为 11 万元.
(3)回归直线方程是^
푦=5x+6.
令^
푦≥10,解得 x≥0.8.
故当附近大学生人数至少约 8000 人时才适合建店.
ˆa