2015高考数学二轮统计与统计案例、概率和统计课时作业1(附解析新人教A版)
一、选择题
1.(2014·山西省重点中学第三次四校联考)已知x、y的取值如下表所示:
x
0
1
3
4
y
0.9
1.9
3.2
4.4
从散点图分析,y与x线性相关,且=0.8x+a,则a=( )
A.0.8 B.1
C.1.2 D.1.5
[答案] B
[解析] ==2,==2.6,
又因为回归直线=0.8x+a过样本中心点(2,2.6)
所以2.6=0.8×2+a,解得a=1.
2.(文)(2014·豫东、豫北十所名校联考)某厂生产A、B、C三种型号的产品,产品数量之比为3∶2∶4,现用分层抽样的方法抽取一个样本容量为180的样本,则样本中B型号的产品的数量为( )
A.20 B.40
C.60 D.80
[答案] B
[解析] 由分层抽样的定义知,B型号产品应抽取180×=40件.
(理)(2013·济南模拟)某全日制大学共有学生5600人,其中专科生有1300人,本科生有3000人,研究生1300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取( )
A.65人,150人,65人 B.30人,150人,100人
C.93人,94人,93人 D.80人,120人,80人
[答案] A
[解析] =,1300×=65,3000×=150,故选A.
3.(文)(2014·新乡、许昌、平顶山二调)在样本频率分布直方图中,共有五个小长方形,这五个小长方形的面积由小到大成等差数列{an}.已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为( )
A.100 B.120
C.150 D. 200
[答案] A
[解析] 设公差为d,则a1+d=2a1,∴a1=d,∴d+2d+3d+4d+5d=1,∴d=,∴
- 11 -
面积最大的一组的频率等于×5=.
∴小长方形面积最大的一组的频数为300×=100.
(理)某电视传媒公司为了了解某类体育节目的收视情况,随机抽取了100名观众进行调查,如图是根据调查结果绘制的观众日均收看该类体育节目时间的频率分布直方图,其中收看时间分组区间是:[0,10),[10,20),[20,30),[30,40),[40,50),[50,60].将日均收看该类体育节目时间不低于40分钟的观众称为“体育迷”,则图中x的值为( )
A.0.01 B.0.02
C.0.03 D.0.04
[答案] A
[解析] 由题设可知(0.005+x+0.012+0.02+0.025+0.028)×10=1,解得x=0.01,选A.
4.(2014·东北三校二模)在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A、B两样本的下列数字特征对应相同的是( )
A.平均数 B.标准差
C.众数 D.中位数
[答案] B
[解析] 因为A组数据为:42,43,46,52,42,50
B组数据为:37,38,41,47,37,45.
可知平均数、众数、中位数都发生了变化,比原来A组数据对应量都减小了5,但标准差不发生变化,故选B.
5.(2014·石家庄质检)等差数列x1,x2,x3,…,x9的公差为1,若以上述数据x1,x2,x3,…,x9为样本,则此样本的方差为( )
A. B.
C.60 D.30
[答案] A
[解析] 令等差数列为1,2,3…9,则样本的平均值=5,
∴S2=[(1-5)2+(2-5)2+…+(9-5)2]==.
6.(文)(2014·郑州市第二次质检)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程为=-4x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为( )
- 11 -
A. B.
C. D.
[答案] B
[解析] ==,
==80,
∵回归直线过点(,80),∴a=106,
∴=-4x+106,∴点(5,84),(9,68)在回归直线左下方,故所求概率P==.
(理)(2014·河北衡水中学二调)关于统计数据的分析,有以下几个结论,其中正确的个数为( )
①利用残差进行回归分析时,若残差点比较均匀地落在宽度较窄的水平带状区域内,则说明线性回归模型的拟合精度较高;
②将一组数据中的每个数据都减去同一个数后,期望与方差均没有变化;
③调查剧院中观众观后感时,从50排(每排人数相同)中任意抽取一排的人进行调查是分层抽样法;
④已知随机变量X服从正态分布N(3,1),且P(2≤X≤4)=0.682 6,则P(X>4)等于0.158 7
⑤某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为15人.
A.2 B.3
C.4 D.5
[答案] A
[解析] ①④正确,②③⑤错误,⑤设样本容量为n,则=,∴n=30,故⑤错.
二、填空题
7.(2014·吉林九校联合体二模)将某班的60名学生编号为:01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.
[答案] 16,28,40,52
[解析] 依据系统抽样方法的定义得知,将这60名学生依次按编号每12人作为一组,即01~12、13~24、…、49~60,当第一组抽得的号码是04时,剩下的四个号码依次是16,28,40,52(即其余每一小组所抽出来的号码都是相应的组中的第四个号码).
8.(2013·龙岩模拟)10名工人某天生产同一零件,生产的件数分别是10,12,14,14,14,15,15,16,16,17,设这10个数的中位数为a,众数为b,则a-b=________.
[答案] 0.5
[解析] 从数据中可以看出,众数b=14,
且中位数a==14.5,
∴a-b=14.5-14=0.5.
- 11 -
9.(2013·烟台质检)为了解某校高三学生身体状况,用分层抽样的方法抽取部分男生和女生的体重,将男生体重数据整理后,画出了频率分布直方图,已知图中从左到右前三个小组频率之比为123,第二小组频数为12,若全校男、女生比例为32,则全校抽取学生数为________.
[答案] 80
[解析] 第四小组和第五小组的频率之和是5×(0.0125+0.0375)=0.25,故前三个小组的频率之和是0.75,则第二小组的频率是0.25,则抽取的男生人数是12÷0.25=48人,抽取的女生人数是48×=32人,全校共抽取80人.
三、解答题
10.(文)(2014·东北三省三校二模)某个团购网站为了更好地满足消费者需求,对在其网站发布的团购产品展开了用户调查,每个用户在使用了团购产品后可以对该产品进行打分,最高分是10分.上个月该网站共卖出了100份团购产品,所有用户打分的平均分作为该产品的参考分值,将这些产品按照得分分成以下几组:第一组[0,2),第二组[2,4),第三组[4,6),第四组[6,8),第五组[8,10],得到的频率分布直方图如图所示.
(1)分别求第三,四,五组的频率;
(2)该网站在得分较高的第三,四,五组中用分层抽样的方法抽取了6个产品作为下个月团购的特惠产品,某人决定在这6个产品中随机抽取2个购买,求他抽到的两个产品均来自第三组的概率.
[解析] (1)第三组的频率是0.150×2=0.3;第四组的频率是0.100×2=0.2;第五组的频率是0.050×2=0.1
(2)设“抽到的两个产品均来自第三组”为事件A,
由题意可知,从第三、四、五组中分别抽取3个,2个,1个.
不妨设第三组抽到的是A1,A2,A3;第四组抽到的是B1,B2;第五组抽到的是C1,所含基本事件总数为:
{A1,A2},{A1,A3},{A2,A3},{A1,B1},{A1,B2},{A1,C1},{A2,B1},{A2,B2},{A2,C1},{A3,B1},{A3,B2},{A3,C1},{B1,B2},{B1,C1},{B2,C1}
所以P(A)==.
(理)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
- 11 -
甲
82
81
79
78
95
88
93
84
乙
92
95
80
75
83
80
90
85
(1)用茎叶图表示这两组数据;
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由;
(3)若将频率视为概率,对甲同学在今后的3次数学竞赛成绩进行预测,记这3次成绩中高于80分的次数为ξ,求ξ的分布列及数学期望E(ξ).
[解析] (1)作出茎叶图如下:
(2)派甲参赛比较合适,理由如下:
甲=(70×2+80×4+90×2+8+9+1+2+4+8+3+5)=85
乙=(70×1+80×4+90×3+5+0+0+3+5+0+2+5)=85.
S=[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5
S=[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41
∵甲=乙,SP1,∴派乙参赛比较合适.
(3)记“甲同学在一次数学竞赛中成绩高于80分”为事件A,则P(A)==,
随机变量ξ的分布列为
ξ
0
1
2
3
P
E(ξ)=0×+1×+2×+3×=.
- 11 -
(或E(ξ)=np=3×=)
一、选择题
11.(文)(2014·重庆理,3)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得线性回归方程可能为( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
[答案] A
[解析] 因为变量x和y正相关,所以回归直线的斜率为正,排除C、D;又将点(3,3.5)代入选项A和B的方程中检验排除B,所以选A.
(理)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了8次试验,收集数据如下:
零件数x(个)
10
20
30
40
50
60
70
80
加工时间y(min)
62
68
75
81
89
95
102
108
设回归方程为y=bx+a,则点(a,b)在直线x+45y-10=0的( )
A.左上方 B.左下方
C.右上方 D.右下方
[答案] C
[解析] ∵=45,=85,∴a+45b=85,
∴a+45b-10>0,故点(a,b)在直线x+45y-10=0的右上方,故选C.
12.(2014·沈阳市质检)某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:
分数段
[60,65)
[65,70)
[70,75)
[75,80)
[80,85)
[85,90)
人数
2
3
4
9
5
1
据此估计允许参加面试的分数线大约是( )
A.75 B.80
C.85 D.90
[答案] B
[解析] 由题可知,在24名笔试者中应选出6人参加面试.由表可得面试分数线大约为80.故选B.
13.(2013·陕西文,5)对一批产品的长度(单位:毫米)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上为一等品,在区间[15,20)和[25,30)上为二等品,在区间[10,15)和[30,35]上为三等品.用频率估计概率,现从该批产品中随机抽取1件,则其为二等品的概率是( )
- 11 -
A.0.09 B.0.20
C.0.25 D.0.45
[答案] D
[解析] 解法1:用样本估计总体.在区间[15,20)和[25,30)上的概率为0.04×5+[1-(0.02+0.04+0.06+0.03)×5=0.45.
解法2:由图可知,抽得一等品的概率P1=0.06×5=0.3;抽得三等品的概率为P3=(0.02+0.03)×5=0.25.故抽得二等品的概率为1-(0.3+0.25)=0.45.
14.(2014·江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
A.成绩 B.视力
C.智商 D.阅读量
[答案] D
[解析] A中,K2==;
B中,K2==;
C中,K2==;
D中,K2==.
因此阅读量与性别相关的可能性最大,所以选D.
- 11 -
15.(文)某养兔场引进了一批新品种,严格按照科学配方进行喂养,四个月后管理员称其体重(单位:kg),将有关数据进行整理后分为五组,并绘制频率分布直方图(如图所示).根据标准,体重超过6kg属于超重,低于5kg的不够分量.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25、0.20、0.10、0.05,第二小组的频数为400,则该批兔子的总数和体重正常的频率分别为( )
A.1000,0.50 B.800,0.50
C.800,0.60 D.1000,0.60
[答案] D
[解析] 第二组的频率为1-0.25-0.20-0.10-0.05=0.40,所以兔子总数为=1000只,体重正常的频率为0.40+0.20=0.60.故选D.
(理)(2014·山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8
C.12 D.18
[答案] C
[解析] 第一、二两组的频率为0.24+0.16=0.4
∴志愿者的总人数为=50(人).
第三组的人数为:50×0.36=18(人)
有疗效的人数为18-6=12(人)
二、填空题
16.(2013·辽宁文,16)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.
[答案] 10
- 11 -
[解析] 设5个班级中参加的人数分别为x1,x2,x3,x4,x5,则=7,
=4,即5个整数平方和为20,x1,x2,x3,x4,x5这5个数中最大数比7大,但不能超过10,因此最大为10,平方和
20=0+1+1+9+9=(7-7)2+(8-7)2+(6-7)2+(10-7)2+(4-7)2.
因此参加的人数为4,6,7,8,10,故最大值为10,最小值为4.
三、解答题
17.(文)(2014·重庆文,17)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:
(1)求频率分布直方图中a的值;
(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;
(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.
[分析] 由频率之和为1,求a,然后求出落在[50,60)和[60,70)中的人数,最后用列举法求古典概型的概率.
[解析] (1)∵组距为10,∴(2a+3a+6a+7a+2a)×10=200a=1,
∴a==0.005.
(2)落在[50,60)中的频率为2a×10=20a=0.1,
∴落在[50,60)中的人数为2.
落在[60,70)中的学生人数为3a×10×20=3×0.005×10×20=3.
(3)设落在[50,60)中的2人成绩为A1,A2,落在[60,70)中的3人为B1,B2,B3.
则从[50,70)中选2人共有10种选法,Ω={(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3)}
其中2人都在[60,70)中的基本事件有3个:(B1,B2),(B1,B3),(B2,B3),故所求概率p=.
(理)(2014·辽宁理,18)一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.
- 11 -
将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.
(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;
(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列,期望E(X)及方差D(X).
[解析] (1)设A1表示事件“日销售量不低于100个”,A2表示事件“日销售量低于50个”,B表示事件“在未来连续3天是有连续2天日销售量不低于100个且另一天销售量低于50个”,因此
P(A1)=(0.006+0.004+0.002)×50=0.6
P(A2)=0.003×50=0.15,
P(B)=0.6×0.6×0.15×2=0.108.
(2)X可能取的值为0,1,2,3,相应的概率为
P(X=0)=C·(1-0.6)3=0.064,
P(X=1)=C·0.6(1-0.6)2=0.288.
P(X=2)=C·0.62(1-0.6)=0.432.
P(X=3)=C·0.63=0.216.
分布列为
X
0
1
2
3
P
0.064
0.288
0.432
0.216
因为X~B(3,0.6)
所以期望E(X)=3×0.6=1.8,
方差D(X)=3×0.6×(1-0.6)=0.72.
18.(文)为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中选取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:
分组
频数
频率
一
60.5~70.5
a
0.26
二
70.5~80.5
15
c
三
80.5~90.5
18
0.36
四
90.5~100.5
b
d
合计
50
e
(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,199,试写出第二组第一位学生的编号;
(2)求出a、b、c、d、e的值(直接写出结果),并作出频率分布直方图;
(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人.
[解析] (1)004
(2)a,b,c,d,e的值分别为13,4,0.30,0.08,1.
频率分布直方图如下:
- 11 -
(3)由样本中成绩在80.5~90.5的频数为18,成绩在90.5~100.5的频数为4,可估计成绩在85.5~95.5的人数为11人,故获得二等奖的学生约为×11=44人.
(理)(2012·山西省高考联合模拟)为了了解某年级1000名学生的百米成绩情况,随机抽取了若干学生的百米成绩,成绩全部介于13s与18s之间,将成绩按如下方式分成五组:第一组[13,14);第二组[14,15);……;第五组[17,18].按上述分组方法得到的频率分布直方图如图所示,已知图中从左到右的前3个组的频率之比为3819,且第二组的频数为8.
(1)将频率当作概率,求调查中随机抽取了多少个学生的百米成绩;
(2)若从第一、五组中随机取出两个成绩,求这两个成绩的差的绝对值大于1秒的概率.
[解析] (1)设图中从左到右前3个组的频率分别为3x,8x,19x依题意,得3x+8x+19x+0.32×1+0.08×1=1,∴x=0.02,设调查中随机抽取了n个学生的百米成绩,则8×0.02=,∴n=50,∴调查中随机抽取了50个学生的百米成绩.
(2)百米成绩在第一组的学生数为3×0.02×1×50=3,记他们的成绩为a、b、c百米成绩在第五组的学生数有0.08×1×50=4,记他们的成绩为m、n、p、q,则从第一、五组中随机取出两个成绩,基本事件有{a,b}、{a,c}、{a,m}、{a,n}、{a,p}、{a,q}、{b,c}、{b,m}、{b,n}、{b,p}、{b,q}、{c,m}、{c,n}、{c,p}、{c,q}、{m,n}、{m,p}、{m,q}、{n,p}、{n,q}、{p,q},共21个
其中满足“成绩的差的绝对值大于1s”所包含的基本事件有{a,m}、{a,n}、{a,p}、{a,q}、{b,m}、{b,n}、{b,p}、{b,q}、{c,m}、{c,n}、{c,p}、{c,q},共12个,所以P==.
- 11 -