二轮大题专练 45—随机变量的分布列(二项分布 2)
1.2019 年 9 月 1 日央视《开学第一课》播出后,社会各界反响强烈,全国人民爱国主义热
情空前高涨,在新中国成立 70 周年前夕,上演了一次小高潮.某兴趣小组为了了解某校
学生对《开学第一课》的喜欢程度,从该校随机抽取了 100 名学生对该节目进行打分,
并把相关的统计结果记录如表:
喜欢程
度
不喜欢 喜欢 非常喜欢
分数段 [50,60) [60,70) [70,80) [80,90) [90,100]
频数 1 9 18 32 40
以喜欢程度位于各区间的频率代替喜欢程度位于该区间的概率.
(1)试估计这 100 名学生对节目打分的中位数和平均数;
(2)为了感谢学生对该次调查统计的支持,兴趣小组决定从全校随机抽取 3 名学生进行
奖励,X 表示所抽取的学生中来自“非常喜欢”的人数,求 X 的分布列和数学期望.
解:(1)∵0.01+0.09+0.18<0.5,0.01+0.09+0.18+0.32>0.5,
∴中位数 x
∈
[80,90),
由 0.01+0.09+0.18+(x﹣80)× =0.5,解得 x=86.875,
故中位数为 86.875;
由 55× +65× =85.1,
得平均数为 85.1;
(2)从该校随机抽取 1 名学生,该学生对节目喜欢程度为“非常喜欢”的概率为 .
X 的可能取值为 0,1,2,3,
则 P(X=0)= ,
P(X=1)= ,
P(X=2)= ,
P(X=3)= .
X 的分布列为:
X 0 1 2 3
P
∴E(X)=0× = .
2.2020 年初,新冠肺炎袭击全国,某省由于人员流动性较大,成为湖北外疫情最严重的省
份之一,截止 2 月 29 日,该省已累计确诊 1349 例患者(无境外输入病例).
(1)为了了解新冠肺炎的相关特征,研究人员统计了他们的年龄数据,可以大致认为,
该省新冠肺炎患者的年龄 Z 服从正态分布 N(54.8,15.22),请估计该省新冠肺炎患者年
龄在 70 岁以上的患者比例;
(2)截至 2 月 29 日,该省新冠肺炎的密切接触者(均已接受检测)中确诊患者约占 10%,
以这些密切接触者确诊的频率代替 1 名密切接触者确诊发生的概率,每名密切接触者是
否确诊相互独立,现有密切接触者 20 人,为检测出所有患者,设计了如下方案:将这 20
名密切接触者随机地按 n(n 可以取 2,4,5,10)个人一组平均分组,并将同组 n 个人
每人抽取的一半血液混合在一起化验,若发现新冠病毒,则对该组的 n 个人抽取的另一
半血液逐一化验,以化验次数的期望值为决策依据,试确定使得 20 人的化验总次数最少
的 n 的值.
参考数据:若 Z~N(
μ
,σ2),则 P(
μ
﹣σ<Z<
μ
+σ)=0.6826,P(
μ
﹣2σ<Z<
μ
+2
σ)=0.9544,P(
μ
﹣3σ<Z<
μ
+3σ)=0.9973.0.94≈0.66,0.95≈0.59,0.910≈0.35.
解:(1)P(54.8﹣15.2<X<54.8+15.2)=P(39.6<X<70)=0.6826.
P(Z≥70)= = =0.1587=15.87%.
所以该省新冠肺炎患者年龄在 70 岁以上(≥70)的患者比例为 15.87%.
(2)由题意,每名密切接触者确诊为新冠脑炎的概率均为 ,
n 的可能取值为 2,4,5,10.且 Xn~B(n, )
对于某组 n 个人,化验次数 Y 的可能取值为 1,n+1.
P(Y=1)= ,P(Y=n+1)=1﹣
所以 E(Y)=1• +(n+1)[1﹣ ]=n+1﹣n ,
则 20 人的化验总次数为 f(n)= [n+1﹣n ]=20[1+ ﹣ ],
经计算 f(2)=13.8,f(4)≈11.8,f(5)≈12.2,f(10)≈15.
所以,当 n=4 时符合题意,即按 4 人一组检测,可是化验总次数最少.
3.某学校为了了解同学们现阶段的视力情况,对全校高三 1000 名学生的视力情况进行了调
查,从中随机抽取了 100 名学生的体检表,绘制了频率分布直方图如图:
前 50 名 后 50 名
近视 42 32
不近视 8 18
(1)求 a 的值,并估计这 1000 名学生视力的中位数(精确到 0.01);
(2)为了进一步了解视力与学生成绩是否有关,对本年级名次在前 50 名与后 50 名的学
生进行了调查,得到如上图表格数据:根据表中数据,能否有 95%把握认为视力与学习
成绩有关?
(3)若报考某高校某专业的资格为:视力不低于 5.0,以该样本数据来估计全市高三学
生的视力,现从全市视力在 4.8 以上的同学中随机抽取 4 名同学,这 4 名同学中有资格报
该校该专业的人数为 X,求 X 的分布列及数学期望.
P(K2≥k) 0.10 0.05 0.025 0.010 0.005
k 2.706 3.841 5.024 6.635 7.879
其中 .
解:(1)由频率分布直方图的性质得:
(0.25+0.5+2a+1+1.75)×0.2=1,
解得 a=0.75.
视力在 4.4 以下的频率为:(0.5+0.75)×0.2=0.25,
视力在 4.6 以下的频率为:(0.5+0.75+1.75)×0.2=0.6,
∴中位数在 4.4 至 4.6 之间,设中位数为 x,
则(x﹣4.4)×1.75=0.5﹣0.25,解得 x=4.54,
∴中位数为 4.54.
(2)K2= = ≈5.2>3.841,
∴有 95%把握认为视力与学习成绩有关.
(3)视力在 4.8 以上的同学中,视力在 5.0 以上的同学所占有比例为:
= ,
∴从全市视力在 4.8 以上的同学中随机抽取 4 名同学,
这 4 名同学中有资格报该校专业的人数 X~B(4, ),
P(X=0)= = ,
P(X=1)= × × = ,
P(X=2)= × × = ,
P(X=3)= × = ,
P(X=4)=( )4= ,
∴X 的分布列为:
X 0 1 2 3 4
P
E(X)=4× =1.
4.2019 年“非洲猪瘟”过后,全国生猪价格逐步上涨,某大型养猪企业,欲将达到养殖周
期的生猪全部出售,根据去年的销售记录,得到销售生猪的重量的频率分布直方图(如
图所示).
(1)根据去年生猪重量的频率分布直方图,估计今年生猪出栏(达到养殖周期)时,生
猪重量达不到 270 斤的概率(以频率代替概率);
(2)若假设该企业今年达到养殖周期的生猪出栏量为 5000 头,生猪市场价格是 8 元/斤,
试估计该企业本养殖周期的销售收入是多少万元;
(3)若从本养殖周期的生猪中,任意选两头生猪,其重量达到 270 斤及以上的生猪数为
随机变量 Y,试求随机变量 Y 的分布列及方差.
解:(1)估计生猪重量达不到 270 斤的概率为(0.0005+0.002)×40+0.005× 30=0.25.
(2)生猪重量的平均数为 180×0.02+220×0.08+260×0.2+300×0.32+340×0.24+380×
0.1+420×0.04=305.6(斤).
所以估计该企业本养殖周期的销售收入是 305.6×8×5000=1222.4(万元).
(3)由(1)可得随机选一头生猪,其重量达到 270 斤及以上的概率为 ,
由题意可得随机变量 Y 的所有可能取值为 0,1,2,则 Y~B(2, ),
∴ ,
,
,
∴随机变量 Y 的分布列为
Y 0 1 2
P
∴随机变量 Y 的方差 .
5.某土特产超市为预估 2020 年元旦期间游客购买土特产的情况,对 2019 年元旦期间的 90
位游客购买情况进行统计,得到如下人数分布表.
购买金额
(元)
[0,15) [15,30) [30,45) [45,60) [60,75) [75,90]
人数 10 15 20 15 20 10
(1)根据以上数据完成 2×2 列联表,并判断是否有 95%的把握认为购买金额是否少于
60 元与性别有关.
不少于 60 元 少于 60 元 合计
男 40
女 18
合计
(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于 60 元可抽奖 3 次,每次
中奖概率为 p(每次抽奖互不影响,且 p 的值等于人数分布表中购买金额不少于 60 元的
频率),中奖 1 次减 5 元,中奖 2 次减 10 元,中奖 3 次减 15 元.若游客甲计划购买 80
元的土特产,请列出实际付款数 X(元)的分布列并求其数学期望.
附:参考公式和数据: .
附表:
k0 2.072 2.706 3.841 6.635 7.879
P(K2≥k0) 0.150 0.100 0.050 0.010 0.005
解:(1)2×2 列联表如下:
不少于 60 元 少于 60 元 合计
男 12 40 52
女 18 20 38
合计 30 60 90
K ,
因此有 95%的把握认为购买金额是否少于 60 元与性别有关;
(2)由题意可得 X 的所有可能取值为 65,70,75,80,
且 p= ,由题意随机变量 X 服从二项分布 X~B(3, ),
则 P(X=65)=C ,P(X=70)=C ,
P(X=75)=C ,P(X=80)=C ,
所有 X 的分布列如下:
X 65 70 75 80
P
期望 E(X)=65× .
6.中国提出共建“一带一路”,旨在促进更多的经济增长和更大的互联互通,随着“一带一
路”的发展,中亚面粉、波兰苹果、法国红酒走上了国人的餐桌,中国制造的汽车、电子元
件、农产品丰富着海外市场.为拓展海外市场,某电子公司新开发一款电子产品,该电子产
品的一个系统 G 有 3 个电子元件组成,各个电子元件能正常工作的概率为 2
3
,且每个电子
元件能否正常工作相互独立,若系统 G 中有超过一半的电子元件正常工作,则 G 可以正常
工作,否则就需要维修,且维修所需费用为 900 元.
(1)求系统需要维修的概率;
(2)该电子产品共由 3 个系统G 组成,设 为电子产品所需要维修的费用,求 的期望;
(3)为提高系统G 正常工作的概率,在系统内增加两个功能完全一样的其他品牌的电子元
件,每个新元件正常工作的概率为 p ,且新增元件后有超过一半的电子元件正常工作,则G
可以正常工作.问: p 满足什么条件时可以提高整个系统 G 的正常工作概率?
解:(1)该电子产品的一个系统 G 有 3 个电子元件组成,各个电子元件能正常工作的概率
为 2
3
,
且每个电子元件能否正常工作相互独立,
系统 G 中有超过一半的电子元件正常工作,则 G 可以正常工作,否则就需要维修,
系统需要维修的概率为:
0 3 1 2
3 3
1 2 1 7( ) ( )( )3 3 3 27P C C .
(2)设 X 为需要维修的系统的个数,则 1~ (3, )3X B ,且 900X ,
的期望 1( ) 900 ( ) 900 3 9003E E X (元 ) .
(3)当系统 G 有 5 个元件时,原来 3 个电子元件中至少有 1 个元件正常工作,G 系统正常
才正常工作,
若前 3 个电子元件中有 1 个正常工作,同时新增的两个必须都正常工作,
则概率为 1 2 2 2
1 3
2 1 2( )( )3 3 9P C p p ,
若前 3 个电子元件中有 2 个正常工作,同时新增的两个至少有 1 个正常工作,
则概率为: 2 2 1 2 2
2 3 2
2 1 4( ) ( )[ (1 ) ] (2 )3 3 9P C C p p p p p ,
若前 3 个电子元件都正常工作,则不管新增的两个是否正常工作,系统 G 均能正常工作,
则概率为: 2
3
2 8( )3 27P ,
新增两个元件后系统 G 能正常一作的概率为:
2 2 22 4 8 2 8 8(2 )9 9 27 9 9 27P p p p p p ,
由 22 8 8 2
9 9 27 3p p ,
由 0 1p ,得 6 21 13 p ,
6 21 13 p 时可以提高整个系统 G 的正常工作概率.
7.随着智能手机的普及,手机计步软件迅速流行开来,这类软件能自动记载用户每日健步
的步数.某市大型企业为了了解其员工每日健步走的情况,从正常上班的员工中随机抽
取了 2000 人,统计了他们手机计步软件上同一天健步的步数(单位:千步,假设每天健
步的步数均在 3 千步至 21 千步之间).将样本数据分成[3,5),[5,7)[7,9),[9,11),
[11,13),[13,15),[15,17),[17,19),[19,21]九组,绘制成如图所示的频率分布
直方图,并用样本的频率分布估计总体的频率分布.
(1)求图中 a 的值;
(2)设该企业正常上班的员工健步步数(单位:千步)近似服从正态分布 N(
μ
,σ2),
其中
μ
近似为样本的平均数(各区间数据用中点值近似计算),取σ=3.64,若该企业恰
有 10 万人正常上班的员工,试估计这些员工中日健步步数 Z 位于区间[4.88,15.8]范围内
的人数;
(3)现从该企业员工中随机抽取 20 人,其中有 k 名员工的日健步步数在 13 千步至 15
千步内的概率为 P(X=k),其中 k=0,1,2,…,20,当 P(X=k)最大时,求 k 的值.
参考数据:若随机变量
ξ
服从正态分布 N(
μ
,σ2),则 P(
μ
﹣σ<
ξ
≤
μ
+σ)≈0.6827,
P(
μ
﹣2σ<
ξ
≤
μ
+2σ)≈0.9545,P(
μ
﹣3σ<
ξ
≤
μ
+3σ)≈0.9973.
解:(1)由 0.02×2+0.03×2+0.05×2+0.05×2+0.15×2+a×2+0.05×2+0.04×2+0.01×2
=1,
解得 a=0.1,
(2)
μ
=4×0.04+6×0.04+8×0.1+10×0.1+12×0.3+14×0.2+16×0.1+18×0.08+20×0.02
=12.16
∴P(4.88≤Z≤15.8)=P(
μ
﹣2σ≤
ξ
≤
μ
+σ)= =0.8186,
100000×0.8186=81860,
∴估计这些员中日健步步数 Z 位于区间[4.88,15.8]范围内的人数约为 81860 人.
(2)设从该企业中随机抽取 20 人日健步步数在 13 千步至 15 千步内的员工有 X 人,则
X~B(20,0.2),
∴P(X=k)=C20k•0.2k•0.820﹣k,k=0,1,2,…,20,
记 f(k)= = = ,
当 f(k)>1 时,k<4.2,则 P(X=k﹣1)<P(X=k)
当 f(k)<1 时,k>4.2,则 P(X=k﹣1)>P(X=k),
所以当 k=4 时,P(X=k)最大.