二轮大题专练 50—随机变量的分布列(独立性检验)
1.近年来,我国肥胖人群的规模急速增长,肥胖人群有着很大的健康隐患.目前,国际上
常用身体质量指数(英文为 BodyMassIndex,简称 BMI)来衡量人体胖瘦程度以及是否健
康,其计算公式是 BMI= ,中国成人的 BMI 数值标准为:BMI<18.5
为偏瘦;18.5≤BMI<23.9 为正常;24≤BMI<27.9 为偏胖;BMI≥28 为肥胖.某地区随
机调查了 100 名 35 岁以上成人的身体健康状况,测量身高、体重并计算 BMI 数值.
(1)根据调查结果制作下面的 2×2 列联表,并判断能否有 99%的把握认为 35 岁以上成
人肥胖与不经常运动有关?
肥胖 不肥胖 总计
经常运动员工 40 60
不经常运动员工 24 40
总计 100
参考公式: ,其中 n=a+b+c+d.
参考数据:
P(K2≥k) 0.25 0.10 0.050 0.010 0.005 0.001
k 1.323 2.706 3.841 6.635 7.879 10.828
(2)如果视样本的频率视为概率,现随机地从这个地区抽取经常运动人群中的 3 人,不
经常运动人群中的 1 人座谈,记这 4 人中肥胖人数为 X,求 X 的分布列和数学期望.
解:(1)填表如下:
肥胖 不肥胖 总计
经常运动员工 20 40 60
不经常运动员工 24 16 40
总计 44 56 100
所以 K2= ≈6.926,
因为 6.926>6.635,所以有 99%的把握认为肥胖与不经常运动有关.
(2)“经常运动且肥胖”的概率为 = ,“经常运动且不肥胖”的概率为 = ,
“不经常运动且肥胖”的概率为 = ,“不经常运动且不肥胖”的概率为 = ,
X 的所有可能取值为 0,1,2,3,4,
P(X=0)=( )3× = ,
P(X=1)= × ×( )2× + ( )3× = ,
P(X=2)= ×( )2× × + × ×( )2× = ,
P(X=3)= ( )3× + ×( )2× × = ,
P(X=4)=( )3× = ,
所以随机变量 X 的分布列为
X 0 1 2 3 4
P
则数学期望为 E(X)=0× +1× +2× +3× +4× = .
2.随着人们生活水平的提高和对健康生活的重视,越来越多的人加入到了健身运动中.某
健身房从参与健身的会员中随机抽取了 100 人,对其每周参与健身的天数和 2020 年在该
健身房的消费金额(单位:元)进行统计,得到以下统计表和统计图:
平均每周健身天数 不大于 2 3 或 4 不小于 5
男性会员人数 20 35 10
女性会员人数 10 20 5
若某人平均每周健身天数不小于 5,则称其为“健身达人”.该健身房规定年消费金额不
超过 1600 元的为普通会员,超过 1600 元但不超过 3200 元的为银牌会员,超过 3200 元
的为金牌会员.
(1)已知金牌会员都是“健身达人”,现从这 100 位会员里的“健身达人”中随机抽取 2
人,求他们都是金牌会员的概率;
(2)根据所给数据,完成下面的 2×2 列联表:
男性会员 女性会员
是“健身达人”
不是“健身达人”
并判断能否在犯错误的概率不超过 0.05 的前提下认为是否为“健身达人”和性别有关?
(3)该健身机构在 2020 年年底针对这 100 位会员举办一次消费返利活动,每位会员均
可参与摸奖游戏,游戏规则如下:摸奖箱中装有 5 张形状大小完全一样的卡片,其中 3
张印跑步机图案、2 张印动感单车图案,有放回地摸三次卡片,每次只能摸一张.若摸到
动感单车的总次数为 1,则获得 50 元奖励;若摸到动感单车的总次数为 2,则获得 100
元奖励;若摸到动感单车的总次数为 3,则获得 200 元奖励,其他情况不予奖励.规定每
个普通会员只能参加 1 次摸奖游戏,每个银牌会员可参加 2 次摸奖游戏,每个金牌会员
可参加 3 次摸奖游戏(每次摸奖结果相互独立).试估计在此次消费返利活动中该健身机
构的总支出.
附: ,其中 n=a+b+c+d.
P(K2≥k0) 0.500 0.250 0.100 0.050 0.010 0.005
k0 0.455 1.323 2.706 3.841 6.636 7.879
解:(1)设事件 A 表示从这 100 位会员里的“健身达人”中随机抽取 2 人都是金牌会员,
则 .
(2)根据题意:
男性会员 女性会员
是“健身达人” 10 5
不是“健身达人” 55 30
= ,
故不能在犯错误的概率不超过 0.05 的前提下认为是否为“健身达人”和性别有关系.
(3)设一次摸奖所获得的奖励额为 X,则 X 的所有可能取值为 0,50,100,200,
且 , ,
, ,
故 一 次 摸 奖 获 得 的 奖 励 额 的 期 望 值 为
,
故总支出约为(28+60×2+12×3)×63.2=184×63.2=11628.8 元.
3.为了解成年人的交通安全意识情况,某中学组织学生进行了一次全市成年人安全知识抽
样调查.随机地抽取了 200 名成年人,然后对这 200 人进行问卷调查,其中拥有驾驶证的占
2
5
.这 200 人所得的分数都分布在[30 ,100] 范围内,规定分数在 80 以上(含80) 的为“具
有很强安全意识”,所得分数的频率分布直方图如图.
(1)补全下面的 2 2 列联表,并判断能否有 95% 的把握认为“具有很强安全意识”与“拥
有驾驶证”有关?
拥有驾驶证 没有驾驶证 总计
具有很强安全意识 22
不具有很强安全意识
总计 200
(2)将上述调查所得的频率视为概率,现从全市成年人中随机抽取 3 人,记“具有很强安
全意识”的人数为 X ,求 X 的分布列及数学期望.
附临界值表:
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
,其中 n a b c d .
2
0( )P K
k 0.15 0.10 0.05 0.025 0.010 0.005 0.001
0k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
解:(1)200 人中拥有驾驶证的占 2
5
,有 80 人,没有驾驶证的有 120 人,
由题意知 (0.004 0.008 0.020 0.028 0.020 0.004) 10 1a ,
解得 0.016a .
所以具有很强安全意识的人有 200 (0.016 0.004) 10 40 人,
不具有很强安全意识的有 160 人.
补全 2 2 列联表如下:
拥有驾驶证 没有驾驶证 总计
具有很强安全意识 22 18 40
不具有很强安全意识 58 102 160
总计 80 120 200
计算得
2
2 200 (22 102 18 58) 75 4.688 3.84140 80 160 120 16K
,
有 95% 的把握认为“具有很强安全意识”与“拥有驾驶证”有关.
(2)由频率分布直方图中数据可知,
抽到的每个成年人“具有很强安全意识”的概率为 1
5
,
所以 X 的所有可能取值为 0,1,2,3.
则 34 64( 0) ( )5 125P X ,
1 2
3
1 4 48( 1) ( )5 5 125P X C ,
2 2
3
1 4 12( 2) ( )5 5 125P X C ,
31 1( 3) ( )5 125P X .
所以 X 的分布列为:
X 0 1 2 3
P 64
125
48
125
12
125
1
125
故 64 48 12 1 3( ) 0 1 2 3125 125 125 125 5E X .
4.为了解使用手机是否对学生的学习有影响,某校随机抽取 50 名学生,对学习成绩和使用
手机情况进行了调查,统计数据如表所示(不完整):
使用手机 不使用手机 总计
学习成绩优秀 5 20
学习成绩一般
总计 30 50
(1)补充完整所给表格,并根据表格数据计算是否有99.9% 的把握认为学生的学习成绩与
使用手机有关;
(2)现从如表 不使用手机的学生中按学习成绩是否优秀分层抽样选出 9 人,再从这 9 人中
随机抽取 3 人,记这 3 人中“学习成绩优秀”的人数为 X ,试求 X 的分布列与数学期望.
参考公式:
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
,其中 n a b c d .
参考数据:
2
0( )P K
k 0.050 0.010 0.001
0k 3.841 6.635 10.828
解:(1)完成列联表如下:
使用手机 不使用手机 总计
学习成绩优秀 5 20 25
学习成绩一般 15 10 25
总计 20 30 50
2 2
2 ( ) 50(5 10 20 15) 0.0533 10.828( )( )( )( ) 20 30 25 25
n ad bcK a b c d a c b d
,
没有 99.9% 的把握认为学生的学习成绩与使用手机有关;
(2)现从如表不使用手机的学生中按学习成绩是否优秀分层抽样选出 9 人,
则从学习成绩优秀中抽取 209 630
人,从学习成绩一般中抽取 109 330
人,
再从这 9 人中随机抽取 3 人,记这 3 人中“学习成绩优秀”的人数为 X ,
则 X 的可能取值为 0,1,2,3,
3
3
3
9
1( 0) 84
CP X C
,
1 2
6 3
3
9
18( 1) 84
C CP X C
,
2 1
6 3
3
9
45( 2) 84
C CP X C
,
3
6
3
9
20( 3) 84
CP X C
,
X 的分布列为:
X 0 1 2 3
P 1
84
18
84
45
84
20
84
数学期望 1 18 45 20( ) 0 1 2 3 284 84 84 84E X .
5.教育部官方数据显示,2020 届大学毕业生达到 844 万,根据相关调查,位于大城市的应
届毕业生毕业后,有 30% 会留在该城市进行就业,于是租房便成为这些毕业生的首选.为
了了解应届毕业生房租支出的费用,研究人员对部分毕业生进行相关调查,所得数据如图所
示.
(1)求 m 的值以及房租支出的平均值 x ;
(2)为了了解应届生选择租房时考虑的主要因素,研究人员作出调查,所得数据如表所示,
判断是否有 99.9% 的把握认为性别与选择租房时考虑的主要因素具有相关性.
以距离上班地点的远近作为主要考虑因
素
以房租的高低作为主要考虑因素
男生 500 300
女生 300 400
(3)由频率分布直方图,可近似地认为 A 城市应届毕业生房租支出服从正态分布 (N ,
23.2 ) ,若 2020 年该市区的应急毕业生共有 100 万人,试根据本题信息估计毕业后留在该市
且房租支出介于 8.6 百元到 21.4 百元之间的毕业生人数.
附:参考公式:
2
2 ( )
( )( )( )( )
ad bcK a b c d a c b d
.
参考数据:
2( )P K
k 0.100 0.050 0.010 0.001
k 2.706 3.841 6.635 10.828
( ) 0.6827P X , ( 2 2 ) 0.9544P X ,
( 3 3 ) 0.9973P X .
解:(1)依题意, (0.0125 0.05 0.0375 0.0125) 4 1m ,解得 0.1375m ;
故 (0.0125 4 0.05 8 0.1375 12 0.0375 16 0.0125 20) 4 1 1.8x ;
(2)在本次实验中, 2K 的观测值
2
0
1500 (500 400 300 300) 57.876 10.828800 800 700 700
k ,
故有 99.9% 的把握认为性别与选择租房时考虑的主要因素具有相关性;
(3)依题意,毕业后留在该市的应届毕业生人数为1000000 0.3 300000 人,
0.6827 0.9973(860 2140) ( 3 ) 0.842P x P x ,
故所求人数为 300000 0.84 252000 .
6.智慧课堂是指一种打破传统教育课堂模式,以信息化科学技术为媒介实现师生之间、生
生之间的多维度互动,能有效提升教师教学效果、学生学习成果的新型教学模式.为了进一
步推动智慧课堂的普及和应用, A 市现对全市中小学智慧课堂的应用情况进行抽样调查,
统计数据如表:
经常应用 偶尔应用或者不应用 总计
农村 40
城市 60
总计 100 60 160
从城市学校中任选一个学校,偶尔应用或者不应用智慧课堂的概率是 1
4
.
(1)补全 2 2 列联表,判断能否有 99.5% 的把握认为智慧课堂的应用与区域有关,并说明
理由;
(2)在偶尔应用或者不应用智慧课堂的学校中,按照农村和城市的比例抽取 6 个学校进行
分析,然后再从这 6 个学校中随机抽取 2 个学校所在的地域进行核实,记其中农村学校有 X
个,求 X 的分布列和数学期望.
附:
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
, n a b c d .
2
0( )P K
k 0.1 0.050 0.010 0.005 0.001
0k 2.706 3.841 6.635 7.879 10.828
解:(1) 2 2 列联表,
经常应用 偶尔应用或者不应用 总计
农村 40 40 80
城市 60 20 80
总计 100 60 160
(2 分)
2 2
2 ( ) 160(20 40 40 60) 32 10.667 7.879( )( )( )( ) 100 60 80 80 3
n ad bcK a b c d a c b d
.(4 分)
所以有 99.5% 的把握认为认为智慧课堂的应用与区域有关.(6 分)
(2)在偶尔应用或者不应用智慧课堂的学校中,农村和城市的比例是 2 :1 ,所以抽取的 6
个样本有 4 个是农村学校,2 个是城市学校,从中抽取 2 个,则 X 的可能取值为 0,1,2.(7
分)
0 2
4 2
2
6
1( 0) 15
C CP X C
,
1 1
4 2
2
6
8( 1) 15
C CP X C
,
2
4
2
6
0
22( 2) 5
C C
P X C
.
所以 X 的分布列为:
X 0 1 2
P 1
15
8
15
2
5
(10 分)
X 的数学期望 1 8 2 4( ) 0 1 215 15 5 3E X .(12 分)
7.某学校共有 1000 名学生,其中男生 400 人,为了解该校学生在学校的月消费情况,采取
分层抽样随机抽取了 100 名学生进行调查,月消费金额分布在 450~950 之间.根据调查
的结果绘制的学生在校月消费金额的频率分布直方图如图所示:
将月消费金额不低于 750 元的学生称为“高消费群”.
(Ⅰ)求 a 的值,并估计该校学生月消费金额的平均数(同一组中的数据用该组区间的
中点值作代表);
(Ⅱ)现采用分层抽样的方式从月消费金额落在[550,650),[750,850)内的两组学生
中抽取 10 人,再从这 10 人中随机抽取 3 人,记被抽取的 3 名学生中属于“高消费群”
的学生人数为随机变量 X,求 X 的分布列及数学期望;
(Ⅲ)若样本中属于“高消费群”的女生有 10 人,完成下列 2×2 列联表,并判断是否
有 97.5%的把握认为该校学生属于“高消费群”与“性别”有关?
属于“高消费群” 不属于“高消费群” 合计
男
女
合计
(参考公式: ,其中 n=a+b+c+d)
P(K2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
解:(Ⅰ)由题意知 100×(0.0015+a+0.0025+0.0015+0.001)=1,解得 a=0.0035,
样本平均数为 =500×0.15+600×0.35+700×0.25+800×0.15+900×0.10=670 元.
(Ⅱ)由题意,从[550,650)中抽取 7 人,从[750,850)中抽取 3 人,
随机变量 X 的所有可能取值有 0,1,2,3.
P(X=k)= (k=0,1,2,3)所以随机变量 X 的分布列为:
X 0 1 2 3
P
随机变量 X 的数学期望 E(X)= +2× +3× = .
(Ⅲ)由题可知,样本中男生 40 人,女生 60 人属于“高消费群”的 25 人,其中女生 10
人;得出以下 2×2 列联表:
属于“高消费群” 不属于“高消费群” 合计
男生 15 25 40
女生 10 50 60
合计 25 75 100
= = >5.024,
所以有 97.5%的把握认为概型学生属于“高消费群”与性别有关.