易错点 11 概率统计
—备战 2021 年高考数学一轮复习易错题
【典例分析】
例 1(2020 年普通高等学校招生全国统一考试数学)某中学的学生积极参加体育锻炼,其
中有 96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既
喜欢足球又喜欢游泳的学生数占该校学生总数的比例是( )
A. 62% B. 56%
C. 46% D. 42%
【答案】C
【解析】
【分析】
记“该中学学生喜欢足球”为事件 ,“该中学学生喜欢游泳”为事件 ,则“该中学学
生喜欢足球或游泳”为事件 ,“该中学学生既喜欢足球又喜欢游泳”为事件 ,
然后根据积事件的概率公式 可得结果.
【详解】记“该中学学生喜欢足球”为事件 ,“该中学学生喜欢游泳”为事件 ,则“该
中学学生喜欢足球或游泳”为事件 ,“该中学学生既喜欢足球又喜欢游泳”为事件
,
则 , , ,
所以
所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为 .
故选:C.
A B
A B+ A B⋅
( )P A B⋅ = ( ) ( ) ( )P A P B P A B+ − +
A B
A B+
A B⋅
( ) 0.6P A = ( ) 0.82P B = ( ) 0.96P A B+ =
( )P A B⋅ = ( ) ( ) ( )P A P B P A B+ − + 0.6 0.82 0.96 0.46= + − =
46%【点睛】本题考查了积事件的概率公式,属于基础题.
例 2(2020 年普通高等学校招生全国统一考试数学)为加强环境保护,治理空气污染,环
境监测部门对某市空气质量进行调研,随机抽查了 天空气中的 和 浓度(单
位: ),得下表:
32 18 4
6 8 12
3 7 10
(1)估计事件“该市一天空气中 浓度不超过 ,且 浓度不超过 ”的概率;
(2)根据所给数据,完成下面的 列联表:
100 PM2.5 2SO
3μg/m
2SO
PM2.5
[0,50] (50,150] (150,475]
[0,35]
(35,75]
(75,115]
PM2.5 75 2SO 150
2 2×
2SO
PM2.5
[0,150] (150,475]
[0,75]
(75,115](3)根据(2)中的列联表,判断是否有 的把握认为该市一天空气中 浓度与
浓度有关?
附: ,
0.050 0.010 0.001
3 841 6.635 10.828
【答案】(1) ;(2)答案见解析;(3)有.
【解析】
【分析】
(1)根据表格中数据以及古典概型的概率公式可求得结果;
(2)根据表格中数据可得 列联表;
(3)计算出 ,结合临界值表可得结论.
【详解】(1)由表格可知,该市 100 天中,空气中的 浓度不超过 75,且 浓度
不超过 150 的天数有 天,
所以该市一天中,空气中的 浓度不超过 75,且 浓度不超过 150 的概率为
;
(2)由所给数据,可得 列联表为:
.
99% PM2.5 2SO
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
−= + + + +
2( )P K k≥
k
0.64
2 2×
2K
2.5PM 2SO
32 6 18 8 64+ + + =
2.5PM 2SO
64 0.64100
=
2 2×合计
64 16 80
10 10 20
合计 74 26 100
(3)根据 列联表中的数据可得
,
因为根据临界值表可知,有 的把握认为该市一天空气中 浓度与 浓度有关.
【易错警示】
易错点 1.重复计算或漏算导致错误
【例 1】4 名考生在三道选做题中任选一道进行做答,则这三道题都有人选做的概率为 ( )
A. B. C. D.
【错解一】4 名考生任选一题,有 种选法。每题都有人做,则先让 3 个人每人做一题,共
种方法,再让第 4 个人从三个题目中选一个即 种,共 种选法。所求概率
为 ,选 C
【错解二】4 名考生任选一题,有 种选法。每题都有人做,则先从 4 人中选 3 人,每人做
2SO
2.5PM
[ ]0,150 ( ]150,475
[ ]0,75
( ]75,115
2 2×
2 2
2 ( ) 100 (64 10 16 10)
( )( )( )( ) 80 20 74 26
n ad bcK a b c d a c b d
− × × − ×= =+ + + + × × ×
3600 7.4844 6.635481
= ≈ >
99% 2.5PM 2SO
4
9
8
27
2
9
4
27
43
3
3A 1
3C 181
3
3
3 =•CA
9
2
81
18 =
43一题,共 种,再让剩下的一人从三个题种选一个即 种,共 种。
所求概率为 ,无答案。
【错因】 第一种做法在计算的过程漏掉了“先选的三个人也可以有两个人同时做同一个题”
这种情况;第二种做法在计算过程中出现了重复计算.
【正解】4 个人做三道题目,每题至少一人,则必有一个题目有两个人做,因此要先将四个
人分成三组,然后再排列,方法数为 ,所求概率为 .选 A
易错点 2.超几何分布与二项分布混淆
【例 2】为了解今年某校高三毕业班报考飞行员学生的体重情况,将所得的数据整理后,画
出了频率分布直方图如图所示,已知图中从左到右的前组的频率之比为
, 其中第二组的频数为 .
(1)求该校报考飞行员的总人数;
(2) 以这所学校的样本数据来估计全省的总体数据,若从全省报考飞行
员的同学中(人数很多)任选三人,设 表示体重超过 公斤的学生人
数,求 的分布列和数学期望.
【错解】由题知,体重在 60 公斤以下的有 6 人,60 公斤以上的有 10 人,
随机变量 服从超几何分布, 所有可能的取值为 0,1,2,3,
则 ,
,
则
【错因】(1)对随机变量的含义不清楚,不能区分超几何分布与二项分布;(2)对于何时
可以样本的频率代替总体的概率不清楚;
【纠错提醒】(1)超几何分布的本质是“不放回抽样”,是一种古典概型,而二项分布的随
机实验是“独立重复实验”,强调每次实验的结果发生的概率相同,可认为是“有放回抽
1: 2:3 12
X 60
X
3
3
3
4 AC • 1
3C 721
3
3
3
3
4 =•• CAC
9
8
81
72 =
2 3
4 3 36C A = 36 4
81 9
=
Χ Χ
( )
56
20 3
16
3
6 ===
C
CΧΡ ( )
56
151 3
16
1
10
2
6 =•==
C
CCΧΡ
( )
56
272 3
16
2
10
1
6 =•==
C
CCΧΡ ( )
56
123 3
16
3
10
0
6 =•==
C
CCΧΡ
18
5
56
12356
27256
15156
20 =×+×+×+×=ΕΧ样”.本题中,“若从全省报考飞行员的同学中(人数很多)任选三人”,特别强调人数很多,
意味着实验可以看做是“有放回抽样”,所以是一个二项分布;
(2)本题明确要求“以这所学校的样本数据来估计全省的总体数据”,其意思是:用频率来
代替概率,即 16 个人中每个人的体重超过 60 公斤的概率是 ,也是说,全省每个学
生的体重超过 60 公斤的概率为 .
【正解】(1)设报考飞行员的人数为,前三小组的频率分别为 ,
则由条件可得: ,
解得, 又因为 ,故 .
(2)由 ( 1 ) 可 得 , 一 个 报 考 学 生 体 重 超 过 60 公 斤 的 概 率 为
,
故 服从二项分布,
∴ 随机变量 的分布列为:
则 ,或 .
易错点 3.几何概型与古典概型混淆
【例 3】心理学家分析发现视觉和空间能力与训练时间有关,某数学兴趣小组为了验证这个
结论,进行了对比试验,经过多次测试后,甲每次解答一道几何题所用的时间在 分钟,
乙每次解答一道几何题所用的时间在 分钟,现甲、乙各解同一道几何题,求乙比甲先
0 1 2 3
10 5=16 8
5
8
321 ,, ppp
2 1
3 1
1 2 3
2
3
(0.037 0.013) 5 1
p p
p p
p p p
=
=
+ + + + × =
1 2 30.125, 0.25, 0.375.p p p= = = 2
120.25p n
= = 48=n
3
5(0.037 0.013) 5 8p p= + + × =
X ( ) 3
3
5 3
8 8
k k
kP X k C
− = =
X
27 135 225 125 150 1 2 3512 512 512 512 8EX = × + × + × + × = 5 153 8 8EX np= = × =
5 7
6 8
X
P 27
512
135
512
225
512
125
512解答完的概率.
【错解】设事件 为“乙比甲先做完此道题”,由题意知,甲完成该题所用的时间可以是
5,6,7 分钟,共 3 种情况,乙可以是 6,7,8 分钟,共 3 种情况,所以,一共有 个基
本时间。其中甲用 7 分钟,乙用 6 分钟时,事件 发生。则
【错因】误认为时间是离散度的,将其看成了一个古典概型
【纠错提醒】时间是一个连续性随机变量,在求解时应建立几何概率模型.
【正解】(1)设甲、乙解答一道几何题的时间分别为 分钟,
则基本事件满足的区域为 (如图所示) ,
设事件 为“乙比甲先做完此道题” 则满足的区域为 .
∴ 由几何概型 ,即乙比甲先解答完的概率为 .
易错点 4.忘记回归直线过样本中心致错
【例 4】某单位为了了解用电量(度)与当天平均
气温(°C)之间的关系,随机统计了某 4 天的当
天平均气温与用电量(如右表).由数据运用最小
二乘法得线性回归方程 ,则 ___.
【错解】将点 带入 ,得 ,所以
【错因】不理解回归直线过样本中心点 ,随便带入数据导致结果错误.
【纠错提醒】求出样本的中心点 ,代入回归方程,即可求得.
【正解】解析: , ,样本中心为 ,
回归直线经过样本中心,所以 .
平均气温(°C) 18 13 10 -1
用电量 (度) 25 35 37 63
A
933 =×
A ( )
9
1=AΡ
x y、
5 7
6 8
x
y
≤ ≤
≤ ≤
A x y>
1 1 1 12( ) 2 2 8P A
× ×
= =×
1
8
2y x a= − + a =
( )25,18 axy +−= 2ˆ a+×−= 18225 61=a
( , )x y
( , )x y
18 13 10 1 104x
+ + −= = 25 35 37 63 404y
+ + += = (10,40)
40 2 10 60a a= − × + ⇒ =
y
y
x
1
1O易错点 5.对正态分布的性质及意义不熟悉致错
【 例 5 】 设 随 机 变 量 服 从 正 态 分 布 , 若 , 则
.
【错解】由 ,所以 ,得
【错因】(1)对正态分布 中的 的意义不清;
(2)对正态分布的性质及意义不熟悉.
【 纠 错 提 醒 】 由 题 意 与 关 于 对 称 , , 解 得
.
【正解】由 ,由正态分布的性质知, 与
关于 对称, ,解得
【变式练习】
1.“数摺聚清风,一捻生秋意”是宋朝朱翌描写折扇的诗句,折扇出入怀袖,扇面书画,扇
骨雕琢,是文人雅士的宠物,所以又有“怀袖雅物”的别号.如图是折扇的示意图, 为
的中点,若在整个扇形区域内随机取一点,则此点取自扇面(扇环)部分的概率是( )
A. B. C. D.
【答案】C
【解析】设 ,圆心角为 ,则整个折扇的面积为 ,扇面的面积为
Χ ( )1,4Ν ( ) ( )1 2 5a aΡ Χ > + = Ρ Χ < −
a =
( ) ( )1 2 5a aΡ Χ > + = Ρ Χ < − 521 −=+ aa 6=a
2( , )N µ σ 2,µ σ
1x a= + 2 5x a= − 1x = 1 2 5 2a a+ + − =
2a =
( ) ( )1 2 5a aΡ Χ > + = Ρ Χ < − 1x a= + 2 5x a= −
1x = 1 2 5 1a a+ + − = 2a =
A OB
1
4
1
2
3
4
5
8
AB r= α 21
2S rα=,
若在整个扇形区域内随机取一点,记此点取自扇面(扇环)部分为事件 ,则根据几何概
型的概率公式得
故选:
2.(2019•新课标Ⅱ)11 分制乒乓球比赛,每赢一球得 1 分,当某局打成 10:10 平后,每
球交换发球权,先多得 2 分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,
假设甲发球时甲得分的概率为 0.5,乙发球时甲得分的概率为 0.4,各球的结果相互独立.在
某局双方 10:10 平后,甲先发球,两人又打了 X 个球该局比赛结束.
(1)求 P(X=2);
(2)求事件“X=4 且甲获胜”的概率.
【解答】解:(1)设双方 10:10 平后的第 k 个球甲获胜为事件 Ak(k=1,2,3,…),
则 P(X=2)=P(A1A2)+P(퐴1퐴2)
=P(A1)P(A2)+P(퐴1)P(퐴2)
=0.5×0.4+0.5×0.6=0.5.
(2)P(X=4 且甲获胜)=P(퐴1A2A3A4)+P(퐴1퐴2퐴3퐴4)
=P(퐴1)P(A2)P(A3)P(A4)+P(A1)P(퐴2)P(A3)P(A4)
=(0.5×0.4+0.5×0.6)×0.5×0.4=0.1.
3.(2019•天津)设甲、乙两位同学上学期间,每天 7:30 之前到校的概率均为2
3.假定甲、
乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.
(Ⅰ)用 X 表示甲同学上学期间的三天中 7:30 之前到校的天数,求随机变量 X 的分布
列和数学期望;
2
2 21 1 3
2 2 2 8
rs r rα α α = − =
M
( )
2
2
3
38
1 4
2
r
P M
r
α
α
= =
C(Ⅱ)设 M 为事件“上学期间的三天中,甲同学在 7:30 之前到校的天数比乙同学在 7:
30 之前到校的天数恰好多 2”,求事件 M 发生的概率.
【解答】解:(I)甲上学期间的三天中到校情况相互独立,且每天 7:30 之前到校的概
率均为2
3,
故 X~B(3,2
3),
从而 P(X=k) = 퐶푘3(
2
3)푘(
1
3)3―푘,k=0,1,2,3.
所以,随机变量 X 的分布列为:
X 0 1 2 3
P 1
27
2
9
4
9
8
27
随机变量 X 的期望 E(X)=3 ×
2
3 = 2.
(II)设乙同学上学期间的三天中 7:30 到校的天数为 Y,则 Y~B(3,2
3),
且 M={X=3,Y=1}∪{X=2,Y=0},由题意知{X=3,Y=1}与{X=2,Y=0}互斥,且
{X=3}与{Y=1},{X=2}与{Y=0}相互独立,
由(I)知,P(M)=P({X=3,Y=1}∪{X=2,Y=0}=P({X=3,Y=1}+P{X=2,Y
=0}
=P(X=3)P(Y=1)+P(X=2)P(Y=0) =
8
27 ×
2
9 +
4
9 ×
1
27 =
20
243
4.2019 年国庆节假期期间,某商场为掌握假期期间顾客购买商品人次,统计了 10 月 1 日
7:00﹣23:00 这一时间段内顾客购买商品人次,统计发现这一时间段内顾客购买商品共
5000 人次顾客购买商品时刻的的频率分布直方图如下图所示,其中时间段 7:00〜11:
00,11:00〜15:00,15:00~19:00,19:00~23:00,依次记作[7,11),[11,15),
[15,19),[19,23].(1)求该天顾客购买商品时刻的中位数 t 与平均值푥(同一组中的数据用该组区间的中
点值代表);
(2)由频率分布直方图可以近似认为国庆节假期期间该商场顾客购买商品时刻服从正态
分布 N(μ,δ2),其中 μ 近似为푥,δ=3.6,估计 2019 年国庆节假期期间(10 月 1 日
﹣10 月 7 日)该商场顾客在 12:12﹣19:24 之间购买商品的总人次(结果保留整数);
(3)为活跃节日气氛,该商场根据题中的 4 个时间段分组,采用分层抽样的方法从这 5000
个样本中随机抽取 10 个样本(假设这 10 个样本为 10 个不同顾客)作为幸运客户,再从
这 10 个幸运客户中随机抽取 4 人每人奖励 500 元购物券,其他幸运客户每人奖励 200 元
购物券,记获得 500 元购物券的 4 人中在 15:00﹣19:00 之间购买商品的人数为 X,求
X 的分布列与数学期望;
参考数据:若 T~N(μ,σ2),则①P(μ﹣σ<T≤μ+σ)=0.6827;
②P(μ﹣2σ<T≤μ+2σ)=0.9545;③P(μ﹣3σ<T≤μ+3σ)=0.9973.
【解答】解:(1)根据题意,中位数 t∈(15,19),
由 4×(0.025+0.075)+(t﹣15)×0.100=0.5,得 t=16,
푥 = 4(9×0.025+13×0.075+17×0.100+21×0.050)=15.8;
(2)由题意可得,商场顾客购买商品时刻服从正态分布 N(15.8,3.62),
μ﹣δ=12.2,μ+δ=19.4,
所以 2019 年国庆节假期期间,商场顾客在 12:12﹣19:24 之间购买商品的概率为 P
(12.2<T<19.4)=0.6827,所以人数为 5000×0.6827×7≈23895;
(3)根据题意 X 可能取值为 0,1,2,3,4,
P(X=0) =
퐶4
6
퐶4
10
=
1
14,P(X=1) =
퐶3
6퐶1
4
퐶4
10
=
8
21,
P(X=2) =
퐶2
6퐶2
4
퐶4
10
=
3
7,P(X=3) =
퐶1
6퐶3
4
퐶4
10
=
4
35,P(X=4) =
퐶4
4
퐶4
10
=
1
210,
X 的分布列如下
X 0 1 2 3 4
P
1
14
8
21
3
7
4
35
1
210
E(X)=0 ×
1
14 + 1 ×
8
21 + 2 ×
3
7 +3 ×
4
35 +4 ⋅
1
210 = 1.6.
5.在贯彻中共中央、国务院关于精准扶贫政策的过程中,某单位在某市定点帮扶某村 100
户贫困户.为了做到精准帮扶,工作组对这 100 户村民的年收入情况、危旧房情况、患
病情况等进行调查,并把调查结果转化为各户的贫困指标 x.将指标 x 按照[0,0.2),
[0.2,0.4),[0.4,0.6),[0.6,0.8),[0.8,1.0]分成五组,得到如图所示的频率分布直方
图.规定若 0≤x<0.6,则认定该户为“绝对贫困户”,否则认定该户为“相对贫困户”;
当 0≤x<0.2 时,认定该户为“亟待帮住户”.工作组又对这 100 户家庭的受教育水平进
行评测,家庭受教育水平记为“良好”与“不好”两种.
(1)完成下面的列联表,并判断是否有 95%的把握认为绝对贫困户数与受教育水平不好
有关:
受教育水平良好 受教育水平不好 总计
绝对贫困户 2
相对贫困户 52总计 100
(2)上级部门为了调查这个村的特困户分布情况,在贫困指标处于[0,0.4)的贫困户中,
随机选取两户,用 X 表示所选两户中“亟待帮助户”的户数,求 X 的分布列和数学期望
EX.
附:퐾2 =
푛(푎푑 ― 푏푐)2
(푎 + 푏)(푐 + 푑)(푎 + 푐)(푏 + 푑),其中 n=a+b+c+d.
P(K2≥k0) 0.15 0.10 0.05 0.025
k0 2.072 2.706 3.841 5.024
【 解 答 】 解 : ( 1 ) 由 如 图 所 示 的 频 率 分 布 直 方 图 可 得 0 ≤ x < 0.6 的 概 率 p1 =
(0.25+0.50+0.75)×0.2=0.3,所以 100 户家庭的“绝对贫困户”由 100×0.3=30,由
(1)的表可得“受教育水平不好”的由 30﹣2=28,
由题意可得“相对贫困户”由 100﹣30=70,由表可得“受教育水平良好的”有 70﹣52=
18 , 所 以 表 的 值 为 下 表 :
;
因为 k2 =
100(2 × 52 ― 18 × 28)2
20 × 80 × 70 × 30 = 4.762>3.841,
所以有 95%的把握认为绝对贫困户数与受教育水平不好有关;(2)由题意可得 100 户家庭中由“亟待帮住户”有 100×0.25×0.2=5 户,
[0,0.4)的贫困户有:100×(0.25+0.5)×0.2=15,
由题意可得随机变量 X 的可能取值为:0,1,2,
p(x=0) =
퐶2
10 ⋅ 퐶0
5
퐶2
15
=
3
7,p(x=1) =
퐶1
10 ⋅ 퐶1
5
퐶2
15
=
10
21,p(x=2) =
퐶0
10 ⋅ 퐶2
5
퐶2
15
=
2
21,
所以 X 的分布列为: ,
所以数学期望 EX=0•3
7 + 1 ⋅
10
21 + 2 ⋅
2
21 =
2
3.
6.近几年一种新奇水果深受广大消费者的喜爱,一位农户发挥聪明才智,把这种露天种植
的新奇水果搬到了大棚里,收到了很好的经济效益.根据资料显示,产出的新奇水果的
箱数 x(单位:十箱)与成本 y(单位:千元)的关系如下:
x 1 3 4 6 7
y 5 6.5 7 7.5 8
y 与 x 可用回归方程
^
푦 = 푏푙푔푥 +
^
푎(其中
^
푎,
^
푏为常数)进行模拟.
(Ⅰ)若该农户产出的该新奇水果的价格为 150 元/箱,试预测该新奇水果 100 箱的利润
是多少元.(利润=售价﹣成本)
(Ⅱ)据统计,10 月份的连续 16 天中该农户每天为甲地可配送的该新奇水果的箱数的频
率分布直方图如图,用这 16 天的情况来估计相应的概率.一个运输户拟购置 n 辆小货车
专门运输该农户为甲地配送的该新奇水果,一辆货车每天只能运营一趟,每辆车每趟最
多只能装载 40 箱该新奇水果,满载发车,否则不发车.若发车,则每辆车每趟可获利 500
元;若未发车,则每辆车每天平均亏损 200 元.试比较 n=3 和 n=4 时此项业务每天的
利润平均值的大小.参考数据与公式:设 t=lgx,则
푡 푦 5
푖=1
(푡푖 ― 푡)(푦푖 ― 푦)
5
푖=1
(푡푖 ― 푡)2
0.54 6.8 1.53 0.45
线性回归直线
^
푦 = 푏푙푔푥 +
^
푎中,푏 =
푛
푖=1 (푡푖 ― 푡)(푦푖 ― 푦)
푛
푖=1 (푡푖 ― 푡)2
,
^
푎 = 푦 ― 푏푡.
【解答】解:(Ⅰ)根据题意,푏 =
5
푖=1 (푡푖 ― 푡)(푦푖 ― 푦)
5
푖=1 (푡푖 ― 푡)2
=
1.53
0.45 = 3.4,
所以푎 = 푦 ― 푏푡 = 6.8﹣3.4×0.54=4.964,
所以푦 = 3.4t+4.964.
又 t=lgx,所以푦 = 3.4lgx+4.964.
所以 x=10 时,푦 = 3.4+4.964=8.364(千元),
即该新奇水果 100 箱的成本为 8364 元,故该新奇水果 100 箱的利润 15000﹣8364=
6636.
(Ⅱ)根据频率分布直方图,可知该农户每天可配送的该新奇水果的箱数的概率分布表
为:
箱数 [40,80) [80,120) [120,160) [160,200]P 1
8
1
4
1
2
1
8
设该运输户购 3 辆车和购 4 辆车时每天的利润分别为 Y1,Y2 元.
则 Y1 的可能取值为 1500,800,100,其分布列为:
Y1 1500 800 100
P 5
8
1
4
1
8
故 E(Y1) =
5
8 × 1500 +
1
4 × 800 +
1
8 × 100 = 1150.
Y2 的可能取值为 2000,1300,600,﹣100,其分布列为:
Y2 2000 1300 600 ﹣100
P 1
8
1
2
1
4
1
8
故 E(Y2) =
1
8 × 2000 +
1
2 × 1300 +
1
4 × 600 +
1
8 × ( ― 100) = 1037.5.
故$E({Y}_{2}),即购置 3 辆小货车的利润平均值大于购置 4 辆小货车的利润平均值.
7.郴州某超市计划按月订购一种饮料,每天进货量相同,进货成本每瓶 6 元,售价每瓶 8
元,未售出的饮料降价处理,以每瓶 3 元的价格当天全部处理完.根据往年销售经验,
每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于 25,需求量为 500
瓶;如果最高气温位于区间[20,25),需求量为 300 瓶;如果最高气温低于 20,需求量
为 200 瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得
下面的频数分布表:
最高气温 [10,15) [15,20) [20,25) [25,30) [30,35) [35,40)
天数 2 16 36 25 7 4以最高气温位于各区间的频率估计最高气温位于该区间的概率.
(Ⅰ)求六月份这种饮料一天的需求量 X(单位:瓶)的分布列;
(Ⅱ)设六月份一天销售这种饮料的利润为 Y(单位:元),当六月份这种饮料一天的进
货量 n(单位:瓶)为多少时,Y 的数学期望达到最大值?
【解答】解:(Ⅰ)易知需求量 X 可取 200,300,500,
P(X=200) =
2 + 16
30 × 3 =
1
5;
P(X=300) =
36
30 × 3 =
2
5;
P(X=500) =
25 + 7 + 4
30 × 3 =
2
5;
则分布列为:
X 200 300 500
P
1
5
2
5
2
5
(Ⅱ)①当 n≤200 时,Y=n(8﹣6)=2n,此时 Ymax=400,当 n=200 时取得.
②当 200<n≤300 时,Y =
4
5 ⋅ 2푛 +
1
5[200×2+(n﹣200)•(﹣3)] =
8
5푛 +
1000 ― 3푛
5 =
5푛 + 1000
5 + n+200,
此时 Ymax=500,当 n=300 时取到,
③当 300<n≤500 时,
Y =
1
5[200×2+(n﹣200)•(﹣3)]+
2
5[300×2+(n﹣300)•(﹣3)]+
2
5 ⋅ 푛 ⋅ 2 =
4000 ― 5푛
5
= 800﹣n,
此时 Y<500.
④当 n≥500 时,易知 Y 一定小于③的情况.综上所述,当 n=300 时,Y 取到最大值为 500.
【真题演练】
1.【2020 年高考全国Ⅰ卷理数】某校一个课外学习小组为研究某作物种子的发芽率 y 和温
度 x(单位:°C)的关系,在 20 个不同的温度条件下进行种子发芽实验,由实验数据
得到下面的散点图:
由此散点图,在 10°C 至 40°C 之间,下面四个回归方程类型中最适宜作为发芽率 y 和温
度 x 的回归方程类型的是
A. B.
C. D.
【答案】D
【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率 和温度 的回归方程类型的是 .
故选:D.
【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.
2.【2020 年高考全国 II 卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每
( , )( 1,2, ,20)i ix y i =
y a bx= + 2y a bx= +
exy a b= + lny a b x= +
y x lny a b x= +天能完成 1200 份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多
志愿者踊跃报名参加配货工作.已知该超市某日积压 500 份订单未配货,预计第二天的
新订单超过 1600 份的概率为 0.05,志愿者每人每天能完成 50 份订单的配货,为使第二
天完成积压订单及当日订单的配货的概率不小于 0.95,则至少需要志愿者
A.10 名 B.18 名
C.24 名 D.32 名
【答案】B
【解析】由题意,第二天新增订单数为 ,设需要志愿者 x 名,
, ,故需要志愿者 名.
故选:B
【点晴】本题主要考查函数模型的简单应用,属于基础题.
3.【2020年高考全国III卷理数】在一组样本数据中,1,2,3,4出现的频率分别为 ,
且 ,则下面四种情形中,对应样本的标准差最大的一组是
A. B.
C. D.
【答案】B
【解析】对于 A 选项,该组数据的平均数为 ,
方差为 ;
对于 B 选项,该组数据的平均数为 ,
方差为 ;
500 1600 1200 900+ − =
50 0.95900
x ≥ 17.1x ≥ 18
1 2 3 4, , ,p p p p
4
1
1i
i
p
=
=∑
1 4 2 30.1, 0.4p p p p= = = = 1 4 2 30.4, 0.1p p p p= = = =
1 4 2 30.2, 0.3p p p p= = = = 1 4 2 30.3, 0.2p p p p= = = =
( ) ( )1 4 0.1 2 3 0.4 2.5Ax = + × + + × =
( ) ( ) ( ) ( )2 2 2 22 1 2.5 0.1 2 2.5 0.4 3 2.5 0.4 4 2.5 0.1 0.65As = − × + − × + − × + − × =
( ) ( )1 4 0.4 2 3 0.1 2.5Bx = + × + + × =
( ) ( ) ( ) ( )2 2 2 22 1 2.5 0.4 2 2.5 0.1 3 2.5 0.1 4 2.5 0.4 1.85Bs = − × + − × + − × + − × =对于 C 选项,该组数据的平均数为 ,
方差为 ;
对于 D 选项,该组数据的平均数为 ,
方差为 .
因此,B 选项这一组 标准差最大.
故选:B.
【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础
题.
4.【2020 年高考山东】某中学的学生积极参加体育锻炼,其中有 96%的学生喜欢足球或游
泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生
数占该校学生总数的比例是
A.62% B.56%
C.46% D.42%
【答案】C
【解析】记“该中学学生喜欢足球”为事件 ,“该中学学生喜欢游泳”为事件 ,则“该中
学学生喜欢足球或游泳”为事件 ,“该中学学生既喜欢足球又喜欢游泳”为事件 ,
则 , , ,
所以
所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为 .
故选:C.
【点睛】本题考查了积事件的概率公式,属于基础题.
的
( ) ( )1 4 0.2 2 3 0.3 2.5Cx = + × + + × =
( ) ( ) ( ) ( )2 2 2 22 1 2.5 0.2 2 2.5 0.3 3 2.5 0.3 4 2.5 0.2 1.05Cs = − × + − × + − × + − × =
( ) ( )1 4 0.3 2 3 0.2 2.5Dx = + × + + × =
( ) ( ) ( ) ( )2 2 2 22 1 2.5 0.3 2 2.5 0.2 3 2.5 0.2 4 2.5 0.3 1.45Ds = − × + − × + − × + − × =
A B
A B+ A B⋅
( ) 0.6P A = ( ) 0.82P B = ( ) 0.96P A B+ =
( )P A B⋅ = ( ) ( ) ( )P A P B P A B+ − + 0.6 0.82 0.96 0.46= + − =
46%5.【2020 年高考山东】信息熵是信息论中的一个重要概念.设随机变量 X 所有可能的取值为
, 且 , 定 义 X 的 信 息 熵
.
A.若 n=1,则 H(X)=0
B.若 n=2,则 H(X)随着 的增大而增大
C.若 ,则 H(X)随着 n 的增大而增大
D . 若 n=2m , 随 机 变 量 Y 所 有 可 能 的 取 值 为 , 且
,则 H(X)≤H(Y)
【答案】AC
【解析】对于 A 选项,若 ,则 ,所以 ,所以
A 选项正确.
对于 B 选项,若 ,则 , ,
所以 ,
当 时, ,
当 时, ,
两者相等,所以 B 选项错误.
对于 C 选项,若 ,则
,
1,2, ,n
1
( ) 0( 1,2, , ), 1
n
i i
i
P X i p i n p
=
= = > = =∑
2
1
( ) log
n
i i
i
H X p p
=
= −∑
1p
1 ( 1,2, , )ip i nn
= =
1,2, ,m
2 1( ) ( 1,2, , )j m jP Y j p p j m+ −= = + =
1n = 11, 1i p= = ( ) ( )21 log 1 0H X = − × =
2n = 1,2i = 2 11p p= −
( ) ( ) ( )1 2 1 1 2 1log 1 log 1H X p p p p= − ⋅ + − ⋅ −
1
1
4p = ( ) 2 2
1 1 3 3log log4 4 4 4H X = − ⋅ + ⋅
1
3p 4
= ( ) 2 2
3 3 1 1log log4 4 4 4H X = − ⋅ + ⋅
( )1 1,2, ,ip i nn
= =
( ) 2 2 2
1 1 1log log logH X n nn n n
= − ⋅ × = − = 则 随着 的增大而增大,所以 C 选项正确.
对于 D 选项,若 ,随机变量 的所有可能的取值为 ,且
( ).
.
由于 ,所以 ,所以
,
所以 ,
所以 ,所以 D 选项错误.
故选:AC
【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题
的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.
6.【2020 年高考江苏】已知一组数据 的平均数为 4,则 的值是
▲ .
( )H X n
2n m= Y 1,2, ,m
( ) 2 1j m jP Y j p p + −= = + 1,2, ,j m=
( ) 2 2
2 2
1 1
1log log
m m
i i i
i i i
H X p p p p= =
= − ⋅ = ⋅∑ ∑
1 2 2 2 2 1 2 2 2
1 2 2 1 2
1 1 1 1log log log logm m
m m
p p p pp p p p−
−
= ⋅ + ⋅ + + ⋅ + ⋅
( )H Y =
( ) ( ) ( )1 2 2 2 2 1 2 1 2
1 2 2 2 1 1
1 1 1log log logm m m m
m m m m
p p p p p pp p p p p p− +
− +
+ ⋅ + + ⋅ + + + ⋅+ + +
1 2 2 2 2 1 2 2 2
1 2 2 2 1 2 2 1 1 2
1 1 1 1log log log logm m
m m m m
p p p pp p p p p p p p−
− −
= ⋅ + ⋅ + + ⋅ + ⋅+ + + +
( )0 1,2, ,2ip i m> =
2 1
1 1
i i m ip p p + −
> +
2 2
2 1
1 1log log
i i m ip p p + −
> +
2 2
2 1
1 1log logi i
i i m i
p pp p p + −
⋅ > ⋅ +
( ) ( )H X H Y>
4,2 ,3 ,5,6a a− a【答案】2
【解析】∵数据 的平均数为 4
∴ ,即 .
故答案为:2.
【点睛】本题主要考查平均数的计算和应用,比较基础.
7.【2020 年高考江苏】将一颗质地均匀的正方体骰子先后抛掷 2 次,观察向上的点数,则
点数和为 5 的概率是_____.
【答案】
【解析】根据题意可得基本事件数总为 个.
点数和为 5 的基本事件有 , , , 共 4 个.
∴出现向上的点数和为 5 的概率为 .
故答案为: .
【点睛】本题考查概率的求法,考查古典概型、列举法等基础知识,考查运算求解能力,
是基础题.
8.【2020 年高考天津】从一批零件中抽取 80 个,测量其直径(单位: ),将所得数据
分为 9 组:
,并整理得到如下频率分布直方图,则在被抽取的零件中,直
径落在区间 内的个数为
4,2 ,3 ,5,6a a−
4 2 3 5 6 20a a+ + − + + = 2a =
1
9
6 6 36× =
( )1,4 ( )4,1 ( )2,3 ( )3,2
4 1
36 9P = =
1
9
mm
[5.31,5.33),[5.33,5.35), ,
[5.45,5.47),[5.47,5.49]
[5.43,5.47)A.10 B.18
C.20 D.36
【答案】B
【 解 析 】 根 据 直 方 图 , 直 径 落 在 区 间 之 间 的 零 件 频 率 为 :
,
则区间 内零件的个数为: .
故选:B.
【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题.
9.【2020 年高考天津】已知甲、乙两球落入盒子的概率分别为 和 .假定两球是否落入
盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落
入盒子的概率为_________.
[ )5.43,5.47
( )6.25 5.00 0.02 0.225+ × =
[ )5.43,5.47 80 0.225 18× =
1
2
1
3【答案】
【解析】甲、乙两球落入盒子的概率分别为 ,
且两球是否落入盒子互不影响,
所以甲、乙都落入盒子 概率为 ,
甲、乙两球都不落入盒子的概率为 ,
所以甲、乙两球至少有一个落入盒子的概率为 .
故答案为: ; .
【点睛】本题主要考查独立事件同时发生的概率,以及利用对立事件求概率,属于基础
题.
10.【2020 年高考浙江】盒中有 4 个球,其中 1 个红球,1 个绿球,2 个黄球.从盒中随机
取球,每次取 1 个,不放回,直到取出红球为止.设此过程中取到黄球的个数为 ,则
_______, _______.
【答案】 ,
【解析】因为 对应事件为第一次拿红球或第一次拿绿球,第二次拿红球,
所以 ,
随机变量 ,
,
,
的
1
6
2
3
1 1,2 3
1 1 1
2 3 6
× =
1 1 1(1 ) (1 )2 3 3
− × − =
2
3
1
6
2
3
ξ
( 0)P ξ = = ( )E ξ =
1
3 1
0ξ =
1 1 1 1( 0) 4 4 3 3P ξ = = + × =
0,1,2ξ =
2 1 2 1 1 1 2 1 1( 1) 4 3 4 3 2 4 3 2 3P ξ = = × + × × + × × =
1 1 1( 2) 1 3 3 3P ξ = = − − =所以 .
故答案为: .
【点睛】本题考查古典概型概率、互斥事件概率加法公式、数学期望,考查基本分析求
解能力,属基础题.
11.【2020 年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:
累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者
与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩
余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.
经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为 ,
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
【解析】(1)甲连胜四场的概率为 .
(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.
比赛四场结束,共有三种情况:
甲连胜四场的概率为 ;
乙连胜四场的概率为 ;
丙上场后连胜三场的概率为 .
所以需要进行第五场比赛的概率为 .
(3)丙最终获胜,有两种情况:
1 1 1( ) 0 1 2 13 3 3E ξ = × + × + × =
1;13
1
2
1
16
1
16
1
16
1
8
1 1 1 31 16 16 8 4
− − − =比赛四场结束且丙最终获胜的概率为 .
比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有
三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为 , , .
因此丙最终获胜的概率为 .
12.【2020 年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动
物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,
从这些地块中用简单随机抽样的方法抽取 20 个作为样区,调查得到样本数据(xi,
yi)(i=1,2,…,20),其中 xi 和 yi 分别表示第 i 个样区的植物覆盖面积(单位:公顷)和这
种 野 生 动 物 的 数 量 , 并 计 算 得 , , ,
, .
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种
野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi) (i=1,2,…,20)的相关系数(精确到 0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获
得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说
明理由.
附:相关系数 , .
【解析】(1)由已知得样本平均数 ,从而该地区这种野生动物数量的
估计值为 60×200=12000.
1
8
1
16
1
8
1
8
1 1 1 1 7
8 16 8 8 16
+ + + =
20
1
60
i
ix
=
=∑ 20
1
1200
i
iy
=
=∑ 20
2
1
) 8( 0i
i
x x
=
− =∑
20
2
1
) 9000(
i
i yy
=
− =∑ 20
1
)( ) 800( i i
i
yyxx
=
− − =∑
1
2 2
1 1
)
(
( )
( )
(
)
i i
i
n
i
n
i
i
n
i
x y
r
x y
x y
x y
=
= =
− −
− −
=
∑
∑ ∑ 2 1.414≈
20
1
601
20 i
iy y
=
== ∑(2)样本 的相关系数
.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对 200 个地块进行分层抽
样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由
于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用
分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从
而可以获得该地区这种野生动物数量更准确的估计.
13.【2020 年高考全国 III 卷理数】某学生兴趣小组随机调查了某市 100 天中每天的空气质
量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
锻炼人次
空气质量等级
[0,200] (200,400] (400,600]
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为 1,2,3,4 的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点
值为代表);
(3)若某天的空气质量等级为 1 或 2,则称这天“空气质量好”;若某天的空气质量等
( , )i ix y ( 1,2, ,20)i =
20
1
20 20
2 2
1 1
)( ) 800 2 2 0.94380 900( 0) )
(
(
i
i
i
i
i i
i
x y y
x
x
r
x yy
=
= =
− −
= = = ≈
×− −
∑
∑ ∑级为 3 或 4,则称这天“空气质量不好”.根据所给数据,完成下面的 2×2 列联表,并根
据列联表,判断是否有 95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质
量有关?
人次≤400 人次>400
空气质量好
空气质量不好
P(K2≥k) 0.050 0.010
0.001
附:K2= ,
k 3.841 6.635
10.828
.
【解析】(1)由所给数据,该市一天的空气质量等级为 1,2,3,4 的概率的估计值如
下表:
空气质量等级 1 2 3 4
概率的估计值 0.43 0.27 0.21 0.09
(2)一天中到该公园锻炼的平均人次的估计值为
.
(3)根据所给数据,可得 列联表:
人次≤400 人次>400
空气质量好 33 37
空气质量不好 22 8
根据列联表得
.
( )
( ) ( )( )
2
)
n ad bc
a b c d a c b d
−
+ + + +
1 (100 20 300 35 500 45) 350100
× + × + × =
2 2×
2
2 100 (33 8 22 37) 5.82055 45 70 30K
× × − ×= ≈× × ×由于 ,故有 95%的把握认为一天中到该公园锻炼的人次与该市当天的空气
质量有关.
14.【2020 年高考山东】
为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了
天空气中的 和 浓度(单位: ),得下表:
32 18 4
6 8 12
3 7 10
(1)估计事件“该市一天空气中 浓度不超过 ,且 浓度不超过 ”的概率;
(2)根据所给数据,完成下面的 列联表:
(3)根据(2)中的列联表,判断是否有 的把握认为该市一天空气中 浓度
与 浓度有关?
附: ,
5.820 3.841>
100 PM2.5 2SO 3μg/m
2SO
PM2.5
[0,50] (50,150] (150,475]
[0,35]
(35,75]
(75,115]
PM2.5 75 2SO 150
2 2×
2SO
PM2.5
[0,150] (150,475]
[0,75]
(75,115]
99% PM2.5
2SO
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
−= + + + +0.050 0.010 0.001
3.841 6.635 10.828
【解析】(1)根据抽查数据,该市 100 天的空气中 PM2.5 浓度不超过 75,且 浓度
不超过 150 的天数为 ,因此,该市一天空气中 PM2.5 浓度不超过 75,且
浓度不超过 150 的概率的估计值为 .
(2)根据抽查数据,可得 列联表:
64 16
10 10
(3)根据(2)的列联表得 .
由于 ,故有 的把握认为该市一天空气中 浓度与 浓度有
关.
15.【2020 年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方
案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得
数据如下表:
男生 女生
支持 不支持 支持 不支持
方案一 200 人 400 人 300 人 100 人
2( )P K k≥
k
2SO
32 18 6 8 64+ + + =
2SO 64 0.64100
=
2 2×
2SO
PM2.5
[0,150] (150,475]
[0,75]
(75,115]
2
2 100 (64 10 16 10) 7.48480 20 74 26K
× × − ×= ≈× × ×
7.484 6.635> 99% PM2.5 2SO方案二 350 人 250 人 150 人 250 人
假设所有学生对活动方案是否支持相互独立.
(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;
(Ⅱ)从该校全体男生中随机抽取 2 人,全体女生中随机抽取 1 人,估计这 3 人中恰有
2 人支持方案一的概率;
(Ⅲ)将该校学生支持方案的概率估计值记为 ,假设该校年级有 500 名男生和 300
名女生,除一年级外其他年级学生支持方案二的概率估计值记为 ,试比较 与 的
大小.(结论不要求证明)
【解析】(Ⅰ)该校男生支持方案一的概率为 ,
该校女生支持方案一的概率为 ;
(Ⅱ)3 人中恰有 2 人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)
仅有一个男生支持方案一,一个女生支持方案一,
所以 3 人中恰有 2 人支持方案一概率为: ;
(Ⅲ)
【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属
基础题.
0p
1p 0p 1p
200 1
200+400 3
=
300 3
300+100 4
=
2 1
2
1 3 1 1 3 13( ) (1 ) ( )(1 )3 4 3 3 4 36C− + − =
01p p