概率与统计
热点一 常见概率模型的概率
几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.
【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏.
(1)求这4个人中恰有2人去参加甲游戏的概率;
(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率;
(3)用X,Y分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X-Y|,求随机变量ξ的分布列.
解 依题意,这4个人中,每个人去参加甲游戏的概率为,去参加乙游戏的概率为.
设“这4个人中恰有i人去参加甲游戏”为事件Ai(i=0,1,2,3,4).
则P(Ai)=C.
(1)这4个人中恰有2人去参加甲游戏的概率
P(A2)=C=.
(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B,则B=A3+A4,且A3与A4互斥,
∴P(B)=P(A3+A4)=P(A3)+P(A4)=C×+C=.
(3)依题设,ξ的所有可能取值为0,2,4.
且A1与A3互斥,A0与A4互斥.
则P(ξ=0)=P(A2)=,
P(ξ=2)=P(A1+A3)=P(A1)+P(A3)
=C·+C×=,
P(ξ=4)=P(A0+A4)=P(A0)+P(A4)
=C+C=.
所以ξ的分布列是
ξ
0
2
4
P
【类题通法】(1)本题4个人中参加甲游戏的人数服从二项分布,由独立重复试验,4人中恰有i人参加甲游戏的概率P=C,这是本题求解的关键.
(2)解题中常见的错误是不能分清事件间的关系,选错概率模型,特别是在第(3)问中,不能把ξ=0,2,4的事件转化为相应的互斥事件Ai的概率和.
【对点训练】甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为,,,乙队每人答对的概率都是,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分.
(1)求ξ=2的概率;
(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率.
解 (1)ξ=2,则甲队有两人答对,一人答错,
故P(ξ=2)=××+××+××=;
(2)设甲队和乙队得分之和为4为事件A,甲队比乙队得分高为事件B.设乙队得分为η,则η~B.
P(ξ=1)=××+××+××=,
P(ξ=3)=××=,
P(η=1)=C··=,
P(η=2)=C··=,
P(η=3)=C=,
∴P(A)=P(ξ=1)P(η=3)+P(ξ=2)P(η=2)+P(ξ=3)·P(η=1)
=×+×+×=,
P(AB)=P(ξ=3)·P(η=1)=×=,
∴所求概率为P(B|A)===.
热点二 离散型随机变量的分布列、均值与方差
离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,每年均有解答题的考查,属于中档题.复习中应强化应用题目的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中强化解答题的规范性训练.
【例2】甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为,乙获胜的概率为,各局比赛结果相互独立.
(1)求甲在4局以内(含4局)赢得比赛的概率;
(2)记X为比赛决出胜负时的总局数,求X的分布列和均值(数学期望).
解 用A表示“甲在4局以内(含4局)赢得比赛”,Ak表示“第k局甲获胜”,Bk
表示“第k局乙获胜”,则P(Ak)=,P(Bk)=,k=1,2,3,4,5.
(1)P(A)=P(A1A2)+P(B1A2A3)+P(A1B2A3A4)
=P(A1)P(A2)+P(B1)P(A2)P(A3)+P(A1)P(B2)·
P(A3)P(A4)
=+×+××=.
(2)X的可能取值为2,3,4,5.
P(X=2)=P(A1A2)+P(B1B2)=P(A1)P(A2)+P(B1)·P(B2)=,
P(X=3)=P(B1A2A3)+P(A1B2B3)
=P(B1)P(A2)P(A3)+P(A1)P(B2)P(B3)=,
P(X=4)=P(A1B2A3A4)+P(B1A2B3B4)
=P(A1)P(B2)P(A3)P(A4)+P(B1)P(A2)P(B3)P(B4)=,
P(X=5)=1-P(X=2)-P(X=3)-P(X=4)=.
故X的分布列为
X
2
3
4
5
P
E(X)=2×+3×+4×+5×=.
【类题通法】求离散型随机变量的均值和方差问题的一般步骤
第一步:确定随机变量的所有可能值;
第二步:求每一个可能值所对应的概率;
第三步:列出离散型随机变量的分布列;
第四步:求均值和方差;
第五步:反思回顾.查看关键点、易错点和答题规范.
【对点训练】为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,
球上所标的面值之和为该顾客所获的奖励额.
(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元.求:
①顾客所获的奖励额为60元的概率;
②顾客所获的奖励额的分布列及数学期望;
(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.
解 (1)设顾客所获的奖励额为X.
①依题意,得P(X=60)==,
即顾客所获的奖励额为60元的概率为.
②依题意,得X的所有可能取值为20,60.
P(X=60)=,P(X=20)==,
即X的分布列为
X
20
60
P
所以顾客所获的奖励额的数学期望为E(X)=20×+60×=40(元).
(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.
对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.
以下是对两个方案的分析:
对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1
的分布列为
X1
20
60
100
P
X1的数学期望为E(X1)=20×+60×+100×=60(元),
X1的方差为D(X1)=(20-60)2×+(60-60)2×+(100-60)2×=.
对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为
X2
40
60
80
P
X2的数学期望为E(X2)=40×+60×+80×=60(元),
X2的方差为D(X2)=(40-60)2×+(60-60)2×+(80-60)2×=.
由于两种方案的奖励额的数学期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.
热点三 概率与统计的综合应用
概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.
【例3】2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示:
(1)分别求出成绩在第3,4,5组的人数;
(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽取6人进行面试.
①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率;
②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.
解 (1)由频率分布直方图知:
第3组的人数为5×0.06×40=12.
第4组的人数为5×0.04×40=8.
第5组的人数为5×0.02×40=4.
(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人.
①设“甲或乙进入第二轮面试”为事件A,则
P(A)=1-=,
所以甲或乙进入第二轮面试的概率为.
②X的所有可能取值为0,1,2,
P(X=0)==,P(X=1)==,
P(X=2)==.
所以X的分布列为
X
0
1
2
P
E(X)=0×+1×+2×==.
【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看懂频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中X服从超几何分布.
【对点训练】某公司为了解用户对某产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地区:73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
解 (1)两地区用户满意度评分的茎叶图如下
通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.
(2)记CA1表示事件:“A地区用户的满意度等级为满意或非常满意”;
CA2表示事件:“A地区用户的满意度等级为非常满意”;
CB1表示事件:“B地区用户的满意度等级为不满意”;
CB2表示事件:“B地区用户的满意度等级为满意”,
则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,
C=CB1CA1∪CB2CA2.
P(C)=P(CB1CA1∪CB2CA2)
=P(CB1CA1)+P(CB2CA2)
=P(CB1)P(CA1)+P(CB2)P(CA2).
由所给数据得CA1,CA2,CB1,CB2发生的频率分别为,,,,即P(CA1)=,P(CA2)=,P(CB1)=,P(CB2)=,故P(C)=×+×=0.48.
热点四 统计与统计案例
能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.
【例4】从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,x=720.
(1)求家庭的月储蓄y对月收入x的线性回归方程=x+;
(2)判断变量x与y之间是正相关还是负相关;
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:线性回归方程=x+中,=,=y- ,其中,为样本平均值.
解 (1)由题意知n=10,=xi==8,
=yi==2,
又lxx=x-n 2=720-10×82=80,
lxy=xiyi-n=184-10×8×2=24,
由此得===0.3,
=y-=2-0.3×8=-0.4,
故所求线性回归方程为=0.3x-0.4.
(2)由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.
(3)将x=7代入回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).
【类题通法】(1)分析两个变量的线性相关性,可通过计算相关系数r来确定,r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表明两变量线性相关性越弱.
(2)求线性回归方程的关键是正确运用,的公式进行准确的计算.
【对点训练】4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解本校学生课外阅读情况,学校随机抽取了100名学生对其课外阅读时间进行调查.下面是根据调查结果绘制的学生日均课外阅读时间(单位:分钟)的频率分布直方图.若将日均课外阅读时间不低于60分钟的学生称为“读书迷”,
低于60分钟的学生称为“非读书迷”.
(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为“读书迷”与性别有关?
非读书迷
读书迷
总计
男
15
女
45
总计
(2)将频率视为概率.现在从该校大量学生中,用随机抽样的方法每次抽取1人,共抽取3次,记被抽取的3人中的“读书迷”的人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X).
解 (1)完成2×2列联表如下:
非读书迷
读书迷
总计
男
40
15
55
女
20
25
45
总计
60
40
100
K2=≈8.249>6.635,
故有99%的把握认为“读书迷”与性别有关.
(2)将频率视为概率.则从该校学生中任意抽取1名学生恰为读书迷的概率P=.
由题意可知X~B,P(X=i)=C
(i=0,1,2,3).
X的分布列为
X
0
1
2
3
P
均值E(X)=np=3×=,
方差D(X)=np(1-p)=3××=.