天添资源网 http://www.ttzyw.com/
(六)概率与统计中的高考热点问题
[命题解读] 1. 统计与概率是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量,该类问题以应用题为载体,注重考查学生的数学建模及阅读理解能力、分类讨论与化归转化能力.
2.概率问题的核心是概率计算,其中事件的互斥、对立是概率计算的核心. 统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征,统计与概率内容相互渗透,背景新颖.
统计与统计案例
以统计图表或文字叙述的实际问题为载体,通过对相关数据的分析、抽象概括,作出估计、判断. 常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查学生的数据处理能力与运算能力及应用意识.
【例1】 已知某班n名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a,b,c成等差数列,且成绩在[90,100]内的有6人.
(1)求n的值;
(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析能否在犯错误的概率不超过0.10的前提下认为“本次测试的及格情况与性别有关”?
附:
P(K2≥k0)
0.10
0.05
0.010
0.005
k0
2.706
3.841
6.635
7.879
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
K2=.
[解] (1)依题意得
解得b=0.01.
因为成绩在[90,100]内的有6人,
所以n==60.
(2)由于2b=a+c,而b=0.01,可得a+c=0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,
设及格的人中,女生有x人,则男生有x-4人,于是x+x-4=48,解得x=26,故及格的人中,女生有26人,男生有22人.
于是本次测试的及格情况与性别的2×2列联表如下:
及格
不及格
总计
男
22
8
30
女
26
4
30
总计
48
12
60
所以K2==1.667<2.706,故不能在犯错误的概率不超过0.10的前提下认为“本次测试的及格情况与性别有关”.
[规律方法] 独立性检验的方法
(1)构造2×2列联表;
(2)计算K2;
(3)查表确定有多大的把握判定两个变量有关联.
易错提示:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k值与求得的K2相比较.另外,表中第一行数据表示两个变量没有关联的可能性p,所以其有关联的可能性为1-p.
近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表:
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
(1)请将如图的列联表补充完整.若用分层抽样的方法在患三高疾病的人群中抽9人,其中女生抽多少人?
(2)为了研究患三高疾病是否与性别有关,请计算出统计量K2的观测值k,并说明是否可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关.
患三高疾病
不患三高疾病
总计
男
6
30
女
总计
36
下面的临界值表供参考:
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(参考公式K2=,其中n=a+b+c+d)
[解] (1)完善补充列联表如下:
患三高疾病
不患三高疾病
总计
男
24
6
30
女
12
18
30
总计
36
24
60
在患三高疾病人群中抽9人,则抽取比例为=,
所以女性应该抽取12×=3(人).
(2)根据2×2列联表,则K2的观测值
k==10>7.879.
所以可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关.
常见概率模型的概率
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
概率应用题侧重于古典概型,主要考查随机事件、等可能事件、互斥事件、对立事件的概率. 解决简单的古典概型试题可用直接法(定义法),对于较为复杂的事件的概率,可以利用所求事件的性质将其转化为互斥事件或对立事件的概率求解.
【例2】 (2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率估计最高气温位于该区间的概率.
(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率.
(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.
[解] (1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为=0.6,所以这种酸奶一天的需求量不超过300瓶的概率的估计值为0.6.
(2)当这种酸奶一天的进货量为450瓶时,
若最高气温不低于25,则Y=6×450-4×450=900;
若最高气温位于区间[20,25),则Y=6×300+2(450-300)-4×450=300;
若最高气温低于20,则Y=6×200+2(450-200)-4×450=-100,
所以,Y的所有可能值为900,300,-100.
Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为=0.8,因此Y大于零的概率的估计值为0.8.
[规律方法] 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
某商场在元旦举行购物抽奖促销活动,规定顾客从装有编号为0,1,2,3,4的五个相同小球的抽奖箱中一次任意摸出两个小球,若取出的两个小球的编号之和等于7,则中一等奖,等于6或5,则中二等奖,等于4,则中三等奖,其余结果为不中奖.
(1)求中二等奖的概率;
(2)求不中奖的概率.
[解] (1)记“中二等奖”为事件A.
从五个小球中一次任意摸出两个小球,不同的结果有{0,1},{0,2},{0,3},{0,4},{1,2},{1,3},{1,4},{2,3},{2,4},{3,4},共10个基本事件.
记两个小球的编号之和为x,由题意可知,事件A包括两个互斥事件:
x=5,x=6.
事件x=5的取法有2种,即{1,4},{2,3},故P(x=5)==;
事件x=6的取法有1种,即{2,4},故P(x=6)=.
所以P(A)=P(x=5)+P(x=6)=+=.
(2)记“不中奖”为事件B,则“中奖”为事件,由题意可知,事件包括三个互斥事件:中一等奖(x=7),中二等奖(事件A),中三等奖(x=4).
事件x=7的取法有1种,即{3,4},故P(x=7)=;
事件x=4的取法有{0,4},{1,3},共2种,故P(x=4)==.
由(1)可知,P(A)=.
所以P()=P(x=7)+P(x=4)+P(A)=++=.
所以不中奖的概率为P(B)=1-P()=1-=.
统计与概率的综合应用
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
统计和概率知识相结合命题统计概率解答题已经是一个新的命题趋向,概率和统计知识初步综合解答题的主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键,在此基础上掌握好样本数字特征及各类概率的计算.
【例3】 (2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用
水量
[0,
0.1)
[0.1,
0.2)
[0.2,
0.3)
[0.3,
0.4)
[0.4,
0.5)
[0.5,
0.6)
[0.6,
0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用
水量
[0,
0.1)
[0.1,
0.2)
[0.2,
0.3)
[0.3,
0.4)
[0.4,
0.5)
[0.5,
0.6)
频数
1
5
13
10
16
5
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
[信息提取] 看到作频率分布直方图,想到作频率分布直方图的作图规则;
看到求概率,想到利用频率分布直方图求概率的方法;
看到估计节水量,想到求使用节水龙头前后的用水量.
[规范解答] (1)如图所示.
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
4分
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48, 6分
因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48. 7分
(3)该家庭未使用节水龙头50天日用水量的平均数为
1=(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48. 9分
该家庭使用了节水龙头后50天日用水量的平均数为
2=(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35. 11分
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3). 12分
[易错与防范] 作频率分布直方图时注意纵轴单位是“频率/组距”,计算平均数时运算要准确,避免“会而不对”的失误.
[通性通法] 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.
长时间用手机上网严重影响着学生的身体健康,某校为了解A,B两班学生手机上网的时长,分别从这两个班中随机抽取5名同学进行调查,将他们平均每周手机上网的时长作为样本绘制成茎叶图如图所示(图中的茎表示十位数字,叶表示个位数字).
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
(1)你能否估计哪个班级平均每周上网时间较长?
(2)从A班的样本数据中随机抽取一个不超过19的数据记为a,从B班的样本数据中随机抽取一个不超过21的数据记为b,求a>b的概率.
[解] (1)A班样本数据的平均值为(9+11+14+20+31)=17,
由此估计A班学生每周平均上网时间为17小时;
B班样本数据的平均值为(11+12+21+25+26)=19,
由此估计B班学生每周平均上网时间为19小时.
所以B班学生上网时间较长.
(2)A班的样本数据中不超过19的数据a有3个,分别为9,11,14,B班的样本数据中不超过21的数据b也有3个,分别为11,12,21.从A班和B班的样本数据中各随机抽取一个共有9种不同的情况,分别为(9,11),(9,12),(9,21),(11,11),(11,12),(11,21),(14,11),(14,12),(14,21),其中a>b的情况有(14,11),(14,12),2种,
故a>b的概率P=.
[大题增分专训]
1.某校高三期中考试后,数学教师对本次全部数学成绩按1∶20进行分层抽样,随机抽取了20名学生的成绩为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:
分数
段(分)
[50,70)
[70,90)
[90,110)
[110,130)
[130,150]
总计
频数
b
频率
a
0.25
(1)求表中a,b的值及成绩在[90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150]内为及格);
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
(2)若从茎叶图中成绩在[100,130)范围内的样本中一次性抽取两个,求取出两个样本数字之差的绝对值小于或等于10的概率.
[解] (1)由茎叶图知成绩在[50,70)范围内的有2人,在[110,130)范围内的有3人,
∴a=0.1,b=3.
∵成绩在[90,110)范围内的频率为1-0.1-0.25-0.25=0.4,
∴成绩在[90,110)范围内的样本数为20×0.4=8.
估计这次考试全校高三学生数学成绩的及格率为
P=1-0.1-0.25=0.65.
(2)所有可能的结果为
(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共21个,
取出的两个样本中数字之差小于或等于10的结果为(100,102),(100,106),(100,106),(102,106),(102,106),(106,106),(106,116),(106,116),(116,118),(118,128),共10个,
∴P(A)=.
2.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期
12月1日
12月2日
12月3日
12月4日
12月5日
温差x(℃)
10
11
13
12
8
发芽数
23
25
30
26
16
天添资源网 http://www.ttzyw.com/
天添资源网 http://www.ttzyw.com/
y(颗)
该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻的2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求y关于x的线性回归方程=x+;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?
(附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计分别为=
[解] (1)设抽到不相邻两组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况是等可能出现的,其中抽到相邻两组数据的情况共有4种,所以P(A)=1-=,故选取的2组数据恰好是不相邻的2天数据的概率为.
(2)由数据,求得=×(11+13+12)=12,
=×(25+30+26)=27,
=11×25+13×30+12×26=977,=112+132+122=434,
所以===,=27-×12=-3.
所以回归直线方程为=x-3.
(3)当x=10时,=22,|22-23|<2,同理当x=8时,=17,|17-16|