十年高考+大数据预测
专题 32 概率和统计【理】
十年大数据*全景展示
年 份 题号 考 点 考 查 内 容
理 2[来
源:Z.Com]
概率 古典概型的概率计算[来源:学。科。网][来源:学|科|网]
2011
理 19 频数分布表 频数分布表,频率与概率
理 15 正态分布 正态分布的应用
2012
理 19 离散型随机变量及其分布列 频数分布表,频率与概率,离散型随机变量及其分布列
理 3 抽样方法 随机抽样方法的简单应用
卷 1
理 19 离散型随机变量分布列、期望
独立重复事件发生的概率,离散型随机变量分布列、期
望
理 14 概率 古典概型的概率计算
2013
卷 2
理 19 概率 古典概型的概率计算
理 5 概率 古典概型的概率计算
卷 1
理 18 频率分布直方图,正态分布
频率分布直方图,正态分布的 3 原则,二项分布的期
望
理 5 概率 条件概率的计算
2014
卷 2
理 19 变量间的相关关系 线性回归方程及其应用
理 4 概率 独立重复事件概率的计算,互斥事件的概率
卷 1
理 19 变量间的相关关系 非线性拟合;线性回归方程
理 3 统计 统计知识,柱形图
2015
卷 2
理 18 茎叶图 茎叶图及其应用,互斥事件和独立事件的概率计算
理 4 概率 几何概型概率的计算
卷 1
理 19 离散型随机变量分布列、期望 条形统计图及其应用,离散型随机变量分布列、期望
理 10 概率 几何概型概率的计算
卷 2
理 19 离散型随机变量的分布列、期望 条件概率、离散型随机变量的分布列、期望
理 4 统计 平均数的计算,统计图及其应用
2016
卷 3
理 18 变量间的相关关系 线性相关与线性回归方程的求法与应用
理 2 概率 古典概型的概率计算
卷 1
理 19 离散性随机变量的分布列、期望 离散性随机变量的分布列、期望,正态分布
理 13 离散性随机变量的分布列、期望 离散性随机变量的分布列、期望,正态分布
卷 2
理 18 频率分布直方图,统计案例 频率分布直方图及其应用,统计案例及其应用
理 3 统计 折线图统计图的应用
2017
卷 3
理 18 离散型随机变量的分布列、期望 频数分布表,离散型随机变量的分布列、数学期望
σ
十年高考+大数据预测
理 3 统计 扇形统计图及其应用
理 10 概率 几何概型概率的计算,数学文化
卷 1
理 20 离散性随机变量的数学期望
次独立重复试验恰好发生 次的概率及其最值问题,
二项分布,离散性随机变量的数学期望
理 8 概率 古典概型的概率计算卷 2
理 18 变量间的相关关系 线性回归方程及其应用
理 8 二项分布 二项分布分布列及期望
2018
卷 3
理 18 茎叶图和独立性检验 茎叶图的应用,统计案例及其应用
理 6 概率 古典概型的概率计算
卷 1
理 15 概率 独立重复事件的概率
理 5 统计 中位数、平均数、方差、极差
理 13 概率 利用统计数据进行概率的估计卷 2
理 18 概率 独立事件、互斥事件的概率计算
理 3 统计 抽样数据的统计
2019
卷 3
理 17 频率分布直方图 频率分布直方图,用样本平均数估计总体的平均数
理 5 变量间的相关关系 由散点图选择合适的回归模型
卷 1
理 19 概率 独立事件、互斥事件及独立重复事件概率的计算
理 14 排列与组合 计数原理的应用,排列与组合应用题的解法
卷 2
理 18 变量间的相关关系 平均数的估计,相关系数的计算,抽样方法的选取
理 3 统计 标准差的计算
2020
卷 3
理 18 独立性检验 统计案例及其应用
大数据分析*预测高考
考 点 出现频率 2021 年预测
考点 107 随机抽样 23 次考 1 次
考点 108 用样本估计总体 23 次考 10 次
考点 109 变量间的相关关系 23 次考 7 次
考点 110 随机事件的概率、古典概型、几何概型 23 次考 20 次
考点111离散型随机变量及其分布列、均值与方差、
正态分布、二项分布
23 次考 14 次
考点 112 独立性检验 23 次考 4 次
2021 年在选择题和填空题中仍会重
点考查各种统计图表、古典概型或几
何概型及其概率计算,在解答题中重
点考查频率分布直方图及其应用(与
概率相结合),离散性随机变量的分
布列与均值,二项分布及其应用,统
计案例及其应用.
n k
十年高考+大数据预测
十年试题分类*探求规律
考点 107 随机抽样
1.(2017 江苏理)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件,
为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取 60 件进行检验,则应从丙种型号的产品
中抽取 件.
【答案】18【解析】应从丙种型号的产品中抽取 件.
2.(2014 广东理)为了解 1000 名学生的学习情况,采用系统抽样的方法,从中抽取容量为 40 的样本,则
分段的间隔为( )
A.50 B.40 C.25 D.20
【答案】C【解析】由 ,可得分段的间隔为 25.故选 C.
3.(2014 湖南理)对一个容器为 的总体抽取容量为 的样本,当选取简单随机抽样、系统抽样和分层抽
样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为 ,则( )
A. B. C. D.
【答案】D【解析】根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样方法,每个个
体被抽到的概率都是 ,故 ,故选 D.
4.(2013 新课标 I 理理)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进
行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况
差异不大,在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽 样 D.系统抽样
【答案】C【解析】因该地区小学、初中、高中三个学段学生的视力情况有较大差异,故最合理的抽样方法
是按学段分层抽样,故选 C.
5.(2014 湖北理)甲、乙两套设备生产的同类型产品共 4800 件,采用分层抽样的方法从中抽取一个容量为
80 的样本进行质量检测.若样本中有 50 件产品由甲设备生产,则乙设备生产的产品总数为 件.
【答案】1800【解析】分层抽样中各层的抽样比相同,样本中甲设备生产的有 50 件,则乙设备生产的有 30
件,在 4800 件产品中,甲、乙设备生产的产品总数比为 5:3,所以乙设备生产的产品总数为 1800 件.
6.(2014 天津理)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从
该校四个年级的本科生中抽取一个容量为 300 的样本进行调查.已知该校一年级、二年级、三年级、四年
30060 181000
× =
1000 2540
=
N n
1 2 3, ,p p p
1 2 3p p p= < 2 3 1p p p= < 1 3 2p p p= < 1 2 3p p p= = n N 1 2 3p p p= =
十年高考+大数据预测
级的本科生人数之比为 4:5:5:6,则应从一年级本科生中抽取_______名学生.
【答案】60【解析】应从一年级抽取 名.
7.(2012 江苏理)某学校高一、高二、高三年级的学生人数之比为 ,现用分层抽样的方法从该校高中三个
年级的学生中抽取容量为 50 的样本,则应从高二年级抽取 名学生.
【答案】15【解析】由题意得高二年级的学生人数占该学校高中人数的 ,利用分层抽样的有关知识得应
从高二年级抽取 50× =15 名学生.
8.(2012 浙江理)某个年级有男生 560 人,女生 420 人,用分层抽样的方法从该年级全体学生中抽取一个
容量为 280 的样本,则此样本中男生人数为____________.
【答案】160【解析】总体中男生与女生的比例为 ,样本中男生人数为 .
考点 108 用样本估计总体
9.(2020 全国Ⅲ文 3)设一组样本数据 的方差为 ,则数据 的方差
为 ( )
A. B. C. D.
【答案】C
【解析】因为数据 的方差是数据 的方差的 倍,
所以所求数据方差为 ,故选:C.
10.(2020 全国Ⅲ理 3)在一组样本数据中, 出现的频率分别为 ,且 ,
则下面四种情形中,对应样本的标准差最大的一组是 ( )
A. B.
C. D.
【答案】B
【解析】对于 A 选项,该组数据的平均数为 ,方差为
;对于 B 选项,该组数据的
平均数为 ,方差为
4:3 4280 1607
× =
4 604 5 5 6300´ =+ + +
3 3 4: :
10
3
10
3
1 2, , , nx x x 0.01 1 210 ,10 , ,10 nx x x
0.01 0.1 1 10
( 1,2, , )iax b i n+ = , ( 1,2, , )ix i n= , 2a
210 0.01=1×
1, 2 , 3 , 4 1 2 3 4, , ,p p p p ∑
=
=
4
1
1
i
ip
1 4 2 30.1, 0.4p p p p= = = = 1 4 2 30.4 , 0.1p p p p= = = =
1 4 2 30.2 , 0.3p p p p= = = = 1 4 2 30.3 , 0.2p p p p= = = =
( ) ( )1 4 0.1 2 3 0.4 2.5Ax = + × + + × =
( ) ( ) ( ) ( )2 2 2 22 1 2.5 0.1 2 2.5 0.4 3 2.5 0.4 4 2.5 0.1 0.65As = − × + − × + − × + − × =
( ) ( )1 4 0.4 2 3 0.1 2.5Bx = + × + + × =
十年高考+大数据预测
;对于 C 选项,该组数据的
平均数为 ,方差为
;对于 D 选项,该组数据
的平均数为 ,方差为
,因此 B 选项这一组的标
准差最大,故选 B.
11.(2020 天津 4)从一批零件中抽取 80 个,测量其直径(单位: ),将所得数据分为 9 组:
,并整理得到如下频率分布直方图,则在被抽取的零
件中,直径落在区间 内的个数为( )
A.10 B.18 C.20 D.36
【答案】B【解析】由题意可得,直径落在区间 之间的零件频率为: ,
则区间 内零件的个数为: ,故选 B.
12.(2019 全国 II 理 5)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个
原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个原始评分相比,不变的
数字特征是
A.中位数 B.平均数
C.方差 D.极差
【答案】A【解析】根据题意,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分,7 个
( ) ( ) ( ) ( )2 2 2 22 1 2.5 0.4 2 2.5 0.1 3 2.5 0.1 4 2.5 0.4 1.85Bs = − × + − × + − × + − × =
( ) ( )1 4 0.2 2 3 0.3 2.5Cx = + × + + × =
( ) ( ) ( ) ( )2 2 2 22 1 2.5 0.2 2 2.5 0.3 3 2.5 0.3 4 2.5 0.2 1.05Cs = − × + − × + − × + − × =
( ) ( )1 4 0.3 2 3 0.2 2.5Dx = + × + + × =
( ) ( ) ( ) ( )2 2 2 22 1 2.5 0.3 2 2.5 0.2 3 2.5 0.2 4 2.5 0.3 1.45Ds = − × + − × + − × + − × =
mm
[5.31,5.33),[5.33,5.35), ,[5.45,5.47],[5.47,5.49]
[5.43,5.47)
[ )5.43,5.47 ( )6.25 5.00 0.02 0.225+ × =
[ )5.43,5.47 80 0.225 18× =
十年高考+大数据预测
有效评分与 9 个原始评分相比,最中间的一个数不变,即中位数不变.故选 A.
13.(2019 全国 II 理 13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有 10 个车次
的正点率为 0.97,有 20 个车次的正点率为 0.98,有 10 个车次的正点率为 0.99,则经停该站高铁列车
所有车次的平均正点率的估计值为__________.
【答案】0.98【解析】经停该站高铁列车所有车次的平均正点率的估计值为:
.
14.(2020 上海 8)已知有四个数 ,这四个数的中位数为 3,平均数为 4,则 .
【答案】36【解析】设 ,则 ,解得: , ,解得: ,所以
.
故答案为:36。
15.(2020 江苏 3)已知一组数据 的平均数为 ,则 的值是 .
【答案】 【解析】由题意得 ,解得 .
16.(2019 江苏 5)已知一组数据 6,7,8,8,9,10,则该组数据的方差是 .
【答案】 【解析】 一组数据 6,7,8,8,9,10 的平均数为 ,
所以该组数据的方差为 .
17.(2020 新高考山东海南 9)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续 11
天复工复产指数折线图,下列说法正确的是 ( )
A.这 11 天复工指数和复产指数均逐日增加
B.这 11 天期间,复产指数增量大于复工指数的增量
10 0.97 20 0.98 10 0.99 0.9810 20 10x
× + × + ×= =+ +
1 (6 7 8 8 9 10) 86x = + + + + + =
2 2 2 2 2 2 21 5[(6 8) (7 8) (8 8) (8 8) (9 8) (10 8) ]6 3s = − + − + − + − + − + − =
1,2, ,a b ab =
a b≤ 2 32
a+ = 4a = 1 2 44
a b+ + + = 9b =
36ab =
4 , 2 , 3 2 , 5 , 6a a− 4 a
2
( )4 2 3 5 6 45
a a+ + − + + = 2a =
5
3
十年高考+大数据预测
C.第 3 天至第 11 天复工复产指数均超过 80%
D.第 9 天至第 11 天复产指数增量大于复工指数的增量
【答案】CD【解析】由图可知,第 1 天到第 2 天复工指数减少,第 7 天到第 8 天复工指数减少,第 10 天到
第 11 复工指数减少,第 8 天到第 9 天复产指数减少,故 A 错误;由图可知,第一天的复产指标与复工指标
的差大于第 11 天的复产指标与复工指标的差,所以这 11 天期间,复产指数增量小于复工指数的增量,故 B
错误;由图可知,第 3 天至第 11 天复工复产指数均超过 80%,故 C 正确;由图可知,第 9 天至第 11 天复
产指数增量大于复工指数的增量,故 D 正确.
18.(2018 全国Ⅰ理)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了
解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼
图:
建设前经济收入构成比例 建设后经济收入构成比例
则下面结论中不正确的是
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【答案】A【解析】通解 设建设前经济收入为 ,则建设后经济收入为 ,则由饼图可得建设前种植收入
为 ,其他收入为 ,养殖收入为 .建设后种植收入为 ,其他收入为 ,养殖收入为
,养殖收入与第三产业收入的总和为 ,所以新农村建设后,种植收入减少是错误的.故选 A.
优解 因为 ,所以新农村建设后,种植收入增加,而不是减少,所以 A 是错误的.故选
A.
19.(2017 新课标Ⅲ理)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014 年 1
月至 2016 年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
a 2a
0.6a 0.04a 0.3a 0.74a 0.1a
0.6a 1.16a
0.6 0.37 2< ×
十年高考+大数据预测
根据该折线图,下列结论错误的是
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在 7,8 月份
D.各年 1 月至 6 月的月接待游客量相对 7 月至 12 月,波动性更小,变化比较平稳
【答案】A【解析】由折线图,7 月份后月接待游客量减少,A 错误,故选 A.
20.(2016 年山东理)某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分
布直方图,其中自习时间的范围是 ,样本数据分组为 , , ,
, .根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是
A.56 B.60 C.120 D.140
【答案】D【解析】由频率分布直方图可知,这 200 名学生每周的自习时间不少于 22.5 小时的频率为
(0.16+0.08+0.04)×2.5=0.7,故这 200 名学生中每周的自习时间不少于 22.5 小时的人数为 200×
0.7=140.故选 D.
21.(2016 年全国 III 理)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均
最低气温的雷达图.图中 A 点表示十月的平均最高气温约为 15℃,B 点表示四月的平均最低气温约为 5℃.下
面叙述不正确的是
[17.5,30] [17.5,20) [20,22.5) [22.5,25)
[25,27.5) [27.5,30]
十年高考+大数据预测
A.各月的平均最低气温都在 0℃以上 B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同 D.平均气温高于 20℃的月份有 5 个
【答案】D【解析】由图可知 0℃在虚线框内,所以各月的平均最低气温都在 0℃以上,A 正确;由图可知
七月的平均温差比一月的平均温差大,B 正确;由图可知三月和十一月的平均最高气温都约为 10℃,基本
相同,C 正确;由图可知平均最高气温高于 20℃的月份不是 5 个,D 不正确,故选 D.
22.(2015 陕西理)某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比例如图所示,则该校
女教师的人数为
A.167 B.137 C.123 D.93
【答案】C【解析】由扇形统计图可得,该校女教师人数为 .
23.(2015 新课标 I 理理 I 理)根据下面给出的 2004 年至 2013 年我国二氧化硫年排放量(单位:万吨)柱
形图,以下结论不正确的是.
A.逐年比较,2008 年减少二氧化硫排放量的效果最显著
110 70 150 (1 60%) 137× + × − =
十年高考+大数据预测
B.2007 年我国治理二氧化硫排放显现成效
C.2006 年以来我国二氧化硫年排放量呈减少趋势
D.2006 年以来我国二氧化硫年排放量与年份正相关
【答案】D【解析】根据柱形图易得选项 A,B,C 正确,2006 年以来我国二氧化碳年排放量与年份负相关,
选项 D 错误.
24.(2015 安徽理)若样本数据 , , , 的标准差为 ,则数据 , , ,
的标准差为
A. B. C. D.
【答案】C【解析】设样本数据 , , , 的标准差为 ,则 ,即方差 ,
而 数 据 , , , 的 方 差 , 所 以 其 标 准 差 为
,故选 C.
25.(2014 广东理)已知某地区中小学生人数和近视情况分别如图 1 和图 2 所示,为了解该地区中小学生的
近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别是
A.200,20 B.100,20 C.200,10 D.100,10
【 答 案 】 A 【 解 析 】 所 抽 人 数 为 , 近 视 人 数 分 别 为 小 学 生
,初中生 ,高中生 ,∴抽取的高中生近视人数为
,故选 A.
26.(2013 福建理)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分为 6 组:[40,50),
[50,60), [60,70), [70,80), [80,90), [90,100]加以统计,得到如图所示的频率分布直方图,已知
高一年级共有学生 600 名,据此估计,该模块测试成绩不少于 60 分的学生人数为( )
A.588 B.480 C.450 D.120
1x 2x ⋅⋅⋅ 10x DX 8DX = 64DX =
12 1x − 22 1x − ⋅⋅⋅ 102 1x − 2 2(2 1) 2 2 64D X DX− = = ×
22 64 16× =
1x 2x ⋅⋅⋅ 10x 8 12 1x − 22 1x − ⋅⋅⋅ 102 1x −
8 15 16
(3500 2000 4500) 2% 200+ + × =
3500 10% 350× = 4500 30% 1350× = 2000 50% 1000× =
1000 2% 20× =
十年高考+大数据预测
【答案】B【解析】由图知道 60 分以上人员的频率为后 4 项频率的和,由图知道
,故分数在 60 以上的人数为 600×0.8=480 人.
27.(2013 山东理)将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91,
现场做的 9 个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以 表示:
则 7 个剩余分数的方差为( )
A. B. C.36 D.
【答案】B【解析】由图可知去掉的两个数是 87,99,所以 ,
.
.
28.(2012 陕西理)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该
样本的中位数、众数、极差分别是( )
A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53
【答案】A【解析】由概念知中位数是中间两数的平均数,即 众数是 45,极差为 68-12=56,
故选 A.
29.(2018 江苏理)已知 5 位裁判给某运动员打出的分数的茎叶图如图所示,那么这 5 位裁判打出的分数的平
均数为 .
(0.03 0.025 0.015 0.01)*10 0.8P = + + + =
x
9 4 0 1 0 x 9 1
8 7 7
116
9
36
7
6 7
7
6 1 7 8
5 0 0 1 1 4 7 9
4 5 5 5 7 7 8 8 9
3 1 2 4 4 8 9
2 0 2 3 3
1 2 5
45+47 =462
,
87 90 2 91 2 94+ × + × + 90 91 7x+ + = ×
4x =
2 2 2 2 21 36[(87 91) (90 91) 2 (91 91) 2 (94 91) 2]7 7s = − + − × + − × + − × =
十年高考+大数据预测
【答案】90【解析】由茎叶图可得分数的平均数为 .
29.(2015 湖南理)在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为 号,再用系统抽样方法从中抽取 7 人,则其中成绩在区间[139,151]
上的运动员人数是 .
【答案】4【解析】由茎叶图可知,在区间 的人数为 ,再由系统抽样的性质可知人数为
人.
30.(2014 江苏理)为了了解一片经济的生长情况,随机抽测了其中 60 株树木的底部周长(单位:cm),所
得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的 60 株树木中,有 株树木的底部
周长小于 100cm.
【答案】24【解析】由频率分布直方图可得树木底部周长小于 100cm 的频率是(0.025 +0.015)×10=0.4,
又样本容量是 60,所以频数是 0.4×60=24.
31.(2013 辽宁理)为了考察某校各班参加课外书法小组的人数,在全校随机抽取 5 个班级,把每个班级
参加该小组的人数作为样本数据.已知样本平均数为 7,样本方差为 4,且样本数据互不相同,则样本数据
中的最大值为 .
【答案】10【解析】设五个班级的数据分别为 .由平均数方差的公式得
110
99
9
8
]151,139[ 20
435
720 =×
a b c d e< < < < 89 89 90 91 91 905 + + + + = 1 35
十年高考+大数据预测
, ,显然各个括号为整数.设
分别为 , ,
则 .
设 =
= ,
因为数据互不相同,分析 的构成,得 恒成立,
因此判别式 ,得 ,所以 ,即 .
32.(2012 山东理)右图是根据部分城市某年 6 月份的平均气温(单位:℃)数据得到的样本频率分布直方图,
其中平均气温的范围是[20.5,26.5],样本数据的分组为 , , , ,
, .已知样本中平均气温低于 22.5℃的城市个数为 11,则样本中平均气温不低于
25.5℃的城市个数为____.
【答案】9【解析】最左边两个矩形面积之和为 0.10×1+0.12×1=0.22,总城市数为 11÷0.22=50,最
右面矩形面积为 0.18×1=0.18,50×0.18=9.
33.(2019 全国 III 理 17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200 只小鼠随
机分成 A、B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每组小鼠给
服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分
比.根据试验数据分别得到如下直方图:
75
a b c d e+ + + + =
2 2 2 2 2( 7) ( 7) ( 7) ( 7) ( 7) 45
a b c d e− + − + − + − + − =
7, 7, 7, 7, 7a b c d e− − − − − , , , ,p q r s t ( , , , , )p q r s t Z∈
2 2 2 2 2
0 (1)
20 (2)
p q r s t
p q r s t
+ + + + =
+ + + + =
2 2 2 2( ) ( ) ( ) ( ) ( )f x x p x q x r x s= − + − + − + −
2 2 2 2 24 2( ) ( )x p q r s x p q r s− + + + + + + + 2 24 2 20x tx t+ + −
( )f x ( ) 0f x >
0 ,因此可看出 A 药的疗效更好.
(2)由观测结果可绘制如下茎叶图:
A 药 B 药
A B 20
A 20 B 40
h
A 20
B 20
x y
1
20x =
1 (0.5 0.5 0.6 0.8 0.9 1.1 1.2 1.220
1.3 1.4 1.6 1.7 1.8 1.9 2.1
2.4 2.5 2.6 2.7 3.2) 1.6
y = + + + + + + +
+ + + + + + +
+ + + + + =
x y
x s− x s+ 23 63.89%36
≈
十年高考+大数据预测
6 0. 5 5 6 8 9
8 5 5 2 2 1. 1 2 2 3 4 6 7 8 9
9 8 7 7 6 5 4 3 3 2 2. 1 4 5 6 7
5 2 1 0 3. 2
从以上茎叶图可以看出,A 药疗效的试验结果有的叶集中在茎 2.3 上,而 B 药疗效的试验结果有 的叶
集中在茎 0,1 上,由此可看出 A 药的疗效更好.
37.(2012 广东理)某校 100 名学生期中考试语文成绩的频率分布直方图如图 4 所示,其中成绩分组区间
是:[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中 的值;
(2)根据频率分布直方图,估计这 100 名学生语文成绩的平均分;
(3)若这 100 名学生语文成绩某些分数段的人数( )与数学成绩相应分数段的人数( )之比如下表所
示,求数学成绩在[50,90)之外的人数.
分数段
x :y 1:1 2:1 3:4 4:5
【解析】(1)
(2)平均分为
(3)数学成绩在 内的人数为
人.
数学成绩在 外的人数为 人.
7
10
a
x y
(2 0.02 0.03 0.04) 10 1 0.005a a+ + + × = ⇔ =
55 0.05 65 0.4 75 0.3 85 0.2 95 0.05 73× + × + × + × + × =
[50,90)
1 4 5(0.005 0.04 0.03 0.02) 10 100 902 3 4
+ × + × + × × × =
[50,90) 100 90 10− =
[ )60,50 [ )70,60 [ )80,70 [ )90,80
十年高考+大数据预测
答:(1) (2)这 100 名学生语文成绩的平均分为
(3)数学成绩在 外的人数为 人.
考点 109 变量间的相关关系
38.(2020 全国Ⅰ文理 5)某校一个课外学习小组为研究某作物种子的发芽率 和温度 (单位: )的关
系,在 20 个不同的温度条件下进行种子发芽实验,由实验数据 得到下面的散点图:
由此散点图,在 至 之间,下面四个回归方程类型中最适宜作为发芽率 和温度 的回归方程类型
的是 ( )
A. B. C. D.
【答案】D
【解析】由散点图分布可知,散点图分布在一个对数函数的图像附近,因此,最适合作为发芽率 和温度
的回归方程类型的是 ,故选 D.
39.(2017 山东理)为了研究某班学生的脚长 (单位:厘米)和身高 (单位:厘米)的关系,从该班随
机抽取 10 名学生,根据测量数据的散点图可以看出 与 之间有线性相关关系,设其回归直线方程为
.已知 , , .该班某学生的脚长为 24,据此估计其身高为
A. B. C. D.
【答案】C【解析】因为 , ,所以 , ,故选
C.
40.(2015 福建理)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区 5 户家庭,得到如
下统计数据表:
收入 (万元) 8.2 8.6 10.0 11.3 11.9
0.005a = 73
[50,90) 10
x y
y x
ˆˆ ˆy bx a= +
10
1
225i
i
x
=
=∑ 10
1
1600i
i
y
=
=∑ ˆ 4b =
160 163 166 170
y x C°
( )( ), 1, 2 , , 20i ix y i =
10 C° 40 C° y x
y a bx= + 2y a bx= + exy a b= + lny a b x= +
y x
lny a b x= +
22.5x = 160y = 160 4 22.5 70a = − × = 4 24 70 166y = × + =
x
十年高考+大数据预测
支出 (万元) 6.2 7.5 8.0 8.5 9.8
根据上表可得回归本线方程 ,其中 ,据此估计,该社区一户收入为 15 万
元家庭年支出为
A.11.4 万元 B.11.8 万元 C.12.0 万元 D.12.2 万元
【答案】B【解析】∵ , , ,∴ ,
∴回归方程为 ,把 代入上式得, (万元),故选 B.
41.(2014 重庆理)已知变量 与 正相关,且由观测数据算得样本的平均数 , ,则由该观
测数据算得的线性回归方程可能为
A. B. C. D.
【答案】A【解析】由题意可知,相应的回归直线的斜率应为正,排除 C、D.且直线必过点 ,代入
A、B 得 A 正确.
42.(2014 湖北理)根据如下样本数据
x 3 4 5 6 7 8
y 4.0 2.5 0.5
得到的回归方程为 ,则
A. , B. , C. , D. ,
【答案】A【解析】画出散点图知 ,故选 A.
43.(2012 新课标理)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn 不全相等)
的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线 上,则这组样本数据的样本相关
系数为
A.−1 B.0 C.1
2 D.1
【答案】D【解析】因为所有的点都在直线上,这组样本数据完全正相关,故其相关系数为 1,故故选
D.
44.(2014 江西理)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量之间的关系,随机抽查
52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最大的变量是
x y 3.5y =
0.5− 2.0− 3.0−
y
ˆˆ ˆy bx a= + ˆ ˆˆ0.76,b a y bx= = −
10.0x = 8.0y = ˆ 0.76b = ˆ 8 0.76 10 0.4a = − × =
ˆ 0.76 0.4y x= + 15x = ˆ 0.76 15 0.4 11.8y = ´ + =
3x =
0.4 2.3y x= + 2 2.4y x= − 2 9.5y x= − + 0.3 4.4y x= − +
(3,3.5)
ˆy bx a= +
0a > 0b < 0a > 0b > 0a < 0b < 0a < 0b >
0, 0b a< >
1 12y x= +
十年高考+大数据预测
【答案】D【解析】因为 ,
, ,
,
则有 ,所以阅读量与性别关联的可能性最大,故选 D.
45.(2012 湖南理)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一
组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为 =0.85x 85.71,则下列结论
中不正确的是
A.y 与 x 具有正的线性相关关系
B.回归直线过样本点的中心( , )
C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg
D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg
【答案】D【解析】由回归方程为 =0.85x 85.71 知 随 的增大而增大,所以 y 与 x 具有正的线性相
关关系,由最小二乘法建立的回归方程得过程知
y
x y
y y x
2 2
2
1
52 (6 22 14 10) 52 8
16 36 32 20 16 36 32 20
χ × × − × ×= =× × × × × ×
2 2
2
2
52 (4 20 16 12) 52 112
16 36 32 20 16 36 32 20
χ × × − × ×= =× × × × × ×
2 2
2
3
52 (8 24 12 8) 52 96
16 36 32 20 16 36 32 20
χ × × − × ×= =× × × × × ×
2 2
2
4
52 (14 30 6 2) 52 408
16 36 32 20 16 36 32 20
χ × × − × ×= =× × × × × ×
2 2 2 2
4 2 3 1
χ χ χ χ> > >
−
−
十年高考+大数据预测
,
所以回归直线过样本点的中心( , ),利用回归方程可以预测估计总体,所以 D 不正确.
46.(2011 山东理)某产品的广告费用 x 与销售额 y 的统计数据如下表
广告费用 x(万元) 4 2 3 5
销售额 y(万元) 49 26 39 54
根据上表可得回归方程 中的 为 9.4,据此模型预报广告费用为 6 万元时销售额为
A.63.6 万元 B.65.5 万元 C.67.7 万元 D.72.0 万元
【答案】B【解析】样本中心点是(3.5,42),则 ,所以回归方程是
,把 代入得 .
47.(2018 全国Ⅱ理)下图是某地区 2000 年至 2016 年环境基础设施投资额 (单位:亿元)的折线图.
为了预测该地区 2018 年的环境基础设施投资额,建立了 与时间变量 的两个线性回归模型.根据 2000 年
至 2016 年的数据(时间变量 的值依次为 )建立模型①: ;根据 2010 年至 2016
年的数据(时间变量 的值依次为 )建立模型②: .
(1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【解析】(1)利用模型①,该地区 2018 年的环境基础设施投资额的预测值为 (亿
元).
利用模型②,该地区 2018 年的环境基础设施投资额的预测值为 (亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
ˆ ( )y bx a bx y bx a y bx= + = + − = −
x y
ˆˆ ˆy bx a= + ˆb
ˆˆ 42 9.4 3.5 9.1a y bx= − = − × =
ˆ 9.4 9.1y x= + 6x = ˆ 65.5y =
y
y t
t 1 2 17, ,… , ˆ 30.4 13.5= − +y t
t 1 2 7, ,… , ˆ 99 17.5= +y t
ˆ 30.4 13.5 19 226.1y = − + × =
ˆ 99 17.5 9 256.5y = + × =
十年高考+大数据预测
(ⅰ)从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 上下.这
说明利用 2000 年至 2016 年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010
年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,
这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立
的线性模型 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型②
得到的预测值更可靠.
(ⅱ)从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型①得到的预测值 226.1 亿
元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.
以上给出了 2 种理由,考生答出其中任意一种或其他合理理由均可得分.
48.(2016 新课标Ⅰ理 II)下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图
(Ⅰ)由折线图看出,可用线性回归模型拟合 与 的关系,请用相关系数加以说明;
(Ⅱ)建立 关于 的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾无害化处理量.
附注:参考数据: , , , ≈2.646.
参考公式:相关系数
回归方程 中斜率和截距的最小二乘估计公式分别为:
【解析】(Ⅰ)由折线图这数据和附注中参考数据得
30.4 13.5y t= − +
ˆ 99 17.5y t= +
y t
y t
7
1
9.32i
i
y
=
=∑ 7
1
40.17i i
i
t y
=
=∑ 7
2
1
( ) 0.55i
i
y y
=
− =∑ 7
1
2 2
1 1
( )( )
( ) (y y)
n
i i
i
n n
i i
i i
t t y y
r
t t
=
= =
− −
=
− −
∑
∑ ∑
,
y a bt= + 1
2
1
( )( )
( )
n
i i
i
n
i
i
t t y y
b
t t
=
=
− −
=
−
∑
∑
, = .a y bt−
十年高考+大数据预测
, , ,
,
.
因为 与 的相关系数近似为 0.99,说明 与 的线性相关相当高,从而可以用线性回归模型拟合 与 的
关系.
(Ⅱ)由 及(Ⅰ)得 ,
.
所以, 关于 的回归方程为: .
将 2016 年对应的 代入回归方程得: .
所以预测 2016 年我国生活垃圾无害化处理量将约 1.82 亿吨.
49.(2015 新课标 I 理)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 (单位:千元)
对年销售量 (单位:t)和年利润 (单位:千元)的影响,对近 8 年的年宣传费 和年销售量 ( =1,
2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6 563 6.8 289.8 1.6 1469 108.8
表中 , = .
(Ⅰ)根据散点图判断, 与 哪一个适宜作为年销售量 关于年宣传费 的回归方程
4=t 28)(
7
1
2 =−∑
=i
i tt 55.0)(
7
1
2 =−∑
=i
i yy
7 7 7
1 1 1
( )( ) 40.17 4 9.32 2.89i i i i i
i i i
t t y y t y t y
= = =
− − = − = − × =∑ ∑ ∑
99.0646.2255.0
89.2 ≈××≈r
y t y t y t
331.17
32.9 ≈=y
7
1
7
2
1
( )( ) 2.89ˆ 0.10328( )
i i
i
i
i
t t y y
b
t t
=
=
− −
= = ≈
−
∑
∑
92.04103.0331.1ˆˆ ≈×−≈−= tbya
y t ty 10.092.0ˆ +=
9=t 82.1910.092.0ˆ =×+=y
x
y z ix iy i
x y w
8
2
1
( )i
i
x x
=
−∑ 8
2
1
( )i
i
w w
=
−∑ 8
1
( )( )i i
i
x x y y
=
− −∑ 8
1
( )( )i i
i
w w y y
=
− −∑
i iw x= w 1
8
8
1
i
i
w
=
∑
y a bx= + y c d x= + y x
十年高考+大数据预测
类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立 关于 的回归方程;
(Ⅲ)已知这种产品的年利率 与 、 的关系为 .根据(Ⅱ)的结果回答下列问题:
(ⅰ)年宣传费 =49 时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费 为何值时,年利率的预报值最大?
附:对于一组数据 , , , ,其回归线 的斜率和截距的最小二乘估计分
别为 , .
【解析】(Ⅰ)由散点图可以判断, 适宜作为年销售量 关于年宣传费 的回归方程类型.
(Ⅱ)令 ,先建立 关于 的线性回归方程,由于 .
,
所以 关于 的线性回归方程为 ,因此 关于 的回归方程为 .
(Ⅲ)(ⅰ)由(Ⅱ)知,当 时,年销售量 的预报值 ,
年利润 的预报值 .
(ⅱ)根据(Ⅱ)得结果知,年利润 的预报值 ,所以
当 ,即 时, 取得最大值,故年宣传费为 千元时,年利润的预报值最
大.
50.(2014 新课标 II 理)某地区 2007 年至 2013 年农村居民家庭纯收入 y(单位:千元)的数据如下表:
年份 2007 2008 2009 2010 2011 2012 2013
年份代号 t 1 2 3 4 5 6 7
人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9
(Ⅰ)求 y 关于 t 的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变化情况,并
y x
z x y 0.2z y x= −
x
x
1 1( , )u v 2 2( , )u v ⋅⋅⋅ ( , )n nu v v uα β= +
1
2
1
( )( )
ˆ
( )
n
i i
i
n
i
i
u u v v
u u
β =
=
− −
=
−
∑
∑
ˆˆ v uα β= −
y c d x= + y x
w x= y w
8
1
8
2
1
( )( ) 108.8ˆ 681.6( )
i i
i
i
i
w w y y
d
w w
=
=
− −
= = =
−
∑
∑
ˆˆ 563 68 6.8 100.6c y dw= − = − × =
y w ˆ 100.6 68y w= + y x ˆ 100.6 68y x= +
49x = y ˆ 100.6 68 49 576.6y = + =
z ˆ 576.6 0.2 49 66.32z = × − =
z ˆ 0.2(100.6 68 ) 13.6 20.12z x x x x= + − = − + +
13.6 6.82x = = 46.24x = ˆz 46.24
十年高考+大数据预测
预测该地区 2015 年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为: ,
【解析】(I) 由所给数据计算得 (1+2+3+4+5+6+7)=4,
(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3
=9+4+1+0+1+4+9=28,
= ,
, ,所求回归方程为 .
51.(2020 全国Ⅱ文理 18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调
查该地区某种野生动物的数量,将其分成面积相近的 200 个地块,从这些地块中用简单随机抽样的方法抽
取 20 个作为样区,调查得到样本数据 ,其中 和 分别表示第 个样区的植物覆
盖面积(单位:公顷)和这种野生动物的数量,并计算得 , , ,
, .
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均
数乘以地块数);
(2)求样本 的相关系数(精确到 );
(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动
物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
( )( )
( )
1
2
1
n
i i
i
n
i
i
t t y y
b
t t
∧
=
=
− −
=
−
∑
∑
ˆˆa y bt= −
1
7t = 1
7y =
7
2
1
1
( )
t
t t
=
−∑
7
1 1
1
( )( )
t
t t y y
=
− −∑ ( 3) ( 1.4) ( 2) ( 1) ( 1) ( 0.7)− × − + − × − + − × − 0 0.1 1 0.5 2 0.9 3 1.6 14+ × + × + × + × =
7
1 1
1
7
2
1
1
( )( ) 14 0.528( )
t
t
t t y y
b
t t
=
=
− −
= = =
−
∑
∑
4.3 0.5 4 2.3a y bt= − = − × = 0.5 2.3y t= +
( )( ), 1, 2 , , 20i ix y i = ix iy i
∑
=
=
20
1
60
i
ix ∑
=
=
20
1
1200
i
iy ( )∑
=
=−
20
1
2 80
i
i xx
( )∑
=
=−
20
1
2 9000
i
i yy ( )( ) 080
20
1
∑
=
=−−
i
ii yyxx
( )( ), 1, 2 , , 20i ix y i = 0.01
十年高考+大数据预测
附:相关系数 , .
【解析】(1)样区野生动物平均数为 ,
地块数为 ,该地区这种野生动物的估计值为 .
(2)样本 的相关系数为 .
(3)由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.先将植物覆盖面
积按优中差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样法抽取样本即可.
考点 110 随机事件的概率、古典概型、几何概型
52.(2020 全国Ⅰ文 4)设 为正方形 的中心,在 中任取 点,则取到的 点共线
的概率为 ( )
A. B. C. D.
【答案】A
【解析】如图,从 个点中任取 个有 ,
,共 种不同取
法, 点共线只有 与 共 2 种情况,由古典概型的概率计算公式知,取到 点共线的
概率为 ,故选 A.
53.(2020 全国Ⅱ文理 4)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成 份订单的
( )( )
( ) ( )∑∑
∑
==
=
−−
−−
=
n
i
i
n
i
i
n
i
ii
yyxx
yyxx
r
1
2
1
2
1 414.12 ≈
20
1
1 1 1200 6020 20i
i
y
=
= × =∑
200 200 60 12000× =
( , )i ix y
20
1
20 20
2 2
1 1
( )( ) 800 2 2 0.94380 9000( ) ( )
i i
i
i i
i i
x x y y
r
x x y y
=
= =
− −
= = = ≈
×− −
∑
∑ ∑
O ABCD , , , ,O A B C D 3 3
1
5
2
5
1
2
4
5
, , , ,O A B C D 5 3 { } { } { }, , , , , , , ,O A B O A C O A D
{ } { } { } { } { } { } { }, , , , , , , , , , , , , , , , , , , ,O B C O B D O C D A B C A B D A C D B C D 10
3 { }, ,O A C { }, ,O B D 3
2 1
10 5
=
1200
十年高考+大数据预测
配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该
超市某日积压 份订单未配货,预计第二天的新订单超过 份的概率为 ,志愿者每人每天能完
成 份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于 ,则至少需要志愿者
( )
A. 名 B. 名 C. 名 D. 名
【答案】B
【解析】由题意,第二天新增订单数为 ,故需要志愿者 名,故选 B.
54.(2020 新高考山东海南 5)某中学的学生积极参加体育锻炼,其中有 的学生喜欢足球或游泳,
的学生喜欢足球, 的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比
例是 ( )
A. B. C. D.
【答案】C
【解析】记“该中学学生喜欢足球”为事件 ,“该中学学生喜欢游泳”为事件 ,则“该中学学生喜欢足球或
游泳”为事件 ,“该中学学生既喜欢足球又喜欢游泳”为事件 ,则 , ,
,所以 ,所以该中学既喜
欢足球又喜欢游泳的学生数占该校学生总数的比例为 ,故选:C.
55.(2019 全国 I 理 6)我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的 6
个爻组成,爻分为阳爻“——”和阴爻“— —”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦
恰有 3 个阳爻的概率是( )
A. B. C. D. 5
16
11
32
21
32
11
16
500 1600 0.05
50 0.95
10 18 24 32
500 1600 1200 900+ − = 900 1850
=
96% 60%
82%
62% 56% 46% 42%
A B
A B+ A B⋅ ( ) 0.6P A = ( ) 0.82P B =
( ) 0.96P A B+ = ( )P A B⋅ = ( ) ( ) ( )P A P B P A B+ − + 0.6 0.82 0.96 0.46= + − =
46%
十年高考+大数据预测
【解析】在所有重卦中随机取一重卦,基本事件总数 ,该重卦恰有 3 个阳爻包含的基本个数
,则该重卦恰有 3 个阳爻的概率 ,故选 A.
56.(2018 全国Ⅰ理)如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个
半圆的直径分别为直角三角形 的斜边 ,直角边 , . 的三边所围成的区域记为Ⅰ,
黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为 ,
, ,则
A. B. C. D.
【答案】A【解析】通解 设直角三角形 的内角 , , 所对的边分别为 , , ,则区域 I 的
面积即 的面积,为 ,区域Ⅱ的面积
,所以 ,由几何概型的知识知
,故选 A.
优解 不妨设 为等腰直角三角形, ,则 ,所以区域 I 的面积即 的面
积,为 ,区域Ⅱ的面积
,区域Ⅲ的面积 .
根据几何概型的概率计算公式,得 , ,所以 ,
, ,故选 A.
57.(2018 全国Ⅱ理)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想
是“每个大于 2 的偶数可以表示为两个素数的和”,如 .在不超过 30 的素数中,随机选取两个不
同的数,其和等于 30 的概率是
62 64n = =
3 3
6 3C C 20m = = 20 5
64 16
mp n
= = =
ABC BC AB AC ∆ABC
1p
2p 3p
1 2
=p p 1 3
=p p 2 3
=p p 1 2 3
= +p p p
ABC A B C a b c
∆ABC 1
1
2
=S bc 2
2
1 ( )2 2
π= × +cS
2
2 2 2 2
( )1 1 1 1 12( ) [ ] ( )2 2 2 2 8 2 2
π
π π
×
× − − = + − + =
a
b bc c b a bc bc 1 2
=S S
1 2
=p p
∆ABC 2= =AB AC 2 2=BC ∆ABC
1
1 2 2 22
= × × =S
2
2
2
( 2)1 [ 2] 22
ππ ×= × − − =S
2
3
( 2) 2 22
π π×= − = −S
1 2
2
2p p π= = + 3
2
2
π
π
−= +p 1 3
≠p p
2 3
≠p p 1 2 3
≠ +p p p
30 7 23= +
十年高考+大数据预测
A. B. C. D.
【答案】C【解析】不超过 30 的素数有 2,3,5,7,11,13,17,19,23,29,共 10 个,从中随机选取两
个不同的数有 种不同的取法,这 10 个数中两个不同的数的和等于 30 的有 3 对,所以所求概率
,故选 C.
58.(2017 新课标Ⅰ理)如图,正方形 内的图形来自中国古代的太极图,正方形内切圆中的黑色部
分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是
A. B. C. D.
【答案】B【解析】设正方形的边长为 ,由题意可知太极图的黑色部分的面积是圆的面积的一半,根据
几何概型的概率计算,所求概率为 .故选 B.
59.(2017 山东理)从分别标有 , , , 的 张卡片中不放回地随机抽取 2 次,每次抽取 1 张.则抽
到的 2 张卡片上的数奇偶性不同的概率是
A. B. C. D.
【答案】C【解析】不放回的抽取 2 次有 ,如图
可知 与 是不同,所以抽到的 2 张卡片上的数奇偶性不同有 =40,所求概率为 .
60.(2016 新课标Ⅰ理)某公司的班车在 7:30,8:00,8:30 发车,小明在 7:50 至 8:30 之间到达发车
1 2 ⋅⋅⋅ 9 9
5
18
4
9
5
9
7
9
2
1,3,4,5,6,7,8,92,3,4,5,6,7,8,9
1
1
12
1
14
1
15
1
18
2
10C
2
10
3 1
C 15
= =P
ABCD
1
4 8
π 1
2 4
π
2a
2
2
1
2
4 8
a
a
π π=
1 1
9 8C C 9 8 72= × =
(1,2) (2,1) 1 1
5 42C C 40 5
72 8
=
十年高考+大数据预测
站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过 10 分钟的概率是
A. B. C. D.
【答案】B【解析】由题意得图:
由图得等车时间不超过 10 分钟的概率为 .
61.(2016 新课标Ⅰ理)从区间 随机抽取 2n 个数 , ,…, , , ,…, ,构成 个数
对 , ,…, ,其中两数的平方和小于 1 的数对共有 个,则用随机模拟的方法得到
的圆周率 的近似值为
A. B. C. D.
【答案】C【解析】由题意得: 在如图所示方格中,而平方和小于 1 的点均在如图
所示的阴影中,由几何概型概率计算公式知 ,∴ ,故选 C.
62.(2015 广东理)袋中共有 个除了颜色外完全相同的球,其中有 个白球, 个红球.从袋中任取
个球,所取的 个球中恰有 个白球, 个红球的概率为
A. B. C. D.
【答案】B 【解析】 基本事件总数为 ,恰有 个白球与 1 个红球的基本事件为 ,所求概率为
.
63.(2014 新课标 I 理)4 位同学各自在周六、周日两天中任选一天参加公益活动,则周六、周日都有同学
参加公益活动的概率为
8:308:208:108:007:50
1
3
1
2
2
3
3
4
1
2
[ ]0 , 1 1x 2x nx 1y 2y ny n
( )1 1,x y ( )2 2,x y ( ),n nx y m
π
4n
m
2n
m
4m
n
2m
n
( )( )1 2i ix y i n= ⋅⋅⋅, , , ,
π
4
1
m
n
= 4π m
n
=
15 10 5 2
2 1 1
5
21
10
21
11
21 1
2
15C 1 1 1
10 5C C
1 1
10 5
2
15
10
21
C C
C =
十年高考+大数据预测
. . . .
【答案】D【解析】 .
64.(2014 江西理)掷两颗均匀的骰子,则点数之和为 5 的概率等于( )
A. B. C. D.
【答案】B【解析】掷两颗均匀的骰子的所有基本事件有 种,点数之和为 5 的有 4 中,所以所求
概率为 .
65.(2014 湖南理)在区间 上随机选取一个数 ,则 的概率为( )
A. B. C. D.
【答案】B【解析】区间长度为 , 的长度为 ,故满足条件的概率为
.
66.(2014 辽宁理)若将一个质点随机投入如图所示的长方形 中,其中 , ,则质点
落在以 为直径的半圆内的概率是( )
A. B. C. D.
【答案】B【解析】由几何模型的概率计算公式,所求概率 .
67.(2014 陕西理)从正方形四个顶点及其中心这 5 个点中,任取 2 个点,则这 2 个点的距离小于该正方形
边长的概率为( )
A. B. C. D.
【答案】B【解析】5 个点中任取 2 个点共有 10 种方法,若 2 个点之间的距离小于边长,则这 2 个点中必须
有 1 个为中心点,有 4 种方法,于是所求概率 .
A
D C
B
A 1
8 B 3
8 C 5
8 D 7
8
4
4
2 2 7
2 8P
−= =
1
18
1
9
1
6
1
12
6 6 36× =
4 1
36 9
=
[ 2,3]− X 1X ≤
4
5
3
5
2
5
1
5
3 ( 2) 5− − = [ 2,1]− 1 ( 2) 3− − =
2
3P =
ABCD 2AB = 1BC =
AB
2
π
4
π
6
π
8
π
1
2= 2 4
SP S
π π= =阴影
长方形
1
5
2
5
3
5
4
5
4 2
10 5P = =
十年高考+大数据预测
68.(2014 湖北理)由不等式 确定的平面区域记为 ,不等式 ,确定的平面区
域记为 ,在 中随机取一点,则该点恰好在 内的概率为( )
A. B. C. D.
【答案】D【解析】由题意作图,如图所示, 的面积为 ,图中阴影部分的面积为
,则所求的概率 ,故选 D.
69.(2013 陕西理)如图,在矩形区域 ABCD 的 A, C 两点处各有一个通信基站,假设其信号覆盖范围分
别是扇形区域 ADE 和扇形区域 CBF(该矩形区域内无其他信号来源,基站工作正常).若在该矩形区域内随
机地选一地点,则该地点无信号的概率是
A. B. C. D.
【答案】A【解析】由题设可知矩形ABCD面积为2,曲边形DEBF的面积为 故所求概率为 ,
故选 A.
70.(2013 安徽理)若某公司从五位大学毕业生甲、乙、丙、丁、戊中录用三人,这五人被录用的机会均等,
则甲或乙被录用的概率为
A. B.
C. D.
1 4
π− 12
π − 2 2
π−
4
π
2 2
π−
2 2 12 4
π
π−
= −
2
3
2
5
3
5
9
10
≤−−
≥
≤
02
0
0
xy
y
x
1Ω
−≥+
≤+
2
1
yx
yx
2Ω 1Ω 2Ω
8
1
4
1
4
3
8
7
1Ω 1 2 2 22
× × =
1 2 2 72 2 2 2 4
− × × = 7
8P =
1
2
D
A
C
B
E
F
十年高考+大数据预测
【答案】D【解析】总的可能性有 10 种,甲被录用乙没被录用的可能性 3 种,乙被录用甲没被录用的可能
性 3 种,甲乙都被录用的可能性 3 种,所以最后的概率 .
71.(2013 新课标 I 理)从 中任取 个不同的数,则取出的 个数之差的绝对值为 的概率是( )
A. B. C. D.
【答案】B【解析】任取两个不同的数有 共 6 种,2 个数之差的绝对
值为 2 的有 ,故 .
72.(2013 湖南理)已知事件“在矩形 ABCD 的边 CD 上随机取一点 P,使△APB 的最大边是 AB”发生的
概率为 ,则 =
A. B. C. D.
【答案】D【解析】由已知,点 P 的分界点恰好是边 CD 的四等分点,
由勾股定理可得 ,解得 ,即 ,故选 D.
73.(2012 辽宁理)在长为 12cm 的线段 AB 上任取一点 C,现作一矩形,邻边长分别等于线段 AC,CB 的
长,则该矩形面积小于 32 的概率为
A. B. C. D.
【答案】C【解析】如图所示,令 ,
则 ,矩形面积设为 ,则 ,
解得 ,该矩形面积小于 32 的概率为 ,故选 C.
74.(2012 北京理)设不等式组 表示的平面区域为 ,在区域 内随机取一个点,则此点到坐标
原点的距离大于 2 的概率是( )
3 3 3 110p
+ += =
1,2,3,4 2 2 2
1
2
1
3
1
4
1
6
1
2
AD
AB
1
2
1
4
3
2
7
4
2cm
A
BC
C B
A
1
6
1
3
2
3
4
5
= , =AC x CB y
( )+ =12 >0,y>0x y x S ( )= = 12- 32S xy x x ≤
0< 4 8 ⋅ + ( ) ( )H X H Y>
p X
2.4DX = ( 4) ( 6)P X P X= < = p 10 (1 ) 2.4DX p p= − = 0.6p = 0.4p = ( 4) ( 6)P X P X= < = 4 4 6 6 6 4 10 10C (1 ) C (1 )p p p p− < − 2 2(1 )p p− < 0.5p >
0.6p =
0 1p< < ξ ξ P 1 2 p− 1 2 2 p p (0,1)
十年高考+大数据预测
A. 减小 B. 增大
C. 先减小后增大 D. 先增大后减小
【答案】D【解析】由题可得 ,所以 ,所以当 在
内增大时, 先增大后减小.故选 D.
115.(2017 浙江理)已知随机变量 满足 , , =1,2.
若 ,则
A. < , < B. < , >
C. > , < D. > , >
【答案】A【解析】由题意可得
0 1 0 1
由两点分布 , ; , ,
∵ ,
∵ ,∴ , ,∴ < , < ,故选 A. 116.(2014 浙江理)已知甲盒中仅有 1 个球且为红球,乙盒中有 个红球和 个篮球 ,从乙 盒中随机抽取 个球放入甲盒中. (a)放入 个球后,甲盒中含有红球的个数记为 ; (b)放入 个球后,从甲盒中取 1 个球是红球的概率记为 .则 A. B. C. D. 【答案】A【解析】解法一(特值法)取 =3 进行计算、比较即可. 解法二 从乙盒中取 1 个球时,取出的红球的个数记为 ,则 的所有可能取值为 0,1,则 , , m n ( )3, 3m n≥ ≥ ( )1,2i i = i ( )1,2i iξ = i ( )1,2ip i = ( ) ( )1 2 1 2,p p E Eξ ξ> < ( ) ( )1 2 1 2,p p E Eξ ξ< >
( ) ( )1 2 1 2,p p E Eξ ξ> > ( ) ( )1 2 1 2,p p E Eξ ξ< < ( )D ξ ( )D ξ ( )D ξ ( )D ξ 1( ) 2E pξ = + 2 21 1 1( ) ( )4 2 2D p p pξ = − + + = − − + p (0,1) ( )D ξ i ξ ( 1)i iP pξ = = ( 0) 1i iP pξ = = − i 1 2 10 2p p< < < 1( )E ξ 2( )E ξ 1( )D ξ 2( )D ξ 1( )E ξ 2( )E ξ 1( )D ξ 2( )D ξ 1( )E ξ 2( )E ξ 1( )D ξ 2( )D ξ 1( )E ξ 2( )E ξ 1( )D ξ 2( )D ξ 1 ξ 2 ξ P 11 p− 1p P 21 p− 2p 1 1( )E pξ = 2 2( )E pξ = 1 1 1( ) (1 )D p pξ = − 2 2 2( ) (1 )D p pξ = − 2 2 2 1 2 2 1 1 2 1 2 1( ) ( ) (1 ) (1 ) ( ) ( )D D p p p p p p p pξ ξ− = − − − = − − − 2 1 2 1( )(1 )p p p p= − − − 1 2 10 2p p< < < 2 1 0p p− > 2 11 0p p− − > 1( )E ξ 2( )E ξ 1( )D ξ 2( )D ξ
m n=
ξ ξ
1( 0) ( 1)nP Pm n
ξ ξ= = = =+ 1( 1) ( 2)mP Pm n
ξ ξ= = = =+
十年高考+大数据预测
所以 ,
所以 ;从乙盒中取 2 个球时,取出的红球的个数记为 ,则 的所有可能的取值为
0,1,2,则 , , ,
∴ ,∴ ,所以 ,
,故选 A.
117.(2020 浙江 16)一个盒子里有 1 个红 1 个绿 2 个黄四个相同的球,每次拿一个,不放回,拿出红球即
停,设拿出黄球的个数为 ,则 ; .
【答案】 ;
【解析】 表示第一次拿到的是红球,设为事件 A,或第一次是绿球,第二次是红球,设为事件 B,则
;
表示拿出红球时已经拿出了一个黄球,即第一次拿到黄球,第二次拿到红球,概率 ,或
是前两次拿到的是一个黄球一个是绿球, ,∴ ;
,表示拿到红球时已经拿出了两个黄球,即前两次黄球,第三次红球, ,说是第四
次拿到红球, ,∴ ,
,故答案为: ; .
118.(2017 新课标Ⅱ理)一批产品的二等品率为 ,从这批产品中每次随机取一件,有放回地抽取
次,훸表示抽到的二等品件数,则 = .
【答案】1.96【解析】由题意可得,抽到二等品的件数符合二项分布,即 ,由二项分布
的期望公式可得 .
119.(2016 年四川理)同时抛掷两枚质地均匀的硬币,当至少有一枚硬币正面向上时,就说这次试验成功,
则在 2 次试验中成功次数 的均值是 .
【答案】 【解析】实验成功的概率 ,故 ,所以 .
1 1 1( ) 1 ( 1) 2 ( 2) 1mE P P m n
ξ ξ ξ= ⋅ = + = = ++
1
1
( ) 2
2 2( )
E m np m n
ξ += = + η η
2
22
C( 0) ( 1)C
n
m n
P Pη ξ
+
= = = =
1 1
22
C C( 1) ( 2)C
n m
m n
P Pη ξ
+
= = = =
2
22
C( 2) ( 3)C
m
m n
P Pη ξ
+
= = = =
2 2 2 2
2( ) 1 ( =1) 2 ( =2) 3 ( =3) 1mE P P P m n
ξ ξ ξ ξ= ⋅ + ⋅ + ⋅ = ++
2
2
( ) 3
3 3( )
E m np m n
ξ += = + 1 2p p>
( ) ( )1 2E Eξ ξ< ξ ( 0)P ξ = = ( )E ξ = 1 3 1 0ξ = ( ) ( ) ( ) 1 1 10 4 4 3 3P P A P Bξ = = + = + =× 1ξ = 2 1 1 4 3 6P ×= =× 2 1 1 12 4 3 2 6P × ×= × =× × ( ) 1 1 11 6 6 3P ξ = = + = 2ξ = 2 1 1 1 4 3 2 12P × ×= =× × 3 2 1 1 4 3 2 1 4P × ×= =× × × ( ) 1 1 12 12 4 3P ξ = = + = ( ) 1 1 10 1 2 13 3 3E ξ = × + × + × = 1 3 1 0.02 100 DX ( )~ 100,0.02X B ( )1 100 0.02 0.98 1.96DX np p= − = × × = X 3 2 3 4p = 3(2, )4X B 3 3( ) 2 4 2E X = × =
十年高考+大数据预测
120.(2014 浙江理)随机变量 的取值为 0,1,2,若 , ,则 __.
【答案】 【解析】由题意设 的分布列如下
0 1 2
由 ,可得 ,所以 .
121.(2020 江苏 25)甲口袋中装有 2 个黑球和 1 个白球,乙口袋中装有 3 个白球.现从甲、乙两口袋中各
任取一个球交换放入另一口袋,重复 n 次这样的操作,记甲口袋中黑球个数为 Xn,恰有 2 个黑球的概率为
pn,恰有 1 个黑球的概率为 qn.
(1)求 p1·q1 和 p2·q2;
(2)求 2pn+qn 与 2pn-1+qn-1 的递推关系式和 Xn 的数学期望 E(Xn)(用 n 表示) .
【解析】(1) , ,
.
(2) ,
,
因此 ,从而 ,
即 , .
122.(2019 天津理 16)设甲、乙两位同学上学期间,每天 7:30 之前到校的概率均为 .假定甲、乙两位
同学到校情况互不影响,且任一同学每天到校情况相互独立.
(Ⅰ)用 表示甲同学上学期间的三天中 7:30 之前到校的天数,求随机变量 的分布列和数学期望;
(Ⅱ)设 为事件“上学期间的三天中,甲同学在 7:30 之前到校的天数比乙同学在 7:30 之前到校的天
数恰好多 2”,求事件 发生的概率.
【解析】(I)∵甲同学上学期间的三天中到校情况相互独立,且每天 7:30 之前到校的概率均为 ,
故 ,从面 .
∴随机变量 的分布列为:
ξ ( ) 10 5P ξ = = ( ) 1E ξ = ( )D ξ =
2
3
X X
M
M
2
5 ( 1) ,P pξ ξ= =
ξ
P 1
5
p 4
5 p−
( ) 1E ξ = 3
5p = 2( ) 5D ξ =
1 1
1 3 1 2 3 2,3 3 3 3 3 3p q
× ×= = = =× × 2 1 1
1 3 1 2 1 1 2 2 7+ +3 3 3 3 3 3 3 9 27p p q
× ×= × × = × × =× ×
2 1 1
2 3 1 1 2 2 2 2 2 5 16+ 0 +3 3 3 3 3 3 3 9 27q p q
× × + ×= × × + = × × =× ×
1 1 1 1
1 3 1 2 1 2+ +3 3 3 3 3 9n n n n np p q p q− − − −
× ×= × × =× ×
1 1 1 1 1
2 3 1 1 2 2 3 2 1 2+ (1 ) +3 3 3 3 3 3 9 3n n n n n nq p q p q q− − − − −
× × + × ×= × × + − − × = −× × ×
1 1
2 1 22 +3 3 3n n n np q p q− −+ = + 1 1 1 1
1 2 12 (2 + ) 2 1 (2 + 1)3 3 3n n n n n n n np q p q p q p q− − − −+ = + ∴ + − = −
1 1 1
1 12 1 (2 + 1) 2 13 3n n n nn np q p q p q−+ − = − ∴ + = + 1( ) 2 1 3n n n nE X p q= + = +
2
3
2~ 3, 3X B
( ) ( )3
3
2 1 0,1,2,33 3
k k
kP X k C k
− = = =
X
十年高考+大数据预测
0 1 2 3
随机变量 的数学期望 .
(II)设乙同学上学期间的三天中 7:30 之前到校的天数为 ,则 ,
且 .
由题意知事件 与 互斥,且事件 与 ,事件 与
均相互独立,从而由(I)知:
.
123.(2019 全国 I 理 21)为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进
行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以
甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种
药治愈的白鼠多 4 只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每
轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得 1 分,乙药得 分;若施以乙药的白鼠
治愈且施以甲药的白鼠未治愈则乙药得 1 分,甲药得 分;若都治愈或都未治愈则两种药均得 0 分.甲、
乙两种药的治愈率分别记为 α 和 β,一轮试验中甲药的得分记为 X.
(1)求 的分布列;
(2)若甲药、乙药在试验开始时都赋予 4 分, 表示“甲药的累计得分为 时,最终认为甲药
比乙药更有效”的概率,则 , , ,其中 ,
, .假设 , .
(i)证明: 为等比数列;
(ii)求 ,并根据 的值解释这种试验方案的合理性.
【解析】试题分析:
试题解析:(1)由题意可列分布列:
1−
1−
X
( 0,1, ,8)ip i = i
0 0p = 8 1p = 1 1i i i ip ap bp cp− += + + ( 1,2, ,7)i = ( 1)a P X= = −
( 0)b P X= = ( 1)c P X= = 0.5α = 0.8β =
1{ }i ip p+ − ( 0,1,2, ,7)i =
4p 4p
X
P 1
27
2
9
4
9
8
27
X 2( ) 3 23E X = × =
Y 2~ 3, 3Y B
{ 3, 1} { 2, 0}M X Y X Y= = = = =
{ }3, 1X Y= = { }2, 0X Y= = { }3X = { }1Y = { }2X = { }0Y =
{ } { }( )( ) 3, 1 2, 0P M P X Y X Y= = = = = ( ) ( )3, 1 2, 0P X Y P X Y= = = + = =
( 3) ( 1) ( 2) ( 0)P X P Y P X P Y= = = + = = 8 2 4 1 20
27 9 9 27 243
= × + × =
十年高考+大数据预测
(2)
(ⅰ)由题意可得 , ,
此时 的分布列为:
故 ,即
化简可得: 即 ,
又
故数列 为公比为 4 的等比数列。
(ⅱ)由等比数列求和公式可得:
即 ,
又 ,即 。
此时说明,甲累计得 4 分,乙累计得 0 分,概率极小,符合甲乙两种药物都有效用的说法。
124.(2019 北京理 17)
改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某
校学生上个月 A,B 两种移动支付方式的使用情况,从全校学生中随机抽取了 100 人,发现样本中 A,B 两
种支付方式都不使用的有 5 人,样本仅使用 A 和仅使用 B 的学生的支付金额分布情况如下:
支付金额
支付方式
大于 2000( ]0,1000 ( ]1000,2000
X 1− 0 1
P ( )1 α β− ( )1 2α β αβ− + + ( )1α β−
( ) ( )1 1 0.4a p X α β= = − = − = ( ) ( )0 1 2 0.5b p X α β αβ= = = − + + =
( ) ( )1 1 0.1c p X α β= = = − =
X
X 1− 0 1
P 2
5
1
2
1
10
( )1 1
2 1 1 1,2, ,75 2 10i i i ip p p p i− += + + = ⋅⋅⋅ ( )1 1
2 2 1 1 1,2, ,75 5 10 10i i i ip p p p i− +− = − = ⋅⋅⋅
( )( )1 14 1,2, ,7i i i ip p p p i+ −− = − = ⋅⋅⋅ ( )1
1
4 1,2, ,7i i
i i
p p ip p
+
−
− = = ⋅⋅⋅−
( )1 1
2 1 1 1,2, ,75 2 10i i i ip p p p i− += + + = ⋅⋅⋅
{ }( )1 0,1, ,7i ip p i+ − = ⋅⋅⋅
( ) ( ) ( ) ( )( )8
1 0
8 0 1 0 2 1 8 7
1 4
1 4
p p
p p p p p p p p
− −
− = − + − +⋅⋅⋅+ − = −
( )8
1 1 8
4 1 31 3 4 1p p
−
= ⇒ = −
( ) ( ) ( )( )4
1 0
4 0 1 0 4 3
1 4
1 4
p p
p p p p p p
− −
− = − +⋅⋅⋅+ − = −
( )4
8
4 4
3 4 1 14 1
3 4 1p
−−= = +
十年高考+大数据预测
仅使用 A 18 人 9 人 3 人
仅使用 B 10 人 14 人 1 人
(Ⅰ)从全校学生中随机抽取 1 人,估计该学生上个月 A,B 两个支付方式都使用的概率;
(Ⅱ)从样本仅使用 A 和仅使用 B 的学生中各随机抽取 1 人,以 X 表示这 2 人中上个月支付金额大于 1000
元的人数,求 X 的分布列和数学期望;
(Ⅲ)已知上个月样本学生的支付方式在本月没有变化,现从样本仅使用 A 的学生中,随机抽查 3 人,发
现他们本月的支付金额大于 2000 元.根据抽查结果,能否认为样本仅使用 A 的学生中本月支付金额大于 2000
元的人数有变化?说明理由.
【解析】(Ⅰ)由题意可知,两种支付方式都是用的人数为: 人,则:
该学生上个月 A,B 两种支付方式都使用的概率 .
(Ⅱ)由题意可知,仅使用 A 支付方法的学生中,金额不大于 1000 的人数占 ,金额大于 1000 的人数占 ,
仅使用 B 支付方法的学生中,金额不大于 1000 的人数占 ,金额大于 1000 的人数占 ,且 X 可能的取值
为 0,1,2,
, , ,
X 的分布列为:
X 0 1 2
其数学期望: .
(Ⅲ)我们不认为样本仅使用 A 的学生中本月支付金额大于 2000 元的人数有变化.理由如下:
随机事件在一次随机实验中是否发生是随机的,是不能预知的,随着试验次数的增多,频率越来越稳定于
概率.
学校是一个相对消费稳定的地方,每个学生根据自己的实际情况每个月的消费应该相对固定,出现题中这
种现象可能是发生了“小概率事件”.
125.(2018 北京理)电影公司随机收集了电影的有关数据,经分类整理得到下表:
电影类型 第一类 第二类 第三类 第四类 第五类 第六类
100 30 25 5 40− − − =
40 2
100 5p = =
3
5
2
5
2
5
3
5
( ) 3 2 60 5 5 25p X = = × = ( ) 2 23 2 131 5 5 25p X = = + =
( ) 3 2 62 5 5 25p X = = × =
( )p X 6
25
13
25
6
25
( ) 6 13 60 1 2 125 25 25E X = × + × + × =
十年高考+大数据预测
电影部数 140 50 300 200 800 510
好评率 0.4 0.2 0.15 0.25 0.2 0.1
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.
假设所有电影是否获得好评相互独立.
(1)从电影公司收集的电影中随机选取 1 部,求这部电影是获得好评的第四类电影的概率;
(2)从第四类电影和第五类电影中各随机选取 1 部,估计恰有 1 部获得好评的概率;
(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“ ”表示第 类电影得到
人们喜欢,“ ”表示第 k 类电影没有得到人们喜欢( =1,2,3,4,5,6).写出方差 , ,
, , , 的大小关系.
【解析】(1)由题意知,样本中电影的总部数是 140+50+300+200+800+510=2000,
第四类电影中获得好评的电影部数是 200×0.25=50,故所求概率为 .
(2)设事件 A 为“从第四类电影中随机选出的电影获得好评”,事件 B 为“从第五类电影中随机选出的电影获得
好评”.
故所求概率为 = .
由题意知: 估计为 0.25, 估计为 0.2,故所求概率估计为 0.25×0.8+0.75×0.2=0.35.
(3) > > = > > .
126.(2018 全国Ⅰ理)某工厂的某种产品成箱包装,每箱 200 件,每一箱产品在交付用户之前要对产品作
检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取 20 件作检验,再根据检验结果
决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为 ,且各件产品是否为不
合格品相互独立.
(1)记 20 件产品中恰有 2 件不合格品的概率为 ,求 的最大值点 .
(2)现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以(1)中确定的 作为 的值.已知每件产品的检
验费用为 2 元,若有不合格品进入用户手中,则工厂要对每件不合格品支付 25 元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 ,求 ;
(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
【解析】(1)20 件产品中恰有 2 件不合格品的概率为 .因此
1k
ξ = k
0k
ξ = k 1Dξ 2Dξ
3Dξ 4Dξ 5Dξ 6Dξ
50 0.0252000
=
( ) ( ) ( )P AB AB P AB P AB+ = + ( )(1 ( )) (1 ( )) ( )P A P B P A P B− + −
( )P A ( )P B
1Dξ 4Dξ 2Dξ 5Dξ 3Dξ 6Dξ
)10(
(0.1,1)p∈ ( ) 0f p′ < ( )f p 0 0.1p = 0.1p = Y (180,0.1)Y B 20 2 25X Y= × + 40 25X Y= + (40 25 ) 40 25 490EX E Y EY= + = + = 400EX >
X
3
4 3
3
7
C C( ) C
k k
P X k
−⋅= = k
X
X
P 1
35
12
35
18
35
4
35
X 1 12 18 4 12( ) 0 1 2 335 35 35 35 7E X = × + × + × + × =
B C
十年高考+大数据预测
3 人中,睡眠充足的员工有 2 人,睡眠不足的员工有 1 人”,则 ,且 与 互斥,
由(i)知, , ,故 .
所以,事件 发生的概率为 .
128.(2017 新课标Ⅲ理)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶 4 元,售价每瓶 6
元,未售出的酸奶降价处理,以每瓶 2 元的价格当天全部处理完.根据往年销售经验,每天需求量与当天
最高气温(单位:℃)有关.如果最高气温不低于 25,需求量为 500 瓶;如果最高气温位于区间[20,25),需
求量为 300 瓶;如果最高气温低于 20,需求量为 200 瓶.为了确定六月份的订购计划,统计了前三年六月
份各天的最高气温数据,得下面的频数分布表:
最高气温 [10,15) [15,20) [20,25) [25,30) [30,35) [35,40)
天数 2 16 36 25 7 4
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量 (单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为 (单位:元),当六月份这种酸奶一天的进货量 (单位:瓶)为多少
时, 的数学期望达到最大值?
【解析】(1)由题意知, 所有的可能取值为 200,300,500,由表格数据知
, ,
.
因此 的分布列为
0.2 0.4 0.4
(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,
因此只需考虑
当 时,
若最高气温不低于25,则 ;
若最高气温位于区间 ,则 ;
若最高气温低于20,则 ;
因此 .
A B C= B C
( ) ( 2)P B p X= = ( ) ( 1)P C P X= = 6( ) ( ) ( 2) ( 1) 7P A P B C P X P X= = = + = =
A 6
7
X
Y n
Y
X
( ) 2 16200 0.290P X
+= = = ( ) 36300 0.490P X = = =
( ) 25 7 4500 0.490P X
+ += = =
X
X 200 300 500
P
200 500n≤ ≤
300 500n≤ ≤
6 4 2Y n n n= − =
[20,25) 6 300 2( 200) 4 1200 2Y n n n= × + − − = −
6 200 2( 200) 4 800 2Y n n n= × + − − = −
2 0.4 (1200 2 ) 0.4 (800 2 ) 0.2 640 0.4EY n n n n= × + − × + − × = −
十年高考+大数据预测
当 时,
若最高气温不低于20,则 ;
若最高气温低于20,则 ;
因此 .
所以 时, 的数学期望达到最大值,最大值为520元.
129.(2017 江苏理)已知一个口袋有 个白球, 个黑球( , , ),这些球除颜色外全部
相同.现将口袋中的球随机的逐个取出,并放入如图所示的编号为 1,2,3,…, 的抽屉内,其中第
次取球放入编号为 的抽屉( =1,2,3,…, ).
1 2 3 …
(1)试求编号为 2 的抽屉内放的是黑球的概率 ;
(2)随机变量 表示最后一个取出的黑球所在抽屉编号的倒数, 是 的数学期望,证明
.
【解析】(1)编号为 2 的抽屉内放的是黑球的概率 为: .
(2)随机变量 的概率分布为:
… …
… …
随机变量 的期望为: .
所以
, .
200 300n
十年高考+大数据预测
145.(2012 山东理)现有甲、乙两个靶,某射手向甲靶射击一次,命中的概率为 ,命中得 分,没有命
中得 分;向乙靶射击两次,每次命中的概率是 ,每命中一次得 分,没命中得 分.该射手每次射击
的结果相互独立.假设该射手完成以上三次射击.
(Ⅰ)求该射手恰好命中一次的概率;
(Ⅱ)求该射手的总得分 的分布列及数学期望 .
【解析】(Ⅰ)记:“该射手恰好命中一次”为事件 A,“该射手射击甲靶命中”为事件 B, “该射手第一
次射击乙靶命中”为事件 C,“该射手第二次射击乙靶命中”为事件 D,由题意可知 ,
,由于
= ;
(Ⅱ)
,
X 0 1 2 3 4 5
P
EX=0× +1× +2× +3× +4× +5× = .
146.(2012 福建理)受轿车在保修期内维修费等因素的影响,企业生产每辆轿车的利润与该轿车首次出现
故障的时间有关,某轿车制造厂生产甲、乙两种品牌轿车,保修期均为 2 年,现从该厂已售出的两种品牌
轿车中各随机抽取 50 辆,统计数据如下:
品牌 甲 乙
首次出现故
障时间 (年)
轿车数量(辆) 2 3 45 5 45
每辆利润(万元) 1 2 3 1.8 2.9
将频率视为概率,解答下列问题:
(I)从该厂生产的甲品牌轿车中随机抽取一辆,求其首次出现故障发生在保修期内的概率;
(II)若该厂生产的轿车均能售出,记生产一辆甲品牌轿车的利润为 ,生产一辆乙品牌轿车的利润为
4
3 1
0 3
2 2 0
X EX
5,4,3,2,1,0=X
9
1
3
2
3
1
4
1)2(,12
1)3
1(4
3)1(.36
1)3
1(4
1)0( 1
2
22 =⋅===⋅===⋅== CXPXPXP
3
1)3
2(4
3)5(,9
1)3
2(4
1)4(,3
1
3
2
3
1
4
3)3( 221
2 =⋅===⋅===⋅== XPXPCXP
36
1
12
1
9
1
3
1
9
1
3
1
36
1
12
1
9
1
3
1
9
1
3
1
12
5312
41 =
3( ) 4P B =
2( ) ( ) 3P C P D= = A BCD BCD BCD= + +
( ) ( )P A P BCD BCD BCD= + + 7
36
x
0 1x< 1 2x< 2x > 0 2x< 2x >
1X
十年高考+大数据预测
,分别求 , 的分布列;
(III)该厂预计今后这两种品牌轿车销量相当,由于资金限制,只能生产其中一种品牌的轿车,若从经济
效益的角度考虑,你认为应该生产哪种品牌的轿车?说明理由.
【解析】(I)设“甲品牌轿车首次出现故障发生在保修期内”为事件 A,则 .
(II)依题意 , 的分布列分别如下:
1 2 3 1.8 2.9
(III)由(II)得 (万元 ),
(万元 ),∵ ,∴应生产甲品牌轿车.
147.(2011 北京理)以下茎叶图记录了甲、乙两组个四名同学的植树棵树.乙组记录中有一个数据模糊,
无法确认,在图中以 X 表示.
(Ⅰ)如果 X=8,求乙组同学植树棵树的平均数和方差;
(Ⅱ)如果 X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树 Y 的分布列和数学
期望.(注:方差 ,其中 为 , ,…… 的平均数)
【解析】(Ⅰ)当 X=8 时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,
所以平均数为
方差为
(Ⅱ)当 X=9 时,由茎叶图可知,甲组同学的植树棵树是:9,9,11,11;乙组同学的植树棵数是:9,8,
9,10.分别从甲、乙两组中随机选取一名同学,共有 4×4=16 种可能的结果,这两名同学植树总棵数 Y 的
可能取值为 17,18,19,20,21 事件“Y=17”等价于“甲组选出的同学植树 9 棵,乙组选出的同学植树 8 棵”
1 1 1 0
9 9 0 X 8 9
乙组甲组
2X 1X 2X
2 3 1( ) 50 10P A
+= =
1X 2X
1X 2X
P 1
25
3
50
9
10
P 1
10
9
10
1
1 3 9( ) 1 2 3 2.8625 50 10E X = × + × + × = 2
1 9( ) 1.8 2.9 2.7910 10E X = × + × =
1 2( ) ( )E X E X>
( ) ( ) ( )2 2 22
1 2
1
ns x x x x x xn
= − + − + + − x 1x 2x nx
8 8 9 10 35;4 4x
+ + += =
.16
11])4
3510()4
359()4
358()4
358[(4
1 22222 =−+−+−+−=s
十年高考+大数据预测
所以该事件有 2 种可能的结果,因此 P(Y=17)=
同理可得
所以随机变量 Y 的分布列为:
Y 17 18 19 20 21
P
EY=17×P(Y=17)+18×P(Y=18)+19×P(Y=19)+20×P(Y=20)+21×P(Y=21)=17× +18× +19× +20×
+21× =19.
148.(2011 江西理)某饮料公司招聘了一名员工,现对其进行一项测试,以使确定工资级别,公司准备了
两种不同的饮料共 8 杯,其颜色完全相同,并且其中 4 杯为 A 饮料,另外 4 杯为 B 饮料,公司要求此员工
一一品尝后,从 8 杯饮料中选出 4 杯 A 饮料,若 4 杯都选对,则月工资定为 3500 元,若 4 杯选对 3 杯,则
月工资定为 2800 元,否则月工资定为 2100 元,令 X 表示此人选对 A 饮料的杯数,假设此人对 A 和 B 两种
饮料没有鉴别能力.
(1)求 X 的分布列;
(2)求此员工月工资的期望.
【解析】(1)X 的所有可能取值为:0,1,2,3,4,
即
X 0 1 2 3 4
P
(2)令 Y 表示新录用员工的月工资,则 Y 的所有可能取值为 2100,2800,3500,则
所以新录用员工月工资的期望为 2280 元.
149.(2015 湖北理)设 , ,这两个正态分布密度曲线如图所示.下列结
论中正确的是
.8
1
16
2 =
;4
1)18( ==YP ;4
1)19( ==YP .8
1)21(;4
1)20( ==== YPYP
8
1
4
1
4
1
4
1
8
1
8
1
4
1
4
1
4
1
8
1
1 4
4 4
4
5
( ) ( 0,1,2,3,4)
iC CP X i iC
−
= = =
1
70
16
70
36
70
16
70
1
70
1 8( 3500) ( 4) , ( 2800) ( 3) ,70 35
53 1 16 53( 2100) ( 2) , 3500 2800 2100 2280 .70 70 70 70
P Y P X P Y P X
P Y P X EY
= = = = = = = =
= = ≤ = = × + × + × =
2
1 1( , )X N µ σ
2
2 2( , )Y N µ σ
十年高考+大数据预测
A. B.
C.对任意正数 , D.对任意正数 ,
【答案】C【解析】由正态分布密度曲线的性质可知, , 的密度曲线分别关
于直线 , 对称,因此结合题中所给图象可得, ,所以 ,故
错误.又 得密度曲线较 的密度曲线“瘦高”,所以 ,所以
,B 错误.对任意正数 , , ,C 正确,D
错误.
150.(2015 山东理)已知某批零件的长度误差(单位:毫米)服从正态分布 ,从中随机取一件,
其长度误差落在区间 内的概率为( )
(附:若随机变量 服从正态分布 ,则 ,
)
A.4.56% B.13.59% C.27.18% D.31.74%
【答案】B【解析】 .
151.(2014 新课标 II 理)某地区空气质量监测资料表明,一天的空气质量为优良的概率是 0.75,连续两
天为优良的概率是 0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是
A.0.8 B.0.75 C.0.6 D.0.45
【答案】A【解析】根据条件概率公式 ,可得所求概率为 .
152.(2011 湖北理)已知随机变量 服从正态分布 ,且 ,则 ( )
A. B. C. D.
【答案】C【解析】如图,正态分布的密度函数示意图所示,函数关于直线 对称,所以
,并且 ,则
ξ ( )2,2 σN ( ) 8.04 =