第 2 讲 三角函数的图象与性质
考点 1 正态分布
例 1.(1)已知随机变量ξ服从正态分布 N(4,σ2),若 P(ξ<2)=0.3,则 P(2<ξ<6)
=__________.
【答案】0.4
【解析】 随机变量 服从正态分布 2(4, )N ,其对称轴方程为 4x ,
又 ( 2) 0.3P , ( 6) ( 2) 0.3P P ,则 (2 6) 1 2 0.3 0.4P .故答案为:0.4.
【点睛】本题考查了正态分布曲线的特点及曲线所表示的意义,考查正态分布中两个量 和
的应用,考查曲线的对称性.
(2) 设 随 机 变 量 ,1N , 函 数 2 2f x x x 没 有 零 点 的 概 率 是 0.5 , 则
0 1P _____________ 附 : 若 2,N , 则 0.6826P X ,
2 2 0.9544P X .
【答案】 0.1359
【解析】 函数 2 2f x x x 没有零点,二次方程 2 2 0x x 无实根,
4 4( ) 0 , 1 ,又 2 2f x x x 没有零点的概率是 0.5,
( 1) 0.5P ,由正态曲线的对称性知 1 , 1,1N , 1, 1 ,
2, 0, 2 3, 2 1 ,
( 2 0) 0.6826P , ( 3 1) 0.9544P ,
1 1(0 1) ( 3 1) ( 2 0) 0.9544 0.6826 0.13592 2P P P ,故答
案为: 0.1359 .
【点睛】本题考查了正态分布的曲线的性质,二次方程的解等知识点,考查运算求解能力;
解本题的方法是根据 ( )f x 没有零点得到 1 ,再结合正态分布的图象的对称性得到 值,
然后再利用正态分布函数图象的性质求解即可;解题的关键点是要熟知正态分布函数图象的
对称性.
【跟踪演练】1.
(1)六安市一次高三年数学统考,经过抽样分析,成绩 X 近似服从正态分布 2110,N ,且
(90 X 110) 0.3P .某校有 800 人参加此次统考,估计该校数学成绩不低于130分的人
数为__________.数据参考:若T 服从正态分布 2( , )N ,则 ( ) 0.6827P T ,
2 2 0.9545P T , 3 3 0.9973P T
【答案】160
【解析】因为成绩 X 近似服从正态分布 2110,N ,且 (90 X 110) 0.3P ,
所以 1 2 (90 X 110)(X 130) 0.22
PP ,因此该校数学成绩不低于130分的人数为
800 0.2 160 .故答案为:160 .
(2)设随机变量 服从正态分布 3,4N ,若 2 3 2P a P a ,则实数 a 的值
为( )
A. 5 B. 3 C. 5
3
D. 7
3
【答案】D
【解析】因为随机变量 服从正态分布 3,4N , 2 3 2P a P a ,
根据正态分布的特征,可得 2 3 2 6a a ,解得 7
3a .故选:D.
考点 2 独立性检验
例 2.(1)2019 年 4 月,江苏省发布了高考综合改革实施方案,试行“3 1 2 ”高考新模式.
为调研新高考模式下,某校学生选择物理或历史与性别是否有关,统计了该校高三年级 800
名学生的选科情况,部分数据如下表:
性别
科目
男生 女生 合计
物理 300
历史 150
合计 400 800
根据所给数据完成上述表格,有_____________的把握认为该校学生选择物理或历史与性别有
关;
附:
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
2( )P K k 0.050 0.010 0.001
k 3.8410 6.635 10.828
【解析】
性别
科目
男生 女生 合计
物理 300 250 550
历史 100 150 250
合计 400 400 800
2
2 800 (300 150 250 100) 160 10.828550 250 400 400 11K
故有99.9% 的把握认为该校学生选择物理或历史与性别有关. 故答案为:99.9%
(2)2019 年 4 月,江苏省发布了高考综合改革实施方案,试行“ 3 1 2 ”高考新模式.为调
硏新高考模式下,某校学生选择物理或历史与性别是否有关,统计了该校高三年级 800 名学
生的选科情况,部分数据如下表:
性别
科目 男生 女生 合计
物理 300
历史 150
合计 400 800
(1)根据所给数据完成上述表格,并判断是否有 99.9%的把握认为该校学生选择物理或历史
与性别有关;
(2)该校为了提高选择历史科目学生的数学学习兴趣,用分层抽样的方法从该类学生中抽取
5 人,组成数学学习小组.一段时间后,从该小组中抽取 3 人汇报数学学习心得.记 3 人中男
生人数为 X,求 X 的分布列和数学期望 ( )E X .
附:
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
2P K k
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)表格答案见解析,有 99.9%的把握认为该校学生选择物理或历史与性别有关;(2)
分布列答案见解析,数学期望: 6
5
.
【解析】(1)
性别
科目 男生 女生 合计
物理 300 250 550
历史 100 150 250
合计 400 400 800
因为
2 2
2 800 (300 150 250 100) (450 250) 160 10.828550 250 400 400 55 25 2 11K
,
所以有 99.9%的把握认为该校学生选择物理或历史与性别有关.
(2)按照分层抽样的方法,抽取男生 2 人,女生 3 人.
随机变量 X 的所有可能取值为 0,1,2.
所以
0 3
2 3
3
5
1( 0) 10
C CP X C
,
1
2 3
3
2
5
3( 1) 5
C CP X C
,
5
12
2 3
3
3( 2) 10
C CP X C
.
所以 X 的分布列为
X 0 1 2
P 1
10
3
5
3
10
所以 1 3 3 6( ) 0 1 210 5 10 5E X .答:x 的数学期望为 6
5
.
【跟踪演练】2.
(1)在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取
了100名学生对线上教学效果进行评分(满分 100 分),记低于80 的评分为“效果一般”,不
低于80 分为“效果较好”.请补充完整 2 2 列联表;通过计算判断,有没有_________的把
握认为线上教学效果评分为“效果较好”与性别有关?
效果一般 效果较好 合计
男 20
女 15 55
合计
【答案】列联表见解析;有99%的把握认为线上教学效果评分为“效果较好”与性别有关;
【解析】由题意,补充后的列联表为
效果一般 效果较好 合计
男 25 20 45
女 15 40 55
合计 40 60 100
则 2
2 100 25 40 15 20 8.249 6.63540 60 4 5 55K
,
因此有99%的把握认为线上教学效果评分为“效果较好”与性别有关.
(2)随着视频传输和移动通信技术的日益成熟、以及新冠疫情的推动,直播+电商的模式正在
全球范围内掀起热潮.目前,国际上 Amazon、Rakuten 等电商平台和以 Facebook 为代表的社
交类平台都纷纷上线了直播电商业务;在国内,淘宝、京东、抖音、拼多多、苏宁等众多平
台都已成为该赛道内的玩家.根据中研产业研究院《2020—2025 年中国直播电商行业市场深
度分析及投资战略咨询研究报告》显示,2020 年上半年,“直播经济”业态主要岗位的人才
达到 2019 年同期的 2.4 倍;2020 年“6.18”期间,带货主播和直播运营两大岗位高达去年
同期的 11.6 倍.针对这一市场现象,为了加强监管,相关管理部门推出了针对电商的商品和
服务的评价体系.现从评价系统中选出 200 次成功交易,并对其评价进行统计,对商品的好
评率为 0.6,对服务的好评率为 0.75,其中对商品和服务都做出好评的交易为 80 次.
(1)请完成关于商品和服务评价的 2×2 列联表,并判断能否在犯错误的概率不超过 0.001
的前提下,认为商品好评与服务好评有关?
对服务好评 对服务不满意 合计
对商品好评 80
对商品不满意 10
合计 200
(2)若将频率视为概率,某人在该购物平台上进行的 3 次购物中,设对商品和服务全为好评
的次数为随机变量 X,求对商品和服务全为好评的次数 X 的分布列和数学期望.
附临界值表:
P(K2≥k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k 2.072 2.706 3.841 5.024 6.635 7.879 10.828
K2 的观测值:
2( )
( )( )( )( )
n ad bck a b c d a c b d
(其中 n=a+b+c+d)
【解析】:(1)由题意可得关于商品和服务评价的 2×2 列联表如下:
,
故能在犯错误的概率不超过 0.001 的前提下,认为商品好评与服务好评有关;
(2)每次购物中,对商品和服务全为好评的概率为 2
5
,且 X 的取值可以是 0,1,2,3,
其中
X 的分布列为:
由于 X~B ,则 X 的数学期望
考点 3 回归分析
例 3.(多选)(1)关于变量 x,y 的 n 个样本点 1 1 2 2( , ),( , ), ,( , )n nx y x y x y 及其线性回归方
程. ˆˆ ˆ,y bx a 下列说法正确的有( )
A.相关系数 r 的绝对值|r|越接近 0,表示 x,y 的线性相关程度越强
B.相关指数 2R 的值越接近 1,表示线性回归方程拟合效果越好
C.残差平方和越大,表示线性回归方程拟合效果越好
D.若
1 1
1 1,
n n
i i
i i
x x y yn n
,则点 ( , ).x y 一定在线性回归方程 ˆˆ ˆy bx a 上
【答案】BD
【解析】根据线性相关系数的意义可知,当 r 的绝对值越接近于 0 时,
两个随机变量线性相关性越弱,则 A 错误;
用相关指数 2R 来刻画回归效果,
2R 越大,说明模型的拟合效果越好,则 B 正确;
拟合效果的好坏是由残差平方和来体现的,
残差平方和越大,拟合效果越差,则 C 错误;
样本中心点一定在回归直线上,则 D 正确.
故选:BD.
(2)红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现
收集到一只红铃虫的产卵数 y(个)和温度 x(℃)的 8 组观测数据,制成图 1 所示的散点图.现
用两种模型① ebx ay ,② 2y cx d 分别进行拟合,由此得到相应的回归方程并进行残差
分析,进一步得到图 2 所示的残差图.
根据收集到的数据,计算得到如下值:
x z t
8
2
1
( )i
i
x x
8
2
1
( )i
i
t t
8
1
( )( )i i
i
z z x x
8
1
( )( )i i
i
y y t t
25 2.89 646 168 422688 48.48 70308
表中 lni iz y ;
8
1
1
8 i
i
z z
; 2
i it x ;
8
1
1
8 i
i
t t
;
(1)根据残差图,比较模型①、②的拟合效果,应选择哪个模型?并说明理由;
(2)根据(1)中所选择的模型,求出 y 关于 x 的回归方程(计算过程中四舍五入保留两位
小数),并求温度为 34℃时,产卵数 y 的预报值.
参考数据: 5.41e 224 , 5.50e 245 , 5.59e 268 .
附:对于一组数据( 1 , 1v ),( 2 , 2v ),…,( n , nv ),其回归直线 ˆˆˆv 的斜率和
截距的最小二乘估计分别为 1
1
2 2
ˆ
n
i i
i
i
n
i
v n v
n
, ˆˆ v .
【解析】:(1)应该选择模型①.
由于模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度
窄,所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适.
(2)令 lnz y ,z 与温度 x 可以用线性回归方程来拟合,则 ˆˆˆz a bx .
88
1 1
8 8
1 1
2 2 2
ˆ 48.48 0.29168
i i
i i
i
i i
i i
i
x x z z
b
x
x z nx z
n xx x
,
所以 ˆˆ 2.89 0.29 25 4.36a z bx ,
则 z 关于 x 的线性回归方程为 ˆ 0.29 4.36z x .
于是有 ln 0.29 4.36y x ,
所以产卵数 y 关于温度 x 的回归方程为 0.29 4.36ˆ e xy
当 34x 时, 0.29 34 4.36 5.50e e 245y (个)
【点睛】本题考查了利用表格数据选择合适的数学模型,并确定模型中的参数值,进而应用
模型计算预测值.
【跟踪演练】3.
(1)为促进就业,提升经济活力,2020 年我国多个城市开始松绑“地摊经济”, A 市自大力发
展“地摊经济”以来,夜市也火了起来,下表是 A 市 2020 年月份代码 x 与夜市的地摊摊位
数 y (单位:万个)的统计数据:
月份 4 月 5 月 6 月 7 月 8 月
月份代码 x 1 2 3 4 5
摊位数 y (万个) 290 330 t 440 480
若 y 与 x 线性相关,且求得其线性回归方程为 ˆ 230 50y x ,则表中t 的值为_________
【答案】360
【解析】由题意,根据表格中的数据,可得 1 2 3 4 5 35x ,
代入 ˆ 230 50y x ,可得 230 50 3=380y ,
又由 1 290 330 440 480 3805 t ,解得 360t .故答案为:360.
(2)经验表明,在室温 25 C 下,85 C 开水冷至 35C 到 40 C (温水)饮用对身体更有益.某
研究人员每隔1min 测量一次开水温度(如下表),经过 minx 后的温度为 Cy .现给出以下 2
个函数模型:
① 25( ,0 1, 0)ay kx k R a x ;② 25( ,0 1, 0)xy ka k R a x ,
其中 a 为温度衰减比例,计算公式为
1 1
251 ( )5 25i
n
i
i
ya i Ny
.
开水温度变化
时间 / minx 0 1 2 3 4 5
水温 / Cy 85 79 75 71 68 65
(1)请选择一个恰当的函数模型描述 ,x y 之间的关系,并求出 k;
(2)求 a 值(a 保留 0.01);
(3)在 25 C 室温下,85 C 开水至少大约放置多长时间(单位:min ,保留整数)才能冷至
到对身体有益温度?(参考数据: 16.6
1 40.92
, 21.5
1 60.92
)
【答案】(1)应该选择②,k 的值为 60;(2) 0.92 ;(3)17min .
【解析】(1)若选择① 25( ,0 1, 0)ay kx k R a x ,把 0x 代入得 25 85y 矛
盾;若选择② 25( ,0 1, 0)xy ka k R a x ,把 0, 85x y 代入,得 60k .
所以选择② 25( ,0 1, 0)xy ka k R a x ,其中 k 的值为 60.
(2)
5
1 1
251 1 54 50 46 43 40
5 25 5 60 54 50 46 43
i
i i
ya y
0.92
(3)由(1)(2)知,x、y 之间的关系为 60 0.92 25xy ,
因为85 C 开水冷至35 C 到 40 C (温水)饮用对身体更有益,
所以35 60 0.92 25 40x ,有 1 10.926 4
x ,即 14 60.92x ,
又 16.6 21.5
1 14, 60.92 0.92
,得16.6 21.5x ,
所以在 25 C 室温下,85 C 开水至少大约放置17min 才能冷至到对身体有益温度.
【仿真练习】
一、单项选择题:本题共 6 小题,每小题 5 分,共 30 分.在每小题给出的四个选项中,只
有一项是符合题目要求的.
1.已知随机变量 2~ 1,X N , 0 0.8P X ,则 2P X ( )
A.0.2 B.0.4
C.0.6 D.0.8
【答案】A
【解析】由 2~ 1,X N ,知随机变量 X 的分布函数图象关于 1X 对称,
所以 ( 2) 0 1 ( 0) 0.2P X P X P X ;故选:A.
2.某校一次高三年级数学检测,经抽样分析,成绩 占近似服从正态分布 295,N ,且
(91 95) 0.25P .若该校有 700 人参加此次检测,估计该校此次检测数学成绩不低于
99 分的人数为( )
A.100 B.125 C.150 D.175
【答案】D
【解析】由题意,成绩 X 近似服从正态分布 295,N ,则正态分布曲线的对称轴为 95X ,
又由 (91 95) 0.25P ,根据正态分布曲线的对称性,可得
1 199 [1 2 (91 95)] 1 2 0.25 0.252 2P X P X ,
所以该市某校有 700 人中,估计该校数学成绩不低于 99 分的人数为 700 0.25 175 人,
故选:D.
3.某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x (单位: C )的关系,在
20 个不同的温度条件下进行种子发芽实验,由实验数据 , 1, 2 , , 20i ix y i 得到下面的散
点图:
由此散点图,在10 C 至 40 C 之间,下面四个回归方程类型中最适宜作为发芽率 y 和温度 x 的
回归方程类型的是 ( )
A.y a bx B. 2y a bx C. exy a b D. lny a b x
【答案】D
【解析】由散点图分布可知,散点图分布在一个对数函数的图像附近,因此,最适合作为发
芽率 y 和温度 x 的回归方程类型的是 lny a b x ,故选:D.
4.2020 年 12 月 30 日,国家药品监督管理局附条件批准国药集团中国生物北京生物制品研究
所有限责任公司的新型冠状病毒灭活疫苗(Vero 细胞)注册申请.该疫苗是首家获批的国产
新冠病毒灭活疫苗,适用于预防由新型冠状病毒感染引起的疾病( 19COVID ). 2021年1
月 3 日,北京市人民政府新闻办公室召开疫情防控第 200 场例行新闻发布会,表示不在
18 59 岁接种年龄段范围的人员,需要等待进一步临床试验数据.近日专家对该年龄内和该
年龄段外的110人进行了临床试验,得到如下 2 2 列联表:
能接种 不能接种 总计
18 59 岁内 40 20 60
18 59 岁外 20 30 50
总计 60 50 110
附:
2
2 n ac bdK a b c d a c b d
,其中 n a b c d ;
2P K k 0.050 0.010 0.001
k 3.841 6.635 10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过 0.1% 的前提下,认为“能接种与年龄段无关”
B.在犯错误的概率不超过 0.1% 的前提下,认为“能接种与年龄段有关”
C.有99% 以上的把握认为“能接种与年龄段无关”
D.有99% 以上的把握认为“能接种与年龄段有关”
【答案】D
【解析】由 2 2 列联表可得 2
2 110 40 30 20 20 7.82260 50 60 50K
由 6.635 7.822 10.828
所以在犯错误的概率不超过1% 的前提下,认为“能接种与年龄段有关”
即有99% 以上的把握认为“能接种与年龄段有关 故选:D
5.设 2
1 1( , )X N , 2
2 2( , )Y N ,这两个正态分布密度曲线如图所示.下列结论中
正确的是
A. 2 1( ) ( )P Y P Y ≥ ≥ ≥ B. 2 1( ) ( )P X P X ≤ ≤ ≤
C.对任意正数 t , ( ) ( )P X t P Y t≤ ≥ ≤ D.对任意正数 t , ( ) ( )P X t P Y t≥ ≥ ≥
【答案】C
【解析】由正态分布密度曲线的性质可知, 2
1 1( , )X N , 2
2 2( , )Y N 的密度曲线分
别关于直线 1x = , 2x = 对称,因此结合题中所给图象可得, 1 2 < ,所以 2 1( ) ( )P Y P Y ≤ ≤ ,B 错误.对任意正数t ,
( ) ( )P X t P Y t≤ ≥ ≤ , ( ) ( )P X t P Y t≥ ≥ ≥ ,C 正确,D 错误. 故选:C
二、多项选择题:本题共 3 小题,每小题 5 分,共 15 分.在每小题给出的选项中,有多项
符合题目要求,全部选对的得 5 分,有选错的得 0 分,部分选对的得 3 分.
6.因防疫的需要,多数大学开学后启用封闭式管理.某大学开学后也启用封闭式管理,该校
有在校学生 9000 人,其中男生 4000 人,女生 5000 人,为了解学生在封闭式管理期间对学校
的管理和服务的满意度,随机调查了 40 名男生和 50 名女生,每位被调查的学生都对学校的
管理和服务给出了满意或不满意的评价,经统计得到如下列联表:
满意 不满意
男 20 20
女 40 10
附表:
P(K2
≥
k)
0.100 0.05 0.025 0.010 0.001
k 2.706 3 .841 5.024 6.635 10.828
附:
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
以下说法正确的有( )
A.满意度的调查过程采用了分层抽样的抽样方法
B.该学校学生对学校的管理和服务满意的概率的估计值为 0.6
C.有 99%的把握认为学生对学校的管理和服务满意与否与性别有关系
D.没有 99%的把握认为学生对学校的管理和服务满意与否与性别有关系
【答案】AC
【解析】因为男女比例为 4000︰5000,故 A 正确.满意的频率为 20 40 2 0.66790 3
,所以
该学校学生对学校的管理和服务满意的概率的估计值约为 0.667,所以 B 错误.
由列联表
2
2 90 (20 10 20 40) 9 6.63540 50 60 30K
,故有 99%的把握认为学生对学校的管理和
服务满意与否与性别有关系,所以 C 正确,D 错误.
故选:AC.
7. 2020 年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交
易却“逆市”而行.下图是该地某小区 2019 年12 月至 2020 年12 月间,当月在售二手房均
价(单位:万元/平方米)的散点图.(图中月份代码1 13 分别对应 2019 年12 月 2020 年12
月)
根据散点图选择 y a b x 和 lny c d x 两个模型进行拟合,经过数据处理得到的两个
回归方程分别为 0.9369 0.0285y x 和 0.9554 0.0306lny x ,并得到以下一些统计
量的值:
0.9369 0.0285y x 0.9554 0.0306lny x
2R 0.923 0.973
注:x 是样本数据中 x 的平均数, y 是样本数据中 y 的平均数,则下列说法正确的是( )
A.当月在售二手房均价 y 与月份代码 x 呈负相关关系
B.由 0.9369 0.0285y x 预测 2021年3 月在售二手房均价约为1.0509万元/平方米
C.曲线 0.9369 0.0285y x 与 0.9554 0.0306lny x 都经过点 ,x y
D.模型 0.9554 0.0306lny x 回归曲线的拟合效果比模型 0.9369 0.0285y x 的好
【答案】BD
【解析】对于 A,散点从左下到右上分布,所以当月在售二手房均价 y 与月份代码 x 呈正相
关关系,故 A 不正确;
对于 B,令 16x ,由, 0.9369 0.0285 16 1.0509y
所以可以预测 2021 年 2 月在售二手房均价约为 1.05091.0509 万元/平方米,故 B 正确;
对于 C,非线性回归曲线不一定经过 ,x y ,故 C 错误;
对于 D, 2R 越大,拟合效果越好,由 0 0.973.923 ,故 D 正确. 故选:BD
三、填空题:本题共 3 小题,每小题 5 分,多空题,第一空 2 分,第二空 3 分,共 15 分.
8. 已 知 随 机 变 量 X 服 从 正 态 分 布 2(1, )N , 且 ( 2) 0.7P X , 则
(0 1)P X __________.
【答案】0.2
【解析】因为随机变量ξ服从正态分布 N(1,o2),所以正态曲线的对称轴是 x=1,
因为 P(X<2)=0.7,所以 P(1<X<2)=0.7-0.5=0.2,
所以 P(0<X<1)=P(1<X<2)=0.2,故答案为:0.2.
9.某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了 200 人进行调查
统计得下方的 2 2 列联表.则根据列联表可知( )
年轻人 非年轻人 总计
经常用流行用 125 25 150
不常用流行用语 35 15 50
总计 160 40 200
参考公式:独立性检验统计量
2
2 ( )
( )( )( )( )
n ad bcX a b c d a c b d
,其中 n a b c d .
下面的临界值表供参考:
2
0P x x
0.15 0.10 0.05 0.025 0.010 0.005 0.001
0x 2.072 2.706 3.841 5.024 6.635 7.879 10.828
有___________的把握认为“经常用流行用语”与“年轻人”有关系
【答案】95%
【解析】
2
2 200 (25 15 25 35) 4.167 3.841160 40 50 150X
,
根据临界值知有 95%的把握认为经常用流行语与年轻人有关系,
故答案为:95%
10.我国为全面建设社会主义现代化国家,制定了从 2021 年到 2025 年的“十四五”规划.某
企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了
解年研发资金投入额 x (单位:亿元)对年盈利额 y (单位:亿元)的影响,研究了“十二
五”和“十三五”规划发展期间近 10 年年研发资金投入额 ix 和年盈利额 iy 的数据.通过对
比分析,建立了两个函数模型:① 2y x ,② x ty e ,其中 , , ,t 均为常数,
e 为自然对数的底数.令 2
i iu x , ln 1,2, ,10i iv y i ,经计算得如下数据:
x y
10 2
1
i
i
x x
10 2
1
i
i
y y
u v
26 215 65 2 680 5.36
10 2
1
i
i
u u
10
1
i i
i
u u y y
10 2
1
i
i
v v
10
1
i i
i
x x v v
11250 130 2.6 12
请从相关系数的角度分析,模型拟合程度更好是________________;利用模型拟合程度更好的
模型以及表中数据,建立 y 关于 x 的回归方程为__________;(系数精确到 0.01)
附 : ① 相 关 系 数 1
2 2
1 1
( )( )
( ) ( )
n
i i
i
nn
i i
i i
x x y y
r
x x y y
, 回 归 直 线 ˆˆ ˆy a bx 中 :
1
2
1
( )( )
ˆ
( )
n
i i
i
n
i
i
x x y y
b
x x
, ˆˆa y bx
【答案】模型 x ty e 的拟合程度更好 0.18 0.56ˆ xy e
【解析】设 iu 和 iy 的相关系数为 1r , ix 和 iv 的相关系数为 2r ,
由题意,
10
1
1 10 102 2
1 1
130 13 0.871511250 2
i i
i
i i
i i
u u y y
r
u u y y
,
10
1
2 10 102 2
1 1
12 12 0.921365 2.6
i i
i
i i
i i
x x v v
r
x x v v
,
则 1 2r r ,因此从相关系数的角度,模型 x ty e 的拟合程度更好.
先建立 v 关于 x 的线性回归方程,由 x ty e ,得 ln y t x ,即 v t x ,
10
1
10 2
1
12ˆ
65
i i
i
i
i
x x v v
x x
,
12ˆˆ 5.36 26 0.5665t v x ,
所以 v 关于 x 的线性回归方程为 ˆ 0.18 0.56v x ,
所以 ˆln 0.18 0.56y x ,则 0.18 0.56ˆ xy e .
四、解答题:本题共 4 小题,共 40 分。解答应写出文字说明、证明过程或演算步骤.
11.2020 年初,武汉出现新型冠状病毒肺炎疫情,并快速席卷我国其他地区,口罩成了重要
的防疫物资.某口罩生产厂不断加大投入,高速生产,现对其 2 月 1 日~2 月 9 日连续 9 天的
日生产量 iy (单位:十万只, 1,2, ,9i )数据作了初步处理,得到如图所示的散点图及
一些统计量的值:
y z
9
1
i i
t
t y
9
1
i i
t
t z
2.72 19 139.09 1095
注:图中日期代码 1~9 分别对应 2 月 1 日~2 月 9 日;表中 iy
iz e ,
9
1
1
9 i
i
z z
.
(1)从 9 个样本点中任意选取 2 个,在 2 个点的日生产量都不高于三十万只的条件下,求 2
个都高于二十万只的概率;
(2)由散点图分析,样本点都集中在曲线 lny bt a 的附近,请求 y 关于 t 的方程
lny bt a ,并估计该厂从什么时候开始日生产量超过四十万只.
参 考 公 式 : 回 归 直 线 方 程 是 v ,
1 1
2 22
1 1
n n
i i i i
i i
n n
i i
i i
v v v n v
n
,
v .参考数据: 4e 54.6 .
【答案】(1) 3
10
;(2) ln 4 1y t ,从 2 月 14 日开始日生产量超过四十万只.
【解析】(1)9 个样本点中日生产量都不高于三十万只的有 5 个,高于二十万只且不高于三
十万只的有 3 个,
设事件 A:所取 2 个点的日生产量都不高于三十万只,
事件 B:所取 2 个点的日生产量高于二十万只,
事件 AB :所取 2 个点的日生产量高于二十万只且不高于三十万只,
则
2
5
2
9
5
18
CP A C
,
2
3
2
9
1
12
CP AB C
,
3
10
P ABP B A P A
.
(2) lny bt a , yz e bt a , 5t ,
9
2
1
285i
i
t
,
9 9
1 1
9 92 22
1 1
2
i i i i i i
i i
i i i
i i
t t z z t z t z z t t z
b
t t t t t t
9
1
9 222
1
9 1095 9 5 19 4285 9 59
i i
i
i
i
t z t z
t t
,
19 4 5 1a z bt , ln 4 1y t .
令 ln 4 1 4t ,解得
4 1 13.94
et ,
14t ,即该厂从 2 月 14 日开始日生产量超过四十万只.
12.团结协作、顽强拼搏的女排精神代代相传.极大地激发了中国人的自豪、自尊和自信.为我
们在实现中华民族伟大复兴的新征程上奋勇前进提供了强大的精神力量.最近.某研究性学习
小组就是否观看过电影《夺冠(中国女排)》对影迷们随机进行了一次抽样调查.其列联表如
表(单位:人).
是 否 合计
青年 40 10 50
中年 30 20 50
合计 70 30 100
(1)根据列联表以及参考公式和数据,能否在犯错误的概率不超过 2.5% 的前提下,认为是
否观看过电影《夺冠(中国女排))与年龄层次有关?
(2)(i)现从样本的中年人中按分层抽样方法取出5人.再从这5人中随机抽取3人.求其中
至少有 2 人观看过电影(夺冠(中国女排》)的概率;
(i i)将频率视为概率.若从众多影迷中随机抽取10人.记其中观看过电影《夺冠(中国女
排))的人数为 .求随机变量 的数学期望及方差.
参考公式:
2
2 n ad bcK a b c d a c b d
.其中 .n a b c d 参考数据:
2
0P K k
0.15 0.10 0.05 0.025 0.010
0k 2.072 2.706 3.841 5.024 6.635
【答案】(1)不能;(2)(i)0.7;(i i)7;2.1.
【解析】(1)由表格数据得.
2
2 100 (40 20 30 10) 100
70 30 50 50 21K
.
因为 100 5 5.02421
.所以不能在犯错误的概率不超过 2.5% 的前提下.认为是否观看过电
影《夺冠(中国女排)》与年龄层次有关.
(2)(i)依题意.从样本的中年人(50人)中按分层抽样的方法取出的5人中.观看过电影
(夺冠(中国女排)》的有 305 350
人.没有观看过的有 2 人.
记抽取的3人中有i 人观看过电影《夺冠(中国女排》为事件 2,3iA i ,则
2 1
3 2
2 3
5
3 2 0.610
C CP A C
;
3
3
3 3
5
1 0.110
CP A C
.
因为 1A 和 2A 互斥,所以抽取的这3人中至少有 2 人观看过电影《夺冠(中国女排)》的概率为
2 2 2 3 0.6 0.1 0.7P A A P A P A .
(i i)由列联表可知,观看过电影《夺冠(中国女排)》的频率为 70 =0.7100
.
将 频 率 视 为 概 率 , 则 随 机 变 量 ~ 10,0.7B . 故 随 机 变 量 的 数 学 期 望 为
10 0.7 7E .
随机变量的方差为 10 0.7 (1 0.7) 2.1D .