1.2 独立性检验的基本思想及其初步应用
课后训练案巩固提升
一、A组
1.在4个独立性检验中,根据试验数据得到K2统计量的值分别为:①6.98;②4.75;③2.93;④9.24.其中在犯错误的概率不超过0.01的前提下认为两个事件有关的独立性检验有( )(参考临界值:P(K2≥6.635)≈0.01)
A.1个 B.2个
C.3个 D.4个
解析:只有①和④,我们可以在犯错误的概率不超过0.01的前提下认为两个事件有关.
答案:B
2.在一次调查后,根据所得数据绘制成如图所示的等高条形图,则( )
A.两个分类变量关系较弱
B.两个分类变量没有关系
C.两个分类变量关系较强
D.无法判断
解析:从条形图中可以看出,在x1中y1的比重明显大于x2中y1的比重,所以两个分类变量的关系较强.
答案:C
3.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关系”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法正确的是( )
A.100个心脏病患者中至少有99人打鼾
B.1个人患心脏病,则这个人有99%的概率打鼾
C.100个心脏病患者中一定有打鼾的人
D.100个心脏病患者中可能一个打鼾的人都没有
答案:D
4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
作文成绩优秀
作文成绩一般
总计
课外阅读量较大
22
10
32
课外阅读量一般
8
20
28
总 计
30
30
60
由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是( )
附:
P(K2≥k0)
0.25
0.15
0.10
0.025
0.010
0.005
- 7 -
k0
1.323
2.072
2.706
5.024
6.635
7.879
A.没有充足的理由认为课外阅读量大与作文成绩优秀有关系
B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关系
C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关系
D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关系
解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关系,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关系.
答案:D
5.在一次独立性检验中,得到列联表如下:
A
总计
B
200
800
1 000
180
a
180+a
总计
380
800+a
1 180+a
且最后发现,没有充分证据显示两个分类变量A和B有关系,则a的可能值是( )
A.200 B.720
C.100 D.180
解析:计算K2的观测值
k=,
当a=200时,
k=≈103.37>2.706,
此时两个分类变量A和B有关系;
当a=720时,
k==0,
由k≤2.706知此时没有充分证据显示两个分类变量A和B有关系,则a的可能值是720.
答案:B
6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,照射14天后的结果如表所示:
死亡
存活
合计
第一种剂量
14
11
25
第二种剂量
6
19
25
合 计
20
30
50
进行统计分析时的统计假设是 .
解析:根据独立性检验的基本思想,可知其类似反证法,即要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立.对于本题,进行统计分析时的统计假设应是“小白鼠的死亡与剂量没有关系”.
答案:小白鼠的死亡与剂量没有关系
- 7 -
7.如果由一个2×2列联表中的数据计算得K2的观测值k=4.013,那么在犯错误的概率不超过 的前提下认为两个变量有关系.
解析:K2的观测值k=4.013>3.841,因此,在犯错误的概率不超过0.05的前提下认为两个变量有关系.
答案:0.05
8.为了考察某种药物预防疾病的效果,进行动物实验,得到如下的列联表:
患 病
未患病
总 计
服用药
10
45
55
没有服用药
20
30
50
合 计
30
75
105
试用等高条形图判断服用药和患病之间是否有关.
解:根据列联表可以作出等高条形图如下:
从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为服用药和患病之间有关系.
9.日本发生的9.0级地震引发了海啸及核泄漏,某国际组织用分层抽样的方法从心理专家、核专家、地质专家三类专家中抽取若干人组成研究团队赴日本工作,有关数据见表1(单位:人).核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为不完整的2×2列联表(见表2,单位:只).
表1
相关人数
抽样人数
心理专家
24
x
核专家
48
y
地质专家
72
6
表2
身体健康
身体不健康
总 计
高度辐射
30
B
C
轻微辐射
A
10
D
总 计
50
60
E
(1)求研究小组的总人数;
(2)写出表中的A,B,C,D,E值,并判断能否在犯错误的概率不超过0.01的前提下,认为羊身体不健康与受到高度辐射有关系?
解:(1)由题意知,,
- 7 -
所以y=4,x=2,所以研究小组的总人数为2+4+6=12(人).
(2)根据列联表可得A=20,B=50,C=30+50=80,D=20+10=30,E=50+60=110,
假设羊身体不健康与受到高度辐射没有关系,
则K2的观测值k=≈7.486>6.635.
所以在犯错误的概率不超过0.01的前提下认为羊身体不健康与受到高度辐射有关系.
二、B组
1.观察下列各图,其中两个分类变量x,y之间关系最强的是( )
解析:D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选D.
答案:D
2.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现K2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是( )
附:
P(K2≥k0)
0.25
0.15
0.10
0.025
0.010
0.005
k0
1.323
2.072
2.706
5.024
6.635
7.879
A.90% B.95%
C.97.5% D.99.5%
解析:因为K2=6.023>5.024,所以其可信度为97.5%.
答案:C
3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
新闻节目
文艺节目
总 计
20至40岁
18
40
58
大于40岁
27
15
42
总 计
45
55
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关: (填“是”或“否”).
- 7 -
解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄有关系.
答案:是
4.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:
非统计专业
统计专业
男生
13
10
女生
7
20
为了检验主修统计专业是否与性别有关,根据表中的数据得到随机变量K2的观测值为k=≈4.844.因为k>3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为 .
解析:因为随机变量K2的观测值k>3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%.
答案:5%
5.导学号40294003某国际会议在北京召开,为了搞好对外宣传工作,会务组选聘了16名男记者和14名女记者担任对外翻译工作,调查发现,男、女记者中分别有10人和6人会俄语.
(1)根据以上数据完成以下2×2列联表:
会俄语
不会俄语
总计
男
女
总计
30
(2)能否在犯错误的概率不超过0.10的前提下认为性别与会俄语有关系?
参考公式:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
解:(1)由已知,得2×2列联表如下:
会俄语
不会俄语
总计
男
10
6
16
女
6
8
14
总计
16
14
30
(2)假设是否会俄语与性别没有关系,由已知数据,可得
K2=≈1.157 56.635,所以能在犯错误的概率不超过0.010的前提下认为是否为网购达人与性别有关系.
- 7 -