§3.2 独立性检验的基本思想及其应用(2)
【学情分析】:
在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀
疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。在对类似的问题作出推断时,我们不能
仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本
节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断
问题,并理解统计思维与确定性思维的差异。
【教学目标】:
(1)知识与技能:进一步加强阅读三维柱形图和二维条形图的能力;加强理解独立性检验思想,会
利用独立性检验方法解决实际问题。
(2)过程与方法:提供多个案例,让学生能自觉运用独立性检验的思维解决问题。
(3)情感态度与价值观:通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;在
合作讨论中学会交流与合作,启迪思维,提高创新能力;通过实际问题的解决和从不同角度对问题的解决,
可提高学生应用数学能力。
【教学重点】:理解独立性检验的基本思想及实施步骤,初步应用。
【教学难点】:(1)了解独立性检验的基本思想;
(2)了解随机变量 的含义, 太大认为两个分类变量是有关系的。
【教学过程设计】:
教学
环节 教学活动 设计意
图
一、
复习
巩固
要推断“X 与 Y 有关系”成立的可能性的方法:
1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系,
(1) ︱ad -bc︱ (2) a/a+b≈c/c+d
2、利用独立性检验精确判断两个分类变量是否有关系
(1)假设无关 (2)求 k 值 (3)下结论
二、
例题
讲解
例 1、在某医院,因为患心脏病而住院的 665 名男性病人中,有 214 人秃顶;而另外 772
名不是因为患心脏病而住院的男性病人中有 175 人秃顶。分别利用图形和独立性检验方法
判断秃顶与患心脏病是否有关?你所得的结论在什么
范围内有效?
解:秃顶 与患心脏病列联表
相应的三维柱形图入图所示,比较来说,底面副对角线上两个柱体高度的乘积要大一些,
因此可以在某种程度上认为“秃顶与患心脏病有关”。
在假设的前提下,
患心脏病 患其他病 总计
秃顶 214 175 389
不秃顶 451 597 1048
总计 665 772 1437
2K 2K
1 2
S1
S2
0
100
200
300
400
500
600
系列1
系列2二、
例题
讲解
所以有 99%的把握认为“秃顶与患心脏病有关”.所得结论只适合住院的病人群体
思考:因为 k≈16.373>10.828,所以有 99.9%以上的把握认为“秃顶与患心脏病有关”,
这和上述结论矛盾吗?
解答:这种说法的推理过程也是正确的,两种说法不矛盾。
例 2、为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校
高中生中随机抽取 300 名学生,得到如下列联表:
喜欢数学课程 不喜欢数学课程 总计
男 37 85 122
女 35 143 178
总计 72 228 300
(1)计算 K2 的观察值 k;(2)在多大程度上可以认为高中生的性别与是否喜
欢数学课程之间有关系?为什么?
解 (1)在假设“性别与是否喜欢数学课程之间没有关系”的前提下,
k≈4.513
(2)在假设的前提下, K2 应该很小,k≈4.513>3.841,
P(K2>3.841) ≈0.05, “性别与是否喜欢数学课程之间有关系”错误的可能性为 0.05,即
有 95%的把握认为“性别与是否喜欢数学课程之间没有关系”.
例 3、在一次恶劣气候的飞行航程中调查男女乘客在机上晕机的情况,共调查了 89 位乘
客,其中男乘客 24 人晕机,31 人不晕机,女乘客有 8 人晕机,26 人不晕机,根据此材料
你是否认为在恶劣气候的飞行中,男人比女人更容易晕机?
分析:列 2×2 列联表进行独立性检验
解:由已知数据制成下表
根据公式 。由于 k﹥2.706,我们有 90%的把握认为在本
次飞机飞行中,晕机与男女有关。尽管这次航班中男人晕机的比例 比女人晕机的比
例 高,但我们不能认在恶劣气候的飞行中,男人比女人更容易晕机。晕机与男女关
系是指统计上的关系,不误认为是因果关系。
晕机 不晕机 总计
男人 24 31 55
女人 8 26 34
总计 32 57 89
由 所 给
数 据 得
到 2X2
列联表,
由 此 复
习 列 联
表 的 制
作方法
第 二 问
主 要 复
习 样 本
的 代 表
性。
在 熟 悉
解 列 联
表 检 验
的 基 本
原理后,
可 以 通
过 直 接
计 算 K2
的值(不
画图)来
解 决 独
立 性 问
题
解 题 中
突 出 强
调 K2 的
含义。
289(24 26 31 8) 3.68955 34 32 57k
× − ×= ≈× × ×
24( )55
8( )34
( )21437 214 597 175 451 16.373 6.635389 1048 665 772k
× − ×= ≈ >× × ×三、
问题
探究
探究问题:某项实验,在 100 次试验中,成功率只有 10%,进行技术改造后,又进行了 100
次试验,试问:若要有 97.5%的把握认为“技术改造后有明显效果”,试验的成功率最少
应为多少?(设 )
解:由题意,设技术改造后试验成功次数为 ,给出列联表如下:
成功 不成功 总计
技术改造前 10 90 100
技术改造后 100- 100
总计 10+ 190- 200
则有
解得 或 (舍去)
所以,若要有 97.5%以上的把握认为“技术改造后有明显效果”,试验的成功率最少应为
22%。
四、
练习
巩固
1、为了研究患支气管炎与吸烟的关系,共调查了 228 人的日吸烟量调查结果如下:
日吸烟 10~19
支
日吸烟 20~40 合计
患者 98 25 123
非患者 89 16 105
合计 187 41 228
试问患支气管炎是否与吸烟有关?
解:由公式知
由于 ,我们没有理由认为患支气管炎与吸烟有关。
2、在 500 人身上实验某种血清预防感冒的作用,把记录与 500 个未用血清的人作比较,
结果如下表所示:
未感冒 感冒 合计
试验过 252 248 500
未用过 224 276 500
合计 476 524 1000
作出二维条形图,通过图形判断这种血清是否能够起到预防感冒的作用,并进行独立性检
验。
解:(二维条形图略)由公式得
从条形图看,这种血清对预防感冒有作用,由于 ,我们有 90%的把握认为起作
用。
2( 5) 0.025P K ≥ =
x
x x
x x
( ) 2
2 200 100 100 90 5100 100 (10 ) (190 )
x xk x x
× × − − = >× × + × −
21.52x > 2.38x <
2228 (98 16 89 25) 0.994123 105 187 41k
× × − ×= ≈× × ×
2.706k <
21000(252 276 224 248) 3.143500 500 476 542k
× − ×= ≈× × ×
2.706k >四、
练习
巩固
3、甲乙两个班进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得出班级与
成绩列联表:
优秀 不优秀 总计
甲班 10 35 45
乙班 7 38 45
总计 17 73 90
画出列联表的条形图,并通过图形判断成绩与班级是否有关,利用列联表的独立性检验估
计,认为“成绩是否优秀与班级有关系”犯错误的概率是多少?
解:(图略)由图及表直观判断好象“成绩与班级有关系”
因为 ,
从而有 50%的把握认为“成绩是否优秀与班级有关系”,即断言“成绩是否优秀
与班级有关系”犯错误的概率为 0.5。
五、
小结
独立性检验是一种假设检验,在对总体的估计中,通过抽取样本构造合适的统
计量,对假设的正确性进行判断。
六、
作业
1、收集班上所有学生的身高的数据,构造一个关于每一个学生的性别与其身高是否高于
(或低于)中位数的列联表,推断性别与身高在多大程度上有关系?
2、在报纸、杂志、互联网找一个抽样调查报告,构造一个 2×2 列联表,并讨
论调查中的两个分类变量之间在多大程度上相关。
同步练习:
(基础题)
1、在研究某种新措施对猪白痢的防治效果问题时,得到了以下数据:
存活数 死亡数 合计
新措施 132 18 150
对照 114 36 150
合计 246 54 300
试问新措施对猪白痢的防治效果如何?
解:由公式得: ,由于 7.317 6.635,所以我们有 99%的把握认
为新措施对猪白痢的防治是有效的。
2、调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表,试问能以多大的把握认为
婴儿的性别与出生时间有关系。
晚上 白天 合计
男婴 24 31 55
女婴 8 26 34
合计 32 57 89
解:由公式得: ,所以没有充分的证据显示婴儿的性别与出
生时间有关。
0.6527 0.455k ≈ > 2( 0.455) 0.5P K > ≈
( )2300 132 36 114 18 7.317150 150 246 54k
× × − ×= ≈× × × >
( )289 24 26 8 31 3.689 3.84155 34 32 57k
× × − ×= ≈ × × ×
( )2100 36 16 8 40 1.458 3.84144 56 24 76k
× × − ×= ≈ × × ×
( )2100 15 46 4 35 7.86 6.63550 50 19 81k
× × − ×= ≈ >× × ×