§1.2 独立性检验的基本思想及其应用(一)
【学情分析】:
在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀
疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。在对类似的问题作出推断时,我们不能
仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本
节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断
问题,并理解统计思维与确定性思维的差异。
【教学目标】:
(1)知识与技能:
理解分类变量的含义;会根据收集的数据列出 2×2 列联表,并会阅读三维柱形图和二维条形图,并
粗略判断两个分类变量是否有关系;理解假设检验思想,会利用独立性检验精确判断两个分类变量是否有
关系;
(2)过程与方法:
利用学生身边熟悉的问题引入分类变量是否相关的问题;运用统计学解决问题的一般思路引导学生;
让学生经历假设检验思想的形成及运用过程,领会分析、总结的方法;
(3)情感态度与价值观:
通过提供适当的情境资料,吸引学生的注意力,激发学生的学习兴趣;在合作讨论中学会交流与合作,
启迪思维,提高创新能力;通过实际问题的解决和从不同角度对问题的解决,可提高学生应用数学能力。
【教学重点】:
理解独立性检验的基本思想及实施步骤。
【教学难点】:.
(1)了解独立性检验的基本思想;
(2)了解随机变量 的含义, 太大认为两个分类变量是有关系的。
【课前准备】:
课件
【教学过程设计】:
教学环节 教学活动 设计意图
一、问题引
入
1. 介绍分类变量的概念:变量的不同”值”表示个体所属的不同类别,如
性别变量男女,是否吸烟,宗教信仰,国籍等.
2. 在日常生活中,我们关心两个分类变量之间是否有关系,如:吸烟是否与
患肺癌有关?
引例.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了 9965
人,得到如下结果:
不患肺癌 患肺癌 总计
不吸烟 7775 42 7817
吸烟 2099 49 2148
总计 9874 91 9965
那么吸烟是否对患肺癌有影响?
为探索新知识做准
备.
二、探究新
知
教师引导:统计学中一般采取什么方式手段研究分析解决问题? 如何运用
统计学的方法进行分析判断?
学生探究:
鼓励学生自己寻找
研究问题的一般统
计学的方法
2K 2K1.利用频率分布表判断;
不患肺癌 患肺癌 总计
不吸烟 99.46% 0.54% 1
吸烟 97.72% 2.28% 1
由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有
影响;
2. 利用统计图直观判断
(1) 通过三维柱形图判断两个分类变量是否有关系:
由图中能清晰看出各个频数的相对大小, 由患肺癌在吸烟者与不吸烟者中
的相对频数差异可粗略估计吸烟对患肺癌有影响;
(2) 通过二维条形图判断两个分类变量是否有关系:
作出患肺癌在吸烟者与不吸烟者中的的频率条形图
由图中可看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例, 可
估计吸烟对患肺癌有影响.
教师引导:上面通过分析数据和图形,得到的直观印象是吸烟和患肺癌有
关,那么事实是否如此呢?并且能够以多大的把握认为”吸烟
与患肺癌有关”?能否用统计学观点进一步考察这个问题.
师生共同探究:
为研究的一般性,在列联表中用字母代替数字
通过图表的方法,
使学生巩固统计学
中一般研究问题的
基本思路。
1 2
S1
S2
0
1000
2000
3000
4000
5000
6000
7000
8000
系列1
系列2
不吸烟 吸烟0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
患肺癌
比例
不患肺癌
比例
不吸烟 吸烟( )29965 7775 49 42 2099 56.6327817 2148 9874 91k
× − ×= ≈× × ×
不患肺癌 患肺癌 总计
不吸烟 a b a+b
吸烟 c d c+d
总计 a+c b+d a+b+c+d
师:若假设吸烟与患肺癌两个变量没有关系,则应得到什么结论?
生:在吸烟者中患肺癌的比例约等于不吸烟者中患肺癌的比例,即
a/a+b≈c/c+d a(c+d) ≈ c(a+b) ad -bc ≈ 0
师:若计算 ad –bc 的结果,由此可以初步得出什么结论?
生:︱ad –bc︱越小,说明吸烟与患肺癌之间关系越弱;
︱ad –bc︱越大,说明吸烟与患肺癌之间关系越强.
师:为使不同的样本容量的数据有统一的评判标准,可构造一个随机变量
其中 为样本容量
若假设成立, 应该很小;若 很大,说明假设不成立,即两变量
有关系. 利用上述公式,可计算出问题中的 的观测值为
同学们肯定会提出同一问题:那么这个值是不是很大?怎样才算很大?
在假设成立的情况下,统计学家估算出如下的概率:
现在的观测值 56.632 远大于 6.635,即假设成立的概率为 0.01,是小概
率事件,也就是假设不合理的程度约为 99%,,因此可以下结论:有 99%的
把握认为“吸烟与患肺癌有关系”。这就是两个分类变量独立性检验的基
本 思 想 , 可 以 表 述 为 : 当
很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变
量有关系。
师:类比反证法的原理,你能否总结出独立性检验的基本步骤?
生:(1)假设两个分类变量 与 无关系;
(2)计算出 的观测值 ;
(3)把 k 的值与临界值比较确定 与 有关的程度或无关。
利用独立事件同时
发生的概率公式启
发学生做出假设
采用类比的方法,
便于学生理解假设
检验的思想
三、形成方
法
方法总结:
要推断“X 与 Y 有关系”成立的可能性的方法:
培养学生归纳的能
力
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
−= + + + + n a b c d= + + +
2K 2K
2K
2( 6.635) 0.01P K ≥ ≈
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
−= + + + +
X Y
2K
2
2 ( )
( )( )( )( )
n ad bcK a b c d a c b d
−= + + + +
X Y1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系,
(1) ︱ad -bc︱ (2) a/a+b≈c/c+d
2、利用独立性检验精确判断两个分类变量是否有关系
(1)假设无关 (2)求 k 值 (3)下结论
四、练习巩
固
1、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上两个
柱形高度的乘积相差越大,两个变量有关系的可能性就( A )
A.越大 B.越小 C.无关系 D.无法确定
2、对于 2×2 列联表,在二维条形图中,两个比例的值相差越大,则
“ 与 有关系”的可能性 越大 。
3、为了调查高中生的数学成绩和物理成绩的关系,在某校随机抽取部分
学生做调查,得到下列两份图表
根据以上图表,列出相应的列联表,根据图形回答,数学成绩好坏与物理
成绩好坏 关系。
解:列联表如下:
物理好 物理差 合计
数学好 80 120 200
数学差 70 30 100
合计 150 150 300
根据图形,可知数学成绩好坏与物理成绩好坏 有 关系。
巩固知识,培养技
能.
五、小结 判断两个分类变量是否有关的方法
1、通过三维柱形图和二维条形图粗略判断两个分类变量是否有关系,
反思归纳
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
数学好 数学差
物理好
物理差
0
50
100
150
200
250
数学好 数学差
物理差
物理好
:h x y(1) ︱ad -bc︱ (2) a/a+b≈c/c+d
2、利用独立性检验精确判断两个分类变量是否有关系
(1)假设无关 (2)求 k 值 (3)下结论
六、作业 P21 习题 1.2 1 , 2
1 为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:
患病 未患病 总计
服用药 10 45 55
未服用药 20 30 50
总计 30 75 105
请问有多大把握认为药物有效?
2、通过随机询问 72 名不同性别的大学生在购买食物时是否看营养说明,
得到如下列联表:
女 男 总计
读营养说明 16 28 44
不读营养说明 20 8 28
总计 36 36 72
请问性别和读营养说明之间在多大程度上有关系?
同步练习与测试:
(基础题)
1、根据下表计算:
不看电视 看电视
男 37 85
女 35 143
计算随机变量的观测值 k= 。
解:把表格补充完整
不看电视 看电视 总计
男 37 85 122
女 35 143 178
总计 72 228 300
4.51
2、独立性检验常作的图形是 和 。
答案 :三维柱形图 ,二维条形图
3、两个临界值为 3.841 与 6.635。当 时,认为事件 A 与 B 是 (填“有关的”或“无
≈×××
×−×=
17812222872
)358514337(300 2
k
2 3.841k ≤关的”);当 时,有 99%的把握说事件 A 与 B 是 (填“有关的”或“无关的”)。
答案:无关的 ,有关的
4、用 统计量进行独立性检验时使用的表称为 ,要求表中的四个数据大于 。
答案: 列联表 ,5
(中等题)
5、设 A 为一随机事件,则下列式子中不正确的是()
A. B.
C. D.
答案:选 C
6、统计假设成立时,有以下判断:
其中真命题个数是( )
A.1 B.2 C.3 D.4
答案:选 C
7、设事件 A 与 B 相互独立,则(1) 和 B 相互独立;(2) 和 A 相互独立;(3) 和 相互独立,
其中真命题是( )
A.(1)(2) B.(1)(3) C.(2)(3) D.(1)(2)(3)
答案:选 D
2 6.635k >
2k
2 2×
( ) ( ) ( )P A A P A P A+ = + ( ) 1P A A+ =
( ) ( ) ( )P A A P A P A⋅ = ⋅ ( ) 0P A A⋅ =
( ) ( ) ( )1 ( ) ( ) ( ) 2 ( ) ( ) ( ) 3 ( ) ( ) ( )P AB P A P B P AB P A P B P AB P A P B= = =
A B A B