1.2 独立性检验的
基本思想及其初步应用
教学目标
• 1理解独立性检验的基本思想
• 2、会从列联表、柱形图、条形图直观判断吸
烟与患肺癌有关。
• 3、了解随机变量K2的含义。
• 理解独立性检验的基本思想及实施步骤。
• 教学重点:理解独立性检验的基本思想。独
立性检验的步骤。
• 教学难点;1、理解独立性检验的基本思想;
2、了解随机变量K²的含义;独立性检验的步
骤。
看到这个课题,你能想到什么?
案 例:某医疗机构为了了解呼吸道疾病与吸
烟是否有关,进行了一次抽样调查,共调查了
515个成年人,其中吸烟者220人,不吸烟者
295人。
调查结果:吸烟的220人中有37人患呼吸道疾
病,183人未患呼吸道疾病;不吸烟的295人中
有21人患病,274人未患病。
根据这些数据,能否断定:患呼吸道疾
病与吸烟有关?
数据整理
患病 未患病 合计
吸烟
不吸烟
合计
37
21
58
183
274
457
220
295
515
问题:判断的标准是什么?
吸烟与不吸烟,患病的可能性的大小是否有差异?
频率估计概率
患 病 未患病 合 计(n)
吸 烟 16.82% 83.18% 100%(220)
不吸烟 7.12% 92.88% 100%(295)
通过图形直观判断
不患病
比例
患病
比例
解决问题:直观方法
吸烟的患病率
不吸烟的患病率
37/220 16.82%
21/295 7.12%
根据统计分析的思想,用频率估计概率
可知,吸烟者与不吸烟者患病的可能性
存在差异。
你能有多大把握认为“患病与吸烟有关”呢
?
有一个颠扑不破的真理,那就是当
我们不能确定什么是真的时,我们就
应该去探求什么是最可能的。
笛卡儿
能否用数量来刻画“有关”程度
不吸烟但患病的人数约为
n • •
不吸烟也不患病的人数约为
n • •
怎样估计实际观测值与理论估计值的误差?
采用如下的量(称为K2 统计量)来刻画这个差异:
+ +
+
化简得
=K2
K 2统计量
K2 =11.8634
解决问题的思路
• 思路:反证法思想
• (1)假设:H0:患病与吸烟无关
• 即 P(A)P(B)= P(AB)
• (2)在 H0成立的条件下进行推理
• (3)如果实际观测值与由(2)推出的值
相差不大,则可以认为这些差异是由随机
误差造成的,假设H0不能被否定;否则,
假设H0不能被接受
反证法原理与假设检验原理
反证法原理:
在一个已知假设
下,如果推出一
个矛盾,就证明
了这个假设不成
立。
假设检验原理:
在一个已知假设
下,如果推出一
个小概率事件发
生,则推断这个
假设不成立的可
能性很大。
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类
取值,即类A和B(如吸烟与不吸烟);Ⅱ也有两类
取值,即类1和2(如患病与不患病)。于是得到
下列联表所示的抽样数据:
类1 类2 总计
类A a b a+b
类B c d c+d
总计 a+c b+d a+b+c+d
要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行:
(1)提出假设H0 :Ⅰ和Ⅱ没有关系;
(3)查对临界值,作出判断。
(2)根据2× 2列联表与公式计算 的值;
由于抽样的随机性,由样本得到的推断
有可能正确,也有可能错误。利用 进行独
立性检验,可以对推断的正确性的概率作出
估计,样本量n越大,估计越准确。
0.5 0.4 0.25 0.15 0.1 0.05 0.025 0.01 0.005 0.001
ko
0.4
55
0.7
08
1.32
3
2.07
2
2.7
06
3.84
1
5.024 6.63
5
7.879 10.82
8
卡方临界值表:
则有99.9%的把握认为“Ⅰ与Ⅱ有关系”;(1)若观测值K2>10.828.
(3)若观测值K2>2.706,
(4)若观测值K2<2.706,
(2)若观测值K2>6.635, 则有99%的把握认为“Ⅰ与Ⅱ有关系”;
则有90%的把握认为“Ⅰ与Ⅱ有关系”;
则没有充分的证据显示“Ⅰ与Ⅱ有关
系”,但也不能作出结论“H0成立”
,即Ⅰ与Ⅱ没有关系。
题型一 有关“相关的检验”
• 【例1】 某校对学生课外活动进行调查,结果整理成
下表:
• 试用你所学过的知识进行分析,能否在犯错误的概
率不超过0.005的前提下,认为“喜欢体育还是文娱
与性别有关系”?
体育 文娱 总计
男生 21 23 44
女生 6 29 35
总计 27 52 79
例2:为研究不同的给药方式(口服与注射)和
药的效果(有效和无效)是否有关,进行了相
应的抽样调查,调查的结果列在下表中,根据
所选择的193个病人的数据,能否作出药的效果
与给药方式有关的结论?
有效 无效 合计
口服 58 40 98
注射 64 31 95
合计 122 71 193
解:提出假设
H0:药的效果与给药方式无关系。
根据列联表中的数据可以求出:
当H0成立时, 的概率大于10%
,这个概率比较大,所以根据目前的调查
数据,不能否定假设H0,即不能作出药的
效果与给药方式有关的结论。