高中数学人教版选修1-2同课异构教学课件:1.2 独立性检验的基本思想及其初步应用 情境互动课型.ppt
加入VIP免费下载
加入VIP免费下载
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天资源网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:403074932
资料简介
1.2  独立性检验的基本思想及其初步应用 我们经常听到这些说法:  吸烟对患肺癌有影响;  数学好的人物理一般也很好;  性别与是否喜欢数学课程之间有关系;  人的血型会决定人的性格;  星座与人的命运之间有某种联系; 这些说法都有道理吗? 1.理解独立性检验的基本思想.(重点) 2.会从列联表、等高条形图直观判断吸烟与患 肺癌有关.(难点) 3.了解随机变量K2的含义,理解独立性检验的 基本思想及实施步骤.(难点) 探究点1 独立性检验的基本思想 对于性别变量,其取值为男和女两种.这种变量 的不同“值”表示个体所属的不同类别,这样的变 量称为 . 分类变量在现实生活中是大量存在的,如是否 吸烟、是否患肺癌、宗教信仰、国别、年龄、出生 月份等. 分类变量 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究 所随机地调查了9965人,得到如下结果(单位:人) 在吸烟者中患肺癌的比重是_______. 说明:吸烟者和不吸烟者患肺癌的可能性存在差异, 吸烟者患肺癌的可能性大. 0.54% 2.28% 在不吸烟者中患肺癌的比重是_______, 通过图形直观判断两个分类变量是否相关: 患肺癌 比例 不患肺癌 比例 等高条形图 通过数据和图形分析,得到结论是:吸烟与患 肺癌有关,那么这种判断是否可靠呢?我们可以通 过统计分析回答这个问题. 假设H0: 吸烟与患肺癌之间没有关系, 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 如果“吸烟与患肺癌没有关系”,那么吸烟样 本中不患肺癌的比例应该与不吸烟样本中相应的比 例差不多. 即 引入一个随机变量 它是检验在多大程度上可以认为“两个变量有 关系”的标准. ︱ad-bc︱越小,说明吸烟与患肺癌之间的关系越弱, ︱ad-bc︱越大,说明吸烟与患肺癌之间的关系越强. 其中n=a+b+c+d为样本容量. 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 通过公式计算 已知在 成立的情况下, 即在 成立的情况下,K2的观测值大于6.635 的概率非常小,近似为0.010,是一个小概率事件. 思考:这个值到底告诉我们什么呢? 现在K2的观测值k≈56.632,远远大于6.635,所以有 理由断定H0不成立,即认为“吸烟与患肺癌有关系 ”. 独立性检验的定义   利用随机变量K2来判断“两个分类变量有关系 ”的方法称为独立性检验. 独立性检验的一般步骤 (1)假设两个分类变量X与Y没有关系; (2)计算出K2的观测值k; (3)把k的值与临界值比较确定X与Y有关的程度或无 关系. 设有两个分类变量X和Y,它们的取值分别为{x1,x2} 和{y1,y2},其样本频数列联表(称为2×2列联表)为   y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 如P(k0>10.828)= 0.001表示在犯错误的概率 不超过0.001的前提下,认为“X与Y有关系”. 如P(k0>6.635)= 0.01表示在犯错误的概率不超 过0.01的前提下,认为“X与Y有关系”. 临界值表: 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 独立性检验的基本思想类似反证法 (1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下随机变量K2应该很小,如果由观测数据 计算得到K2的观测值k很大,则在一定程度上说明假 设不合理. (3)根据随机变量K2的含义,可以通过评价该假设不合 理的程度,如由实际计算出的k>10.828.说明假设不 合理的程度为99.9%,即“两个分类变量有关系”这 一结论成立的可信度为约为99.9%. 在一次独立性相关检验中,若能在犯错误的概 率不超过0.005的前提下认为两个分类变量X与Y 有关系,则k的取值范围是( ) A.[5.024,6.635) B.[6.635,7.879) C.[7.879,10.828) D.[7.879,+ ) DD 【即时训练】 探究点2 独立性检验的初步应用 例1.在某医院,因为患心脏病而住院的665名男性 病人中,有214人秃顶.而另外772名不是因为患心脏病 而住院的男性病人中,有175人秃顶.利用图形判断秃 顶与患心脏病是否有关系.能否在犯错误的概率不超 过0.010的前提下认为秃顶与患心脏病有关系? 解:根据题目所给数据得到如下列联表: 患心脏病 患其他病 总计 秃顶 214 175 389 不秃顶 451 597 1048 总计 665 772 1437 相应的等高条形图如下所示, 秃顶 不秃顶 不患心脏病 患心脏病 因此,在犯错误的概率不超过0.010的前提下, 认为秃顶与患心脏病有关系. 根据列联表中的数据,得到   y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 思考:考察下表, 定义 根据独立性检验原理,如何用W构造一个判断X和Y是否 有关系的规则,使得在该规则下把“X和Y没有关系” 错判成“X和Y有关系”的概率不超过0.010? 由W的定义可以发现:它越大,越有利于结论 “X和Y有关系”;它越小,越有利于结论“X和Y没 有关系”.因此可以建立如下的判断规则: 当W的观测值ω≥ ω0时,就判断“X和Y有关 系”;否则,判断“X和Y没有关系”.这里ω0为 正实数,满足如下条件:在“X和Y没有关系”的 前提下, 思考:若在“X和Y没有关系”的情况下有 例1 在某医院,因为患心脏病而住院的665名男性 病人中,有214人秃顶;而另外772名不是因为患 心脏病而住院的男性病人中,有175人秃顶.利用 图形判断秃顶与患心脏病是否有关系.能否在犯错 误的概率不超过0.01的前提下认为秃顶与患心脏 病有关系? 【解题关键】由题意列出2×2列联表,利用公式求 得K2后与临界值比较,得出结论后要注意这组数据 是来自于住院的病人,而不是随机对全体人群采样. 【解析】由题意列出2×2列联表如下: 由公式得 K2≈16.373. K2 >6.635.所以有99.9%的把握认为“秃顶 与患心脏病有关”.   患心脏病 不患心脏病 总计 秃顶 214 175 389 不秃顶 451 597 1048 总计 665 772 1437 有甲乙两个班级进行一门课程的考试,按照学生 考试成绩优秀和不优秀统计成绩后,得到如下列 联表:   优秀 不优秀 总计 甲班 10 35 45 乙班 7 38 45 总计 17 73 90 能否在犯错误的概率不超过0.01的前提下认为成 绩与班级有关? 【变式练习】 【解析】假设H0 :成绩与班级无关.根据列联表中的 数据得: 因此不能在犯错误的概率不超过0.01的前提下认为 成绩与班级有关. 1.下列说法中正确的是(  ) ①独立性检验的基本思想是带有概率性质的反证法; ②独立性检验就是选取一个假设H0条件下的小概率事件, 若在一次试验中该事件发生了,这是与实际推断相抵触 的“不合理”现象,则作出拒绝H0的推断; ③独立性检验一定能给出明确的结论. A.①② B.①③ C.②③ D.①②③ 2.在2×2列联表中,两个比值________相差越大,两个 分类变量之间的关系越强(  )A 3.如果在犯错误的概率不超过0.05的前提下认为事件A 和B有关,那么具体算出的数据满足(  ) A.K2>3.841 B.K26.635 D.K2

资料: 29.3万

进入主页

人气:

10000+的老师在这里下载备课资料