8.3列联表与独立性检验8.3.1分类变量与列联表
课标要求素养要求1.通过实例,理解2×2列联表的统计意义.2.理解判断两个分类变量是否有关系的常用方法.通过学习2×2列联表,提升数学抽象、直观想象及数据分析素养.
新知探究饮用水的质量是人类普遍关心的问题,根据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人.问题 人的身体健康状况与饮用水的质量之间有关系吗?提示我们可以根据2×2列联表找到人的身体健康与饮用水之间的关系,也就是本节课所要学习的内容.
1.分类变量这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为__________,分类变量的取值可以用______表示.分类变量实数
2.2×2列联表在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉__________.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为分类频数y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d
3.等高堆积条形图等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的______特征,依据________________的原理,我们可以推断结果.频率频率稳定于概率
拓展深化[微判断]1.分类变量中的变量与函数中的变量是同一概念.()提示分类变量中的变量是指一定范围内的两种现象或性质,与函数中的变量不是同一概念.2.列联表中的数据是两个分类变量的频数.()3.列联表、频率分析法、等高条形图都可初步分析两分类变量是否有关系.()×√√
[微训练]1.下列不是分类变量的是()A.近视B.成绩C.血压D.饮酒解析近视变量有近视与不近视两种类别,血压变量有异常、正常两种类别,饮酒变量有饮酒与不饮酒两种类别.故选B.答案B
2.某校为了检验高中数学新课程改革的成果,在两个班进行教学方式的对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.80分及80分以上80分以下合计试验班321850对照班24m50合计5644n
答案26100
[微思考]1.是否吸烟、是否患肺癌是什么变量?提示分类变量.2.吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?提示不是.
解2×2列联表如下:年龄在六十岁以上年龄在六十岁以下合计饮食以蔬菜为主432164饮食以肉类为主273360合计7054124
将表中数据代入公式得
【训练1】假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:y1y2x11018x2m26则当m取下面何值时,X与Y的关系最弱()A.8B.9C.14D.19解析由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.答案C
题型二 用等高堆积条形图分析两分类变量间的关系【例2】某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.性格内向性格外向合计考前心情紧张332213545考前心情不紧张94381475合计4265941020
相应的等高堆积条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前心情紧张与性格类型有关.
规律方法利用等高堆积条形图判断两个分类变量是否相关的步骤:
【训练2】在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解根据题目给出的数据作出如下的列联表:色盲不色盲合计男38442480女6514520合计449561000
根据列联表作出相应的等高堆积条形图:从等高堆积条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.
一、素养落地1.通过本节课的学习,进一步提升数学抽象、直观想象及数据分析素养.2.列联表与等高堆积条形图列联表由两个分类变量之间频率大小的差异说明这两个变量之间是否有相关关系,而利用等高堆积条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系.
二、素养训练1.与表格相比,能更直观地反映出相关数据总体状况的是()A.列联表B.散点图C.残差图D.等高堆积条形图答案D
2.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,则性别与喜欢吃甜食的2×2列联表为________.答案喜欢吃甜食不喜欢吃甜食合计男117413530女492178670合计6095911200
3.根据如图所示的等高堆积条形图可知吸烟与患肺病________关系(填“有”或“没有”).解析从等高条形图上可以明显地看出吸烟患肺病的频率远远大于不吸烟患肺病的频率.答案有
4.(多空题)下面是一个2×2列联表:y1y2合计x1a2173x222527合计b46100则表中a=________,b=__________.
答案5254
5.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:患病未患病合计服用药104555未服用药203050合计3075105