1.2独立性检验的基本思想及其初步应用
1.分类变量与列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)2×2列联表①列出的两个分类变量的频数表,称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
做一做1下面是一个2×2列联表则表中a,b的值分别为()A.94,96B.52,50C.52,54D.54,52解析:由a+21=73,得a=52,由b+46=100,得b=54.答案:C
2.等高条形图(1)图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现相差很大,就判断两个分类变量之间有关系.
做一做2下面是调查某地区男女中学生喜欢理科情况的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:由题图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故B,D不正确.由题图知,男生比女生喜欢理科的可能性大些.答案:C
3.独立性检验
做一做3为了确定居民的头发颜色与居住地的依赖关系,分别在A,B两个地区调查了两组人群,其结果如下表:由调查得到的结果,能否证实居民的发色与他们的居住地有关?解:由公式得≈10.019>7.879,所以在犯错误的概率不超过0.005的前提下可以认为居民的发色与他们的居住地有关.
思考辨析判断下列说法是否正确,正确的在后面的括号内打“√”,错误的打“×”.(1)分类变量与定量变量的含义是相同的.()(2)在等高条形图中,如果非常接近,说明两个变量之间有关系.()(3)利用列联表求得的K2的值越大,说明两个变量有关系的可能性越大.()(4)在独立性检验中,如果K2的观测值k≥k0(k0为某一临界值),就可推断两个变量没有关系.()××√×
探究一探究二探究三思维辨析当堂检测列联表【例1】某学校对高三学生作了一项调查,结果发现在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,试根据这些数据,作出列联表.分析:先确定两个分类变量,然后分别计算分类变量的取值,最后作出列联表.解:列联表如下:
探究一探究二探究三思维辨析当堂检测
探究一探究二探究三思维辨析当堂检测变式训练1以下是一个2×2列联表,请将表中缺少的数据补充完整.解析:①196-39=157,②157+167=324,③167+29=196,④39+29=68,⑤196+196=392.答案:①157,②324,③196,④68,⑤392.
探究一探究二探究三思维辨析当堂检测利用等高条形图进行独立性检验【例2】在一项有关医疗保健的社会调查中,一共调查了男性530人,女性670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人.请根据以上数据作出性别与喜欢吃甜食的列联表,并用等高条形图判断二者之间是否有关系.分析:先根据题意确定分类变量,然后作出列联表,再画等高条形图,最后给出判断.
探究一探究二探究三思维辨析当堂检测解:根据已知的数据,可以作出列联表如下:等高条形图如下:从等高条形图可以看出,男性中不喜欢吃甜食的比例明显高于女性中不喜欢吃甜食的比例,因此可以认为性别与喜欢吃甜食之间有关系.
探究一探究二探究三思维辨析当堂检测
探究一探究二探究三思维辨析当堂检测变式训练2为了考察某种药物预防疾病的效果,进行动物实验,得到如下的列联表:试用等高条形图判断服用药和患病之间是否有关系.
探究一探究二探究三思维辨析当堂检测解:根据列联表可以作出等高条形图如下:从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为服用药和患病之间有关系.
探究一探究二探究三思维辨析当堂检测利用列联表进行独立性检验【例3】打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据:根据列联表的独立性检验,能否在犯错误的概率不超过0.001的前提下认为每晚都打鼾与患心脏病有关系?分析:根据列联表,通过公式计算K2的观测值,然后与临界值进行比较,得出结论.
探究一探究二探究三思维辨析当堂检测解:由列联表中的数据,得K2的观测值为因此,可在犯错误的概率不超过0.001的前提下,认为每晚都打鼾与患心脏病有关系.
探究一探究二探究三思维辨析当堂检测
探究一探究二探究三思维辨析当堂检测变式训练3某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下2×2列联表:如果说其亲属的饮食习惯与年龄有关,那么犯错误的概率不超过()A.0.1B.0.05C.0.01D.0.001解析:=10>6.635,所以如果说其亲属的饮食习惯与年龄有关,那么犯错误的概率不超过0.01.答案:C
探究二探究三探究一思维辨析当堂检测对独立性检验的原理理解不清致误典例在一项研究吸烟与患肺癌的关系的调查中,共调查了6578人,经计算得K2=62.98,根据这一数据分析,我们有的把握认为“吸烟与患肺癌没有关系”,这种判断出错的可能性是.(参考值P(K2≥10.828)=0.001)错解:99.9%0.1%正解:由于K2=62.98>10.828,所以在犯错误的概率不超过0.001的前提下,我们可以认为“吸烟与患肺癌有关系”,即我们只能有0.1%的把握认为“吸烟与患肺癌没有关系”,亦即这种判断出错的可能性是99.9%.答案:0.1%99.9%
探究二探究三探究一思维辨析当堂检测
探究二探究三探究一思维辨析当堂检测变式训练利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率不超过0.005的前提下认为事件A和B有关系,则具体计算得出的数据k应满足()A.k≥6.635B.k3.841)=0.05,判断出错的可能性为5%.答案:5%
探究一探究二探究三思维辨析当堂检测5.巴西医生马廷恩收集犯有各种贪污、受贿罪的官员与廉洁官员寿命的调查资料:500名贪官中有348人的寿命小于平均寿命,152人的寿命大于或等于平均寿命;590名廉洁官员中有93人的寿命小于平均寿命,497人的寿命大于或等于平均寿命.这里,平均寿命是指“当地人均寿命”.能否在犯错误的概率不超过0.01的前提下认为官员在经济上是否清廉与他们寿命的长短之间有关系?
探究一探究二探究三思维辨析当堂检测解:根据题意列2×2列联表如下:假设官员是否清廉与他们寿命的长短无关.由公式得K2的观测值≈325.635.因为325.635>6.635,所以能在犯错误的概率不超过0.01的前提下认为官员在经济上是否清廉与他们寿命的长短之间是有关系的.