第八章成对数据的统计分析[数学文化]——了解数学传统文化的发展与应用统计学起源统计学是一门很古老的科学,它是通过搜集、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学,其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域.一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史.它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段.所谓“数理统计”并非是独立于统计学的新学科,确切地说,它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词.概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴.[读图探新]——发现现象背后的知识1.根据犯罪分子在作案过程中遗留的脚印,能够对罪犯的性别、年龄、身高、走路姿势等方面分析画像,而且能起到揭露和证实犯罪的重要作用.
2.水稻是喜光植物,经研究发现,水稻的产量与光照时间有着某种必然的联系,最开始随着光照时间的增长,产量增大,之后产量趋于平缓,随着时间增长不再增加,时间继续增加,产量会下降.3.一般来讲,在良好环境下成长的儿童,其成年身高很大程度上取决于遗传,其身高和父母平均身高之间的相关系数为0.75.孩子成年身高可以通过父母身高粗略的预测,父母的平均身高即是遗传潜力所确定的儿童身高,也称靶身高.问题:脚印的长短与身高之间是怎样的一种关系?光照时间与水稻的产量之间是具体的函数关系吗?孩子的身高与父母的身高一定是一种确切的关系吗?链接:本章所学习的成对数据的统计相关性,一元线性回归模型和2×2列联表等,这些知识与方法在解决上述实际问题中非常有用.本章的重点是回归分析与独立性检验的基本思想与方法;难点是回归分析与独立性检验的初步应用.
8.1 成对数据的统计相关性8.1.1 变量的相关关系课标要求素养要求1.结合实例,体会两个变量间的相关关系.2.掌握相关关系的判断,能根据散点图对线性相关关系进行判断.通过对两个变量相关关系的学习,提升直观想象及数据分析素养.新知探究俗话说“庄稼一枝花,全靠肥当家”,这说明施肥的多少对粮食的产量影响很大,那么粮食的产量还受其他因素的影响吗?施肥量和粮食的产量是确定的函数关系吗?两个变量间的关系除了可能是函数关系外,还可能是其他关系吗?为了搞清这些问题,我们需要学习本节内容.问题 上述情境中施肥量与粮食产量之间到底具有怎样的关系?提示 上述两变量间确实存在关系,但又不具备确定性,即当自变量取值一定时,因变量取值带有随机性的两个变量的关系,就称为变量间的相关关系.1.相关关系两个变量间的关系有函数关系,相关关系和不相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.2.正相关、负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现减少的趋势,则称这个两个变量负相关.3.线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.拓展深化[微判断]1.统计活动中,分析数据时通常用统计图表计算数据的数据特征.(√)2.在一定范围内,农作物的产量与施肥量之间的关系是相关关系.(√)3.对于给定的两个变量的统计数据,都可以作出散点图.(√)[微训练]1.(多选题)下列说法正确的是( )A.任何两个变量都具有相关关系B.圆的周长与该圆的半径具有相关关系C.某商品的需求量与该商品的价格是一种非确定性关系D.根据散点图可判断两变量是否具有线性相关关系解析 A显然不对,B是函数关系,CD正确.答案 CD2.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图图2.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析 由这两个散点图可以判断,变量x与y负相关,u与v正相关.答案 C[微思考]相关关系与函数关系的区别和联系是什么?提示 相同点:两者均是指两个变量的关系;不同点:(1)函数关系是一种确定的关系.如匀速直线运动中时间t与路程s的关系;相关关系是一种非确定的关系.如一块农田的水稻产量与施肥量之间的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系,然而学会新词并不能使脚变大,而是涉及第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高,而且他们的脚也变大.
题型一 相关关系的理解【例1】 判断以下两个变量之间是否具有相关关系?(1)正方形的面积与其周长之间的关系;(2)父母的身高与子女的身高之间的关系;(3)学生的学号与身高;(4)汽车匀速行驶时的路程与时间的关系.解 (1)设正方形的面积为S,周长为C,则S=2,即正方形的面积由其周长唯一确定,因此二者是函数关系,不是相关关系;(2)子女身高除了与父母的身高有一定关系外,还与其他因素有关,即子女的身高并不是由其父母的身高唯一确定的,因此二者之间具有相关关系;(3)学生的学号与身高之间没有任何关系,不具有相关关系;(4)若汽车匀速行驶时的速度为v,行驶的路程为s,时间为t,则有s=vt,因此当速度一定时,路程由时间唯一确定,二者之间具有函数关系,而不是相关关系.规律方法 函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.【训练1】 (多选题)下列说法正确的是( )A.闯红灯与交通事故发生率的关系是相关关系B.同一物体的加速度与作用力是函数关系C.产品的成本与产量之间的关系是函数关系D.广告费用与销售量之间的关系是相关关系解析 闯红灯与发生交通事故之间不是因果关系,但具有相关性,是相关关系,所以A正确;物体的加速度与作用力的关系是函数关系,B正确;产品的成本与产量之间是相关关系,C错误;广告费用与销售量之间是相关关系,D正确.答案 ABD
题型二 散点图与相关性【例2】 某种木材体积与树木的树龄之间有如下的对应关系:树龄2345678体积30344060556270(1)请作出这些数据的散点图;(2)你能由散点图发现木材体积与树木的树龄近似成什么关系吗?解 (1)以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示:(2)由散点图发现木材体积随着树龄的增加而呈增加的趋势,且散点落在一条直线附近,所以木材的体积与树龄成线性相关关系.【迁移1】 (变条件,变问法)若近似成线性相关关系,请画出一条直线来近似地表示这种线性相关关系.解 近似拟合直线如图所示:【迁移2】 (变条件,变问法)若该种木材每单位体积的价值是80元,作出木材的价值与树龄之间关系的散点图.解 木材的价值与树龄之间的关系如表所示:树龄2345678体积30344060556270价值2400272032004800440049605600以x轴表示树木的树龄,y轴表示树木的价值,可得相应的散点图如图所示:
规律方法 判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.【训练2】 5名学生的数学和物理成绩(单位:分)如下:学生成绩 ABCDE数学成绩8075706560物理成绩7066686462判断它们是否具有线性相关关系.解 以x轴表示数学成绩,y轴表示物理成绩,得相应的散点图如图所示.由散点图可知,各点分布在一条直线附近,故两者之间具有线性相关关系.题型三 散点图及其应用【例3】 下面是水稻产量与施化肥量的一组观测数据:施化肥量15202530354045水稻产量320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增加吗?解 (1)散点图如下:
(2)从图中可以发现,当施化肥量由小到大变化时,水稻产量也由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增加,不会一直随施化肥量的增加而增加.规律方法 1.画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.2.在这里利用散点图直观感知事物的形态与变化,理解事物间的关联及变化规律,是数学核心素养直观想象的具体体现.【训练3】 (多选题)某中学的兴趣小组在某座山测得海拔高度、气压和沸点的六组数据绘制成散点图如图所示,则下列说法正确的是( )A.沸点与海拔高度呈正相关B.沸点与气压呈正相关C.沸点与海拔高度呈负相关D.沸点与海拔高度、沸点与气压的相关性都很强解析 由左图知气压随海拔高度的增加而减小,由右图知沸点随气压的升高而升高,所以沸点与气压呈正相关,沸点与海拔高度呈负相关;由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,故B,C,D正确,A错误.答案 BCD
一、素养落地1.通过本节课的学习,进一步提升直观想象及数据分析素养.2.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关.二、素养训练1.下列每组的两个变量之间具有相关关系的是( )A.乌鸦叫,灾难到B.圆心角的大小与半径C.物体的质量一定,其密度与体积之间的关系D.儿童的年龄与身高解析 A,B中的两个变量之间没有关系,C中的两个变量之间是函数关系,D中的两个变量之间是相关关系.答案 D2.下列语句所表示的事件中的因素不具有相关关系的是( )A.瑞雪兆丰年B.名师出高徒C.吸烟有害健康D.喜鹊叫喜解析 瑞雪对农作物有好处,可能使得农作物丰收,所以瑞雪兆丰年具有相关关系,名师出高徒也具有相关关系,吸烟有害健康也具有相关关系,而喜鹊叫喜,没有必然的关系,故选D.答案 D3.观察下列散点图,具有相关关系的是( )A.①②B.①③C.②④D.②③解析 ①是函数关系,④不具有相关关系,②③具有相关关系.答案 D
4.(多选题)对于给定的两个变量的统计数据,下列说法不正确的是( )A.都可以分析出两个变量之间的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系解析 给出一组样本数据,不一定能分析出两个变量的关系,更不一定符合线性相关,不一定用一条直线近似地表示,故A、B不正确;但总可以作出相应的散点图,C正确;两个变量的统计数据不一定有函数关系,故D不正确.答案 ABD5.(多选题)下列关系是相关关系的是( )A.角度和它的余弦值B.某商场搞促销活动与销售量之间的关系C.作文水平与课外阅读量之间的关系D.底面积一定的三棱锥的体积与高之间的关系解析 A,D中两个变量之间的关系是一种确定性关系,而B,C中的两个变量之间的关系是不确定的,所以它们具有相关关系.故选BC.答案 BC基础达标一、选择题1.下列语句所表示的事件中的因素不具有相关关系的是( )A.正方体的棱长与体积B.读书破万卷,下笔如有神C.数学成绩与物理成绩D.光照时间与水稻的单位产量解析 A具有函数关系.答案 A2.下列说法正确的是( )A.y=2x2+1中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系C.电脑的销售量与电脑的价格之间是一种确定性的关系D.传染病医院感染传染病的医务人员数与医院收治的传染病病人数是具有相关关系的两个变量解析 A,B均为函数关系,C,D为相关关系.答案 D3.下列图形中具有相关关系的两个变量是( )解析 A和B符合函数关系,即对x的每一个值,y都有唯一确定的值与之对应;从C,D散点图来看,D的散点都在某一条直线附近波动,因此两变量具有相关关系.答案 D4.(多选题)有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③森林中同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是( )A.①B.②C.③D.均不正确解析 ①,③具有相关关系,②具有确定的关系,即函数关系.答案 AC5.下列说法正确的是( )A.任何两个变量之间都有相关关系B.根据身高和体重的相关关系可以确定身高对应的体重值C.相关关系是一种不确定的关系D.以上答案都不对解析 变量之间的相关关系是一种不确定的关系,它也能反映变量之间的某种依赖关系.利用相关关系可以估计某些相关数据,但是不能确定准确的数值.
答案 C二、填空题6.下列两个变量之间的关系,是函数关系的有__________(填序号).①球的体积和它的半径;②人的身高和体重;③底面积为定值的长方体的体积和高;④城镇居民的消费水平和平均工资.解析 球的体积公式为V=πr3,长方体的体积V=S·h,都是确定的关系,因此①③中两个变量为函数关系,而②④中的两个变量,不是函数关系而是相关关系.答案 ①③7.下面是四个散点图中的点的分布状态,直观上判断两个变量之间具有线性相关关系的是__________(填序号).解析 散点图①中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;②中所有的点都在同一条直线上,是函数关系;③中点的分布在一条带状区域上,即点分布在一条直线的附近,是线性相关关系;④中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故填③.答案 ③8.某市煤气消耗量与使用煤气户数的历史记录资料如下表所示.i(年)12345x(户数:万户)11.21.61.82
y(煤气消耗量:百万立方米)679.81212.1i(年)678910x(户数:万户)2.53.244.24.5y(煤气消耗量:百万立方米)14.5202425.427.5其散点图如图所示.从散点图可知,煤气消耗量与使用煤气户数__________(填“线性相关”或“线性不相关”);若两者关系可近似为直线y=6.057x+0.082,则当煤气用户扩大到5万户时,该市煤气消耗量估计是__________百万立方米.解析 由散点图发现图中各点在一条直线附近,所以煤气消耗量与使用煤气户数是线性相关关系.给出近似直线方程,只需将x=5代入即可.此时6.057×5+0.082=30.367百万立方米.答案 线性相关 30.367三、解答题9.下表是某小卖部6天卖出热茶的杯数与当天气温的对比表:气温(℃)2518121040杯数183037355054(1)根据表中的数据画出散点图;(2)你能从散点图中发现气温与热茶杯数近似成什么关系吗?解 (1)根据表中的数据画出某小卖部6天卖出热茶的杯数与当天气温的散点图,如图.
(2)从散点图中可以看出气温与卖出的热茶杯数近似地成线性相关关系,且当气温越高时,所卖出的热茶的杯数就越少.10.在7块并排的、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg):施化肥量15202530354045水稻产量330345365405445450455(1)画出散点图;(2)判断它们是否具有线性相关关系.解 (1)以施化肥量为横坐标,其对应的水稻产量为纵坐标,在平面直角坐标系中描点,得散点图.(2)观察散点图,知散点图中的点分布在一条直线附近,则水稻产量与施化肥量之间具有线性相关关系.能力提升11.如图所示,有5组(x,y)的数据,去掉__________组数据后,剩下的4组数据的线性相关性最大.解析 显然去掉D组数据后,x,y的线性相关性最大.答案 D12.有人收集了10年中某城市居民年收入(即此城市所有居民在一年内的收入的总和)与某种商品的销售额的有关数据:(单位:亿元)第n年12345678910年收入32.231.132.935.837.138.039.043.044.646.0销售额25.030.034.037.039.041.042.044.048.051.0
(1)画出散点图.你能从散点图中发现居民年收入与该种商品销售额之间的近似关系吗?(2)如果它们之间近似成线性关系,请画出一条直线来近似表示这种关系.解 (1)散点图如图所示:从散点图中可以看出年收入与销售额之间的总体趋势成一条直线,也就是说它们之间是线性相关关系.(2)所画直线如图所示.创新猜想13.(多选题)下列关系中,是相关关系的为( )A.学生的学习态度与学习成绩之间的关系B.教师的教学水平与学生的学习成绩之间的关系C.学生的身高与学生的学习成绩之间的关系D.家庭的经济条件与学生的学习成绩之间的关系解析 A中学生的学习态度与学习成绩之间不是因果关系,但具有相关性,是相关关系;B中教师的教学水平与学生的学习成绩之间的关系是相关关系;CD都不具备相关关系.答案 AB14.(多选题)从统计学的角度看,下列关于变量间的关系说法不正确的是( )A.人体的脂肪含量与年龄之间没有相关关系B.汽车的重量和汽车每消耗1L汽油所行驶的平均路程之间有相关关系C.吸烟量与健康水平之间没有相关关系D.气温与热饮销售好不好之间没有相关关系解析 从统计学的角度看,在一定年龄段内,人体的脂肪含量与年龄之间有相关关系,∴A错误;汽车的重量和汽车每消耗1L汽油所行驶的平均路程之间有相关关系,∴B正确;吸烟量与健康水平之间有相关关系,∴
C错误;气温与热饮销售好不好之间有相关关系,∴D错误.答案 ACD