资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2.3.1 变量间的相关关系,授课人:沙尼亚托克西,单位:昭苏县曙光中学,1,复习回顾,前面我们学习了怎样对收集来的数据进行分析,:,频率分布图,离散程度,集中趋势,下面我们来介绍一中更为常见的分析方法,:,变量间的相关关系,2,小明,你数学成绩不太好,物理怎么样,?,也不太好啊,.,学不好数学,物理也是学不好的,?.,3,哲学原理,:世界是一个普遍联系的整体,任何事物都与,周围,其它事物相联系。,数学地理解世界,4,你认为老师的说法对吗,?,事实上,我们在考察数学成绩对物理成绩影响的同时,还必须考虑到其他的因素,:,爱好,努力程度,如果单纯从数学对物理的影响来考虑,就是考虑这两者之间的,相关关系,我们在生活中,碰到很多相关关系的问题,:,数学成绩,学习兴趣,花费时间,其他因素,5,商品销售收入,K,广告支出经费,?,粮食产量,K,施肥量,?,付出,K,收入,?,人体脂肪含量,K,年龄,?,6,以上种种问题中的两个变量之间的相关关系,我们都可以根据自己的生活,学习经验作出相应的判断,“,规律是经验的总结,”,不管你多有经验,只凭经验办事,还是很容易出错的,一次在寻找变量讲的相关关系时,我们需要一些更为科学的方法来说明问题,.,在寻找变量间的相关关系时,统计同样发挥了非常重要的作用,我们是通过收集大量的数据,对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断,.,下面我们通过具体的例子来分析,7,1,、两个变量之间的相关关系,两个变量间存在着某种关系,带有不确定性,(,随机性),不能用函数关系精确地表达出来,我们说这两个变量具有,相关关系,.,8,相关关系,当自变量取值一定,因变量的,取值带有一定的随机性(非确定性关系,),函数关系,-,函数关系指的是自变量和因变量之间的关系是相互唯一确定的,.,注:相关关系和函数关系的异同点,相同点:两者均是指两个变量间的关系,不同点:函数关系是一种确定关系,,相关关系是一种非确定的关系。,对相关关系的理解,9,1,:下列两变量中具有相关关系的是(),A,角度和它的余弦值,B,正方形的边长和面积,C,成人的身高和视力,D,身高和体重,D,练习:,10,【,问题,】,在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:,其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数,.,年龄,23,27,39,41,45,49,50,脂肪,9.5,17.8,21.2,25.9,27.5,26.3,28.2,年龄,53,54,56,57,58,60,61,脂肪,29.6,30.2,31.4,30.8,33.5,35.2,34.6,根据上述数据,人体的脂肪含量与年龄之间,有怎样的关系?,11,思考,1,:,对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性,.,观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?,年龄,23,27,39,41,45,49,50,脂肪,9.5,17.8,21.2,25.9,27.5,26.3,28.2,年龄,53,54,56,57,58,60,61,脂肪,29.6,30.2,31.4,30.8,33.5,35.2,34.6,12,思考,2,:,为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象,.,以,x,轴表示年龄,,y,轴表示脂肪含量,,你能在直角坐标系中描出样本数据对应的图形吗?,年龄,23,27,39,41,45,49,50,脂肪,9.5,17.8,21.2,25.9,27.5,26.3,28.2,年龄,53,54,56,57,58,60,61,脂肪,29.6,30.2,31.4,30.8,33.5,35.2,34.6,13,思考,3,:,上图叫做,散点图,,你能描述一下散点图的含义吗?,在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图,.,14,散点图,3).,如果所有的样本点都落在某一,直线附近,,,变量之间就有,线性相关关系,.,1).,如果所有的样本点都落在某一,函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有,函数关系,2).,如果所有的样本点都落在某一,函数曲线附近,变量之间就有,相关关系,。,说明,散点图,:,用来判断两个变量是否具有相关关系,.,15,观察散点图的大致趋势,两个变量的,散点图,中点的分布的位置是从左下角到右上角的区域,我们称这种相关关系为,正相关。,16,思考,4,:,如果两个变量成,负相关,,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?,散点图中的点散布在从左上角到右下角的区域,.,思考,5,:,你能列举一些生活中的变量成正相关或负相关的实例吗,?,17,如高原含氧量与海拔高度,的相关关系,海平面以上,,海拔高度越高,含氧量越,少。,作出散点图发现,它们散,布在从左上角到右下角的区,域内。又如汽车的载重和汽,车每消耗,1,升汽油所行使的,平均路程,称它们成,负相关,.,O,18,2.,下列关系属于负相关关系的是(),A.,父母的身高与子女的身高,B.,农作物产量与施肥的关系,C.,吸烟与健康的关系,D.,数学成绩与物理成绩的关系,C,练习:,19,如果散点图中点的分布,从,整体,上看,大致在一条直线附近,我们就称这两个变量之间具有,线性相关关系,,这条直线就叫做,回归直线,。,这条回归直线的方程,简称为回归方程。,三、回归直线,20,1.,如果所有的样本点都落在某一函数曲线上,变量之间具有函数关系,2.,如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系,3.,如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系,只有散点图中的点呈条状集中在某一直线周围的时候,才可以说两个变量之间具有线性关系,才有两个变量的正线性相关和负线性相关的概念,才可以用回归直线来描述两个变量之间的关系,21,整体上最接近,方案一:,采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程。,四、如何具体的求出这个回归方程呢?,22,方案二,:,在图中选取两点画直线,使得直线两侧的点的个数基本相同。,三、如何具体的求出这个回归方程呢?,23,方案三,:,在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距。,三、如何具体的求出这个回归方程呢?,24,上述三种方案均有一定的道理,但可靠性不强,我们回到回归直线的,定义,。,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与直线的偏差最小”。,如果散点图中点的分布,从,整体,上看,大致在一条直线附近,我们就称这两个变量之间具有,线性相关关系,,这条直线就叫做,回归直线,。,思考,6,:,对一组具有线性相关关系的样本数据:,(x,1,,,y,1,),,,(x,2,,,y,2,),,,,,(x,n,,,y,n,),,设其回归方程为 可以用哪些数量关系来刻画各样本点与回归直线的接近程度?,25,回归直线,实际上,求回归直线的关键是如何用数学的方法来刻画“从整体上看,各点到此直线的距离最小”,.,26,这样的方法叫做最小二乘法,.,27,我们上面给出的几种方案可靠性都不是很强,人们经过长期的实践与研究,已经找到了计算回归方程的斜率与截距的一般公式,:,以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫,最小二乘法,。,28,思考,7,:,利用,计算器或计算机,可求得年龄和人体脂肪含量的样本数据的回归方程为,,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的,回归值,.,若某人,65,岁,则其体内脂肪含量的百分比,约,为多少?,37.1,(,0.57765-0.448=37.1,),29,若某人,65,岁,可预测他体内脂肪含量在,37.1,(,0.57765-0.448=37.1,)附近的可能性比较大。,但不能说他体内脂肪含量一定是,37.1,原因,:线性回归方程中的截距和斜率都是通过样本,估计的,,存在随机误差,这种误差可以导致预测结果的偏差,即使截距斜率没有误差,也不可能百分百地保证对应于,x,,预报值,Y,能等于实际值,y,30,例,3,:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:,1,、画出散点图;,2,、从散点图中发现气温与热饮销售杯数之间关系的一般规律;,3,、求回归方程;,4,、如果某天的气温是,2,摄氏度,预测这天卖出的热饮杯数。,31,1,、散点图,2,、从图,3-1,看到,各点散布在从左上角到由下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。,3、从散点图可以看出,这些点大致分布在一条直线的附近,因此利用公式求出回归方程的系数。,Y=-2.352x+147.767,4,、当,x=2,时,,Y=143.063,因此,某天的气温为,2,摄氏度时,这天大约可以卖出,143,杯热饮。,32,练习,:,给出施化肥量对水稻产量影响的,试验数据:,施化肥量,x,15,20,25,30,35,40,45,水稻产量,y,330,345,365,405,445,450,455,(1),画出上表的散点图,;,(2),求出回归直线并且画出图形,.,33,从而得回归直线方程是,解:,(1),散点图(略),(2),表中的数据进行具体计算,列成以下表格,20475,18000,15575,12150,9125,6900,4950,x,i,y,i,455,450,445,405,365,345,330,y,i,45,40,35,30,25,20,15,x,i,7,6,5,4,3,2,1,i,(,图形略,),故可得到,34,小结,1.,求样本数据的线性回归方程,可按下列步骤进行:,第一步,列表计算平均数,第二步,求和,第三步,计算,第四步,写出回归方程,35,2.,回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近,.,对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性,.,3.,对于任意一组样本数据,利用上述公式都可以求得“,回归方程,”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的,.,因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程,.,36,二、求线性回归方程,例,2,:观察两相关变量得如下表:,x,-1,-2,-3,-4,-5,5,3,4,2,1,y,-9,-7,-5,-3,-1,1,5,3,7,9,求两变量间的回归方程,解,1,:,列表:,i,1,2,3,4,5,6,7,8,9,10,-1,-2,-3,-4,-5,5,3,4,2,1,-9,-7,-5,-3,-1,1,5,3,7,9,9,14,15,12,5,5,15,12,14,9,计算得,:,37,练习,:,根据下表,求回归方程,.,38,1,、列表,2,、代入公式计算,3,、写出回归直线方程,39,总结,基础知识框图表解,变量间关系,函数关系,相关关系,散点图,线形回归,线形回归方程,40,1,、相关关系,(,1,)概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系。,(,2,)相关关系与函数关系的异同点。,相同点:两者均是指两个变量间的关系。,不同点:函数关系是一种确定关系,是一种因果系;相关关系是一种非确定的关系,也不一定是因果关系(但可能是伴随关系)。,(,3,)相关关系的分析方向。,在收集,大量数据的基础上,利用统计分析,发现规律,对它们的关系作出判断。,41,2,、两个变量的线性相关,(,1,)回归分析,对具有相关关系的两个变量进行统计分析的方法叫回归分析。通俗地讲,回归分析是寻找相关关系中非确定关系的某种确定性。,(,2,)散点图,A,、定义;,B,、正相关、负相关。,3,、回归直线方程,注,:,如果关于两个变量统计数据的散点图呈现发散状,则这两个变量之间不具有相关关系,.,42,3,、回归直线方程,(,1,)回归直线:观察散点图的特征,如果各点大致分布在一条直线的附近,就称两个变量之间具有线性相关的关系,这条直线叫做回归直线。,(,2,)最小二乘法,(3),利用回归直线对总体进行估计,43,P94,习题,2.3 A,组:,2,.,作业:,44,
展开阅读全文