资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第九章 相关与回归分析,第一节 相关关系的概念和种类,第二节,相关表、相关图与相关系数,第三节 回归分析,第四节 估计标准误差,返回到目录,第九章 相关与回归分析,一、,教学目的,:通过对本章的学习,使学生掌握相关关系的概念和种类,相关表、相关图、相关系数的概念和作用,回归分析的概念和方法,估计标准误差的概念和计算。,二、,重点和难点,:相关关系的概念和种类,相关系数的概念、计算和作用,回归分析的概念和方法。,三、,教学方法,:课堂讲授。,四、,课时安排,:4课时,五、,教学内容,:,返回到第九章,第一节 相关关系的概念和种类,二、相关关系的种类,一、相关关系的概念,三、相关分析的主要内容,返回到第九章,一、相关关系的概念,相关关系,是指现象之间确实存在的,但关系值不固定的相互依存关系。,例如,圆面积,s=,r,2,,,是一个常数,,r,是圆的半径。,r,的值发生变化,则有一个确定的圆面积的值和它相对应。,例如身高,与,体重,的关系,,施肥量,与,亩产量,的关系。,函数关系,也是指两个变量之间存在的相互依存关系,但是它们之间的具体关系值是固定的。,在研究相关关系时,常常借助函数关系的形式。,返回到第一节,二、相关关系的种类,相关关系,按表现,形态分,按相关变化方向分,单相关,复相关,按涉及因素多少分,按相关,程度分,正相关,负相关,完全相关,不完全相关,直线相关,曲线相关,无相关,二、相关关系的种类,完全正线性相关,完全负线性相关,非线性相关,正线性相关,负线性相关,不相关,返回到第一节,三、相关分析的主要内容,(,一,),定性,判断,现象间有,无相关关系,根据有关的经济理论、专业知识、实际经验,和分析研究能力,对被研究现象在性质上作,出定性判断。,(,四,),配合回归方程式,即,建立函数关系式,来近似地描述现象间相关关,系的一般形式,(,二,),编制相关表、相关图,明确,现象间相关关系的,表现形式,(三)确定现象间相互关系的密切程度,(五)测算回归方程式的,可靠性,返回到第一节,第二节,相关表、相关图与相关系数,二、相关图,一、相关表,三、相关系数,返回到第九章,一、相关表,相关表就是根据被研究现象间一定数量的原始对应资料编制的统计表。,根据它可以对现象间相关关系进行初步分析,还可以进一步绘制相关图,为更深入的分析研究提供依据。,例:机床使用年限与维修费相关表,序号,机床使用年限(年)(,x),年维修费(元)(,y),1,2,400,2,2,540,3,3,520,4,4,640,5,4,740,6,5,600,7,5,800,8,6,700,9,6,760,10,6,900,11,8,840,12,9,1080,从表中可以看出,随着机床使用年限的增加,维修费也相应增加。,因此,可以得出,结论,:,(1)机床使用年限与维修费在数量上存在着一定的相关关系。,(2)这种相关关系属于正相关。,返回到第二节,二、相关图,相关图,又称散点图,是根据现象间相关关系一定数量的实际对应资料,(,即相关表中所列资料,),绘制而成的统计图。,具体做法:以直角坐标系中的,横轴,代表一个变量(通常是作为影响因素的那个变量),以,纵轴,代表另一个变量(通常是作为被影响因素的那个变量),将相关表中的每个数值在坐标系中画成,坐标点,,坐标点对称为相关点,所有的相关点组成的图形就是相关图。,例:将上表中的资料绘制成相关图如图。,1,维修费用,(元),0,机床使用年限(年),1,2,3,4,5,6,7,8,9,10,11,12,1100,1000,900,800,700,600,500,400,300,200,100,返回到第二节,三、相关系数,相关系数,是反映两个现象在直线相关条件下,相关关系密切程度的统计分析指标。,第二,因变量数列的标准差:,计算相关系数,首先要计算三个指标:,第一,,自变量数列的标准差:,第三,两个数列的协方差:,则,相关系数基本公式,为:,在实际工作中,都要求原始数据不少于50对。,三、相关系数计算示例,以机床使用年限与维修费用资料为例。,设:机床使用年限为,x,,维修费为,y,,计算得:,则:,相关系数的应用,当相关系数为,正值,时,现象间为,正相关,关系;,当相关系数为,负值,时,现象间为,负相关,关系。,相关系数的数值在-1和+1之间,即-1,r+1。,一般根据相关系数的绝对值大小,将其分为四个等级:,当,r,的绝对值在,0.3,以下时,视为,不相关,。,当,r,的绝对值在,0.3,0.5,之间时,为,低度相关,。,当,r,的绝对值在,0.5,0.8,之间时,为,显著相关,。,当,r,的绝对值在,0.81,之间时,为,高度相关,。,相关系数用于判断两个现象间线性相关关系的密切程度。,返回到第二节,第三节,回归分析,二、回归分析的种类,一、回归分析的概念,三、一元直线回归,四、曲线回归,返回到第九章,一、回归分析的概念,回归分析,就是对具有相关关系的变量之间变化的关系进行测定与描述,确定一定的,数学表达式,,以便进行估计或预测的方法。,回归分析具有以下特点:,1.两个变量之间不是对等关系,一个是自变量,,一个是因变量。,2.回归方程是据以利用自变量的给定值来推算,或估计因变量的值,反映其变量值之间具体,的变动关系。,返回到第三节,二、回归分析的种类,(,一,),从回归变量的个数划分为:,多元回归,三个或三个以上变量的回归,即包含了两个或两个以上自变量的回归。,(,二,),从回归的形式划分为:,一元回归,一元回归是指只研究两个变量之,间的回归分析,即只有一个自变量的回归。,非直线回归,曲线来代表现象之间的一般数量关系。,直线回归,(线性回归)变量之间的变化趋势大体呈直线趋势。,返回到第三节,三、一元直线回归,一元直线回归,也称简单直线回归,是指两个变量之间的回归,并且这两个变量之间的变化趋势近似于一条直线。,简单直线回归方程的一般公式为:,y,c,a+bx,式中:,y,c,为因变量的估计值,或是推算出来的直线上的趋势值;,x,为自变量;,a,为直线的截距,即当自变量为零时,因变量的数值;,b,为斜率,即自变量每增加一单位时,因变量平均增加值。,求解,a,、,b,两个参数要用的标准方程组为:,Y,na+b,x,x,y =ax+b,x,2,三、一元直线回归,例:根据机床使用年限与维修费用资料建立回归方程式。,解,:通过前面的相关分析,机床使用年限和维修费用间存在着高度直线相关关系。因此,可以为它们配合,回归直线,,即:,y,c,=a+bx,将前面的计算结果代入,方程组:,得:,Y,na+b,x,x,y =ax+b,x,2,8520=12,a+60b,46560=60,a+352b,求解,得,:,a=329.25,b=76.15,得出反映自变量和因变量之间一般数量关系的,方程式,,,即:,y,c,=329.25+76.15 x,返回到第三节,四、曲线回归,在对经济变量进行配合回归方程时,常遇到的问题是自变量和因变量的关系是曲线型。,(一)双曲线,设,双曲线回归方程,为:,根据最小平方法,求解方程中参数,a,和,b,,,即:,(二)指数曲线,设,指数曲线方程,为:,上式中,,b,0,,,a,、,b,是待定参数。,当,b1,时,为递增曲线;当0,b1,时,为递减曲线。,求,a、b,两个参数时,可将指数曲线方程两边取对数,转换为直线的对数形式,即:,若令,则方程可变为:,Y=A+Bx,这样,就可以按照求解直线方程中参数的方法来计算,A,和,B,,,最后再返回去查反对数表得出,a,和,b,来。,(三)二次抛物线,设二次,抛物线方程,为:,y,c,=a+bx+cx,2,根据最小二乘法求解未知参数,a、b、c,的方程组为:,y=na+b,x+c,x,2,xy=a,x+b,x,2,+c,x,3,x,2,y=ax,2,+bx,3,+cx,4,用此方程组解出,a,、,b,、,c,,,然后代入方程,yc=a+bx+cx,2,中得出二次抛物线方程式。,返回到第三节,第四节,估计标准误差,二、估计标准误差的测定,一、估计标准误差的概念,三、相关系数和估计标准误差的关系,返回到第九章,一、估计标准误差的概念,估计标准误差,就是用来说明回归方程推算结果的准确程度的统计分析指标。,根据直线回归方程,当已知自变量的某个数值时,就可推算出因变量的数值。,统计上把这种差距叫做估计标准误差。,推算出来的因变量的数值并不是确定的数值,是一个估计值,它和实际值有一定的差距。,返回到第四节,二、估计标准误差的测定,估计标准误差,又叫回归标准差。根据掌握资料不同,它有两种计算方法:,(,一,),根据因变量实际值和估计值的离差计算,计算公式如下:,式中:,S,yx,代表估计标准误差;,y,代表因变量数列的实际值;,y,c,代表根据回归方程推算出来的估计值;,n,代表因变量的项数。,(二)根据,a、b,两个参数值计算估计标准误差,计算公式如下:,二、估计标准误差测定示例,例:根据机床使用年限与维修费用资料计算,估计标准误差,见下表:,机床使用年限(,x),维修费(元),y,c,(y,c,=329.25+76.15x),y-y,c,(y-y,c,),2,2,(y),481.55,88.55,6650.40,2,400,481.55,58.45,3416.40,3,540,557.70,37.7,1421.29,4,520,633.85,6.15,37.82,4,640,633.85,106.15,11267.82,5,740,710.00,110,12100,5,600,710.00,90,8100,6,800,786.15,86.15,7121.82,6,700,786.15,-26.15,683.82,6,760,786.15,113.85,12961.82,8,900,938.45,98.45,9692.4,9,840,1014.60,65.40,4377.16,合计,1080,8520,78030.75,将上表计算结果代入公式即得:,计算结果,估计标准误差为80.46元,说明维修费的实际值和估计值间的差距。,返回到第四节,三、相关系数和估计标准误差的关系,相关系数与估计标准误差在数量上有以下,关系,:,或S,2,yx,=,2,y,(1-r,2,),r,是相关系数;,2,y,是因变量数列的方差;,S,2,yx,是估计标准误差的平方。,相关系数和估计标准误差在数值上的大小表现为,相反的关系,。,1.,r,值越大,则,S,yx,值越小,说明相关程度越密切。,2.,r,值越小,则,S,yx,值越大,说明相关程度不密切。,四、应用相关与回归分析时应注意的问题,1.必须以现象间客观存在的数量依存关系为分析的基础和前提,2,.将相关系数、回归方程和回归标准差,结合起来应用,3,.在回归分析时,要注意变量的计量单位,。,返回到第四节,本章作业,一、完成统计学习指导书本章所有习题。,二、,了解利用,Excel,建立直线方程的步骤。,返回到第九章,
展开阅读全文