1、7-1统计学统计学STATISTICSSTATISTICS第七章第七章 相关与回归分析相关与回归分析制作时间:200420057-2统计学统计学STATISTICSSTATISTICS内容提要内容提要1、相关关系的概念与种类、相关关系的概念与种类 2、相关分析相关分析3、一元线性回归分析一元线性回归分析4、多元线性回归分析多元线性回归分析5、曲线回归分析曲线回归分析7-3统计学统计学STATISTICSSTATISTICS学习目标学习目标1.理解相关关系的概念理解相关关系的概念2.掌握线性回归的基本原理和参数的最小掌握线性回归的基本原理和参数的最小二乘估计二乘估计3.掌握回归直线的拟合优度掌握
2、回归直线的拟合优度4.掌握回归方程的显著性检验掌握回归方程的显著性检验5.利用回归方程进行估计和预测利用回归方程进行估计和预测6.用用 Excel 进行回归分析进行回归分析7-4统计学统计学STATISTICSSTATISTICS第一节相关关系概述第一节相关关系概述7-5统计学统计学STATISTICSSTATISTICS一、变量间的关系一、变量间的关系7-6统计学统计学STATISTICSSTATISTICS(一)函数关系(一)函数关系1.是一一是一一对应的确定关系对应的确定关系2.设设有有两两个个变变量量 x x 和和 y y,变变量量 y y 随随变变量量 x x 一一起起变变化化,并并
3、完完全全依依赖赖于于 x x ,当当变变量量 x x 取取某某个个数数值值时时,y y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y y 是是 x x 的的函函数数,记记为为 y y =f f(x x),其其中中 x x 称为自变量,称为自变量,y y 称为因变量称为因变量3.各各观测点落在一条线上观测点落在一条线上 x xy y7-7统计学统计学STATISTICSSTATISTICS函数关系函数关系(几个例子几个例子)函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额y y与与销销售售量量x x之之间间的的关关系系可可表表示为示为 y y=pxpx (p p 为单价
4、为单价)圆的面积圆的面积S S与半径之间的关系可表示为与半径之间的关系可表示为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额y y与与产产量量x x1 1 、单单位位产产量量消消耗耗x x2 2 、原材料价格原材料价格x x3 3之间的关系可表示为之间的关系可表示为 y y=x x1 1 x x2 2 x x3 3 7-8统计学统计学STATISTICSSTATISTICS(二)相关关系(二)相关关系(correlation)1.变变量量间间关关系系不不能能用用函函数数关关系精确表达系精确表达2.一一个个变变量量的的取取值值不不能能由由另另一个变量唯一确定一个变量唯一确定3.当当变
5、变量量 x x 取取某某个个值值时时,变变量量 y y 的取值可能有几个的取值可能有几个4.各观测各观测点分布在直线周围点分布在直线周围 x xy y7-9统计学统计学STATISTICSSTATISTICS相关关系相关关系(几个例子几个例子)相关关系的例子相关关系的例子父亲身高父亲身高y y与子女身高与子女身高x x之间的关系之间的关系收入水平收入水平y y与受教育程度与受教育程度x x之间的关系之间的关系粮粮食食亩亩产产量量y y与与施施肥肥量量x x1 1 、降降雨雨量量x x2 2 、温温度度x x3 3之间的关系之间的关系商品的消费量商品的消费量y y与居民收入与居民收入x x之间的
6、关系之间的关系商品销售额商品销售额y y与广告费支出与广告费支出x x之间的关系之间的关系7-10统计学统计学STATISTICSSTATISTICS二、相关关系的种类二、相关关系的种类7-11统计学统计学STATISTICSSTATISTICS 相关关系的种类相关关系的种类单项关1、按相关的形式分为:线性相关非线性相关2、按所研究的变量多少分为:复相关3、按相关的方向分为:正相关负相关4、按相关的程度分为:完全相关不完全相关不相关偏相关7-12统计学统计学STATISTICSSTATISTICS散点图散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线
7、性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关 7-13统计学统计学STATISTICSSTATISTICS三、相关关系分析的方法三、相关关系分析的方法7-14统计学统计学STATISTICSSTATISTICS(一)相关分析(一)相关分析1、相关分析主要用于测定具有相关关系的变量之间相互关系的密切程度。
8、2、是回归分析的基础。3、分析方法主要有:绘制散点图、编制相关表、计算项关系数等。7-15统计学统计学STATISTICSSTATISTICS(二)回归分析(二)回归分析(Regression)1.研究具有相关关系的变量值之间一般的数量变动关系,即自变量发生变化时,因变量平均会发生多大的变化。2.通过建立回归方程来完成分析。3.回归方程除可用于研究相关变量之间的一般数量变动关系外,还常用于进行预测,即根据一个或几个变量的取值来预测或控制另一个相关变量的取值,并给出这种预测或控制的精确程度7-16统计学统计学STATISTICSSTATISTICS回归模型的类型回归模型的类型7-17统计学统计学
9、STATISTICSSTATISTICS(三)回归分析与相关分析的区别(三)回归分析与相关分析的区别1.相相关关分分析析主主要要是是描描述述两两个个变变量量之之间间线线性性关关系系的的密密切切程程度度;回回归归分分析析不不仅仅可可以以揭揭示示变变量量 之之间间的的一一般般数数量量变变动动关关系系,还还可可以以由由回回归归方方程程进进行行预预测测和和控制控制 。2.相相关关分分析析中中,变变量量 x x 变变量量 y y 处处于于平平等等的的地地位位;回回归归分分析析中中,变变量量 y y 称称为为因因变变量量,处处在在被被解解释释的的地地位,位,x x 称为自变量,用于预测因变量的变化称为自变
10、量,用于预测因变量的变化3.相相关关分分析析中中所所涉涉及及的的变变量量 x x 和和 y y 都都是是随随机机变变量量;回回归归分分析析中中,因因变变量量 y y 是是随随机机变变量量,自自变变量量 x x 可可以是随机变量,也可以是非随机的确定变量以是随机变量,也可以是非随机的确定变量7-18统计学统计学STATISTICSSTATISTICS第二节相关分析第二节相关分析7-19统计学统计学STATISTICSSTATISTICS一、相关表和相关图一、相关表和相关图7-20统计学统计学STATISTICSSTATISTICS相关表与相关图相关表与相关图(概念要点)(概念要点)1 1、相关表
11、和相关图是研究相关关系的直观工具。相关表和相关图是研究相关关系的直观工具。相关表和相关图是研究相关关系的直观工具。相关表和相关图是研究相关关系的直观工具。一般在进一般在进一般在进一般在进行详细的定量分析之前,可以利用它们对现象之间存在行详细的定量分析之前,可以利用它们对现象之间存在行详细的定量分析之前,可以利用它们对现象之间存在行详细的定量分析之前,可以利用它们对现象之间存在的相关关系的方向、形式和密切程度做大致的判断。的相关关系的方向、形式和密切程度做大致的判断。的相关关系的方向、形式和密切程度做大致的判断。的相关关系的方向、形式和密切程度做大致的判断。2 2、相关表相关表相关表相关表是一种
12、反映变量之间相关关系的统计表。它是将是一种反映变量之间相关关系的统计表。它是将是一种反映变量之间相关关系的统计表。它是将是一种反映变量之间相关关系的统计表。它是将某一变量按其取值的大小排列,然后再将与其相关的另某一变量按其取值的大小排列,然后再将与其相关的另某一变量按其取值的大小排列,然后再将与其相关的另某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到简单的相关表。一变量的对应值平行排列,便可得到简单的相关表。一变量的对应值平行排列,便可得到简单的相关表。一变量的对应值平行排列,便可得到简单的相关表。3 3、相关图又称散点图相关图又称散点图相关图又称散点图相关图
13、又称散点图。它是以直角坐标系的横轴代表变量。它是以直角坐标系的横轴代表变量。它是以直角坐标系的横轴代表变量。它是以直角坐标系的横轴代表变量X X,纵轴代表,纵轴代表,纵轴代表,纵轴代表Y Y,将两个变量间相应的变量值用坐标点,将两个变量间相应的变量值用坐标点,将两个变量间相应的变量值用坐标点,将两个变量间相应的变量值用坐标点的形式描绘出来,用来反应量变量之间相关关系的图形的形式描绘出来,用来反应量变量之间相关关系的图形的形式描绘出来,用来反应量变量之间相关关系的图形的形式描绘出来,用来反应量变量之间相关关系的图形。7-21统计学统计学STATISTICSSTATISTICS相关表相关表(举例分
14、析)(举例分析)家庭编号家庭编号1 12 23 34 45 56 67 78 89 91010可支配收入可支配收入 2525 1818 6060 45456262 8888 9292 999975759898可支配收入可支配收入 1818 2525 4545 60606262 7575 8888 929298989999 居民收入和消费的原始资料 计量单位:百元 居民消费和收入相关表 计量单位:百元消费支出消费支出2020 1515 4040 30304242 6060 6565 707053537878消费支出消费支出1515 2020 3030 40404242 5353 6060 656
15、5787870707-22统计学统计学STATISTICSSTATISTICS散点图散点图(例题分析例题分析)【例例例例】一一家家大大型型商商业业银银行行在在多多个个地地区区设设有有分分行行,其其业业务务主主要要是是进进行行基基础础设设施施建建设设、国国家家重重点点项项目目建建设设、固固定定资资产产投投资资等等项项目目的的贷贷款款。近近年年来来,该该银银行行的的贷贷款款额额平平稳稳增增长长,但但不不良良贷贷款款额额也也有有较较大大比比例例的的增增长长,这这给给银银行行业业务务的的发发展展带带来来较较大大压压力力。为为弄弄清清楚楚不不良良贷贷款款形形成成的的原原因因,希希望望利利用用银银行行业业
16、务务的的有有关关数数据据做做些些定定量量分分析析,以以便便找找出出控控制制不不良良贷贷款款的的办办法法。下下面面是是该该银银行行所所属属的的2525家分行家分行20022002年的有关业务数据年的有关业务数据 7-23统计学统计学STATISTICSSTATISTICS散点图散点图(例题分析例题分析)7-24统计学统计学STATISTICSSTATISTICS散点图散点图(例题分析例题分析)7-25统计学统计学STATISTICSSTATISTICS二、相关系数及其检验二、相关系数及其检验7-26统计学统计学STATISTICSSTATISTICS相关系数相关系数(correlation co
17、efficient)1.对变量之间关系密切程度的测度值(指标)2.对两两个个变变量量之间线性相关程度的度量称为单单相相关系数关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 ,若是根据样本数据计算的,则称为样本相关系数,记为 r 7-27统计学统计学STATISTICSSTATISTICS相关系数相关系数 (计算公式计算公式)样本相关系数的计算公式或化简为7-28统计学统计学STATISTICSSTATISTICS相关系数相关系数(取值及其意义取值及其意义)1.r r 的取值范围的取值范围是是 -1,1-1,12.|r r|=|=1 1,为完全相关为完全相关n nr r=1
18、 1,为为完全正相关完全正相关n nr r=-1-1,为完全负正相关为完全负正相关3.r r=0=0,不存在不存在线性线性线性线性相关相关关系关系4.-1-1 r r 0 0,为为负相关负相关5.0 0 t t,拒绝拒绝H H0 0 若若 t t =7.5344t t(25-2)=2.0687(25-2)=2.0687,拒拒绝绝H H0 0,不不良良贷贷款与贷款余额之间存在着显著的正线性相关关系款与贷款余额之间存在着显著的正线性相关关系 7-38统计学统计学STATISTICSSTATISTICS相关系数的显著性检验相关系数的显著性检验(例题分析例题分析)各相关系数检验的统计量各相关系数检验的
19、统计量7-39统计学统计学STATISTICSSTATISTICS第三节第三节 一元线性回归一元线性回归7-40统计学统计学STATISTICSSTATISTICS一、一元线性回归与函数模型一、一元线性回归与函数模型7-41统计学统计学STATISTICSSTATISTICS一元线性回归函数一元线性回归模型总体样本(一)一元线性回归函数与(一)一元线性回归函数与模型的数学表达式模型的数学表达式 0 0是回归直线在是回归直线在 y y 轴上的截距,是当轴上的截距,是当 x x=0=0 时时 y y 的期望值。的期望值。1 1是是直线的斜率,称为回归系数,表示当直线的斜率,称为回归系数,表示当 x
20、 x 每变动一个单位时,每变动一个单位时,y y 的平均变动值。的平均变动值。7-42统计学统计学STATISTICSSTATISTICSXYX1X2X3X4(二)一元线性回归函数与(二)一元线性回归函数与模型意义的图形解释模型意义的图形解释7-43统计学统计学STATISTICSSTATISTICS(三)一元线性回归模型的(三)一元线性回归模型的(三)一元线性回归模型的(三)一元线性回归模型的基本假定基本假定基本假定基本假定 1.1.误误差差项项u u是是一一个个期期望望值值为为0 0的的正正态态分分布布随随机机变变量量,即即2.2.对对于所有的于所有的 x x 值,值,u u的方差的方差
21、2 2 都相同,即都相同,即3.3.对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的u u与与其其他他 x x 值值所所对应的对应的u u不相关。即不相关。即4.4.对对于于一一个个特特定定的的 x x 值值,它它所所对对应应的的 y y 值值与与其其他他 x x 所所对应的对应的 y y 值也不相关值也不相关7-44统计学统计学STATISTICSSTATISTICSXYX1X2X3X4回归模型基本假定的图形解释回归模型基本假定的图形解释7-45统计学统计学STATISTICSSTATISTICS(四)样本回归方程与总体回归方(四)样本回归方程与总体回归方程的联系与区别程的联
22、系与区别联联系系:样样本本回回归归方方程程与与总总体体回回归归方方程程具具有有相相同同的的形形式式,且且样样本回归模型是作为总体回归模型的估计而存在的。本回归模型是作为总体回归模型的估计而存在的。区别:区别:1 1、总总体体回回归归线线是是未未知知的的,并并且且只只有有一一条条。而而样样本本回回归归线线则则是是根根据据样样本本数数据据拟拟合合的的,每每抽抽取取一一个个样样本本,便便可可以以拟拟合合一一条条回归线。回归线。2 2、总总体体回回归归方方程程中中的的参参数数是是未未知知的的,但但它它是是确确定定的的。而而样样本回归方程中的参数是随机变量,随样本的不同而不同。本回归方程中的参数是随机变
23、量,随样本的不同而不同。3 3、总总体体回回归归模模型型中中的的ui是是(因因变变量量实实际际观观测测值值)Yi与与总总体体回回归归线线之之间间的的纵纵向向距距离离,它它是是不不可可直直接接观观测测的的。而而样样本本回回归归模模型型中中ei是是Yi与与样样本本回回归归线线之之间间的的纵纵向向距距离离,当当根根据据样样本本数数据据拟合出样本回归线之后,可以计算出拟合出样本回归线之后,可以计算出ei的具体数值。的具体数值。7-46统计学统计学STATISTICSSTATISTICS二、模型参数的估计二、模型参数的估计7-47统计学统计学STATISTICSSTATISTICS(一)回归系数的估计(
24、一)回归系数的估计 最小二乘估计最小二乘估计1.使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即2.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小7-48统计学统计学STATISTICSSTATISTICS最小二乘估计最小二乘估计(图示图示)x xy y(x xn n,y yn n)(x x1 1,y y1 1)(x x2 2,y y2 2)(x xi i,y yi i)e ei i=y yi i-y yi i7-49统计学统计学STATISTICSSTATISTICS最小二乘法最小二乘法(和和 的计算公式的计算公式)根据最小二乘法的要求,
25、可得求解 和 的公式如下7-50统计学统计学STATISTICSSTATISTICS最小二乘法最小二乘法(例题分析例题分析)【例】【例】【例】【例】求不良贷款对贷款余额的回归(方程)函数求不良贷款对贷款余额的回归(方程)函数回归方程为:回归方程为:y=-0.8295+0.037895 x回回归归系系数数 =0.037895=0.037895 表表示示,贷贷款款余余额额每每增增加加1 1亿元,不良贷款平均增加亿元,不良贷款平均增加0.0378950.037895亿元亿元 7-51统计学统计学STATISTICSSTATISTICS最小二乘法最小二乘法(例题分析例题分析)不良贷款对贷款余额回归方程
26、的图示7-52统计学统计学STATISTICSSTATISTICS(二)总体方差的估计(二)总体方差的估计 此外,S2 的正平方根有叫做回归估计的标准差估计的标准差。S越小,回归线的代表性越强,否则相反。除除了了 1 1和和 2 2,一一元元线线性性回回归归模模型型还还包包括括另另外外一一个个未未知知参参数数,那那就就是是总总体体随随机机误误差差项项的的方方差差2 2。2 2可可以以反反映映理理论论模模型型误误差差的的大大小小,它它是是检检验验模模型型时时,必必须须利利用用的的一一个个重重要要参参数数。由由于于2 2本本身身不不能能直直接接观观测测,因因而而需需要要用用e et t2 2(最最
27、小小二二乘乘残残差差)来估计来估计2 2。可以证明。可以证明2 2的无偏估计为:的无偏估计为:7-53统计学统计学STATISTICSSTATISTICS用用Excel进行回归分析进行回归分析第第第第1 1步:步:步:步:选择选择“工具工具工具工具”下拉菜单下拉菜单第第第第2 2步:步:步:步:选择选择“数据分析数据分析数据分析数据分析”选项选项第第第第3 3步:步:步:步:在分析工具中选择在分析工具中选择“回归回归回归回归”,然后选择,然后选择“确定确定确定确定”第第第第4 4步:步:步:步:当对话框出现时当对话框出现时 在在“Y Y值输入区域值输入区域值输入区域值输入区域”设置框内键入设置
28、框内键入Y Y的数据区域的数据区域 在在“X X值输入区域值输入区域值输入区域值输入区域”设置框内键入设置框内键入X X的数据区域的数据区域 在在“置信度置信度置信度置信度”选项中给出所需的数值选项中给出所需的数值 在在“输出选项输出选项输出选项输出选项”中选择输出区域中选择输出区域 在在“残差残差残差残差”分析选项中选择所需的选项分析选项中选择所需的选项 用用用用ExcelExcel进行回归分析进行回归分析进行回归分析进行回归分析7-54统计学统计学STATISTICSSTATISTICS三、回归模型的检验三、回归模型的检验7-55统计学统计学STATISTICSSTATISTICS1 1、
29、经济理论检验、经济理论检验经经济济理理论论检检验验主主要要涉涉及及估估计计值值的的符符号号和和取取值值区区间间。如果它们与实质性科学的理论以及人们的实践经验不相符合,就说明模型不能很好的解释现实现象。其原因可能是样本偏小,不能代表总体或不能满足标准回归分析所要求的假定条件。2 2、统计检验(一级检验)、统计检验(一级检验)统统计计检检验验是是利利用用统统计计学学中中的的抽抽样样理理论论检检验验样样本本回回归归方方程程的的可可靠靠性性,包包括括拟拟合合优优度度检检验验和和显显著著性性检检验验。统计检验是所有现象进行回归分析时都必须进行的检验。3 3、计量经济学检验(二级检验)、计量经济学检验(二
30、级检验)计量经济学检验是对标准回归方程的假定条件能否得到满足进行检验。(一)模型检验的内容(一)模型检验的内容7-56统计学统计学STATISTICSSTATISTICS(二)模型拟合优度检验(二)模型拟合优度检验7-57统计学统计学STATISTICSSTATISTICS 拟拟合合优优度度检检验验是是检检验验样样本本回回归归方方程程对对样样本本观观测测值值代代表表性性大大小小。衡衡量量这这一一问问题题的的指指标标称称为为可可决决系系数数(决决定定系系数数),其数学表达式为:其数学表达式为:(Regression Sum of Square)(Residual Sum of Square)(T
31、otal Deviation Sum of Square)1、概念及公式、概念及公式7-58统计学统计学STATISTICSSTATISTICS离差平方和的分解离差平方和的分解(变差)变差)1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面n n由于自变量由于自变量 x x 的取值不同造成的的取值不同造成的n n除除 x x 以以外外的的其其他他因因素素(如如x x对对y y的的非非线线性性影影响响、测量误差等测量误差等)的影响的影响2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示7-59统计学统计学STATISTICSSTATISTI
32、CS变差的分解变差的分解(图示图示)x xy yy y 7-60统计学统计学STATISTICSSTATISTICS离差平方和的分解离差平方和的分解(三个平方和的关系三个平方和的关系)SST=SSR+SSE总平方和总平方和总平方和总平方和(SSTSST)回归平方和回归平方和回归平方和回归平方和(SSRSSR)残差平方和残差平方和残差平方和残差平方和(SSESSE)7-61统计学统计学STATISTICSSTATISTICS离差平方和的分解离差平方和的分解(三个平方和的意义三个平方和的意义)1.总平方和总平方和(SST)n n反映因变量的反映因变量的 n n 个观察值与其均值的总离差个观察值与其
33、均值的总离差2.回归平方和回归平方和(SSR)n n反反映映自自变变量量 x x 的的变变化化对对因因变变量量 y y 取取值值变变化化的的影影响响,或或者者说说,是是由由于于 x x 与与 y y 之之间间的的线线性性关关系系引引起的起的 y y 的取值变化,也称为可解释的平方和的取值变化,也称为可解释的平方和3.残差平方和残差平方和(SSE)n n反反映映除除 x x 以以外外的的其其他他因因素素对对 y y 取取值值的的影影响响,也也称为不可解释的平方和或剩余平方和称为不可解释的平方和或剩余平方和7-62统计学统计学STATISTICSSTATISTICS2、可决系数、可决系数r2 的特
34、性的特性(1 1)具有非负性)具有非负性(2 2)r r2 2的值越接近的值越接近1 1,SSRSSR越接近越接近SST,SST,即即 说说明明回回归归方方程程对对实实际际观观测测值值的的拟拟合合程程度度愈愈好好,否则相反。否则相反。(3 3)可可决决系系数数是是样样本本观观测测值值的的函函数数,它它也也是是一一个个随随机变量。机变量。(4 4)可可决决系系数数的的平平方方根根为为相相关关系系数数,用用公公式式表表示示为:为:7-63统计学统计学STATISTICSSTATISTICS可决系数可决系数r2 (例题分析例题分析)【例例例例】计计算算不不良良贷贷款款对对贷贷款款余余额额回回归归的的
35、判判定定系系数数,并并解解释释其意义其意义 判判判判定定定定系系系系数数数数的的的的实实实实际际际际意意意意义义义义是是是是:在在不不良良贷贷款款取取值值的的变变差差中中,有有71.16%71.16%可可以以由由不不良良贷贷款款与与贷贷款款余余额额之之间间的的线线性性关关系系来来解解释释,或或者者说说,在在不不良良贷贷款款取取值值的的变变动动中中,有有71.16%71.16%是是由由贷贷款款余余额额所所决决定定的的。也也就就是是说说,不不良良贷贷款款取取值值的的差差异异有有2/32/3以以上上是是由由贷贷款款余余额额决决定定的的。可可见见不不良良贷款与贷款余额之间有较强的线性关系贷款与贷款余额
36、之间有较强的线性关系 7-64统计学统计学STATISTICSSTATISTICS(三)(三)显著性检验显著性检验7-65统计学统计学STATISTICSSTATISTICS显著性检验显著性检验(概念要点)(概念要点)回归分析中的显著性检验包括两方面的内容:一是对各回归系数的显著性检验;对于回归系数的显著性检验通常采用t检验,二是对整个回归方程的显著性检验。对回归方程的显著性检验则是在方差分析的基础上采用F检验。在一元线性回归模型中,由于只有一个自变量X,对 =0的t检验与整个方程的F检验是等价的。所以这里只介绍回归系数的显著性检验,关于回归方程的显著性检验将在多元统计分析中介绍。7-66统计
37、学统计学STATISTICSSTATISTICS(三)回归系数的检验(三)回归系数的检验7-67统计学统计学STATISTICSSTATISTICS回归系数的检验回归系数的检验(概念要点)(概念要点)2.检验 x 与 y 之间是否具有线性关系,或者说,检验自变量 x 对因变量 y 的影响是否显著3.理论基础是回归系数 的抽样分布,1.就是根据样本估计的结果对总体回归系数的是否为0进行假设检验。7-68统计学统计学STATISTICSSTATISTICS回归系数的检验回归系数的检验(样本统计量样本统计量 的分布的分布)1.1.1.是是是根根根据据据最最最小小小二二二乘乘乘法法法求求求出出出的的的
38、样样样本本本统统统计计计量量量,它它它是是是一一一个个个随机变量随机变量随机变量,有自己的分布有自己的分布有自己的分布2.2.2.的的的分布具有如下性质分布具有如下性质分布具有如下性质 分布形式:正态分布分布形式:正态分布分布形式:正态分布 数学期望:数学期望:数学期望:标准差:标准差:标准差:由由由于于于 未未未知知知,需需需用用用其其其估估估计计计量量量s s sy yy来来来代代代替替替得得得到到到 的的的估估估计计计的的的标准差标准差标准差7-69统计学统计学STATISTICSSTATISTICS回归系数的检验回归系数的检验(检验步骤检验步骤)1.提出假设提出假设n nH H0 0:
39、1 1=0(=0(没有线性关系没有线性关系)n nH H1 1:1 1 0(0(有线性关系有线性关系)2.计算检验的统计量计算检验的统计量3.确定显著性水平确定显著性水平,并进行决策,并进行决策 t t t t,拒绝拒绝H H0 0;t t =7.533515t t=2.201=2.201,拒拒绝绝H H0 0,表表明明不不良良贷贷款款与贷款余额之间有线性关系与贷款余额之间有线性关系7-71统计学统计学STATISTICSSTATISTICS回归系数的检验回归系数的检验(例题分析例题分析)P 值的应用值的应用P P=0.000000=0.000000 F F ,拒绝拒绝H H0 0 Excel
40、 Excel 输输输输出结果的分析出结果的分析出结果的分析出结果的分析7-106统计学统计学STATISTICSSTATISTICS(三)回归系数检验和推断(三)回归系数检验和推断7-107统计学统计学STATISTICSSTATISTICS回归系数的检验回归系数的检验1.线性关系检验通过后,对各个回归系数有选择地进行一次或多次检验2.究竟要对哪几个回归系数进行检验,通常需要在建立模型之前作出决定3.对回归系数检验的个数进行限制,以避免犯过多的第一类错误(弃真错误)4.对每一个自变量都要单独进行检验5.应用 t 检验统计量7-108统计学统计学STATISTICSSTATISTICS回归系数的
41、检验回归系数的检验(步骤步骤)1.提出假设n nH H0 0:i i=0 (=0 (自变量自变量 x xi i 与与 因变量因变量 y y 没有线性关系没有线性关系)n nH H1 1:i i 0 (0 (自变量自变量 x xi i 与与 因变量因变量 y y有线性关系有线性关系)2.计算检验的统计量 t3.确定显著性水平,并进行决策 t t t t,拒绝拒绝H H0 0;t t t t,不能拒绝不能拒绝H H0 0 Excel Excel 输输输输出结果的分析出结果的分析出结果的分析出结果的分析7-109统计学统计学STATISTICSSTATISTICS回归系数的推断回归系数的推断 (置信
42、区间置信区间)回归系数在1-置信水平下的置信区间为 回归系数的回归系数的抽样标准差抽样标准差 Excel Excel 输出结果的分析输出结果的分析输出结果的分析输出结果的分析7-110统计学统计学STATISTICSSTATISTICS第五节第五节 曲线回归曲线回归7-111统计学统计学STATISTICSSTATISTICS非线性回归非线性回归1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线性关系3.用最小二乘法求出参数的估计值4.并非所有的非线性模型都可以化为线性模型7-112统计学统计学STATISTICSSTATISTICS曲线回归模型的种类曲线回归模型的种类7-11
43、3统计学统计学STATISTICSSTATISTICS双曲线双曲线 0 0 01.基本形式:2.线性化方法令:令:y y =1/=1/y y,x x=1/=1/x x,则有则有y y =+x x 3.图像7-114统计学统计学STATISTICSSTATISTICS幂函数曲线幂函数曲线1.基本形式:2.线性化方法n n两端取对数得:两端取对数得:l lg g y y=lglg +lglg x xn n令:令:y y =lglgy y,x x=lglg x x,则则y y =lglg +x x 3.图像00 1 1 1 1 =1=1-1-1 0 0 -1-1 =-1=-1 7-115统计学统计学
44、STATISTICSSTATISTICS对数曲线对数曲线1.基本形式:2.线性化方法x x=lnlnx x ,则有则有y y =+x x 3.图像 0 0 0 0 7-116统计学统计学STATISTICSSTATISTICS指数曲线指数曲线1.基本形式:2.线性化方法两端取对数得:两端取对数得:lnlny y =lnln +x x令:令:y y =lnlny y,则有则有y y =lnln +x x3.图像 7-117统计学统计学STATISTICSSTATISTICSS 型曲线型曲线1.基本形式:2.线性化方法n n令:令:y y =1/=1/y y,x x=e=e-x x,则有则有y y
45、 =+x x3.图像7-118统计学统计学STATISTICSSTATISTICS非线性回归非线性回归(例题分析例题分析)【例例例例】一一种种商商品品的的需需求求量量与与其其价价格格有有一一定定的的关关系系。现现对对一一定定时时期期内内的的商商品品价价格格x x与与需需求求量量y y进进行行观观察察,取取得得的的样样本本数数据据如如表表11.1611.16。试试判判断断商商品品价价格格与与需需求求量量之之间回归函数的类型,并求需求量对价格的回归方程间回归函数的类型,并求需求量对价格的回归方程废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系废品率与生产率的关系价格价格价格价格 (元元
46、元元)x x1 12 23 34 45 56 67 78 89 91010需求量需求量需求量需求量(千克千克千克千克)y y58585050444438383434303029292626252524247-119统计学统计学STATISTICSSTATISTICS非线性回归非线性回归 (例题分析例题分析)价格与需求量的散点图价格与需求量的散点图7-120统计学统计学STATISTICSSTATISTICS非线性回归非线性回归 (例题分析例题分析)1.用双曲线模型:2.按线性回归的方法求解和,得7-121统计学统计学STATISTICSSTATISTICS非线性回归非线性回归 (例题分析例题分析)价格与需求量的散点图价格与需求量的散点图7-122统计学统计学STATISTICSSTATISTICS本章小结本章小结1.变量间关系的度量变量间关系的度量2.回归模型、回归方程与估计的回归方程回归模型、回归方程与估计的回归方程3.回归直线的拟合优度回归直线的拟合优度4.回归分析中的显著性检验回归分析中的显著性检验5.估计和预测估计和预测6.用用Excel 进行回归分析进行回归分析7-123统计学统计学STATISTICSSTATISTICSEnd of Chapter 9