1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Econometrics,1,第五章,异 方 差 性,计量经济学,2,引子:,更为接近真实的结论是什么?,根据四川省,2000,年,21,个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下:,式中 表示卫生医疗机
2、构数(个),表示人口数量(万人)。,3,模型显示的结果和问题,人口数量对应参数的标准误差较小;,t,统计量远大于临界值,可决系数和修正的可决系,数结果较好,,F,检验结果明显显著;,表明该模型的估计效果不错,可以认为人口数量,每增加,1,万人,平均说来医疗机构将增加,5.3735,人。,然而,这里得出的结论可能是不可靠的,平均说来每增加,1,万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。,有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?,4,本章讨论四个问题:,异方差的实质和产生的原因,异方差产生的后果,异方差的检测方法,异方差的补救,第五章 异 方
3、 差 性,5,第一节 异方差性的概念,本节基本内容:,异方差性的实质,异方差产生的原因,6,一、异方差性的实质,同方差的含义,同方差性:对所有的 有:,(,5.1,),因为方差是度量被解释变量 的观测值围绕回归线,(,5.2,),的分散程度,因此同方差性指的是所有观测值的,分散程度相同。,7,设模型为,如果对于模型中随机误差项 有:,则称具有异方差性。进一步,把异方差看成是由于某个解释变量的变化而引起的,则,异方差性的含义,(5.4),(5.3),8,图形表示,9,(一)模型中省略了某些重要的解释变量,假设正确的计量模型是:,假如略去 ,而采用,当被略去的 与 有呈同方向或反方向变,化的趋势时
4、随 的有规律变化会体现在(,5.5,),式的 中。,(,5.5,),二、产生异方差的原因,10,(二)模型的设定误差,模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。,(三)数据的测量误差,样本数据的观测误差有可能随研究范围的扩大,而增加,或随时间的推移逐步积累,也可能随,着观测技术的提高而逐步减小。,11,(四)截面数据中总体各单位的差异,通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一
5、对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。,12,第二节 异方差性的后果,本节基本内容:,对参数估计统计特性的影响,对参数显著性检验的影响,对预测的影响,13,一、对参数估计统计特性的影响,(一)参数估计的无偏性仍然成立,参数估计的无偏性仅依赖于基本假定中的零均值,假定(即 )。所以异方差的存在对无偏性,的成立没有影响。,(二)参数估计的方差不再是最小的,同方差假定是,OLS,估计方差最小的前提条件,所,以随机误差项是异方差时,将不能再保证最小二,乘估计的方差最小。,14,二、对参数显著性检验的影响,由于异方差的影响,使得无法正确估计参数
6、的标准误差,导致参数估计的,t,统计量的值不能正确确定,所以,如果仍用,t,统计量进行参数的显著性检验将失去意义。,15,尽管参数的,OLS,估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对,Y,的预测也将不是有效的。,三、对预测的影响,16,第三节 异方差性的检验,常用检验方法,:,图示检验法,Goldfeld-Quanadt,检验,White,检验,ARCH,检验,17,一、图示检验法,(一)相关图形分析,方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量 与随机误差项 有相同的方差,所以利用分析 与 的相关图形,可以初略地看到 的离散程度与
7、之间是否有相关关系。,如果随着 的增加,的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。,18,用,1998,年四川省各地市州农村居民家庭消费支出与家庭纯,收入的数据,绘制出消费支出对纯收入的散点图,其中用,表示农村家庭消费支出,表示家庭纯收入。,图形举例,19,设一元线性回归模型为:,运用,OLS,法估计,得样本回归模型为:,由上两式得残差:,绘制出 对 的散点图,如果 不随 而变化,则表明,不存在异方差,;,如果 随 而变化,则表明,存在异方差,。,(二)残差图形分析,20,二、,Goldfeld-Quanadt,检验,作用,:检验递增性,(,或递减性,),
8、异方差。,基本思想,:将样本分为两部分,然后分别对两个样,本进行回归,并计算两个子样的残差平方和所构成,的比,以此为统计量来判断是否存在异方差。,(一)检验的前提条件,1,、要求检验使用的为大样本容量。,2,、除了同方差假定不成立外,其它假定均满足。,21,(二)检验的具体做法,1.,排序,将解释变量的取值按从小到大排序。,2.,数据分组,将排列在中间的约,1/4,的观察值删除掉,记,为 ,再将剩余的分为两个部分,每部分观察,值的个数为 。,3.,提出假设,22,4.,构造,F,统计量,分别对上述两个部分的观察值求回归模型,由此,得到的两个部分的残差平方为 和 。,为前一部分样本回归产生的残差
9、平方和,,为后一部分样本回归产生的残差平方和。它,们的自由度均为 ,为参数的个数。,23,在原假设成立的条件下,因 和 自由度均为 ,分布,可导出:,(,5.13,),24,5.,判断,给定显著性水平 ,查,F,分布表得临界值,计算统计量 。,如果,则拒绝原假设,接受备择假设,即模型中的,随机误差存在异方差。,25,要求大样本,异方差的表现既可为递增型,也可为递减型,检验结果与选择数据删除的个数 的大小有关,只能判断异方差是否存在,在多个解释变量的情下,对哪一个变量引起异方差的判断存在局限。,(三)检验的特点,26,三、,White,检验,(一),基本思想,:,不需要关于异方差的任何先验信息,
10、只需要在大样本的情况下,将,OLS,估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。,27,(,二,),检验的特点,要求变量的取值为大样本,不仅能够检验异方差的存在性,同时在多变量的,情况下,还能判断出是哪一个变量引起的异方差。,28,(三)检验的基本步骤:,以一个二元线性回归模型为例,设模型为:,并且,设异方差与 的一般关系为,其中 为随机误差项。,29,1.,求回归估计式并计算,用,OLS,估计式(,5.14,),计算残差 ,并求残差的平方 。,2.,求辅助函数,用残差平方 作为异方差 的估计,并建立,的辅助
11、回归,即,(,5.15,),30,3.,计算,利用求回归估计式(,5.15,)得到辅助回归函数的可决系数 ,为样本容量。,4.,提出假设,31,5.,检验,在零假设成立下,有 渐进服从自由度为,5,的 分布。给定显著性水平,查 分布表得临界值 ,如果,则拒绝原假设,表明模型中随机误差存在异方差。,32,(一),ARCH,过程,设,ARCH,过程为,为,ARCH,过程的阶数,并且 为随机误差。,(二)检验的基本思想,在时间序列数据中,可认为存在的异方差性为,ARCH,过程,,并通过检验这一过程是否成立去判断时间序列是否存在异方,差。,四、,ARCH,检验,33,1.,提出原假设,2.,参数估计,
12、并计算,对原模型作,OLS,估计,求出残差 ,并计算,残差平方序列 ,以分别作为对,的估计。,(三),ARCH,检验的基本步骤,34,3.,求辅助回归,(,5.17,),4.,检验,计算辅助回归的可决系数 与 的乘积,。在 成立时,基于大样本,,渐进服从 分布。,给定显著性水平 ,查 分布表得临界值,,如果,,则拒绝原假,设,表明模型中得随机误差存在异方差。,35,变量的样本值为大样本,数据是时间序列数据,只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。,(四)检验的特点,36,五、,Glejser,检验,(一)检验的基本思想,由,OLS,法得到残差,取得绝对值,然后将对某个
13、解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。,(二)检验的特点,不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式 进行诊断。该检验要求变量的观测值为大样本。,37,(三)检验的步骤,1.,建立模型并求,根据样本数据建立回归模型,并求残差序列,2.,寻找 与 的最佳函数形式,用残差绝对值 对 进行回归,用各种函数,形式去试,寻找最佳的函数形式。,38,3.,判断,根据选择的函数形式作 对 的回归,作为 的替代变量,对所选函数形式回归。用回归所得到的 、等信息判断,若参数 显著不为零,即认为存在异方差性。,39,第四节 异方差性的补救措施,主要方法,
14、模型变换法,加权最小二乘法,模型的对数变换,40,以一元线性回归模型为例:,经检验 存在异方差,且,其中 是常数,是 的某种函数。,一、模型变换法,41,变换模型时,用 除以模型的两端得:,记,则有:,42,随机误差项 的方差为,经变换的模型的随机误差项 已是同方差,,常见的设定形式及对应的 情况,函数形式,43,二、加权最小二乘法,以一元线性回归模型为例:,经检验 存在异方差,且:,其中 是常数,是 的某种函数。,44,(一)基本思路,区别对待不同的 。对较小的,给予较大的权,数,对较大的 给予较小的权数,从而使 更,好地反映 对残差平方和的影响。,45,(二)具体做法,1.,选取权数并
15、求出加权的残差平方和,通常取权数 ,当 越小,时,越大。当 越大时,越小。将权数与,残差平方相乘以后再求和,得到加权的残差平方,和:,46,2.,求使满足 的,根据最小二乘原理,若使得加权残差平方和最小,,则:,其中,:,47,三、模型的对数变换,在经济意义成立的情况下,如果对模型:,作对数变换,,其变量 和 分别用 和,代替,即:,对数变换后的模型通常可以降低异方差性的影响:,运用对数变换能使测定变量值的尺度缩小。,经过对数变换后的线性模型,其残差表示相对误差往往,比绝对误差有较小的差异。,注意:,对变量取对数虽然能够减少异方差对模型的,影响,但应注意取对数后变量的经济意义。,48,第五节
16、案例分析,一、问题的提出和模型设定,为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。,假定医疗机构数与人口数之间满足线性约束,则理论模型设定为:,其中 表示卫生医疗机构数,表示人口数。,四川省,2000,年各地区医疗机构数与人口数,地区,人口数(万人),医疗机构数(个),地区,人口数(万人),医疗机构数(个),成都,1013.3,6304,眉山,339.9,827,自贡,315,911,宜宾,508.5,1530,攀枝花,103,934,广安,438.6,1589,泸州,463.7,1297,达州,620.1,2403,德阳,379.3
17、1085,雅安,149.8,866,绵阳,518.4,1616,巴中,346.7,1223,广元,302.6,1021,资阳,488.4,1361,遂宁,371,1375,阿坝,82.9,536,内江,419.9,1212,甘孜,88.9,594,乐山,345.9,1132,凉山,402.4,1471,南充,709.2,4064,49,50,二、参数估计,估计结果为,:,51,三、检验模型的异方差,(一)图形法,1.EViews,软件操作,由路径:,Quick/Qstimate Equation,,进入,Equation Specification,窗口,键入 ,点,“,ok,”,,得样本回
18、归估计结果,见教材表,5.2,。,52,(,1,)生成残差平方序列。,在得到表,5.2,估计结果后,用生成命令生成序列,记为 。生成过程如下,先按路径:,Procs/Generate Series,,进入,Generate Series by Equation,对话框,键入下式并点,“,OK,”,即可:,53,生成序列图示,54,(,2,)绘制 对 的散点图。选择变量名,与 。(注意选择变量的顺序,先选的变量将在,图形中表示横轴,,后选的变量表示,纵轴),进入数,据列表,再按路,径,view/graph/,scatter,,,可得散,点图,见右图:,55,2.,判断,由图可以看出,残差平方 对
19、解释变量 的散点图主要分布在图形中的下三角部分,大致看出残差平方 随 的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。,56,(二),Goldfeld-Quanadt,检验,1.EViews,软件操作,(,1,),对变量取值排序(按递增或递减),。在,Procs,菜单里选,Sort Current Page/Sort Workfile Series,命令,出现排序对话框,键入 ,如果以递增型排序,选,“,Ascenging,”,,如果以递减型排序,则应选,“,Descending,”,,点,ok,。本例选递增型排序,这时变量 与 将以 按递增型排序。
20、2,),构造子样本区间,建立回归模型,。在本例中,样本容量 ,删除中间,1/4,的观测值,即大约,5,个观测值,余下部分平分得两个样本区间:,1,8,和,14,21,,它们的样本个数均是,8,个,即,57,在,Sample,菜单里,将区间定义为,1,8,,然后用,OLS,方法 求得如下结果,(,表,1),58,在,Sample,菜单里,将区间定义为,1421,,再用,OLS,方法求得如下结果,(,表,2),59,(,3,),求,F,统计量值,。基于表,1,和表,2,中残差平方和的,数据,即,Sum squared resid,的值。由表,1,计算得到,的残差平方和为 ,由表,2,计算得到
21、的,残差平方和为 。,根据,Goldfeld-Quanadt,检验,,F,统计量为,60,(,4,),判断,在 下,式中分子、分母的自由度均为,6,,查,F,分布表得临界值为:,因为 ,所以拒绝原假设,表明模型确实存在异方差。,61,(三),White,检验,由表,5.2,估计结果,按路径,view/residual tests/white heteroskedasticity,(,no cross terms or cross terms,),进入,White,检验。,根据,White,检验中辅助函数的构造,最后一项为变,量的交叉乘积项,因为本例为一元函数,故无交叉,乘积项,因此应选,no
22、cross terms,,则辅助函数,为:,经估计出现,White,检验结果,见表,5.5,。,62,从表,5.5,可以看出,由,White,检验知,,在,下,,查,分布表得临界值,因为,所以拒绝原假设,不拒绝备,择假设,表明模型存在异方,差。,表,5.5,63,四、异方差的修正,加权最小二乘法,(,WLS,),分别选用权数,:,生成权数:,在,Genr/Enter equation,中,分别键入:,经估计检验发现用权数 较好,下面只给出用权,数 的结果。,64,方法,:,在,Estimate equation,中输入,“,”,点,option,在对话框中点,weighted LS,在,wei
23、ghted,中输入,“,”,再点,ok ,即出现加权最小二乘结果。,65,表,5.7,估计结果:,结论,:,运用加权小二乘法消,除了异方差性后,参数的,t,检验,均显著,可决系数大幅提高,,F,检验也显著,并说明人口数,量每增加,1,万人,平均说来将,增加,2.953,个卫生医疗机构,而,不是引子中得出的增加,5.3735,个医疗机构。,66,第五章 小 结,1.,异方差性是指模型中随机误差项的方差不是常量,而且它的变化与解释变量的变动有关。,2.,产生异方差性的主要原因有:模型中略去的变量随解释变量的变化而呈规律性的变化、变量的设定问题、截面数据的使用,利用平均数作为样本数据等。,3.,存在异方差性时对模型的,OLS,估计仍然具有无偏性,但最小方差性不成立,从而导致参数的显著性检验失效和预测的精度降低。,67,4.,检验异方差性的方法有多种,常用的有图形法、,Goldfeld-Qunandt,检验、,White,检验、,ARCH,检验以及,Glejser,检验,运用这些检验方法时要注意它们的假设条件。,5.,异方差性的主要方法是加权最小二乘法,也可以用变量变换法和对数变换法。变量变换法与加权最小二乘法实际是等价的,。,68,THANKS,第 五 章 结 束 了!,