1、第五章 异方差性思考题5.1 简述什么是异方差?为什么异方差的出现总是与模型中某个解释变量的变化有关?答 :设模型为,如果其他假定均不变,但模型中随机误差项的方差为,则称具有异方差性。由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,所以异方差的出现总是与模型中某个解释变量的变化有关。5.2 试归纳检验异方差方法的基本思想,并指出这些方法的异同。答:各种异方差检验的共同思想是,基于不同的假定,分析随机误差项的方差与解释变量之间的相关性,以判断随机误差项的方差是否随解释变量变化而变化。其中,戈德菲尔德-跨特检验、怀特检验、ARCH检验和Glejser检验都要求大样本,其中戈
2、德菲尔德-跨特检验、怀特检验和Glejser检验对时间序列和截面数据模型都可以检验,ARCH检验只适用于时间序列数据模型中。戈德菲尔德-跨特检验和ARCH检验只能判断是否存在异方差,怀特检验在判断基础上还可以判断出是哪一个变量引起的异方差。Glejser检验不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。5.3 什么是加权最小二乘法?它的基本思想是什么?答:以一元线性回归模型为例:经检验存在异方差,公式可以表示为。选取权数 ,当 越小 时,权数越大。当 越大时,权数越小。将权数与 残差平方相乘以后再求和,得到加权的残差平方和:,求使加权残差平方和最小的参数估
3、计值。这种求解参数估计式的方法为加权最小二乘法。加权最小二乘的基本思想是通过权数Wi使异方差经受了“压缩”和“扩张”变为同方差。区别对待不同的 。对较小的,给予较大的权数,对较大的给予较小的权数,从而使 更 好地反映 对残差平方和的影响。 5.4 产生异方差的原因是什么?试举例说明经济现象中的异方差性。答:原因包括模型设定误差,模型中略去重要解释变量或者模型数学形式不正确都可能导致异方差。样本数据的观测误差以及截面数据中总体各单位的差异等也会导致异方差的存在。5.5 如果模型中存在异方差性,对模型又什么影响?这时候模型还能进行应用分析吗?答:当模型中的误差项存在异方差时,参数估计仍然是无偏的但
4、方差不再是最小的;在异方差存在的情况下,参数估计的方差可能会高估或者低估真实的方差,从而会低估或者高估t统计量,从而可能导致错误的结论。由于参数估计量不再是有效的,从而对Y的预测也将不是有效的。5.6 对数变化的作用是什么?进行对数变化应注意什么?对数变换后模型的经济意义有什么变化?答:通过对数变换可以实现:一能使测定变量值的尺度缩小;二经过对数变换后的线性模型,其残差e表示相对误差,而相对误差往往比绝对误差有较小的差异。进行对数变化应注意的是,对变量取对数虽然能够减少异方差对模型的影响,但应注意取对数后变量的经济意义。如果变量之间在经济意义上并非呈对数线性关系,则不能简单地对变量取对数,这时
5、只能用其他方法对异方差进行修正。5.7 怎样确定加权最小二乘法中的权数?答:在样本容量足够的情况下,可以先尝试用怀特检验找出引起异方差的解释变量,然后通过Glejser检验找出残差e随该解释变量变化而变化的函数形式,进而以该函数开方的倒数作为权数进行加权最小二乘估计。第六章 思考题 6.1 如何使用DW统计量来进行自相关检验?该检验方法的前提条件和局限性有哪些?答:DW 检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951年提出的一种适用于小样本的检验方法,一般的计算机软件都可以计算出DW 值。给定显著水平,依据样本容量n和解释变量个数k,查D.W.表得d统计量的上界du和
6、下界dL,当0ddL时,表明存在一阶正自相关,而且正自相关的程度随d向0的靠近而增强。当dLddu时,表明为不能确定存在自相关。当dud4-du时,表明不存在一阶自相关。当4-dud4-dL时,表明不能确定存在自相关。当4-dLd4时,表明存在一阶负自相关,而且负自相关的程度随d向4的靠近而增强。 DW检验的前提条件:(1)回归模型中含有截距项;(2)解释变量是非随机的(因此与随机扰动项不相关)(3)随机扰动项是一阶线性自相关。 ;(4)回归模型中不把滞后内生变量(前定内生变量)做为解释变量。(5)没有缺失数据,样本比较大。DW检验的局限性:(1)DW检验有两个不能确定的区域,一旦DW值落在这
7、两个区域,就无法判断。这时,只有增大样本容量或选取其他方法 (2)DW统计量的上、下界表要求n15, 这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断(3) DW检验不适应随机误差项具有高阶序列相关的检验.(4) 只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量 6.2 当回归模型中的随机误差项为AR(1)自相关时,为什么仍用OLS法会低估的标准误差? 仍然考虑一元线性回归模型,以 为例:记 为存在自相关的估计值,则 时,说明随机误差项存在自相关,此时,所以这个时候参数估计值的方差不是最小。如果存在自相关时仍然用最小二乘方法估计参数,就极有可能低估参数估计值
8、的真实方差。6.3 判断以下陈述的真伪,并给出合理的解释。(1)当回归模型随机误差项有自相关时,普通最小二乘估计量是有偏误的和非有效的。判断:错误。当回归模型随机误差项有自相关时,普通最小二乘估计量是无偏误的和非有效的。(2)DW检验假定随机误差项ui的方差是同方差。判断:错误。DW统计量的构造中并没有要求误差项的方差是同方差 。(3)用一阶差分法消除自相关是假定自相关系数为-1。判断:错误。用一阶差分法消除自相关是假定自相关系数为1,即原原模型存在完全一阶正自相关。(4)当回归模型随机误差项有自相关时,普通最小二乘估计的预测值的方差和标准误差不再是有效的。判断:正确。6.4 对于四个解释变量
9、的回归模型ttttttuXXXXY+=443322110bbbbb如果样本量n=50, 当DW统计量为如下数值时,请判断模型中的自相关状况。(1)DW=1.05 (2) DW=1.40(3)DW=2.50 (4) DW=3.97答:给定显著水平=0.05,依据样本容量n=50和解释变量个数k=4,查D.W.表得d统计量的上界du=1.721,下界dL=1.378,4- du=2.279,4-dL=2.622。(1)DW=1.05dL,所以模型存在正自相关。(2) dLDW=1.40du, 所以模型不能确定是否存在自相关。(3)4- du DW=2.504-dL,所以模型存在负自相关。第七章 分
10、布滞后模型与自回归模型7.1 什么是滞后现象?产生滞后现象的原因主要有哪些?答:解释变量与被解释变量的因果联系不可能在短时间内完成,在这一过程中通常都存在时间滞后,也就是说解释变量需要通过一段时间才能完全作用于被解释变量。 此外,由于经济活动的惯性,一个经济指标以前的变化态势往往会延续到本期,从而形成被解释变量的当期变化同自身过去取值水平相关的情形。 这种被解释变量受自身或其它经济变量过去值影响的现象称为滞后效应。 心理预期因素、技术因素、制度因素等都是产生滞后现象的原因7.2 对分布滞后模型进行估计存在哪些困难?实际应用中如何处理这些困难?答:分布滞后模型进行估计存在的困难自由度问题:如果样
11、本观测值个数n较小,随着滞后长度s的增大,有效样本容量n-s变小,会出现自由度不足的问题。多重共线性问题:由于经济活动的前后继起性,经济变量的滞后值之间通常存在较强的联系,因此,分布滞后模型中滞后解释变量观测值之间往往会存在严重多重共线性问题。滞后长度难于确定的问题:在实际经济分析中用分布滞后模型来处理滞后现象时,模型中滞后长度的确定较为困难,没有充分的先验信息可供使用。实际应用中处理这些困难的方法:对于有限分布滞后模型,其基本思想是设法有目的地减少需要直接估计的模型参数个数,以缓解多重共线性,保证自由度。 对于无限分布滞后模型,主要是通过适当的模型变换,使其转化为只需估计有限个参数的自回归模
12、型。7.3 库伊克模型 、自适应预期模型与局部调整模型有哪些共性和不同之处?模型估计会存在哪些困难?如何解决?答:(1)相同之处:库伊克模型、自适应预期模型、局部调整模型三个模型的最终形式都是一阶自回归模型。(2)不同之处:1)导出模型的经济背景和思想不同。库伊克模型是在无限分布滞后模型的基础上,根据库伊克几何分布滞后假定导出的;自适应预期模型是由解释变量自适应过程得到的;局部调整模型是由应变量的局部调整得到的。2)模型存在的问题不同。三个模型的形成机理不同,所以随机误差项的结构不同,库伊克模型和自适应预期模型都存在自相关、解释变量与随机误差项相关的问题;而局部调整模型则不存在。库伊克模型和自
13、适应预期模型不能够直接使用最小二乘法直接估计,而局部调整模型则可以。(3)模型估计存在的困难及解决的方法(a)出现了随机解释变量 ,而可能与相关;(b)随机扰动项可能自相关,库伊克模型和自适应预 期模型的随机扰动项都会导致自相关,只有局部调整模型的随机扰动无自相关.如果用最小二乘法直接估计自回归模型,则估计可能是有偏的,而且不是一致估计。 估计自回归模型需要解决两个问题:设法消除与的相关性;检验是否存在自相关。所以应用工具变量法进行估计一阶自回归模型,就是在进行参数估计的过程中选择适当的工具变量,代替回归模型中同随机扰动项存在相关性的解释变量。7.4叙述用阿尔蒙多项式法估计外生变量有限分布滞后
14、模型的方法步骤,对多项式的次数m有哪些限制,为什么?答:阿尔蒙多项式法的目的是消除多重共线性的影响。其基本原理:在有限分布滞后模型滞后长度s 已知的情况下,滞后项系数有一取值结构,把它看成是相应滞后期i的函数。在以滞后期i为横轴、滞后系数取值为纵轴的坐标系中,如果这些滞后系数落在一条光滑曲线上,或近似落在一条光滑曲线上,则可以由一个关于i的次数较低的m次多项式很好地逼近,即 :将阿尔蒙多项式变换代入分布滞后模型并整理,模型变为如下形式:对于变换后的模型,在满足古典假定的条件下,可用最小二乘法进行估计。将估计的参数代入阿尔蒙多项式,就可求出原分布滞后模型参数的估计值。在实际应用中,阿尔蒙多项式的
15、次数m通常取得较低,一般取2或3,很少超过4。7.5考虑如下模型:假定相关。为了消除相关,采用如下工具变量法:先求对和的回归,得到的估计值,然后做如下回归:其中是第一步粗估计值的滞后值。分析说明该方法为什么可以消除原模型中之间的相关性。答:由于、和不相关,作为对和的回归,也与不相关,进而也与不相关,因此对式进行回归,可以消除原模型中之间的相关性。7.6 检验一阶自回归模型随机扰动项是否存在自相关,为什么用德宾h-检验而不用DW检验?答:因为DW检验法不适合于方程含有滞后被解释变量的场合,在自回归模型中,滞后被解释变量是随机变量,已有研究表明,如果用DW检验法,则d统计量值总是趋近于2。也就是说
16、,在一阶自回归中,当随机扰动项存在自相关时,DW检验却倾向于得出非自相关的结论。德宾提出了检验一阶自相关的h统计量检验法。 其中,为随机扰动项一阶自相关系数 的估计量, d为DW统计量,n 为样本容量,为滞后被解释变量的回归系数的估计方差。 在=0的假定下,h统计量的极限分布为标准正态分布。因此,在大样本情况下,可以用h统计量值判断随机扰动项是否存在一阶自相关。 给定显著性水平,查标准正态分布表得临界值 。若| ,则拒绝原假设 ,说明自回归模型存在一阶自相关;若| ,则接受原假设=0,说明自回归模型不存在一阶自相关。 第八章 虚拟变量回归8.1什么是虚拟变量?它在模型中有什么作用?答:虚拟变量
17、是人工构造的取值为0或1的作为属性变量代表的变量。虚拟变量的作用主要有:(1)可以作为属性因素的代表,如性别、所有制等;(2)作为某些非精确计量的数量因素的代表,如受教育程度、管理者素质等;(3)作为某些偶然因素或政策因素的代表,如战争、灾害、改革前后等;(4)可以作为时间序列分析中季节的代表;(5)可以实现分段回归,研究斜率、截距的变动,或比较两个回归模型的结构差异。8.2虚拟变量为何只选0、1,选2、3、4行吗?为什么?答:虚拟变量是非此即彼的问题,一般情形下,虚拟变量的取值为0和1。当虚拟变量取值为0时,表示某种属性或状态的类型或水平不出现或不存在;当虚拟变量取值为1时,表示某种属性或状
18、态的类型或水平出现或存在。取值一般不选2、3、4,否则对回归系数的分析带来不便。8.3对式(8.10)的模型,如果选择一个虚拟变量这样的设置方式隐含了什么假定?这一假定合理吗?答:隐含的假定是大专及大专以上的人数和高中以下的人数是相等的,显然这是不合理的。8.4引入虚拟解释变量的两种基本方式是什么?它们各适用于什么情况?答:加入虚拟变量的途径有两种基本类型:一是加法类型;二是乘法类型。加法类型适用于截距效应的分析,乘法类型适用于斜率效应的分析。8.5四种加法方式引入虚拟变量会产生什么效应?答:四种加法方式引入虚拟变量均改变了截距,可以用于分析虚拟变量不同类之间的水平差异。8.6引入虚拟被解释变
19、量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些?答:某经济现象或活动受到多种因素的影响,需要对这一经济现象或活动进行是或否的判断或决策时,需要引入被解释变量。虚拟被解释变量模型的估计方法主要有线性概率模型估计和对数单位模型估计。8.7设服装消费模型为:,其中,为收入水平;为年服装消费支出;,试写出不同收入人群组的服装消费函数模型。答:大专以下男性()服装消费模型:大专以下女性()服装消费模型:大专及大专以上男性()服装消费模型:大专及大专以上女性()服装消费模型:8.8利用月度数据资料,为了检验下面的假设,应引入多少个虚拟解释变量?(1)一年里的12个月全部表示出季节模式。(2)只有2月、6月、8月、10月和12月表现出季节模式。答:(1)引入11个虚拟变量;(2)引入4个虚拟变量。