1、计量经济学思考题答案 第一章 绪论 1.1怎样理解产生于西方国家的计量经济学能够在中国的经济理论研究和现代化建设中发挥重要作用? 答:计量经济学的产生源于对经济问题的定量研究,这是社会经济发展到一定阶段的客观需要。计量经济学的发展是与现代科学技术成就结合在一起的,它反映了社会化大生产对各种经济因素和经济活动进行数量分析的客观要求。经济学从定性研究向定量分析的发展,是经济学逐步向更加精密、更加科学发展的表现。我们只要坚持以科学的经济理论为指导,紧密结合中国经济的实际,就能够使计量经济学的理论与方法在中国的经济理论研究和现代化建设中发挥重要作用。 1.2理论计量经济学和应用计量经济学的区别和联系是
2、什么?答:计量经济学不仅要寻求经济计量分析的方法,而且要对实际经济问题加以研究,分为理论计量经济学和应用计量经济学两个方面。 理论计量经济学是以计量经济学理论与方法技术为研究内容,目的在于为应用计量经济学提供方法论。所谓计量经济学理论与方法技术的研究,实质上是指研究如何运用、改造和发展数理统计方法,使之成为适合测定随机经济关系的特殊方法。 应用计量经济学是在一定的经济理论的指导下,以反映经济事实的统计数据为依据,用计量经济方法技术研究计量经济模型的实用化或探索实证经济规律、分析经济现象和预测经济行为以及对经济政策作定量评价。 1.3怎样理解计量经济学与理论经济学、经济统计学的关系? 答:1、计
3、量经济学与经济学的关系。联系:计量经济学研究的主体经济现象和经济关系的数量规律;计量经济学必须以经济学提供的理论原则和经济运行规律为依据;经济计量分析的结果:对经济理论确定的原则加以验证、充实、完善。区别:经济理论重在定性分析,并不对经济关系提供数量上的具体度量;计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容。 2、计量经济学与经济统计学的关系。联系:经济统计侧重于对社会经济现象的描述性计量;经济统计提供的数据是计量经济学据以估计参数、验证经济理论的基本依据;经济现象不能作实验,只能被动地观测客观经济现象变动的既成事实,只能依赖于经济统计数据。区别:经济统计学主要用统计指标和统
4、计分析方法对经济现象进行描述和计量;计量经济学主要利用数理统计方法对经济变量间的关系进行计量。 1.4在计量经济模型中被解释变量和解释变量的作用有什么不同? 答:在计量经济模型中,解释变量是变动的原因,被解释变量是变动的结果。被解释变量是模型要分析研究的对象。解释变量是说明被解释变量变动主要原因的变量。 1.5一个完整的计量经济模型应包括哪些基本要素?你能举一个例子吗? 答:一个完整的计量经济模型应包括三个基本要素:经济变量、参数和随机误差项。 例如研究消费函数的计量经济模型:Y=+X+u 其中,Y为居民消费支出,X为居民家庭收入,二者是经济变量;和为参数;u是随机误差项。 1.6假如你是中央
5、银行货币政策的研究者,需要你对增加货币供应量促进经济增长提出建议,你将考虑哪些因素?你认为可以怎样运用计量经济学的研究方法 答:货币政策工具或者说影响货币供应量的因素有再贴现率、公开市场业务操作以及法定准备金率。所以会考虑再贴现率、公开市场业务操作以及法定准备金率。选择这三种因素作为解释变量。货币供应量作为被解释变量。从而建立简单线性回归模型。1.7计量经济学模型的主要应用领域有哪些? 答:计量经济模型主要可以用于经济结构分析、经济预测、政策评价和检验与发展经济理论。 1.8如果要根据历史经验预测明年中国的粮食产量,你认为应当考虑哪些因素?应当怎样设定计量经济模型? 答:影响中国的粮食产量的因
6、素可以有农业资金投入、农业劳动力、粮食播种面积、受灾面积等。可建立如下多元模型:。 其中,Y为中国的粮食产量,为农业资金投入,为农业劳动力,为粮食播种面积,为受灾面积。 1.9参数和变量的区别是什么?为什么对计量经济模型中的参数通常只能用样本观测值去估计? 答:经济变量反映不同时间、不同空间的表现不同,取值不同,是可以观测的因素。是模型的研究对象或影响因素。经济参数是表现经济变量相互依存程度的、决定经济结构和特征的、相对稳定的因素,通常不能直接观测。一般来说参数是未知的,又是不可直接观测的。由于随机误差项的存在,参数也不能通过变量值去精确计算。只能通过变量样本观测值选择适当方法去估计。 1.1
7、0你能分别举出三个时间序列数据、截面数据、面板数据、虚拟变量数据的实际例子,并分别说明这些数据的来源吗? 答:时间序列数据:中国1981年至2010年国内生产总值,可从中国统计年鉴查得数据。 截面数据:中国2010年各省、区、直辖市的国内生产总值,可从中国统计年鉴查得数据。 面板数据:中国1981年至2010年各省、区、直辖市的国内生产总值,可从中国统计年鉴查得数据。虚拟变量数据:自然灾害状态,1表示该状态发生,0表示该状态不发生。 1.11为什么对已经估计出参数的模型还要进行检验?你能举一个例子说明各种检验的必要性吗? 答:模型中的参数被估计以后,一般说来这样的模型还不能直接加以应用,还需要
8、对其进行检验。首先,在设定模型时,对所研究经济现象规律性的认识可能并不充分,所依据的经济理论对所研究对象也许还不能作出正确的解释和说明。或者经济理论是正确的,但可能我们对问题的认识只是从某些局部出发,或者只是考察了某些特殊的样本,以局部去说明全局的变化规律,可能导致偏差。其次,我们用以估计参数的统计数据或其它信息可能并不十分可靠,或者较多地采用了经济突变时期的数据,不能真实代表所研究的经济关系,或者由于样本太小,所估计参数只是抽样的某种偶然结果。此外,我们所建立的模型、采用的方法、所用的统计数据,都有可能违反计量经济的基本假定,这也可能导出错误的结论。 1.12为什么计量经济模型可以用于政策评
9、价?其前提条件是什么? 答:所谓政策评价,是利用计量经济模型对各种可供选择的政策方案的实施后果进行模拟运算,从而对各种政策方案作出评价。前提是,我们是把计量经济模型当作经济运行的实验室,去模拟所研究的经济体计量经济模型体系,分析整个经济体系对各种假设的政策条件的反映。在实际的政策评价时,经常把模型中的某些变量或参数视为可用政策调整的政策变量,然后分析政策变量的变动对被解释变量的影响。 1.13为什么定义方程式可以用于联立方程组模型,而不宜用于建立单一方程模型? 答:定义关系是指根据定义而表达的恒等式,是由经济理论或客观存在的经济关系决定的恒等关系。国民经济中许多平衡关系都可以建立恒等关系,这样
10、的模型称为定义方程式。在联立方程组模型中经常利用定义方程式。但是,定义方程式的恒等关系中没有随机误差项和需要估计的参数,所以一般不宜用于建立单一方程模型。 第二章 简单线性回归模型2.1相关分析与回归分析的关系是什么? 答:相关分析与回归分析有密切的关系,它们都是对变量间相关关系的研究,二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在一定程度的相关关系时,进行回归分析才有实际的意义。同时,在进行相关分析时如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且相关分析中相关系数的确定也是建立在回归分析基础上的。 相关分析与回归分析的区别。从研究目的上看,相
11、关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据解释变量的固定值去估计和预测被解释变量的平均值。从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分解释变量和被解释变量,相关的变量不一定具有因果关系,均视为随机变量;回归分析是建立在变量因果关系分析的基础上,研究其中解释变量的变动对被解释变量的具体影响,回归分析中必须明确划分解释变量和被解释变量,对变量的处理是不对称的。 2.2什么是总体回归函数和样本回归函数?它们之间的区别是什么? 答:总体回归函数()是将总体被解释变量的条件期望表现为解
12、释变量的函数。样本回归函数()是将被解释变量的样本条件均值表示为解释变量的函数。 区别:首先,总体回归函数虽然未知,但它是确定的;而由于从总体中每次抽样都能获得一个样本,就都可以拟合一条样本回归线,样本回归线是随抽样波动而变化的,可以有很多条。所以样本回归函数还不是总体回归函数,至多只是未知的总体回归函数的近似反映。 其次,总体回归函数的参数和是确定的常数;而样本回归函数的参数和是随抽样而变化的随机变量。 总体回归函数中的是不可直接观测的,样本回归函数中的是只要估计出样本回归的参数就可以计算的数值。2.3什么是随机扰动项和剩余项(残差)?它们之间的区别是什么? 答:总体回归函数中,被解释变量个
13、别值与条件期望的偏差是随机扰动项。样本回归函数中,被解释变量个别值与样本条件均值的偏差是残差项。残差项在概念上类似总体回归函数中的随机扰动项,可视为对随机扰动项的估计。总体回归函数中的随机误差项是不可以直接观测的;而样本回归函数中的残差项是只要估计出样本回归的参数就可以计算的数值。2.4为什么在对参数作最小二乘估计之前,要对模型提出古典假设? 答:在对参数作最小二乘估计之前,要对模型提出古典假设。因为模型中有随机扰动,估计的参数是随机变量,只有对随机扰动的分布作出假定,才能确定所估计参数的分布性质,也才可能进行假设检验和区间估计。只有具备一定的假定条件,所作出的估计才具有较好的统计性质。 2.
14、5总体方差和参数估计方差的区别是什么? 答:总体方差是未知的,但是确定存在的。参数估计方差可以由样本数据计算出来,但只是总体的近似反映,未必等于真实值。 2.6为什么可决系数可以度量模型的拟合优度?在简单线性回归中它与对参数的检验的关系是什么? 答:可决系数是回归平方和占总离差平方和的比重,即由样本回归作出解释的离差平方和在总离差平方和中占的比重,如果样本回归线对样本观测值拟合程度好,各样本观测点与回归线靠得越近,由样本回归作出解释的离差平方和在总离差平方和中占的比重也将越大,反之拟合程度越差,这部分所占比重就越小。所以可决系数可以作为综合度量回归模型对样本观测值拟合优度的指标。在简单线性回归
15、中,可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,X对Y的解释能力越强,模型拟合优度越好。对参数的检验是判断解释变量X是否是被解释变量Y的显著影响因素。二者的目的作用是一致的。 2.7有人说:“得到参数区间估计的上下限后,说明参数的真实值落入这个区间的概率为。”如何评论这种说法? 答:这种说法是错误的。区间是随机的,只是说明在重复抽样中,像这样的区间可构造许多次,从长远看平均地说,这些区间中将有的概率包含着参数的真实值。参数的真实值虽然未知,却是一个固定的值,不是随机变量。所以应理解为区间包含参数真实值的概率是 ,而不能认为参数的真实值落入这个区间的概率为。 2.8对参数假设
16、检验的基本思想是什么? 答:对参数假设检验的基本思想,是在所估计样本回归系数概率分布性质已确定的基础上,在对总体回归系数某种原假设成立的条件下,利用适当的有明确概率分布的统计量和给定的显著性水平,构造一个小概率事件,判断原假设结果合理与否,是基于“小概率事件不易发生”的原理,可以认为小概率事件在一次观察中基本不会发生,如果小概率事件竟然发生了,就认为原假设不成立,从而拒绝原假设,不拒绝备择假设。 2.9为什么对被解释变量个别值的预测区间会比对被解释变量平均值的预测区间更宽? 答:预测被解释变量平均值仅存在抽样误差,而对被解释变量个别值的预测,不仅存在抽样误差,而且要受随机扰动项的影响。所以对个
17、别值的预测区间比对平均值的预测区间更宽。 2.10如果有人利用中国19782000年的样本估计的计量经济模型直接预测“中国综合经济水平将在2050年达到美国2002年的水平”,你如何评论这种预测? 答:用回归模型作预测时,预测期解释变量取值不宜偏离样本期过远,否则预测的精度会大大降低。利用中国19782000年的样本估计50年之后的经济水平,其预测不会太准确。 2.11对本章开始提出的“中国旅游业总收入将超过3000亿美元”,你认为可以建立什么样的简单线性回归模型去分析? 答:对本章开始提出的问题,我们会考虑:是什么决定性的因素能使中国旅游业总收入到2020年达到3000亿美元?旅游业的发展与
18、这种决定性因素的数量关系究竟是什么?怎样具体测定旅游业发展与这种决定性因素的数量关系?综合考虑各种因素,我们认为影响中国旅游业总收入的决定性因素是中国居民收入的增长。于是建立如下模型:其中,Y为中国旅游业总收入,X为中国居民收入。 第三章 多元线性回归模型3.1若要将一个被解释变量对两个解释变量作线性回归分析: 1)写出总体回归函数和样本回归函数; 2) 写出回归模型的矩阵表示;3)说明对此模型的古典假定; 4)写出回归系数及随机扰动项方差的最小二乘估计式并说明参数估计式的性质。 答:1)总体回归函数:+ 样本回归函数:+=b 2) 写出回归模型的矩阵表示 3)此模型的古典假定:零均值假定;同
19、方差和无自相关假定;随机扰动项与解释变量不相关;无多重共线性假定;随机误差项服从正态分布。 4)回归系数最小二乘估计式: ( bbb-=-=-= 随机扰动项方差的最小二乘估计式:=参数估计式的性质:具有线性性、无偏性和最小方差性。 3.2什么是偏回归系数?它与简单线性回归的回归系数有什么不同? 答:多元线性回归模型中,回归系数(j,k)表示的是当控制其它解释变量不变的条件下,第j个解释变量的单位变动对被解释变量平均值的影响,这样的回归系数称为偏回归系数。 简单线性回归模型只有一个解释变量,回归系数表示解释变量的单位变动对被解释变量平均值的影响。多元线性回归模型中的回归系数是偏回归系数,是当控制
20、其它解释变量不变的条件下,某个解释变量的单位变动对被解释变量平均值的影响,从而可以实现保持某些控制变量不变的情况下,分析所关注的变量对被解释变量的真实影响。3.3多元线性回归中的古典假定与简单线性回归时有什么不同? 答:多元线性回归中的古典假定比简单线性回归时多出一个无多重共线性假定。假定各解释变量之间不存在线性关系,或各个解释变量观测值之间线性无关。解释变量观测值矩阵X列满秩(k列)。这是保证多元线性回归模型参数估计值有解的重要条件。 3.4多元线性回归分析中,为什么要对可决系数加以修正?修正可决系数与F检验之间有何区别与联系? 答:多元线性回归分析中,多重可决系数是模型中解释变量个数的增函
21、数,这给对比不同模型的多重可决系数带来缺陷,所以需要修正。可决系数只涉及变差,没有考虑自由度。如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难。 联系:由方差分析可以看出,F检验与可决系数有密切联系,二者都建立在对应变量变差分解的基础上。F统计量也可通过可决系数计算。对方程联合显著性检验的F检验,实际上也是对可决系数的显著性检验。区别:F检验有精确的分布,它可以在给定显著性水平下,给出统计意义上严格的结论。可决系数只能提供一个模糊的推测,可决系数越大,模型对数据的拟合程度就越好。但要大到什么程度才算模型拟合得好,并没有一个绝对的数量标准。 3.5什么是方差分析?对被解释变量
22、的方差分析与对模型拟合优度的度量有什么联系和区别? 答:被解释变量Y观测值的总变差分解式为:。将自由度考虑进去进行方差分析,即得如下方差分析表:变差来源平方和自由度方差源于回归源于残差总变差 方差分析和对模型拟合优度的度量(可决系数)都是在把总变差分解为回归平方和与残差平方和的基础上进行分析。区别是前者考虑了自由度,后者未考虑自由度。 3.6多元线性回归分析中,F检验与t检验的关系是什么?为什么在作了F检验以后还要作t检验? 答:在多元回归中,t检验是分别检验当其他解释变量保持不变时,各个解释变量X对应变量Y是否有显著影响。F检验是在多元回归中有多个解释变量,需要说明所有解释变量联合起来对应变
23、量影响的总显著性,或整个方程总的联合显著性。 F检验是对多元回归模型方程整体可靠性的检验,而多元线性回归分析的目的,不仅是要寻求方程整体的显著性,也要对各个参数作出有意义的估计。方程整体线性关系显著并不一定表示每个解释变量对被解释变量的影响是显著的,因此,还必须分别对每个回归系数逐个地进行t检验。 3.7试证明:在二元线性回归模型中,当和相互独立时,对斜率系数和的OLS估计值。等于Y分对和作简单线性回归时斜率系数的OLS估计值。 答:二元线性回归模型的回归系数和最小二乘估计式: 而当和相互独立时,和的斜方差等于零,即: 将代入和式中,可得: 所以,当和相互独立时,对斜率系数和的OLS估计值。等
24、于Y分对和作简单线性回归时斜率系数的OLS估计值。 3.8对于本章开始提出的“中国已成为世界汽车产销第一国”,为分析中国汽车产销量的发展,你认为可建立什么样的计量经济模型? 答:分析中汽车市场状况如何,我们可以用销售量观测。其次考虑影响汽车销量的主要因素都有哪些。比如收入、价格、费用、道路状况、能源、政策环境等。可以建立如下模型: 其中,Y为汽车销售量,为居民收入,为汽车价格,为汽油价格,像其他费用、道路状况、政策环境等次要因素包含在随机误差项中。 3.9说明用Eviews完成多元线性回归分析的具体操作步骤。 1、建立工作文件,建立一个Group对象,输入数据。 2、 点击Quick下拉菜单中
25、的Estimate Equation。 3、 在对话框Equation Specification栏中键入Y C X2 X3 X4,点击OK,即出现回归结果。 第四章 多重共线性4.1多重共线性的实质是什么?为什么会出现多重共线性? 答:多重共线性包括完全的多重共线性和不完全的多重共线性。多重共线性实质上是样本数据问题,出现了解释变量系数矩阵的线性相关问题。 产生多重共线性的经济背景主要有以下几种情形:第一,经济变量之间具有共同变化趋势。第二,模型中包含滞后变量。第三,利用截面数据建立模型也可能出现多重共线性。第四,样本数据自身的原因。 4.2多重共线性对回归参数的估计有何影响? 答:在完全多
26、重共线性情况下,参数的估计值不确定,估计量的方差无限大。在不完全共线性情况下,参数估计量的方差随共线性程度的增加而增大;对参数区间估计时,置信区间趋于变大;严重多重共线性时,假设检验容易做出错误的判断;当多重共线性严重时,可能造成可决系数较高,经检验的参数联合显著性也很高,但单个参数检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。 4.3多重共线性的典型表现是什么?判断是否存在多重共线性的方法有哪些? 答:多重共线性的典型表现是模型拟和较好,但偏回归系数几乎都无统计学意义;偏回归系数估计值不稳定,方差很大;偏回归系数估计值的符号可能与预期不符或与经验相悖,结果难以解释。
27、 具体判断方法有:解释变量之间简单相关系数矩阵法;方差扩大因子法以及一些直观判断法和逐步回归的方法。 4.4针对出现多重共线性的不同情形,能采取的补救措施有哪些? 答:根据经验,可以选择剔除变量,增大样本容量,变换模型形式,利用非样本先验信息,截面数据和时间序列数据并用以及变量变换等不同方法。也可以采取逐步回归方法由由一元模型开始逐步增加解释变量个数,增加的原则是显著提高可决系数,自身显著而与其他变量之间又不产生共线性。最后,还可以采取岭回归方法来降低多重共线性的程度。 4.5在涉及相关的宏观经济总量指标如GDP、货币供应量、物价水平、国民总收入、就业人数等时间序列的数据中一般都会怀疑有多重共
28、线性,为什么? 答:原因是这些变量之间通常具有共同变化的趋势。 4.6多重共线性的产生与样本容量的个数n、解释变量的个数k有无关系? 答:由于多重共线性是一个样本特征,所以可能同样变量的另一组样本共线性程度又没那么严重。根据方差公式,样本容量越大也会增加,从而会减小回归参数的方差,标准误差也同样会减小。多重共线性与解释变量的个数也有关系,解释变量个数越多,变量之间产生多重共线性的可能性越大。 4.7具有严重多重共线性的回归方程能否用来进行预测? 答:如果研究的目的仅在于预测Y,而各个解释变量X之间的多重共线性关系的性质在未来将继续保持,这时虽然无法精确估计个别的回归系数,但可以估计这些系数的某
29、些线性组合,因此,多重共线性可能并不是严重问题。 4.8岭回归法的基本思想是什么,它对降低共线性有何作用? 答:当解释变量之间存在多重共线性时,则会增大,原因是接近于奇异。如果将加上一个正常数对角矩阵(0,为单位矩阵),即,使得的可能性比的可能性更小,那么接近奇异的程度就会比小得多。如此可以得到参数的岭回归估计:,是岭回归参数。当解释变量之间存在多重共线性时,岭回归估计比最小二乘估计稳定,当k较小时,回归系数很不稳定,而当逐渐增大时,回归系数可能呈现稳定状态。因此,选择合适的值,岭回归参数会优于普通最小二乘估计参数。当=0时,岭回归估计等于普通最小二乘估计。 4.9以下陈述是否正确?请判断并说
30、明理由。 1) 在高度多重共线性的情形中,要评价一个或多个偏回归系数的单个显著性是不可能的。 答:正确。 理由:在高度多重共线性的情形中,没有任何方法能从所给的样本中把存在高度共线性的解释变量的各自影响分解开来,从而也就无法得到单个参数显著性检验的t统计量,因此无法判断单个或多个偏回归系数的单个显著性。 2) 尽管有完全的多重共线性,OLS估计量仍然是BLUE。答:错误。理由:在完全多重共线性情况下,参数估计值的方差无穷大,因此不再是有效估计量,从而BLUE不再成立。 3) 如果有某一辅助回归显示出高的值,则高度共线性的存在肯定是无疑的。 答:正确。理由:方差扩大因子,当时, 方差扩大因子也会
31、很大,说明变量之间多重共线性也会越严重。 4) 变量的两两高度相关并不表示高度多重共线性。 答:正确。 理由:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性,这时就需要检查偏相关系数。因此,并不能简单地依据相关系数进行多重共线性的准确判断。 5)如果其他条件不变,VIF越高,OLS估计量的方差越大。 答:正确。 理由:以二元模型为例, ,从而方差扩大因子越大,参数估计量的方法越大。 6) 如果在多元回归中,根据通常的t检验,全部偏回归系数分别都是统计上不显著的,你就不会得到一个高的值。 答:错误。
32、 理由:在多元回归模型中,可能会由于多重共线性的存在导致很高的情况下,各个参数单独的t检验却不显著。 7) 在对和的回归中,假如的值很少变化,这就会使增大,在极端的情况下,如果全部值都相同,将是无穷大。 答:正确。 理由:根据公式,在两个解释变量线性相关程度一定的情况下,的值很少变化,从而会使得很小,从而增大,如果全部值都相同,趋于零,将是无穷大。 第五章 异方差性5.1简述什么是异方差?为什么异方差的出现总是与模型中某个解释变量的变化有关? 答 :设模型为,如果其他假定均不变,但模型中随机误差项的方差为,则称具有异方差性。由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的
33、,所以异方差的出现总是与模型中某个解释变量的变化有关。 5.2试归纳检验异方差方法的基本思想,并指出这些方法的异同。 答:各种异方差检验的共同思想是,基于不同的假定,分析随机误差项的方差与解释变量之间的相关性,以判断随机误差项的方差是否随解释变量变化而变化。其中,戈德菲尔德-跨特检验、怀特检验、ARCH检验和Glejser检验都要求大样本,其中戈德菲尔德-跨特检验、怀特检验和Glejser检验对时间序列和截面数据模型都可以检验,ARCH检验只适用于时间序列数据模型中。戈德菲尔德-跨特检验和ARCH检验只能判断是否存在异方差,怀特检验在判断基础上还可以判断出是哪一个变量引起的异方差。Glejse
34、r检验不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。 5.3什么是加权最小二乘法?它的基本思想是什么? 答:以一元线性回归模型为例:,经检验存在异方差,公式可以表示为。选取权数 ,当越小 时,权数越大。当越大时,权数越小。将权数与残差平方相乘以后再求和,得到加权的残差平方和:,求使加权残差平方和最小的参数估计值和。这种求解参数估计式的方法为加权最小二乘法。 加权最小二乘的基本思想是通过权数使异方差经受了“压缩”和“扩张”变为同方差。区别对待不同的。对较小的,给予较大的权数,对较大的给予较小的权数,从而使更 好地反映对残差平方和的影响。 5.4产生异方差的原
35、因是什么?试举例说明经济现象中的异方差性。 答:原因包括模型设定误差,模型中略去重要解释变量或者模型数学形式不正确都可能导致异方差。样本数据的观测误差以及截面数据中总体各单位的差异等也会导致异方差的存在。5.5如果模型中存在异方差性,对模型又什么影响?这时候模型还能进行应用分析吗? 答:当模型中的误差项存在异方差时,参数估计仍然是无偏的但方差不再是最小的;在异方差存在的情况下,参数估计的方差可能会高估或者低估真实的方差,从而会低估或者高估t统计量,从而可能导致错误的结论。 由于参数估计量不再是有效的,从而对Y的预测也将不是有效的。 5.6对数变化的作用是什么?进行对数变化应注意什么?对数变换后
36、模型的经济意义有什么变化? 答:通过对数变换可以实现:一能使测定变量值的尺度缩小;二经过对数变换后的线性模型,其残差e表示相对误差,而相对误差往往比绝对误差有较小的差异。 进行对数变化应注意的是,对变量取对数虽然能够减少异方差对模型的影响,但应注意取对数后变量的经济意义。如果变量之间在经济意义上并非呈对数线性关系,则不能简单地对变量取对数,这时只能用其他方法对异方差进行修正。 5.7怎样确定加权最小二乘法中的权数? 答:在样本容量足够的情况下,可以先尝试用怀特检验找出引起异方差的解释变量,然后通过Glejser检验找出残差e随该解释变量变化而变化的函数形式,进而以该函数开方的倒数作为权数进行加
37、权最小二乘估计。 第六章 自相关6.1如何使用DW统计量来进行自相关检验?该检验方法的前提条件和局限性有哪些? 答:DW 检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951年提出的一种适用于小样本的检验方法,一般的计算机软件都可以计算出DW 值。 给定显著水平,依据样本容量n和解释变量个数k,查D.W.表得d统计量的上界du和下界dL,当0ddL时,表明存在一阶正自相关,而且正自相关的程度随d向0的靠近而增强。当dLddu时,表明为不能确定存在自相关。当dud4-du时,表明不存在一阶自相关。当4-dud4-dL时,表明不能确定存在自相关。当4-dLd判断:正确。 6.4对于四个解释变量的回归模型 如果样本量n=50, 当DW统计量为如下数值时,请判断模型中的自相关状况。 (1)DW=1.05 (2)DW=1.40 (3)DW=2.50 (4) DW=3.97 答:给定显著水平=0.05,依据样本容量n=50和解释变量个数k=4,查D.W.表得d统计量的上界=1.721,下界=1.378,=2.279,=2.622。 (1) DW=1.05,所以模型存在正自相关。 (2) DW=1.40, 所以模型不能确定是否存在自相关。 (3) DW=2.50,所以模型存在负自相关。