1、第一章 导论1计量经济学是一门什么样的学科?答:“经济计量学”不仅要研究经济问题的计量方法,还要研究经济问题发展变化的数量规律。可以认为,计量经济学是以经济理论为指导,以经济数据为依据,以数学、统计方法为手段,通过建立、估计、检验经济模型,揭示客观经济活动中存在的随机因果关系的一门应用经济学的分支学科。2计量经济学与经济理论、数学、统计学的联系和区别是什么?答:计量经济学是经济理论、数学、统计学的结合,是经济学、数学、统计学的交叉学科(或边缘学科)。6计量经济学模型的检验包括哪几个方面?为什么要进行模型的检验?答:对模型的检验通常包括经济意义经验、统计推断检验、计量经济检验、模型预测检验四个方
2、面。8计量经济学模型中的被解释变量和解释变量、内生变量和外生变量是如何划分的?答:在联立方程计量经济学模型中,按是否由模型系统决定,将变量分为内生变量(endogenous variables)和外生变量(exogenous variables)两大类。内生变量是由模型系统决定同时可能也对模型系统产生影响的变量,是具有某种概率分布的随机变量,外生变量是不由模型系统决定但对模型系统产生影响的变量,是确定性的变量。9计量经济学模型中包含的变量之间的关系主要有哪些?答:计量经济学模型中变量之间的关系主要是解释变量与被解释变量之间的因果关系,包括单向因果关系、相互影响关系、恒等关系。12计量经济学中常
3、用的数据类型有哪些?答:根据生成过程和结构方面的差异,计量经济学中应用的数据可分为时间序列数据(time series data)、截面数据(cross sectional data)、面板数据(panal data)和虚拟变量数据(dummy variables data)。13什么是数据的完整性、准确性、可比性、一致性?答:1)完整性,指模型中所有变量在每个样本点上都必须有观察数据,所有变量的样本观察数据都一样多。2)准确性,指样本数据必须准确反映经济变量的状态或水平。数据的准确性与样本数据的采集直接相关,通常是研究者所不能控制的。3)可比性,指数据的统计口径必须相同,不同样本点上的数据要
4、有可比性。4)一致性,指母体与样本即变量与数据必须一致。第二章 一元线性回归模型1什么是相关分析?什么是回归分析?相关分析与回归分析的关系如何?答:相关分析(correlation analysis)是研究变量之间的相关关系的形式和程度的一种统计分析方法,主要通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。回归分析(regression analysis)是研究不仅存在相关关系而且存在因果关系的变量之间的依存关系的一种分析理论与方法,是计量经济学的方法论基础。相关分析与回归分析既有联系又有区别。联系在于:相关分析与回归分析都是对存在相关关系的变量的统计相关关系的研究,都能测度线性相关
5、程度的大小,都能判断线性相关关系是正相关还是负相关。区别在于:相关分析仅仅是从统计数据上测度变量之间的相关程度,不考虑两者之间是否存在因果关系,因而变量的地位在相关分析中是对等的;回归分析是对变量之间的因果关系的分析,变量的地位是不对等的,有被解释变量和解释变量之分。2随机误差项在计量经济学模型中的作用是什么?答:计量经济学是研究经济变量之间存在的随机因果关系的理论与方法,其中对经济变量之间关系的随机性的描述通过引入随机误差项(stochastic error)的方式来实现。一个经济变量通常不能被另一个经济变量完全精确地决定,需要引入随机误差项来反映各种误差的综合影响,主要包括:1)变量的内在
6、随机性的影响;2)解释变量中被忽略的因素的影响;3)模型关系设定误差的影响;4)变量观察值的观察误差的影响;5)其他随机因素的影响。3什么是总体回归函数?什么是总体回归模型?答:给定解释变量条件下被解释变量的期望轨迹称为总体回归曲线或总体回归线。描述总体回归曲线的函数称为总体回归函数。引入了随机误差项,称为总体回归函数的随机设定形式,也是因为引入了随机误差项,成为计量经济学模型,称为总体回归模型根据样本数据对总体回归函数作出的估计称为样本回归函数。引入样本回归函数中的代表各种随机因素影响的随机变量,称为样本回归模型。6为什么要对模型提出假设?线性回归模型的基本假设有哪些?答:线性回归模型的参数
7、估计方法很多,但各种估计方法都是建立在一定的假设前提之下的,只有满足假设,才能保证参数估计结果的可靠性。为此,本节首先介绍模型的基本假设。线性回归模型的基本假设包括对解释变量的假设、对随机误差项的假设、对模型设定的假设几个方面,主要如下:1)解释变量是确定性变量,不是随机变量。2)随机误差项具有0均值、同方差,且在不同样本点之间是独立的,不存在序列相关,即3)随机误差项与解释变量不相关。即4)随机误差项服从正态分布,即5)回归模型是正确设定的。这5条假设中的前4条是线性回归模型的古典假设,也称为高斯假设,满足古典假设的线性回归模型称为古典线性回归模型(classical linear regr
8、ession model)。7参数的普通最小二乘估计法和最大似然估计法的基本思想各是什么?答:普通最小二乘法(ordinary least squares,OLS)是最常用的参数估计方法,其基本思想是使样本回归函数尽可能好地拟合样本数据,反映在图上,就是要使样本散点偏离样本回归直线的距离总体上最小。最小二乘法以表示被解释变量的估计值与实际观察值的偏差总体上最小,称为最小二乘准则。最大似然法(maximum likelihood,ML),也称为最大或然法或极大似然法。最大似然法的基本思想是使从模型中取得样本观察数据的概率最大。8普通最小二乘参数估计量和估计值各有哪些性质?答:在满足基本假设情况下
9、,一元线性回归模型的普通最小二乘参数估计量是最佳线性无偏估计量。用普通最小二乘法估计得到的一元线性回归模型的样本回归函数具有如下性质:1. 样本回归线过样本均值点,即点满足样本回归函数;2. 被解释变量的估计的均值等于实际值的均值,即;3. 残差和为零,即;4. 解释变量与残差的乘积之和为零,即;5. 被解释变量的估计与残差的乘积之和为零,即。10什么是拟合优度?什么是拟合优度检验?拟合优度通过什么指标度量?为什么残差平方和不能作为拟合优度的度量指标?答:拟合优度指样本回归线对样本数据拟合的精确程度,拟合优度检验就是检验样本回归线对样本数据拟合的精确程度。样本残差平方和是一个可用来描述模型拟合
10、效果的指标,残差平方和越大,表明拟合效果越差;残差平方和越小,表明拟合效果越好。但残差平方和是一个绝对指标,不具有横向可比性,不能作为度量拟合优度的统计量。所以拟合优度检验的度量指标是通过残差平方和构造的决定系数来进行检验的。决定系数公式是:与残差平方和不同,决定系数是一个相对指标,具有横向可比性,因此可以用作拟合优度检验。12什么是变量显著性检验?答:一元线性回归模型中,是否显著不为0,反映解释变量对被解释变量的影响是否显著,所以常针对原假设,备择假设,进行检验,称为变量显著性检验。13为什么被解释变量总体均值的预测置信区间比个别值的预测置信区间窄?答:被解释变量的总体均值的波动,主要取决于
11、样本数据的抽样波动。被解释变量的个别值的波动,除受样本数据的抽样波动的影响外,还受随机误差项的影响。14由19812005年的样本数据估计得到反映某一经济活动的计量经济学模型,利用模型对2050年该经济活动的情况进行预测,是否合适?为什么?答:用回归模型作预测时,解释变量的取值不宜偏离解释变量的样本均值太大,否则预测精度会大大降低。所以利用模型对2050年的经济活动的情况进行预测不合适。15在一元线性回归模型中,用不为零的常数去乘每一个X值,对参数与的估计值、Y的拟合值、残差会产生什么样的影响?如果用不为零的常数去加每一个X值,又会怎样?,用不为零的常数去乘每一个Y值,对参数、的估计值会产生什
12、么样的影响?如果用不为零的常数去加每一个Y值,又会怎样?解答:记原总体模型对应的样本回归模型为,则有, 用不为零的常数去乘每一个X值,的估计值变为原来的,的估计值、Y的拟合值与模型的残差不变。用不为零的常数去加每一个X值,的估计值改变, 的估计值、Y的拟合值与模型的残差不变。用不为零的常数去乘每一个Y值,、的估计值会变为原来的倍。用不为零的常数去加每一个Y值,的估计值比原来增大、的估计值不变。多元线性模型1多元线性回归模型的基本假设有哪些?在多元线性回归模型的参数估计量的无偏性、有效性的证明中各用了哪些?解答 多元线性回归模型的基本假设也包括对解释变量的假设、对随机误差项的假设、对模型设定的假
13、设几个方面,主要如下:1)解释变量是确定性变量,不是随机变量,解释变量之间不相关,即矩阵是阶非随机矩阵,矩阵列满秩 则有矩阵非奇异。2)随机误差项具有0均值、同方差,且在不同样本点相互独立,不存在序列相关性,即 3)解释变量与随机误差项不相关,即4)随机误差项服从正态分布,即用矩阵形式可表示为5)回归模型是正确设定的。同一元线性回归模型,在这5条假设中,前4条假设是古典假设,若前两条假设满足,第3条假设自然满足,并且由第2条假设有在证明参数估计量的无偏性时,利用了解释变量非随机或与随机干扰项不相关的假定;在证明参数估计量的有效性时用到了随机干扰项同方差且无序列相关的假定。3在多元模型中,为何要
14、对决定系数进行调整?调整的决定系数与F的关系如何?解答 在多元线性回归模型中,因为决定系数随解释变量数目的增加而增大(或至少不变),所以不能利用决定系数进行解释变量数目不同的模型的拟合优度的比较。调整的决定系数与F统计量存在下列关系:或者随机变量问题1随机解释变量问题主要表现为解释变量与随机误差项之间的关系。它们有如下三种关系:(1)相互独立: (2)同期无关,但异期相关: (3)同期相关: 2、产生原因A经济变量的不可控,使得解释变量观测值具有随机性;B遗漏了某个重要变量C模型中含有被解释变量的滞后项,而被解释变量本身就是随机的3、随机解释变量的影响(1)如果与相互独立 OLS估计量仍然无偏
15、一致。(2)同期不相关,异期相关 OLS估计量有偏,但一致。(3)同期相关 OLS估计量有偏且非一致。3、随机解释变量的修正(1)工具变量的选取 工具变量Z与所替代的随机解释变量X高度相关:工具变量Z与随机误差项u不相关:工具变量Z与模型其他解释变量不相关。(3)估计量的性质 是有偏估计量 但满足一致性4、关于工具变量法的几个注意事项(1)一般不是用工具变量直接替换原来的解释变量。(2)如果一个随机变量可以找到多个相互独立的工具变量,可以利用这些信息,形成广义矩方法。(3)找到一个工具变量很不容易,一般很少应用这种方法。多重共线1、什么是多重共线?解释变量之间存在线性关系一般形式:完全共线和近
16、似多重共线:2、产生原因(1)经济变量之间的内在联系【根本原因】;(2)经济变量在时间上有同方向的趋势【重要原因】(3)模型中滞后项的引入;(4)取样过程中,也会引起数值上的多重共线问题【客观原因】。3、多重共线影响(1)完全共线:参数无法估计(2)近似共线:使估计量的方差变大,其中方差膨胀因子(3)所有统计检验和预测功能失去意义。(4)参数估计量的经济意义不合理。4、判别多重共线:多重共线的检验(1)判断是否存在 简单相关系数:大于0.8,则存在共线问题。 直观判断法: 综合统计检验法:R2和F统计量大,但T统计量小。(2)判断共线的程度 决定系数法 行列式检验法 方差膨胀(扩大)因子,VI
17、F大于10,就认为存在严重多重共线性。 逐步回归法:根据可决系数、F检验或者AIC准则,以Y为被解释变量,逐个引入或排除解释变量,以判断该解释变量是否可以放在模型中。5、修正(1)省略变量法(2)利用已知信息克服多重共线,即约束参数之间的关系,可减少解释变量个数。(3)变换模型形式:(4)增加样本容量,可避免由于采样问题而引起的数据之间的相关性(5)逐步回归法(6)差分法:对解释变量进行一次差分补充:t检验与F检验结果相矛盾可能是由于多重共线性造成的。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能很好地被度量。多重共线性往往表现的是解释变量间的样本相关现象,在
18、不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS估计量的无偏性、一致性和有效性仍然成立,但共线性会导致参数估计值的方差大于不存在多重共线性的情况。异方差1、什么是异方差?异方差一般是针对随机误差项而言的。类型:单调递增型;单调递减型;复杂型。2、产生原因 例如:居民储蓄模型,高收入的储蓄差异较大,而低收入的储蓄差异较小;干中学模型;股票价格和消费者价格模型;假性异方差,源于解释变量缺失、函数形式不正确或参数变化等。3、影响(1)参数估计量无偏但非有效(2)随机误差项的方差估计不再无偏(3),OLS的各种统计检验非有效(4)模型不再具有良好的统计性质;(5),预测置信区
19、间失去意义,故预测失效。4、检验(1)图示检验法(2)帕克检验和戈里瑟检验:(3)G-Q检验 按照可能引起异方差的X对残差排序; 去掉中间的c个样本; 对两变剩余样本分别进行OLS回归,分别计算残差平方和; 构造F统计量: 根据给定的显著性水平,确定临界值,并进行判断。(5)怀特检验 对Y和所有解释变量X进行OLS回归; 将得到的残差平方作为被解释变量,对其他解释变量进行回归; 根据得到的可决系数计算LM值 根据显著性水平,确定临界值,判断LM是否大于临界值。如果LM大于临界值,则存在异方差。5、修正(1)异方差稳健标准法(2)对估计过程的修正加权最小二乘法和可行的加权最小二乘法序列相关性1、
20、什么是序列相关?2、产生原因(1)经计时间序列数据惯性(2)模型设定的偏误(3)滞后效应(5)数据的编造3、影响(1)参数估计量无偏但非有效(2)随机误差项方差估计量有偏(3)拟合优度检验和方程显著性检验无效(4)变量显著性检验T检验统计量和相应的参数置信区间无意义(5)模型的预测失效4、检验(1)图示法(2)回归检验法(3)杜宾-沃森检验(DW检验) 条件a. 回归含有截距项;b. 解释变量是非随机的;c. 随机干扰项是一阶自回归形式;d. 回归模型不应把滞后被解释变量作为解释变量之一,即解释变量中不能出现;e. 没有缺失数据。 原假设:不存在一阶自相关 统计量 判断:(4)拉格朗日乘子检验
21、5、修正(1)广义最小二乘法:它具有无偏和有效性。(2)广义差分法(3)科克伦-奥克特迭代法(4)杜宾两步法虚拟变量1、什么是虚拟变量?作用:为了寻求某些定性因素对X的影响2、虚拟变量在模型中的表现形式(加法和乘法)(1)虚拟变量模型:同时含有一般解释变量和虚拟变量的模型;(2)虚拟变量可以作为解释变量,也可以作为被解释变量;(3)一般形式:;(4)可以用普通最小二乘法估计其参数;(5)当作为解释变量时,虚拟变量表示为截距或斜率的变化。3、虚拟变量的引入方式(1)加法方式 反映截距的变化(2)乘法方式 反映斜率的变化(3)临界指标的虚拟变量的引入 某一年为转折点在经济发生转折时,可通过建立临界
22、指标的虚拟变量来反映。其中,为年的X值。这样引入是为了曲线的连贯性。(4)数值变量作为虚拟变量引入 把连续数据转变成有序数据,进而变成虚拟变量(5)有交互效应的虚拟变量 两虚拟变量之间存在交互关系4、虚拟变量的设置原则(1)每个变量的值只有“1”或“0”;(2)每一定性变量所需的虚拟变量个数要比该定性变量的类别数目少1,即如果定性变量有m个类别,则引入m-1个虚拟变量。“虚拟变量陷阱”根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。这种由于引入虚拟变量个数与类别个数相等
23、导致的模型无法估计的问题,称为“虚拟变量陷阱”。滞后变量1、为什么要建立滞后变量模型?答:建立滞后变量模型主要基于以下几个因素:(1)由于社会经济的发展、经济行为的形成与演变在很大程度上都与前期的经济活动密切相关,滞后变量模型可以更全面、客观地描述经济现象,提高模型的拟合程度。(2)滞后变量模型可以反映过去的经济活动对现期经济行为的影响,从而描述了经济活动的运动过程,使模型成为动态模型。(3)滞后变量模型可以模拟分析经济系统的变化和调整过程。(1)什么是滞后效应?某些经济变量不仅受到同期各种因素的影响,也可能受到过去某些时期的某些经济变量的影响。 把这种过去时期的具有滞后影响作用的变量称为滞后
24、变量,含有滞后变量的模型称为滞后变量模型,含有滞后被解释变量的模型称为动态模型滞后效应:被解释变量受到自身或另一解释变量的前几期值影响的现象。(2)滞后效应产生原因 客观原因a. 技术原因:在现实经济运行中,从生产到流通再到使用,每一个环节都需要一段时间,从而形成时滞。b. 制度原因:契约、管理制度等因素也会造成经济行为一定程度的滞后。 主观原因人们对于信息的了解往往存在不全面或者易受心理因素的影响,从而对于新的变化反应迟钝。(3)滞后变量模型 滞后变量模型:以滞后变量作为解释变量的模型。 分布滞后模型:仅含解释变量的滞后变量,不包含被解释变量对自身滞后变量的回归。 自回归模型:仅包含被解释变
25、量对自身滞后变量的回归,不包含解释变量的滞后变量,但可能包含解释变量的同期变量。 自回归分布滞后模型:既含有被解释变量对自身滞后变量的回归,也包括解释变量的滞后变量。(科伊克模型、自适应预期模型、局部调整模型) 有限自回归分布滞后模型:滞后期长度有限。 无限自回归分布滞后模型:滞后期长度无限。2、分布滞后模型(1)一般形式 :短期或即期乘数:动态乘数或延迟系数滞后各期X的变动对Y的平均值影响的大小:长期乘数或均衡乘数X变动一个单位,由于滞后效应而形成的对Y平均值总影响的大小。:平均滞后所有滞后的加权平均数。(2)参数估计 估计的困难a. 没有先验准侧确定滞后期长度;b. 如果滞后期较长,而样本
26、数据较小,将缺乏足够的自由度进行传统的统计检验;c. 同名变量滞后值之间可能存在高度线性相关,即模型会存在高度的多重共线性。 分布滞后模型的修正估计方法【a. 经验加权法】递减法:矩型:倒V型:【b. 阿尔蒙多项式法】【c. 科伊克方法】 为了消除无限分布滞后期【特点】以一个滞后被解释变量代替了大量的滞后解释变量,节省了自由度;与的线性相关性肯定小于X各期自身的相关性,避免了多重共线。【产生问题】模型存在随机干扰项的一阶自相关性;滞后被解释变量与随机项不独立。3、自回归模型滞后变量模型中的解释变量仅包含X的当期值与被解释变量Y的一个或多个滞后值。(1)自回归模型的构造 自适应预期模型 在不知道
27、X当期水平的情况下,认为Y收到X当期预期水平的影响 局部调整模型 一般用于物资储备问题,在已知X的情况下,Y的预期水平与X的关系(2)参数估计自回归模型可能存在随机解释变量问题( 工具变量法)或序列相关问题( 普通最小二乘法),即滞后的被解释变量很可能与随机干扰项之间存在相关关系,以及随机干扰项可能存在自身的序列相关问题。对此需要进行相应的处理。4、格兰杰因果关系检验考虑X与Y之间的因果关系,即X的滞后变量对Y是否有显著的影响(T检验或联合检验显著),或者Y的滞后变量对X是否有显著的影响(T检验或联合检验显著)。例如:考虑X各滞后期对Y的影响的检验约束模型:无约束模型:记约束模型的残差平方和为,无约束模型的残差平方和为,则构造F统计量 其中,p为滞后期数,或者说约束模型与无约束模型之间解释变量个数的差;k为2p+1。F服从相应的F分布。【F统计量可以理解为,在Y的变动中,X能解释的部分(两个残差平方和的差)占X和Y共同解释的部分(无约束模型的残差平方和)的比重,显然,如果这个比重越大,表明X的影响越明显】