资源描述
第一章 绪论
计量经济学的含义:一定的经济理论和实际统计资料为依据,运用数学、统计学方法和计算机技术,通过建立计量经济模型,定量的分析经济变量之间的随即因果关系。
计量经济学研究的经济关系具有两个特征:一是随机关系,产出与生产要素投入、消费与收入、投资与收入和利率之间都不是精确的函数关系。二是因果关系,计量经济模型中的每一个(随机)方程都是反映某个经济变量与其影响因素之间的因果关系。
计量经济学的研究步骤:建立理论模型、估计模型中的参数、检验估计的模型和应用模型进行定量分析。
1. 建立理论模型
其任务是依据经济理论和对所研究经济系统的认识,将系统内各经济变量之间的相互关系用一组(或一个)数学方程表示出来。这一阶段的工作又称为模型设定。模型设定一般包括总体设定和个体设定。总体设定的目标是能正确反映经济系统的运行机制。个体设定的目标是能正确反映经济变量之间的因果关系。
①确定模型中的变量
计量经济学中一般将方程中的变量分为两类,方程等号左端的变量称为被解释变量,有端的变量称为解释变量,即用这些变量来解释或说明被解释变量的变化情况(回归分析中称为因变量和自变量)。建立理论模型时,主要是确定模型中的解释变量,一般时根据经济理论和经验确定被解释变量的主要影响因素。
②确定模型中的函数形式
确定模型中的函数形式一般有两种方式,一种方式是根据经济行为理论,运用数理经济学的研究方法推导出模型的具体数学形式。另一种方式是根据实际统计资料绘制被解释变量和解释变量的相关图,由相关图显示的变量之间的相关关系确定模型的数学形式,这也是目前经常采用的方式。
③确定统计指标并搜集整理数据
需要根据模型中变量的含义和统计数据的可得性,模型的研究目的,以及统计数据的可比性和一致性等因素进行综合考虑,以确定适当的统计指标。
建立计量经济模型的统计数据主要有三种类型:时间序列数据,即按时间先后顺序排列的数据,时间频率可以是年、季、月、日等;横截面数据,即某一时点上的数据;合并数据,即时间序列与横截面数据的混合数据。
2.估计模型中的参数
建立理论模型之后,需要根据实际统计资料估计出模型中各个参数的具体数值,即得到一个估计的计量经济模型,这样才能定量描述经济变量之间的数量关系。
3.检验估计的模型
具体的检验内容包括:
①经济检验:主要是检验参数估计值的符号以及数值的大小在经济意义上是否合理。
②统计检验:主要是利用数理统计中的推断统计方法,对估计结果的可靠性进行检验。一般包括拟合优度检验、模型的显著性检验、解释变量的显著性检验等。
③计量经济检验:主要用于检验模型的计量经济学性质,如回归模型的假设条件检验,模型的识别性检验等。
④预测性能检验:主要检验模型参数估计量的稳定性,以及模型对样本期以外客观事实的近似描述能力(即所谓的超样本特性)。
4.应用模型
计量经济模型主要有以下几个方面的用途。
①结构分析:即分析经济变量或结构参数的变动对整个经济系统的影响。
②经济预测:由于计量经济预测是根据事物变化的原因进行预测即为因果预测,而且预测模型可以同时考虑多个经济变量之间的多种因果关系。
③政策评价:即利用计量经济模型定量分析政策变量变化对经济系统运行的影响。
④实证分析:即利用计量经济模型和实际统计资料实证分析某个理论假说的正确与否。
计量经济研究的四个步骤可以进一步概括成:
经济系统 计量经济模型 经济问题
广义计量经济学与狭义计量经济学:广义计量经济学是利用经济理论、数学和统计定量研究经济现象的数量经济方法统称,内容包括回归分析、时间序列分析、投入产出分析,等等。狭义计量经济学就是我们通常定义的计量经济学,主要研究经济变量之间的随机因果关系,采用的数学方法主要是在回归分析基础上发展起来的计量经济方法。
计量经济模型的类型:
单方程模型与联立方程模型
如果模型系统只包含一个方程,即只研究某一个经济关系,则称该模型为单方程模型。如果模型系统涉及到多个经济关系而需要构造多个方程,则称该模型为联立方程模型。
随机方程与恒等方程
恒等方程中没有随机误差项。计量经济学主要研究经济变量之间的随机关系,所以单方程模型都是随机方程。
静态模型与动态模型
只考虑本期变量之间相互关系的模型为静态模型;如果模型中引入了滞后变量,如前期收入、前期投资、前期利率等,则模型成为动态模型。
第二章 回归模型
总体回归直线方程: 称为总体回归方程,常数称为总体回归(或回归系数)。回归分析的主要任务就是设法求出总体回归参数的具体数值,进而利用总体回归方程描述和分析总体的平均变化规律。只有了解总体的整个概率分布情况,才能确定总体回归方程。但是在现实经济生活中,往往无法获取总体的所有资料,只能通过对总体的若干次观察得到总体的一个样本,再依据样本信息来估计总体回归方程。
虽然样本的观察值并没有完全落在总体回归直线上,但样本是从总体中随机抽取的,必然包含总体的信息,散点分布仍然呈现出明显的线性趋势;设法确定一条直线来较好地拟合这些样本观察值,称这条直线为样本回归直线,其对应的方程:称为样本回归方程,分别为总体回归参数的估计。如果估计误差较小,即的值与总体回归参数比较接近,则可以用样本回归方程来近似的代替总体回归方程,即利用样本回归方程近似地描述总体的平均变化规律。
因此,回归分析的主要内容可以概括成:
根据样本观察值确定样本回归方程;
检验样本回归方程对总体回归方程的近似程度;
利用样本回归方程分析总体的平均变化规律。
随机误差项设定:
1. 随机误差项
总体回归方程只是反映了总体的平均变化规律,单个家庭的消费支出与平均消费支出之间存在着一定的离差,将这个离差用表示,即: 或 其中,是一个不可观测的、可正可负的随机变量,所以称之为随机误差项。
相应的,若样本回归方程为,则实际值与估计值的离差用表示,即: 称为残差(或拟合误差),它可以作为随机误差项的估计。
2. 产生随机误差的原因
模型中被忽略因素的影响。
模型函数形式的设定误差。
数据的测量与归并误差和随机因素的影响(如自然灾害等)
引入随机误差项后,之间的关系式就表示成以下形式:
这就是一元回归模型的一般形式,或称为回归模型的随机设定形式。以这种形式描述之间的关系有明确的意义:
第一,误差的随机性使得之间呈现出一种随机的因果关系,由于经济变量之间大多是不确定的相关关系,因此,用这种形式描述经济关系更加准确、合理。
第二,的取值由两部分组成,一部分是总体的平均值,其 变化由模型中的解释变量来决定,可以称之为“系统内影响”;另一部分是随机误差,主要反映了那些对有影响、但又未能包括到回归模型中的所有因素的综合影响,可以称之为“系统外影响”。因此,回归模型的随机设定形式更加全面地反映了被解释变量y的变化情况。
古典回归模型的基本假设:
1. 解释变量x为非随机变量,即在重复抽样过程中,x取值是可控的、固定的。
2. 零均值假定:,即随机误差项的平均值为零。在此假定下,才有:回归方程才能反映总体的平均变化趋势,否则将会差生系统误差。
3. 同方差假定:(常数),即各个随机误差项的离散程度(或变动幅度)是相同的。
4. 非自相关协定:,即随机误差项之间是互不相关、互不影响的。这样可以独立考虑各个水平下随机误差项的影响。
5. 解释变量与随机误差项不相关假定,,即解释变量与随机误差项互不相关,彼此对立的对y产生影响。在假定1成立的情况下,该假定自动成立。
6. 无多重共线性假定,即解释变量之间不存在完全的线性关系,这样才能分析每个解释变量对y的单独影响。
最小二乘法估计(OLS)
1. 选择最佳拟合曲线的标准可以确定为:是总的拟合误差(即总残差)达到最小。其中最常用的就是普通最小二乘法:所选择的回归模型应该使所有观察值的残差平方和达到最小。即:
2. 由于:是关于的二次函数并且非负,所以存在最小值。解得:
其中:
在Eviews软件命令窗口中直接键入CREATE命令,也可以建立工作命令。命令格式为:CREATE 时间频率类型 起始期 终止期
在Eviews软件的命令窗口中,可以直接键入LS命令来估计模型。命令格式为:LS 被解释变量 C 解释变量
3. 最小二乘估计的性质参数估计量的评价标准:
无偏性。设是参数的估计量,如果,则称是的无偏估计。无偏估计保证了参数估计值是在真实值(简称参数真值)的左右波动,并且“平均位置”就是参数的真值。
有效性(最小方差性)。设、均为参数的无偏估计量,若,则称比有效;如果在的所以无偏估计中,最小,则称为有效估计量。有效性衡量了参数估计量与参数真值平均离散程度的大小。如果估计量是有效估计,则参数估计值不仅在参数真值左右波动,而且波动幅度最小,这样参数估计值就很可能接近于参数真值。
一致性。这是估计量的一个大样本性质,如果随着样本的增加,估计量越接近于真值,则称是的一致估计。严格的说,是依概率收敛于,即: 其中,为一个任意小的正数。
4. 系数的估计误差与置信区间
系数的估计误差
估计误差即估计值与真值的偏差,随着抽样的不同,误差大小是一个随机变量,因此考虑概率意义下的平均误差。由于,平均误差(平方)= 即等于估计量的方差;因为最小二乘法估计是无偏估计,均值即为参数真值,所以估计量关于均值的平均偏差--方差也就反映了估计量与参数真值的平均偏差。
在前面的证明过程中已经得到: 假定
由于正态分布的线性组合仍是正态分布,而且分布形式由其均值和方差惟一确定,所以:
这样,参数估计量的平均误差为: 其中,涉及到随机误差项的方差,这个值通常不知道,实际计算中一般采用的无偏估计量: 来估计,并且用符合来表示系数的估计误差为:
同理的估计误差为:
又称为系数的标准误差(或标准差)。Eviews软件在估计回归模型时,将同时输出系数的估计值和标准差。需要指出的是,系数的标准差只是反映了估计量和真值的相对偏离程度;越小,则与的近似误差越小,但不能认为与之间的绝对误差就是。
系数的置信区间
统计量: 所以对于给定的置信度,由t分布表可以查得临界值,使得:,即:
所以系数b的置信区间为: 即以的概率保证回归系数属于该区间的。
显然,置信区间越小,对回归系数的估计精度就越高。从置信区间的计算公式可以看出,置信区间的长度为,在a取定的情况下,是一个常数,所以置信区间的长度主要取决于系数的标准差,越小,则估计的误差越小,估计值与真值越接近。因此,称为系数的估计误差,并用它来衡量估计的精度是合理的;而且,在一定的概率下,与的绝对误差充其量不会超过。
5.极大似然估计的原理:既然所抽取的样本是在一次观测中得到的,表明“观察值落在该样本周围”是一个比较容易发生的大概率事件,因此,所选择的参数估计值应该使这一事件的概率达到最大。最小二乘估计是使模型对样本的拟合达到最优,而极大似然估计却是使样本出现的概率达到最大。
回归模型的统计检验:
一. 模型的拟合优度检验
所谓“拟合优度”,即模型对样本数据的近似程度。为了考察模型的拟合优度,需要构造一个数量指标--判断系数。
1. 总平方和分解公式
设估计的多元线性回归模型为:
因为:
其中的
所以:
记成: (*)
其中称为总平方和(或总离差平方和),它反映了解释变量y(关于均值)的总变化情况;称为回归平方和(或可解释平方和),它反映了变量的总变化情况,即y的变化中可以用回归模型(样本回归方程)来解释的部分,这部分变化实际上是由解释变量的变化引起的;称为残差平方和,它反映了回归模型的总拟合误差,即y的变化中不能用回归模型来解释的部分。
(*)式称为总平方和分解公式,它表明y的变化由两部分组成,一部分是模型中的将解释变量引起的变化,另一部分是模型之外其他因素引起的变化。
2. 判定系数
总平方和分解公式表明,在y的总变化中,被回归模型解释的部分越多,则模型的拟合误差相对来说就越小。对于一组确定的样本数据,总平方和是一个确定的数值,因此,可以用回归平方和占总平方和的比重作为衡量模型对样本拟合优度的指标,该指标称为判定系数(或可决系数),用符合表示,即:
显然,,并且当是,;因此,的值越接近于1,则表明模型对样本数据的拟合优度越高。
判定系数不仅反映了模型拟合程度的优劣,而且直观的经济含义:它定量地描述了y的变化中可以用回归模型来说明的部分,即模型的可解释程度。
值得说明的是,判定系数在数值上恰好等于相关系数的平方,判定系数也是衡量y与x之间的线性(因果)关系程度。
二. 模型的显著性检验
判定系数只能说明模型对样本数据的近似情况,但是建立计量经济模型的目的是为了描述总体的经济关系。所谓模型的显著性检验,就是检验模型对总体的近似程度,而且最常用的检验方法是F检验。
1.F检验
对于多元线性回归模型:
假设:
若假设成立,则意味着: 表明y的变化主要由模型之外的变量来决定,模型的线性关系不显著,所设定的模型没有意义。
在原假设成立的情况下,可以证明:
所以,对于给定的显著水平,可由F分布表查得临界值(注意是单侧检验),如果根据样本数据计算得出: 则拒绝原假设,即回归系数中有一个显著地不为0;此时可认为模型的线性关系式显著地。若,则接受,认为模型的线性关系不显著。
2. 检验与F检验的关系
F
F统计量与的关系
因此,F统计量是判定系数的单调增函数,当时,。 对于每一个临界值,都可以找到一个与之对应,当 时, 便有。可以说明以下几个问题:
F检验实际上也是判定系数的显著性检验;
如果模型对样本有较高的拟合优度,则F检验一般都能通过。
实际应用中不必过分苛求值的大小,重要的是考察模型的经济意思是否合理。
三. 解释变量的显著性检验
如果模型通过了F检验,则表明模型中所有解释变量对被解释变量的“总影响”是显著地,但并不意味着模型中的每一个解释变量对y都有重要影响,或者说并不是每个解释变量的单独影响都是显著的。
对于多元线性回归模型,为了检验某个解释变量对y是否有显著影响,可以建立原假设:
即假设对y没有显著影响。在确定系数的置信区间时曾经使用过的t统计量:
在假设的情况下,
因此,对于给定的显著水平,可以由t分布查得临界值,若,则表明原假设是一个错误的假设,应该拒绝,即认为系数显著地不等于0,对y有显著影响;反之,则认为影响不显著,应考虑将从模型中剔除而重新建立模型。
非线性回归模型:
前面讨论线性回归模型:
其结构具有两个特点:被解释变量y是解释变量的线性函数,即关于解释变量线性;被解释变量y也是参数的线性函数,即关于参数线性。
一. 可线性化模型
1. 倒数变换模型(双曲函数模型)
模型 设
即进行变量的倒数变换,就可以将其转化为线性回归模型,所以称该模型为倒数变换模型。
倒数变换模型有一个明显特征:随着x的无限增大,y将趋近于极限值a(或1/a),即有一个渐近下限或上限。
2. 双对数模型(幂函数模型)
模型
则将其转换成线性回归模型:
对于双对数模型,因为
因此,双对数模型中的回归系数b恰好就是被解释变量y关于解释变量x的弹性。
3. 半对数模型
模型
由于模型中只有某一侧的变量为对数形式,所以称半对数模型。
半对数模型中的回归系数b也有直观的含义:
对数函数模型中,
即x增加1%时,y将增长0.01b个单位。
指数函数模型中,
即x增加1个单位时,y将增加100b%。特别地,若x为时间变量(如年份),则系数b衡量了y的年均增长速度。
4. 多项式模型
模型 设
则 模型转化成多元线性回归模型
第三章回归模型的扩展
异方差性:
古典回归模型中包含了若干基本假定,在这些基本假定成立的前提下,应用最小二乘法可以得到无偏、有效的参数估计量,而且可以构造F检验、t检验、系数的标准误差等统计量来评价模型的优劣。但是,许多经济现象并一定都能满足这些假定,这必然会影响回归分析的估计和检验结果。
一. 异方差性及其产生的原因
对于线性回归模型:
同方差假定为:
即对于不同的样本点,随机误差项的离散程度是相同的,如果出现: 则称模型出现了异方差性。
模型产生异方差性主要有以下原因:
模型中遗漏了影响逐渐增大的因素。
模型函数形式的设定误差。
随机因素的影响。
经验表明,利用截面数据建立模型时,由于在不同样本点上(解释变量之外)其他因素影响的差异较大,所以比时间序列资料更容易产生异方差性。
二. 异方差性的影响
1. 最小二乘估计不再是有效估计,但仍然是无偏估计;
2. 无法正确估计系数的标准误差;
3. t检验的可靠性降低;
4. 增大模型的预测误差。异方差性的存在一方面使模型失去了良好的统计性质,另一方面由于随机误差项的方差与模型的预测区间密切相关,在逐渐增大的情况下,模型的预测误差也随着增大。
三. 异方差性的检验
为了检验模型是否存在异方差性,需要事先了解随机误差项取值的(概率)分布情况。但是随机误差项的变化是由模型之外的其他因素的综合影响来决定,其取值情况无法观测的。实际研究中,一般通过对残差分布情况的分析来推测随机误差项的分布特征,因为残差项描述的也是解释变量之外其他因素的综合影响,可以将其作为随机误差项的估计。
(一) 图示检验法
1.相关图分析
“方差”即为随机变量取值的离散程度。由于被解释变量y与误差项的方差相同,因此通过观察y与x的相关图,可以分析y的离散程度与解释变量之间是否存在着相关关系;如果随着x值的增加,y的离散程度呈现逐渐增大或减小的趋势,则表明模型存在着递增型或递减型的异方差性。
2. 残差分布图分析
建立回归模型后,在方程窗口中点击按钮可以得到模型的残差分布图,如果残差分布的离散程度有明显扩大的趋势,则表明存在着异方差性。注意观察之前需要将先将数据关于解释变量排序,命令格式为:
图示检验法只能粗略地判断模型是否存在异方差性,当异方差性不太明显时,还需要采用一些较为精确的检验方法。
(二) 戈德菲尔德--匡特检验
戈德菲尔德检验,简称为G-Q检验,原理:为了检验异方差性,将样本按解释变量排序后分成两部分,再利用样本1和样本2分别建立回归模型,并求出各自的残差平方和和。如果误差项的离散程度相同(即为同方差的),即与的值大致相同;若两者之间存在显著差异,则表明存在异方差性。检验过程中,为了“夸大”残差的差异性,一般先在样本中部去掉C个数据(通常取),再利用F统计量判断差异的显著性:
其中,一般取。对于给定的显著水平,若,则表明存在异方差性;反之,则不存在异方差性。
G-Q检验适用于检验样本容量较大,异方差性呈递增或递减的情况,而且检验结果与数据剔除个数C的选取有关。
(三) 怀特检验
检验是通过建立辅助回归模型的方式来判断异方差性。设回归模型为二元线性回归模型:,则检验的具体步骤为:
1. 估计回归模型,并计算残差的平方;
2. 估计辅助回归模型:即将残差平方关于所以解释变量的一次项、二次项和交叉项进行回归(其中,是满足古典回归模型假定的误差项)。实际上还可以引进解释变量的高次项,但这样会使样本的自由度大幅度下降,所以一般只引入二次项;而且在样本容量较小、解释变量个数相对较多的情况下,为了保证自由度,在辅助回归模型中可以省去交叉乘积项。
3. 计算辅助回归模型的判定系数。可以证明,在同方差的假设下(即假设),渐近地有: 其中,自由度为辅助回归模型中的自变量个数。
4. 对于给定的显著水平,若,则拒绝原假设,即认为中至少有一个显著地不等于0,模型存在异方差性;反之,则认为不存在异方差性。
利用软件可以直接进行检验。具体步骤为:
1. 建立回归模型:
2. 检验异方差性:在方程窗口中依次点击
实际应用中,一般是直接观察概率值的大小,若值较小,则拒绝不存在异方差性的假设,认为模型存在异方差性。
(四) 帕克检验和戈里瑟检验
帕克检验和戈里瑟检验的基本原理都是通过建立残差序列对解释变量的(辅助)回归模型,判断随机误差项的方差与解释变量之间是否存在较强的相关关系。
帕克检验的模型形式为:
戈里瑟建立是利用多个模型形式进行检验:
其中,是随机误差项。如果经检验某个方程是显著的,则表明随机误差项的方差(此时用来近似估计)随着解释变量取值的不同而变化,即存在异方差性。
这两种检验的特点是:不仅能检验异方差性,而且通过“实验”可以探测的具体形式,这有助于进一步研究如何消除异方差性的影响。
利用软件进行检验的步骤为:
利用软件进行检验的具体步骤为:
然后利用命令依次生成等序列,再分别建立与这些序列的回归方程。
四. 异方差性的解决方法
(一) 模型变换法
模型变换法的前提是要合理确定异方差性的具体形式,这可以通过对具体经济问题的经验分析,或者帕克检验、戈里瑟检验所提供的信息加以确定。
一般情况下,若,则在原模型的两端同时除以,就可以将模型转化成同方差模型,因此,仍然可以使用OLS方法估计(变换后)模型中的参数估计。
展开阅读全文