资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,1,本章要点,金融计量学的方法论与应用步骤。,金融数据的特点和来源,金融计量学软件的使用,2,第一节 金融计量学的含义及建模步骤,一、金融计量学的含义,金融计量学就是把计量经济学中的方法和技术应用到金融领域,即应用统计方法和统计技术解决金融问题。,3,二、金融计量建模的主要步骤,经济理论或金融理论,建立金融计量模型,数据收集,模型估计,模型检验,不通过 通过,重新建立模型 模型的应用,4,第一步,把需要研究的金融问题模型化;,第二步,收集样本数据;,第三步,选择合适的估计方法来估计模型;,第四步,对模型进行检验;,第五步,对模型进行相应的应用。,5,三、金融数据的主要类型、特点和来源,1.,金融数据的主要类型,时间序列数据(,Time series data,),是按照一定的时间间隔对某一变量在不同时间的取值进行观测得到的一组数据,例如每天的股票价格、每月的货币供应量、每季度的,GDP,、每年用于表示通货膨胀率的,GDP,平减指数等。,6,在分析时间序列数据时,应注意以下几点:,(,1,)在利用时间序列数据回归模型时,各变量数据的频率应该是相同的;,(,2,)不同时间的样本点之间的可比性问题;,(,3,)使用时间序列数据回归模型时,往往会导致模型随机误差项产生序列相关;,(,4,)使用时间序列数据回归模型时应特别注意数据序列的平稳性问题。,7,横截面数据(,Cross-sectional data,),是指对变量在某一时点上收集的数据的集合,例如,某一时间点上海证券交易所所有股票的收益率,,2004,年世界上发展中国家的外汇储备等。,平行数据(,Panel data,),是指多个个体同样变量的时间序列数据按照一定顺序排列得到的集合,,例如,30,家蓝筹股过去,3,年每日的收盘价。,8,2.,金融数据的特点,与一般宏观经济数据相比,金融数据在频率、准确性、周期性等方面具有自己特有的性质:,(,1,)金融数据可以更频繁地观察到,可用于计量分析的数据观测值个数可以成千上万,数量十分巨大;,(,2,)金融数据一般都能在交易时准确记录下来;,(,3,)金融数据一般也是不平稳的,但难以区分金融数据序列的随机游走、趋势以及其他的一些特征。,9,3.,金融数据的主要来源,政府部门和国际组织的出版物及网站,专业信息数据公司,,抽样调查,10,第二节,金融计量学软件简介,一、金融计量学主要软件简介,1.,金融计量分析的主要任务,从反映金融问题的大量数据中提取和归纳金融问题的客观规律性,进行解释和预测,为金融政策和金融实践提供依据。,为此,必须合理、科学地组织管理大量的数据信息,并用计量经济学或金融计量学的方法对这些数据进行一系列复杂的数值计算处理。,11,2.,分类(按操作的互动性与否分为),菜单模式,如,Microfit,命令行模式,如,Eviews,及介于二者之间的中间模式,12,3.,主要计量经济学软件,Eviews,软件,GAUSS,软件,LIMDEP,软件,Mathematica,软件,Matlab,软件,Microfit,软件,Minitab,软件,RATS,软件,SAS,软件,SHAZMA,软件,S-PLUS,软件,SPSS,软件,STATA,软件,TSP,软件,13,二、本课程所用软件,Microfit4.0,和,Eviews3.1,1.Microfit4.0,使用简介,以,Microfit4.0,版本为例。,1.,数据输入、修改及保存,14,图,1-2 Microfit 4.0,主界面,15,图,1-3,数据录入设定界面,16,图,1-4,变量定义、修改窗口,17,图,1-5,数据录入界面,18,2.,命令窗口及绘图,图,1-6 Microfit,命令窗口,19,图,1-7 19621972,年辞职率和失业率线性图,20,图,1-8 19621972,年辞职率和失业率散点图,21,3.,一个回归分析案例,图,1-9 Microfit,单方程回归分析窗口,22,图,1-10,最小二乘估计结果及相关统计量,23,图,1-11,四种假设检验的结果,24,(二),Eviews 3.1,使用简介,1.,数据输入、修改及保存,图,1-12 Eviews,新工作文件数据设定窗口,25,图,1-13,空白新工作文件,26,(二),Eviews3.1,使用简介,1.,数据输入、修改及保存,图,1-14,新工作文件数据导入窗口,27,图,1-15,数据导入后工作文件,28,图,1-16,察看数据窗口,29,图,1-17 GDP,和,M1,线性图,30,图,1-18,方程设定窗口,31,图,1-19,回归结果,32,本章小节,金融计量学是金融学的一个重要分支,金融问题的数量化研究是金融计量学的目的,包括金融模型的设计、建立、估计、检验及使用模型进行预测和政策策划的系列过程。金融理论的迅速发展、金融模型的不断推出、计算机技术的日益发展和计量软件的多样化都为现代金融的数量化研究提供了有力的工具,这些条件的结合形成了金融计量分析的基础。,33,本章简要阐述了金融计量学的方法和一般应用步骤,着重介绍了金融数据的类型和特点,简要评述了主要的计量和统计软件包,对常用的,Microfit,和,Eviews,计量软件的使用方法进行了详细讲解并举例说明。本章旨在使学生理解金融计量模型思想,了解金融数据的特点与来源,掌握常用的金融计量软件。,34,第二章 最小二乘法(,OLS,)和线性回归模型,35,本章要点,最小二乘法的基本原理和计算方法,经典线性回归模型的基本假定,BLUE,统计量的性质,t,检验和置信区间检验的原理及步骤,多变量模型的回归系数的,F,检验,预测的类型及评判预测的标准,好模型具有的特征,36,第一节 最小二乘法的基本属性,一、有关回归的基本介绍,金融、经济变量之间的关系,大体上可以分为两种:,(,1,)函数关系:,Y=f(X,1,X,2,.,X,P,),,其中,Y,的值是由,X,i,(,i=1,2.p,)所唯一确定的。,(,2,)相关关系,:Y=f(X,1,X,2,.,X,P,),,这里,Y,的值不能由,X,i,(,i=1,2.p,)精确的唯一确定。,37,图,2-1,货币供应量和,GDP,散点图,38,图,2-1,表示的是我国货币供应量,M2,(,y,)与经过季节调整的,GDP,(,x,)之间的关系(数据为,1995,年第一季度到,2004,年第二季度的季度数据)。,39,但有时候我们想知道当,x,变化一单位时,,y,平均变化,多少,可以看到,由于图中所有的点都相对的集中在图中直线周围,因此我们可以以这条直线大致代表,x,与,y,之间的关系。如果我们能够确定这条直线,我们就可以用直线的斜率来表示当,x,变化一单位时,y,的变化程度,,由图中的点确定线的过程就是回归。,40,对于变量间的相关关系,我们可以根据大量的统计资料,找出它们在数量变化方面的规律(即“平均”的规律),这种统计规律所揭示的关系就是,回归关系,(,regressive relationship,),所表示的数学方程就是,回归方程,(,regression equation,)或,回归模型,(,regression model,)。,41,图,2-1,中的直线可表示为,(,2.1,),根据上式,在确定,、,的情况下,给定一个,x,值,我们就能够得到一个确定的,y,值,然而根据式(,2.1,)得到的,y,值与实际的,y,值存在一个误差(即图,2-1,中点到直线的距离)。,42,如果我们以表示误差,则方程(,2.1,)变为:,即:,其中,t,(,=1,2,3,.,T,)表示观测数。,(,2.2,),(,2.3,),式(,2.3,)即为一个简单的双变量回归模型(因其仅具有两个变量,x,y,)的基本形式。,43,其中,y,t,被称作因变量,(,dependent variable,)、,被解释变量,(,explained variable,)、,结果变量,(,effect variable,);,x,t,被称作自变量,(,independent variable,)、解释变量,(,explanatory variable,)、,原因变量,(,causal variable,),44,、,为参数(,parameters,),或称回归系数(,regression coefficients,);,t,通常被称为随机误差项(,stochastic error term,),或随机扰动项(,random disturbance term,),简称误差项,,在回归模型中它是不确定的,服从随机分布(相应的,,y,t,也是不确定的,服从随机分布)。,45,为什么将,t,包含在模型中?,(,1,)有些变量是观测不到的或者是无法度量的,又或者影响因变量,y,t,的因素太多;,(,2,)在,y,t,的度量过程中会发生偏误,这些偏误在模型中是表示不出来的;,(,3,)外界随机因素对,y,t,的影响也很难模型化,比如:恐怖事件、自然灾害、设备故障等。,46,二、参数的最小二乘估计,(,一,),方法介绍,本章所介绍的是,普通最小二乘法,(,ordinary least squares,简记,OLS,),;,最小二乘法的基本原则是:最优拟合直线应该使各点到直线的距离的和最小,也可表述为距离的平方和最小。,假定根据这一原理得到的,、,估计值为 、,则直线可表示为,。,47,直线上的,y,t,值,记为 ,称为拟合值(,fitted value,),实际值与拟合值的差,记为 ,称为,残差,(,residual,),可以看作是随机误差项 的估计值。,根据,OLS,的基本原则,使直线与各散点的距离的平方和最小,实际上是使残差平方和(,residual sum of squares,简记,RSS,)最小,即最小化:,RSS=,(,2.4,),48,根据最小化的一阶条件,将式,2.4,分别对、求偏导,并令其为零,即可求得结果如下,:,(,2.5,),(,2.6,),49,(二)一些基本概念,1.,总体(,the population,)和样本(,the sample,),总体是指待研究变量的所有数据集合,可以是有限的,也可以是无限的;而样本是总体的一个子集。,2,、总体回归方程(,the population regression function,,简记,PRF,),样本回归方程(,the sample regression function,,简记,SRF,)。,50,总体回归方程(,PRF,)表示变量之间的真实关系,有时也被称为数据生成过程(,DGP,),,PRF,中的,、,值是真实值,方程为:,+,(,2.7,),样本回归方程(,SRF,)是根据所选样本估算的变量之间的关系函数,方程为:,注意:,SRF,中没有误差项,根据这一方程得到的是总体因变量的期望值,(,2.8,),51,于是方程(,2.7,)可以写为:,(,2.9,),总体,y,值被分解为两部分:模型拟合值()和残差项()。,52,3.,线性关系,对线性的第一种解释是指:,y,是,x,的线性函数,比如,,y=,。,对线性的第二种解释是指:,y,是,参数,的一个线性函数,它可以不是变量,x,的线性函数。比如,,y=,就是一个线性回归模型,但 则不是。,在本课程中,线性回归一词总是对指参数,为线性的一种回归(即参数只以一次方出现),对解释变量,x,则可以是或不是线性的。,53,有些模型看起来不是线性回归,但经过一些基本代数变换可以转换成线性回归模型。例如,,(,2.10,),可以进行如下变换:,(,2.11,),令 、,则方程,(,2.11,)变为:,(,2.12,),可以看到,模型,2.12,即为一线性模型。,54,4.,估计量(,estimator,)和估计值(,estimate,),估计量是指计算系数的方程;而估计值是指估计出来的系数的数值。,55,三、最小二乘估计量的性质和分布,(一)经典线性回归模型的基本假设,(,1,),即残差具有零均值;,(,2,),var 30,),并且要求满足,条件,:观测值的数目至少是参数的二倍;随机项没有自相关并且服从正态分布。,统计假设:零假设 :是同方差(,i=1,2,n,),备择假设 :具有异方差,135,Goldfeld-Quandt,检验法涉及对两个最小二乘回归直线的计算,一个回归直线采用我们认为随机项方差较小的数据,另一个采用我们认为随机项方差较大的数据。如果各回归直线残差的方差大致相等,则不能拒绝同方差的原假设,但是如果残差的方差增加很多,就可能拒绝原假设。步骤为:,136,第一步,处理观测值。,将某个解释变量的观测值按由小到大的顺序排列,然后将居中的,d,项观测数据除去,其中,d,的大小可以选择,比如取样本容量的,1/4,。再将剩余的(,n-d,)个数据分为数目相等的二组。,137,第二步,建立回归方程求残差平方和。,拟合两个回归模型,第一个是关于较小,x,值的那部分数据,第二个是关于较大,x,值的那部分数据。每一个回归模型都有,(n-d)/2,个数据以及,(n-d)/2-2,的自由度。,d,必须足够小以保证有足够的自由度,从而能够对每一个回归模型进行适当的估计。,对每一个回归模型,计算残差平方和:记 值较小的一组子样本的残差平方和为,=,,值较大的一组子样本的残差平方和为,=,。,138,第三步,建立统计量。,用所得出的两个子样本的残差平方和构成,F,统计量:,若零假设为真,则上式中,n,为样本容量(观测值总数),,d,为被去掉的观测值数目,,k,为模型中自变量的个数。,139,第四步,得出结论。,假设随机项服从正态分布(并且不存在序列相关),则统计量,/,将服从分子自由度和分母自由度均为()的,F,分布。,对于给定的显著性水平,如果统计量的值大于上述,F,分布的临界值,我们就拒绝原假设,认为残差具有异方差性。否则,就不能拒绝原假设。,140,(二),Spearman rank correlation,检验法,首先引入定义,Spearman,的等级检验系数:,其中 表示第,i,个单元或现象的两种不同特性所处的等级之差,而,n,表示带有级别的单元或现象的个数。,在这里,我们假设模型为:,141,第一步,运用,OLS,法对原方程进行回归,计算残差 ,,i=1,,,2,n,。,第二步,计算,Spearman,等级相关系数。将 和解释变量观察值 按从小到大或从大到小的顺序分成等级。等级的大小可以人为规定,一般取大小顺序中的序号。如有两个值相等,则规定这个值的等级取相继等级的算术平均值。,然后,计算 与 的等级差 ,的等级 的等级。最后根据公式计算,Spearman,等级相关系数。,142,第三步,对总体等级相关系数 进行显著性检验 :,0,,:,0,。样本 的显著性可通过,t,检验按下述方法加以检验:,t,对给定的显著水平 ,查,t,分布表得 的值,若,,表明样本数据异方差性显著,否则,认为不存在异方差性。,对于多元回归模型,可分别计算 与每个解释变量的等级相关系数,再分别进行上述检验。,143,(三),Park,检验法,Park,检验法就是将残差图法公式化,提出 是解释变量 的某个函数,然后通过检验这个函数形式是否显著,来判定是否具有异方差性及其异方差性的函数结构。该方法的主要步骤如下:,第一步,建立被解释变量,y,对所有解释变量,x,的回归方程,然后计算残差 (,i=1,2,n,),第二步,取异方差结构的函数形式为 ,其中,和 是两个未知参数,是随机变量。写成对数形式则为:。,144,第三步,建立方差结构回归模型,同时用 来代替 ,即 。对此模型运用,OLS,法。对 进行,t,检验,如果不显著,则没有异方差性。否则表明存在异方差。,Park,检验法的优点是不但能确定有无异方差性,而且还能给出异方差性的具体函数形式。但也有质疑,认为 仍可能有异方差性,因而结果的真实性要受到影响。,145,(四),Glejser,检验法,这种方法类似于,Park,检验。首先从,OLS,回归取得残差 之后,用 的绝对值对被认为与 密切相关的,X,变量作回归。,有如下几种函数形式(其中 是误差项):,146,Glejser,检验方法的优点是允许在更大的范围内寻找异方差性的结构函数。缺点是难于确定 的适当的幂次,这往往需要进行大量的计算。从实际方面考虑,该方法可用于大样本,而在小样本中,则仅可作为异方差摸索的一种定性技巧。,147,(五),Breusch-Pagan,检验法,该方法的基本思想是构造残差平方序列与解释变量之间的辅助函数,得到回归平方和,ESS,,从而判断异方差性存在的显著性。,设模型为:,(,3.7,),并且,(,3.8,),在式(,3.8,),中 表示是某个解释变量或全部。,148,提出原假设为 ,,具体步骤如下:,第一步,用,OLS,方法估计式(,3.7,),中的未知参数,得,(,3.9,),和 (,n,为样本容量)(,3.10,),第二步,构造辅助回归函数,(,3.11,),式中 为随机误差项。,149,第三步,用,OLS,方法估计式(,3.11,),中的未知参数,计算解释的平方和,ESS,,可以证明当有同方差性,且,n,无限增大时有,第四步,对于给定显著性水平 ,查 分布表得 ,比较 与 ,如果,,则拒绝原假设,表明模型中存在异方差。,150,(六),White,检验,White,检验的提出避免了,Breusch-Pagan,检验一定要已知随机误差的方差产生的原因,并且要求随机误差服从正态分布。,White,检验与,Breusch-Pagan,检验很相似,但它不需要关于异方差的任何先验知识,只要求在大样本的情况下。,下面是,White,检验的基本步骤:,设二元线性回归模型为,(,3.12,),151,异方差与解释变量的一般线性关系为,第一步,用,OLS,法估计式,3.3,的参数 。,第二步,计算残差序列 和 。,第三步,求 对 ,的线性回归估计式,即构造辅助回归函数。,第四步,计算统计量 ,其中,n,为样本容量,为辅助回归函数中的决定系数。,152,第五步,在的 原假设下,服从自由度为,5,的 分布,给定显著性水平 ,查分布表得临界值 ,比较 与 ,如果前者大于后者,则拒绝原假设,表明式(,3.12,)中随机误差存在异方差。,此外,由于金融问题研究中经常需要处理时间序列数据,当存在异方差性的时候,可考虑用,ARCH,方法检验。检验异方差的方法多种多样,可以根据所研究问题的需要加以选择,也可以同时选择不同的方法,对检验结果进行分析比较,以求得出更准确的结论。,153,第三节 异方差的修正,异方差性虽然不损坏,OLS,估计量的无偏性和一致性,但却使它们不再是有效的,甚至不是渐近(即在大样本中)有效的。参数的显著性检验失效,降低了预测精度。故而直接运用普通最小二乘法进行估计不再是恰当的,需要采取相应的修正补救办法以克服异方差的不利影响。,其基本思路是变异方差为同方差,或者尽量缓解方差变异的程度。,在这里,我们将会遇到的情形分为两种:当误差项方差为已知和当为未知。,154,一、当为 已知:加权最小二乘法 (,weighted least squares,WLS,在同方差的假定下,对不同的 ,偏离均值的程度相同,取相同权数的做法是合理的。但在异方差情况下,则是显而易见的错误,因为的 方差在不同的 上是不同的。比如在递增异方差中,对应于较大的,x,值的估计值的偏差就比较大,残差所反映的信息应打折扣;而对于较小的,x,值,偏差较小,应给予重视。,155,所以在这里我们的办法就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。,156,可以考虑用 作为 的权数。,于是加权最小二乘法可以表述成使加权残差平方和,达到最小。,157,二、当 为未知,已知真实的 可以用,WLS,得到,BLUE,估计量。但现实中多数情况下是未知的,所以还要考虑别的方法来消除异方差。一般来讲,可以将异方差的表现分为这样几种类别。我们以,为模型。,(,一,),正比于 :,可对原方程做如下变换:,158,(,二,),正比于 :,就可将原始的模型进行入下变换,(三)正比于,Y,均值的平方:,将原模型进行如下变换:,159,在上述变换中,都可以看到对的形式采取的是一种猜测的态度,即我们也不能肯定采取哪种变换更有效。同时这些变换可能还有其他的一些问题:,1.,当解释变量多于,1,个时,也许先验上不知道应选择哪一个,X,去进行变换;,2.,当 无法直接得知而要从前面讨论的一个或多个变换中做出估计时,所有用到,t,检验,F,检验等的检验程序,都只有在大样本中有效。,3.,谬误相关的问题。,160,三、模型对数变换法,仍以模型 为例,变量 和 分别用 和 代替,则对模型,进行估计,通常可以降低异方差性的影响。,原因?,161,第四节 金融实例分析,例,3-1,纽约股票交易所(,NYSE,)与美国证券交易委员会(,SEC,)关于经济佣金率放松管制的争论,其中异方差的检验与修正在证明规模效应存在与否起着重要的作用。,162,下面通过一个具体金融案例来讨论异方差的检验与修正过程:,根据北京市,1978-1998,年人均储蓄与人均收入的数据资料,若假定,X,为人均收入(元),,Y,为人均储蓄(元),分析人均储蓄受人均收入的线性影响,可建立一元线性回归模型进行分析。,设模型为,163,图,3-3 Eviews,回归结果,1,用,OLS,估计法估计参数,164,图,3-4,残差图,(,1,)图示法,165,(,2,),Goldfeld-Quandt,检验,按前述检验方法,对,19781985,与,19911998,年时间段的数据进行,OLS,方法检验,求出,F,统计量,查表得是否存在异方差,166,(,3,),ARCH,检验,图,3-5 ARCH,检验结果,167,异方差的修正:,WLS,法,图,3-6 WLS,估计结果,168,对数变换法,图,3-7,对数变换估计结果,169,第五节 自相关的概念和产生原因,为了能更好地说明自相关问题,我们以一个金融案例来开始本章余下三节的学习,并将在下面反复用到这个例子。,例,:,利率的变化,我们将用工业生产指数(,IP,),货币供应量增长率(,GM2,),以及通胀率(,GPW,)的函数来解释国债利率,R,的变化。,170,R=3,个月期美国国债利率。为年利率的某一百分比,IP,联邦储备委员会的工业生产指数,(1987=100),M2=,名义货币供给、以十亿美元为单位,PW,所有商品的生产价格指数,(1982=100),171,用于回归模型的货币与价格变量是:,回归方程是:,(,括号中为,t,统计量,),(,2.84,)(,8.89,)(,3.91,)(,6.15,),=0.22 DW=0.18 S=2.458 Mean=6.07,172,一、滞后值与自相关的概念,在阐释自相关概念之前,先介绍滞后值的概念。一个变量的滞后值是这个变量在一段时间前的取值。举个例子:滞后一期的取值,记为 。,y,的一阶差分,记为,是用,y,的当期值减去前一期的值:,以此类推,可以得到滞后二期,滞后三期值。,173,表,3-1,当期值、滞后值、差分的关系,1990.1,0.8,1990.2,1.3,0.8,0.5,1990.3,-0.9,1.3,-2.2,1990.4,0.2,-0.9,1.1,1990.5,-1.7,0.2,-1.9,1990.6,2.3,-1.7,4.0,1990.7,0.1,2.3,-2.2,1990.8,0.0,0.1,-0.1,174,回到自相关问题,在回归模型:,经典线性回归模型(,CLRM,)的基本假设第三条是:,若此假设被破坏,即,随机误差项,u,的取值与它的前一期或前几期的取值(滞后值)有关,则称误差项存在序列相关或自相关。,自相关有正相关和负相关之分。实证表明:在经济数据中,常见的是正自相关。,175,(,a,)正自相关,176,(,b,)负自相关,177,(,c,)无自相关,178,二、自相关产生的原因,1.,经济数据的固有的惯性(,inertia,)带来的相关,2.,模型设定误差带来的相关,3.,数据的加工带来的相关,179,第六节 自相关的度量与后果,一、自相关的度量,假定存在自相关,若 的取值仅与前一期 有关,即,=f(),则称这种自相关为一阶自相关。对于一般经济现象而言,两个随机项在时间上相隔越远,前者对后者的影响越小。如果存在自相关的话,最强的自相关应该是一阶自相关。这里,我们只讨论一阶自相关,并且假定这是一种线性自相关,具有一阶线性自回归,AR(1),的形式:,180,式中 为常数,称为自相关系数。是一个新随机项,它满足经典回归的全部假定。,上式可以看成是一个一元回归模型。是因变量,是自变量,是回归系数。可用,OLS,法估计 :,181,当,0,时,为正相关,,0.8,),或,F,检验值显著,但单个解释变量系数估计值却不显著;或从金融理论知某个解释变量对因变量有重要影响,但其估计值却不显著,则可以认为存在严重的多重共线性问题。,若两个解释变量之间的相关系数高,比如说大于,0.8,,则可以认为存在严重的多重共线性。,215,判断多重共线性的存在范围,要确定多重共线性是由哪些主要变量引起的,可以采用,辅助回归法,(,auxiliary regression method,)。所谓辅助回归是指某一解释变量对其余解释变量的回归,区别于因变量对所有解释变量回归的主回归(,main regression,)。,辅助回归法构造的检验统计量定义如下:,服从自由度为,k-1,与,n-k,的,F,分布,其中 (,i=1,2,k,)为第,i,个解释变量 关于其余解释变量的辅助回归的拟和优度,,k,为解释变量的个数,,n,代表样本容量。,216,检验多重共线性的表现形式,当确定多重共线性是由哪些主要变量引起后,若要找出与主要变量有共线性的解释变量,即确定多重共线性的表现形式,可采用,偏相关系数法,。解释变量 与 偏相关系数即是在其它的解释变量固定的情况下它们之间的相关系数。,偏相关系数法构造的检验统计量定义如下:,,服从自由度为,n-k-1,的,t,分布,其中,n,为样本容量,,k,为解释变量的个数,为 与 的偏相关系数。若 显著不为零,则认为 、是引起多重共线性的原因,否则不是。,217,多重共线性的修正,如前所述,多重共线性在金融数据中是普遍存在的,是否对多重共线性采取修正措施取决于多重共线性的严重程度。,若多重共线性程度较轻微,并不严重影响系数估计值(符号正确,,t,值显著),则可以忽略多重共线性问题。若多重共线性对重要因素的系数估计值有严重的影响,则必须进行补救。,采取何种补救措施,则取决于多重共线性因素的重要性、其它数据来源的可用性、所估计模型的目的以及其它需要考虑的事项。以下将介绍几种补救措施。,218,多重共线性的修正,一、删除不必要的变量,如果在产生多重共线性的因素中有相对不重要的变量,则可试着将其删除,这是解决多重共线性最简单的方法,但删除变量也可能会导致新问题的产生:,(,1,)被删除变量对因变量的影响将被其它解释变量和随机误差项所吸收,这可能一方面解决了一部分变量的多重共线性问题,但另一方面却又同时增强了另一部分变量的多重共线性问题,而且,还可能使随机误差项的自相关程度增强。,(,2,)删除某个变量可能会导致,模型设定误差,(,specification error,)。所谓模型设定误差,指的是在建立回归模型的过程中,因为错误设定模型结构而产生的误差。错误的删除解释变量将会导致最小二乘估计值是有偏的。,219,二、改变解释变量的形式。,1,、,差分法,对于时间序列数据而言,若原始变量存在严重的多重共线性,则可以考虑对变量取差分形式,可在一定程度上降低多重共线性的程度。例如对于模型 ,可把变量变换为差分形式:,2,、,指数增长率方法,例如研究三种指数 关系时,可用如下模型:,220,3,、,以比率代替高度相关的变量,若模型中存在高度相关的变量,在不违反金融理论的前提下,可以求得两者之间的比率,并以此比率代替相应变量出现在模型中。,例如对于模型 ,若 与 之间高度相关,且模型的目的是用于预测,则可令 ,则,可在一定程度上消除多重共线性,此外,当模型中有 较多解释变量的滞后值,并存在严重多重共线性时,可以考虑用被解释变量的滞后值代替解释变量的滞后值;以人均形式的变量代替总体变量在某些状况下也可以在一定程度上降低多重共线性的程度。,221,多重共线性的修正,三、补充新数据。,由于多重共线性是一样本特征,故有可能在关于同样变量的另一样本中共线性没有第一个样本那么严重。,Christ(1966),认为:解释变量之间的相关程度与样本容量成反比,即样本容量越小,相关程度越高;样本容量越大,相关程度越小。因此,收集更多观测值,增加样本容量,就可以避免或减轻多重共线性的危害。,222,多重共线性的修正,四、利用先验信息法。,这里的先验信息,包括从金融理论以及实际统计资料所获得的解释变量或所估计参数之间的关系。若发生多重共线性的那些解释变量之间的关系可由先验信息得到,则在所研究的模型中利用这种关系,便可以减轻多重共线性的程度。,223,金融数据的多重共线性处理,:,示例,理论上,股票代表着对公司未来现金流的所有权,因此,公司未来的收益以及利息是股票价格的决定因素。而宏观经济形势能够影响到公司未来的收益,进而对股票价格产生影响。同时宏观经济形势也能够通过其它的一些渠道直接对股票价格产生影响。我们将以整个股票市场为研究对象,来考虑影响股票价格指数的宏观经济因素以及它们的影响程度。我们将采取从一般到特别的建模方式,即首先将模型中包含尽可能多的变量,然后通过各种检验逐步剔出对因变量没有解释能力的变量。,224,对影响股票价格指数宏观经济因素的实证分析,我们选择上证综指,(,以,Y,表示,),作为股票价格指数的代表。对于影响股票价格指数的宏观经济因素,初步选定如下的十个宏观变量:居民消费物价指数、商品零售物价指数、企业商品价格指数、工业增加值、固定资产投资、社会消费品零售总额、股市成交量、外汇市场交易量、汇率、货币供应量,m1,、进出口额。分别以 至 代表。其中前三个价格指数从不同侧面反映了我国的市场环境,而则从不同侧面反映了整体经济状况,反映了我国金融环境的影响,股市成交量从一个侧面反映了股市状况。我们采用的数据是从,2000.1,2004.9,月的月度数据,对于价格指数变量以及汇率,我们以原变量形式进入模型,而对于其它变量,我们取其对数形势进入模型。,225,在对数据调整后,我们建立如下的模型:,利用普通最小二乘法回归方程,得到如下的结果:,去掉不显著的变量,对模型重新回归得到:,226,在,10%,的显著性水平下,变量系数估计值的,t,值都是显著的,模型的,=0.78,,,=0.75,,总体上看模型是不错的。尽管估计值的,t,值是显著的,我们仍来检验该模型解释变量之间是否存在多重共线性,因为若两个变量之间存在高度相关并且符号相反,他们的作用就会相互抵消,从而有可能两个变量都是显著的。,首先,根据 和,t,值,我们无法发现多重共线性,因此我们将利用变量之间的相关系数来判断。,227,在,Eviews,软件中,要获得检验解释变量两两之间的相关系数矩阵是很容易的,我们只需在命令窗口中键入“,COR”,命令以及相应的解释变量。,图,4-1,相关系数矩阵,228,分别删除 、再进行回归得到的结果如下:,图,4-2,删除 后的回归结果,229,图,4-3,删除 后的回归结果,230,分别删除,X,6,、,X,10,后得到的结果如下:,图,4-4,删除,X,6,后的回归结果,231,图,4-5,删除,X,10,后的回归结果,232,最后得到的模型是:,我们之所以在原回归方程系数估计值都显著的情况下仍进行多重共线性检验,并删除一些变量,是因为在金融计量学中,在保证模型一定解释能力的情况下,尽可能的使模型简洁,是我们应该始终坚持的一个原则。,在这个例子中,我们仅考虑了对模型解释变量的多重共线性检验,在实际建模以及估计过程中,还应该考虑模型的自相关性、异方差性等的检验。,233,虚拟变量模型,在本章余下的四节中,我们将讨论虚拟变量在回归分析中的应用。,虚 拟变量既可以作为解释变量出现在模型中,也可以作为因变量出现在模型中,我们统称这类含虚拟变量的经济计量模型为虚拟变量模型。,234,虚拟变量的性质,在金融计量学中,所考虑的变量除了可以直接度量的数量变量(如价格、收益、收入等)之外,还有实质上是定性性质的变量,如性别、国家、战争及政府经济政策的变动等。这类定性变量常指某一性质、属性出现或不出现,例如男性或女性,中国人或外国人,战争期间或非战争期间等。由于其不能直接度量,为研究方便,可构造一个变量,令其取值为,1,或为,0,,取值为,0,时表示某一性质出现(不出现),取值为,1,时表示某性质不出现(出现),该变量即为,虚拟变量,(,dummy variables,)。,235,一般的,在虚拟变量的设置中,基础类型、否定类型取值为“,0”,,称为基底(,base,)类、基准(,benchmark,)类或参考(,reference,)类;而比较类型、肯定类型取值“,1”,。,虚拟变量和定量变量在回归模型中的应用是一样的。若一个模型中的解释变量全部都是虚拟变量,则此模型被称为,方差分析模型,(,Analysis of Variance Model,);若解释变量中既有定量变量,又有虚拟变量,则该线性回归模型可称为,协方差分析模型,(,Analysis of Covariance Model,)。,236,例子,在我国上市公司中,个人做第一大股东的现象还非常少,主要是国家或法人作为公司的第一大股东。而国家作为第一大股东与法人相比,除了公司业绩,还有其它考虑,例如就业、形象工程、负责人升迁、上缴利税等,这些目标都或多或少有悖于公司利润最大化的目标。另外,国家控股的公司由国家选择代理人,而这些代理人往往是行政人员或官僚出身,没有经营管理的特长,进一步制约上市公司绩效的发挥。因此,总体而言,国家作为第一大股东的上市公司的绩效要低于法人做第一大股东的上市公司的绩效。为验证上述结论,我们建立如下的模型:,237,其中 为每股收益,用以代表公司绩效。的定义方式如下:,1,,国家是公司,i,的第一大股东,=,0,,法人是公司,i,的第一大股东,由模型可以得到:,国家为第一大股东平均每股收益:,=,法人为第一大股东平均每股收益:,=0)=,238,虚拟变量的设置原则,许多金融现象表明,金融数据特别是时间序列数据常因某些非正常因素(如战争、自然灾害等)而产生较大的波动,这种波动使得被解释变量与解释变量之间的数量依存关系在某一期或暑期内同其它各期相比具有显著的差异。这种差异表现为描述变量之间关系的回归线(面)在不同时期内或截距项移动,或斜率移动,或截距项和斜率同时移动。,239,相应的,为表述这种移动,虚拟变量的引入方式也有如下的三种:,(,1,)加,法方式:,(,2,)乘法方式:,(,3,)同时以加法方式及乘法方式引入:,在同一个模型中,可以引入多个虚拟变量,但其设置必须遵循如下的原则:如果一个定性变量有,m,个类别,则仅要引入,m-1,个虚拟变量。,240,虚拟变量模型的运用,1,、虚拟变量模型在调整季节波动中的运用,许多按月度或季度数据表示的金融时间序列,常呈现出季节变化的规律性,如公司销售额、通货膨胀率、节假日储蓄额等。在研究中,有时需要消除季节性因素的影响,即需要进行,季节调整,(,seasonal adjustment,)。进行季节调整有多种方法,而利用虚拟变量进行季节调整是较为简单的一种。,原模型:,引入虚拟变量:,241,2,、虚拟变量模型在分段线性回归中的应用,在金融理论中,常常会出现一种情况:当某影响因素越过某一
展开阅读全文