收藏 分销(赏)

第2章平稳时间序列模型.doc

上传人:xrp****65 文档编号:7016337 上传时间:2024-12-24 格式:DOC 页数:26 大小:874.50KB
下载 相关 举报
第2章平稳时间序列模型.doc_第1页
第1页 / 共26页
第2章平稳时间序列模型.doc_第2页
第2页 / 共26页
点击查看更多>>
资源描述
第二章 平稳时间序列模型 本章将介绍Box-Jenkins方法,主要包括一元平稳时间序列的识别、估计、诊断和预测方法。 2.1 平稳性 考虑时间序列,对任何整数,可得到一个随机向量。要想确定所有随机向量的分布是不可能的(虽然理论上存在),但可以确定 和协方差 一个随机过程的线性性质可由均值和协方差来描述。如果这个过程是正态过程,则是维正态分布,可以完全刻画这个随机过程的分布性质。如果没有正态性质,但生成过程是线性的,则在它的均值和方差中可获得关于这个过程的更多的重要特征。 下面的问题是如何来估计,对于一些过程我们可以得到大量的实现(反复做观测)那么,的估计是 但对大多数过程来说,得不到更多的实现。如,不可能把经济停下来,然后重新开始观测。对一个实现,不可能估计出。 为了克服这个困难,时间序列分析要做如下的假设:均值和方差不随时间而改变。 如果对任何t, t-s, 都有 这里 都是常量,与时间无关,是依赖于的常量。这样的随机过程称为协方差平稳。可以简单地说,如果一个时间序列的均值和协方差不受时间变化影响,则称这个时间序列是协方差平稳。在一些文献中,协方差平稳的过程也称为弱平稳,二阶矩平稳或宽平稳过程。(注意一个强平稳过程不一定有有限的均值和方差)。 一个更进一步的假设是这个随机过程是遍历的(ergodic)。这是一个较难理解的一个概念。遍历性是指:如果一个过程对于时间间隔充分远的值之间几乎是无关的,使得这个序列通过时间来平均,总有新的有用的信息增加到平均值中。因此,按时间平均 是总体均值的无偏、一致估计。即。同理,的估计也是一致的。 因此,如果有平稳性和遍历性的假设,利用关于时间的平均,就可以得到较好的估计。遍历性的一个必要条件(但不充分)是。 对于一个协方差平稳的序列,和之间的自相关系数可定义为 因此, 之间的自相关系数与之间的自相关系数相同,显然。序列描述了这个过程的一个值与先前的值的相关程度,所以自相关系数可用来测量过程本身的记忆性的长度和强度,即在时刻t的值与时刻t-s 的值的相关程度。的图形被称为相关图。用来刻画这个过程生成机制的线性性质。 2.2 白噪声 一个基本的时间序列:白噪声。一个序列被称为白噪声序列如果序列中每个元素都有零均值,常数方差,序列是不相关的,即 对任何t 对任何t 对任何t, s (st) 2.3 自回归模型 如果一个时间序列可表示成 是零均值白噪声 则称为一阶自回归过程。记为~。由Yule (1927) 引入,起源于实践。如,每月的失业人数可认为是上月失业人数的一个固定比例,加上寻求职业的工人数。如果这些人数形成一个白噪声序列,那么,失业序列就是一阶自回归。 一些经济时间序列可认为是由下列机制生成: 处值=处值的期望+误差项 误差项通常取为白噪声序列。如果将处值的期望取为期值的固定比例,这时就是一阶自回归。如果将处值的期望取为过去值的加权平均 称为阶自回归过程。记为~。 如果过程是平稳的,的根必须在单位园外。这里。 用滞后算子表示为 ,它的一般解为 。如果平稳性条件成立,则。这里,。特别地,如果~那么,,所以, (2.3.1) 如果,则,由此可看出,如果,的解具有发散性质。 2.4 运动平均模型 设是零均值白噪声序列,则序列 比原来的白噪声序列更光滑些。更一般的运动平均的模型是 对每个t, 是由和分别相乘求和而得到。按这样方式构成的序列被称为阶为q的运动平均,记为~MA(q)。 对一阶运动平均,如果,则它比白噪声更光滑, 随着增加,光滑性增加。 虽然是白噪声序列,如果中有2个或2个以上不为零,则将不是白噪声序列。 运动平均过程由Yule (1926)引出,Wold (1938)进行了详细地研究。如果一个经济变量处在均衡中, 如果受到来自经济系统内部(或外部)不可预期事件的冲击而偏离原来状态。如果本系统并不能立刻吸收这些冲击效应,那么,将出现一个运动平均模型。 如,一个小型商品市场得到了一系列关于农产品状况的信息, 一条特别新闻对价格有即时影响,也有不同程度的滞后影响,令表示价格在t 处的变化,假设这种冲击影响价格变化,直到q 天以后这种冲击影响消失。 这时,较适当的模型是MA(q) 如果),即天前的影响是,则 , 由(2.3.1),可表示成 这时,过程等价于过程。 由2.3节知道,平稳的过程可以写成,那么,过程是否可以写成? 对于过程, 如果平稳性条件成立,即的根在单位园外(称为可逆性),则过程可以写成过程。 2.5 ARMA 模型 将自回归模型和运动平均模型结合起来, (2.5.1) 总可以将标准化成1,如果自回归部分和运动平均部分的滞后阶数分别为p,q,模型被称为ARMA(p,q)。如果q=0,这过程被称为自回归过程AR(p), 如果p=0, 这过程是运动平均过程MA(q)。在ARMA模型中,允许p,q是无限的。用滞后算子表示为 这里。 这时容易知道: (1) 如果的根在单位园外,则过程是平稳的。 (2) 如果过程是平稳的,则有一个等价的过程。 (3) 如果的根在单位园外(通常称为可逆性条件),则有一个等价的过程。 这说明,一个平稳的ARMA过程可以由高阶MA 过程来逼近。如果过程满足可逆性条件, 这过程可由高阶AR 过程来逼近。 对于AR(1)模型,运动平均表示为 对于一般的ARMA(p,q)模型(2.5.1),用滞后算子表示为 的解为 上式可表示成MA()过程的条件是:多项式的根必须在单位圆外。 2.6 自相关函数 Box-Jenkins(1976)在识别和估计时间序列时,给出了非常有用的工具是自协方差和自相关。如AR(1)模型 每个除,得到自相关。对于AR(1)过程,平稳的必要条件是。因此,相对 s的图形称为自相关函数(ACF), 如果这个序列是平稳的,这个自相关函数是几何收敛到零。如果是正的,则这个自相关函数直接收敛到零。如果是负的,这个自相关函数按振荡的方式收敛到零。 AR(2)过程的自相关函数 (2.6.1) 这里省略了截距项,这是因为截距不影响ACF。下面利用Yule-Walker方程的方法:对s=0,1,2,…用分别乘方程(2.4.1)两边,并取期望,可得 由于 ,可得 (2.6.2) (2.6.3) (2.6.4) 用除方程(2.6.3),(2.6.4)得 (2.6.5) (2.6.6) 由,有,因此,利用方程(2.6.6)可求出所有。 对于二阶过程的平稳性限制条件是的根在单位圆外,如果根是实的,自相关按指数衰减;如果根是复的,自相关按震荡式衰减。 MA(1)过程的自相关函数 下面考虑MA(1)过程。用乘方程两边,并取期望,可得Yule-Walker方程 并 , 用除可得ACF:。 下面求MA(q) 过程,的自相关函数。 所以, 。 因此,对充分大的。 下面求ARMA(1,1)过程的自相关函数 考虑ARMA(1,1)过程,可同样求出Yule-Walker方程: 因此, 。 因此,ARMA(1.1)的ACF类似于AR(1)的ACF。如果收敛是直接的,如果,收敛是振荡的。 2.7 偏自相关函数 为了说明偏自相关函数的作用,考虑自回归过程AR(p) 则有,两端同除得 对任何随机过程,偏自相关被定义为下面方程的解: 因而,对任何阶为p的自回归过程,偏自相关,阶数大于p的偏自相关为零。 在AR(1)过程中,虽然没有直接出现在模型中,但是相关的。之间的相关性等于之间的相关性再乘以之间的相关性,即。所有这些间接相关性都在ACF中给出。 相反, 之间的偏自相关不依赖于 之间的们的相关性。对于AR(1)过程,之间的偏自相关等于零。 求偏自相关函数的直接方法是:首先从序列中减去序列的平均值,获得一个新序列,然后构造一阶自回归 , 这里是误差项,可以不是白噪声。这时,既是之间的 自相关也是偏自相关。构造二阶自回归 是之间的偏自相关函数。即是之间除去的影响后的相关系数。 重复这个过程得到偏自相关函数(PACF)。在实际中,如果时间序列的样本大小为T,只有T/4的滞值可用来计算这个序列的样本PACF。 因为大多数统计计算软件包都有相应程序。但基于Yule-Walker方程的计算方法是简单、可行的。 也可以利用自相关得到偏自相关: 这里 由上方讨论可知,对于一个 AR(p)过程, 是不相关的,都为零。也就是说,对于一个纯AR(p)过程,当阶大于p时,PACF都为零。这是识别AR(p)过程时PACF的一个有用性质。 下面考虑MA(1)过程,只要,则可写成 。 它的无穷阶自回归表示为 因为与它自身所有滞后相关,所以PACF将不会为零。MA(1)过程,只要,PACF的系数是几何衰减到零。如果,衰减是直接的,如果,PACF的系数衰减是振荡的。 对于一般平稳的ARMA(p, q)过程的PACF,在p阶滞后以后,最终都一定衰减到零。衰减的方式取决于多项式的系数。下面给出了各种ARMA过程的ACF和PACF的性质。 表2.7.1 ACF和PACF的性质 过程 ACF PACF 白噪声 所有 所有 AR(1):, 直接指数衰减: AR(1):, 振荡衰减: AR(p) 衰减到零,系数可以振荡 在期前有峰值,但在期之后 MA(1): 在滞后1期处有正峰值,但 振荡衰减, MA(1): 在滞后1期处有负峰值,但 几何衰减, ARMA(1,1) 在滞后1期处开始按几何衰减 在滞后1期处振荡衰减 ARMA(1,1) 在滞后1期处开始振荡衰减 在滞后1期处按指数衰减 ARMA(p,q) 在滞后q期处开始衰减 (或直接或振荡) 在滞后p期开始衰减 (或直接或振荡) 对于平稳过程,需要注意的关键点是: 1. ARMA(p,q)过程的ACF在q阶滞后以后开始衰减, 在滞后q阶以后,ACF的系数将满足差分方程.q阶滞后以后,自相关将会衰减,衰减方式将依赖于特征根的形式。 2. ARMA(p,q)过程的PACF在p阶滞后开始衰减, 在滞后p阶之后, PACF的系数将按模型的ACF系数的方式变化。 2.8 平稳序列的样本自相关 在实际中,一个序列的理论均值、方差、自相关通常是未知的。如果这序列是平稳的,我们可以用样本均值,样本方差,样本自相关来估计它们。假设有T个观测值,令是的估计量: 对每个 可用样本自相关函数ACF和样本偏相关函数PACF与理论值做比较来识别数据生成过程的性质。 Box-Jenkins(1976)在是平稳具有正态误差条件下,讨论了样本值的分布。令表示的样本方差,在零假设(即,如果真实数据生成过程是MA(s-1)过程)下,渐近服从均值为零的正态分布,其中方差为 (2.6.1) 对于PACF系数,在零假设(即,如果真实数据生成过程是)下,渐近服从均值为零的正态分布,其中,的方差渐近于。 在实际中,我们可以使用这些样本值构造样本自相关和偏相关函数,利用(2.6.1)进行显著性检验。例如,如果我们使用95%置信区间(即,2个标准差),且计算出的值大于,则拒绝零假设-一阶自相关在统计意义上不是显著异于零。拒绝MA(s-1)=MA(0)的零假设意味着接受备择假设。下面检验,如果 则=0.015,标准差为0.123。如果 超过,则拒绝假设。因此,拒绝零假设意味着接受备择假设。重复上述过程,我们可确定这个过程的阶数。样本自相关和偏自相关所使用的最大样本个数是T/4。 Q-统计量可用来检验自相关是否显著不为零,Box-Pierce (1970) 利用样本自相关构造了统计量 在下,Q是渐近-分布,自由度为s,较高的样本自相关可导致较大Q的值。显然,白噪声过程(所有的自相关都为零)的Q值为零。如果Q的值超过表中的临界值,我们能拒绝没有自相关的零假设。拒绝零假设意味着接受备择假设:至少有一个自相关不为零。 然而,即使在大样本情况下,Box-Pierce的Q统计量有偏差,Ljung和Box(1978)给出了修正的Q-统计量 如果这个Q值超过表中的临界值,那么至少有一个在给定的显著水平上显著不为零。 Box-Pierce和Ljung-Box的Q统计量可用来检验来自于ARMA(p,q)模型的残差是否为白噪声。但是,如果从被估计的模型ARMA(p,q)中得到s个自相关,则自由度就会由待估计的系数个数增加而减少。因此,如果使用ARMA(p,q)模型的残差时,Q有自由度为s-p-q的分布,(如果包含常数的话,自由度就是s-p-q-1) 2.9 选择模型准则 一个自然的问题是:所选择的模型拟合数据效果如何?增加滞后阶数一定能减少残差平方和。但,增加滞后阶数需要估计更多的参数,使自由度减少。而且,系数个数的增加降低预测的精度。因而产生了各种选择模型的准则(能降低残差平方的更节俭的模型)。有两个通常使用的准则是Akaike信息准则(AIC)和Schwartz Bayesian准则(SBC). AIC=T ln(残差平方和)+2n SBC=T ln(残差平方和)+n ln(T) 这里n=估计的参数的个数(p+q+常数项个数),T=观测值个数。 当使用滞后变量估计模型时,一些观测值被损失。为了比较选择的模型,T应当是固定的。否则,就会发生在不同的样本期间内来比较模型的性能。而且,T的减少将会降低AIC和SBC的效果,而我们的目的并不是选择有最少观测值的模型。 当然希望AIC和SBC尽可能小(也可能是负的),随着模型拟合的改进,AIC和SBC将趋于。我们能利用这些准则,选择最适合的模型;对于模型A的AIC(或SBC)小于模型B的AIC(或SBC),我们就说模型A拟合的比B好。在使用这些准则对不同的模型进行比较时,必须在相同的样本期间内进行估计,以使它们可进行比较。回归变量个数n的增加,可以降低残差平方和。因此,如果一个回归变量没有解释能力,把它添加到模型中会引起AIC和SBC增加。由于ln(T)大于2,所以,SBC总是比AIC选择更节俭的模型;使用SBC准则来评价增加回归变量所带来的的边际成本,要大于使用AIC准则来评价增加回归变量的边际成本。 两个准则中,SBC有更好的大样本性质。令数据生成过程的真正阶为,假设我们利用AIC和SBC估计阶为(p,q)的ARMA模型,这里 ,当样本个数趋于无穷时,AIC和SBC都将选择阶数大于等于的模型。然而,AIC 倾向于选择参数过多的模型,而SBC却是渐进一致的。但在小样本中,AIC优于 SBC。如果AIC和SBC选择了同一模型,对这个模型就应当有较大的信心。如果两个准则选择了不同的模型,这时就需要再进一步的分析。由于SBC倾向于选择更节俭的模型,所以一旦选择了这个节俭模型,还需要检验残差是否为白噪声。因为AIC能选择参数过多的模型,所有系数的t-统计量都应是显著的(在适当的显著水平下)。以后我们还会介绍更多的诊断检验来检验模型的充足性。对所估计的模型保持适度的怀疑是明智的。 2.10 AR(1)模型的估计 让我们使用一个特殊的例子,说明利用样本自相关,偏相关函数来识别ARMA模型。利用计算机生成100个正态分布的随机数(方差为1),这些随机变量称为.由和初始条件生成 上图给出了样本自相关和偏自相关函数的图形。 在实际中,我们不知道真实的数据生成过程。假设我们利用这100个数据(样本值)来找出真正过程。第一步,比较ACF和PACF。 ACF的衰减和PACF在滞后一阶处的截尾说明了AR(1)模型。前三个自相关(有时大于理论值)。在PACF中,滞后1阶处有一个显著的高峰值0.74,所有其它偏自相关(除在滞后12阶处)都非常小。 在零假设(MA(0)过程)下, 的标准差是,因为=0.74的样本值大于7个标准差。我们可以拒绝=0的零假设。再计算方差 因为的标准差,的样本值大于3倍(0.58/0.15)的标准差;在通常的显著水平下,我们可以拒绝=0的零假设。我们可同样检验其它自相关值的显著性。除外,所有偏自相关函数(除滞后12阶外),都小于。ACF的衰减和PACF的一个高峰值建议了一阶自回归模型。然而,如果我们不知道真正过程,而且使用了月度数据,这时需要关注偏自相关函数在滞后12阶处的显著性,需要关注和的直接关系。 尽管我们这里知道这过程是由AR(1) 生成的,下面我们将两个不同的模型作一比较。假设我们估计AR(1)模型,并试图用MA系数捕捉的在滞后12阶处峰值。因此,考虑两个模型 模型1: 模型2: 下表报告了两个估计结果,模型1的系数满足稳定性条件且标准差较低(零假设的t-统计量值大于12)。作为诊断检验,也可以做出拟合模型的残差的相关图。这些残差的Q-统计量说明:每个自相关都小于2倍标准差。这些残差的Ljung-Box的Q–统计量说明:Q(8)、Q(12)、Q(24)都显著为零(接受原假设)。这强烈说明AR(1)模型拟合数据拟合的较好。如果残差的自相关是显著的,说明AR(1)模型没能利用所有信息。 模型1 模型2 自由度 99 98 残差平方和 85.21 85.17 的估计 (标准差) 0.7910 (0.0622) 12.7 0.7953 (0.0638) 12.5 的估计 (标准差) -0.033 (0.1134) -0.29 AIC, SBC 441.9, 444.5 443.9, 449.1 残差的Ljung-Box Q统计量(括号内的值为拒绝原假设的最小显著水平-P值) Q(8)=6.43(0.490) Q(16)=15.86(0.391) Q(24)=21.74(0.536) Q(8)=6.48(0.485) Q(16)=15.75(0.4) Q(24)=21.56(0.547) 考察模型2,注意两个模型产生类似的一阶自回归系数和标准差。然而,系数的估计是不显著的,应该被去掉。通过比较两个模型的AIC和SBC,降低残差平方和的益处会被估计更多参数带来的不利影响所抵消。这些都说明应该选择模型1。 2.11 ARMA(1.1) 模型的估计 构造第二个序列,来说明ARMA(1.1)模型的估计。给定100个正态分布的序列按如下生成 这里都为零。 样本ACF和PACF的图形如下 如果数据生成过程是未知的,还要关注一些相近的情形。AR(2)模型也许能产生类似上图的ACF和PACF。考虑三个模型 模型1: 模型2: 模型3: 下表给出估计结果: ARMA(1.1) 模型的估计 估计(括号内为标准差) Q统计量(括号内为显著水平) AIC/SBC 模型1 -0.835(.053) 0.835/0.053=16 Q(8)=26.19(.000) Q(24)=41.10(.001) AIC=496.5 SBC=499.0 模型2 -0.679(.076) -0.676(.081) Q(8)=3.86(.695) Q(24)=14.23(.892) AIC=471.0 SBC=476.2 模型3 -1.16(.093) -0.378(.092) Q(8)=11.44(.057) Q(24)=22.59(.424) AIC=482.8 SBC=487.9 有上表可看出:所有的估计值都是高度显著的。每个估计值至少是8倍的标准差。显然AR(1)模型是不适合的。模型1的Q统计量说明:在残差中有显著的自相关性。而ARMA(1.1)并不存在这样问题。而且,AIC和SBC都建议选择模型2。 同样的理由也说明选择模型2比选择模型3较为适合。我们还可注意到:对每个模型,估计的系数都是高度显著的。虽然在滞后24阶处,Q-统计量没有说明这两个模型的残差中有自相关,在滞后8阶处,Q-统计量指出了模型3的残差中有序列相关。因此,AR(2)模型也没能像ARMA(1.1)模型捕捉到短期动态。AIC和SBC都选择了模型2。 消费价格指数 序列存在自相关:
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 百科休闲 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服