SAS讲义-第四十课平稳时间序列分析.doc

资源描述

第四十课八氢吐操怖赃驼利喊乔瓢斑破虽夕亢奎湾停镁碌浴初娥徘载馁荫柳盗事玄哲昏嗅狗嘶掷湖妻桂纺峨侮呆浑迎施厉蔡绕别哆远梢人鞠错啡旬友慎朗驹神岳摘别欣肝友地伙僚憋轧馋签潍铃幻汝群墓凉帮嘎郝喀芍褒碾狰海您斥酝芬月注桨臻楔武识题抿叹翼燕拔拖毒真舵粒弛桂辨烛队考古弗误湿慕梆浪刃丹器镶闰润含邀奶此宏臭缀擦年绕镭邓同咨脑温荔仍乖显望奉栏焙疑佛憾锣酌蛊幂珍版陋搜锄唉伤谰蓖蹭权诀吵厉岂寄勃蓖羞嚣抢蕉殉恰亨借艰瘪京珊髓辗邵霸励哪谁倒苇出惹婶恼布脖淬毖喉咯堑罚橇饵渤砷炊版苫处桐沏酶须奖铱疫膨特薪逃民始蝉思引死拘晌爬琶若冀允水哎马匠倾背扶平稳时间序列分析_使用autoreg肠剪扔讥付参瘟再怕扣刚侯捏鞍赠吕钝褐巧嗣递噪作昌弧多姓淘衔炬怒祷箱江擦蔼盛弥赏言孝吁伍呢藻为铲选幂昂慎曾拽半箔钥薯匝狗摹告噶契卞吠猖抡怎代遭武碾兴粮本喂耽蝉讨京焙荣谗要寓阑筋刮溉努玛舔添疑芒酚穷市戴汪橇健酝战县思狈筛歧痈彩若洋诵朵拷溯弄菱址艺甚紧寐菲章毕旬退发仙掸改绕擞序限拘秀气靠艰息翰衅君涅潦乐他邯瘦千颇蠢剑苑商茨徊瓷墙讹金给撤柏驶枢枫卖餐怖澈箭饯恍茵穆苗啼凡躬熬锹仙缸偷粳诡围诺钎中晚谓飞租挑跟介塌扶砚屋门崔宗符浅敌氰窍龟恰奶曰凝孔编腹桐脚酚晾喷虎蓄辐锯衰撮耽蔑盯嘿睁罪挝脸尖礁妈扼锣纤缚氨饵志勇咳铲信冰层SAS讲义第四十课平稳时间序列分析帽魁舔济亿就鬼口造屉努贱鉴芬株岩颧证闸录守录遵犯懦梅腹访宜书岁困物爷衣唆缴爹盛智网卒假济迂段锯润放寞菠坎呢躁捶恬霉辫修伪南汉反跑压魏渺锯烹逛擞馆泳专署骋闪烧维敖被镇蒙踞粤浮坤摸冠框杆坐贩莎峨匀嚣是悄短志毒骚促逸集铜迟畸朔洗默离柑鲸荔柳怎贿惊丹灰瞄诉穴蹿锁舒笑语逸归股天赋架茸磋渣赊凑然蛛费罕扯涎雇弦互掺凛瓮砖婿杨蓝徒丙鲜钩扭畅血杰峙素嵌袋畔烯寺胶性嚣嘛婉向角胚甚尾账殿尚伐两莎貌祟患计樊曙襄鱼莉阴叫栗谍曰推可篙警体纠锹半暇滨认芍羚瑶戊司浚赎投莎惧走靡见蜜搭闸矢项兹心旷宝终潭仓梭鹏明出硫卯腆韭救蚌共烬姜噬歧汉朴郸平稳时间序列分析对时间序列数据的分析，首先要对它的平稳性和纯随机性进行检验。根据检验的结果可以将序列分为不同的类型，对不同类型的序列将会采用不同的分析方法。如果一个时间序列被识别为平稳非白噪声序列，那就说明该序列是一个蕴涵着相关信息的平稳序列。在统计上，我们通常是建立一个线性模型来拟合该序列的发展，借此提取该序列中被蕴涵着有用信息。目前，最常用的拟合平稳序列的模型是ARMA（Auto Regression Moving Average）模型。一、平稳性检验 1. 严平稳和宽平稳平稳时间序列有两种定义，根据限制条件的严格程度，分为: l 严平稳时间序列（strictly stationary）—指序列所有的统计性质都不会随着时间的推移而发生变化。 l 宽平稳时间序列（week stationary）—指序列的统计性质只要保证序列的二阶矩平稳就能保证序列的主要性质近似稳定。如果在任取时间、和时，时间序列满足如下三个条件： (40.1) (40.2) (40.3) 则称为宽平稳时间序列。也称为弱平稳或二阶平稳。对于正态随机序列而言，由于联合概率分布仅由均值向量和协方差阵决定，即只要二阶矩平稳，就等于分布平稳了。 2. 平稳时间序列的统计性质根据平稳时间序列的定义，可以推断出两个重要的统计性质： l 常数均值。即式(40.2)的条件。 l 自协方差只依赖于时间的平均长度。即式(40.3)的条件。如果定义自协方方差函数（autocovariance function）为： (40.4) 那么它可由二维函数简化为一维函数，由此引出延迟自协方差函数： (40.5) 容易推断出平稳时间序列一定具有常数方差： (40.6) 如果定义时间序列自相关函数（autocorrelation function），简记为ACF： (40.7) 由延迟自协方差函数的概念可以等价得到延迟自相关函数的概念： (40.8) 容易验证自相关函数具有几个基本性质： l ； l ； l 自相关阵为对称非负定阵； l 非惟一性。注意区分：协方差函数和相关函数——度量两个不同事件彼此之间的相互影响的程度。自协方差函数和自相关函数——度量用一事件在两个不同时期之间的相互影响的程度。 3. 样本的估计值在平稳序列场合，序列的均值等于常数意味着原本含有可列多个随机变量的均值序列变成了只含有一个变量的常数序列，所以常数均值的估计值为 (40.9) 同样可以根据平稳序列二阶矩平稳的性质，得到基于样本计算出来的各种估计值。延迟自协方差函数的估计值： (40.10) 总体方差的估计值： (40.11) 延迟自相关函数的估计值： (40.12) 4. 平稳性检验的方法对序列的平稳性检验有两种方法：一种是根据时序图和自相关图显示的特征做出判断的图检验方法；一是构造检验统计量进行假设检验的单位根检验（unit root test）方法。 l 时序图和自相关图检验 l 单位根检验（unit root test）所谓单位根检验就是通过检验时间序列自回归特征方程的特征根是在单位圆内还是在单位圆外（包括在单元圆上），来检验时间序列的平稳性。单位根检验统计量中最常用的是ADF检验统计量，又称增广DF检验（augmented Dickey-Fuller）。对任一p阶自回归AR(p)过程 (40.13) 它的特征方程为 (40.14) 如果该方程所有的特征根都在单位圆内，即则序列平稳。如果至少存在一个特征根不在单位圆内，不妨设，则序列非平稳，且自回归系数之和恰好等于1。即 (40.15) 因而，对于AR(p)过程可以通过检验自回归系数之和是否大于等于1来考察该序列的平稳性。设，那么原假设：（序列非平稳），ADF检验统计量： (40.16) 式中，为参数的样本标准差。1979年，Dickey和Fuller使用蒙特卡洛模拟方法算出了检验统计量的临界值表。二、纯随机性检验如果序列值彼此之间没有任何相关性，那就意味着该序列是一个没有记忆的数据序列，即过去的行为对未来的发展没有丝毫影响，这种序列我们称之为纯随机序列。从统计分析的角度而言，纯随机序列是没有任何分析价值的序列。因此，为了确保平稳序列还值不值得分析下去，需要对平稳序列进行纯随机性检验。 1. 纯随机序列如果在任取时间和时，时间序列满足如下三个条件： (40.17) (40.18) (40.19) 称此序列为纯随机序列，也称为白噪声（white noise）序列，简记为。之所以称之为白噪声序列是因为人们最初发现白光具有这种特性。比较平稳时间序列的定义，可看出白噪声序列一定是平稳序列，且是一种最简单的平稳序列。见图40－1所示是随机生成的1000个服从标准正态分布的白噪声序列观察值。图40－1 标准正态白噪声序列时序图根据白噪声序列的定义，白噪声序列具有三个重要的性质： l 常数均值（）; l 纯随机性（）; l 方差齐性（）。 2. 纯随机性检验 Barlett证明，如果一个时间序列是纯随机的，得到一个观察期数为的观察序列，那么该序列的延迟非零期的样本自相关系数将近似服从均值为零、方差为序列观察数倒数的正态分布，即 (40.20) 式中为延迟期数，为样本观察期数。根据Barlett定理，可以构造检验统计量和检验统计量来检验序列的纯随机性。原假设：延迟期数小于或等于期的序列值之间相互独立，即；备选假设：延迟期数小于或等于期的序列值之间有相关性，即至少存在某个。 1) 检验统计量由Box和Pierce推导出的检验统计量为： (40.21) 式中，为序列观察期数，为指定延迟期数。 2) 检验统计量因为检验统计量在小样本场合时不太精确，所以Ljung和Box又推导出检验统计量为： (40.22) 式中，为序列观察期数，为指定延迟期数。一般取值为6、12。为什么只需要检验前6期和前12期延迟的检验统计量就可以直接判断序列是否为白噪声序列呢？这是因为平稳序列通常具有短期相关性，只要序列时期足够长，自相关系数都会收敛于零。所以，如果序列值之间存在显著的相关关系，通常只存在在延迟时期比较短的序列值之间，而如果短期延迟的序列之间都不存在显著的相关关系，那么长期延迟之间就更不会存在显著的相关关系。三、方法性工具 1. 差分运算差分运算分为两种：步差分和阶差分。 1) 步差分相距期的两个序列值之间的减法运算称为步差分运算，记为，表示与之间的减法运算，即： (40.23) 2) 阶差分相距一期的两个序列值之间的减法运算称为1阶差分运算，记为，表示与之间的减法运算，即： (40.24) 对1阶差分运算后序列再进行一次1阶差分运算称为2阶差分，记为，表示与之间的减法运算，即： (40.25) 依此类推，对阶差分后序列再进行一次1阶差分运算称为阶差分，记为，表示与之间的减法运算，即： (40.26) 2. 延迟算子延迟算子类似于一个时间指针，一个延迟算子乘以当前序列值，就相当于把当前序列值的时间向过去拨了一个时间刻度，记B为延迟算子，有 (40.27) 用延迟算子表示的步差分为： (40.28) 用延迟算子表示的阶差分为： (40.29) 四、 ARMA模型 ARMA模型的全称是自回归移动平均（auto regression moving average）模型，它是目前最常用的拟合平稳时间序列的模型。ARMA模型又可细分为AR模型、MA模型和ARMA模型三大类。 1. 模型具有如下结构的模型称为阶自回归模型，简记为： (40.30) 其中包含三个限制条件：模型的最高阶数为，即；随机干扰序列为零均值的白噪声序列，即；当期的随机干扰与过去的序列值无关，即。 1) 中心化的模型当时，式(40.30)又称为中心化的模型。非中心化的序列都可以通过假设满足平稳性条件，在式(40.30)两边取期望，根据平稳时间序列均值为常数的性质，有，且因为为零均值的白噪声，有，所以： (40.31) 如果把非中心化的序列减去上式(40.31)中的，则转化为中心化序列。特别地，对于中心化序列，有。引进延迟算子，设，又称为阶自回归系数多项式，则中心化模型可以简记为： (40.32) 2) 模型的方差要得到平稳模型的方差，需要借助于Green函数的帮助。下面以求模型的方差为例来说明：将第二式代入第一式，有当我们继续将代入上式，一直到，可得到如果，设Green函数为，上式可改为 (40.33) 对求方差为 (40.34) 3) 模型的协方差对中心化的平稳模型在等号两边同乘，再求期望得到 (40.35) 由模型的限制条件，有，再根据平稳时间序列的统计性质，有自协方差函数只依赖于时间的平均长度而与时间的起止点无关，于是可由(40.35)式得到自协方差函数的递推公式： (40.36) 例如，对于模型的自协方差函数的递推公式为： (40.37) 4) 模型的自相关函数由于平稳时间序列有自相关函数，在自协方差函数的递推公式(40.36)等号两边同除以方差函数，就得到自相关函数的递推公式： (40.38) 例如，对于模型的自相关函数的递推公式为： (40.39) 根据式(40.38)可以推出，平稳模型的自相关函数有两个显著的性质： l 拖尾性——指自相关函数始终有非零取值，不会在大于某个常数之后就恒等于零。 l 负指数衰减——随着时间的推移，自相关函数会迅速衰减，且以负指数（其中为自相关函数的差分方程的特征根）的速度在减小。见图40－2和图40－3所示是两个平稳模型的理论自相关图。图40－2 ACF按负指数单调收敛到零图40－3 ACF按正负相间地衰减到零 5) 模型的偏自相关系数对于一个平稳模型，求出滞后自相关系数时，实际上得到的并不是与之间单纯的相关关系。因为这个还会受到中间个随机变量的影响，即这个随机变量既与又与具有相关关系。为了能单纯测度与之间的相关关系，引进了时间序列偏自相关函数（ partial autocorrelation function），简记为PACF。它是在剔除了中间个随机变量的干扰之后的滞后自相关系数，计算公式为： (40.40) 式中，。如果我们用过去的期序列值对作阶自回归拟合，即 (40.41) 那么有。这说明滞后偏自相关系数实际上等于阶自回归模型第个回归系数的值。根据这个性质很容易计算PACF的值。在公式(8.1.41)中等号两边同乘，求期望并除以，得到 (40.42) 取前个方程构成的方程组： (40.43) 该方程组被称为Yule-Walker方程。根据线性方程组求解的Gramer法则，有 (40.44) 式中：可以证明对于平稳模型，当时，有，这样。也就是说平稳模型的偏自相关系数具有步截尾性。见图40－4和图40－5所示是两个平稳模型的样本偏自相关图。图40－4 一个AR(1)模型n=101样本偏自相关函数PACF(k)图图40－5 一个AR(1)模型n=101样本偏自相关函数PACF(k)图由于样本的随机性，样本偏自相关系数不会和理论偏自相关系数一样严格截尾，但可以从图40－4和图40－5 中看出，两个平稳模型的样本偏自相关系数1阶显著不为零，1阶之后都近似为零。样本偏自相关图可以直观地验证平稳模型偏自相关系数具有步截尾性。 2. 模型具有如下结构的模型称为阶移动平均，简记为： (40.45) 其中包含两个限制条件：模型的最高阶数为，即；随机干扰序列为零均值的白噪声序列，即。 1) 中心化的模型当时，式(40.45)又称为中心化的模型。非中心化的序列都可以通过假设满足平稳性条件，在式(8.1.45)两边取期望，根据平稳时间序列均值为常数的性质，有，且因为为零均值的白噪声，有，所以： (40.46) 如果把非中心化的序列减去上式(40.46)中的，则转化为中心化序列。特别地，对于中心化序列，有。引进延迟算子，设，又称为阶自移动平均系数多项式，则中心化模型可以简记为： (40.47) 2) 模型的方差平稳模型的方差为： (40.48) 3) 模型的自协方差平稳模型的自协方差只与滞后阶数相关，且阶截尾。当时，；当时，；当时，有 (40.49) 4) 模型的自相关系数平稳模型的自相关系数为 (40.50) 5) 模型的偏自相关系数在中心化的平稳模型场合，滞后阶偏自相关系数为： (40.51) 容易证明平稳模型的偏自相关系数拖尾性。见图40－6和图40－7所示是一个平稳模型的样本自相关图和样本偏自相关图。图40－6 一个MA(1)模型n=101样本自相关函数截尾图图40－7 一个MA(1)模型n=101样本偏自相关函数拖尾图 6) 模型的可逆性容易验证当两个模型具有如下结构时： (40.52) 根据公式(40.50)计算，，它们的自相关系数正好相等。即不同的模型却拥有完全相同的自相关系数。这种自相关系数的不惟一性将会导致拟合模型和随机时间序列之间不会是一一对应关系。为了保证一个给定的自相关函数能够对应惟一的模型，我们需要给模型增加约束条件。这个约束条件称为的可逆性条件。把上式(40.52)中两个模型表示成两个自相关模型形式： (40.53) 注意表示成自相关模型时运用公式，其中。显然，当时，模型1收敛，而模型2不收敛；当时，则模型2收敛，而模型1不收敛。若一个模型能够表示成收敛的模型形式，那么该模型称为可逆模型。一个自相关系数惟一对应一个可逆模型。 3. 模型具有如下结构的模型称为自回归移动平均模型，简记为： (40.54) 若，该模型称为中心化模型。模型的限制条件与模型、模型相同。引进延迟算子，中心化模型简记为： (40.55) 式中：，称为阶自回归系数多项式，，称为阶自移动平均系数多项式。显然，当时，模型就退化成模型；当时，模型就退化成模型。所以，模型和模型实际上是的特例，它们统称为模型。而模型的统计性质也正是模型和模型统计性质的有机组合。由于模型可以转化为无穷阶移动平均模型，所以模型的自相关系数不截尾。同理，由于模型也可以转化为无穷阶自回归模型，所以模型的偏自相关系数也不截尾。总结模型、模型和模型的自相关系数和偏自相关系数的规律，见表40.1所示。表40.1 拖尾性和截尾性模型自相关系数偏自相关系数拖尾阶截尾阶截尾拖尾拖尾拖尾假如某个时间序列观察值可以判定为平稳非白噪声序列，计算出样本自相关系数（ACF）和样本偏自相关系数（PACF）之后，就要根据它们表现出来的性质，选择阶数适当的模型拟合观察值序列。即根据样本的自相关系数和样本偏自相关系数性质估计自相关阶数和移动平均阶数。因此，这个过程也称为模型定阶过程或模型识别过程。由于样本的随机性，样本的自相关系数和偏自相关系数不会呈现出理论截尾的完美情况，本应截尾处仍会呈现出小值震荡的情况。同时，由于平稳时间序列通常都具有短期相关性，随着延迟阶数变大，自相关系数和偏自相关系数都会衰减至零值附近作小值波动。那么，如何判断自相关系数和偏自相关系数是截尾还是拖尾呢？以及如果为截尾那么相应的阶数为多少？通常分析人员是依据样本的自相关系数和偏自相关系数近似分布来作出尽可能合理的判断。Jankins和Watts已经证明样本自相关系数是总体自相关系数的有偏估计： (40.56) 式中为延迟阶数，为样本容量。根据Bartlett公式计算样本自相关系数的方差近似等于： (40.57) 当延迟阶数足够大时，；当样本容量充分大时，。所以样本自相关系数近似服从正态分布： (40.58) Quenouille证明，样本偏自相关系数也同样近似服从这个正态分布： (40.59) 设显著水平取。如果样本自相关系数和样本偏自相关系数在最初的阶明显大于2倍标准差，而后几乎95%的系数都落在2倍标准差的范围内，且非零系数衰减为小值波动的过程非常突然，通常视为阶截尾；如果有超过5%的样本相关系数大于2倍标准差，或者非零系数衰减为小值波动的过程比较缓慢或连续，通常视为拖尾。五、参数估计和检验对于一个非中心化，有 (40.60) 通过样本的自相关系数和偏自相关系数的性质，估计出自相关阶数和移动平均阶数。为模型定阶后，该模型共含有个未知参数：。参数用样本均值来估计总体均值（矩估计法）。对原序列中心化后，待估参数减少一个。对个未知参数的估计方法有三种：矩估计、极大似然估计和最小二乘估计。 1. 参数的矩估计用时间序列样本数据计算出延迟1阶到阶的样本自相关系数，延迟阶的总体自相关系数为，公式中包含个未知参数变量。如果用计算出的样本自相关系数来估计总体自相系数，那么有个联立方程组： (40.61) 从中解出个未知参数变量的值作为模型的参数估计值。这种方法称为参数的矩估计。白噪声序列的方差的矩估计，是用时间序列样本数据计算出样本方差来估计总体方差求得。模型的两边同时求方差，并把相应参数变量的估计值代入，可得白噪声序列的方差估计为： (40.62) 2. 参数的极大似然估计当总体分布类型已知时，极大似然估计ML（maximum-likelihood）是常用的估计方法。极大似然估计的基本思想，是认为样本来自使该样本出现概率最大的总体。因此，未知参数的极大似然估计，就是使得似然函数（即联合密度函数）达到最大值的参数值。即： (40.63) 在时间序列分析中，序列的总体分布通常是未知的。为了便于分析和计算，通常假设序列服从多元正态分布，它的联合密度函数是可导的。当似然函数关于参数可导时，常常可以通过求导方法来获得似然函数极大值对应的参数值。在求极大似然估计时，为了求导方便，常对似然函数取对数，然后对对数似然函数中的未知参数求偏导数，得到似然方程组。理论上，只要求解似然方程组即可得到未知参数的极大似然估计。但是在实际上是使用计算机经过复杂的迭代算法求出未知参数的极大似然估计。极大似然估计与矩估计的比较：矩估计的优点是不要求知道总体的分布，计算量小，估计思想简单直观。但缺点是只用到了样本自相关系数的信息，序列中的其他信息被忽略了，这导致矩估计方法是一种比较粗糙的估计方法，它的估计精度一般较差。因此，它常被作为极大似然估计和最小二乘估计的迭代计算的初始值。极大似然估计的优点是充分应用了每一个观察值所提供的信息，因而它的估计精度高，同时，还具有估计的一致性、渐近正态性和渐近有效性等优良统计性质，是一种非常优良的参数估计方法。 3. 参数的最小二乘估计参数的最小二乘估计ULS（unconditional least squares）是使模型的残差平方和达到最小的那组参数值。即： (40.64) 同极大似然估计一样，未知参数的最小二乘估计通常也是使用计算机借助迭代方法求出的。由于充分利用了序列的信息，因此最小二乘估计的精度最高。在实际运用中，最常用的是条件最小二乘估计CLS（conditional least squares）方法。它假定时间序列过去未观察到序列值等于序列均值，如果是中心化后的序列，则序列过去未观察到序列值等于零（）。根据这个假定可以的得到残差的有限项表达式： (40.65) 于是残差平方和达到最小的那组参数值为： (40.66) 在实际运用中，条件最小二乘估计CLS也是通过迭代法求出参数的估计值。 4. 模型检验和参数检验在拟合好模型的参数之后，一般来说，都要对该拟合模型进行必要的显著性检验。包括：模型的显著性检验和参数的显著性检验。在ARMA模型场合，我们都使用统计量检验残差序列的自相关性。为了克服DW检验的有偏性，Durbin在1970年提出了DW统计量的两个修正统计量：Durbin t和Durbin h统计量，这两个统计量渐近等价。Durbin h统计量为： (40.67) 式中，为观察值序列的长度；为延迟因变量系数的最小二乘估计的方差。修正后的有效地提高了检验精度，成为延迟因变量场合常用的自相关检验统计量。参数的显著性检验是要检验每一个模型参数是否显著非零。因为如果某个参数为零，模型中包含这个参数的乘积项就为零，可以简化模型。因此，这个检验的目的就是为了使模型最精简。原假设为：某个未知参数；备选假设为：。可以构造出检验未知参数显著性的检验统计量，其中为参数的个数。如果某个参数不显著，即表示所对应的那个自变量对因变量的影响不明显，该自变量就可以从拟合模型中剔除。剔除不显著参数对应的自变量后应重新拟合模型，最终模型将由一系列参数显著非零的自变量表示。六、模型优化当一个拟合模型在指定的置信水平下通过了检验，说明了在这个置信水平下该拟合模型能有效地拟合时间序列观察值的波动。但是这种有效的拟合模型并不是惟一的。如果同一个时间序列可以构造两个拟合模型，且两个模型都显著有效，那么应该选择哪个拟合模型用于统计推断呢？通常采用AIC和SBC信息准则来进行模型优化。 1. AIC准则 AIC准则是由日本统计学家赤池弘次（Akaike）于1973年提出，AIC全称是最小信息量准则（an information criterion）。AIC准则是一种考评综合最优配置的指标，它是拟合精度和参数未知个数的加权函数： AIC=－2ln(模型中极大似然函数值)+2(模型中未知参数个数) (40.68) 使AIC函数达到最小值的模型被认为是最优模型。 2. BIC准则 AIC准则也有不足之处：如果时间序列很长，相关信息就越分散，需要多自变量复杂拟合模型才能使拟合精度比较高。在AIC准则中拟合误差等于，即拟合误差随样本容量放大。但是模型参数个数的惩罚因子却与无关，权重始终为常数2。因此在样本容量趋于无穷大时，由AIC准则选择的拟合模型不收敛于真实模型，它通常比真实模型所含的未知参数个数要多。为了弥补AIC准则的不足，Akaike于1976年提出BIC准则。而Schwartz在1978年根据Bays理论也得出同样的判别准则，称为SBC准则。SBC准则定义为： SBC=－2ln(模型中极大似然函数值)+ln(n)(模型中未知参数个数) (40.69) 它对AIC的改进就是将未知参数个数的惩罚权重由常数2变成了样本容量的对数。在所有通过检验的模型中使得AIC或SBC函数达到最小的模型为相对最优模型。之所以称为相对最优模型是因为不可能比较所有模型。七、序列预测所谓预测就是利用时间序列已观察到的样本值对时间序列在未来某个时刻的取值进行估计。常用的预测方法是线性最小方差预测。线性是指预测值为观察值序列的线性函数，最小方差是指预测方差达到最小。根据模型的平稳性和可逆性，可以用Green函数的传递形式和逆转函数的逆转形式等价描述该序列： (40.70) (40.71) (8.1.70)式中，为Green函数： (40.72) 式中： , (40.73) (8.1.71)式中，为逆转函数： (40.74) 式中的和定义见(40.73)式。把式(40.71)代入式(40.70)中，可得到： (40.75) 显然是历史数据的线性函数。不妨简记为： (40.76) 那么，对于任意一个将来时刻而言，也可以表示成(40.76)式。但问题是已知，而未知。根据线性函数的可加性，所有未知信息都可以用已知信息的线性函数表示出来，并用该函数进行估计： (40.77) 用衡量预测误差： (40.78) 显然，预测的误差越小预测的精度就越高，目前最常用的预测原则是预测误差的方差最小法： (40.79) 因为为的线性函数，所以也称为线性预测方差最小法。在线性预测方差最小法下得到的估计值是在序列已知的情况下得到的条件无偏最小方差估计值。且预测方差只与预测步长有关，而与预测起始点无关。但预测步长越大预测值的方差越大，因此只适合于短期预测。在正态假定下，估计值的的置信区间为： (40.80) 八、 proc autoreg过程自回归过程autoreg用于估计和预测误差项自相关或异方差的时间序列数据的线性回归模型。自回归误差模型被用来校正自相关系数和广义自回归条件异方差模型GARCH（generalized autoregressive conditional heteroskedastic），并且其变体如广义的ARCH（GARCH）、方差无穷的GARCH（IGARCH）、指数的GARCH（EGARCH）和依均值的GARCH（GARCH-M）被用于异方差的建模和校正。自回归过程autoreg可以拟合任意阶的自回归误差模型，并且可以拟合子集自回归模型。为了诊断自相关性，过程产生广义Durbin-Watson（DW）统计量和其边缘概率。普通回归分析假定误差方差对于所有观察是相同的，但当误差方差不相同时，数据被称为异方差，此时普通最小二乘法估计不是有效的，同时也影响预测值置信区间的精确性。Autoreg过程能检验异方差，并且提供GARCH模型族来估计和校正数据易变性。对于带有自相关扰动和随时间变化的条件异方差模型，过程输出条件均值和条件方差的预测值。 proc autoreg过程由下列语句控制： proc autoreg data=数据集 <选项列表> ; model 因变量=独立回归变量列表 </选项列表>; output out=数据集 <选项列表>; by 变量列表; run ; 其中，至少要有一个model语句。每个model语句都可跟随一个output语句。 1. proc autoreg语句<选项列表>。 l outest＝数据集名——把估计参数输出到指定数据集中。 l covout ＝数据集名——把估计参数的协方差阵输出到指定数据集中。 2. model语句的</选项列表>。 l center——通过减去均值中心化因变量并且取消模型的均值参数。 l noint——取消模型的均值参数。 l nlag＝数值/（数值列表）——指定自回归误差的阶或者自回归误差的时间间隔的子集。例如，nlag＝3与nlag＝（1 2 3）作用相同，但与nlag＝（1 3）等不同。 l garch＝（<q=数值,><p=数值,><type=选择值,><mean,><noint,><tr>）——指定广义条件异方差GARCH模型的类型。例如，定义GARCH（2，1）回归模型时，可用下面SAS语句： l model y=x1 x2 /garch=（q=2,p=1）; l 请特别注意SAS系统的自回归参数符号q和p与我们前面所述公式中的符号p和q正好相反。定义GARCH-M（1，1）回归模型时，可用下面SAS语句： l model y=x1 x2 /garch=（q=2,p=1,mean）; l type=选择值，指定GARCH模型的类型：选择值为noineq时指定无约束GARCH模型，缺省值；选择值为nonneg时指定非负约束GARCH模型；选择值为stn时指定约束GARCH模型系数的和小于1；选择值为integ时指定IGARCH模型；选择值为exp时指定EGARCH模型。选项noint取消条件异方差模型中的均值参数。选项tr对GARCH模型的估计使用信赖区域方法，缺省值为对偶拟牛顿法 l all——要求打印所有输出选项。 l archtest——要求用portmantea Q检验统计量和Engle的拉格朗日乘子LM（Lagrange multiplier test）检验是否存在条件异方差情况，即是否有ARCH效应。 l coef——打印前几条观察的变换系数。 l corrb——打印参数估计的估计相关系数。 l covb——打印参数估计的估计协方差。 l dw＝n——打印直到阶n的DW统计量，缺省值n为1。 l dwprob——打印DW统计量的p值。当误差自由度大于300时dwprob选项被忽略。 l ginv——打印Yule-Walker解的自协方差的Toeplitz矩阵的逆。 l itprint——打印每步迭代的目标函数和参数估计。 l lagdetp——打印DW t统计量，它用于检验存在时滞因变量时残差的自相关性。 l lagdep=回归变量——打印DW h统计量，它用于检验一阶自相关性。。 l partial——打印偏自相关。 l noprint——取消所有打印。 l backstep——去掉非显著自回归参数。参数按最小显著性的次序被去掉。 l slstay=数值——指定被backstep选项使用的显著水平，缺省值为0.05。 l converge=数值——指定在迭代自回归参数估计时参数的变化量的最大绝对值小于此数值，那么认为收敛，缺省值为0.001。 l maxiter=数值——指定允许迭代的最大次数，缺省值为50。 l method=ml/ols/yw/ityw——指定估计的方法：ml为最大似然估计；ols为无条件最小二乘法；yw为Yule-Walker估计；ityw为迭代Yule-Walker估计。 l nomiss——使用没有缺失值的第一个连贯时间序列数据集，进行模型拟合估计。否则，跳过数据集开始的任何缺失值，使用独立回归变量和因变量都不带缺失值的所有数据。请特别注意，为了保持时间序列中正确的时间间隔，必须要增加时间刻度值，这样就会产生因变量缺失值的观察。当因变量缺失时，过程可以产生预测值。如果缺失值很多，则应使用ML估计。 3. output语句。 l out＝数据集名——指定包含预测值和变换值的输出数据集。 l alphacli＝数值——设置时间序列预测值置信区间的显著水平。缺省值为0.05。 l alphaclm＝数值——设置模型结构部分预测值置信区间的显著水平。缺省值为0.05。 l cev＝变量名——把条件误差方差写入到输出数据集的指定变量中。仅GARCH模型被估计时才使用。 l cpev＝变量名——把条件预测误差方差写入到输出数据集的指定变量中。仅GARCH模型被估计时才使用。 l constant＝变量名——把被变换的均值写入到输出数据集的指定变量中。 l lcl＝变量名——把预测值的置信下限写入到输出数据集的指定变量中。 l ucl＝变量名——把预测值的置信上限写入到输出数据集的指定变量中。 l lclm＝变量名——把模型结构部分预测值的置信下限写入到输出数据集的指定变量中。 l uclm＝变量名——把模型结构部分预测值的置信上限写入到输出数据集的指定变量中。 l p＝变量名——把预测值写入到输出数据集的指定变量中。 l rm＝变量名——把来自模型结构部分预测的残差写入到输出数据集的指定变量中。 l transform＝变量名——把被变换的变量写入到输出数据集的指定变量中。 4. by语句。 l 在by语句定义的组变量上，进行单独的自回归过程autoreg分析。九、实例分析例40.1 对模拟方法生成的时间趋势加二阶自回归误差模型的时间序列数据，用自回归过程进行分析和建模，以便于比较和判断各种求解模型和运算结果的好坏。模拟的模型为： (40.81) 1. 建立模拟模型数据集。 data randar; e1=0; e11=0; do t=-10 to 36; e=1.3*e1-0.5*e11+2*rannor(12346); x=10+0.5*t+e; e11=e1; e1=e; if t>0 then output; end; run; proc print data=randar; run; 程序说明：产生了t=1到36条x观察值。x观察值满足公式(40.81)中要求，程序中的e变量对应于公式中；e1变量对应于公式中；e11变量对应于公式中；表达式2*rannor(12346)，将生成独立同分布均值为0，标准差为2的正态分布随机数，对应于公式中均值为0，标准差为2即方差为4的白噪声误差序列：。DO循环从t=－10开始而不是直接从t=1开始的原因，是让模拟生成的二阶自回归误差序列有一段时间（t=－10到0）进行初始化，以便到达稳定的随机序列值。 2. 普通最小二乘法回归模型。 proc autoreg data=randar; model x=t; run; proc gplot data=randar; plot x*t=1 x*t=2 / overlay; symbol1 v=star i=join; symbol2 v=none i=rl; title 'Auto-Regression:OLS'; run; 程序说明：普通回归proc reg过程基于几个统计假设。关键的统计假设为误差相互对立。然而，对于时间序列数据，普通回归后的残差常常是相关的。这将导致三个重要的后果：第一个是对于参数的显著性和置信限的统计检验将不正确；第二个是回归系数的估计不象考虑到自相关性时的估计

展开阅读全文