收藏 分销(赏)

平稳时间序列的判断及建模课件.ppt

上传人:s4****5z 文档编号:13965153 上传时间:2026-05-18 格式:PPT 页数:92 大小:656KB 下载积分:10 金币
下载 相关 举报
平稳时间序列的判断及建模课件.ppt_第1页
第1页 / 共92页
平稳时间序列的判断及建模课件.ppt_第2页
第2页 / 共92页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第二章,时间序列的预处理,运用时间序列模型进行预测的基本程序,(一)根据时间序列的散点图、自相关函数和偏自相关函数图以,ADF,单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。,运用时间序列模型进行预测的基本程序,(二)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。,运用时间序列模型进行预测的基本程序,(三)根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合,AR,模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合,MA,模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合,ARMA,模型。,运用时间序列模型进行预测的基本程序,(四)进行参数估计,检验是否具有统计意义。(五)进行假设检验,诊断残差序列是否为白噪声。(六)利用已通过检验的模型进行预测分析。,时间序列的预处理,拿到一个观察值序列之后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。根据检验的结果可以将序列分为不同的类型,对不同类型的序列我们会采用不同的分析方法。,本章结构,平稳性检验,异常点检验与缺省值的补足,纯随机性检验,2.1,平稳性检验,特征统计量,平稳时间序列的定义,平稳时间序列的统计性质,平稳时间序列的意义,平稳性的检验,特征统计量,平稳性是某些时间序列具有的一种统计特征。要描述清楚这个特征,我们必须借助如下统计工具。,概率分布,概率分布的意义,数理统计的基础知识告诉我们分布函数或密度函数能够完整地描述一个随机变量的统计特征。同样,一个随机变量族的统计特性也完全由它们的联合分布函数或联合密度函数决定。,概率分布,对于时间序列 ,它的概率分布定义为:,任取正整数 ,任取 ,则,维随机向量 的联合概率分布记为 ,由这些有限维分布函数构成的全体,概率分布,就称为序列 的概率分布族。,概率分布族是极其重要的统计特征描述工具,因为序列的所有统计性质理论上都可以通过概率分布推测出来,但是概率分布族的重要性也就停留在这样的理论意义上。在实际应用中,要得到序列的联合概率分布几乎是不可能的,而且联合概率分布通常涉及非常复杂的数学运算,这些原因使我们很少直接使用联合概率分布进行时间序列分析。,特征统计量,一个更简单、更实用的描述时间序列统计特征的方法是研究该序列的低阶矩,特别是均值、方差、自协方差和自相关系数,它们也被称为特征统计量。,特征统计量,尽管这些特征统计量不能描述随机序列全部的统计性质,但由于它们概率意义明显,易于计算,而且往往能代表随机序列的主要概率特征,所以我们对时间序列进行分析,主要就是通过分析这些统计量的统计特性,推断出随机序列的性质。,特征统计量,均值,方差,自协方差,自相关系数,特征统计量,之所以称它们为自协方差函数和自相关系数,是因为通常的协方差函数和相关系数度量的是两个不同事件彼此之间的相互影响程度,而自协方差函数和自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。,特征统计量,若前 期的行为对现在时刻行为有一定的影响作用,则 与 可能是相关的而不是无关的。其作用程度具体表现为相关程度的高低。相关程度高,影响作用大,反之亦然。若某一时刻的值对其 期以后的值没有影响作用,则自相关系数几乎为零,可见,系统的动态性完全可用自相关函数来刻画。,平稳时间序列的定义,严平稳,严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。,宽平稳,宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。,平稳时间序列的统计定义,满足如下条件的序列称为严平稳序列,满足如下条件的序列称为宽平稳序列,平稳时间序列,在实践中要获得随机序列的联合分布是一件非常困难的事,而且即使知道随机序列的联合分布,计算和应用也非常不便。所以严平稳时间序列通常只具有理论意义,在实践中用得更多的是条件比较宽松的宽平稳时间序列。,严平稳与宽平稳的关系,一般关系,严平稳条件比宽平稳条件苛刻。严平稳是对序列联合分布的要求,以保证序列所有的统计特征都相同;而宽平稳只要求序列二阶平稳,对于高于二阶的矩没有任何要求。通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立。,严平稳与宽平稳的关系,但这不是绝对的,两种情况都有特例,不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列。对柯西分布序列 ,每个,有密度函数,严格地讲,只有存在二阶矩的严平稳序列才能保证它一定也是宽平稳序列。,严平稳与宽平稳的关系,当序列服从多元正态分布时,宽平稳可以推出严平稳。从正态随机序列的密度函数可以看出,它的 维分布仅由均值向量和协方差阵决定,换言之,对正态随机序列而言,只要二阶矩平稳,就等于分布平稳了。,严平稳与宽平稳的关系,在实际应用中,研究最多的是宽平稳随机序列,以后见到平稳随机序列,如果不加特殊注明,指的都是宽平稳随机序列。如果序列不满足平稳条件,就称为非平稳序列。,平稳时间序列的统计性质,常数均值,自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关,根据这个性质,可以将,自协方差函数由二维简化为一维,即,平稳时间序列的统计性质,对于,平稳时间序列 ,任取,,定义 为时间序列,的延迟 自协方差函数:,根据平稳序列的这个性质,容易推断出平稳随机序列一定具有常数方差:,自相关系数的概念与性质,由延迟 自协方差函数的概念可以等价,得到延迟 自相关系数的概念,规范性,对称性,非负定性,非唯一性,平稳时间序列的意义,时间序列分析方法作为数理统计学的一个专业分支,它遵循数理统计学的基本原理,都是利用样本信息来推测总体信息。,根据数理统计学知识,显然要分析的随机变量越少越好,而每个变量获得的样本信息越多越好。因为随机变量越少,分析的过程越简单,而样本容量越大,分析的结果就会越可靠。,平稳时间序列的意义,时间序列数据结构的特殊性,可列多个随机变量,而每个变量只有一个样本观察值,平稳性的重大意义,极大地减少了随机变量的个数,并增加了待估变量的样本容量,极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度,平稳时间序列的意义,在平稳序列场合,序列的均值等于常数意味着原本含有可列多个随机变量的均值序列,变成了只含有一个变量的常数序列,原本每个随机变量的均值 只能依靠唯一的一个样本观察值 ,都变成了常数均值 的样本观察值,平稳性的检验,对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。,图检验方法是一种操作简单、运用广泛的平稳性判别方法,它的缺点是判别结论带有很强的主观色彩。所以最好能用统计检验方法加以辅助判断。,平稳性的检验(图检验方法),时序图检验,根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征,自相关图检验,平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零,自相关图检验,从第下章我们将知道,一个零均值平稳序列的自相关函数要么是截尾的,要么是拖尾的。因此,如果一个时间序列零均值化以后的自相关函数出现了缓慢衰减或周期性的衰减的情况,则说明序列可能存在某种趋势或周期性。,例题,例2.1,检验,1964,年,1999,年中国纱年产量序列,的平稳性,例,2.2,检验,1962,年,1,月,1975,年,12,月平均每头奶牛月产奶量序列,的平稳性,例,2.3,检验1949年1998年北京市每年最高气温序列的平稳性,例,2.1时序图,例,2.1自相关图,例,2.2时序图,例,2.2 自相关图,例,2.3时序图,例,2.3自相关图,例题,例2.,4,检验,19,90,年,2006,年国家财政用于科学研究的支出序列,的平稳性,例,2.,5,检验,19,96,年,5,月,20,日,1996,年,9,月,27,日上海证券交易所每日收盘的综合指数序列,的平稳性,例,2.4,程序,data example;,input x;,t=intnx(year,01jan1990d,_n_-1);,format t year4.;,cards;,139.12 160.69 189.26 225.61 268.25,302.36 348.63 408.86 438.60 543.85,例,2.4,程序,575.62 703.26 816.22 975.54 1095.34,1334.91 1688.50,;,proc,gplot,;,symbol i=joint v=none;,plot x*t;,例,2.4,程序,proc,arima,data=example;,identify,var,=,sha,nlag,=22;,run;,quit;,例,2.5,程序,data example;,input x;,t=_n_;,cards;,例,2.5,程序,proc,gplot,;,symbol i=joint v=none;,plot x*t;,proc,arima,;,identify,var,=x,nlag,=9;,run;,quit;,2,.,2,异常点检验与缺省值的补足,为了对某系统进行控制或预测,必须通过观察得到时间序列的样本,然后据此样本建立动态模型。,1,时间序列数据的采集,2,异常点的检验与处理,例,2.6,程序,data example;,input x ;,t=_n_;,cards;,0.672104 0.3413,0.3413,-0.1557 0.0639 0.05465 0.1101 0.0824 0.0819 0.2252 0.289234 0.3584,例,2.6,程序,0.1693 0.3001 0.0618 0.1001 0.32914 0.0927 0.3852 0.2278 0.09804 -0.1487 0.0639 0.1880 0.0625 1.5979 -0.1557 -0.1031,-0.108919 0.6952 0.2078 0.2067,;,例,2.6,程序,proc,gplot,;,symbol i=,jiont,v=dot;,plot x*t;,proc,univariate,normal;/*,也可采用,MEANS,过程或,SUMMARY,过程*,/,var,x;,run;,quit;,3,缺失值的补足,data example;,input price;,time=intnx(month,01jan2008d,,,_n_-1);,format time date.;,cards;,3.41 3.45 .3.53 3.45,;,proc expand data=example out=example_1;,id time;,proc print data=example_1;,run;,quit;,2.,3,纯随机性检验,拿到一个观察值序列之后,首先是判断它的平稳性。通过平稳性检验,序列可以分为平稳序列和非平稳序列两大类。,对于非平稳序列,由于它不具有二阶矩平稳的性质,所以对它的统计分析要周折一些,通常要进行进一步的检验、变换或处理之后,才能确定适当的拟合模型。,2.,3,纯随机性检验,如果序列平稳,情况就简单多了,有一套非常成熟的平稳序列建模方法。但是,并不是所有的平稳序列都值得建模。只有那些序列值之间具有密切的相关关系,历史数据对未来的发展有一定影响的序列,才值得我们花时间去挖掘历史数据中的有效信息,用来预测序列未来的发展。,2.,3,纯随机性检验,如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列我们称之为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。,2.,3,纯随机性检验,为了确定平稳序列还值不值得继续分析下去,我们需要对平稳序列进行纯随机性检验,纯随机序列的定义,纯随机性的性质,纯随机性检验,纯随机序列的定义,纯随机序列也称为白噪声序列,它满足如下两条性质,纯随机序列的定义,之所以称之为白噪声序列,是因为人们最处发现白光具有这种特性。容易证明白噪声序列一定是平稳序列,而且是最简单的平稳序列。,例,2.7,随机产生,1000,个服从标准正态分布的,白噪声序列观察值,并绘制时序图。,标准正态白噪声序列时序图,白噪声序列的性质,纯随机性,由于,白噪声序列具有如下性质:,这说明白噪声序列的各项之间没有任何相关关系,这种“没有记忆”的序列就是纯,随机,序列。,白噪声序列的性质,纯随机序列各项之间没有任何关联,序列在进行完全无序的随机波动。一旦某个随机事件呈现出纯随机运动的特征,就认为该随机事件没有包含任何值得提取的有用信息,我们就应该终止分析了。,如果序列值之间呈现出某种显著的相关关系:,白噪声序列的性质,就说明该序列不是纯随机序列,该序列间隔期的序列值之间存在着一定程度的相互影响关系,这种相互影响关系,统计上称为相关信息。我们分析的目的就是要想方设法把这种相关信息从观察值序列中提取出来。一旦观察值序列中蕴含的相关信息被我们充分提取出来了,那么剩下的残差序列就应该呈现出纯随机的性质。所以纯随机性还是我们判断相关信息是否提取充分的一个判别标准。,白噪声序列的性质,方差齐性,所谓方差齐性,就是指序列中每个变量的方差都相等,即,在时间序列分析中,方差齐性是一个非常重要的限制条件。因为根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的。如果假定不成立,最小二乘估计值就不是方差最小线性无偏估计,拟合模型的预测精度会受到很大影响。,白噪声序列的性质,所以我们在进行模型拟合时,检验内容之一就是要检验拟合模型的残差是否满足方差齐性假定。如果不满足,那就说明残差序列还不是白噪声序列,即拟合模型没有充分提取随机序列中的相关信息,这时拟合模型的精度是值得怀疑的。在这种场合下,我们通常需要使用适当的条件异方差模型来拟合该序列的发展。,纯随机性检验,纯随机性检验也称为白噪声检验,是专门用来检验序列是否为纯随机序列的一种方法。我们知道如果一个序列是纯随机序列,那它的序列值之间应该没有任何相关关系,即满足,纯随机性检验,这是一种理论上才会出现的理想状态。实际上,由于观测值序列的有限性,导致纯随机序列的样本自相关系数不会绝对为零。,例,2.7,续 绘制例,2.7,标准正态白噪声序列的样本自相关图。,例,2.7,续:,标准正态白噪声序列样本自相关图,样本自相关图,纯随机性检验,样本自相关图显示这个纯随机序列没有一个样本自相关系数严格等于零。但这些自相关系数确实都非常小,都在零值附近以一个很小的幅度做着随机波动。这就提醒我们应该考虑样本自相关系数的分布性质,从统计意义上来判断序列的性质。,纯随机性检验,检验原理,假设条件,检验统计量,判别原则,Barlett,定理,如果一个时间序列是纯随机的,得到一个观察期数为 的观察序列,,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布,Barlett,定理,根据,Barlett,定理,我们可以构造检验统计量来检验序列的纯随机性。,假设条件,由于序列之间的变异性是绝对的,而相关性是偶然的,所以假设条件如下确定。,假设条件,原假设:延迟期数小于或等于 期的序列值之间相互独立,备择假设:延迟期数小于或等于 期的序列值之间有相关性,检验统计量,Q,统计量,LB,统计量,判别原则,拒绝原假设,当检验统计量大于 分位点,或该统计量的,P,值小于 时,则可以以 的置信水平拒绝原假设,认为该序列为非白噪声序列,接受原假设,当检验统计量小于 分位点,或该统计量的,P,值大于 时,则认为在 的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定,例,2.7,续:,标准正态白噪声序列纯随机性检验,延迟,统计量检验,统计量值,P,值,延迟,6,期,2.36,0.8838,延迟,12,期,5.35,0.9454,由于,P,值显著大于显著性水平 ,所以该序列不能拒绝纯随机的原假设。,检验结果,还需要解释的一点是,为什么在本例中只检验了前,6,期和前,12,期延迟的,Q,统计量和,LB,统计量就直接判断该序列是白噪声序列呢?为什么不进行全部,999,期延迟检验呢?,这是因为平稳序列通常具有短期相关性,如果序列值之间存在显著的相关关系,通常只存在于延迟时期比较短的序,检验结果,列值之间。所以,如果一个平稳序列短期延迟的序列值之间都不存在显著的相关关系,通常长期延迟之间就更不会存在显著的相关关系。,另一方面,假如一个平稳序列显示出显著的短期相关性,那么该序列就一定不是白噪声序列,我们就可以对序列值之间存在的相关性进行分析。假如此时考虑的延迟期数太长,反而可能淹没了该序列的短期相关性。因为平稳序列只要延迟期足够长,自相关系数都会收敛于零。,例,2.8,对,1950,年,1998,年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验,时序图,自相关图,白噪声检验结果,延迟阶数,LB,统计量检验,LB,检验统计量的值,P,值,6,75.46,0.0001,12,82.57,0.0001,2.4,方差的同质性检验,方差的同质性是平稳时间序列的一个非常重要的限制条件。,例,对时序观测值,19,23,21,13,21,24,27,20,20,18,19,15,22,25,27,22,进行方差齐性检验,.,SAS,的,F,检验,data example;,do a=1 to 4;,do i=1 to 4;,input x;,output;,end;,end;,SAS,的,F,检验,cards;,19,23,21,13,21,24,27,20,20,18,19,15,22,25,27,22,;,proc anova;,class a;,model x=a;,SAS,的,F,检验,means a/hovtest;,run;,quit;,方差的稳定性转换,在时间序列方差不同质的情况下,如果可以对观测数据进行某种转换,使转换后观测数据的方差近似同质,则称这种数据转换为方差的稳定性转换。,例,观测数据如下:,58,86,92,95,93,97,90,72,67,39,51,63,77,57,57,59,45,45,80,38,36,39,85,94,方差的稳定性转换,试先对原始数据进行方差同质性检验;再作平方根反正弦转换后的方差同质性检验。,分析转换前的数据所用的,SAS,程序。,data ex;,do a=1 to 4;,do i=1 to 6;,方差的稳定性转换,input x;,output;,end;,end;,cards;,58,86,92,95,93,97,90,72,67,39,51,63,77,57,57,59,45,45,80,38,36,39,85,94,方差的稳定性转换,;,proc anova;,class a;,model x=a;,means a/hovtest;,run;,quit;,方差的稳定性转换,分析转换后的数据所用的,SAS,程序。,data ex;,do a=1 to 4;,do i=1 to 6;,input x;,y=arsin(sqrt(x/100);,output;,方差的稳定性转换,end;,end;,cards;,58,86,92,95,93,97,90,72,67,39,51,63,77,57,57,59,45,45,80,38,36,39,85,94,;,方差的稳定性转换,proc anova;,class a;,model y=a;,means a/hovtest;,run;,quit;,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服