1、单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,时间序列分析,是,数理统计,这一学科的一个重要分支.时间序列分析的最基本的理论基础是20世纪40年代分别由,Norbort Wiener,和,Andrei Kolmogonov,独立给出的.在60年代后期,时间序列分析在,Box-Jenkins,提出一套比较完善的建模理论及方法之后便迅速发展起来近30年来,计算技术和计算机的发展又赋予时间序列分析以新的活力,使之成为自然科学、社会科学领域中不可缺少的数据分析工具。目前,
2、时间序列分析这个分支巳趋于成熟,其理论和方法已被广泛应用到工程技术、气象、水文、地震、生物医学、经济管理以及军事科学等诸多领域作为未来的数据分析、处理的工作者,掌握时间序列分析这一方法十分必要。,时间序列分析方法:,频域方法:借助富里埃分析从频率的角度揭示数据的规律性。,时域方法:借助于时间推移变量之间的相关结构研究数据变化规律。,时间序列分析的主要应用,1、预测,2、政策因素分析,3、信号的提取,4、过程控制,5、随机系统描述,几种统计软件,1,Eviews,Eviews(Econometrics Views),称为计量经济学软件包。使用,EViews,软件包可以对,时间序列和非时间序列,的
3、数据进行分析,建立序列(变量)间的统计关系式,并用该关系式进行预测、模拟等等。此外,,EViews,处理非时间序列数据照样得心应手。实际上,相当大型的非时间序列(截面数据)的项目也能在,EViews,中进行处理。,2,SAS,SAS,是美国,SAS,软件研究所研制的一套大型集成应用软件系统,具有完备的数据存取、数据管理、数据分析和数据展现功能。在数据处理和统计分析领域,被誉为国际上的标准软件和最权威的优秀统计软件包,广泛应用于政府行政管理、科研、教育、生产和金融等不同领域。,SAS,系统中提供的主要分析功能包括统计分析、经济计量分析、,时间序列分析,、决策分析、财务分析和全面质量管理工具等等,
4、3,SPSS,SPSS(Statistical Package for the Social Science),称为社会科学统计软件包,是世界是著名的统计分析软件之一。,SPSS,的基本功能包括数据管理、统计分析、图表分析、输出管理等等。,SPSS,统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、,时间序列分析,、多重响应等几大类。,SPSS,也有专门的绘图系统,可以根据数据绘制各种图形。,4,S-plus,S-plus,基于,S,语言,并由,MathSoft,公司的统计科学部进一步完善。作为统计学家及一般研究人员的通用方
5、法工具箱,,S-plus,强调演示图形、探索性数据分析、统计方法、开发新统计工具的计算方法,以及可扩展性。,S-plus,可以直接用来进行标准的统计分析得到所需结果。,5,Minitab,Minitab,同样是国际上流行的一个统计软件包,其特点是简单易懂,在国外大学统计学系开设的统计软件课程中,,Minitab,与,SAS、BMDP,并列。,Minitab for Windows,统计软件比,SAS、SPSS,等小得多,但其功能并不弱,特别是它的试验设计及质量控制等功能。功能包括:基本统计分析、回归分析、方差分析、多元分析、非参数分析、,时间序列分析,、试验设计、质量控制、模拟、绘制高质量三维
6、图形等,从功能来看,,Minitab,除各种统计模型外,还具有许多统计软件不具备的功能矩阵运算。,课本:,安鸿志编著:时间序列分析,华东师范大学出版社,易丹辉编著:时间序列分析,中国人民大学出版社,参考书:,1.王炜炘,杜金观,伍尤桂,李元著:应用时间序列分析,广西师范大学出版社,1999,2.,James D.Hamilton,著:时间序列分析(刘明志译),中国社会科学出版社,1999,3.,Peter J.Brockwell,Richard A.Davis,著:时间序列的理论与方法(田铮译),高等教育出版社,2001,4.何书元著:应用时间序列分析,北京大学出版社,2003,第一章 平稳时
7、间序列,第一节 时间序列实例,时间序列可分为:,时间序列的定义:,按时间次序排列的随机变量序列,(1.1),称为时间序列,如果用,(1.2),分别表示随机变量 的观测值,就称(1.2)是时间序列,(1.1)的,N,个观测样本。这里,N,是观测样本的个数。如果用,(1.3),表示 的依次观测值,就称(1.3)是(1.1)的一次实现或一,轨道。,时序 可由 或 表示;它的一个实现可由,或 表示。,例1.1(通过一电阻器的电流)电阻为,r,的电阻器两端加一正弦波电压 ,并记录下电流,则得到一连续时间序列,t,t,1790,3929214,1890,62979766,1800,5308483,1900
8、76212168,1810,7239881,1910,92228496,1820,9638453,1920,106000000,1830,12860702,1930,123000000,1840,17063353,1940,132000000,1850,23191876,1950,151000000,1860,31443321,1960,179000000,1870,38558371,1970,203000000,1880,50189209,1980,227000000,例1.2(美国人口总数 ,1790-1980),0.0,E+00,5.0,E+07,1.0,E+08,1.5,E+08,2
9、0,E+08,2.5,E+08,1800,1860,1920,1980,X2_T,0.0,E+00,5.0,E+07,1.0,E+08,1.5,E+08,2.0,E+08,2.5,E+08,1780,1830,1880,1930,1980,T,X_T,t,t,1951,4737,1966,4405,1952,5117,1967,4595,1953,5091,1968,5045,1954,3468,1969,5700,1955,4320,1970,5716,1956,3825,1971,5138,1957,3673,1972,5010,1958,3694,1973,5353,1959,3708
10、1974,6074,1960,3333,1975,5031,1961,3367,1976,5648,1962,3614,1977,5506,1963,3362,1978,4230,1964,3655,1979,4827,1965,3963,1980,3885,例1.3(美国罢工数 ,1951-1980),t,t,t,t,1933,-1,1945,+,1957,-1,1969,1,1934,-1,1946,-1,1958,-1,1970,1,1935,-1,1947,-1,1959,*,1971,-1,1936,1,1948,-1,1960,*,1972,1,1937,-1,1949,-1,1
11、961,*,1973,1,1938,1,1950,1,1962,*,1974,1,1939,-1,1951,1,1963,1,1975,1,1940,1,1952,1,1964,1,1976,1,1941,-1,1953,1,1965,1,1977,1,1942,-1,1954,-1,1966,1,1978,1,1943,-1,1955,1,1967,1,1979,1,1944,1,1956,1,1968,1,1980,1,例1.4(明星棒球队比赛,1933-1980),+=没有比赛,*=安排了两场比赛,例1.5(,Woller,太阳黑子数,1770-1869),月 年,1973,1974,1
12、975,1976,1977,1978,1,9007,7750,8162,7717,7792,7836,2,8106,6981,7307,7461,6957,6892,3,8928,8038,8124,7776,7726,7791,4,9137,8422,7870,7925,8106,8129,5,10017,8714,9387,8634,8890,9115,6,10826,9512,9556,8945,9299,9434,7,11371,10120,10093,10078,10625,10484,8,10744,9823,9620,9179,9302,9827,9,9713,8743,8285
13、8037,8314,9110,10,9938,9129,8433,8488,8850,9070,11,9161,8710,8160,7874,8265,8633,12,8927,8680,8034,8647,8796,9240,例1.6(美国月事故死亡数据,1973-1978,),第二节 趋势项和季节项的 估计和分离,每个时间序列或经过适当的函数变换的时间序列,可以分解成三个部分的叠加,(2.1),其中 是缓慢变化的函数,称为趋势项,,是已知周期为,d,的函数,称为季节项,而称,为随机项。,目的:估计和抽取确定性成分 和 ,以使残差或噪声项 是一平稳过程。进而求得关于过程 的合适的概率模型,
14、分析它的性质,并连同 和 可达到对,进行预报和控制的目的。,剔除趋势项和季节项的两种方法:,(,a),典型分解式(2.1)中 和 的估计,(,b),另一类方法由,Box,与,Jenkins,广泛研究的方法,它是对数据 反复作用差分算子,一直到差分后数据与某一平稳过程 的实现相似,然后可用平稳过程的理论对 进行建模、分析和预报,从而得到对原过程的分析和预报。,情形一:不含季节项的趋势项的删除,一,时间回归法,1,时间线性回归模型,特征,令,则 的最小二乘估计由公式,决定。,趋势项 的估计值,是回归直线,预报,:,当 时,,为时间线性回归的预测模型。,例2.1:1969年至1980年的人均钢材年消
15、费量如下表,求1981至1984年的各年人均年消费量的预测。,年 份,时间序号,t,人均钢材年消费量 (千克),1969,1,12.8,1970,2,15.9,1971,3,18.2,1972,4,18.0,1973,5,19.9,1974,6,19.1,1975,7,21.3,1976,8,20.4,1977,9,21.3,1978,10,25.5,1979,11,28.2,1980,12,28.8,注,1 当数据点的分布基本上呈线性趋势才可使用该方法,注2 不仅注1成立,而且要对残差检验后才可使用线性回归预报模型。,2,时间非线性回归模型,(1),时间,t,的二项式回归模型,令,则 的最小
16、二乘估计由公式,决定。,例2.2(第一节例1.2),趋势项的估计为,假设 ,并且 的估计值,则估计,可作为美国人口在1990年的估计,。,(2),时间指数回归模型,经对数变换后,可表为,在利用1中的相应结果,可给出时间指数回归的预测模型,为:,tN,时,二、,移动平均法,1、一次移动平均值,2、二次移动平均值,3、滞后偏差,4、移动平均法的预测模型,5、移动平均期数的选取,例:由1969至1980年的国民收入的动态数据,使用移动平均法对1981年至1984年的国民收入作出预测,年份,时间序号,t,国民收入,一次移动平均,二次移动平均,1969,1,1555,1970,2,1917,1971,3
17、2051,1841,1972,4,2111,2026.3,1973,5,2286,2149.3,2005.3,1974,6,2311,2236,2137.2,1975,7,2503,2366.7,2250.7,1976,8,2435,2416.3,2339.7,1977,9,2625,2521,2434.7,1978,10,2948,2669.3,2535.5,1979,11,3155,2909.3,2699.9,1980,12,3372,3158.3,2912.3,计算平滑系数,建立预测模型,三、,滑动平均平滑法,设 在区间,t-q,t+q,上近似于线性函数,,设,q,为非负整数,考虑双边
18、滑动,当 ,上式所给出的方法失效,故在实,际应用中,首先定义,例2.3 (第一节例1.3),四,指数平滑法,1,一次指数平滑值,对于任意固定 ,定义单边滑动平均,,为,其中 称为第,t,时期的一次指数平滑值。初始值,。则趋势项的估计可由 给出.,当 时,有,它是 的加权滑动平均。,2,二次指数平滑值,由一次指数平滑值在进行一次指数平滑,它,由如下递推公式计算,其中 称为第,t,时期的二次平滑指数,其初值,的选取方法与 是一样的。,3 预测模型,(1)线性预测模型,当动态数据 的分布呈线性趋势时,采用,二次指数平滑法,有如下线性预测模型,其中,称为平滑系数。,(2)二次型的预测模型,当动态数据
19、的分布呈具有曲率的二次曲线时,,须引入三次指数平滑值,建立如下的二次型的预测模型,其中,例2.4 某厂1981至1986年年销售额如下,求1987年和1988年的预测值,年份,时间序号,t,年销售额 (百万),0,10,10,10,1981,1,10,10,10,10,1982,2,12,10.60,10.18,10.05,1983,3,15,11.92,10.72,10.25,1984,4,14,12.54,11.27,10.56,1985,5,12,12.38,11.60,10.87,1986,6,9,11.37,11.53,11.07,选取 ,初始值,并采用二次型预测模型。指数平滑系数为
20、于是,预测模型为,1987,年和1988年的预测销售额分别为,五.产生平稳数据的,差分方法,定义一阶差分算子,其中,B,是延迟算子。,考虑模型 ,其中 为零均值,平稳过程,则,是均值为 的平稳过程。,例2.5(第一节例1.2的人口数据),对原始数据作二阶差分得到无明显趋势项的数据序,列,情形二:趋势项和季节项的删除,对于含有季节项的数据,我们将时间序号,t,表为年份,序号,i,和每年中个时期序号,j.,当,t,变动而相应,i=1,2,.,m,m,为数据跨越的年数,,j=1,2,k,k,为一年中时期数。,t,与,i,j,的关系按季度或月相应的有,t=4(i-1)+j,或,t=12(i-1)+j
21、一般地,,t=k(i-1)+j,i=1,2,m,j=1,2,k,一,小趋势项方法,举例说明:第一节例1.6,特点:事故数据趋势项较小;有明显周期12,,趋势项的无偏估计为:,季节项 的估计为,第,i,年第,j,月估计的误差项为,趋势项,周期项,随机项,二,滑动平均估计,步骤:,1 选择滑动平均滤波器估计趋势项。当周期为偶数,d=2q,或为奇数,d=2q+1,则,2 估计季节项。分别对,j=1,2,d,,计算偏差,的均值 ,估计,3 由上一部的结果 估计趋势项,4 噪声项的估计,三,延迟,d,步差分,延迟,d,步差分定义为:,步骤:,1 将算子 作用于模型 ,其中,的周期为,d,则有,2,利用
22、前面所介绍的方法消除趋势项 例如差分(即算子 的幂次形式),例2.6 (数据同例1.6),d,步延迟,消除季节项,这里,d=12,由于差分后的序列仍具有非降趋势项,故再作一次,差分,即将算子 作用于 ,差分后的数据,,如图,第三节 时间序列与随机过程,一 随机过程,定义3.1 设(,P),为概率空间,,T,为某一足标集,对 是该概率空间上的一个随机变量,当,t,在,T,中跑遍时,得到一族随机变量 ,记为 或 ,称 为,T,上的随机函数,通常,T,取为,随机函数 中的,T,取(,i),的情形,称 为随机过程;,T,取(,ii),的情形,称 为随机序列,简记为,固定 ,得到随机函数 的一样本函数,
23、在 的情形下,,,它是一条曲线或称为轨道,亦称为随机过程 的一个实现。,对随机序列 ,其一次观测结果是以普通实数列 ,称 为随机序列的一个实现或样本。随机序列 的正整数变量,k,通常表示时间,故常称 为时间序列。,二 随机过程(序列)的概率分布,定义3.2(随机过程 的分布函数族),设,则过程 的有限维分布函数族为,特别当,有,,有限维分布函数的性质,柯,尔莫哥洛夫相容性条件,(1)对 的任一排列 有,(2),若,m1,和,随机变量 相互独立,,则称,N(t),是一个强度为 的,poisson,过程。,定义:,经计算,于是 是一个独立白噪声,称为,poisson,白噪声。,例4.9(布朗运动和
24、正态白噪声)如果连续随机过程,满足:,(1)B(0)=0,且对任何 ,,B(t)-B(s),服从正态分布,N(0,t-s);,(2)B(t),有独立增量性,则称,B(t),是一个标准布朗运动(,Brownian motion).,定义:,则 是一个标准正,态白噪声。,四.平稳线性序列,1.,时间序列的运算,时间序列的运算,是指对一个或几个时间序列作运算而获得新的时间序列。,时间序列的运算可分成以下几种:,(1)时间序列的线性运算,设 与 为两个时序,则,为序列 与 的一种线性运算。,(2)时间序列的延迟运算,设 为一时间序列,,d,为一正整数,那么,为 的,d,步延迟计算,仍为时间序列。,当
25、为严平稳序列时,仍为严平稳序列,当 为宽平稳序列时,仍为宽平稳序列,当 为正态序列时,仍为正态序列。,(3)时间序列的线性和延迟的联合运算,设 为一时序,则 为,i,步延迟序列。再对不同,的,i,将 进行线性运算,即,特别地,,此时,是对序列 的滑动平均序列。,(4)时间序列的非线性计算,是关于 及其延迟的多项式与有理函数,而不是对它们的线性运算。,2.平稳线性序列,平稳线性序列:由白噪声的线性组合构成的平稳序列。,(1),有限运动平均,定义4.5:设 是 ,对于非负整数,q,和常数,,我们称,是白噪声 的(有限,),运动平均,又称滑动平均(,Moving,Average)。,统计性质:是平稳
26、序列,该序列又被称为是,q,相关的。,(2).平稳线性序列,均方收敛:当序列 满足以下极限性质时,称 收敛于随机变量 ,即,记:,定义4.6:设 为白噪声序列,称以下序列为 的无穷滑动平均序列,即,(4.2),定理4.3 由(4.2)定义的时间序列是平稳的,且无穷滑动和是均方收敛的。,证:(1),(2)由于(4.2)在均方意义下收敛,故,定理4.4 由(4.2)定义的时间序列的自协方差函数具有如下的性质:,证:,故,,注:,如果 是独立同分布序列,那么相应的无穷滑动平均序列 是严平稳序列。,如果 是正态白噪声序列,那么 也是正态平稳序列。,定理4.5 设 为二阶矩有穷的,i.i.d.,随机序列
27、则由(4.2)定义的序列 有,(1)为严平稳序列,,(2)(4.2)的无穷滑动和不仅均方收敛,而且几乎处处收敛。,(3),是遍历的。,定义4.6 形如(4.2)的无穷滑动平均序列称为平稳线性序列或线性平稳序列。,3.时间序列的线性滤波,线性低通滤波器:滤掉信号过程中的高频噪声的线性滤波器;,保时线性滤波器:绝对可和的实数列 作用于序列 ,得到序列,若 是平稳信号,且 自协方差函数为,则,有如下性质,期望函数:,自协方差函数:,如果保时滤波器,H,满足,则,它对平稳信号 起平滑的作用,同时对抑制噪声,特,别是抑制高频噪声是有效的。,例4.10 余弦波信号的滤波,(4.3),其中 是零均值平稳列
28、且与 独立。,讨论:余弦波信号的方差 表示信号的强弱。,噪声的方差,信噪比定义为:,信噪比大,信号容易被识别;信噪比过小,信号会被噪,声淹没。,采用余弦滤波器进行滤波后得到,利用三角求和公式,下图中的,X,是来自模型(4.3)的,100,个观测,,b=1.5,是方差等于1的正态白噪声,信噪比是,按照保时线性滤波器(4.1)的定义,并取,M=3,,则输出的信,噪比是3.245。(,sample10),五.遍历性(,Erdogic),一个时间序列的期望和第,j,个自协方差视作如下意义上的总体平均,即,平稳序列 的一个样本是 的一个实现,而不是某个特定时刻,t,的 的简单抽样,故不能直接引用统计
29、中的大数定律的结果。,对于从随机序列中得到的样本量为,N,的实现,,,可计算:,样本均值:,(4.4),样本协方差:,(4.5),它们不是一个总体平均而是一个时间平均。,一个平稳过程被称作是关于,均值遍历,的,如果当 时,(4.4)依概率收敛于 。,如果一个平稳过程的自协方差满足,则 关于均值是遍历的。,一个平稳过程,如果,对所有的,j,都成立,则称该过程是关于,二阶矩遍历的,。,若 是一个正态平稳过程时,条件,足可以保证关于所有阶矩的遍历性。,物理上的解释:,时间平均=总体平均,这一结果表明:求平稳序列的统计特征矩只需序列的一,次实现,而不需要多次实现。,例4.11:一个平稳的但非遍历的过程
30、设第,i,个实现 的均值 是由 分布生成,的,,其中 是独立于 的均值为0,方差为 的正态白,噪声过程。,第五节 线性差分方程,一 后移算子(推移算子、延迟算子),对于任何时间序列 和无穷级数 ,如果级数 在某种意义下收敛(,a.s.,依概率收敛,均方收敛),就定义,(5.0),并称,B,是时间,t,的向后推移算子,简称后移算子,也称为时,滞算子或延迟算子.,推移算子,B,的性质:,(1)对和,t,无关的随机变量,Y,,有,BY=Y;,(2),对常数,n,a,有,(3)对 ,有,(4),对多项式 ,有,(5),对多项式,和,的乘积 ,有,(6),对于时间序列 ,,多项式,和随机变量,U、V、
31、W,,有,二 常系数齐次线性差分方程,定义5.1 设 为实数列,若满足如下关系式,,(5.1),其中 为实系数,为已知实数列,则,称(5.1)为 所满足的,p,阶常系数线性差分方程,简称为,p,阶,线性差分方程,。,特别地,即,(5.2),称(5.2)为(5.1)相应的,p,阶,齐次差分方程,(5.3),称为(5.1)的,特征方程,(5.3)的解称为特征根。,引入延迟算子,则(5.2)可表为,(5.4),令 ,则 的根与(5.3)的特征,根互为倒数。,引理5.1 ,c,为常数,是(5.2)的解的充分必要条件是 为特征根。,推论5.1 若(5.3)有,p,个不同的特征根 ,则,为(5.2)的通解
32、其中 为任意常数,,它们由 的初值唯一确定。,引理5.2 若 ,其中 为常,数(可以是复数),则存在常数 使得,引理5.3 设 ,则,是差分方程,(5.5),的,k,个线性无关的解。,定理5.1 差分方程(5.2)采用算子,B,表示为 .,可分解为,其中 是 的互不相同的根,是,的重数,,则(5.2)的通解,为,其中 为任意常数。,注:,(1)对于 的每个单实根 ,通解中包含形如,的项;,(2)对于 的每个 重根 ,通解中包含形如,的项;,(3)对于 的每对共轭复根(不重),通解中包含形,如,其中,Re(.),表示括号中复数的实部,(4)对于 的每对 重共轭复根 ,通解中,包含形如,三 非线性齐次差分方程,对于非线性齐次差分方程(5.1)的通解,是由相应的齐,次常系数线性差分方程(5.2)的通解加上非齐次常系数线,性差分方程(5.1)的特解组成。,例5.1 设非负齐次常系数差分方程为,(5.6),求它的通解。,






