1、时间序列分析总复习精品资料 王茂林 一、选择题1.已知2000-2006年某银行的年末存款余额,要计算各年平均存款余额,该平均数是:( b ) a. 几何序时平均数; b.“首末折半法”序时平均数;c. 时期数列的平均数; d.时点数列的平均数。2.某地区粮食增长量19901995年为12万吨,19962000年也为12万吨。那么,19902000年期间,该地区粮食环比增长速度( d )a.逐年上升 b.逐年下降 c.保持不变 d.不能做结论3.某商业集团20002001年各季度销售资料如下:2000年2001年123412341.零售额(百万)2.季初库存额(百万)3.流通费用额(百万)4.
2、商品流转次数(次/季)40203.81.9542213.219.538222.81.6544243.21.848253.01.8850263.12.0440233.11.6360284.02.03上表资料中,是总量时期数列的有( d )a. 1、2、3 b. 1、3、4 c. 2、4 d. 1、34.利用上题资料计算零售额移动平均数(简单,4项移动平均),2001年第二季度移动平均数为(a )a. 47.5 b. 46.5 c. 49.5 d. 48.4二、判断题1.连续12个月逐期增长量之和等于年距增长量。2.计算固定资产投资额的年平均发展速度应采用几何平均法。3.用移动平均法分析企业季度销
3、售额时间序列的长期趋势时,一般应取4项进行移动平均。4.计算平均发展速度的水平法只适合时点指标时间序列。5.某公司连续四个季度销售收入增长率分别为9%、12%、20%和18%,其环比增长速度为0.14%。正确答案:(1)错;(2)错;(3)对;(4)错;(5)错。三、计算题:1某企业2000年8月几次员工数变动登记如下表:8月1日8月11日8月16日8月31日1 2101 2401 3001 270试计算该企业8月份平均员工数。解:该题是现象发生变动时登记一次的时点序列求序时平均数,假设员工人数用y来表示,则: 该企业8月份平均员工数为1260人。2. 某地区“十五”期间年末居民存款余额如下表
4、:(单位:百万) 年份200020012002200320042005存款余额7 0349 11011 54514 74621 51929 662试计算该地区“十五”期间居民年平均存款余额。解:居民存款余额为时点序列,本题是间隔相等的时点序列,运用“首末折半法”计算序时平均数。 15053.60(百万)该地区“十五”期间居民年平均存款余额为15053.6百万。3.某企业2007年产品库存量资料如下: 单位:件日期库存量日期库存量日期库存量1月1日1月31日2月28日3月31日636088464月30日5月31日6月30日7月31日8月31日50557048499月30日10月31日11月30日
5、12月31日60685458试计算第一季度、第二季度、上半年、下半年和全年的平均库存量。解:产品库存量是时点序列,本题是间隔相等的时点序列,运用“首末折半法”计算平均库存量。 计算公式:第一季度平均库存量:0(件)第二季度平均库存量:3(件)上半年平均库存量:2(件)下半年平均库存:(件)全年的平均库存量: (件)4.某企业20002005年底工人数和管理人员数资料如下: 单位:人年份工人数管理人员数年份工人数管理人员数2000200120021 0001 2021 1204043502003200420051 2301 2851 415526064试计算19912005年该企业管理人员数占工
6、人数的平均比重。解:本题是计算相对数序时平均数。计算公式: y:管理人员占工人数的比重;a:管理人员数;b:工人数。 20012005年企业管理人员占工人数的平均比重为4.255某地区20002005年社会消费品零售总额资料如下: 单位:亿元200020012002200320042005社会消费品零售总额8 2559 38310 98512 23816 05919 710要求:计算全期平均增长量、平均发展速度和平均增长速度,并列表计算(1)逐期增长量和累积增长量;(2)定基发展速度和环比发展速度;(3)定基增长速度和环比增长速度;(4)增长1%的绝对值。解: 单位:亿元年度200020012
7、002200320042005社会消费品零售额()8255938310985122381605919710逐期增长量()11281602125338213651累积增长量()_112827303983780411455定基发展速度()(%)_113.66133.07148.25194.54238.76环比发展速度()(%)_113.66117.07111.41131.22122.73定基增长速度()(%)_13.6633.0748.2594.5438.76环比增长速度()(%)_13.6617.0711.4131.2222.73增长1的增长量(/100)_82.5593.83109.85122
8、.38160.59 平均增长量2291(亿元)平均发展速度平均增长速度119.0110019.016某地区2006年末人口数为2000万人,假定以后每年以9的速度增长,又知该地区2006年GDP为1240亿元。要求到2010年人均GDP达到9500元,试问该地区2010年的GDP应达到多少?2007年到2009年GDP的年均增长速度应达到多少?解:2004年末该地区人口:2054.49(万人) 2005年末该地区人口:2072.98(万人) 2005年该地区的平均人口为:(2054.49+2072.98)/2=2063.76(万人) 所以,该地区2005年的GDP:95002063.76196
9、05625(万元) 20022004年该地区GDP的年均增长速度:所以,要使2005年的人均GDP达到9500元,20022005年GDP的年均增长速度应达到12.13。7.某企业19932007年产品产量资料如表:要求:(1)进行三项中心化移动平均修匀。(2)根据修匀后的数据用最小二乘法配合直线趋势方程,并据以计算各年的趋势值。(3)预测2009年该企业的产品产量。 单位:件年份产量年份产量年份产量19931994199519961997344416435440450199819992000200120024684864965225802003200420052006200758056954
10、8580629解:(1) 三项中心化移动平均修匀: 年份19931994199519961997数据三项移动平均344416398.33435430.33440441.67450452.67年份19981999200020012002数据三项移动平均468468486483.33496501.33522532.67580367.33年份20032004200520062007数据三项移动平均580576.3569565.67548565.67580585.67629(2)直线趋势方程:将修匀后的数据代入最小二乘法求参数的公式:,可得:最小二乘法计算表年份时间变量ti产量yiti2tiyi199
11、41398.331398.3319852430.334860.6619963441.6791325.0119974452.67161810.681998546825234019996483.33362899.9820007501.33493509.3120018532.67644261.3620029367.33813305.97200310576.31005763200411565.671216222.37200512567.671446812.04200613585.671697613.71合 计916370.9781947122.42根据方程计算各年的趋势值,得到如下数据:年份趋势值19
12、94406.811995420.691996434.571997448.451998462.33年份趋势值1999476.212000490.092001503.972002517.852003531.73年份趋势值2004545.612005559.492006573.372007587.25 (3)根据配合的方程,对2009年企业的产品产量进行预测。2002年时,t15,所以预测值为:(件)8某市集市2004-2007年各月猪肉销售量(单位:万公斤)如下表: 1月2月3月4月5月6月7月8月9月10月11月12月200420052006200740434055505264724145586
13、23941566045486770536574866879849873869510850647687486068784345566338415258试分别用同期平均法和移动平均剔除法计算季节指数。解:(1)用同期平均法中的比率平均法计算季节指数 第一、计算各周期月平均数: ,得:49,55.75,65.83,74.75 第二、计算各指标值的季节比率和季节比率的平均数: 季节比率: 季节比率平均数:计算季节比率和季节比率平均数(最后一行是季节比率平均数,其余是季节比率),结果如下: 月年12345678910111219980.821.020.840.80.921.081.391.491.020
14、.980.880.7819990.770.930.810.740.861.171.421.541.151.080.810.7420000.610.970.880.851.021.121.281.441.151.030.850.7920010.740.960.830.80.941.151.311.441.161.040.840.780.730.970.840.800.931.131.351.481.121.030.840.77第三,计算季节指数: 首先计算之和:12 所以,各时期的季节比率等于其季节指数。(2)用移动平均剔除法计算季节指数年月猪肉销售量中心化移动平均数季节比率季节比率的平均数20
15、0412345678910111220051234567891011122006123456789101112200712344050413945536873504843384352454148657986646045414064585667748495766856525572626049.1349.3349.5849.8350.0450.6751.6352.6353.7554.8355.4255.6355.635657.0458.2159.6360.7961.3861.9662.8363.6764.4665.3866.4667.4267.9268.2568.5469.1770.2571.38
16、72.3873.251.3841.481.0080.9630.8590.750.8330.9880.8370.7480.8661.1691.421.5361.1221.0310.7550.6740.6521.0330.9230.881.0391.1321.2641.4091.1190.9960.8170.7520.7831.0090.8570.8191.361.471.0810.810.730.761.010.870.820.951.155678910708698108877873.9674.50.9461.154由于,所以,季节指数等于季节平均数。9.某地区1998年到2007年的GDP如下
17、表,请选择最适合的值,并用一次指数平滑模型预测1992年2001年的GDP(单位:亿元)。年份GDP年份GDP19981999200020012002216266345450577200320042005200620076797488168951 036解:本题取平滑初始值为1998、1999和2000年GDP的算术平均数,275.67。按照均方根误差最小的原则选取的值。具体过程略,最后选定,预测值如下所示: 年份19981999200020012002GDP216266345450577预测值275.67344.31448.94575.72年份20032004200520062007GDP6
18、797488168951036预测值677.97747.3815.31894.21034.58一、随机过程(Stochastic Process)定义 设(,F,P)是概率空间,T是给定的参数集,如果对于任意tT,都有一定义在(,F ,P)上的随机变量X(t,)与之对应,则称随机变量族X(t,),tT为随机过程。简记为X(t,),tT或Xt,tT 或XT离散参数的随机过程也称为随机序列或(随机)时间序列。上述定义可简单理解成:随机过程是一簇随机变量Xt,tT,其中T表示时间t的变动范围,对每个固定的时刻t而言,Xt是一普通的随机变量,这些随机变量的全体就构成一个随机过程。当t=0,1,2,时,
19、即时刻t只取整数时,随机过程Xt,tT可写成如下形式,Xt,t=0,1,2,。此类随机过程Xt是离散时间t的随机函数,称它为随机序列或时间序列。对于一个连续时间的随机过程的等间隔采样序列,即Xt,t=0,1,2,就是一个离散随机序列。二、时间序列的概率分布和数值特征1、时间序列的概率分布一个时间序列便是一个无限维的随机向量。一个无限维随机向量X=(,X-1,X0,X1,)/的概率分布应当用一个无限维概率分布描述。根据柯尔莫哥夫定理,一个时间序列的概率分布可以用它有限维分布簇来描述。时间序列所有的一维分布是:,F-1(),F0(),F1(),所有二维分布是:Fij(,), i,j=0,1,2,(
20、ij)一个时间序列的所有有限维分布簇的全体,称为该序列的有限维分布簇。2、时间序列的均值函数一个时间序列的均值函数是指:其中EXt表示在t固定时对随机变量Xt的求均值,它只一维分布簇中的分布函数Ft()有关。3、时间序列的协方差函数与自相关函数与随机变量之间的协方差相似,时间序列的协方差函数定义为:其中Ft,s(X,Y)为(Xt,Xs)的二维联合分布。类似可以定义时间序列的自相关函数,即:时间序列的自协方差函数有以下性质: (1) 对称性:(2) 非负定性:对任意正整数m和任意m个整数k1, k2,。 km,方阵为对称非负定矩阵。时间序列的自相关函数同样也具有上述性质且有(t,t)=1。三、平
21、稳随机过程平稳时间序列是时间序列分析中一类重要而特殊的随机序列,时间序列分析的主要内容是关于平稳时间序列的统计分析。(一)两种不同的平稳性定义: 1、 严平稳:如果对于时间t的任意n个值和任意实数,随机过程的n维分布满足关系式:则称为严平稳过程。 2、宽平稳:若随机过程的均值(一阶矩)和协方差存在,且满足(1)(2)则称为宽平稳随机过程。通常说的平稳是指宽平稳。二者的联系:()严宽:因为宽平稳要求期望和协方差存在,而严平稳要求概率分布存在,而不能断言一、二阶矩存在。()宽严,这是不言而喻的。()严平稳+二阶矩存在宽平稳。但反过来一般不成立。()对于正态过程来说,有:严平稳宽平稳(二)平稳时间序
22、列自协方差函数和自相关函数为了叙述方便,常假定平稳时间序列的均值为零,即。用以下记号表示平稳序列的自协方差函数,即相应地,的自相关函数用以下记号平稳序列的自协方差函数列和自相关函数列具有以下性质:(1) 对称性:;(2) 非负定性:对于任意正整数m,为非负定对称方阵;(3) 。(三)平稳序列的样本统计量(1) 样本均值时间序列无法获得多重实现,多数时间序列仅包含一次实现,对于一个平稳序列用时间均值代替总体均值。即 上式的估计是无偏的。(2) 样本自协方差函数第一式是有偏估计,第二式是无偏估计,但有效性不如第一式。其它概率性质和偏自相关函数的定义将在以后章节介绍。四、几类特殊的随机过程(序列):
23、1、纯随机过程:随机过程如果是由一个不相关的随机变量的序列构成的,则称其为纯随机过程。2、白噪声序列(White noise):如果时间序列满足以下性质:(1)(2)式中,当ts时,。称此序列为白噪声序列,简称白噪声。白噪声是一种最简单的平稳序列。(3)独立同分布序列:如果时间序列中的随机变量Xt,t=0,1,2,为相互独立的随机变量,而且Xt具有相同的分布,称这样的时间序列为独立同分布序列。独立同分布序列是一种最简单的严平稳序列。一般说,白噪声序列与独立同分布序列是不同的两种序列,当白噪声序列为正态序列时,它也是独立同分布序列,此时称之为正态白噪声序列。(4)独立增量随机过程:对于任意正整数
24、n,任意,随机变量相互独立。简单地讲,就是任意两相邻时刻上的随机变量之差(增量)是相互独立的。(5)二阶矩过程:若随机过程对每个的均值和方差存在,则称之为二阶矩过程。(6)正态过程:若的有限维分布都是正态分布,则称为正态随机过程。主要介绍三种单变量模型:自回归(AR)模型、移动平均(MA)模型和自回归移动平均(ARMA)模型。第一节 自回归模型一、一阶自回归模型AR(1) 如果时间序列独立,就是说事物的后一时刻的行为主要与其前一时刻的行为毫无关系。这样的资料所揭示甲统计规律就是事物独立地随机变动,系统无记忆能力。如果情况不是这样,资料之间有一定的依存性。后一时刻的行为主要与前一时刻的行为有关,
25、而与其前一时刻以前的行为无直接关系,即已知Xt-1;Xt主要与Xt-1相关。用记忆性来说,就是最短的记忆,即一期记忆,也就是一阶动态性。描述这种关系的数学模型就是一阶自回归模型。即 记作AR(1)。其中Xt 零均值平稳序列,t 为随机扰动。1、 一阶自回归模型的特点Xt对Xt-1有线性相关关系t为独立正态同分布序列2、 AR(1)与普通一元线性回归的关系一元线性回归一阶自回归两个变量,Y为随机变量,X为确定性变量;一个变量,为随机变量;为白噪声序列,;;;还可假定为正态分布。主要区别:(1) 普通线性回归模型需要一组确定性变量值和相应的观测值;()模型只需要一组随机变量的观测值。(2) 普通一
26、无线性回归表示的是一随机变量对另一个确定性变量的依存关系;而AR(1)表示的是一个随机变量对其自身过去值的依存关系。(3) 普通线性回归是在静态的条件下研究的;AR(1)是在动态的条件下研究的。(4) 二者的假定不同。(5) 普通回归模型实质是一种条件回归,而AR(1)是无条件回归。主要联系:固定时刻t-1,且观察值Xt-1已知时,AR(1)就是一个普通的一元线性回归。二、 AR(1)模型的特例随机游动、 随机游动模型 、模型的特性() 系统具有极强的一期记忆性,系统在t-1和t时刻的响应,除随机扰动外,完全一致,差异完全是由扰动引起的。() 在时刻t-1时,系统的一步超前预测就是系统在t-1
27、时的响应Xt-1,即。() 系统行为是一系列独立随机变量的和,即 三、一般自回归模型AR(n)其中:为白噪声,。第二节 移动平均模型一、 一阶移动平均模型MA(1)如果系统的响应Xt仅与其前一时刻进入系统的扰动t存在一定的相关关系,则有MA(1)模型: 其中:为白噪声。MA(1)模型的基本假设为:(1)系统的响应Xt仅与其前一时刻进入系统的扰动t有一定的依存关系;(2)为白噪声。二、 一般移动模型MA(m)模型的形式:其中:(1)Xt仅与, ,有关,而与(j=m+1,m+2,)无关;(2)为白噪声。第三节 自回归移动平均(ARMA)模型一、 ARMA(2,1)模型 1、ARMA(2,1)模型的
28、形式:其中:与、和有相关关系,白噪声。2、ARMA(2,1)模型的结构:ARMA(2,1)模型是由一个AR(2)和一个MA(1)两部分构成。3、ARMA(2,1)与AR(1)的区别从模型形式看,ARMA(2,1)比AR(1)的项数多;从模型的动态性看,ARMA(2,1)比AR(1)具有更长的记忆;从计算所需的资料看,ARMA(2,1)需要用t期以前的,这需要从初期开始递归地计算出来,通常取零;从参数估计来看,ARMA(2,1)比AR(1)困难。二、 ARMA(n,n-1)模型ARMA(n,n-1)模型的基本假设为:独立于(j=n,n+1,),从而独立于(j=n+1,n+2,).三、ARMA(n
29、,n-1)模型的合理性 为什么我们以ARMA(n,n-1)模型为一般形式来建立时序模型呢?难道一个ARMA(n,n-1)模型总可以描述一个时间序列吗?对于平稳系统来说,这是毫无疑问的。之所以以ARMA(n,n-1)为基本模型是因为下述理由: 第一,AR、MA、ARMA(n,m)模型都是ARMA(n,n-1)模型的特殊情形。 第二,理论依据:用Hilbert空间线性算子的基本理论可以证明,对于任何平稳随机系统,我们都可以用一个ARMA(n,n-1)模型近似到我们想要达到的程度;用差分方程的理论也可以证明,对于n阶自回归,MA模型的阶数应该是n-1。第三,从连续系统的离散化过程来看,ARMA(n,
30、n1)也是合理的。在一个n阶自回归线性微分方程和任意阶的移动平均数的形式下,如果一个连续自回归移动平均过程在一致区间上抽样,那么,这个抽样过程的结果是ARMA(n,n-1)。【章节实验】利用Eviews软件生成AR序列、MA序列和ARMA序列。第三章 ARMA模型的特性本章为本书重点之一,主要掌握三类模型的格林函数形式、平稳性和可逆性条件、AFC和PAFC的形式和特点。第一节 线性差分方程一、 后移(Backshift)算子:1. 定义:后移算子B定义为,从而。2. 后移算子的性质:(1) 常数的后移算子为常数:(2) 分配律:(3) 结合律:(4) 后移算子B的逆为前移算子(5) 对于,无限
31、求和得前面的MA(m)模型、AR(n)模型和ARMA(n,m)模型可分别表示为: 其中:二、 线性差分方程 可将写成 这里 差分方程通解为: 这里,C (t)是齐次方程解,I (t)是特解。三、 齐次方程解的计算无重根 考虑齐次差分方程 其中 假定G1,G2,Gn是互不相同,则在时刻t的通解: 其中Ai为常数(可由初始条件确定)。重根 设有d个相等的根,可验证通解为 对一般情形,当的因式分解为 齐次方程解便是 因此,齐次方程解是由衰减指数项Gt、多项式tj、衰减正弦项Dtsin(2f0t+F),以及这些函数的组合混合生成的。上述过程中计算并不方便,通常通过解方程得到其根为:。由于的根与的根互为
32、倒数,因此。非齐次方程的特解通常情况下不容易得到,没有一个“万能钥匙”,需要具体问题具体分析,只能对一些具有特殊形式非齐次项的方程进行讨论。此处丛略。第二节 格林函数(Greens function)和平稳性(Stationarity)一、 格林函数(Greens function)1、 定义:设零均值平稳序列能够表示为 (1)则称上式为平稳序列的传递形式,式中的加权系数称为格林(Green)函数,其中。2、 格林函数的含义:格林函数是描述系统记忆扰动程度的函数。式(1)可以记为 (2)其中。式(1)表明具有传递形式的平稳序列可以由现在时刻以前的白噪声通过系统“”的作用而生成,是j个单位时间以
33、前加入系统的干扰项对现实响应的权,亦即系统对的“记忆”。二、 AR(1)系统的格林函数由AR(1)模型 即: 则AR(1)模型的格林函数。如若,则随着j的增大而缓慢减小,表明系统的记忆较强;相反,若,则随着j的增大而急剧减小,表明系统的记忆较弱.例:下面是参数分别为0.9、0.1和-0.9的AR(1)系统对扰动的记忆情况(三个序列由同一正态白噪声序列模拟生成): 比较前后三个不同参数的图,可以看出:() 取正值时,响应波动较平坦。() 取负值时,响应波动较大。() 越大,系统响应回到均衡位置的速度越慢,时间越长。由于其中,因此AR(1)模型可用一个无限阶MA来逼近,这说明AR模型是一种长效记忆
34、模型。三、AR系统的平稳性1、由平稳性的定义求AR(1)系统的平稳性条件将AR(1)模型两边平方再取数学期望,得到 如果序列是平稳的,则有,由上式可得 由于是非负的,所以,从而,这就是AR(1)模型的平稳性条件。利用滞后算子B,AR(1)模型可以写为 式中,那么平稳性条件就等价于的根在单位圆外(或的根落在单位圆内)。上述平稳条件可以推广到AR(n)模型,即其中:的平稳性条件为:的根在单位圆外(或的根在单位圆内)。2、由格林函数求AR(1)模型的平稳性条件对于AR(1)系统来说,其平稳性条件也可以由格林函数得出。如果系统受扰后,该扰动的作用渐渐减小,直至趋于零,即系统响应随着时间的增长回到均衡位
35、置,那么,该系统就是平稳的。相对于格林函数来说,就是随着j,扰动的权数,由于故必有j,显然, 这就是AR(1)系统平稳性条件。反过来,若,则称AR(1)为渐近稳定的,也必是平稳的。 时,=1; 当=1时,=(-1)j 当=-1时这时,虽然响应不回到其均衡位置,但仍是有界的,这时系统为临界稳定的,系统可能存在某种趋势或季节性。 当时,j,任意小的扰动只要给定足够的时间,就会使系统响应正负趋于无穷,永远不会回到其均衡位置,这时系统便是不稳定的,当然是非平稳的。例:求AR(2)模型的平稳域解:特征方程 的根,根据AR模型的平稳性的条件由于是实数,必同为实数或共轭复数,由于,因此 故AR(2)模型的平
36、稳域为四、格林函数与Wold分解(Wolds Decomposition)所谓Wold分解也叫正交分解,其核心就是把一个平稳过程分解成不相关的随机变量的和。由于这一思想是由Wold引入(1938年)到时序分析中的,故叫做Wold分解。他认为可以用线性空间来解释ARMA模型的解。在n维线性空间Ln中,n个线性无关的向量称为空间的一组基。设可由线性表示: 其中由向量和唯一确定,称为向量关于基的坐标。如果用线性空间的观点来看AR(1)模型的解由于是相互独立的,可看作线性空间的基(或无限维坐标轴),显然可由线性表示,其系数就是对于的坐标,就是的正交向量的和。因而上式也叫做Wold分解式,其系数叫Wol
37、d系数。格林函数和Wold系数是同一客体从不同角度观察的结果,二者是完全一致的。Wold系数是线性空间解释,格林函数是系统解释。五、ARMA模型格林函数的通用解法ARMA(n,m)模型 且 则 令 则化为比较等式两边B的同次幂的系数,可得由上式,格林函数可从开始依次递推算出。思考:MA(m)模型的格林函数为 例:ARMA(2,1)系统的格林函数ARMA(2,1)模型可以看作是一个二阶差分方程,设该方程的解是将上式代入模型中: 利用比较系数法,B的同次幂必相等,于是:B的指数:上式可以写成:即: 上式为一关于齐次差分方程的形式,其通解为其中:和是特征方程的根;和是任意常数,其值由初始条件确定。这
38、里的初始条件是:则ARMA(2,1)系统的格林函数为:ARMA(2,1)模型的格林函数也可以通过下面的过程求得。根据Wold分解,平稳ARMA(2,1)模型可以写成即:AR(2)为ARMA(2,1)模型的特殊形式,同样具有上述关系。例:ARMA(n,n-1)系统的格林函数与上面方法相同,ARMA(n,n-1)系统的格林函数的隐式的递推式为:其中 由下列式子导出 即 其最终解为:其中:例:ARMA(2,1)系统的平稳性条件ARMA(2,1)的平稳性条件要求:。由得:,即的根在单位圆内。由于ARMA(2,1)的特征方程和AR(2)和形式一样(或者说和其移动平均项系数无关),因此其平稳域与AR(2)系统的平稳域相同,都是:思考:MA模型的平稳性条件。第三节 逆函数