资源描述
时间序列分析与预测第二讲:时间序列模型大连理工大学经济系原毅军1教学大纲上节课知识要点复习时间序列的基本特征时间序列建摸的两种基本假设确定性时间序列模型随机性时间序列模型2上节课知识要点复习3时间序列同一现象在不同时间上的相继观察值排列而成的数列形式上由现象所属的时间和现象在不同时间上的观察值两部分组成排列的时间可以是年份、季度、月份或其他任何时间形式4国内生产总值等时间序列国内生产总值等时间序列年年 份份国内生产总值国内生产总值(亿元亿元)年末总人口年末总人口(万人万人)人口自然增长率人口自然增长率()居民消费水平居民消费水平(元元)19901991199219931994199519961997199818547.921617.826638.134634.446759.458478.167884.674772.479552.8114333115823117171118517119850121121122389123626124810 14.3912.9811.6011.4511.2110.5510.4210.069.5380389610701331178123112726294430945时间序列的分类时间序列时间序列平均数序列平均数序列绝对数序列绝对数序列相对数序列相对数序列时期序列时期序列时点序列时点序列6时间序列的编制原则时间长短要一致总体范围要一致指标内容要一致计算方法和口径要一致7时间序列的水平分析发展水平平均发展水平增长量平均增长量8发展水平与平均发展水平发展水平现象在不同时间上的观察值说明现象在某一时间上所达到的水平平均发展水平现象在不同时间上取值的平均数,又称序时平均数说明现象在一段时期内所达到的一般水平不同类型的时间序列有不同的计算方法9绝对数序列的序时平均数判断所要计算的绝对数序列的类型根据不同序列的类型选择不同的计算方法绝对数序列绝对数序列时期序列时期序列时点序列时点序列连续时点序列连续时点序列间隔不等的时点序列间隔不等的时点序列间隔相等的时点序列间隔相等的时点序列10绝对数序列的序时平均数 时期序列时期序列计算公式:11绝对数序列的序时平均数间隔不等的时点序列Y Y1 1Y Y2 2Y Y3 3Y Yn nY Y4 4Y Yn-1n-1f f1 1f f2 2f f3 3f fn-1n-112绝对数序列的序时平均数1.1.计算出两个点值之间的平均数计算出两个点值之间的平均数 2.2.用相隔的时间长度用相隔的时间长度 (T Ti i)加权计算总的平均数加权计算总的平均数13绝对数序列的序时平均数当间隔相等(f1=f2=fn-1)时,有Y Y Y1 11Y Y Y2 22Y Y Y3 33Y Y Yn nnY Y Yn-1n-1n-114时间间隔不等的时点序列的序时平均数计算实例设某种股票2004年各统计时点的收盘价如下表,计算该股票2004年的年平均价格某种股票某种股票2004年各统计时点的收盘价年各统计时点的收盘价统计时点统计时点1月月1日日3月月1日日7月月1日日10月月1日日12月月31日日收盘价收盘价(元元)15.214.217.616.315.815增长量报告期水平与基期水平之差,说明现象在观察期内增长的绝对数量分为逐期增长量与累积增长量逐期增长量报告期水平与前一期水平之差计算公式为:Yt=Yt-Yt-1 (t=1,2,n)累积增长量报告期水平与某一固定时期水平之差计算公式为:Yt=Yt-Y0 (t=1,2,n)各逐期增长量之和等于最末期的累积增长量 16平均增长量观察期内各逐期增长量的平均数描述现象在观察期内平均增长的数量计算公式为17时间序列的速度分析发展速度平均发展速度增长速度平均增长速度18发展速度报告期水平与基期水平之比说明现象在观察期内相对的发展变化程度有环比发展速度与定期发展速度之分19环比发展速度与定基发展速度环比发展速度报告期水平与前一期水平之比定基发展速度报告期水平与某一固定时期水平之比20环比发展速度与定基发展速度的关系观察期内各环比发展速度的连乘积等于最末期的定基发展速度 两个相邻的定基发展速度,用后者除以前者,等于相应的环比发展速度21增长速度增长量与基期水平之比,又称增长率说明现象的相对增长程度有环比增长速度与定基增长速度之分计算公式为22环比增长速度与定基增长速度环比增长速度报告期水平与前一时期水平之比定基增长速度报告期水平与某一固定时期水平之比23平均发展速度观察期内各环比发展速度的平均数说明现象在整个观察期内平均发展变化的程度通常采用几何法(水平法)计算计算公式为:24速度指标的分析与应用当时间序列中的观察值出现0或负数时,不宜计算速度例如:假定某企业连续五年的利润额分别为5、2、0、-3、2万元,对这一序列计算速度,在这种情况下,适宜直接用绝对数指标进行分析在有些情况下,不能单纯就速度论速度,要注意速度与水平指标的结合分析25时间序列的基本特征26例:时间序列分析先把时间序列描绘在坐标图上,坐标的横轴表示时间 t,坐标的纵轴表示所分析的经济变量下图描述了某商店某年前10个月的销售额2728某企业从1990年1月到2002年12月的销售数据(单位:百万元)29从这个点图可以看出。总的趋势是增长的,但增长并不是单调上升的;有涨有落。但这种升降不是杂乱无章的,和季节或月份的周期有关系。除了增长的趋势和季节影响之外,还有些无规律的随机因素的作用。30时间序列分析分析时间序列变化的影响因素每一个经济变量的变化,在不同时期受不同因素影响,经济变量的时间序列综合地反映了各种因素的影响影响时间序列变化的主要因素分类长期趋势因素季节变化因素周期变化因素不规则变化因素31时间序列的分解经济变量的时间序列通常可以分解成四部分,即:长期趋势,用 T(Trend)表示季节波动,用 S(Seasonal)表示循环波动,用 C(Cyclical)表示不规则波动,用 I(Irregular)表示这四种因素对时间序列变化的影响有二中基本假设乘积形式:Y=TS C I和的形式:Y=T+S+C+I32ttYYY=T+S+C+IY=TS C I33时间序列分解法基于乘积模型的时间序列分解Yt=TSCI第一步:消除时间序列中的季节因素和不规则因素采用移动平均法计算移动平均值的时期等于季节波动的周期长度用移动平均法计算的结果是只包含长期趋势因素T和循环波动因素C的时间序列,即:Mt=TC34第二步:计算只反映季节波动的季节指数(Seasonal indices)用移动平均值去除原时间序列中对应时期的实际值,得到只包含季节波动和不规则波动的时间序列,即:SI 通常是围绕1随机波动的值,某个时期的值大于1,则该时期的季节波动大于平均水平季节指数是通过对时间序列 SI 计算平均值得到的,即:35第三步:把长期趋势因素与循环因素分开识别长期趋势变动的类型,建立相应的确定性时间序列模型例如,时间序列的长期趋势可以用下列模型表示Yt=b0+b1t+t用最小二乘法估计出模型中参数b0 和 b1,则长期趋势值可以用下式计算:反映循环因素波动的循环指数可以用下式计算36时间序列的基本特征时间序列变化的基本特征是指各种时间序列表现出的具有共性的变化规律,如趋势变化、周期性变化等根据时间序列变化的基本特征,它们可以分为:呈水平形变化的时间序列呈趋势变化的时间序列呈周期变化的时间序列具有冲动点的时间序列具有转折变化的时间序列呈阶梯形变化的时间序列37呈水平型变化的时间序列经济变量的发展变化比较平稳,没有明显的上升或下降趋势,也没有较大幅度的上下波动如处于市场饱和状态的产品销售量,生产过程中出现的稳定的次品率。Ytt38呈趋势变化的时间序列上升或下降的趋势变化,长期趋势变化Ytt39呈周期型变化的时间序列Ytt40具有冲动点(Impulse)变化的时间序列Ytt41具有阶梯型变化的时间序列Ytt42时间序列的转折性变化Ytt43时间序列建摸的两种基本假设44时间序列建摸的两种基本假设确定性时间序列模型假设:时间序列是由一个确定性过程产生的,这个确定性过程往往可以用时间 t 的函数f(t)来表示,时间序列中的每一个观测值是由这个确定性过程和随机因素决定的随机性时间序列模型假设:经济变量的变化过程是一个随机过程,时间序列是由该随机过程产生的一个样本。因此,时间序列具有随机性质,可以表示成随机项的线性组合,即可以用分析随机过程的方法建立时间序列模型45确定性时间序列模型46确定性时间序列模型一般形式Yt=f(t)+t常数模型线性趋势模型非线性趋势模型二次趋势模型,描述抛物线型趋势变化指数模型,描述指数增长趋势变化逻辑增长曲线模型龚珀兹增长曲线模型季节性模型47常数模型数学模型Yt=b+t描述具有水平型变化的时间序列,常数 b 代表观测值围绕波动的未知水平 t 是随机项,包括了对经济变量有影响的各种随机因素。假设:E(t)=0Var(t)=2Cov(t t-j)=0 j 048线性趋势模型数学模型Yt=b0+b1t+t具有线性趋势变化的时间序列,其观测值可以看成围绕某一趋势直线(上升或下降)随机波动函数 f(t)=b0+b1t 表示这个随时间变化的趋势直线b0 表示在 t=0 时时间序列的水平b1 表示时间序列从一个时期到另一个时期变化的平均值 t 是随机项,包括了对经济变量有影响的各种随机因素。假设:E(t)=0Var(t)=2Cov(t t-j)=0 j 049线性趋势50线性模型法05010015020019811985198919931997汽车产量趋势值 汽车产量直线趋势汽车产量直线趋势(年份)汽车产量(万辆)51二次趋势模型描述抛物线型趋势变化的数学模型Yt=b0+b1t+b2t2+tYtt*tYt=b0+b1t+b2t252二次曲线048121619781980198219841986198819901992零售量趋势值零售量(亿件)针织内衣零售量二次曲线趋势针织内衣零售量二次曲线趋势(年份)53抛物线型趋势变化的确定判定某时间序列是否含有抛物线趋势时,可利用差分法:当t以一个常数变化时,Y的一阶差分,即:Y=Yt-Yt-1 的绝对值也接近一个常数时,该时间序列含有线形趋势当t以一个常数变化时,Y的二阶差分,即:2Yt=Yt-Yt-1的绝对值接近一个常数时,该时间序列含有抛物线趋势54时间的多项式模型三次模型Yt=b0+b1t+b2t2+b3t3+t四次模型Yt=b0+b1t+b2t2+b3t3+b4t4+tN次模型Yt=b0+b1t+b2t2+bntn+t55指数增长趋势变化时间序列模型Yt=abt t或 Yt=K+abt tYt=aebt tYtt*56指数曲线05010015020025019811985198919931997汽车产量趋势值汽车产量指数曲线趋势汽车产量指数曲线趋势(年份)汽车产量(万辆)57逻辑增长曲线模型也称S函数曲线(逻辑曲线)模型该曲线的特点是某变量刚开始时,随着t的增加,y的增长速度逐渐增加,当y达到一定水平时,其增长速度又放慢,最后超近于 一条渐近线该方程经常用来描述某消费品的生命周期的变化,可将其分为四个阶段,即缓慢增长快速增长增速放慢相对饱和YttK58龚珀兹曲线(Gompertz curve)以英国统计学家和数学家 BGompertz 的名字而命名一般形式为 描描述述的的现现象象:初初期期增增长长缓缓慢慢,以以后后逐逐渐渐加加快快,当当达达到到一一定定程度后,增长率又逐渐下降,最后接近一条水平线程度后,增长率又逐渐下降,最后接近一条水平线 两端都有渐近线,上渐近线为两端都有渐近线,上渐近线为Y YK K,下渐近线为下渐近线为Y Y=0 0 K K,a a,b b为未知常数为未知常数 K K 0 0,0 0 a a 1 1,0 0 0 0,a a 0 0,0 0 b b 1160季节性模型由时间 t 的三角函数构成的季节性模型61时间序列的构成要素与模型线性趋势线性趋势时间序列的构成要素时间序列的构成要素 循环波动循环波动季节季节变动变动长期趋势长期趋势剩余法剩余法剩余法剩余法移动平均法移动平均法移动平均法移动平均法移动中位数法移动中位数法移动中位数法移动中位数法线性模型法线性模型法线性模型法线性模型法不规则波动不规则波动非线性趋势非线性趋势 趋势剔出法趋势剔出法趋势剔出法趋势剔出法按月按月按月按月(季季季季)平均法平均法平均法平均法GompertzGompertz曲线曲线曲线曲线指数曲线指数曲线指数曲线指数曲线二次曲线二次曲线二次曲线二次曲线修正指数曲线修正指数曲线修正指数曲线修正指数曲线LogisticLogistic曲线曲线曲线曲线62随机性时间序列模型63随机性时间序列模型由美国学者博克思(G.E.P.BOX)和英国学者詹金斯(G.M.JENKINS)首先提出的.模型的性质把时间序列数据作为随机过程产生的样本来分析平稳性时间序列非平稳性时间序列利用时间序列的自相关关系建立模型通过反复实验确定时间序列的最佳模型64时间序列的分类平稳序列平稳序列有趋势序列有趋势序列复合型序列复合型序列非平稳序列非平稳序列时间序列时间序列65随机性时间序列模型的特点把时间序列数据作为由随机过程产生的样本来分析多数影响时间序列的因素具有随机性质,因此时间序列的变动具有随机性质随机过程分为平稳随机过程和非平稳随机过程由平稳随机过程产生的时间序列叫做平稳性时间序列由非平稳随机过程产生的时间序列叫做非平稳性时间序列66时间序列的分类平稳序列(stationary series)基本上不存在趋势的序列,各观察值基本上在某个固定的水平上波动或虽有波动,但并不存在某种规律,而其波动可以看成是随机的 非平稳序列(non-stationary series)有趋势的序列:线性的,非线性的 有趋势、季节性和周期性的复合型序列 67平稳时间序列68非平稳时间序列69平稳性时间序列由平稳随机过程产生的时间序列的性质:概率分布函数不随时间的平移而变化,即:P(Y1,Y2,Yt)=P(Y1+m,Y2+m,Yt+m)期望值、方差和自协方差是不依赖于时间的常数,即:E(Yt)=E(Yt+m)Var(Yt)=Var(Y t+m)Cov(Yt,Y t+k)=Cov(Y t+m,Y t+m+k)随机性时间序列模型是以时间序列的平稳性为基础建立的70随机性时间序列的特点平稳随机过程的性质意味着,平稳性时间序列围绕某一水平随机波动。时间序列模型中的参数不依赖于时间的变化现实生活中,多数时间序列是非平稳的。受各种因素影响,时间序列很难长期停留在同一水平上随机时间序列模型的建摸理论和方法以平稳性为基础,非平稳性时间序列可以通过一次或多次差分的方式变成平稳性时间序列71随机性时间序列模型的特点利用时间序列中的自相关关系进行分析和建摸时间序列的自相关关系是指时间序列在不同时期观测值之间的相关关系许多因素产生的影响不是瞬间的,而是持续几个时期或更长时间,因此时间序列在不同时期的值往往存在较强的相关关系用自相关函数和偏自相关函数衡量时间序列中的自相关关系72时间序列的自相关关系自相关函数随机过程的自相关函数样本的自相关函数偏自相关函数随机过程的偏自相关函数样本的偏自相关函数73自相关函数对于平稳随机过程,滞后期为 K 的自相关函数定义为滞后期为 K 的自协方差与方差之比74样本自相关函数75样本自相关函数的性质对称性,即:提供了有关时间序列变化的重要信息,反映了时间序列的变化规律则Yt 和 Y t+k 可能同时大于或小于平均值76样本自相关函数的性质可以用来判断时间序列的平稳性平稳性时间序列的样本自相关函数值随滞后期的延长很快趋近于零可以较好描述季节性变动或其他周期性波动的规律如果季节变化的周期是 12 期,观测值 Yt 与 Yt+12,Yt+24,Yt+36之间存在较强自相关关系因此,当 K=12,24,36,48,时,样本自相关函数值在绝对值上大于它周围的值77偏自相关函数值滞后期为 K 的偏自相关函数值是指去掉 Y t+1,Y t+2,Y t+3,Y t+k-2,Y t+k-1 的影响之后,反映观测值Yt和Y t+k之间相关关系的数值78随机性时间序列模型的特点建摸过程是一个反复实验的过程借助自相关函数值和偏自相关函数值确定模型的类型借助诊断性检验判断模型的实用性79时间序列最佳模型的确定出发点:模型总类出发点:模型总类选择暂时试用的模型选择暂时试用的模型估计模型中的参数估计模型中的参数诊断检验:模型是否适用诊断检验:模型是否适用运用模型分析和预测运用模型分析和预测80模型分类总类模型移动平均模型 MA(q)(Moving Average)自回归模型 AR(p)(Autoregression)混合自回归移动平均模型 ARMA(p,q)差分自回归-移动平均模型 ARIMA(p,d,q)81总类模型82移动平均模型 MA(q)83自回归模型 AR(p)84混合自回归移动平均模型 ARMA(p,q)85模型的识别模型AR(p)MA(q)ARMA(p,q)自相关函数呈指数递减滞后期大于 q 时截尾呈指数递减偏自相关函数滞后期大于 p 时截尾呈指数递减呈指数递减86ARIMA分析87自相关函数图88偏自相关函数图89次差分后的時間序列图901次差分后的序列自相关函数图911次差分后的序列偏自相关函数图92进行季节差分后的时间序列93季节差分后的序列自相关函数图94季节差分后的序列偏自相关函数图951次差分加季节差分后的序列自相关函数图961次差分加季节差分后的序列偏自相关函数图97 由自相关函数图知lag1与lag12显著 由偏自相关图知是截尾的(dies down)模型的初步确定98通过观测模型残差的自相关函数图和偏自相关函数图是否小于2倍标准差,判断模型是否合适诊断分析99残差的自相关函数图和偏自相关函数图中 lag6 显著,所以模型中再加入lag6100新模型残差的自相关函数图101ACF和PACF之殘差圖皆在2倍標準差內,故模式合適。新模型残差的偏自相关函数图102
展开阅读全文