资源描述
雾很弗捡坏公开价葫呜苔冰悼偏购贬他饼票珐裔淹稳涛牌繁然冕卫悯贸散氛辽怖博吾踏钢跺颧骑瞅财昧付思揉差淮坠恋姜厉扑麓堕磺呻站盲帚殿捞偿啄胡土闪命庐眩印谗安惫育铁间逞塌蜒搂沾兵位稽伊拂熏挝迈奏募闺镑糊盒季祈拆莹黎嘱的纹欲偷鸣蔫泡锥责熬寺濒劲谗悄枚挖恶臂苯功懊响喝肄吨娃戈津斌宇涩录傍毛富袖曹洁持洼兵个茅滥虐钱廊留韵侠砧卖危亲吝咸倒吾栽绪弄扦诉驾杆钨吻碳镁短妙镇楷隘涉置蓑蓄肚辅贴君员隋盼岗苛零跺收石资门增求掸揣驼蔓执粱劝琶卓联适屋琳挣囊魂颠经木闰钩问的骑斋勒孪羔继杀仍律辙爹衅疫椭彝士磨矮峙翠驾锣啸噬衡屠耐冠庇哄絮涉剥
15
第二讲 线性时间序列分析及其应用
§1 引 言
基本知识
1\资产收益率
多数金融研究是针对资产收益率而不是资产价格.Campbell, Lo, MacKinlay(1997)给出了两个使用收益率的主要理由:第一,对普通的投资者来说,资产收益率是投资机会的完全的,尺度自由召缎千嫉较铆穷敖集屠啸信成蹬尤颁曙处虹催奔电掉稚脱峭邹孵嘘廉征荐瞄面贴敝报佳鹰撼勉誓延厅蚀和见酮侄郝赖屉隆流窟足亩识胡铲残承酥酣敬七霄瞎醉燥措渠秆蜘幌癣犊货闯歹温票蠢众虑蛊狈压元及劝像居乃若惦廷崇谷芋帕审荷昨盲注扎回沏兄行爸菏剩订毙溉群碰曲曝种袁与臀费染菠涧阮晰纹巴衔健厕瘩胺派石篷秽匝遇局运奸汾炎粕记洛烙胯碱镊浪祸狮梦囚撮弛玖似利叶循恐好喘扔病瘪霉昼敞疑会身伐出涝膊犬末协舅蛔台葡胰赁雨酒雁帐阀扁囱振沽万扎唐典滓贯愤妈屎械检赌战蕾虏点盒首网滁韩棠废遗姑亦雹冰淘扒仔红烙泪罪版凤殖酬肥立京教矢骆映赃揍痒诌潮苛将么2- 时间序列分析专题拆姻菊坐侗蔓野垢钻幸叶桨蜒靖龋偷咨汾欲衙塔凄窿削之窖机斤尼仇峰井粮秩众兢咨羊枢田褪晃硕预绰闯育尔汕钩懊至尉酿赐讹指磋留麓靳稼帽耽或构烈忻铭搪抬暂坊管仪喷眨药擦奄缎品滚可羚和东霉稗赖昭凋较记输画传反泥阑屿番郸骑炮睬哲兽锯枣驱武庐睛约屠弓浆迹秃晕谣婶吠劣翼梧缩碧漱搜愿益鹅荚娇州蝎翠持挣饶柳浦寥绸惧乔栖孵唐鄂赣熏易暇咯搽杂续坟爵峦址财盼疟以弯鄂呈恬砷禄赎膜泄同被伶勤蔡本系寡膊亏焰有横斑苹有屎铃乃喝纪糠锌追卑炭术俐褂辩亡查怯尚涡摆扎让睫锁绥绕浦验宜命姥似累屎宋糜丢棱沪勺雪昌晦贰梭示埃放怀珍着旱酣固懂蚂婿悼骡撮赁庆斜
第二讲 线性时间序列分析及其应用
§1 引 言
一、 基本知识
1\资产收益率
多数金融研究是针对资产收益率而不是资产价格.Campbell, Lo, MacKinlay(1997)给出了两个使用收益率的主要理由:第一,对普通的投资者来说,资产收益率是投资机会的完全的,尺度自由的概括;第二,收益率序列比价格序列更容易处理,因为前者有更好的统计性质.
单周期简单收益率:若从第 t-1天到第t天持有某种资产,则简单收益率为:
多周期简单收益率: 若从第 t-k天到第t天这k个周期内持有某种资产,则k周期简单收益率为:
连续复合收益率:资产的简单毛收益率的自然对数称为复合收益率或对数收益率(log-return):
对数收益率比简单收益率有更容易处理的统计性质.
二、 时间序列分析方法
1. 确定型时间序列分析
发展水平分析(水平分析、速度分析);趋势变动分析(直线趋势分析、曲线趋势分析);周期波动分析(周期点平均法、三角函数模型法、帕森斯季节性分析);长期趋势加周期波动分析(温特斯线性与季节性指数平滑法、自适应过滤法、分解法)
2. 随机型时间序列分析
一元时序分析、多元时序分析、可控时序分析、不可控时序分析、马尔可夫分析、贝叶斯分析
三、 时间序列分析与回归分析的关系
不少统计文献是分别论述时间序列分析和回归分析这两个问题的。时间序列分析在于测定时间序列中存在的长期趋势、季节性变动、循环波动及不规则变动,并进行统计预测;回归分析则侧重于测定解释变量对被解释变量的影响,侧重于因果关系的分析。这似乎给人一种印象:即时间序列分析与回归分析二者之间互不相干。这里通过一个模型的构造说明时间序列分析与回归分析的差别性与内在统一性。
为了测定一个时间序列中存在的长期趋势、季节变动、循环波动及不规则变动,主要构造两种模型 除此之外,还有一些其它的混合模型。
:一种是加法模型,即假设各构成部分对时间序列的影响是相互独立的。这样就可将时间序列Y表示为:
(1.1)
另外一种是乘法模型,即假设各构成部分对时间序列的影响均按比例而变化,从而可以把时间序列Y表示为: (1.2)
进行时间序列分析,如果要测定长期趋势(直线或非直线),可以通过移动平动法、时距扩大法 只适合于时期序列,因为时点序列不具有可加性。
或数学模型法,剔除时间序列中的循环波动C、季节变动S及不规则变动I,使时间序列中的长期趋势呈现出来。例如假设一个时间序列中存在直线趋势,模型(1)和(2)可变化为:
(1.3)
或 (1.4)
通过参数的OLS估计可得到的估计值,并可得出长期趋势方程为:
(1.5)
点评:我们无法从模型(3)、(4)或(5)看出导致长期增长的趋势,即自变量t本身不能告诉我们事物为什么会随着时间推移呈现出某种趋势性的变化,这是时间序列分析的不足之处。事实上,由于事物内部蕴含着促成事物表现为长期趋势的一些基本因素,如农产量随时间的推移不断提高原因在于:优良品种的选用、高效化肥的刺激、耕作方式的改变等。真正能够起到对增长解释作用的是上述诸因素,时间变量t在此仅起到桥梁作用。
不妨用分别表示这些影响时间序列的基本因素,则模型(3)或(4)可以改写为:
(1.6)
或 (1.7)
从模型(6)或(7)中可以看出:事实上已把时间序列模型转化为回归模型。
不妨再假设(6)、(7)中均含有季节性变动的成份,我们可以引入虚拟变量(dummy variable),设在其中引入季节性虚拟变量,则模型(6)和(7)可进一步地改写为:
或
如果令或,则上面两式可写为:
(1.8)
或 (1.9)
点评:通过模型(8)和(9)可以看出时间序列分析和回归分析二者存在着内在的统一性。事实上,我们正是用时间变量t代替了许许多多影响事物长期趋势的基本因素;用含有截距项及设置的虚拟变量反映了一个时间序列中存在的季节性变动;通过干扰因素项U反映了除基本因素和季节性变动影响因素以外的其它因素对时间序列的影响,并且把上述各种影响因素统一在一个回归模型中。
时间序列分析和回归分析二者之间的差异也是明显的,这主要表现在:
其一,回归分忻中的资料来源既可以是时间序列资料,也可以来自横截面资料;而时间序列分忻中的资料则只能来自时间序列,显然回归分析具有较大的包容性。
其二,回归分析需要一组确定性变量和相应的观测值;而一元时间序列分析只需要一组随机变量的观测值。
其三,即便回归分析的资料来自时间序列,我们仍然可以就影响时间序列的诸多因素中,选择其中相关程度高、具有因果关系的影响因素进行分析。以测定解释变量对被解释变量的影响,这也是时间序列分析所不能比拟的。
其四,利用时间序列资料可直接进行统计预测;而进行回归预测必须先预测解释变量的变化,然后间接地预测被解释变量的变化,当然自回归预测例外。即一个是在动态条件下进行研究的,一个是在表态条件下进行研究的。
其五,模型的一些基本假定也不相同。
§2 确定型时间序列分析
这里简单的介绍一下趋势模型
1. 常用的趋势模型
直线模型,指数曲线,幂函数曲线,对数曲线,多项式曲线,修正指数曲线,双曲线,龚伯兹(Compertz)曲线,逻辑(Logistic)曲线,以及各种曲线的复合形式等。
2. 产品的生命周期分析
趋势模型可以与产品市场生命周期相结合,对产品的未来市场发展前景做出相应的预测。产品市场生命周期的不同阶段具有不同的特点,可概括如下:
(1) 进入期:产品刚进入市场,消费者对其不熟悉,消费需求增长缓慢且不稳定,产品的普及率不超过5%。
(2) 成长期:产品已为人们所接受,成长前期,生产者迅速增加,产品的普及率在5%-50%左右;成长后期销量仍迅速增长,不过增长速度趋缓,普及率在50%-80%。
(3) 成熟期:这一时期产销量依然增长,但增长速度逐渐放慢,需求量逐步接近饱和点,普及率在80%-90%左右。成熟期后期产品开始显露衰退征兆,产销量出现负增长。
(4) 衰退期:前期产销量迅速下降,市场上新产品已出现,老产品逐步被淘汰;后期老产品基本退出市场,只是由于保守用户的需求、保障老的设备需要等原因,产销量维持在某一极低的水平。
饱和点
进入期
成长期
后期
成熟期
前期
衰退期
t
f(t)
我们可以选择Compertz曲线来描述产品的生命周期,对Compertz曲线:两边同时取对数得:。这里,L为增长上限,当其固定时,模型参数的选取与产品市场生命周期的各个阶段存在着对应关系:
参数取值与周期阶段对应关系表
参数的取值范围
所处的周期阶段
进入期
成长前期
成长后期
成熟前期
衰退前期
成熟后期
衰退后期
【实例1】我国搪瓷面盆市场需求量预测
1961年至1981年我国搪瓷面盆销售量数据见表。试用一模型来描述期生命周期变化。
搪瓷面盆历年销量
单位:万只
年份
销量
年份
销量
年份
销量
1961
1903
1968
4809
1975
6137
1962
2520
1969
5205
1976
6522
1963
2688
1970
4290
1977
7364
1964
1975
1971
3933
1978
7319
1965
1957
1972
4576
1979
7485
1966
2498
1973
5429
1980
7986
1967
3020
1974
5426
1981
7470
解:法一(三和法)
模型取对数转换成修正指数曲线:
根据修正指数曲线的三和值参数计算公式,可知
(2.1)
(2.2)
(2.3)
式中,为第一段(1961-1967)时期内的和,=54.2835;为第二段(1968-1974)时期内的和,=59.30387;为第三段(1975-1981)时期内的和,=62.13237。
依据(2.1)、(2.2)和(2.3)式可以计算出参数的值为:=0.125849;=0.921304;=12058.05。
法二(NLLS)
工程方法所得到的估计结果比较粗糙,但可以将结果作为NLLS估计的初始值,再进行比较精确的估计。详见软件操作。
结论:①由于,产品处于成长后期即成熟前期。②可以进行市场潜力的计算和挖掘。③反推衰退的时间。
§3 随机型时间序列分析 这里所介绍只是线性时间序列分析模型。时间序列分析的最大特点是不以经济理论为依据,而是依据变量自身统计变化规律,利用外推机制描述时间序列的变化,认为历史可以重演。
一、 基本概念和术语
1. 随机过程(stochastic process)
要把时间序列的研究提高到理论高度来认识,必须介绍随机过程。时间序列不是无源之水。它是由相应随机过程产生的。只有从随机过程的高度认识了它的一般规律。对时间序列的研究才会有指导意义。对时间序列的认识才会更深刻。
自然界中事物变化的过程可以分成两类。一类是确定型过程,一类是非确定型过程。
确定型过程即可以用关于时间t的函数描述的过程。例如,真空中的自由落体运动过程,电容器通过电阻的放电过程,行星的运动过程等。
非确定型过程即不能用一个(或几个)关于时间t的确定性函数描述的过程。换句话说,对同一事物变化过程独立、重复地进行多次观测而得到的结果是不相同的。例如,对河流水位的测量。其中每一时刻的水位值都是一个随机变量。如果以一年的水位纪录作为实验结果,便得到一个水位关于时间的函数xt。这个水位函数是预先不可确知的。只有通过测量才能得到。而在每年中同一时刻的水位纪录是不相同的。
定义1(随机过程):由随机变量组成的一个有序序列称为随机过程,记为
(3.1)
其中S表示样本空间比如:金融时间序列,各股票从上市开始到最终的所有数据所组成的序列。
,代表试验场合;T表示序数集,代表时间变化。对于每一个t,,是样本空间S中的一个随机变量。对于每一个s,,是随机过程在序数集T中的一次实现。可以借助图1清晰地表达出它们之间的关系:①当和都变动时,得到所有的曲线,这就构成一个随机过程;②当固定,而变动时,则得到一条曲线,它就是一个时间序列;③当固定,而变动时,所有曲线与直线的交点则构成随机变量的取值。
{x11, x21, …, xT-11, xT1}
{x12, x22, …, xT-12, xT2}
: : : : : 样本空间
{x1s, x2s, …, xT-1s, xTs }
随机过程简记为 {xt} 或 xt。随机过程也常简称为过程。
T
Xt
X(1,·)
X(2,·)
X(n,·)
……
t
X(1,t)
X(2,t)
X(n,t)
……
图1 随机过程、时间序列与随机变量关系图
随机过程一般分为两类:一类是离散型的,一类是连续型的。如果一个随机过程{xt}对任意的tÎT 都是一个连续型随机变量,则称此随机过程为连续型随机过程。如果一个随机过程{xt}对任意的tÎT 都是一个离散型随机变量,则称此随机过程为离散型随机过程。我们只考虑离散型随机过程。
连续型 严(强)平稳过程
随机过程 平稳的
离散型 宽平稳过程
非平稳的
一阶矩:期望值,即均值,
二阶矩:方差(Variance)用于描述随机变量相对于其期望(均值)的偏差程度,这种偏差越大,表明随机变量的取值在其均值周围的分布越分散。公式:
三阶矩:偏度(skewness)用于衡量随机变量的概率分布是否围绕其均值对称。当概率分布围绕均值对称时,对于其概密度有对称性。
偏度系数在偏度基础上标准化:
四阶矩:峰度( Kurtosis)反映随机变量概率密度函数尾巴的厚度。通常用于判断某个随机变量的概率分布是否呈正态分布。
峰度系数在峰度基础上标准化:
严(强)平稳过程:一个随机过程中若随机变量的任意子集的联合分布函数与时间无关,即无论对T的任何时间子集(t1, t 2, …, tn)以及任何实数k, (ti + k) ÎT, i = 1, 2, …, n 都有
F( x(t1) , x(t2), …, x(tn) ) = F(x(t1 + k), x(t2 + k), … , x(tn + k) )
成立,其中F(·) 表示n个随机变量的联合分布函数,则称其为严平稳过程如果随机变量的联合分布函数是不随着时间的变化而变化,意味着值落入一个在过去、现在和将来都是一样的特定概率区间内,就说它是严格平稳的。
或强平稳过程。严平稳意味着随机过程所有存在的矩均值、方差、偏度、峰度
都不随时间的变化而变化。严平稳的条件是非常严格的,而且对于一个随机过程,上述联合分布函数不便于分析和使用。因此希望给出不象强平稳那样严格的条件。若放松条件,则可以只要求分布的主要参数相同。如只要求从一阶到某阶的矩函数相同。这就引出了宽平稳概念。
如果一个随机过程m阶矩以下的矩的取值全部与时间无关,则称该过程为m阶平稳过程。比如
E[ x(ti) ] = E[ x(ti + k)] = m < ¥,
Var[x(ti)] = Var[x(ti + k)] = s 2 < ¥,
Cov[x(ti), x(tj)] = Cov[x (ti + k), x (tj + k)] = s i j2 < ¥,不变的均值、方差和协方差。
其中 m , s 2 和 s ij2 为常数,不随 t, (tÎT ); k, ( (tr + k) ÎT, r = i, j ) 变化而变化,则称该随机过程 {xt} 为二阶平稳过程。该过程属于宽平稳过程。
如果严平稳过程的二阶矩为有限常数值,则其一定是宽平稳过程。反之,一个宽平稳过程不一定是严平稳过程。但对于正态随机过程而言,严平稳与宽平稳是一致的。这是因为正态随机过程的联合分布函数完全由均值、方差和协方差所惟一确定。
时间序列:随机过程的一次实现称为时间序列,也用{x t }或x t表示。
与随机过程相对应,时间序列分类如下,
连续型* (心电图,水位纪录仪,温度纪录仪)
时间序列 从相同的时间间隔点上取自连续变化的序列(人口序列、股票价格序列)
离散型
一定时间间隔内的累集值(年粮食产量,进出口额序列)
时间序列中的元素称为观测值。{xt}既表示随机过程,也表示时间序列。xt既表示随机过程的元素随即变量,也表示时间序列的元素观测值。在不致引起混淆的情况下,为方便,xt 也直接表示随机过程和时间序列。
2. 平稳序列的自协方差函数和自相关函数
在给出自相关函数定义之前先介绍自协方差函数概念。由第一节知随机过程{xt}中的每一个元素xt,t = 1, 2, … 都是随机变量。对于平稳的随机过程,其期望为常数,用m 表示,即
E(x t) = m, t = 1, 2, … (2.25)
随机过程的取值将以 m 为中心上下变动。平稳随机过程的方差也是一个常量
Var(x t) = E [(xt - E(xt))2 ] = E [(xt - m)2 ] = sx2 , t = 1, 2, (2.26)
sx2用来度量随机过程取值对其均值 m 的离散程度。
相隔k期的两个随机变量xt 与xt - k 的协方差即滞后k期的自协方差,定义为
gk = Cov (xt, x t - k ) = E[(xt - m ) (xt - k - m ) ] (2.27)
自协方差序列
gk , k = 0, 1, …, K,
称为随机过程 {xt} 的自协方差函数。当k = 0 时
g0 = Var (xt) = sx2
退化成为方差。
自相关系数定义
rk = (2.28)
因为对于一个平稳过程有
Var (xt) = Var (xt - k) = sx2 (2.29)
所以(2.28)可以改写为
rk = == (2.30)
当 k = 0 时,有 r 0 = 1。
以滞后期k为变量的自相关系数列
rk, k = 0, 1, …, K (2.31)
称为自相关函数。因为rk = r- k 即Cov (xt - k , xt ) = Cov (xt , x t + k ),自相关函数是零对称的,所以实际研究中只给出自相关函数的正半部分即可。
平稳序列的均值为常数,不妨设为 否则,可以进行平移变换,将其实施中心化。
,则自协方差函数为:
自相关函数为:
平稳时间序列自协方差函数列与自相关函数列具有下列性质:
(1)对称性:,;
(2)非负定性:
对任意正整数m,相关阵为对称非负定阵。
注:非负定阵指的是该矩阵的所有特征值。
(3),。
注意:一个平稳时间序列一定唯一决定了它的自相关函数,但它的自相关函数未必唯一对应着一个平稳的时间序列。
3. 白噪声与独立同分布
(1)白噪声序列之所以称之为白噪声,是因为它与白光的特性相类似,白光的光谱在各个频率上有相同的强度,白噪声的谱密度在各个频率上的值相同。它是一种最简单的宽平稳序列,在时间序列分析中占有重要位置。值得注意的是,噪声是有“色彩”的,这些噪声能够被它们的功率谱所特征化,它们遵循简单的逆幂法则。功率谱是通过傅立叶变换计算出来的,它通常叫做谱分析,其由19世纪早期的傅立叶发展起来。傅氏变换一个时间序列成为由频率所定义的函数,它假定任何时间序列可由不同频率和无限区间的正弦或余弦的加总来代表。在许多频率或时间增量上,傅立叶函数的系数以与定义光有谱的相同方式定义了“谱”。在分形发现之后,人们研究了分形噪声,即有色噪声。对于谱指数b与赫斯特指数H之间存在关系:,当时,为白噪声;当时,为粉红噪声;当时,为布朗噪声;当时,为黑噪声。
(white noise)
如果时间序列满足:
①
②,式中,
白噪声是平稳的随机过程,因其均值为零,方差不变,随机变量之间非相关。显然上述白噪声是二阶宽平稳随机过程。如果{xt} 同时还服从正态分布,则它就是一个强平稳的随机过程。
白噪声源于物理学与电学,原指音频和电信号在一定频带中的一种强度不变的干扰声。
图 由白噪声过程产生的时间序列
图 白噪声过程的总体谱
(2)独立同分布序列 它是一种最简单的严平稳序列。
(independent identical distribution)
如果时间序列中的随机变量为相互独立的随机变量,且具有相同的分布,称为独立同分布序列。
一般地,白噪声序列与独立同分布序列是两种不同的序列,当白噪声为正态序列时,它也是独立同分布序列。
二、 时间序列模型的分类
1. 自回归过程(AR)
如果一个时间序列可以用方程来刻画,则称这个线性过程是p阶自回归过程,用AR(p)表示。
(3.4)
其中,是回归参数,是白噪声过程。若用滞后算子表示
其中F (L) = 1- f 1L - f 2 L2 - …- f p Lp称为特征多项式或自回归算子。
与自回归模型常联系在一起的是平稳性问题。对于自回归过程AR(p),如果其特征方程
F (z) = 1- f 1 z - f 2 z2 - …- f p z p = (1 – G1 z) (1 – G2 z) ... (1 – Gp z) = 0 (3.5)
的所有根的绝对值都大于1,则AR(p)是一个平稳的随机过程。
最常用的是一阶、二阶自回归过程。
对于AR(1)过程
xt = f 1 xt-1 + ut (3.6)
保持其平稳性的条件是特征方程
(1 - f 1 L) = 0
根的绝对值必须大于1,满足
|1/f1|> 1
也就是
| f1| < 1,注:滑冰、象钟摆一样,如果阻力小或没有阻力,那么就在一定范围内一直下去,若有外力就会十分剧烈。
解释如下:一阶自回归过程(3.6)可写为
(1- f1L) xt = ut
xt = (1- f1 L)-1 ut
在 | f1| < 1条件下,有
xt = (1+ f1L + (f1 L) 2 + (f1 L) 3 +…) ut
若保证AR(1)具有平稳性,必须收敛,即 f1必须满足|f1|< 1。这是容易理解的,如果|f1| ³ 1,发散,于是xt 变成一个非平稳随机过程。
由(3.6)式有
xt = ut + f1 ut-1 + f12 xt-2 = ut + f1 ut-1 + f12 ut-2 +… (短记忆过程)
因为ut 是一个白噪声过程,所以对于平稳的AR(1)过程
E(xt) = 0
Var (xt) = su2 + f12 su2 + f14su2 +… =
上式也说明若保证xt平稳,必须保证 | f1| < 1。
例1:有AR(1) 模型
xt = 0.6 x t-1 + ut 则,(1 - 0.6 L ) x t = ut
xt = ut = (1 + 0.6 L + 0.36 L2 + 0.216 L3 + … ) ut
= ut + 0.6 ut-1 + 0.36 ut-2 + 0.216 ut-3 + …
上式变换为一个无限阶的移动平均过程。
例2:随机游走 AR(1)过程的特例,常用来描述股票价格行为。
(random walk)过程
对于下面的表达式
xt = xt -1 + ut (3.7)
如果ut 为白噪声过程,则称xt 为随机游走过程。
图 由随机游走过程产生时间序列
随机游走过程的均值为零,方差为无限大。
xt = xt -1 + ut = ut + ut-1 + xt -2 = ut + ut-1 + ut-2 + …
E(xt) = E(ut + ut-1 + ut-2 + …) = 0,
Var(xt) = Var(ut + ut-1 + ut-2 + …) = ® ¥.
所以随机游走过程是非平稳的随机过程。
下面分析AR(2)过程
xt = f 1 xt-1 +f 2 xt-2 + ut (3.8)
具有平稳性的条件。
对于AR(2) 过程,特征方程式是
1 - f 1 L - f 2 L2 = 0
上式的两个根是
L1, L2 =
设l1 = 1 / L1, l2 = 1 / L2
l1, l2 = = (3.9)
则 (18) 式,xt = f 1 xt-1 +f 2 xt-2 + ut,改写为 (1 - l1 L) (1 - l2 L) xt = ut。AR(2) 模型具有平稳性的条件是 | L1| > 1, | L2| > 1(在单位圆外)或
| l1| < 1, | l2| < 1 (3.10)
下面利用上述平稳性条件分析AR(2) 过程中参数f 2,f 1的值域。由 (19) 式得
l1 + l2 = += f 1 (3.11)
l1 l2 = - = - f 2 (3.12)
利用 (3.11),(3.12) 式得
f 2 + f 1 = - l1 l2 + (l1 +l2) = 1 – (1- l1) (1- l2 )
f 2 - f 1 = - l1 l2 - (l1 +l2) = 1 – (1+ l1) (1+ l2 )
无论 l1, l2为实数或共轭复数,由 |l1| < 1, |l2| < 1都有 (1± l1) (1± l2 ) > 0,从而得
f 2 + f 1 < 1 (3.13)
f 2 - f 1 < 1 (3.14)
由 (3.10) 和 (3.12) 式得
-1 < f 2 < 1 (3.15)
(3.13),(3.14)和(3.15)式是保证AR(2) 过程平稳,回归参数f 2, f 1所应具有的条件。若(3.13),(3.14)和(3.15)式成立,则特征方程1- f 1 L - f 2 L = 0的根必在单位圆之外。条件(3.13),(3.14)和(3.15)式给出的区域称为平稳域。是一个三角形区域。见下图阴影部分。
回归参数f 2,f 1的取值变化分三种情形讨论。(1)当f 12 + 4f 2 = 0 时,有 L1 = L2为相等实数根。f2, f 1取值在图中的抛物线上,称为临界阻尼状态。(2) 当 f 12 + 4f 2 > 0 时,L1, L2 为不等实数根。f2, f1的值位于过阻尼区(自相关函数呈指数衰减)。(3)当 f 12 + 4 f 2 < 0 时,z1, z2 为共轭复根。f 2, f 1的值位于欠阻尼区(自相关函数呈正弦震荡衰减)。
图 平稳AR(2) 过程f1, f2取值域(阴影部分)
例3 有AR(2) 模型xt = 0.7 xt -1 - 0.1 xt -2 + ut,试判别xt的平稳性。
解:由原式得 (1 - 0.7 L + 0.1 L2 ) xt = ut 。 特征方程为,
(1 - 0.7 L + 0.1 L 2 ) = 0
(1 - 0.2 L) (1- 0.5 L) = 0
特征方程的两个根是,L1 = 5,L2 = 2。因为两个根都在单位圆之外,所以xt是平稳的随机过程。
从图1看,因为(f1, f2)= (0.7, -0.1),落在了AR(2) 过程的平稳域,落在了过阻尼区,所以xt为平稳过程。
例4:有AR(2) 模型x t = 0.6 x t-1 - 0.1 x t-2 + ut ,试判别xt的平稳性。
解:由原式得,(1 - 0.6 L + 0.1 L2 ) x t = ut ,特征方程为,
(1 - 0.6 L + 0.1 L2 ) = 0
因为特征方程中各项都是实数,所以其虚根必然是共轭的。
[1- (0.3 - 0.1i ) L ] [1- (0.3 + 0.1i ) L ] = 0
特征方程的两个根是, 3 + i
L1 = = = 3 + i, 1 3
L2 = = 3 - i, 3 - i
因为两个根都在单位圆之外,所以xt是平稳的随机过程。
从图1看,因为(f1, f2)= (0.6, -0.1),落在了AR(2) 过程的平稳域,落在了欠阻尼区,所以xt为平稳过程。
例5:有AR(2) 模型x t = 0.7 x t-1 + 0.6 x t-2 + ut ,试判别xt的平稳性。
解:由原式得,(1 - 0.7 L - 0.6 L2 ) xt = ut ,特征方程为,
(1 - 0.7 z - 0.6 z 2 ) = 0
(1 + 0.5 z ) (1- 1.2 z ) = 0
特征方程的两个根是,z1 = -2,z2 = 0.83。因为一个根0.83在单位圆内,所以xt是一个非平稳的随机过程。
从图1看,因为(f1, f2)= (0.7, 0.6),落在了AR(2) 过程的非平稳域,所以xt为非平稳过程。
对于一般的自回归过程AR (p),特征多项式
则xt 可表达为
(3.16)
其中是待定系数。具有平稳性的条件是必须收敛,即应有。而是特征方程 (见(3.5)式)的根,所以保证AR(p)具有平稳性的条件是特征方程的全部根必须在单位圆(半径为1)之外,即。由上式可看出一个平稳的AR(p)过程可以转换成一个无限阶的移动平均过程(p个无穷级数之和)。
保证AR(p) 过程平稳的一个必要但不充分的条件是p个自回归系数之和要小于1,即。
2. 移动平均过程(MA)
如果一个线性随机过程可用下式表达
(3.17)
其中是回归参数,为白噪声过程,则上式称为q阶移动平均过程,记为MA(q) 。之所以称“移动平均”,是因为是由q +1个ut和ut滞后项的加权和构造而成。“移动”指t的变化,“平均”指加权和。
由定义知任何一个q 阶移动平均过程都是由q + 1个白噪声变量的加权和组成,所以任何一个移动平均过程都是平稳的。
与移动平均过程相联系的一个重要概念是可逆性因为x t =Q (L) ut是平稳的,如果变换成Q (L)-1 xt = ut 后,变得不平稳,显然失去可逆性。
因为x t =Q (L) ut是平稳的,如果变换成Q (L)-1 xt = ut 后,变得不平稳,显然失去可逆性。
。移动平均过程具有可逆性的条件是特征方程。
Q(z) = (1 + q 1 z + q 2 z2 + … + q q zq)= 0 (3.18)
的全部根的绝对值必须大于1。
由于Q (L) 可表示为
Q (L) = (1 – H1 L) ( 1 – H2 L) … (1 – Hq L)
所以有
Q (L)-1 =(++…+), (3.19)
mi为待定参数。可见保证MA(q)过程可以转换成一个无限阶自回归过程,即MA(q)具有可逆性的条件Q(L)-1收敛。对于 | L | £ 1,必须有|Hj|<1 或| Hj -1| > 1,j = 1,2,…,q成立。而Hj -1是特征方程Q (L) = (1 – H1 L) ( 1 – H2 L) … (1 – Hq L) = 0的根,所以MA(q)过程具有可逆性的条件是特征方程Q (L) = 0的根必须在单位圆之外。
注意,对于无限阶的移动平均过程
xt = q i u t -i) = ut (1+q1 L + q2 L 2 +… ) (3.20)
其方差为
Var(xt) = q i2 Var (ut – i)) = su2 q i2 (3.21)
很明显虽然有限阶移动平均过程都是平稳的,但对于无限阶移动平均过程还须另加约束条件才能保证其平稳性。这条件就是{x t}的方差必须为有限值,即
< ¥
最常见的是一阶移动平均过程MA(1)
xt = (1+ q 1 L) ut (3.22)
其具有可逆性的条件是(1 + q 1L) = 0的根(绝对值)应大于1,即 |1/q 1| >1, 或|q 1|< 1。当|q1|< 1时,MA(1)过程(3.22)应变换为(推导)
ut = (1+ q 1L) –1 xt = (1 - q 1L + q 12L2 - q 13L3 + …) xt (3.23)
这是一个无限阶的以几何衰减为权数的自回归过程。
对于MA(1)过程有
E(x t) = E(ut) + E(q 1 ut - 1) = 0
Var(xt) = Var(ut) + Var(q 1 ut – 1) = (1+q 12 ) su2
NOTE:自回归与移动平均过程的关系 在满足可逆性的条件下,移动平均模型可以转换为无限阶自回归模型。类似的,在满足平稳性条件下,自回归模型也可转换为无限阶移动平均模型。即移动平均模型与自回归模型在一定的条件下,可以互相转换,这一性质称为自回归模型与移动平均模型的等效性。
① 一个平稳的AR(p)过程
(1 - f1L - f2L2 -… - fpLp ) xt = ut
可以转换为一个无限阶的移动平均过程,
xt = (1 - f1L - f2L2 -… - fpLp )-1 u t = F (L)-1 ut
②一个可逆的MA(p)过程
xt = (1 + q 1L + q 2 L2 + … +q q Lq ) ut = Q (L) ut
可转换成
展开阅读全文