1、第十八讲 时间序列的性质(一) 第一节 平稳的时间序列 任何时间序列数据都可看成由一个随机过程产生的结果或者说是一个随机过程的一个实现:设为一随机时间序列,其中每一项都是随机的,则有关这一随机时间序列的观测值所组成的序列就是这一随机时间序列的一个实现或者说一个样本。我们对时间序列的研究往往是根据随机时间序列的一个样本来推断随机时间序列总体的性质进而进行预测。在前面的回归分析中,我们总假定解释变量是非随机的,但实际上大多数经济数据特别是宏观经济数据,由于其为时间序列数据的时候居多,在这种情况下,无论是被解释变量还是解释变量的观测数据往往可看作是随机时间序列的一个实现,从而使解释变量具有随
2、机性,当解释变量与回归模型中的随机扰动项相关时,就出现了内生性问题,其解决方法已如前所述;当解释变量与回归模型中的随机扰动项无关时,解释变量即使是随机的,经典回归的有关结论仍然适用,但前提条件是模型设定正确。然而,模型设定是否正确在相当程度上取决于时间序列的稳定特性。例如,当回归模型中的变量一方面是时间序列,另一方面有的时间序列变量是平稳的而有的时间序列变量是非平稳的,那么,就会产生谬误回归,即回归模型的误设。所以时间序列的平稳性分析不仅对时间序列本身十分重要而且对包括时间序列的经典回归分析十分重要。因此讨论平稳的时间序列对整个计量经济学来说就显得十分必要了。 一 平稳时间序列的定义 如
3、果一个随机时间序列的均值和方差在时间过程上都是常数,并且在任何两时期之间的协方差仅依赖于该两时期间的距离或滞后,而不依赖于计算这个协方差的实际时间,就称它为平稳的 在时间序列文献中称这样的平衡为弱平衡过程(weakly stationary stochastic process),也称为协方差平稳平衡的,在大多数实际情况中,这样的平衡就够用了,在本书中的平稳是指弱平稳。严格意义上的平衡性是指随机时间序列或随机过程的随机特性不随时间变化。 。 用数学式子表示随机时间序列的平稳性:设有一随机时间序列,如果: 第一, 均值与时间无关。 第二, 方差与时间无关。(方差也可用表示) 第三, 协
4、方差只与间隔期有关而与时间无关,称这样的协方差为滞后的自协方差。(显然) 则称这样的随机时间序列为平稳的时间序列。 例1 若随机时间序列由下式生成 (1) 其中为一与时间无关的常数,为白噪声过程,即以零为均值,有相同方差,自协方差为零。 则由(8.1)式表示的过程是一个平稳过程:;; 。 例2 一阶自回归过程 随机时间序列由下列(2)式生成,则称这样的过程为一阶自回归过程,记为AR(1)。 (2) 其中为常数,为白噪声过程。 则当时,AR(1)过程为平稳过程
5、事实上, 第一,当时,AR(1)过程的均值为一常数: 因为 所以 (3) 第二,当时,AR(1)过程的方差为一常数: (4) 第三,当时,AR(1)过程的滞后的自协方差为一只与滞后有关而与时间无关的常数: (5) 例3 二阶自回归过程 二阶自回归过程是指由下列(6)式所生成的时间序列: (6) 在什么条件下,(6)式所表示的二阶自回归过程即AR(2)是平稳的? 为了研究AR(2)的平稳性,我们引入滞后算子的概念: 将滞后算子L定
6、义为: (7) 如果运用两次滞后算子,结果为: 这样一个对滞后算子的二重运用记作“”: 一般地,对任何整数k, (8) 对于滞后算子有一些运算法则,如它与数乘运算可交换、它对于加法运算可分配等。 运用滞后算子,AR(2)可写成 (9) 根据差分方程中的有关结论,上式平稳的充分必要条件是滞后算子多项式的特征根(即将滞后算子符号L改为普通复数后的多项式的根)在单位园以外 参见詹姆斯 D. 汉密尔顿[美]著,刘明志译《时间序列分析》,第34——38
7、页,中国社会科学出版社,1999。 。 多项式 (10) 的两个根为 (11) 这两个根在单位以外的充分必要条件是下列三个式子同时成立: (12) AR(2)的平稳性条件可用下图表示: -1 1 1 -1 图1 AR(2)的平稳域:由,和 所围成的三角形区域之内。 对(8.6)式两边同取数学期望,便可求出平稳的AR(2)模型的均值。 由平稳性知代入上式,并利用: 故
8、 (13) 为了求出AR(2)过程的方差与自协方差,将(6)式写成如下形式: (14) 因为上式即为 所以(14)式成立。 将(14)两边同时乘以后,两边取数学期望得 即 (15) (15)式说明AR(2)过程的自协方差具有与原模型的相同的差分形式。 在(15)中,分别令和并利用得 (16) 因此 (17) 将(14)式两边同时乘以后求数学期望得 即 (18) 将(8.17)代入(8.18
9、)后,化简得 (19) 平稳的AR(2)的自协方差可由(8.17)式及迭代关系(8.15)给出。 例4 移动平均过程 一阶移动平均过程记为MA(1),它是指由下面(20)式所决定的随机过程: (20) 其中,为常数,是一白噪声过程。过程(8.20)之所以称为“移动平均”,是因为是由相邻两期值的加权和构造而成,类似于一个平均。MA(1)过程的均值、方差和自协方差计算如下: 的均值为: (21) 的方差为: (22) 其中为白噪声过程的方差即。 的一
10、阶自协方差为: (23) 的高阶自协方差均为零 (24) 由(21)——(24)知,MA(1)过程是(弱)平稳过程。 一般地,q阶移动平均过程记为MA(q),它由下述(25)式所表述: (25) 其中,和诸为常数,是一白噪声过程。易知,的均值、方差和自协方差分别为: (26) (27) (28) 其中为白噪声过程的方差即。 由(25)——(28)知,MA(q)过程是(弱)平稳过程。 可以证明,当权数的平方和存在时,无穷阶移动平均过程也是一个协方差平稳过程。 例5
11、 自回归移动平均过程 自回归移动平均过程记为,如果其中自回归的最长滞后期为p,移动平均的最大滞后期为q,则称这样的自回归移动平均过程为p阶自回归q阶移动平均的自回归移动平均过程,记为。由下式所生成: (29) 利用滞后算子,上式可写成 (30) 当特征多项式 的根落在单位园之外时,自回归移动平均过程(30)是平稳的参见詹姆斯 D. 汉密尔顿[美]著,刘明志译《时间序列分析》,第68页,中国社会科学出版社,1999。 。 上面的平稳时间序列的例子是在已知随机过程的生成模型后,我们所进行的有关平稳性的演绎。但实际上,经济时间序列的随机总体是不可知的,所知道的仅
12、仅是随机时间序列的一个样本,或者说是随机过程的一个实现。人们所能够做的只是根据随机时间序列的一个实现去推断在这个“实现”背后的随机过程的性质,进而进行预测。为此,我们应分别了解一些刻划随机时间序列(相当于横截面分析中的“总体”)和它的一个实现(相当于横截面分析中的“样本”)的特征的概念。 二 随机时间序列和其样本的数字特征 我们已经知道了随机时间序列的几个数字特征,它们分别是均值、方差和自协方差,下面引入另一个数字特征:自相关函数。我们定义滞后k期的自相关函数为Y (31) 对于平稳过程,(31)式中的分子就是自协方差,而分母则等于随机过程的方差,所以对于平稳过程,我们有
13、 (32) 显然对任何随机过程都成立,而对于平衡时间序列显然有。 根据定义,很容易求出例1——例4中的随机时间序列的自相关函数。例如,例1所表示的过程是一个纯随机过程,它的自相关函数为。 刻画随机过程性质的一些数字特征,只有在随机过程的生成机制是已知时才能精确地求出。但对于一个具体的经济时间序列来说,其“背后”的生成机制是不可能精确地知道的,所以时间序列“背后”的随机时间序列的诸如均值、方差、自协方差和自相关函数是不可能精确求出的,我们所能做的只是根据可得的或可观测的时间序列(可看作是随机过程的一个实现)来估计随机时间序列的数字特征。这些估计的数字特征称
14、为样本数字特征:如样本均值、样本方差、样本自协方差和样本自相关函数等。 时间序列的样本均值定义为 (33) 时间序列样本方差定义为 (34) 时间序列样本自协方差定义为 (35) 时间序列样本自相关函数定义为 (36) 显然,对样本自相关函数而言,我们有 由于样本自相关函数关于原点的对称性,所以,在作以k为横坐标,以为纵坐标的样本自相关图时,只须画出k为正值的情形。 关于用样本数字特征来估计随机时间序列的数字特征的一个问题是:样本数字特征是在不同时间点上的样本值或样本
15、值的函数的平均,而随机时间序列的数字特征是在同一时间点上的随机变量的数字特征,用这样的样本数字特征来估计随机时间序列的数字特征具有合理性吗?或者说,这样的估计是一致的吗?对于协方差平稳的随机时间序列而言,回答是肯定的,其理论证明所涉及的渐近理论超出了本书的范围,在这里就不介绍了 对平稳的随机时间序列而言,如果它的一个时间序列样本的样本数字特征能收敛于相应的随机时间序列的数字特征,我们可以称这样的随机时时间序列关于所研究的数字特征具有遍历性。对此的研究可参见詹姆斯 D. 汉密尔顿[美]著,刘明志译《时间序列分析》,第218——234页,中国社会科学出版社,1999。 。作为一个相当非正式的检验
16、下面我们通过样本自相关函数来判断某一时间序列的平稳性。 三 根据样本自相关函数的平稳性检验 1 根据样本自相关图的平稳性检验。一般来说,承随着k的增大,样本自相关函数的值很快地下降为零时,产生这样的样本的随机时间序列往往是平稳的,反之当样本自相关函数不随关k的增大而快速下降为零时,往往表明时间序列不平稳。通过样本自相关图便可清楚地看到是否很快地随着k的增大而下降为零。让我们通过一个例子来说明。 例6 表1是按当年的绝对量计算的中国的GDP序列及其对数的序列,GDP的对数ln(GDP)所构成的时间序列可看成是一个随机时间序列的实现,此时间序列是平稳的吗? 表1按当年绝对量计算
17、的中国的GDP及其对数序列 年份 GDP(亿元) ln(GDP) 年份 GDP(亿元) ln(GDP) 1978 3624.1 8.195361261 1991 21617.8 9.981272328 1979 4038.2 8.303554327 1992 26638.1 10.1900978 1980 4517.8 8.415780429 1993 34634.4 10.45260269 1981 4862.4 8.489287422 1994 46759.4 10.75277058 1982 5294.7 8.574461
18、599 1995 58478.1 10.9764076 1983 5934.5 8.688538057 1996 67884.6 11.12556448 1984 7171 8.877800394 1997 74462.6 11.21805226 1985 8964.4 9.101016457 1998 78345.2 11.26887998 1986 10202.2 9.230358662 1999 82067.46 11.31529687 1987 11962.5 9.389532036 2000 89442.2 11.40
19、134789 1988 14928.3 9.611014019 2001 95933.3 11.47140844 1989 16909.2 9.735613131 2002 105172.3 11.56335524 1990 18547.9 9.828111854 2003 116898.4 11.66906046 资料来源:中华人民共和国统计局网站 在以年份为横轴GDP的对数为纵轴的坐标系中作曲线图如图8.2所示。 图2 中国GDP对数曲线图 从图2中可以看出ln(GDP)有明显的趋势,所以它是非平稳的。关于这一结论能否从样本自样关图中看
20、出呢?为此先计算当k取值分别为1到9时,样本自相关函数的所对应的值如下表所示: k 1 2 3 4 5 6 7 8 9 0.906 0.806 0.703 0.593 0.48 0.362 0.245 0.132 0.022 根据上表,以滞后期k为横轴以样本自相关函数为纵轴作样本自相关图如图8.3所示。 图3 的样本自相关图 从图.3中明显看出,的样本自相关函数,并不是随着k的增大而快速地下降为零,所以,从样本自相关图也能看出非平稳性。 2 自相关函数的值是否为零的检验。注意到平稳随机序列的一个特例:纯随机过程,其中为白噪声过程。这个纯
21、随机过程的所有滞后期大于零的自相关函数的值都为零,据此可构造一些检验来说明,一个现实的时间序列是否有一定的可靠性来自纯随机过程,如果是,我们就有同样的可靠性声称该时间序列是平稳的。 巴特利特(Bartlett)曾表明,如果一个时间序列是纯随机的,则对所有的滞后期大于或等于1的样本自相关系数(样本自相关函数的取值)近似地服从均值为零,方差为(n为序列观测值的个数)的正态分布。因此,如果某时间序列由100个数据点构成,则任何滞后期大于或等于1的样本自相关系数的标准差近似地为0.1,如果某个自相关系数大于0.2,因为(置信度为95%时,z统计量的临界值),所以我们就有95%的把握认为真正的自相关系
22、数(即随机时间序列的自相关系数)不为零 转引自[美]罗伯特 S. 平狄克,丹尼尔 L. 鲁宾费尔德箸,钱小军等译《计量经济模型与经济预测》(Edition),机械工业出版社,2003年12月。 。例如,根据在例6中的值可计算z统计量,并根据z统计量的值与显著性水平为5%时z统计量的临界值(1.96)的对比,便可决定是否拒绝的假设。其计算结果如下表: k 1 2 3 4 5 6 7 8 9 0.906 0.806 0.703 0.593 0.48 0.362 0.245 0.132 0.022 z 4.62 4.11 3.58 3.02
23、2.45 1.85 1.25 0.673 0.112 是否拒绝 拒绝 拒绝 拒绝 拒绝 拒绝 不 拒绝 不 拒绝 不 拒绝 不 拒绝 为了检验联合假设:全部自相关系数,我们可以使用由博克斯(Box)和皮尔斯(Pierce)推演出的Q统计量,其定义为: (37) 其中,n为序列观测值的个数,m为最大滞后长度。 Q统计量近似地(即在大样本中)服从自由度为m的分布。可根据按(37)式所计算出的Q统计量的值与在一定显著性水平下的分布的临界值的对比来决定是否拒绝全部自相关系数的联合假设。如果Q统计量的值大于一定显著性水平下的分布的临界值,则拒绝联合假设;否则不拒绝。例如,根据在例6中的值可计算Q统计量,并根据Q统计量的值与显著性水平为5%时Q统计量的临界值(的对比,便可决定是否拒绝全部自相关系数的假设。事实上, 故拒绝全部自相关系数的联合假设。 应用杨—博克斯(Ljung and Box, 1978)的LB 统计量来检验全部自相关系数均为零的联合假设对于小样本更适合,因为它有较好的小样本性质。LB 统计量定义为: (38) 它也服从自由度为m的分布。 关于平稳性的一个较为正式的检验即单位根检验,将在本章第三节介绍。 11






