1、 1 上交所国债收益率的聚类结构分析上交所国债收益率的聚类结构分析1 李彪 杨宝臣李彪 杨宝臣2 2(天津大学管理学院,天津 300072)摘要:(天津大学管理学院,天津 300072)摘要:首先对上海证券交易所 2004 年 7 月 1 日到 11 月 12 日的 17 种记帐式国债的日收益率时间序列进行预分析,在此基础上对日收益率时间序列做了分离趋势修正。然后,提出了一种基于各个国债收益率之间相关性的测度距离的方法,并根据这种新方法对修正后的国债日收益率时间序列进行了聚类分析。通过对采用联接算法计算出的阈值向量和层次树进行权衡比较,将 17 种国债分成了五类。分类结果表明,我国国债的日收益
2、率之间的相关性程度并不是很明显地依赖于它们的到期时间,因此存在可能进行套利的机会。关键词:关键词:国债;测度;聚类分析;Cophenetic 系数 1 1 引言 引言 固定收益市场中证券价格是以一种同质(homogeneous)方式变动的。之所以会出现这种现象,是因为证券的价格都是遵循共同的市场规律而变动的。一般而言,固定收益市场尤其是国债市场与股票市场相比,其波动性较小,这是由固定收益工具自身的特点所决定的。固定收益市场上存在所谓的“一价法则”,它表明向投资者提供相同的现金流和到期债务的两种固定收益证券应当具有相同的市场价格。否则,就会出现无风险的套利机会。根据“一价法则”,可以预期固定收益
3、市场尤其是国债市场上的各个证券收益将会存在很强的相关性。但是,尽管可以认为债券的价格变动是高度相关的,但是对于这些证券价格的变动过程却缺少研究。国内学者已经对股票市场中的价格变动进行了深入的研究,建立了各种复杂的模型来描述它的统计特征和价格等数据的生成过程1234。而对于债券市场的研究却很少见。但仅从两种市场的交易量来看,就决不能忽视对债券市场的研究。因此,本文借鉴国外学者对固定收益市场的研究56789,对中国国债市场的内部结构进行了深入分析。本文选取了上海证券交易所 2004 年 7 月 1 日到 2004 年 11 月 12 日的 17 种国债的每日报价(收盘价)数据,并剔除掉相应的缺失数
4、据,共 90 个有效观测数据作为样本进行分析。有关国债数据信息如表 1 所示,限于篇幅,各个国债的日收益率序列数据略。表表 1 2004 年年 11 月月 12 日上海证券交易所的国债数据日上海证券交易所的国债数据 国债代码 到期日 到期年限 年息票率 年付息次数 国债代码 到期日 到期年限 年息票率 年付息次数 000696 06-06-14 1.5820 11.83%1 010112 11-10-30 6.9481 3.05%1 009704 07-09-05 2.8060 9.78%1 010115 08-12-18 4.0902 3%1 1 国家自然科学基金项目(批准号:7047105
5、1)。2 李彪,男,25 岁,汉族,河北衡水人,天津大学管理学院博士生,研究方向:金融工程与金融管理。Email:libiao2002403,电话:(022)27891334 或者 27890245,通信地址:天津大学管理学院 9041 信箱,邮编:300072。2009905 07-08-20 2.7623 3.28%1 010203 12-04-18 7.4153 2.54%1 009908 09-09-23 4.8525 3.3%1 010210 09-08-16 4.7486 2.39%1 010004 10-05-23 5.5137 2.6%1 010213 17-09-20 12.
6、8279 2.6%2 010010 07-11-14 2.9973 2.36%1 010214 07-10-24 2.9399 2.65%1 010103 08-04-24 3.4399 3.27%1 010215 09-12-06 5.0546 2.93%1 010107 21-07-31 16.6803 4.26%2 010301 10-02-19 5.2596 2.66%1 010110 11-09-25 6.8525 2.95%1 资料来源:上海证券交易所 2 2 日收益率时间序列的修正 日收益率时间序列的修正 通过对收集到的国债每日报价数据进行简单分析后,发现这些国债间的每日价格波动
7、幅度是很小的,而且各个国债报价序列之间具有一定的相似性。因此,为进行深入的结构分析,就必须对原始的每日报价序列进行修正。首先,根据原始的每日国债价格序列,对国债日收益率做如下定义:()ln()ln(1)iiir tp tp t=(1)其中,()ir t表示第i个国债在第t日的收益率,()ip t和(1)ip t 分别表示第i个国债在第t日和1t 日的收盘价。根据(1)式,可以计算出上述 17 种国债的日收益率,从而得到多个国债日收益率时间序列。然后,对得到的国债日收益率序列进行“分离趋势(detrend)”修正。由于各个国债的日收益率序列是非常相似的,因此这些国债日收益率的时间均值序列可以很好
8、的反应出国债的总体收益水平。但是,要深入研究国债市场的内部结构,必须考虑各个国债的日收益率对国债市场总体水平的偏离情况。定义tm为所有国债在第t日的日收益率的算术平均值,即:171117titimr=(2)根据(2)式,即可得到一个所有国债日收益率均值的时间序列。而对于一个国债i,其在第t日的收益率与所有国债日收益率均值的差值序列则用itn来表示,即:itittnrm=(3)根据(3)式,得到的各个国债的日收益率序列就是经过“分离趋势”的,可以用于对国债市场的内部结构进行深入研究。3 3 聚类结构分析 聚类结构分析 首先,定义国债i和j(,1,.17i j=)之间的样本相关函数为:311122
9、2211111()()()()11()()()()TTTijiitttijTTTTiijjttttr t r tr tr tTCrtr trtr tTT=(4)其中,T为样本的长度或者观测的个数,()(1,2,17)ir ti=L可以解释为TR空间上的坐标。根据 Mantegna7,通过相关系数ijC定义下式为距离的测度,即:(,)2(1)ijd i jC=(5)上 式 满 足 距 离 的 三 个 公 理:(,)0d i jij=,(,)(,)d i jd j i=和(,)(,)(,)d i jd i kd k j+。而 且,距 离(,)d i j的 理 论 值 域 是0,2。再 假 定 国
10、债(1,2,.17)i i=是TR空间上的一个向量,它的第t个元素是11()()Tiitir tr tT=,其中i表示国债i的日收益率样本标准偏差。由此,相关函数ijC实际上就是国债向量i和j的夹角余弦,即cosijijC=。同时,1i=,1j=(其中i和j分别表示向量i和j的长度)。又由于国债i和j在TR空间上的欧几里得内积,cosiji ji jij=?。由此,很容易可以证明国债i和j在TR空间上的欧几里得内积恰好是相关系数ijC,即,iji jC=。这样,可以利用范数定义形式来重新表示(5)式,即:(,),2(1)ijd i jijij iji ii jj ij jC=+=其中,2,1(
11、1,2,.17)i iii=,(6)式中的这种测度方式,仅仅依赖于国债之间的相关程度。根据上面所定义的相关测度方法,对上海证券交易所的 17 个国债进行聚类分析。首先,要确定合适的阈值,以保证属于同一类国债的距离应当落在相同的阈值之内,也就是国债i与其所属类中至少有一个国债的距离是小于的。这样,两个不同类之间的最小距离都是大于的。聚类的个数也因所设定的阈值的大小而不同。当0=时,没有对原来的国债样本观测做任何聚类,各个国债之间没有联系;当2=时,就将所有的国债样本观测归成了一类,也无法对各个国债之间的内部结构进行深入研究。因此,选择合适的阈值是很 4重要的。为了具体说明对这 17 个国债的聚类
12、结果,使用 Matlab6.5 中的统计工具箱进行计算分析。根据工具箱所提供的联接(linkage)算法,得到了表征各个债券之间相关紧密程度的一个倒“U”型的层次树(hierarchical tree)图,如图 1 所示。1011 1 6 5 2 3 7 413 91712 814151600.0050.010.0150.020.0250.030.035不 同 到 期 期 限 的 债 券 Bi上 海 证 券 交 易 所 国 债 的 聚 类 结 构 阈值 图图 1 2004 年年 11 月月 12 日上海证券交易所日上海证券交易所 17 个国债的聚类结构个国债的聚类结构 从图 1 中可以看到,每
13、一个“U”型线都确定了一个用于进行国债归类的阈值。在这一临界的值处,可以将两个国债或者一个国债与另一小类国债归成一类。通过对 Matlab中的联接算法计算出的阈值向量和图 1 中的层次树进行反复比较斟酌,最终确定在临界的阈值 0.0137时,将 2004 年 11 月 12 日上海证券交易所的 17 个国债分成五类,如表 2所示。表表 2 2004 年年 11 月月 12 日上海证券交易所日上海证券交易所 17 个国债的聚类结果个国债的聚类结果 所属类别所属类别 第一类第一类 第二类第二类 第三类第三类 第四类第四类 第五类第五类 国债代码 009905 009908 010103 01011
14、0 010203 010210 010301 010107 000696 009704 010004 010010 010112 010115 010213 010214 010215 由表 2 可知,在最后得到的聚类结果中,第一类包括 7 个国债,是所有类中最多的一个,该类国债的到期期限在 2.7623 年(009905)和 7.4153 年(010203)之间;第二类仅包括 1个国债,是所有类中最少的一个,这个国债(010107)的到期期限是 16.6803 年;第三类包括 4 个国债,到期期限在 1.5820 年(000696)和 5.5137 年(010004)之间;第四类包括两个国债
15、到期期限分别为 4.0902 年(010115)和 6.9481 年(010112);第五类包括 3 个国债,到期期限在 2.9399 年(010214)和 12.8279 年(010213)之间。对最后聚类的结果,计算 Cophenetic 系数,得到其值为 0.7924,表明上述 17 个国债所 5使用的联接算法是相当平稳的,聚类的结果也是令人满意的。同时,通过分析图 1 中的聚类结构和 17 个国债的样本相关矩阵,可以发现不同聚类中的国债的相关系数小于 0,而同一个类中的国债则具有很强的正相关关系。此处,仅以四个国债为例,国债 010112 和 010115同属于一类,它们的样本相关系
16、数接近于 1,样本序列之间的距离接近于 0,说明这两个国债的相关程度极高,表现为价格变动上的联动性;而国债 009905 和 010213 不属于同一类,它们的样本相关系数为-0.4746,样本序列之间的距离为 1.7173,说明这两个国债是负相关的,表现为价格变动上的不一致性,如图 2 和 3 所示。0102030405060708090-10-8-6-4-202468x 10-3国 债 010112和 010115修 正 后 的 日 收 益 序 列时 间 tr 率益收日后正修010112010115 图图 2 国债国债 010115 和和 010112 修正后的日收益序列修正后的日收益序列
17、 0102030405060708090-8-6-4-202468x 10-3国 债 009905和 010213修 正 后 的 日 收 益 序 列时 间 tr 率益收日后正修009905010213 图图 3 国债国债 009905 和和 010213 修正后的日收益序列修正后的日收益序列 由于修正后的国债日收益率序列itn表示与所有国债日收益率均值的偏离,如果0itn,它表明国债i在时间t的日收益率比国债市场总体的日收益率要高。因此,通过图 1 中的聚 6类结构图可以确定出各个国债的归类情况,如果两个国债是属于同一类的,那么它们就是正相关的,这两个国债修正后的日收益率序列相对于国债市场收益
18、总体均值具有相同的特征;而如果这两个国债不属于同一类,那么就是负相关的,它们修正后的日收益率序列相对于市场收益率总体均值而言具有相反的走向,这样就可以发现国债市场上存在套利的机会。通过分析表 1 中的各个国债的到期时间和表 2 中的各个国债的聚类结果,发现我国国债市场中的各个国债日收益率之间的相关性程度并不是很明显地依赖于它们的到期时间,这与Luca Grilli10所分析的美国国债市场长期国债的聚类情况是不一致的。Luca Grilli10通过分析最后所得到的三类结果,认为美国的长期国债的内部结构在很大程度上依赖于它们的到期时间。4 4 结论 结论 本文通过采用一种基于各个国债之间相关性的新
19、测度方法,对修正后的国债日收益率时间序列进行了聚类分析,并利用联接算法计算出的阈值向量和层次树进行权衡比较,最终确定在临界的阈值 0.0137时,将 2004 年 11 月 12 日上海证券交易所的 17 种国债分成了五类。分类结果表明,我国国债日收益率之间的相关性程度并不是很明显地依赖于它们的到期时间,这与美国国债市场的结构分析情况不同,不符合前面所提到的“一价法则”,存在可能进行套利的机会。说明我国的国债市场在很大程度上还不完善,因此,还要从各个方面对国债乃至固定收益市场进行完善,而建立良好的国债期限结构以形成完整的基准利率期限结构则是当前最为迫切的任务之一11。参考文献:参考文献:1 白
20、崑,张世英.扩展的SV模型及其在深圳股票市场的应用J.系统工程,2001,19(6):21-26 2 彭作祥,庞皓.资本市场有效性假说与AR-X-GARCH模型的应用J.西南师范大学学报(自然科学版),2002,27(3):303-308 3 王卫宁,汪秉宏,陈曦.上海证券指数的统计分析J.运筹与管理,2003,12(4):85-90 4 张永东.风险的时间尺度对中国股市的实证分析J.系统工程学报,2004,19(3):294-299 5 Didier Sornette,Anders Johansen.A hierarchical model of financial crashesJ.Phy
21、sica A 1998,261:581-598 6 Mantegna R.N.Information and hierarchical structure in financial marketsJ.Computer Physics Communications 1999,121-122:153-156 7 Mantegna R.N.Hierarchical structure in financial marketsJ.Eur.Phys.J.B 1999,25:193197 8 Marangio L.,A.Ramponi,M.Bernaschi.A critical review of te
22、chniques for term 7structure analysisJ.Int.J.Theor.Appl.Finance 2002,5:189-221 9 Mantegna R.,H.E.Stanley.Scaling behavior in the dynamics of an economics indexJ.Nature 1995,376:46-49 10 Luca Grilli.Long-term fixed income market structureJ.Physics A 2004,332:441-447 11 杨宝臣,李彪.基于扩展的息票剥离法的国债收益率曲线的估计J.中
23、国管理科学,2004,21(6):45-51 The Clustering Analysis of Chinese Treasury Bond Returns Li Biao Yang Baochen(School of Management,Tianjin University,Tianjin,300072)Abstract:The paper first pre-analyzed daily return time series of Chinese Treasury bond market from July 1,2004 to November 12,2004.And on the b
24、asis of that,the daily return time series were detrended.Then,a new metrical approach of distance by using the correlation of bond daily returns was proposed and the clustering analysis for the bond daily returns is conducted with the modified series of daily returns according to the new method.At l
25、ast,the 17 bonds were classified 5 categories by trading off between threshold value and hierarchical tree.The classification result indicates that the correlation of Chinese Treasury bonds daily return does not evidently depend on their maturities,thus there maybe is the opportunity to arbitrage.Keywords:Treasury bond;Measure;Cluster analysis;Cophenetic coefficient






