资源描述
典型相关分析典型相关分析2024/10/13 周日2要 点典型相关分析的数学表达方式,假定条件;典型相关系数的数学含义;典型变量系数的数学含义;简单相关,复相关和典型相关的意义;典型相关的应用 一、什么是典型相关分析及基本思想一、什么是典型相关分析及基本思想 通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标 和P个原材料的指标 之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵y2y3y1x2x1 典型相关分析的思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,2024/10/13 周日9 然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。u2和v2与u1和v1相互独立,但u2和v2相关。如此继续下去,直至进行到r步,两组变量的相关性被提取完为止。rmin(p,q),可以得到r组变量。二、典型相关的数学描述典型相关的数学描述 考虑两组变量的向量 其协方差阵为(一)想法 其中11是第一组变量的协方差矩阵;22是第二组变量的协方差矩阵;是X和Y的其协方差矩阵。如果我们记两组变量的第一对线性组合为:其中:所以,典型相关分析就是求 1和b b1,使uv达到最大。(二)典型相关系数和典型变量的求法 在约束条件:下,求a a1 1和和b b1 1,使uv达到最大。令2024/10/13 周日13利用柯西不等式有(参看1.8.4式)2024/10/13 周日14记m为 12的秩,则记为相应的特征向量为其余的零特征根对应的向量为2024/10/13 周日15由特征向量可以构成一个正交矩阵T,有,有2024/10/13 周日16 若取 则2024/10/13 周日17相应的特征向量为 a1和和b1分别构成了第一组变量和第二组变量的分别构成了第一组变量和第二组变量的第一对典型变量的系数。第一对典型变量的系数。2024/10/13 周日18 第一对典型相关变量提取了原始变量x组和y组之间相关的主要部分,那么这部分的信息不够,则还可以在剩余相关中提取第二对典型变量:在以下的约束条件下:2024/10/13 周日19 求 令 则,约束条件等价于2024/10/13 周日202024/10/13 周日21 当取 这时uk和vk达到最大值k,称它为第k个典型相关系数,称ak和 bk为第k对典型变量系数。2024/10/13 周日22相应的特征向量为 ak和和bk分别构成了第一组变量和第二组变量的分别构成了第一组变量和第二组变量的第第k对典型变量的系数。对典型变量的系数。2024/10/13 周日23注有相同的特征根,而可以验证:根据线性代数的思想,下列矩阵2024/10/13 周日24方法二方法二 根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求 的极大值,其中和是 Lagrange乘数。将上面的3式分别左乘和将左乘(3)的第二式,得并将第一式代入,得 的特征根是 ,相应的特征向量为将左乘(3)的第一式,并将第二式代入,得 的特征根是 ,相应的特征向量为结论:既是M1又是M2的特征根,和是相应于M1和M2的特征向量。至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:在约束条件:求使达到最大的和。2024/10/13 周日30例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。2024/10/13 周日31X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y组典型变量的系数V1V2Y1(年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.2956三、典型变量的性质1、同一组的典型变量之间互不相关 X组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:Y组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:因为特征向量之间是正交的。故2、不同组的典型变量之间相关性 不同组内一对典型变量之间的相关系数为:2024/10/13 周日36同对则协方差为i,不同对则为零。3、原始变量与典型变量之间的相关系数原始变量相关系数矩阵 X X典型变量系数矩阵y典型变量系数矩阵2024/10/13 周日402024/10/13 周日422024/10/13 周日43例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。2024/10/13 周日44X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵2024/10/13 周日45data xiaofei(type=corr);input _name_$x1 x2 y1-y3;_type_=corr;cards;x1 1 0.08 0.26 0.67 0.34x2 0.08 1 0.33 0.59 0.34y1 0.26 0.33 1 0.37 0.21y2 0.67 0.59 0.37 1 0.35y3 0.34 0.34 0.21 0.35 1;proc print data=xiaofei;run;proc cancorr data=xiaofei wprefix=w vprefix=v;with y1-y3;var x1-x2;run;典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y组典型变量的系数V1V2Y1(年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.2956典型变量的结构(相关系数)U1U2X10.9866-0.1632X20.88720.4614V1V2Y10.42110.8464Y20.9822-0.1101Y30.51450.3013典型变量的结构(相关系数)V1V2X10.6787-0.0305X20.61040.0862U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.05632024/10/13 周日50 两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入,u1和 v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度,u2和 v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。2024/10/13 周日524、各组原始变量被典型变量所解释的方差X组原始变量被ui解释的方差比例X组原始变量被vi解释的方差比例y组原始变量被ui解释的方差比例y组原始变量被vi解释的方差比例 被典型变量解释的被典型变量解释的X组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方Y组典型变量解释组典型变量解释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比例10.88030.88030.47330.41660.416620.11971.00000.03490.00420.4208 被典型变量解释的被典型变量解释的Y组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方X组典型变量解释组典型变量解释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比例1 0.46890.46890.47330.22190.22192 0.27310.74200.03490.00950.23152024/10/13 周日55 5、简单相关、复相关和典型相关之间的关系 若p1且q1,则x和y的典型相关就是简单相关;若p1或q1,则x和y的典型相关就是复相关;2024/10/13 周日56五、样本典型相关系数 在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。2024/10/13 周日57 1、假设有X组和Y组变量,样本容量为n。假设(X1,Y1),(X2,Y2),(Xn,Yn),观测值矩阵为:2024/10/13 周日582024/10/13 周日59 2、计算特征根和特征向量 求M1和 M2的特征根 ,对应的特征向量 。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。2024/10/13 周日60六、典型相关系数的检验典型相关分析是否恰当,应该取决于两组原变量之间是否相关,如果两组变量之间毫无相关性而言,则不应该作典型相关分析。用样本来估计总体的典型相关系数是否有误,需要进行检验。(一)整体检验检验的统计量:2024/10/13 周日61所以,两边同时求行列式,有事实上2024/10/13 周日622024/10/13 周日63 由于 所以若M的特征根为,则(l-M)的特征根为(1-)。根据矩阵行列式与特征根的关系,可得:相关系数越大,则2024/10/13 周日64在原假设为真的情况下,检验的统计量 近似服从自由度为pq的2分布。在给定的显著性水平下,如果22(pq),则拒绝原假设,认为至少第一对典型变量之间的相关性显著。2024/10/13 周日65 依此类推,再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进行典型相关分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。2024/10/13 周日66 若原假设H0被接受,则认为只有第二对典型变量是有用的;若原假设H0被拒绝,则认为第二对典型变量也是有用的,并进一步检验假设。(二)部分总体典型相关系数为零的检验2024/10/13 周日67如此进行下去.直至对某个k2024/10/13 周日68检验的统计量 近似服从自由度为(p-k)(q-k)的2分布。在给定的显著性水平下,如果22(p-k)(q-k),则拒绝原假设,认为至少第k+1对典型变量之间的相关性显著。2024/10/13 周日69 H0:当前和后面的典型相关系数均为零当前和后面的典型相关系数均为零 H1:至少当前的典型相关系数为零至少当前的典型相关系数为零LikelihoodRatioApprox FNum DFDen DFPr F 10.508334981341.2346199900.0001 20.96508130180.838299960.0001可见,前面两对典型变量的相关性是很强的。2024/10/13 周日70职业满意度典型相关分析 某调查公司从一个大型零售公司随机调查了784人,测量了5个职业特性指标和7个职业满意变量。讨论 两组指标之间是否相联系。X组:Y组:X1用户反馈 Y1主管满意度X2任务重要性 Y2事业前景满意度X3任务多样性 Y3财政满意度X4任务特殊性 Y4工作强度满意度X5自主权 Y5公司地位满意度 Y6工作满意度 Y7总体满意度2024/10/13 周日71X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.190.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.281.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.002024/10/13 周日72CanonicalCorrelationAnalysisAdjustedCanonicalCorrelationApproxCanonicalCorrelationSquaredStandardErrorCanonicalCorrelation10.5537060.5530730.0069340.30659120.2364040.2346890.0094420.05588730.119186.0.0098580.01420540.072228.0.0099480.00521750.057270.0.0099680.0032802024/10/13 周日73LikelihoodRatioApproxFNumDFDenDFPrF10.63988477134.42373542018.150.000120.9228094133.82422434848.670.000130.9774354115.26341527578.390.000140.9915203010.65798199820.000150.9967201510.9600399920.0001当前和后面的典型相关系数均为零的检验2024/10/13 周日74U1U2U3U4U5X10.42170.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392X组的典型变量2024/10/13 周日75V1V2V3V4V5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141Y组的典型变量2024/10/13 周日76U1U2U3U4U5X10.82930.1093-0.4853-0.24690.0611X20.7304-0.43660.20010.00210.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026X50.86060.26600.38860.1484-0.1246V1V2V3V4V5Y10.75640.04460.3395-0.1294-0.3370Y20.64390.3582-0.1717-0.3530-0.3335Y30.38720.0373-0.1767-0.53480.4148Y40.37720.7919-0.00540.28860.3341Y50.65320.10840.2092-0.43760.4346Y60.8040-0.2416-0.23480.40520.1964Y70.50240.16280.4933-0.18900.0678原始变量与本组典型变量之间的相关系数2024/10/13 周日77V1V2V3V4V5X10.45920.0258-0.0578-0.01780.0035X20.4044-0.10320.02390.00020.0278X30.4171-0.1102-0.01260.0218-0.0192X40.34110.0526-0.02450.04780.0173X50.47650.06290.04630.0107-0.0071U1U2U3U4U5Y10.41880.01050.0405-0.0093-0.0193Y20.35650.0847-0.0205-0.0255-0.0191Y30.21440.0088-0.0211-0.03860.0238Y40.20880.1872-0.00060.02080.0191Y50.36170.02560.0249-0.03160.0249Y60.4452-0.0571-0.02800.02930.0112Y70.27820.03850.0588-0.01360.0039原始变量与对应组典型变量之间的相关系数2024/10/13 周日78 可以看出,所有五个表示职业特性的变量与u1有大致相同的相关系数,u1视为形容职业特性的指标。第一对典型变量的第二个成员v1与Y1,Y2,Y5,Y6有较大的相关系数,说明v1主要代表了主管满意度,事业前景满意度,公司地位满意度和工种满意度。而u1和v1之间的相关系数0.5537。2024/10/13 周日79 CanonicalRedundancyAnalysisRawVarianceoftheVARVariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.58180.58180.17840.178420.10800.68980.00600.184430.09600.78580.00140.185840.12230.90810.00060.186450.09191.00000.00030.1867RawVarianceoftheWITHVariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.37210.37210.11410.114120.12220.49430.00680.120930.07400.56830.00110.122040.12890.69720.00070.122650.10580.80300.00030.12302024/10/13 周日80u1和v1解释的本组原始变量的比率:X组的原始变量被u1到u5解释了100%Y组的原始变量被v1到v5解释了80.3%X组的原始变量被u1到u4解释了90.81%Y组的原始变量被v1到v4解释了69.72%房地产指标典型相关分析报告房地产指标典型相关分析报告 在对房地产指标的典型相关分析中建立了如下的指标体系:X1:开发公司个数(个)X2:年平均职工人数(人)X3:自开始建设至本年底累计完成投资X4:本年完成投资 X5:施工房屋面积(万平方米)Y1:经营总收入 Y2:土地转让收入Y3:商品房屋销售收入 Y4:房屋出租收入Y5:经营税金及附加 Y6:营业利润Y7:竣工房屋面积(万平方米)Y8:竣工房屋价值(万元)其中,X1-X5是反映房地产投入的变量,Y1-Y8是反映房地产产出的变量。数据来源于1999中国统计年鉴,选取了全国30个省市自治区的相应指标值(西藏和新疆两自治区因数据不全而删除序号序号典型相关系数典型相关系数 典典 型型 变变 量量10.998716U1=-0.1769X1+0.0639X2+0.7264X3+0.3633X4+0.0053X5V1=2.5217Y1+0.1720Y2-1.7370Y3-0.1993Y4-0.0886Y5-0.3747Y6-0.1016Y7+0.6610Y820.980640U2=0.3319X1+0.0785X2-3.3077X3+1.8943X4+1.2047X5V2=-2.0308Y1-0.2555Y2+0.3219Y3+0.4304Y4+1.4052Y5+0.4774Y6+2.0697Y7-1.8594Y830.916191U3=-1.1339X1-3.1176X2+1.2803X3-3.9436X4+6.7392X5V3=0.3990Y1-0.6098Y2-0.7852Y3-2.0872Y4+4.2927Y5-0.6167Y6-1.6135Y7+0.5071Y840.757332U4=1.4478X1-1.7250X2-4.4766X3+8.1918X4+3.5963X5V4=-8.0531Y1-0.9941Y2-1.6221Y3-1.3311Y4+5.1584Y5+1.6818Y6-0.9464Y7+6.4783Y850.739978U5=-3.7387X1+2.3073X2-2.0488X3+1.8063X4+1.4170X5V5=4.7208Y1-0.3733Y2-4.4002Y3+3.1983Y4-4.2877Y5-1.8271Y6+1.5460Y8+0.9555Y9第一对典型变量中,U1主要受自开始建设至本年底累计完成投资影响,V1主要受经营总收入和商品房屋销售收入影响;第二对典型变量中,U2主要受自开始建设至本年底累计完成投资、本年完成投资和施工房屋面积影响,V2主要受经营税金及附加、竣工房屋面积和竣工房屋价值影响:第三对典型变量中,U3受各个指标影响都较大,V4主要受房屋出租收入、经营税金及附加和竣工房屋面积的影响;第四对典型变量中,U4主要受本年完成投资的影响,V4主要受经营总收入和工房屋价值的影响。第五对典型变量中,U5主要受开发公司个数影响,V4主要受经营总收入、商品房屋销售收入、房屋出租收入和经营税金及附加影响。但注意到,第一对典型变量的方差贡献率已达92.20%,故保留第一对典型变量用作分析,从而达到降维的目的。总的来说,房地产的投入变量主要受自开始建设至本年底累计完成投资影响,产出变量集中在经营总收入和商品房屋销售收入上。累计完成投资额与经营总收入,特别是商品房屋销售收入高度相关。典型相关分析的基本思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有最大相关性。如此下去,直至两组变量的相关性被提取完为止。本例想利用我国1999年城镇居民的家庭收入来源和消费性支出的数据了解我国居民消费构成及主要影响因素分析所用的数据来自:中国统计年鉴2000。我国居民消费构成及主要影响因素 收入指标:X1可支配收入 X2实际收入 X3国有单位职工收入 X4集体单位职工收入 X5其他经济类型职工收入,X6转移收入 支出指标:Y1消费性支出 Y2食品 Y3衣着 Y4交通和通讯 Y5医疗和保健 Y6娱乐、教育、文化服务 Y7居住 序号序号 典型相关系数典型相关系数 典型变量典型变量1 0.990174 U1 =0.9989X1+-0.0595X2+0.0776X3+0.0489X4-0.0931X5+0.0074X6 V1=1.3263Y1-0.0270Y2-0.0005Y3-0.0769Y4-0.0717Y5-0.2031Y6-0.0219Y2 0.868704 U2 =-4.8668X1+0.1264X2+1.9585X3+0.3299X4+1.4095X5+2.6453X6 V2=-4.4920Y1+2.5421Y2+1.2480Y3-0.4621Y4+1.0443Y5+0.8610Y6+0.0586Y7由累计贡献率得知,第一组和第二组变量的累计贡献率已达到了97.56%,而且,这两组的系数和方差与其他组相比要大得多.即只需要前两组变量就已经可以解释全部信息的97.56%.在第一对典型变量中,U1主要受可支配收入的影响,V1主要受消费性支出的影响;可见实际收入对消费支出的影响远小于可支配收入的影响。居民消费主要依据其可支配收入而定。第二对典型变量中,U2主要受国有单位职工收入、其他经济类型职工收入和转移收入的影响,V2主要受食品、衣着、医疗和保健的影响。2024/10/13 周日88在此,可见我国集体单位的职工收入还不能够与国有甚至是其他经济类型的单位这职工收入相比,这也从一个侧面放反映了集体单位规模等方面的现状。再有就是我国居民食品和衣着方面的支出仍占了总支出的大部分,反映了我国居民总体收入水平还不够高;其次,医疗保健支出的比例比较大是可喜的,说明我国居民已经可以把部分精力放在了自己身体的调养上来,全国居民的总体健康状况在上升之中。让我们担忧的是在教育方面的支出所占比例太小,不符合现今世界发展对教育程度的要求。科技是第一生产力,如何提高国民的科技文化知识水平是当今的一大重点。在当代激烈的竞争中,没有知识的支撑是不行的。2024/10/13 周日89协整关系协整关系(cointegration)(cointegration)典型相关分析的应用典型相关分析的应用典型相关分析的应用典型相关分析的应用 -约翰森协整关系检验约翰森协整关系检验约翰森协整关系检验约翰森协整关系检验2024/10/13 周日90 协整关系协整关系宏观经济变量的大多数,单个来观察的话,随着时间的推移它们呈现一种醉步(非平稳)的走势。如果把几个经济变量的走势图形放在一起观察的话,会发现它们的运动具有某种相似性(例如,消费和收入,进口和出口等)。这种现象的产生,引起了人们的兴趣,这种经济变量运动的相似性构成了协整概念的基础,2024/10/13 周日91 定义(协整):设YtI(1),xtI(1)。如果存在常数b,使得YtbXt为I(0)(平稳时间序列)时,称Yt和Xt之间存在协整关系。上面提到当Yt和Xt均为非平稳时间序列Yt和Xt作回归时,要注意假相关问题的出现,但是当Yt和Xt之间存在协整关系时,不会产生这样的问题。一、两个变量间协整的检验一、两个变量间协整的检验 2024/10/13 周日92 由协整的定义可以知道,协整的检验与单位根的检验分不开。关于协整关系的检验,这里只简单介绍一下利用回归残差进行检验的Engle-Granger方法(Engle and Granger8)具体步骤如下:第一步:设Yt和Xt之间存在以下的关系Yt=m+bXtut,用OLS对式作回归得到残差et。第二步:对残差et运用DF的单位根检验方法来判断ut的平稳性,如果得出utI(0)的结论,则称Yt和Xt之间存在协整关系。2024/10/13 周日93二、多重协整多重协整 当研究的变量在3个或3个以上时,我们仍然关心他们是否具有协整关系,即他们中构成协整关系的变量有几组。1、多重协整的基本理论、多重协整的基本理论设Yt是一个m维的非平稳时间序列2024/10/13 周日94 当Yt是一个m维的非平稳时间序列I(1)时,如果存在某个mr的矩阵mr,mr 为列满秩。成为I(0)过程,则称Yt在mr上具有r个协整关系。使得2024/10/13 周日952024/10/13 周日96通过适当的变换,等价的模型为其中:2024/10/13 周日97例 一阶自回归的情形 我们以一个一阶自回归过程为例,来讨论关于 协整的问题。2024/10/13 周日98当当0,即,即 ,则,则rank()=0容易得到容易得到Yt所有分量均为所有分量均为I(1),),且没有协整关系。且没有协整关系。2024/10/13 周日99当当0,即,即,且,且rank()=m,对方程,对方程 可见可见Yt本生就是平稳序列。本生就是平稳序列。因为其左边是平稳的序列,右边也应该是平稳序列,是满秩矩阵,故2024/10/13 周日100 当当0,即,即,rank()=rm,根据线性代数的,根据线性代数的结论,有结论,有m r阶矩阵阶矩阵 和和 列满秩矩阵,使列满秩矩阵,使 有有 包含包含r个协整关系。个协整关系。该模型成为误差校正模型。协整关系,调整系数。2024/10/13 周日101总结起来有三种情形:1、系数矩阵的秩为r时,Yt的分量间存在有r个协整组合,有m-r个组合仍为I(1)。2、当系数矩阵的秩为m时,Yt为I(0)向量。平稳的向量。3、当系数矩阵的秩为0时,Yt为I(1)向量,且不存在任何协整关系。至此,我们已经发现,讨论多讨论多重协整关系的问题,归于讨论重协整关系的问题,归于讨论 的秩的问题。的秩的问题。2024/10/13 周日102约翰森(Johansen)检验提供了确定协整变量个数的方法,其方法的理论基础是典型相关分析。2、协整变量的个数协整变量的个数 其中:2024/10/13 周日103 的秩=r0是ut和 t中m对典型变量(线性组合)相关系数的平方。是ut和 t的协方差矩阵,如果ut和 t无相关关系,则S01=0。Johansen检验的思想就是检验ut和 t是否存在相关的典型变量和有几对相关性较大的典型变量。2024/10/13 周日1092024/10/13 周日110如果ut和 t无相关关系,S01=0,则 无协整关系,否则当很小时,支持备择假设,至少有一个协整变量。2024/10/13 周日111 检验的统计量 当H0:r=0的情形下,接受原假设,则没有协整关系,如果拒绝原假设,则要进行下一步检验,即检验r=1时的情形。H1:有2个协整关系,即在ut和vt中有2对典型变量相关性显著;H0:至多存在1个协整关系,即在ut和vt中有1对典型变量相关性显著;2024/10/13 周日112检验的统计量为:当r=1的情形下,接受原假设,则仅有一个协整变量,如果拒绝原假设,则要进行下一步检验,即检验r=2时。与此类推,当r=k的情形下,接受原假设,则有k个协整变量,如果拒绝原假设,则要进行下一步检验,即检验r=k+1时情况。2024/10/13 周日113(3)Johansen检验的实施 2024/10/13 周日114 Johansen检验要求,协整方程有5种,上面的对话框左侧:序列y或协整方程种无确定趋势项或无截距项;序列y无截距项且协整方程只有截距项;序列y或协整方程中只有截距项;序列y无趋势项和在协整方程既有截距项也有趋势项;序列y有线性趋势且在协整方程既有截距项也有趋势项。2024/10/13 周日1152024/10/13 周日1162024/10/13 周日117data data101;input x1-x5;label x1=力学(闭)x2=物理(闭)x3=代数(开)x4=分析(开)x5=统计(开);n=_n_;cards;77 82 67 67 81 63 78 80 70 8175 73 71 66 81 55 72 63 70 6863 63 65 70 63 53 61 72 64 7351 67 65 65 68 59 70 68 62 5662 60 58 62 70 64 72 60 62 4552 64 60 63 54 55 67 59 62 4450 50 64 55 63 65 63 58 56 3731 55 60 57 73 60 64 56 54 4044 69 53 53 53 42 69 61 55 4562 46 61 57 45 31 49 62 63 6244 61 52 62 46 49 41 61 49 6412 58 61 63 67 49 53 49 62 4754 49 56 47 53 54 53 46 59 4444 56 55 61 36 18 44 50 57 8146 52 65 50 35 32 45 49 57 6430 69 50 52 45 46 49 53 59 3740 27 54 61 61 31 42 48 54 6836 59 51 45 51 56 40 56 54 3546 56 57 49 32 45 42 55 56 4042 60 54 49 33 40 63 53 54 2523 55 59 53 44 48 48 49 51 3741 63 49 46 34 46 52 53 41 40;proc print data=data101;run;proc cancorr data=data101 vprefix=open wprefix=close;var x1 x2;with x3 x4 x5;run;2024/10/13 周日118
展开阅读全文