ImageVerifierCode 换一换
格式:PPT , 页数:84 ,大小:868KB ,
资源ID:2045847      下载积分:6 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/2045847.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(典型相关分析和通径分析.ppt)为本站上传会员【精****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

典型相关分析和通径分析.ppt

1、典型相关分析1.一、什么是典型相关分析及基本思想一、什么是典型相关分析及基本思想 通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。2.在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标P个原材料的指标 之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关

2、性的目的。3.例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。4.X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵5.y2y3y1x2x16.典型相关分析的思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对

3、本身具有次大的相关性。如此下去,直至两组变量的相关性被提取完为止。7.u2和v2与u1和v1相互独立,但u2和v2相关。如此继续下去,直至进行到r步,rmin(p,q),可以得到r组变量。从而达到降维的目的。8.二、典型相关的数学描述典型相关的数学描述(一)想法 考虑两组变量的向量 其协方差阵为其中11是第一组变量的协方差矩阵;22是第二组变量的协方差矩阵;12=21是X和Y的其协方差矩阵。9.如果我们记两组变量的第一对线性组合为:其中:所以,典型相关分析就是求1和1,使uv达到最大。10.(二)典型相关系数和典型变量的求法 在约束条件下,求1和1,使uv达到最大。根据数学分析中条件极值的求法

4、,引入Lagrange乘数,求极值问题,则可以转化为求的极大值,其中和是 Lagrange乘数。11.将上面的3式分别左乘和12.将左乘(3)的第二式,得并将第一式代入,得 的特征根是 ,相应的特征向量为13.将左乘(3)的第一式,并将第二式代入,得 的特征根是 ,相应的特征向量为14.结论:既是M1又是M2的特征根,和是相应于M1和M2的特征向量。至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。15.在剩余的相关中再求出第二对典型变量

5、和他们的典型相关系数。设第二对典型变量为:在约束条件:求使达到最大的和。16.17.典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491918.X组典型变量的系数U1U2X10.7689-1.4787X20.27211.6443Y组典型变量的系数V1V2Y10.04911.0003Y20.8975-0.5837Y30.19000.295619.三、典型变量的性质1、同一组的典型变量之间互

6、不相关X组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:Y组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:20.2、不同组的典型变量之间相关性 不同组内典型变量之间的相关系数为:21.同对则协方差为i,不同对则为零。22.3、原始变量与典型变量之间的相关系数原始变量相关系数矩阵 x典型变量系数矩阵23.y典型变量系数矩阵24.25.26.典型变量的结构U1U2X10.9866-0.1632X20.88720.4614V1V2Y10.42110.8464Y20.9822-0.1101Y30.51450.301327.典型变量的结构V1V2X10.6787-0.0305X2

7、0.61040.0862U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.056328.两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入,u1和 v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.301

8、3,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度,u2和 v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。29.4、各组原始变量被典型变量所解释的方差X组原始变量被ui解释的方差比例X组原始变量被vi解释的方差比例y组原始变量被ui解释的方差比例y组原始变量被vi解释的方差比例30.被典型变量解释的被典型变量解释的X组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方Y组典型变量解释组典型变量解释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比例10.88030.88030.47330.41660.

9、416620.11971.00000.03490.00420.420831.被典型变量解释的被典型变量解释的Y组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方X组典型变量解释组典型变量解释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比例10.46890.46890.47330.22190.221920.27310.74200.03490.00950.231532.注:冗余分析 典型相关冗余分析是一个比较陌生的概念,然而它不仅对于典型相关分析十分重要,而且对于整个统计分析都十分重要。其含义是多余,过剩的意思。冗余主要是指方差而言

10、的。如果一个变量中的部分方差可以由另一个变量的方差来解释或预测,即方差相冗余。冗余分析是通过冗余指数来测度,冗余指数是一组的典型变量对另一组观测变量总方差的解释比例,是组间交叉共享比率。33.五、样本典型相关系数 在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。34.1、假设有X组和Y组变量,样本容量为n。假设(X1,Y1),(X2,Y2),(Xn,Yn),观测值矩阵为:35.36.2、计算

11、特征根和特征向量 求M1和 M2的特征根 ,对应的特征向量 。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。37.六、典型相关系数的检验典型相关分析是否恰当,应该取决于两组原变量之间是否相关,如果两组变量之间毫无相关性而言,则不应该作典型相关分析。用样本来估计总体的典型相关系数是否有误,需要进行检验。检验的统计量:(一)整体检验38.所以,两边同时求行列式,有39.40.由于 所以若M的特征根为,则(l-M)的特征根为(1-)。根据矩阵行列式与特征根的关系,可得:41.在原假设为真的情况下,检验的统计量 Q=-(n-1)-(p+q+1)/2ln0近似服从自由度为pq的2分布。在

12、给定的显著性水平下,如果22(pq),则拒绝原假设,认为至少第一对典型变量之间的相关性显著。依此类推,再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进行典型相关分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。42.(二)部分总体典型相关系数为零的检验 H0:P2Pr0 Hl:P2,P3,Pr至少有一个不为零。若原假设H0被接受,则认为只有第二对典型变量是有用的;若原假设H0被拒绝,则认为第二对典型变量也是有用的,并进一步检验假设 H0:P3Pr0 H1:P3,

13、Pr至少有一个不为零。如此进行下去.直至对某个k,H0:P(k十1)PM0H1:P(k+1),,Pm至少有一个不为零 43.检验的统计量近似服从自由度为(p-k)(q-k)的2分布。在给定的显著性水平下,如果22(p-k)(q-k),则拒绝原假设,认为至少第k+1对典型变量之间的相关性显著。44.H0:当前和后面的典型相关系数均为零当前和后面的典型相关系数均为零H1:至少当前的典型相关系数为零至少当前的典型相关系数为零LikelihoodRatioApproxFNumDFDenDFPrF10.508334981341.2346199900.000120.96508130180.83829996

14、0.0001可见,前面两对典型变量的相关性是很强的。45.职业满意度典型相关分析 某调查公司从一个大型零售公司随机调查了784人,测量了5个职业特性指标和7个职业满意变量。讨论 两组指标之间是否相联系。X组:Y组:X1用户反馈 Y1主管满意度X2任务重要性 Y2事业前景满意度X3任务多样性 Y3财政满意度X4任务特殊性 Y4工作强度满意度X5自主权 Y5公司地位满意度 Y6工作满意度 Y7总体满意度46.X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.53

15、0.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.190.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.17

16、0.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.281.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.0047.CanonicalCorrelationAnalysisAdjustedCanonicalCorrelationApproxCanonic

17、alCorrelationSquaredStandardErrorCanonicalCorrelation10.5537060.5530730.0069340.30659120.2364040.2346890.0094420.05588730.119186.0.0098580.01420540.072228.0.0099480.00521750.057270.0.0099680.00328048.LikelihoodRatioApproxFNumDFDenDFPrF10.63988477134.42373542018.150.000120.9228094133.82422434848.670.

18、000130.9774354115.26341527578.390.000140.9915203010.65798199820.000150.9967201510.9600399920.0001当前和后面的典型相关系数均为零的检验49.U1U2U3U4U5X10.42170.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392

19、X组的典型变量50.V1V2V3V4V5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141Y组的典型变量51.U1U2U3U4U5X10.82930.1093-0.4

20、853-0.24690.0611X20.7304-0.43660.20010.00210.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026X50.86060.26600.38860.1484-0.1246V1V2V3V4V5Y10.75640.04460.3395-0.1294-0.3370Y20.64390.3582-0.1717-0.3530-0.3335Y30.38720.0373-0.1767-0.53480.4148Y40.37720.7919-0.00540.28860.3341Y50.

21、65320.10840.2092-0.43760.4346Y60.8040-0.2416-0.23480.40520.1964Y70.50240.16280.4933-0.18900.0678原始变量与本组典型变量之间的相关系数52.V1V2V3V4V5X10.45920.0258-0.0578-0.01780.0035X20.4044-0.10320.02390.00020.0278X30.4171-0.1102-0.01260.0218-0.0192X40.34110.0526-0.02450.04780.0173X50.47650.06290.04630.0107-0.0071U1U2U

22、3U4U5Y10.41880.01050.0405-0.0093-0.0193Y20.35650.0847-0.0205-0.0255-0.0191Y30.21440.0088-0.0211-0.03860.0238Y40.20880.1872-0.00060.02080.0191Y50.36170.02560.0249-0.03160.0249Y60.4452-0.0571-0.02800.02930.0112Y70.27820.03850.0588-0.01360.0039原始变量与对应组典型变量之间的相关系数53.可以看出,所有五个表示职业特性的变量与u1有大致相同的相关系数,u1视为形

23、容职业特性的指标。第一对典型变量的第二个成员v1与Y1,Y2,Y5,Y6有较大的相关系数,说明v1主要代表了主管满意度,事业前景满意度,公司地位满意度和工种满意度。而u1和v1之间的相关系数0.5537。54.CanonicalRedundancyAnalysisRawVarianceoftheVARVariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.58180.58180

24、.17840.178420.10800.68980.00600.184430.09600.78580.00140.185840.12230.90810.00060.186450.09191.00000.00030.1867RawVarianceoftheWITHVariablesExplainedbyTheirOwnTheOppositeCanonicalVariablesCanonicalVariablesCumulativeCumulativeProportionProportionProportionProportion10.37210.37210.11410.114120.12220.

25、49430.00680.120930.07400.56830.00110.122040.12890.69720.00070.122650.10580.80300.00030.123055.u1和v1解释的本组原始变量的比率:X组的原始变量被u1到u5解释了100%Y组的原始变量被v1到v5解释了80.3%X组的原始变量被u1到u4解释了90.81%Y组的原始变量被v1到v4解释了69.72%56.房地产指标典型相关分析报告房地产指标典型相关分析报告在对房地产指标的典型相关分析中建立了如下的指标体系:X1:开发公司个数(个)X2:年平均职工人数(人)X3:自开始建设至本年底累计完成投资X4:本年

26、完成投资 X5:施工房屋面积(万平方米)Y1:经营总收入 Y2:土地转让收入Y3:商品房屋销售收入 Y4:房屋出租收入Y5:经营税金及附加 Y6:营业利润Y7:竣工房屋面积(万平方米)Y8:竣工房屋价值(万元)其中,X1-X5是反映房地产投入的变量,Y1-Y8是反映房地产产出的变量。数据来源于1999中国统计年鉴,选取了全国30个省市自治区的相应指标值(西藏和新疆两自治区因数据不全而删除57.序号序号典型相关系数典型相关系数典典型型变变量量10.998716U1=-0.1769X1+0.0639X2+0.7264X3+0.3633X4+0.0053X5V1=2.5217Y1+0.1720Y2-

27、1.7370Y3-0.1993Y4-0.0886Y5-0.3747Y6-0.1016Y7+0.6610Y820.980640U2=0.3319X1+0.0785X2-3.3077X3+1.8943X4+1.2047X5V2=-2.0308Y1-0.2555Y2+0.3219Y3+0.4304Y4+1.4052Y5+0.4774Y6+2.0697Y7-1.8594Y830.916191U3=-1.1339X1-3.1176X2+1.2803X3-3.9436X4+6.7392X5V3=0.3990Y1-0.6098Y2-0.7852Y3-2.0872Y4+4.2927Y5-0.6167Y6-1.

28、6135Y7+0.5071Y840.757332U4=1.4478X1-1.7250X2-4.4766X3+8.1918X4+3.5963X5V4=-8.0531Y1-0.9941Y2-1.6221Y3-1.3311Y4+5.1584Y5+1.6818Y6-0.9464Y7+6.4783Y850.739978U5=-3.7387X1+2.3073X2-2.0488X3+1.8063X4+1.4170X5V5=4.7208Y1-0.3733Y2-4.4002Y3+3.1983Y4-4.2877Y5-1.8271Y6+1.5460Y8+0.9555Y958.第一对典型变量中,U1主要受自开始建设至

29、本年底累计完成投资影响,V1主要受经营总收入和商品房屋销售收入影响;第二对典型变量中,U2主要受自开始建设至本年底累计完成投资、本年完成投资和施工房屋面积影响,V2主要受经营税金及附加、竣工房屋面积和竣工房屋价值影响:第三对典型变量中,U3受各个指标影响都较大,V4主要受房屋出租收入、经营税金及附加和竣工房屋面积的影响;第四对典型变量中,U4主要受本年完成投资的影响,V4主要受经营总收入和工房屋价值的影响。第五对典型变量中,U5主要受开发公司个数影响,V4主要受经营总收入、商品房屋销售收入、房屋出租收入和经营税金及附加影响。但注意到,第一对典型变量的方差贡献率已达92.20%,故保留第一对典型

30、变量用作分析,从而达到降维的目的。总的来说,房地产的投入变量主要受自开始建设至本年底累计完成投资影响,产出变量集中在经营总收入和商品房屋销售收入上。累计完成投资额与经营总收入,特别是商品房屋销售收入高度相关。59.典型相关分析的基本思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有最大相关性。如此下去,直至两组变量的相关性被提取完为止。本例想利用我国1999年城镇居民的家庭收入来源和消费性支出的数据了解我国居民消费构成及主要影响因素分析所用的数据来自:中国统计年鉴2000。我国居民消费构成

31、及主要影响因素 60.收入指标:X1可支配收入 X2实际收入 X3国有单位职工收入 X4集体单位职工收入 X5其他经济类型职工收入,X6转移收入 支出指标:Y1消费性支出 Y2食品 Y3衣着 Y4交通和通讯 Y5医疗和保健 Y6娱乐、教育、文化服务 Y7居住 61.序号序号典型相关系数典型相关系数典型变量典型变量10.990174U1=0.9989X1+-0.0595X2+0.0776X3+0.0489X4-0.0931X5+0.0074X6 V1=1.3263Y1-0.0270Y2-0.0005Y3-0.0769Y4-0.0717Y5-0.2031Y6-0.0219Y20.868704U2=

32、-4.8668X1+0.1264X2+1.9585X3+0.3299X4+1.4095X5+2.6453X6V2=-4.4920Y1+2.5421Y2+1.2480Y3-0.4621Y4+1.0443Y5+0.8610Y6+0.0586Y762.由累计贡献率得知,第一组和第二组变量的累计贡献率已达到了97.56%,而且,这两组的系数和方差与其他组相比要大得多.即只需要前两组变量就已经可以解释全部信息的97.56%.在第一对典型变量中,U1主要受可支配收入的影响,V1主要受消费性支出的影响;可见实际收入对消费支出的影响远小于可支配收入的影响。居民消费主要依据其可支配收入而定。第二对典型变量中,U

33、2主要受国有单位职工收入、其他经济类型职工收入和转移收入的影响,V2主要受食品、衣着、医疗和保健的影响。63.在此,可见我国集体单位的职工收入还不能够与国有甚至是其他经济类型的单位这职工收入相比,这也从一个侧面放反映了集体单位规模等方面的现状。再有就是我国居民食品和衣着方面的支出仍占了总支出的大部分,反映了我国居民总体收入水平还不够高;其次,医疗保健支出的比例比较大是可喜的,说明我国居民已经可以把部分精力放在了自己身体的调养上来,全国居民的总体健康状况在上升之中。让我们担忧的是在教育方面的支出所占比例太小,不符合现今世界发展对教育程度的要求。科技是第一生产力,如何提高国民的科技文化知识水平是当

34、今的一大重点。在当代激烈的竞争中,没有知识的支撑是不行的。64.通径分析65.一、通径分析的基本原理 在对社会经济现象依存关系的分析中,离不开回归分析。但是,当各自变量间相关系数很大时,多元回归分析中最小二乘法失去作用,多元回归方程建立无效。通径分析是继回归分析之后发展起来的一种统计方法,它比回归分析更有效地确定自变量与因变量的回归关系。通过通径分析,很容易找出自变量对因变量影响的直接效应和间接效应;找出由于自变量间相关性很强而引起多重共线性的自变量,剔除不必要的自变量,建立“最优”的回归方程。66.设被解释变量Y受两个彼此独立的自变量x1和x2的影响。若自变量x1和x2彼此不独立,存在一定的

35、相关关系:这时,又产生了两条通径 yx1 x2 yx1 x267.设Y与X1,X2,Xk 间存在线性关系,其回归方程为:将(1)-(2)两边同时除以被解释变量的标准差y68.令 称标准化的偏相关系数为通径系数:69.(一)衡量相对重要性的统计量 通径系数和决定系数不同于偏回归系数,是无单位的相对系数。多元回归中偏回归系数只能说明每一自变量的作用大小,而通径系数不仅起到偏回归系数的效果,而且彼此可以相互比较。通径系数与偏回归系数相比,虽然符号一致,但由于通径系数不带单位,可彼此比较,从而确定各自变量对因变量是影响大小顺序(按绝对值大小排序)。说那些变量是主要因素,哪些是次要因素。二、通径分析在经

36、济统计上的应用70.例如:现有某商品的销售量(Y)与居民可支配收入(X1),该商品的价格指数(X2),社会保有量(X3),其它商品的平均价格指数(X4)资料,建立多元回归方程为:运用通径分析求解通径系数 PYX1=0.821281,PYX2=-0.375785,PYX3=0.045195,PYX4=0.506435。71.通径系数与偏回归系数相比,虽然符号一致,但由于通径系数不带单位可彼此比较,从而确定各自变量对因变量是影响大小顺序为:(按绝对值大小)这说明X1是影响销售量的主要因素,X4 次之。而在回归分析中,无法得出这一结论。72.(二)剖析因果关系的方法;经济关系的通径分析Xi对Y 的总

37、间接影响=Xi对Y的总影响=RXiYXi对Y的直接影响=Xi通过Xj对Y 的间接影响=73.(三)相关系数的组成分析 寻找引起多重共线性的自变量在多元回归方程 (直接效应)=(相关系数)-(间接效应)由此可见,某一个自变量X1与Y的相关性取决于两方面的效应:一是通径系数PYXi 表示Xi 对Y的直接影响;二是取决于自变量Xi通过Xi的联合作用,称间接效应。所以,若自变量间相关系数很高,必然导致通径系数符号发生变化,这就是多重共线性现象。74.(四)建立“最优”回归有效方法:逐步通径分析法 应用逐步通径分析方法选择“最优”回归方程,比逐步回归方法简单得多。具体步骤如下:1.计算个自变量标准化平方

38、和(称为0级),根据平方和大小决定哪一个自变量被首先引入方程,并作显著性检验。2.在第一个自变量检验显著情况下,计算一级标准化平方和,决定引入下一个自变量,同时检验其显著性,至到不显著为止。3.将个通径系数还原为偏回归系数,重建回归方程,由此把引起多重共线性或对因变量影响不大的自变量弃留在方程之外。75.总结:1.通径分析是介于相关系数与回归系数之间的统计量,标准化后去了单位,变成可以彼此比较的相对数,从而反应了各自变量对因变量的直接效应;2.经济关系的通径分析可以把一自变量的相关剖分两部分;直接效应和间接效应;剖分回归系数的组成,找出引起多重共线性的自变量;3.逐步通径分析可以选择“最优”回

39、归方程76.三、通径分析的实例 1、朗莱用美国联邦政府雇员人数Y和国民总产出隐含平减指数X1,国民总产出X2,失业人数X3,武装力量人数X4,14岁以上非慈善机构人口数X5,时间变量X6.朗莱所用数据是美国4762年数据,该例是主成分回归用得较早的例子。77.78.yx1x2x3x4x5y10.720.7070.0430.8910.638x10.7210.9920.6210.4650.979x20.7070.99210.6040.4460.991x30.0430.6210.6041-0.1770.687x40.8910.4650.446-0.17710.364x50.6380.9790.991

40、0.6870.3641相关系数矩阵相关系数矩阵79.Unstandardized Coefficients Standardized CoefficientstSig.BStd.ErrorBeta (Constant)-2797.0444219.560直接通径系数直接通径系数-.663.522X120.63015.8671.2021.300.223X2-3.280E-03.004-1.761-.862.409X3-8.197E-02.053-.414-1.558.150X4.154.034.5794.527.001X53.403E-02.0401.278.859.41180.间接通径系数间接通

41、径系数X1通通过过其其它影响它影响Yx2通通过过其其它影响它影响Yx3通通过过其其它影响它影响Yx4通通过过其其它影响它影响Yx5通通过过其其它影响它影响Yx11.192380.746440.558931.17676x2-1.7469-1.0636-0.7854-1.7452x3-0.2571-0.25010.07328-0.2844x40.269240.25823-0.10250.21076x51.251161.26650.877990.4651981.(直接效应)=(相关系数)-(间接效应)Xi对Y的总影响=RXiYX2对Y的总影响=R(X2,Y)-1.761是x1对y的直接通径系数,由于

42、X2和X1,X2和X5的相关性太高,故导致了X2的系数为负,这是不合理的。82.直接影响 通过x1 通过x2 通过x3 通过x4 通过x5 通过x6 通过x7 作用 作用 作用 作用 作用 作用 作用 作用x1-0.18476-0.164540.011340.067741.029530.014560.21125x2-0.16695-0.18209 0.011170.068521.041090.015270.20751x3 0.01642-0.12765-0.11360 0.052680.696810.011140.14374x4 0.07232-0.17307-0.158180.01196 0.960560.014900.19384x5 1.04634-0.18179-0.166110.010930.06639 0.014960.20811x6 0.01621-0.16598-0.157280.011280.066470.96520 0.18573x7 0.21257-0.18361-0.162970.011100.065951.024380.01417 剩余通径系数=0.038423 通径系数分析83.84.

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服