ImageVerifierCode 换一换
格式:PPT , 页数:60 ,大小:390KB ,
资源ID:14020191      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/14020191.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(多重线性回归.ppt)为本站上传会员【xrp****65】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

多重线性回归.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第十三章,多因素线性回归,1,主要内容,1,多重线性回归模型简介,2,回归系数的估计,3,多重回归的假设检验,4,评价回归方程的标准,5,自变量的筛选,6,多重线性回归的应用及其注意事项,2,某地,13,岁男童身高、体重、肺活量的实测数据,编号,身高,(cm),x,1,体重,(kg),x,2,肺活量,(L),y,1,135.1,32.0,1.75,3,163.6,46.2,2.75,5,156.2,37.1,2.75,7,167.8,41.5,2.75,9,145.0,33.0,2.50,11,165.5,

2、49.5,3.00,13,153.3,41.0,2.75,15,160.5,47.2,2.25,17,147.6,40.5,2.00,19,155.1,44.7,2.75,21,143.0,31.5,1.75,23,160.8,40.4,2.75,25,158.2,37.5,2.00,27,144.5,34.7,2.25,29,156.5,32.0,1.75,3,问题,身高、体重与肺活量有无线性关系?,用身高和体重预测肺活量有多高的精度?,单独用身高、或体重是否也能达到同样效果?,身高的贡献大,还是体重的贡献大?,4,一、多重线性回归模型,多重线性回归数学模型:,Y,为因变量的实际观测值,X,

3、1,、,X,2,、,X,m,为,m,个自变量,为常数项,为总体偏回归系数,为残差,,Y,的变化中不能用现有自变量解释的部分,5,多重线性回归方程,b,0,为截距,(intercept),,,又称常数,(constant),表示各自变量均为,0,时,y,的估计值,b,j,称为样本偏回归系数,(partial regression coefficient),,,表示在其他自变量固定不变的情况下,自变量,x,j,每改变一个单位时单独引起因变量,y,的平均改变量。,称为,y,的估计值或预测值,(predicted value),6,举例,根据,某地,29,名,13,岁男童的身高,x,1,(,cm,),

4、体重,x,2,(,kg,),和肺活量,y,(,L,),建立的回归方程为:,当,x,1,=150,,,x,2,=32,时,,表示对所有身高为,150,cm,,,体重,为,32,kg,的,13,岁男童,估计平均肺活量为,1.9168(L),。,7,二、回归系数的估计,最小二乘法,(least square,LS),基本思想,残差平方和,(sum of squares for residuals),最小,8,用,偏导数方法可得出下列正规方程组,9,求解正规方程组得偏回归系数,10,标准化偏回归系数,(,standardized partial regression coefficient),无量

5、纲,越大说明相应的自变量,x,j,对,y,的贡献越大,11,例,20-1,总胆固醇和甘油三酯对空腹血糖的影响,12,三、多重回归的假设检验,回归方程(模型)的检验,偏回归系数的检验,13,模型检验,方差分析法,确定系数法,14,方差分析法,变异分解,1.,总变异:,2.,引进回归以后的变异,(,剩余,):,3.,回归的贡献,回归平方和:,15,回归方程检验的方差分析表,变异,来源,离均差平方和,SS,自由度,df,离均差平方均方,MS,F,回归,SS,回归,K,SS,回归,/K,MS,回归,剩余,SS,剩余,N-K-1,SS,剩余,/(N-K-1),/MS,剩余,总,SS,总,N-1,16,检

6、验步骤,1.,建立假设,确定检验水准,2.,计算,F,值,3.,确定,P,值,得出结论,17,确定系数法,(coefficient of determination),确定系数,18,R,2,可用于检验多元回归方程,H,0,:,2,=0,;,H,1,:,2,0,。,检验统计量为:,19,偏回归系数的假设检验,t,检验,H,0,:,j,=0,;,H,1,:,j,0,。,20,偏回归平方和法,偏回归平方和:是指将某自变量,x,j,从回归方程中删除后所引起的回归平方和减少的量。,21,例,20-1,总胆固醇和甘油三酯对空腹血糖的影响,模型检验结果,22,偏回归系数的,t,检验结果,23,偏回归平方和

7、法的检验结果,方程内,变量,方程外,变量,SS,回归,偏回归平方和(,x,j,),F(,x,j,),x,1,x,2,4.281,x,2,x,1,1.543,2.738,9.849,x,1,x,2,2.989,1.292,4.647,F,0.05,(1,37),=4.11,24,评价回归方程的标准,复相关系数,校正复相关系数,剩余标准差,25,复相关系数,(multiple correlation coefficient),0,R,1,R,反映的是因变量与所有自变量的总的相关关系,当方程中自变量个数增加时,R,总是增加的。当只有一个因变量,y,与一个自变量,x,时,,R,就等于,y,与,x,的简

8、单相关系数之绝对值:,R,=|,r,yx,|,。,根据,R,的大小判断方程的优劣时,结论总是自变量最多的方程最好,用,R,衡量方程的优劣是有缺陷的。,26,校正复相关系数,R,ad,当有统计学意义的变量进入方程中,可使,R,ad,增加,而当无统计学意义的变量增加到方程中时,,R,ad,反而减少。,R,ad,是衡量方程优劣的重要指标,27,剩余标准差,剩余标准差 小则估计值与实测值接近,反之则估计值与实测值相差较大,它是反映回归方程精度的指标,28,自变量的筛选,全面分析法,前进法,后退法,逐步回归法,29,全面分析法(最优子集法),从所有可能的变量组合的回归方程中挑选最优者,即把所有包含,1,

9、个、,2,个、,直至全部,k,个自变量的回归方程都计算出来(),挑选剩余标准差最小的。,30,前进法的基本思想,选定一个标准。,开始方程中没有自变量,(,常数项除外,),按自变量对,y,的贡献大小由大到小依次挑选进入方程。,每选入一个变量进入方程,则重新计算方程外各自变量对,y,的贡献。,直到方程外变量均达不到入选标准,没有自变量可被引入方程为止。,31,图示:前进法,计算,l,ij,、,方程外的变量分别进,入方程,计算,SS,回,增,加量增加最大者为,X,K,X,K,进入方程,显著,对,X,K,进行检验,不显著,结束,32,前进法,Y,,,X1,X2 X3 X4 X5,第一步 建立,5,个方

10、程,Y,与,x1 P1=0.015,Y,与,x2 P2=0.003,Y,与,x3 P3=0.026,Y,与,x4 P4=0.223,Y,与,x5 P5=0.665,选入,X2,方程中有一个变量,33,前进法,第二步 建立,4,个方程,Y,与,X2,,,x1 P1=0.023,Y,与,x2,,,x3 P2=0.005,Y,与,x2,,,x4 P3=0.223,Y,与,x2,,,x5 P4=0.635,选入,X3,方程中有二个变量,x2,,,x3,34,前进法,第三步 建立,3,个方程,Y,与,X2,,,X3,,,x1 P1=0.023,Y,与,X2,,,X3,,,x4 P2=0.000,Y,与,

11、X2,,,X3,,,x5 P3=0.535,选入,X4,方程中有三个变量,X2,,,X3,,,x4,35,前进法,考虑在剩余的,X1,、,X5,选入。,若,P,有小于,0.05,,继续考虑选入。,依次循环,直到方程外也选不入,计算停止,此时的方程为前进法的最优方程。,36,后退法的基本思想,选定一个标准,开始所有变量均在方程中,按自变量对,y,的贡献大小由小到大依次剔除变量。,每剔除一个变量,则重新计算方程内各自变量对,y,的贡献。,直到方程内变量均达到入选标准,没有自变量可被剔除为止。,37,图示:后退法,变量全部进,入方程,方程内的变量分别剔,除,计算,SS,回,减少量,,减少量最小者为,

12、X,k,剔除,X,k,显著,对,X,K,进行检验,不显著,不剔除,X,k,结束,38,后退法,Y,,,X1,X2 X3 X4 X5,第一步 建立,1,个方程,Y,与,X1,,,X2,,,X3,,,X4,,,X5,39,后退法,第二步 建立,5,个方程,(考虑剔除),Y,与,X1,,,X2,,,X3,,,X4,无,X5,所损失,P1=0.723,Y,与,X1,,,X2,,,X3,,,X5,无,X4,所损失,P2=0.005,Y,与,X1,,,X2,,,X4,,,X5,无,X3,所损失,P3=0.123,Y,与,X1,,,X3,,,X4,,,X5,无,X2,所损失,P4=0.035,Y,与,X2,

13、X3,,,X4,,,X5,无,X1,所损失,P4=0.535,40,后退法,第三步 建立,4,个方程,(考虑剔除),Y,与,X1,,,X2,,,X3,无,X4,所损失,P1=0.003,Y,与,X1,,,X2,,,X4,无,X3,所损失,P2=0.005,Y,与,X1,,,X3,,,X4,无,X2,所损失,P4=0.035,Y,与,X2,,,X3,,,X4,无,X1,所损失,P4=0.535,41,后退法,第四步 建立,3,个方程,(考虑剔除),Y,与,X2,,,X3,无,X4,所损失,P1=0.003,Y,与,X2,,,X4,无,X3,所损失,P2=0.002,Y,与,X3,,,X4,无

14、X2,所损失,P3=0.005,42,后退法,若,P,都小于,0.05,,不能剔除,直到方程内剔不出,计算停止,此时的方程为后退法的最优方程。,43,逐步回归,将自变量逐个地引入方程,引入的条件是该自变量的偏回归平方和在未选入的自变量中是最大的,并,F,检验具有显著意义。另一方面,每引入一个新变量,要对先前选入方程的自变量逐个进行,F,检验,将偏回归平方和最小且无显著性的自变量剔出方程,直到方程外的自变量不能再引入,方程内的自变量不能再剔除。,44,图示:逐步回归过程,计算,l,ij,、,方程外的变量分别进,入方程,计算,SS,回,增,加量增加最大者为,X,K,X,K,进入方程,步数,2,方

15、程内的变量分别剔,除,计算,SS,回,减少量,,减少量最小者为,X,S,对,X,S,检验,剔除,X,S,显著,不显著,显著,对,X,K,进行检验,不显著,结束,是,否,45,前进法逐步回归,Y,,,X1,X2 X3 X4 X5,第一步 建立,5,个方程,Y,与,x1 P1=0.015,Y,与,x2 P2=0.003,Y,与,x3 P3=0.026,Y,与,x4 P4=0.223,Y,与,x5 P5=0.665,选入,X2,方程中有一个变量,46,前进法逐步回归,第二步 建立,4,个方程,Y,与,X2,,,x1 P1=0.023,Y,与,x2,,,x3 P2=0.005,Y,与,x2,,,x4

16、P3=0.223,Y,与,x2,,,x5 P4=0.635,选入,X3,方程中有二个变量,x2,,,x3,47,前进法逐步回归,第三步 建立,3,个方程,Y,与,X2,,,X3,,,x1 P1=0.023,Y,与,X2,,,X3,,,x4 p2=0.000,Y,与,X2,,,X3,,,x5 p3=0.535,选入,X4,方程中有三个变量,X2,,,X3,,,x4,48,前进法逐步回归,第四步 建立,3,个方程,(考虑剔除),Y,与,X2,,,X3,无,X4,所损失,P1=0.003,Y,与,X2,,,X4,无,X3,所损失,P2=0.002,Y,与,X3,,,X4,无,X2,所损失,P3=0.

17、250,49,前进法逐步回归,此时,P3,大于,0.05,则剔除变量,X2,,,然后考虑在剩余的,X1,、,X5,选入。,若,P,都小于,0.05,继续考虑选入。,依次循环,直到方程内剔不出,方程外也选不入,计算停止,此时的方程为前进法的最优方程。,50,后退法逐步回归,开始时全部因素都引入模型,然后分别剔除各因素,比较值最大者,经检验,如没有显著性,首先剔除。再分别考虑剔除还在模型内的各因素,如果值最大者经检验,没有显著性,再剔除。直到模型内的因素均不能剔除为止。再考虑模型外的各因素,分别引入模型,经检验,具有显著性者再引入。直到模型内的因素都具有显著性,都不能剔除,而模型外的因素都不具有显

18、著性,不能引入,则得到最后的模型。,51,后退法逐步回归,Y,,,X1,X2 X3 X4 X5,第一步 建立,1,个方程,Y,与,X1,,,X2,,,X3,,,X4,,,X5,52,后退法逐步回归,第二步 建立,5,个方程,(考虑剔除),Y,与,X1,,,X2,,,X3,,,X4,无,X5,所损失,P1=0.723,Y,与,X1,,,X2,,,X3,,,X5,无,X4,所损失,P2=0.005,Y,与,X1,,,X2,,,X4,,,X5,无,X3,所损失,P3=0.123,Y,与,X1,,,X3,,,X4,,,X5,无,X2,所损失,P4=0.035,Y,与,X2,,,X3,,,X4,,,X5

19、无,X1,所损失,P4=0.535,53,后退法逐步回归,第三步 建立,4,个方程,(考虑剔除),Y,与,X1,,,X2,,,X3,无,X4,所损失,P1=0.003,Y,与,X1,,,X2,,,X4,无,X3,所损失,P2=0.005,Y,与,X1,,,X3,,,X4,无,X2,所损失,P4=0.035,Y,与,X2,,,X3,,,X4,无,X1,所损失,P4=0.535,54,后退法逐步回归,第四步 建立,3,个方程,(考虑剔除),Y,与,X2,,,X3,无,X4,所损失,P1=0.003,Y,与,X2,,,X4,无,X3,所损失,P2=0.002,Y,与,X3,,,X4,无,X2,所损

20、失,P3=0.005,55,后退法逐步回归,若,P,都小于,0.05,不能剔除,则考虑考虑选入变量。若有,P,大于,0.05,则继续剔除,然后选入。,依次循环,直到方程内剔不出,方程外也选不入,计算停止,此时的方程为后退法的最优方程。,56,方法的比较,欲求到最优,方程,应用最优子集法。但计算工作量太大。,前进法能得到哪个因素的单个作用大,有时漏掉单个作用小,而交互作用大的变量。,后退法能得不到哪个因素的单个作用大,不会漏掉单个作用小,而交互作用大的变量。当变量间关联性强时,有时可能得不到方程。,57,分类变量数值化,1.,两分类,2.,多分类,58,多重线性回归的应用,1.,研究多个因素对某变量(指标)的影响,要求这些因素与该变量的关系是线性的。,2.,用多重线性回归来实现控制一些混杂因素,如校正基线、年龄和性别等。但本法只是一种简单的线性校正混杂因素方法。,59,多重线性回归的注意事项,1.,用逐步回归分析或最优子集分析,其最终模型中的自变量可以认为与应变量相关。,但未引入模型的变量不能轻易地认为与应变量无关,,因为很可能它们与应变量的相关性较弱或与其它自变量相关,以致未能作为主要的影响因素模型。,2.,对于实验性研究的统计分析,一般不应作逐步回归。,3.,如果用多重线性回归寻找最佳预测模型,则应作残差分析,即考察各个自变量与残差之间是否存在明显的趋势变化。,60,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服