ImageVerifierCode 换一换
格式:PPT , 页数:35 ,大小:870KB ,
资源ID:10289872      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10289872.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请。


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(商务数据分析与统计建模:chap2.2 多元回归分析R实现.ppt)为本站上传会员【可****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

商务数据分析与统计建模:chap2.2 多元回归分析R实现.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2.1,多元线性模型,2.2,变量选择,2.3,回归诊断,2.4,回归预测,第,2,章多元线性模型,1,2.1,多元线性模型,1.,模型定义,其中,x,1,x,k,是非随机的自变量,y,是随机的因变量,0,是常数项,1,k,是回归系数,是随机误差项,.,2,1.,模型定义,模型,(2.1),的样本形式,其中,i=,1,n,表示有,n,组观测值,.,3,1.,模型定义,模型,(2.2),的矩阵形式,其中,4,例,2.1(,数据文件为,eg2.1),5,主编:费宇,表,2.1,抽样调查得到的,36,个人的数据资

2、料,2025/5/16 周五,y,x,1,x,2,x,3,x,4,x,5,y,x,1,x,2,x,3,x,4,x,5,79220,14010,98,115,15,女,71120,11460,83,75,8,女,79670,13260,98,26,8,男,91520,22260,81,3,16,男,186320,81240,96,199,19,男,76220,12510,81,0,12,女,161945,46260,96,120,19,男,74420,12510,81,13,12,女,68420,11460,85,72,12,女,121320,23010,65,19,16,男,75320,140

3、10,85,59,15,女,77570,17010,64,69,12,男,模型(,2.3,)的参数 的最小二乘估计,的,最小二乘估计,2.,模型的参数估计和检验,6,回归方程的显著性检验,其中 是回归平方和,而,是残差平方和,拒绝域为,2.,模型的参数估计和检验,7,2.,模型的参数估计和检验,8,例,2.1,续,(,数据文件为,eg2.1),9,主编:费宇,建立,y,关于,x,1,、,x,2,、,x,3,和,x,4,的线性回归方程,并对方程和回归系数进行显著性检验,.,2025/5/16 周五,y,x,1,x,2,x,3,x,4,x,5,y,x,1,x,2,x,3,x,4,x,5,79220

4、14010,98,115,15,女,71120,11460,83,75,8,女,79670,13260,98,26,8,男,91520,22260,81,3,16,男,186320,81240,96,199,19,男,76220,12510,81,0,12,女,161945,46260,96,120,19,男,74420,12510,81,13,12,女,68420,11460,85,72,12,女,121320,23010,65,19,16,男,75320,14010,85,59,15,女,77570,17010,64,69,12,男,#eg2.1,回归分析,#,打开数据文件,eg2.1.

5、xls,选取,A1:F37,区域,然后复制,data2.1-read.table(clipboard,header=T)#,将,eg2.1.xls,数据读入到,data2.1,中,lm.salary|t|),(Intercept)48386.0620 11237.2882 4.306 0.000155*,x1 1.6831 0.1302 12.929 5.01e-14*,x2 -34.5520 130.2602 -0.265 0.792570,x3 -13.0004 13.7882 -0.943 0.353043,x4 808.3223 547.8017 1.476 0.150144,例,2.

6、1,续,(,数据文件为,eg2.1),2025/5/16 周五,11,回归分析结果为,-,Signif.codes:0,*,0.001,*,0.01,*,0.05,.,0.1,1,Residual,standard error:7858 on 31 degrees of freedom,Multiple R-squared:0.919,Adjusted R-squared:0.9086,F-statistic:87.95 on 4 and 31 DF,p-value:2.2e-16,例,2.1,续,(,数据文件为,eg2.1),2025/5/16 周五,12,回归方程的,F,值为,87.95,

7、相应的,p,值为,2.2,10,-16,说明回归方程是显著的,;,但,t,检验对应的,p,值则显示,:,常数项和,x,1,是显著的,而,x,2,、,x,3,和,x,4,不显著,.,最优模型一般满足,2,个条件,(,1,)模型反映了变量间的真实关系,(,2,)模型包含的变量尽量,少,例,2.1,(续),建立,y,关于,x,1,、,x,2,、,x,3,和,x,4,的线性回归方程,并对方程和回归系数进行,显著性检验,(逐步回归建立“最优方程”),.,2.2,变量选择,2025/5/16 周五,13,#,假设,eg2.1.xls,中的数据已经读入到,data2.1,中,lm.salary-lm(yx1

8、x2+x3+x4,data=data2.1)#,建立全变量回归方程,lm.step-step(lm.salary,direction=both)#,用“一切子集回归法”来进行逐步回归,direction,是确定逐步搜索的方向,:both,是,“,一切子集回归法,”,forward,是,“,向前法,”,backward,是,“,向后法,”,默认值是,both.,所以这个回归过程可以简写为,lm.step|t|),(Intercept)42097.165 5265.218 7.995,3.18e-09*,x1,1.631,0.117 13.934 2.22e-15*,x4,1039.260 46

9、7.671,2.222,0.0332*,-,Signif.codes:0*0.001*0.01*0.05.0.1 1,Residual standard error:7747 on 33 degrees of freedom,Multiple R-squared:0.9162,Adjusted R-squared:0.9111,F-statistic:180.4 on 2 and 33 DF,p-value:2.2e-16,回归模型汇总信息,:,summary(lm.step),2025/5/16 周五,17,1.,残差分析和异常点探测,残差向量,e,是模型中随机误差项,的估计,残差分析可以诊

10、断模型的基本假定是否成立。,2.3,模型诊断,2025/5/16 周五,18,例,2.2,计算,例,2.1,得到的逐步回归模型,lm.step,的普通残差和标准化残差,判断可能存在的异常点,画出相应的残差散点图,并直观判断模型的基本假定是否成立,.,2.3,模型诊断,2025/5/16 周五,19,#,假设由例,2.1,已经得到逐步回归模型,lm.step,y.res-residuals(lm.salary)#,计算回归模型,lm.salary,的普通残差,y.rst-rstandard(lm.step)#,计算回归模型,lm.step,的标准化残差,print(y.rst)#,输出回归模型,

11、lm.step,的标准化残差,y.rst,y.fit-predict(lm.step)#,计算回归模型,lm.step,的预测值,plot(y.res y.fit)#,绘制以普通残差为纵坐标,预测值为横坐标的残差散点图,plot(y.rst y.fit)#,绘制以标准化残差为纵坐标,预测值为横坐标的残差散点图,2.3,模型诊断,2025/5/16 周五,20,采用,residuals(),rstandard(),和,rstudent(),来分别计算普通残差,标准化残差和学生化残差,.,1 2 3 4 5 6,-0.17481171 1.03650457 -1.64144064,3.435090

12、88,-0.69388898 0.21730074,7 8 9 10 11 12,-0.28221956-0.57391074 -1.13860082 0.14942833 -0.08074416 -0.70313518,13 14 15 16 17 18,-0.08074416-1.90879266 0.86519102 -0.04532806 -0.63719129 -0.69529295,19 20 21 22 23 24,0.27405524-0.46453524 0.16499595 -0.07189545 0.22203402 0.41883966,25 26 27 28 29 3

13、0,0.25844627-0.12669958 -0.01045782 -0.29460957 -0.15151718-0.89674431,31 32 33 34 35 36,0.47424184 0.64162319 -0.84880014 0.18495911,3.32423970,-0.62075537,2.3,模型诊断,2025/5/16 周五,21,回归模型,lm.step,的标准化残差,y.rst,如下,第,4,号和,35,号是异常点,2025/5/16 周五,22,图,2.1,例,2.2,中的普通残差图,(,左,),和标准化残差图,(,右,),例,2.3,通过,方差稳定变换来更

14、新例,2.1,得到的逐步回归模型,lm.step,并计算更新后模型的标准化残差,画出相应的残差散点图,并直观判断模型的基本假定是否成立,.,2.3,模型诊断,2025/5/16 周五,23,#,假设由例,2.1,已经得到逐步回归模型,lm.step,lm.step_new-update(lm.step,log(.).)#,对模型进行对数变换,y.rst-rstandard(lm.step_new)#,计算新回归模型,lm.step_new,的标准化残差,y.fit-predict(lm.step_new)#,计算回归模型,lm.step_new,的预测值,plot(y.rst y.fit)#,

15、绘制以标准化残差为纵坐标,预测值为横坐标的残差散点图,(,见图,2-2),采用对数变换来解决方差非齐问题,2025/5/16 周五,24,对数变换后:只有第,35,号是异常点,2025/5/16 周五,25,图,2.2,例,2.3,中的标准化残差图,lm.salary-lm(log(y)x1+x2+x3+x4,data=data2.1-c(4,35),)#,去掉第,4,号和,35,号观测值再建立全变量回归方程,lm.step-step(lm.salary,direction=both)#,用“一切子集回归法”来进行逐步回归,y.rst-rstandard(lm.step)#,计算回归模型,lm

16、step,的标准化残差,y.fit-predict(lm.step)#,计算回归模型,lm.step,的预测值,plot(y.rst y.fit)#,绘制以标准化残差为纵坐标,预测值为横坐标的残差散点图,去掉,4,和,35,号观测值,再回归,2025/5/16 周五,26,残差全部落在,-2,,,2,区域内,2025/5/16 周五,27,图,2.3,例,2.3,中的标准化残差图,:,去掉,4,和,35,号观测值,2.,回归诊断:一般的方法,残差分析无法分析模型的影响点,即探测哪些点对模型的推断有重要影响,本节给出,的,回归诊断方法,可以诊断模型的基本假定是否成立,哪些值是异常点,哪些点是强

17、影响点,.,在,R,中,函数,plot(),和,influence.measures(),可以用来绘制诊断图和计算诊断统计量,2.3,模型诊断,2025/5/16 周五,28,例,2.4,对例,2.3,得到的逐步回归模型,lm.step_new,进行回归诊断分析,.,2.3,模型诊断,2025/5/16 周五,29,#,假定由例,2.3,已经获得模型,lm.step_new,par(mfrow=c(2,2)#,在一个,22,网格中创建,4,个绘图区,plot(lm.step_new)#,绘制模型诊断图,influence.measures(lm.step_new)#,计算各个观测值的诊断统计量

18、运行上述程,进行,序可得回归诊断图,(,图,2.4),和如下,36,个观测值对应的诊断统计量的值,.,2025/5/16 周五,30,Influence measures of,lm(formula=log(y)x1+x4,data=data2.1):,dfb.1_,dfb.x1,dfb.x4,dffit,cov.r,cook.d,hat inf,1 0.027388 0.05593 -0.057229 -0.08411 1.161 2.42e-03 0.0646,2 0.333715 0.07828 -0.277049 0.35202 1.088 4.11e-02 0.0953,3 0.3

19、48810 -3.49426 0.912364 -3.86083 1.255 3.93e+00 0.6054*,4 -0.580142 0.53947 0.390696 1.14942 0.649 3.63e-01 0.1404*,5 -0.070573 0.03314 0.018032 -0.15068 1.064 7.64e-03 0.0324,.,34-0.085786 0.13422 0.042539 0.22772 1.218 1.76e-02 0.1287,35-0.437405 -0.28259 0.631117 0.93919 0.341 2.02e-01 0.0520*,36

20、0.053140 0.01007 0.020734 -0.10486 1.096 3.74e-03 0.0312,第,3,4,和,35,号观测值可能是异常点和强影响点,.,2025/5/16 周五,31,图,2.4,例,2.4,的回归诊断图,Influence measures of,lm(formula=log(y)x1+x4,data=data2.1):,dfb.1_ dfb.x1 dfb.x4 dffit cov.r cook.d hat inf,1 0.027388 0.05593 -0.057229 -0.08411 1.161 2.42e-03 0.0646,2 0.333715

21、 0.07828 -0.277049 0.35202 1.088 4.11e-02 0.0953,3 0.348810 -3.49426 0.912364 -3.86083 1.255 3.93e+00 0.6054*,4 -0.580142 0.53947 0.390696 1.14942 0.649 3.63e-01 0.1404*,5 -0.070573 0.03314 0.018032 -0.15068 1.064 7.64e-03 0.0324,.,34-0.085786 0.13422 0.042539 0.22772 1.218 1.76e-02 0.1287,35-0.4374

22、05 -0.28259 0.631117 0.93919 0.341 2.02e-01 0.0520*,36-0.053140 0.01007 0.020734 -0.10486 1.096 3.74e-03 0.0312,2.3,模型诊断,2025/5/16 周五,32,36,个观测值对应的诊断统计量的值,输出结果:,回归预测分为点预测和区间预测两种,可以采用函数,predict(),来实现,.,例,2.5,给定解释变量,x,1,=20000,x,4,=20,利用例,2.1,得到的回归模型对,y,进行点预测和区间预测,(,置信度为,95%).,2.4,回归预测,2025/5/16 周五,33

23、假定由例,2.1,已经获得模型,lm.step,predspredict(lm.step,newdata=preds,interval=prediction,level=0.95)#,区间预测,fit lwr upr,1 95493.09 78187.28 112798.9,2.4,回归预测,2025/5/16 周五,35,运行上述程序可得,y,的点预测和区间预测的结果如下,:,程序中选项,interval=prediction,表示要给出预测区间,选项,level=0.95,表示置信水平是,95%.,计算结果,y,的点预测为,95493.09,预测区间为,78187.28,112798.9.,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服