ImageVerifierCode 换一换
格式:PPT , 页数:81 ,大小:805KB ,
资源ID:10509331      下载积分:18 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10509331.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(Logistic-回归模型PPT课件.ppt)为本站上传会员【w****g】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

Logistic-回归模型PPT课件.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,1,Logistic,回归模型,赵耐青,复旦大学公共卫生学院,2,数据分析的背景,计量资料单因素统计分析,对于两组计量资料的比较,一般采用,t,检验或秩和检验。,对于两个变量的相关分析采用,Pearson,相关分析或,Spearman,相关分析,考虑多因素的影响,对于应变量,(,反应变量,),为计量资料,一般可以考虑应用多重线性回归模型进行多因素分析。,3,数据分析的背景,单因素的分类资料统计分析,一般采用,Pearson,2,进行统计检验,用,Odds Ratio,及其,95%,可信区间评价关联程度。,考

2、虑多因素的影响,对于反应变量为分类变量时,用线性回归模型,P=a+bx,就不合适了,应选用,Logistic,回归模型进行统计分析。,4,Logistic,回归模型,按研究设计分类,非配对设计:非条件,Logistic,回归模型,配对的病例对照:条件,Logistic,回归模型,按反应变量分类,二分类,Logistic,回归模型,(,常用,),多分类无序,Logistic,回归模型,多分类有序,Logistic,回归模型,5,基础知识,通过下例引入和复习相关概念,例如:研究患某疾病与饮酒的关联性,患病率,P,1,=a/m,1,P,2,=b/m,2,6,基础知识,Odds,(优势),P,越大,则

3、Odds,越大;,P,越小,则,Odds,越小,并且,0Odds1?OR1?,9,(,二分类,)Logistic,回归模型,因为,0Odds+,所以,-,ln(Odds)1.96,,,P0.05,拒绝,H,0,19,实例,1:,用,Logistic,模型进行统计分析,实例,1,的回归系数估计为,se(b)=0.1780719,z=b/se=2.31,P=0.021,则拒绝,H,0,。,如果对模型中所有的自变量进行检验,则称为模型检验。如实例,2,,对两个自变量进行检验,故这是模型检验。,26,实例,2,应用,Logistic,模型校正混杂作用,应用,Stata,软件进行最大似然估计,得到模型

4、拟合的主要结果如下,似然函数比为,2ln(L),76.32,,,df=2,,,P0.001,,因此拒绝,H,0,:,1,=,2,=0,,可以认为,1,和,2,不全为,0,。,27,实例,2,应用,Logistic,模型校正混杂作用,应用,Stata,软件进行最大似然估计,得到回归系数估计的主要结果如下,饮酒,:,28,多自变量,Logistic,模型的,OR,解释,在本例中,对于同为吸烟或不吸烟的对象而言,(x2,相对固定不变,),,,饮酒,(x1=1),的对数,Odds,为,不饮酒,(x1=0),的对数,Odds,为,29,多自变量,Logistic,模型的,OR,解释,则饮酒的对数,Odd

5、s Ratio,为,即:饮酒的,意义:对于同为吸烟的对象或者同为不吸烟的对象,其饮酒的,故称校正吸烟后,OR,,而前者未考虑吸烟的单因素,OR,称为,crude OR,30,实例,2,应用,Logistic,模型校正混杂作用,饮酒,:,P=1,校正了吸烟因素的情况下,没有足够的证据推断饮酒与,AMI,患病有关联性。,吸烟:,P0.001,,校正了饮酒的情况下,可以认为吸烟与患,AMI,的关联性有统计学意义,并且可以认为吸烟者患,AMI,的风险更大。,31,Logistic,模型中的交互作用,实例,3,:采用病例对照设计研究吸烟和家属史与患肺癌的关联性。,用,x1=1,0,分别表示吸烟和不吸烟;

6、x2=1,0,分别表示有无家属史;用,y=1,0,分别表示患肺癌和未患肺癌。,32,实例,3,:,Logistic,模型的交互作用,一般而言,吸烟和家属史均是肺癌的重要相关因素,很有可能这两个因素对患肺癌有交互作用,因此采用下列含有交互作用项的,Logistic,模型。,其中,x,1,和,x,2,的乘积项,x,1,x,2,称为交互作用项,33,应用,Logistic,模型分析实例,3,用,Stata,软件对实例,3,的资料拟合上述模型,得到下列结果:,3,=0.955825,,,P,0.04,,差别有统计学意义,可以认为吸烟和家属史对患肺癌有交互作用。,34,实例,3,:,Logistic,

7、模型的交互作用,由于本例模型为,对于无家属史,,x2=0,代入模型,得到,由回归系数与,OR,的关系,得到吸烟的:,P =3.84,,故拒绝,H,0,,可以认为,1,+,3,0,,差别有统计学意义,可以认为吸烟者患肺癌的风险更大。,37,实例,3,:,Logistic,模型的交互作用,同理,为了评价家属史与肺癌的关联性,,根据下列,Logistic,模型,对于不吸烟,x1=0,,则上述,Logistic,模型为,家属史的,P=0.,认为,0260.05,,两个药的疗效差异无统计学意义。,模型,病情重,x2=1,代入模型,得到,45,Logistic,模型中的交互作用,即:病情重时的药物变量,x

8、1,的回归系数为,对于在病情重的情况下,两个药的疗效是否有差异需检验,1,+,3,=0,,用,Stata,软件计算得:,检验统计量,2,42.16,df=1,,,P0,,导致,x,1,越大,患病概率相对越大;,若,1,0.05,,即:对于职业为工人与农民而言,其与患病之间的关联性无统计学意义。,53,多分类无序自变量的处理,x13,的回归系数,P,0.0030.05,,说明干部与农民的职业与患糖尿病有关联,其,干部与工人比较,用,Stata,软件检验,12,=,13,,,P=0.0230.05,,差异有统计学意义。,X2,的回归系数,P0.001,说明年龄与患病也有关联,其,OR=1.04,。

9、54,引用亚元变量应注意的问题,在,Logistic,模型中,二分类变量是不区分有序和无序的,因为回归系数的正负号能处理两分类变量所对应的概率大小问题。,在,Logistic,模型中,用亚元处理多分类自变量时,对同一个因素的一组亚元而言,必须同时引入模型或同时不引入模型,不能若干个亚元在模型中,其它亚元不在模型中,这样会导致模型的参数意义发生改变以致错误解释参数意义。,55,多分类有序自变量的处理,例,6,:用横断面调查设计,分析肥胖与患糖尿病的关联性。,职业:用,x1=0,1,2,分别表示体重正常,超重和肥胖。,用,x2,表示年龄。,x1,是有序的分类变量,(,等级变量,),Y=1,表示患

10、糖尿病,,Y=0,表示未患糖尿病。,56,多分类有序自变量的处理,有序分类变量可以直接引入,Logistic,模型,也可以按无序分类变量方式采用亚元变量引入模型,一般视资料而决定。,有序分类变量直接引入模型:,体重正常,x1=0,,,体重超重,x1=1,体重超重与正常的对数,OR,为,57,多分类有序自变量的处理,由,体重正常,x1=0,体重超重,x1=1,体重超重与正常的对数,OR,为,作对数反变换,得到体重超重与正常的,58,多分类有序自变量的处理,由,体重超重,x1=1,,,体重肥胖,x1=2,体重肥胖与超重的对数,OR,为,作对数反变换,得到体重肥胖与超重的,59,多分类有序自变量的处

11、理,由此可见,如果直接将有序多分类变量引入模型,就是假定相邻两个等级的总体,OR,相同,并且不难验证:体重肥胖与体重正常的 。,综合上述,若满足相邻两个等级的总体,OR,相同的条件下可以直接将有序多分类变量引入模型,对于不满足这个条件,则应采用亚元变量引入模型。,60,多分类有序自变量的处理,对于多分类有序自变量,可以用似然比检验的方法检验相邻两个等级的总体,OR,是否相同。,在模型,1,中引入亚元变量,其定义如下:,体重正常,体重超重,体重肥胖,x1,0,1,2,X11,0,1,0,x12,0,0,1,61,多分类有序自变量的处理,模型,1,用最大似然法得到的似然函数值为,L,1,模型,2,

12、用最大似然法得到的似然函数值为,L,2,显然两个模型等价意味,1,=,11,且,2,1,=,12,似然比检验统计量为,2ln(L)=2(ln(L,1,)-ln(L,2,),62,多分类有序自变量的处理,H,0,:模型,1,等价于模型,2,H,1,:模型,1,不等价,模型,2,=0.05,H,0,为真时,,2ln(L),近似服从自由度为,1(,自变量的分类数,2),的,2,分布,即:检验统计量 ,则拒绝,H,0,,选用引入亚元的模型,1,。,63,逐步回归分析,在多因素统计分析中,多个自变量之间存在相关性,往往相互影响,研究者希望寻找主要影响应变量,Y,的因素。,理论上,只要把各种因素组合都

13、试一遍,寻找变量个数最多,每个变量均有统计学意义,并且模型拟合程度最好的模型,这种模型称为最佳预测模型,这种方法称为寻找最优子集,当变量较多时很难实现。,64,逐步回归,为了比较方便地找到最佳预测回归模型,一般采用逐步回归的分析策略建立拟最佳预测回归模型。,逐步回归采用逐个增加最佳变量的方式或逐个减少最差的变量方式找到最佳或拟最佳回归模型。,65,逐步回归,逐步回归有,4,种方式:,前进法,:,最开始时,模型中无任何自变量,然后逐个引入变量进入模型,每次在未进入模型的所有变量中挑选一个变量,其,P,是最小且,P,值,,每引入一个变量,重新拟合一次模型,逐步引入变量直至没有满足上述条件的变量可以

14、引入模型为止。,66,逐步回归,后退法:最开始时,把所有的变量引入模型,然后逐次把,P,值最大并且,P,的变量剔除出模型,每次只剔除一个变量,每次剔除一个变量后重新拟合模型,按照上述剔除标准继续剔除变量,直至模型中的所有变量的,P,为止。,67,逐步回归,前进逐步回归法,最开始时,模型中无任何自变量,然后逐个引入变量进入模型,每次在未进入模型的所有变量中挑选一个变量,其,P,是最小且,P,值,的变量,若有将其剔出模型,然后重新拟合一次模型,逐步引入变量直至没有满足上述条件的变量可以引入模型为止。,68,逐步回归,后退逐步回归法,最开始时,把所有的变量引入模型,然后逐次把,P,值最大并且,P,的

15、变量剔除出模型,每次只剔除一个变量,每次剔除一个变量后考察未在模型中的变量中是否存在,P,的变量,若有重新引入模型,然后,重新拟合模型,按照上述剔除标准继续剔除变量,直至模型中的所有变量的,P0.05,,故剔除,X1,72,实例,6,:逐步回归,X6,的,P,值最大并且,P0.05,,故剔除,X6,73,实例,6,:逐步回归,X3,的,P,值最大并且,P0.05,,故剔除,X3,74,实例,6,:逐步回归,X7,的,P,值最大并且,0.05,,故剔除,X7,75,实例,6,:逐步回归,所有变量的,P,值均,=0.0510 removing x1,p=0.7183=0.0510 removing

16、 x6,p=0.3873=0.0510 removing x3,p=0.4013=0.0510 removing x7,77,实例,6,:逐步回归,得到下列回归系数的估计,由上述结果可知与糖尿病患病的主要影响因素是年龄,x2,,家属史,x4,和总胆固醇,x5,。,78,逐步回归小结,逐步回归是寻找主要影响因素的一种回归策略,又称建立最佳预测模型。,进入回归模型的变量可以推断这些变量与应变量,Y,有关联,但是没有进入回归模型的变量不能称这些变量与应变量,Y,没有关联性。,一般设定变量进入模型的,0.05,,剔除变量的,0.05,。,79,Logistic,回归模型小结,对于应变量为二分类,可以用

17、Logistic,回归模型进行统计分析。,在,Logistic,模型中,自变量可以是二分类的,也可以是连续型变量和有序多分类变量,但无序多分类变量应用一组亚元变量取代。,逐步回归是寻找主要影响因素的回归策略,没有进入模型的变量不能作推断。,80,Logistic,回归模型小结,模型中出现有交互作用,不是统计分析的最终结果,只是中间结果,一般要根据研究目的进行简单效应分析。,条件,Logistic,模型只适用于配对病例对照研究,其回归系数解释与非条件的,Logistic,模型相同。,81,Logistic,回归模型小结,病例对照研究的资料可以用,Logistic,回归模型分析暴露因素与应变量之间的关联性,但不可以直接应用,Logistic,模型进行预测或估计患病率。,Logistic,回归模型在拟合的过程中经常会提到拟合优度,(goodness of fiting),的问题,拟合优度没有统计学意义,只说明当前在模型中的变量情况下,该模型与最优模型无统计学差异,但不能说明模型中再增加变量的情况。,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服