ImageVerifierCode 换一换
格式:PPT , 页数:48 ,大小:329KB ,
资源ID:12573737      下载积分:5 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/12573737.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(logistic回归分析培训讲义.ppt)为本站上传会员【二***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

logistic回归分析培训讲义.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,问题提出:,医学研究中常研究某因素存在条件下某结果是否发生?以及之间的关系如何?,因素(,X),疾病结果(,Y),x1,x2,x3X,K,发生,Y=1,不发生,Y=0,例:暴露因素 冠心病结果,高血压史(,x1):,有 或无 有 或 无,高血脂史(,x2):,有 或 无,吸烟(,x3):,有或无,研究问题可否用多元线性回归方法?,1.多元线性回归方法要求,Y,的取值为计量的连续性随机变量。,2.多元线性回归方程要求,Y,与,X,间关系为线性关系。,3.多元线性回归结果 不能回答“发生与否”,logistic

2、回归方法补充多元线性回归的不足,Logistic回归方法,该法研究是,当,y,取某值(如,y=1),发生的概率(,p),与某暴露因素(,x),的关系。,P(,概率)的取值波动01范围。,基本原理,:用一组观察数据拟合,Logistic,模型,揭示若干个,x,与一个因变量取值的关系,反映,y,对,x,的依存关系。,第一节,logistic,回归,一、基本概念,1.变量的取值,logistic,回归要求应变量(,Y),取值为分类变量(两分类或多个分类),自变量(,X,i,),称为危险因素或暴露因素,,,可为连续变量、等级变量、分类变量。,可有,m,个自变量,X,1,,X,2,,X,m,2.,两值

3、因变量的,logistic,回归模型方程,一个自变量与,Y,关系的回归模型,如:,y:,发生=1,未发生=0,x:,有=1,无=0,,记为,p(y=1/x),表示某暴露因素状态下,结果,y=1,的概率(,P),模型。,或,模型描述了应变量,p,与,x,的关系,P,概率,1,0.5,Z,值,0,1,2,3,-1,-2,-3,图16-1,Logistic,回归函数的几何图形,为正值,,x,越大,结果,y=1,发生的可能性(,p),越大。,几个,logistic,回归模型方程,logistic,回归模型方程的线性表达,对,logistic,回归模型的概率(,p),做,logit,变换,,截距(常数)

4、回归系数,Y,(-,至+),线形关系,方程如下:,在有多个危险因素(,X,i,),时,多个变量,的,logistic,回归模型方程的线性表达:,或,公式16-2,2.模型中参数的意义,0,(,常数项),:暴露因素,X,i,=,0时,个体发病概率与不发病概率之比的自然对数比值。,的含义:,某危险因素,暴露水平变化时,即,X,i,=1,与,X,i,=0,相比,发生某结果(如发病)优势比的对数值。,P,1,(,y=1/x=1),的概率,P,0,(,y=1/x=0),的概率,危险因素,Y x=1 x=0,发病=1 30(,a)10(b),不发病=0 70(,c)90(d),a+c b+d,危险因素,

5、Y x=1 x=0,发病=1,p,1,p,0,不发病=0 1-,p,1,1-p,0,有暴露因素人群中发病的比例,反映了在其他变量固定后,,X=1,与,x=0,相比发生,Y,事件的对数优势比。,回归系数,与,OR X,与,Y,的关联,=0,OR=1,,无关,1,OR1,,有关,危险因素,1,OR1,,有关,保护因子,事件发生率很小,,ORRR。,多元回归模型的的 概念,二、logistic回归模型的参数估计,1.,模型中的参数(,i,),估计,通常用最大似然函数(,maximum likelihood estimate,MLE),估计,,,由统计软件包完成。(讲义259页),,,,,2.优势比(

6、OR),及可信区间的估计,如,X=1,0,两分类,则,OR,的1-,可信区间估计公式,为回归系数的标准误,(公式16-10),例:讲义表16-1资料,一个研究吸烟、饮酒与食道癌关系的病例对照资料(886例),试作,logistic,回归分析。,变量的赋值,经,logistic,回归计算后得,b,0,=-0.9099,b,1,=0.8856,b,2,=0.5261,,方程表达,:,控制饮酒因素后,吸烟与不吸烟相比患食管癌的优势比为2.4倍,OR的可信区间估计,吸烟与不吸烟患食管癌,OR,的95%可信区间:,饮酒与不饮酒,OR,的95%可信区间:,三、,Logistic,回归模型的假设检验,1.

7、检验一:对建立的整个模型做检验。,说明自变量对,Y,的作用是否有统计意义。,检验方法(,讲义260-261页),1),似然比检验,(,likelihood ratio test),2),Wald,检验,3),计分检验,(,score test),例表16-1吸烟、饮酒与食管癌资料(,SAS,软件计算),1.,对建立的整个模型做检验。,Testing Global Null Hypothesis:BETA=0,Test Chi-Square DF Pr,似然比,68.5457 2 .0001,计分检验 67.0712 2 .0001,Wald,检验 64.2784 2 .0001,2.检验二:,

8、检验模型中某,是否对,Y,有作用。,检验假设:,检验统计量:主要为,Wald,检验(,SAS,软件),例;,在大样本时,三方法结果一致。,公式16-13,=1,的,2,例表16-1资料,对各,x,的,做检验(,wald,检验),参数,估计值,标准误,Chi-Squa Pr,常数-0.9099 0.1358 44.8699 .0001,吸烟,0.8856 0.1500 34.8625,.0001,饮酒,0.5261 0.1572 11.2069 .0008,Odds Ratio Estimates,Point 95%Wald,Effect Estimate Confidence Limits,吸

9、烟,x1 2.424 1.807 3.253,饮酒,x2 1.692 1.244 2.303,似然比检验(讲义),对某个,做检验,检验统计量(,G),包括,p,个自变量的对数似然函数,包括,l,个自变量的对数似然函数,G,服从自由度(,d)=p-l,的,2,分布,似然比检验对,做检验,例:,X1,为吸烟,,X2,为饮酒,检验饮酒与食管癌关系,,H,0,:,2,=0,H,1:,2,0,G 3.84,p0.05,,说明调整吸烟因素后,饮酒与食管癌有关系。,四、变量筛选,目的;将回归系数有显著意义的自变量选入模型中,作用不显著的自变量则排除在外。,变量筛选算法有:前进法、后退法和,逐步法(,step

10、wise)。,例:讲义例16-2,用逐步法,选入变量的显著水准为0.10,变量保留在方程的水准为0.15,例:16-2讲义261-263页,表16-4 进入方程的自变量及参数估计,变量,S,b,Wald,2,P,标准,OR,常数 -4.705 1.54 9.30 0.0023,年龄 0.924 0.477 3.76 0.0525 0.401 2.52,X5 1.496 0.744 4.04 0.0443 0.406 4.46,X6 3.136 1.249 6.30 0.0121 0.703 23.06,X8 1.947 0.847 5.29 0.0215 0.523 7.,01,标准回归系数(

11、b),比较各自变量对,Y,的相对贡献,第二节 条件Logistic回归,概念:,用配对设计获得病例对照研究资料,计算的,Logistic,回归模型为,条件,Logistic,回归,。,成组(未配对)设计的病例对照研究资料,计算的,Logistic,回归模型为,非条件,Logistic,回归。,例:见265页,区别:,条件,Logistic,回归的参数估计无常数项(,0,),,主要用于危险因素的分析。,第三节,logistic,回归的应用及注意事项,一、,logistic,回归的应用,1.,疾病(某结果)的危险因素分析和筛选,用回归模型中的回归系数(,i,),和,OR,说明危险因素与疾病的关系

12、例:讲义例16-1,16-2,16-3,适用的资料:,前瞻性研究设计、病例对照研究设计、横断面研究设计的资料。,三类研究计算的,logistic,回归模型的,意义是一致。仅常数项不同。(证明略),Logistic,回归的应用,2.,校正混杂因素,对疗效做评价,在临床研究和疗效的评价,组间某些因素构成不一致干扰疗效分析,通过该法可控制非处理因素,正确评价疗效。,3.,预测与判别,预测个体在某因素存在条件下,发生某事件(发病)的概率,为进一步治疗提供依据。,表5-4甲乙两疗法某病治愈率%比较,病型 甲疗法 乙疗法,病人 治愈 治愈 病人 治愈 治愈,数 数 率 数 数 率,普通型 300 180

13、 60.0 100 65 65.0,重型 100 35 35.0 300 125 41.7,合计 400 215 53.8 400 190 47.5,例:,例1,表5-5直接法计算标准化治愈率,病型 标准 甲疗法 乙疗法,治疗 原治 预期 原治 预期,人数 愈率 治愈数 愈率 治愈数,普通型 400 60.0 240 65.0 260,重型 400 35.0 140 41.7 167,合计 800 380 427,调整率(标准化率):,X1,疗法(甲=0,乙=1),X2,病情(轻=1,重=0),Y,疗效(,Y=1,有效,,Y=0,无效),LOGISTIC,回归计算,Standard Wald

14、Parameter Estimate Error Chi-Squa Pr,Intercept -0.6453 0.1653 15.24 .0001,疗法 0.2482 0.1699 2.13 0.1442 病情,0.9900 0.1699 33.93 .0001,Odds Ratio Estimate,Point 95%Wald,Effect Estimate Confidence Limits,疗法 1.282 0.919 1.788,病情 2.691 1.929 3.755,例2 性别、两种药物对某病疗效的研究,不考虑性别的影响,疗效与药物的,logistic,回归,2,=10.23,p=

15、0.0014,OR=4.46,性别,治疗方法,疗效,有效(,y=1),无效,(,y=0),合计,女,X1=1,新药(,x2=1),21,6,27,对照(,x2=0),13,19,32,男,X1=0,新药(,x2=1),7,7,14,对照(,x2=0),1,10,11,考虑性别、药物对疗效的作用,Standard Wald,Parame Estimate Error Chi-Square Pr,常数 -1.9037 0.5982 10.127 0.0015,性别 1.4685 0.575 6.508 0.0107,药物 1.7816 0.518 11.794 0.0006,Odds Ratio

16、Estimates,Point 95%Wald,Effect Estimate Confidence Limits,x1,性别 4.343 1.405 13.421,x2,药物 5.939 2.149 16.417,结论:性别和药物的回归系数都均有统计意义。说明女性或用新药的疗效较优。,用,Logistic,模型方程对个体的疗效做预测:,设如女性病人,,x1=1,,用新药,x2=1,,有效的概率,p=0.79,如男性病人,x1=0,,用新药,x2=1,,有效的概率,p=0.4695,二、,Logistic,回归应用的注意事项,1.模型中自变量的取值,自变量(,X),可为计量数据、分类数据和等级

17、数据。,计量数据常重新划为有序组段,,OR,的实际意义较大。,例:年龄(岁,,x1),数据的几种赋值形式,1)两分类变量,赋值为:有=1,无=0,2)有序变量,赋值;无=0,少=1,中=2,多=3,例;年龄 45=1 45-54=2 55-64=3 65=4,3.)多分类无序变量:,赋值为:哑变量(,dummy variable),形式,见例:,注:变量取值不同,方程的系数和符号将发生变化。,表16-2 冠心病8个可能的危险因素与赋值(讲义262页),因素,变量名,赋值说明,年龄(岁),X,1,45=1,45,54=2,55,64=3,65,=4,高血压史,X,2,无=0,有=1,高血压家族史

18、X,3,无=0,有=1,吸烟,X,4,不吸=0,吸=1,表16-9 年龄(,X),化为哑变量的赋值,年龄(岁),有序变量,哑变量(方法一),X,水平,D,1,D,2,D,3,ChiSq,Deviance 1 3.4202 0.0644,Pearson 1 3.4218 0.0643,4.多分类的Logistic回归,Logistic,回归可处理:,1),应变量(,Y),为有序的多分类资料,如结果为:治愈、显效、好转、无效,2),应变量(,Y),为无序的多分类资料,例:研究阑尾炎类型与危险因素关系,阑尾炎类型有:卡他型、坏疽型、腹膜炎型,多分类,Logistic,回归方法(略),结果的表达,一般,logistic,回归分析报告内容:,1.危险因素的回归系数及标准误、,p,值,2.标准化的回归系数。,3.危险因素对应的,OR,和可信区间,4.,Logistic,回归方程,讲义264页,本节重点掌握内容和作业,一、问答题,1.,Logistic,回归与线性回归有什么不同?,2.,Logistic,回归可解决哪些问题?,3.自变量可以有哪些类型,应用时应如何赋值?,4.,Logistic,回归中,的含义和方程的表达。,二、计算分析题的第2题的第(1)题,。,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服