ImageVerifierCode 换一换
格式:PPT , 页数:68 ,大小:450.01KB ,
资源ID:1779792      下载积分:14 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/1779792.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(7-多元Logistic-回归分析.ppt)为本站上传会员【a199****6536】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

7-多元Logistic-回归分析.ppt

1、多元统计分析方法多元统计分析方法 The Methods of Multivariate Statistical Analysis1多元多元Logistic 回归分析回归分析Multiple Logistic Regression Analysis第七章第七章2主要内容主要内容 Logistic 回归分析的基本概念 Logistic 回归分析的数学模型 Logistic 回归模型的建立和检验 Logistic 回归系数的解释 配对病例-对照数据的logistic回归分析3回归分析的分类回归分析的分类连续型因变量连续型因变量(y)-线性回归分析线性回归分析多个因变量多个因变量(y1,y2yk)分

2、类型因变量分类型因变量(y)-Logistic 回归分析回归分析时间序列因变量时间序列因变量(t)-时间序列分析时间序列分析生存时间因变量生存时间因变量(t)-生存风险回归分析生存风险回归分析路径分析路径分析结构方程模型分析结构方程模型分析一个一个因变因变量量 y回忆:回忆:4医学研究中经常遇到分类型变量医学研究中经常遇到分类型变量二分类变量:o生存与死亡o有病与无病o有效与无效o感染与未感染多分类有序变量:o疾病程度(轻度、中度、重度)o治愈效果(治愈、显效、好转、无效)多分类无序变量:o手术方法(A、B、C)o就诊医院(甲、乙、丙、丁)5医学研究者经常关心的问题医学研究者经常关心的问题哪些

3、因素导致了人群中有的人患胃癌而有的人不患胃癌?哪些因素导致了手术后有的人感染,而有的人不感染?哪些因素导致了某种治疗方法出现治愈、显效、好转、无效等不同的效果?是回归分析问题是回归分析问题:Y=f(x)Y=f(x)6如何解决这样的问题?如何解决这样的问题?y=f(x)y=1,0 x任意任意存在,且不唯一存在,且不唯一不能直接分析不能直接分析变量变量y与与x的关系的关系p=p(y=1|x)=f(x)0p1,x任意任意Logistic回归模型回归模型y取某个值的概取某个值的概率变量率变量p与与x 的的关系关系不存在不存在71、什么是、什么是Logistic 回归分析?回归分析?研究因变量研究因变量

4、y取某个值的概率变量取某个值的概率变量p与与自自变量变量x的依存关系。的依存关系。p=p(y=1|x)=f(x)第一节第一节 Logistic 回归分析的概念回归分析的概念82、Logistic回归分析的分类回归分析的分类按数据的类型:按数据的类型:o非条件非条件logistic回归分析(成组数据)回归分析(成组数据)o条件条件logistic回归分析(配对病例回归分析(配对病例-对照数据)对照数据)按因变量取值个数:按因变量取值个数:o二值二值logistic回归分析回归分析o多值多值logistic回归分析回归分析按自变量个数:按自变量个数:o一元一元logistic回归分析回归分析o多元

5、多元logistic回归分析回归分析Logistic回归分析回归分析9第二节第二节 Logistic 回归分析的数学模型回归分析的数学模型 令令y是是1,0变量,变量,x是任是任意变量,意变量,p=p(y=1|x),那么,二值变量那么,二值变量y关于关于变量变量x的一元的一元logistic 回归回归模型是:模型是:其中,其中,和和是未知参数或待估计的回归系数。该模型描述了是未知参数或待估计的回归系数。该模型描述了y取某个值(这里取某个值(这里y=1)的概率的概率p与自变量与自变量x之间的关系。之间的关系。(1)二值一元二值一元logistic回归模型回归模型:10 令令y是是1,0变量,变量

6、x1,x2,xk是是任意任意k个变量;个变量;p=p(y=1|x1,x2,xk),那么,变量那么,变量y关于变量关于变量x1,x2,xk 的的k元元logistic回归模型是:回归模型是:(2)二值多元二值多元logistic回归模型回归模型:注意:对于二值Logistic回归模型,Y=0的模型是:p=p(y=0|x1,xk)=1-p(y=1|x1,xk)11 Logistic 回归模型的另外一种形式回归模型的另外一种形式它给出变量它给出变量z=logit(p)关于关于x 的线性函数。的线性函数。12(3)多值多值logistic回归模型回归模型:例如,当y取值1,2,3时,logistic

7、回归模型是:P1=P2=P3=p(y3|x)=1-P2P1=p(y=1)=P1P2=p(y=2)=P2-P1P3=p(y=3)=1-P2累积概率模型累积概率模型独立概率模型独立概率模型131、估计参数、估计参数-最大似然法最大似然法2、检验参数的显著性、检验参数的显著性 H0:j=0 vs H1:j0 3、检验模型的显著性、检验模型的显著性 H0:1=k=0 vs H1:j04、解释参数的实际意义、解释参数的实际意义第三节第三节 Logistic回归分析方法步骤回归分析方法步骤14例例1、自变量是二值分类型变量、自变量是二值分类型变量某医院为了研究导致手术切口感染的原因,收集了某医院为了研究导

8、致手术切口感染的原因,收集了295例手术例手术者情况,其中,手术时间小于或等于者情况,其中,手术时间小于或等于5小时的有小时的有242例,感染者例,感染者13例;手术时间大于例;手术时间大于5小时的有小时的有53例,感染者例,感染者7例。试建立手术例。试建立手术切口感染切口感染(y)关于手术时间关于手术时间(x)的的logistic回归模型。回归模型。46530(7 13 46 229 53 24215data eg7_1a;data eg7_1a;input y x wt;input y x wt;cards;cards;1 1 71 1 71 0 131 0 130 1 460 1 460

9、 0 2290 0 229;run;run;proc logistic descending;proc logistic descending;model y=x;model y=x;weight wt;weight wt;run;run;SAS程序程序16The LOGISTIC ProcedureThe LOGISTIC ProcedureData Set:WORK.EG7_1AData Set:WORK.EG7_1AResponse Variable:YResponse Variable:YResponse Levels:2Response Levels:2Number of Obser

10、vations:4Number of Observations:4Weight Variable:WTWeight Variable:WTSum of Weights:295Sum of Weights:295Link Function:Link Function:Logit Logit Response Profile Response ProfileOrdered TotalOrdered Total Value Y Count Weight Value Y Count Weight 1 1 1 1 2 20.00000 2 20.00000 2 2 0 0 2 275.00000 2 2

11、75.0000017 Model Fitting Information and Testing Global Null Hypothesis BETA=0Model Fitting Information and Testing Global Null Hypothesis BETA=0 Intercept Intercept Intercept and Intercept andCriterion Only Covariates Chi-Square for CovariatesCriterion Only Covariates Chi-Square for CovariatesAIC 1

12、48.262 146.686 .AIC 148.262 146.686 .SC 147.648 145.458 .SC 147.648 145.458 .-2 LOG L 146.262 142.686 -2 LOG L 146.262 142.686 3.576 with 1 DF(p=0.0586)3.576 with 1 DF(p=0.0586)Score .4.224 with 1 DF(p=0.0399)Score .4.224 with 1 DF(p=0.0399)Analysis of Maximum Likelihood Estimates Analysis of Maximu

13、m Likelihood Estimates Parameter Standard Parameter Standard Wald Wald Pr Standardized Odds Pr Standardized OddsVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioINTERCPT 1 INTERCPT 1 -2.8688-2.8688 0.2851 101.2408 0.2851 10

14、1.2408 0.00010.0001 .X 1 X 1 0.98600.9860 0.4959 3.9542 0.4959 3.9542 0.04680.0468 2.069569 2.069569 2.6812.68118回归模型:回归模型:参数估计:参数估计:a=-2.869(p=0.0001),b=0.986(p=0.0468).模型检验:模型检验:2=3.576,df=1,p=0.0586结果:结果:如何解释系数的实际意义?如何解释系数的实际意义?19第四节第四节 Logistic回归模型系数的解释回归模型系数的解释 回忆流行病学研究中两个重要概念:回忆流行病学研究中两个重要概念:在

15、在logistic回归模型回归模型令令x=0和和x=1,得到得到20a)一元一元logistic回归模型系数回归模型系数的意义解释:的意义解释:b)(1)x=1,0 变量变量如果如果x=1,0,则则 e b=OR 近似表示在近似表示在x=1条件下的发病率与条件下的发病率与在在x=0 条件下发病率之比条件下发病率之比(相对危险度相对危险度),或者说,或者说,x=1条条件下的发病可能性比件下的发病可能性比x=1条件下多或少条件下多或少(OR-1)*100%。21Logistic 回归模型:回归模型:从从b=0.986,得到得到 RR OR=eb=2.681。所以,手术时间大于所以,手术时间大于5小

16、时的感染率是手术时间小于或等于小时的感染率是手术时间小于或等于5小时的感染率的小时的感染率的2.681倍,即感染的可能性增加了倍,即感染的可能性增加了186.1%。0(7 13 46 229 53 242例如,手术感染问题例如,手术感染问题22a)一元一元logistic回归模型系数回归模型系数的意义解释:的意义解释:b)(2)如果如果x是连续变量是连续变量c)对于任意对于任意x1 和和x2,x1 x2 如果如果x 是连续变量,则是连续变量,则OR=eb 近似表示在近似表示在x 的相邻两个的相邻两个单位上的相对危险度。即单位上的相对危险度。即x 每每增加一个单位,相对危险增加一个单位,相对危险

17、增加增加 或减少或减少(OR-1)*100%。23例例2 2、自变量是连续型数值变量、自变量是连续型数值变量为了分析新生儿出生时体重为了分析新生儿出生时体重(birthwtbirthwt)与支气管肺的发育与支气管肺的发育不良病不良病(BPD)BPD)的关系,调查了的关系,调查了223223名新生儿。调查的数据名新生儿。调查的数据列在下表中。列在下表中。24data eg7_2;do birthwt=750,1150,1550;do bpd=1,0;input wt ;output;end;end;cards;49 19 18 62 9 66run;proc logistic data=eg2

18、descending;model bpd=birthwt;weight wt;run;SAS程序程序25 Response ProfileResponse ProfileOrderedOrdered Value BPD Count Value BPD Count 1 1 76 1 1 76 2 0 147 2 0 147 Model Fitting Information and Testing Global Null Hypothesis BETA=0 Model Fitting Information and Testing Global Null Hypothesis BETA=0 In

19、tercept Intercept Intercept and Intercept andCriterion Only Covariates Chi-Square for CovariatesCriterion Only Covariates Chi-Square for CovariatesAIC 288.140 229.166 .AIC 288.140 229.166 .SC 291.547 235.980 .SC 291.547 235.980 .-2 LOG L 286.140 225.166 -2 LOG L 286.140 225.166 60.974 with 1 DF(p=0.

20、0001)60.974 with 1 DF(p=0.0001)Score .56.008 with 1 DF(p=0.0001)Score .56.008 with 1 DF(p=0.0001)Analysis of Maximum Likelihood Estimates Analysis of Maximum Likelihood Estimates Parameter Standard Parameter Standard Wald Wald Pr Standardized OddsPr Standardized OddsVariable DF Estimate Error Chi-Sq

21、uare Chi-Square Estimate RatioVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioINTERCPT 1 3.7180 0.6387 33.8853 0.0001 .INTERCPT 1 3.7180 0.6387 33.8853 0.0001 .BIRTHWT 1 -0.00397 0.000588 45.6092 0.0001 -0.702480 BIRTHWT 1 -0.00397 0.000588 45.6092 0.0001 -0.702480 0.9960.996SAS输出结果输出

22、结果261、因变量、因变量bpd对自变量对自变量birthwt 的的logistic回归模型是:回归模型是:2、自变量、自变量birthwt 的回归系数在统计意义上不等于的回归系数在统计意义上不等于0 (p=0.0001),因此,因此,OR=0.996在统计意义上不等于在统计意义上不等于1。OR=0.996 说明新生儿出生体重每增加一个单位说明新生儿出生体重每增加一个单位(g),患患 BPD病的机会就会减少大约病的机会就会减少大约0.4%。即患。即患bpd病的概率病的概率 随新生儿出生体重的增加而下降。随新生儿出生体重的增加而下降。3、根据上述回归模型可以预测新生儿出生时可能患、根据上述回归模

23、型可以预测新生儿出生时可能患BPD病病 的的 概率概率。27a)一元一元logistic回归模型系数回归模型系数的意义解释:的意义解释:b)(3)如果如果x 是分类变量是分类变量c)如果如果x 是分类型变量,特别是名义型变量,则需要是分类型变量,特别是名义型变量,则需要将将x 转化为哑变量,再进行转化为哑变量,再进行Logistic回归分析。回归分析。如果如果x是是g个分类的分类型变量,则要将个分类的分类型变量,则要将x 的的g-1个哑个哑变量放入模型,每一个哑变量的变量放入模型,每一个哑变量的OR 值表示该组与参值表示该组与参照组的相对危险度。照组的相对危险度。28什么是哑变量?什么是哑变量

24、一个含有一个含有g个类的分类型变量可以构造个类的分类型变量可以构造g个哑变量。个哑变量。29如何用如何用SASSAS程序构造哑变量?程序构造哑变量?data d2;set d1;array a3 student teacher worker;do i=1 to 3;ai=(x 1=i);end;run;data d2;set d1;array a3 student teacher worker;do i=1 to 3;if x1=i then ai=1;else ai=0;end;run;30如何对哑变量进行分析?如何对哑变量进行分析?(1)将g-1个哑变量放入模型进行分析,留一个哑变 量作

25、为参照变量;(2)每一个哑变量的OR值表示该哑变量组与参照变量组的相对危险度。31例例3、自变量是分类型变量、自变量是分类型变量为了了解冠心病与种族的关系,某研究所调查了为了了解冠心病与种族的关系,某研究所调查了100个样本,个样本,数据列在下表中。试估计各种族间患冠心病的相对危险度。数据列在下表中。试估计各种族间患冠心病的相对危险度。设设y=1表示患冠心病,表示患冠心病,y=0表示未患冠心病。令表示未患冠心病。令x=1表示黑表示黑人,人,x=2表示白人,表示白人,x=3表示其它种族。将变量表示其它种族。将变量x转化为哑转化为哑变量,变量名是:变量,变量名是:black、white和和othe

26、r。32data eg7_3;do y=1,0;do x=1 to 3;input wt ;output;end;end;cards;20 5 25 10 20 20run;data eg7_3;set eg7_3;array a3 black white other;do i=1 to 3;ai=(x=i);end;run;proc logistic descending;model y=black other;weight wt;run;White作为参照组作为参照组33The LOGISTIC ProcedureThe LOGISTIC Procedure Response Profil

27、e Response ProfileOrdered TotalOrdered Total Value Y Count Weight Value Y Count Weight 1 1 3 50.000000 1 1 3 50.000000 2 0 3 50.000000 2 0 3 50.000000Model Fitting Information and Testing Global Null Hypothesis BETA=0Model Fitting Information and Testing Global Null Hypothesis BETA=0 Without With Wi

28、thout WithCriterion Covariates Covariates Chi-Square for CovariatesCriterion Covariates Covariates Chi-Square for CovariatesAIC 138.629 131.038 .AIC 138.629 131.038 .SC 138.629 130.413 .SC 138.629 130.413 .-2 LOG L 138.629 125.038 -2 LOG L 138.629 125.038 13.592 with 3 DF(p=0.0035)13.592 with 3 DF(p

29、0.0035)Score .12.889 with 3 DF(p=0.0049)Score .12.889 with 3 DF(p=0.0049)Analysis of Maximum Likelihood Estimates Analysis of Maximum Likelihood Estimates Parameter Standard Parameter Standard Wald Wald Pr Standardized OddsPr Standardized OddsVariable DF Estimate Error Chi-Square Chi-Square Variabl

30、e DF Estimate Error Chi-Square Chi-Square Estimate Ratio Estimate RatioINTERCPT 1 -1.3863 0.5000 7.6874 0.0056 .INTERCPT 1 -1.3863 0.5000 7.6874 0.0056 .BLACK 1 2.0794 0.6325 10.8103 0.0010 2.349536 BLACK 1 2.0794 0.6325 10.8103 0.0010 2.349536 8.0008.000OTHER 1 1.6094 0.5831 7.6186 0.0058 1.974184

31、OTHER 1 1.6094 0.5831 7.6186 0.0058 1.974184 5.0005.000341.模型总体检验结果说明该模型具有统计意义模型总体检验结果说明该模型具有统计意义(p=0.0035)。2.参数检验说明,黑人与白人患冠心病的相对危险度是:参数检验说明,黑人与白人患冠心病的相对危险度是:OR=8(p=0.0010),说明黑人患冠心病的几率大约是说明黑人患冠心病的几率大约是白人的白人的8倍。倍。3.参数检验说明,其他种族人与白人患冠心病的相对危参数检验说明,其他种族人与白人患冠心病的相对危险度是:险度是:OR=5(p=0.0058),说明其他种族人患冠心说明其他种族人

32、患冠心病的几率大约是白人的病的几率大约是白人的5倍。倍。结论结论35a)一元一元logistic回归模型系数回归模型系数的意义解释:的意义解释:如果如果x是是分类型变量分类型变量(g个分类个分类),则要将则要将x 的的g-1个哑变量个哑变量放入模型,每一个哑变量的放入模型,每一个哑变量的OR 值表示该组与参照组的相值表示该组与参照组的相对危险度。对危险度。如果如果x=1,0,则则 e b=OR 近似表示在近似表示在x=1条件下的发病率与条件下的发病率与在在x=0 条件下发病率之比条件下发病率之比(相对危险度相对危险度),或者说,或者说,x=1条条件下的发病可能性比件下的发病可能性比x=1条件下

33、多或少条件下多或少(OR-1)*100%。如果如果x 是连续型变量,是连续型变量,则则OR=eb 近似表示在近似表示在x 的相邻两个的相邻两个单位上的相对危险度。即单位上的相对危险度。即x 每每增加一个单位,相对危险增增加一个单位,相对危险增加加 或减少或减少(OR-1)*100%。36b)多元多元logistic回归模型系数的解释回归模型系数的解释假设假设 y 在二值变量在二值变量 x 1和和 x 2上的二元上的二元 logistic回归模型是:回归模型是:可以证明:可以证明:e1 表示消去了表示消去了x 2 的影响后或在的影响后或在x 2 不变的情况下,不变的情况下,x 1 相邻两个单位患

34、病率之比(相对危险度);相邻两个单位患病率之比(相对危险度);e2 表示消去了表示消去了x 1 的影响后或在的影响后或在x 1 不变的情况下,不变的情况下,x 2 相邻两个单位患病率之比(相对危险度)。相邻两个单位患病率之比(相对危险度)。37例例4、无交互影响的多元、无交互影响的多元logistic回归模型回归模型某市调查饮酒对食道癌的影响,共收集了某市调查饮酒对食道癌的影响,共收集了200例食道癌患者例食道癌患者作为病例组作为病例组(y=1),774例非食道癌患者作为对照组例非食道癌患者作为对照组(y=0)。询问了他们的年龄和饮酒情况。数据列在下表中。试分析询问了他们的年龄和饮酒情况。数据

35、列在下表中。试分析饮酒对食道癌的影响,将年龄作为混杂因素。饮酒对食道癌的影响,将年龄作为混杂因素。38data eg4;do y=1,0;do age=1 to 3;do drink=1,0;input wt ;output;end;end;end;cards;5 5 67 55 24 44 35 270 56 276 18 119run;proc logistic descending;model y=drink age;weight wt;run;39SAS输出结果输出结果The LOGISTIC ProcedureThe LOGISTIC Procedure Response Profi

36、le Response ProfileOrdered TotalOrdered Total Value Y Count Weight Value Y Count Weight 1 1 6 200.00000 1 1 6 200.00000 2 0 6 774.00000 2 0 6 774.00000 Model Fitting Information and Testing Global Null Hypothesis BETA=0 Model Fitting Information and Testing Global Null Hypothesis BETA=0-2 LOG L 989.

37、029 816.466 -2 LOG L 989.029 816.466 172.563 with 2 DF(p=0.0001)172.563 with 2 DF(p=0.0001)Analysis of Maximum Likelihood Estimates Analysis of Maximum Likelihood Estimates Parameter Standard Parameter Standard Wald Wald Pr Standardized Pr Standardized OddsOddsVariable DF Estimate Error Chi-Square C

38、hi-Square Estimate Variable DF Estimate Error Chi-Square Chi-Square Estimate RatioRatioINTERCPT 1 -4.1249 0.3226 163.4795 0.0001 .INTERCPT 1 -4.1249 0.3226 163.4795 0.0001 .DRINK 1 1.7788 0.1865 91.0078 0.0001 3.761888 DRINK 1 1.7788 0.1865 91.0078 0.0001 3.761888 5.9235.923AGE 1 1.0971 0.1338 67.27

39、05 0.0001 4.108738 AGE 1 1.0971 0.1338 67.2705 0.0001 4.108738 2.9952.99540结论结论1.模型的总体检验说明模型具有统计意义模型的总体检验说明模型具有统计意义(p=0.0001)。2.参数检验结果显示所有回归系数都具有显著性意参数检验结果显示所有回归系数都具有显著性意义义(p=0.0001)。3.OR(drink)=5.923说明除去年龄这个混杂因子的影说明除去年龄这个混杂因子的影响后,饮酒者比不饮酒者大约多响后,饮酒者比不饮酒者大约多492.3%的可能性的可能性患食道癌患食道癌(p=0.0001),或者说饮酒者患食道癌的

40、或者说饮酒者患食道癌的可能性大约是不饮酒者的可能性大约是不饮酒者的5.923倍倍(p=0.0001)41例例5、有交互影响的多元、有交互影响的多元logistic回归模型回归模型在回顾性研究中,随机抽查了某地区在回顾性研究中,随机抽查了某地区818个人的吸烟饮酒等个人的吸烟饮酒等生活方式以及各种慢性疾病的患病情况。表生活方式以及各种慢性疾病的患病情况。表7-5中列出的是中列出的是一部分调查结果。试分析吸烟、饮酒危险因素对患胃病的一部分调查结果。试分析吸烟、饮酒危险因素对患胃病的影响程度以及它们的交互影响程度。影响程度以及它们的交互影响程度。表表7-5 生活方式与胃病的调查数据生活方式与胃病的调

41、查数据42y=1和0,分别表示患胃病和未患胃病;x 1=1和 0,分别表示吸烟和不吸烟;x 2=1和 0,分别表示饮酒和不饮酒。建立四个哑变量分别代表四种不同的生活方式,即x 11=1表示既吸烟又饮酒,0 表示其他;x 10=1表示吸烟但不饮酒,0 表示其他;x 01=1表示不吸烟但饮酒,0 表示其他;x 00=1表示既不吸烟又不饮酒,0 表示其他。将前三个哑变量放进模型,则可以得前三种生活方式相对于最后一种生活方式患胃病的相对危险度。43data eg7_5;do y=1,0;do x1=1,0;do x2=1,0;input wt ;output;end;end;end;cards;39

42、25 35 16 101 126 253 223run;data eg7_5;set eg7_5;if x1=1&x2=1 then x11=1;else x11=0;if x1=1&x2=0 then x10=1;else x10=0;if x1=0&x2=1 then x01=1;else x01=0;if x1=0&x2=0 then x00=1;else x00=0;run;proc logistic descending;model y=x11 x10 x01;weight wt;run;44The LOGISTIC ProcedureThe LOGISTIC Procedure M

43、odel Fitting Information and Testing Global Null Hypothesis BETA=0 Model Fitting Information and Testing Global Null Hypothesis BETA=0-2 LOG L 664.261 631.703 32.557 with 3 DF(p=0.0001)-2 LOG L 664.261 631.703 32.557 with 3 DF(p=0.0001)Analysis of Maximum Likelihood Estimates Analysis of Maximum Lik

44、elihood Estimates Parameter Standard Parameter Standard Wald Wald Pr Standardized Odds Pr Standardized OddsVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioVariable DF Estimate Error Chi-Square Chi-Square Estimate RatioINTERCPT 1 -2.6346 0.2588 103.6217 0.0001 .INTERCPT 1 -2.6346 0.258

45、8 103.6217 0.0001 .X11 1 1.6830 0.3202 27.6277 0.0001 3.777933 5.382X11 1 1.6830 0.3202 27.6277 0.0001 3.777933 5.382X10 1 1.0172 0.3390 9.0031 0.0027 2.351977 2.765X10 1 1.0172 0.3390 9.0031 0.0027 2.351977 2.765X01 1 0.6565 0.3154 4.3318 0.0374 1.868880 1.928X01 1 0.6565 0.3154 4.3318 0.0374 1.868

46、880 1.92845结论:1)模型具有统计意义(p=0.0001);三个参数均有显著性意义(p=0.0027、p=0.0374和p=0.0374)。2)因为四个哑变量中x00作为参照变量,因此,OR(x11)=5.382表示既吸烟又饮酒者患胃病的几率是不吸烟又不饮酒者的5.382倍;OR(x10)=2.765表示吸烟但不饮酒者患胃病的几率是不吸烟又不饮酒者的2.765倍;OR(x01)=1.928表示不吸烟但饮酒者患胃病的几率是不吸烟又不饮酒者的1.928倍。466、多值变量的、多值变量的logistic回归模型系数的解释回归模型系数的解释:某大学医院外科采用两种不同的绷带和两种不同的包扎方

47、某大学医院外科采用两种不同的绷带和两种不同的包扎方式进行腿溃疡的治疗处理。治疗的结果分三种:不愈、有式进行腿溃疡的治疗处理。治疗的结果分三种:不愈、有效和痊愈。治疗方式和治疗效果列在表效和痊愈。治疗方式和治疗效果列在表7-6中。试分析治疗中。试分析治疗方法对治疗效果的影响。方法对治疗效果的影响。设因变量设因变量 y 表示治疗效果,表示治疗效果,0=不愈、不愈、1=有效、有效、2=痊愈。设痊愈。设因变量因变量 x 1表示绷带种类,自变量表示绷带种类,自变量 x 2 表示包扎方式表示包扎方式。47 腿溃疡治疗方式与效果数据资料腿溃疡治疗方式与效果数据资料48【SAS程序】程序】data eg7_6

48、input y x1 x2 wt ;cards;0 0 0 19 2 1 1 5run;proc logistic descending;model y=x1 x2;weight wt;run;49【SASSAS输出结果】输出结果】The LOGISTIC ProcedureThe LOGISTIC Procedure Response Profile Response ProfileOrdered TotalOrdered Total Value Y Count Weight Value Y Count Weight 1 2 4 15.000000 1 2 4 15.000000 2 1

49、4 25.000000 2 1 4 25.000000 3 0 4 59.000000 3 0 4 59.000000 Score Test for the Proportional Odds Assumption Score Test for the Proportional Odds Assumption Chi-Square=0.7505 with 2 DF(p=0.6871)Chi-Square=0.7505 with 2 DF(p=0.6871)Model Fitting Information and Testing Global Null Hypothesis BETA=0 Mo

50、del Fitting Information and Testing Global Null Hypothesis BETA=0 Intercept Intercept Intercept and Intercept andCriterion Only Covariates Chi-Square for CovariatesCriterion Only Covariates Chi-Square for CovariatesAIC 190.499 178.977 .AIC 190.499 178.977 .SC 191.469 180.916 .SC 191.469 180.916 .-2

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服