收藏 分销(赏)

cox比例风险回归模型及其R程序.ppt

上传人:可**** 文档编号:798755 上传时间:2024-03-21 格式:PPT 页数:46 大小:1.18MB
下载 相关 举报
cox比例风险回归模型及其R程序.ppt_第1页
第1页 / 共46页
cox比例风险回归模型及其R程序.ppt_第2页
第2页 / 共46页
cox比例风险回归模型及其R程序.ppt_第3页
第3页 / 共46页
cox比例风险回归模型及其R程序.ppt_第4页
第4页 / 共46页
cox比例风险回归模型及其R程序.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

1、CoxCox回归分析回归分析刘瑞红利用生存率函数S(t,X)与风险函数h(t,X)的关系可导出 较好地解决截尾值的问题 反映了协变量X与生存函数的关系 Cox模型的基本形式 所有危险因素为0时的基础风险率,它是未知的,但假定它与h(t,X)是呈比例的。右侧可分为两部分:h0(t)没有明确的定义,分布无明确的假定,参数无法估计,为非参数部分;另一部分是参数部分,其参数可以通过样本的实际观察值来估计的,正因为Cox模型有非参数和参数两部分组成,故又称为半参数模型。若若 i0,则,则RR1,该因素为危险因素;,该因素为危险因素;若若 i0,则,则RR0,说明该个体死亡风险高于平均水平;若PIj0,说

2、明该个体死亡风险低于平均水平。3通过估计生存率,对群体定量地进行预后评价。由于生存率与基础生存率相关,故只要估计出基础生存率,再结合各因素的偏回归系数就可以估计出生存率,即 ti 时刻的基础时刻的基础生存率公式生存率公式 ti 时时 刻刻 的的 基基础础累累计计风风险险函函 数数 公公 式式在在tk时时刻的死亡人数刻的死亡人数 ti 时时刻刻的的生生存存率率 计计 算算 公公 式式 2.Breslow法5.Cox模型拟合优度的考察可将研究对象按个体预后指数恰当地分组,用乘积极限法估计各组的生存率曲线,并与按Cox模型预后指数分类的生存率曲线在同一坐标系内进行比较,若两种曲线具有一致性,说明模型

3、拟合较理想。也可以使用卡方检验的方法。比例风险假定(比例风险假定(PH假定):假定):PH假定的检验方法大致可以分为图法和正规的检验方法图法和正规的检验方法。图法:即通过观察散点图中散点的分布或趋势是否满足既定模型基本假设下的形状来判断资料是否满足或近似满足模型假定,主要的方法有:比较COX-KM生存曲线、基于累计风险函数的图示法、Schoenfeld残差图、Score残差图;正规的检验方法:通过构造满足既定模型基本假定下服从某一已知分布的统计量,利用P值来检验资料是否满足或近似满足模型假定。主要方法有:时协变量法、线性相关检验、加权残差Score检验、三次样条函数法.Cox比例风险回归模型诊

4、断及预测有关问题的研究_余红梅.caj.caj对数线性假定对数线性假定主要的方法:多重法;鞅残差法;改进的鞅残差法;构造变量法Cox回归影响点的分析鞅残差,剩余残差,得分残差,Schoenfeld残差,加权Schoenfeld残差R程序:程序:在survival包中的函数:coxph(formula,data,weights,subset,na.action)formula:反应变量要有Surv()函数定义cox.zph(fit,transform=,global=T/F)检验比例风险假定basehaz(fit,centered=T/F)计算基础风险率的函数getwd()setwd(C:/Us

5、ers/Administrator/Desktop)my-read.csv(pharynx.csv,header=T)attach(my)my-myCOND!=9&GRADE!=9,#去掉两个缺失值 CONDCOND=3|COND=4-2CONDCOND=0-1aa-table(COND)aamydata-my,-c(1,11)library(survival)fit-coxph(Surv(TIME,as.numeric(STATUS).,data=mydata)#cox比例风险模型函数plot(survfit(fit)summary(fit)basehaz(fit)#基础风险函数aa-cox

6、.zph(fit)#比例风险假定的检验print(aa)plot(aa6)多重分数多项式模型多重分数多项式模型library(mfp)f-mfp(Surv(TIME,as.numeric(STATUS)fp(AGE,df=4,select=0.05)+INST+SEX+TX+GRADE+COND+SITE+T_STAGE+N_STAGE,select=0.15,family=cox,data=mydata)print(f)(rsq=1-sum(f$residuals)2/sum(mydata$TIME-mean(mydata$TIME)2)#R2SAS程序:程序:proc phreg data

7、=;model=/选项;strata freq;by;Proportionality_test:test;/*比例风险假定,时协变量法*/run;libname ll F:R语言学习COX;data a;set ll.pharynx;run;data a;set a;if cond=9 or grade=9 then delete;if cond=3 or cond=4 then cond=2;if cond=0 then cond=1;run;proc phreg data=a;model time*status(0)=tx cond site t_stage n_stage age gra

8、de inst/selection=stepwise risklimits sle=0.15 sls=0.15;baseline out=cox survival=suv stderr=stderr /method=ch;run;四、Cox模型的适用范围及注意事项1.适用范围适用范围Cox模型适用于生存资料的统计分析,属半参数模型,对模型适用于生存资料的统计分析,属半参数模型,对资料没有特殊的要求,也可以估计各因素的参数,并能资料没有特殊的要求,也可以估计各因素的参数,并能做多因素的统计分析。该模型的主要优点在于能从众多做多因素的统计分析。该模型的主要优点在于能从众多的影响因素中排除混杂因素的

9、影响,找出影响生存时间的影响因素中排除混杂因素的影响,找出影响生存时间的因素,根据各因素的参数估计出个体的生存率。的因素,根据各因素的参数估计出个体的生存率。另外,另外,Cox模型能分析具有截尾数值的生存时间。模型能分析具有截尾数值的生存时间。Cox模型可以分析多种因素对疾病预后的影响,使其更适模型可以分析多种因素对疾病预后的影响,使其更适合于临床的随访研究。合于临床的随访研究。Cox模型使临床观察的定性指标又模型使临床观察的定性指标又加上定量指标进行分析,提高了分析的效率。加上定量指标进行分析,提高了分析的效率。2.注意事项注意事项(1)设计阶段应注意的问题设计阶段应注意的问题 样本的代表性

10、要好。样本的代表性要好。样本的含量为观察协变量的5-20倍。所有危险因素要在设计时考虑全面,避免漏掉重要因素和所有危险因素要在设计时考虑全面,避免漏掉重要因素和加入无关因素。加入无关因素。生存时间的定义要明确。起始事件和终点事件要有明确规生存时间的定义要明确。起始事件和终点事件要有明确规定定,时间尽可能精确测量。时间尽可能精确测量。研究的协变量在研究对象中的分布要适中,否则会给参数研究的协变量在研究对象中的分布要适中,否则会给参数的估计带来困难。的估计带来困难。在设计时要注意影响时间的效应因素。在设计时要注意影响时间的效应因素。如研究吸烟对肺癌患者生存率的影响,若本来吸烟的人因患肺癌而戒烟,则

11、一般模型不易分析吸烟的作用,需考虑吸烟量随时间变化的趋势。如果研究的因素随时间而发生变化,必要时可以采用伴时协变量的Cox模型进行分析。注意事项(2)模型拟合时应注意的问题模型拟合时应注意的问题 多重共线性问题:医学研究中的许多变量间并不是独立的,多重共线性问题:医学研究中的许多变量间并不是独立的,但通常不会影响分析的结果,如果变量间存在高度的相关,但通常不会影响分析的结果,如果变量间存在高度的相关,则会影响则会影响Cox模型的参数估计,此时可采用主成分分析法或模型的参数估计,此时可采用主成分分析法或R型聚类分析法消除多元共线性的影响。型聚类分析法消除多元共线性的影响。应注意应注意Cox模型要

12、求病人的风险函数与基础风险函数呈比例,模型要求病人的风险函数与基础风险函数呈比例,如果这一假定不成立,则不能用如果这一假定不成立,则不能用Cox模型进行分析模型进行分析。注意事项(3)模型应用时应注意的问题模型应用时应注意的问题 结果的解释应结合专业知识。结果的解释应结合专业知识。Cox模型与其他回归分模型与其他回归分析一样,当进入模型中的因素有统计学意义时,该因析一样,当进入模型中的因素有统计学意义时,该因素与生存时间不一定有因果关系,其中有一部分因素素与生存时间不一定有因果关系,其中有一部分因素与生存时间的关系为伴随关系。与生存时间的关系为伴随关系。Cox回归的生存率一般不宜用于不同资料之

13、间的比较,回归的生存率一般不宜用于不同资料之间的比较,因为基准危险率函数只在同一份资料内保持相同,不因为基准危险率函数只在同一份资料内保持相同,不同资料的基准危险率往往不同;而且在多因素分析的同资料的基准危险率往往不同;而且在多因素分析的情况下,协变量组合也很难一致,可比性难以保证。情况下,协变量组合也很难一致,可比性难以保证。3.Cox模型的局限性模型的局限性 Cox模型估计参数时,首先要假定偏似然函数具有最模型估计参数时,首先要假定偏似然函数具有最大似然的性质,这个问题在理论上尚不完善。大似然的性质,这个问题在理论上尚不完善。Cox模型对异常值较为敏感,所以在进行模型配合时模型对异常值较为敏感,所以在进行模型配合时要注意要注意Cox模型拟合优度的检验。模型拟合优度的检验。Cox模型估计参数时,不是利用精确的生存时间,而模型估计参数时,不是利用精确的生存时间,而是利用生存时间的顺序统计量,这损失了一定的样本是利用生存时间的顺序统计量,这损失了一定的样本信息。当引进的协变量随时间的变化剧烈时,偏似然信息。当引进的协变量随时间的变化剧烈时,偏似然函数损失的信息也增多。函数损失的信息也增多。五、扩展的五、扩展的Cox回归模型回归模型1.伴时协变量Cox回归模型2.分层Cox回归模型3.分组数据的Cox回归模型4.多状态Cox回归模型Thank you!

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服