1、单击此处编辑母版文本样式,第二级,*,生存分析与,Cox,回归,*,单击此处编辑母版标题样式,生存分析与,Cox,回归,流行病与卫生统计学教研室,曹明芹,生存分析与,Cox,回归,生存资料概述,生存分析的基本概念,生存资料的统计描述,生存曲线的比较,Cox,回归,2025/3/6 周四,2,生存分析与,Cox,回归,一、生存资料概述,举例,某医师分别用中药、西药各治疗急性肝炎病人40例,结果如下表,试问:哪种药物的治疗效果好?,2025/3/6 周四,3,生存分析与,Cox,回归,一、生存资料概述,随访研究,(follow up),是医学研究中常用的设计方法,随访研究不仅要考虑观察对象的结局,
2、还要考虑出现结局所经历的时间,这类,(,既要考虑结局又要考虑结局出现的时间,),资料称为生存资料,(survival data),生存分析,(survival analysis),是将观察的结局和出现结局所经历的的时间结合起来进行分析的统计方法。,2025/3/6 周四,4,生存分析与,Cox,回归,一、生存资料概述,医学随访研究一般有两种,所有研究对象同时进入研究,(,观察起始时间相同,),例如,队列研究、动物的随访观察,被研究对象逐个进入研究,(,观察起始时间不同,),例如,临床随访研究,由于受经费和时间的限制,最终观察时间不能无限延长,2025/3/6 周四,5,生存分析与,Cox,回归
3、2025/3/6 周四,6,生存分析与,Cox,回归,2025/3/6 周四,7,生存分析与,Cox,回归,1.,基本概念,起始事件与终点事件,起始事件,反映研究对象生存过程的起始特征事件。,终点事件,(outcome event),又称失效事件,(failure event),或死亡事件,(death event),终点事件,研究者所关心的研究对象的特定结局,可以标志某种处理措施失败或失效的特征事件,起始事件和终点事件是由研究目的决定的,在设计时就明确规定,并在研究期间严格遵守不能随意改变,2025/3/6 周四,8,生存分析与,Cox,回归,1.,基本概念,举例 说明下列研究的起始事件与
4、终点事件,急性白血病患者进行骨髓移植后以是否复发来评价骨髓移植效果,职业性铅中毒的危险因素,(,开始职业性接触至出现铅中毒症状,),冠心病患者两次发病的时间间隔,大肠癌患者手术后存活情况,(,手术、死亡,),接受健康教育对青少年戒烟到复吸的影响因素分析,接受某种保险方式后的中途退保分析,2025/3/6 周四,9,生存分析与,Cox,回归,1.,基本概念,生存时间,(survival time),或失效时间,(failure time),生存时间指观察到的存活时间,常用符号,t,表示,生存时间是生存分析中的重要信息,必须准确,明确规定起始事件、终点事件,时间的测度单位,(,年、月、日,),20
5、25/3/6 周四,10,生存分析与,Cox,回归,1.,基本概念,整个研究的观察时间,研究开始到研究结束的时间,因为有起始事件发生时间、终点事件发生时间、观察开始时间、观察结束时间,生存资料数据分为完全数据,(,complete data,),和截尾数据,(censored data),2025/3/6 周四,11,生存分析与,Cox,回归,1.,基本概念,完全数据:指从观察起点到发生死亡事件所经历的时间,生存时间是完整确切的。,截尾数据或截尾值,(censored value),,又称删失值或终检值。,生存时间观察过程的截止不是由于死亡,/,终点事件,而是由于其他原因引起的,称为截尾,(c
6、ensored),从观察起点到截尾时点所经历的生存时间称为截尾数据,习惯上在生存时间右上角标注“”表示,2025/3/6 周四,12,生存分析与,Cox,回归,1.,基本概念,截尾的主要原因:,失访,(withdrawal):,失去联系,如信访无回音、电话采访不应答、上门采访找不到人、搬迁没留地址等,退出,:,死于非研究因素或非处理因素而退出研究,如死于意外或其他疾病,终止,:,设计时规定的研究时限已到而终止观察,但研究对象仍然存活,2025/3/6 周四,13,生存分析与,Cox,回归,2025/3/6 周四,14,生存分析与,Cox,回归,2025/3/6 周四,15,生存分析与,Cox,
7、回归,1.,基本概念,完全数据提供了观察对象确切的生存时间,是生存分析的主要依据;,截尾数据仅提供了部分信息,研究者并不知道观察对象确切的生存时间。截尾数据太多会影响生存分析的效果,那么截尾数据能不能删除?,2025/3/6 周四,16,生存分析与,Cox,回归,1.,基本概念,对生存资料的两种错误分析,抛弃,截尾,数据,只考虑确切数据,损失样本含量、损失了信息,截尾数据提供部分信息,说明在某时刻之前仍存活,将,截尾,数据当作确切数据处理,低估了生存时间的平均水平,截尾数据中存在生存时间较长的数据,如果损失,会使结果产生偏性,2025/3/6 周四,17,生存分析与,Cox,回归,1.,基本概
8、念,对截尾数据进行分析是生存分析的重要特点,在生存分析中,结局变量常以1表示出现结局,0表示截尾。,应变量有,2,个,:,生存时间,t,和结局变量,(0-1),2025/3/6 周四,18,生存分析与,Cox,回归,2.,生存资料的特点,蕴涵有结局和时间两个方面的信息;,结局为两分类互斥事件;,一般是通过随访收集得到,随访观察往往是从某统一时间点,(,如确诊、入院或实施手术等某种处理措施后,),开始,观察到某规定时间点截止;,常因失访等原因造成某些研究对象的生存时间数据不完整;,分布类型复杂,需用生存分析,2025/3/6 周四,19,生存分析与,Cox,回归,3.,生存资料的数据形式,202
9、5/3/6 周四,20,生存分析与,Cox,回归,4.,生存分析的基本内容,描述生存过程:研究生存时间的分布特点,估计生存率及其标准误、绘制生存曲线等。,例如,根据乳腺癌患者手术后的生存资料,可以估计不同时间点的生存率及其标准误,如,1,年生存率、,3,年生存率、,5,年生存率等,还可以绘制生存曲线,观察乳腺癌患者手术后的生存过程。,常用方法有乘积极限法和寿命表法。,2025/3/6 周四,21,生存分析与,Cox,回归,4.,生存分析的基本内容,比较生存过程:获得生存率及其标准误的估计值后,可进行两组或多组生存曲线,(,生存过程,),的比较。,例如,比较两种不同治疗措施治疗恶性肿瘤患者的生存
10、曲线,可了解哪种治疗措施较优,从而为临床决策提供依据。常用方法有对数秩检验。,2025/3/6 周四,22,生存分析与,Cox,回归,4.,生存分析的基本内容,生存过程的影响因素分析,例如,为了改善鼻咽癌患者的预后,应先了解可能影响患者预后的因素,如年龄、病程、病情、术前健康状况、有无淋巴结转移、术后有无感染、辅助治疗措施、营养状况等,通过随访收集患者术后的生存时间和上述因素的资料,然后采用多因素生存分析方法确定影响患者预后的主要因素,从而为在手术前后进行预防或干预提供参考依据。,常用的多因素生存分析方法:,Cox,比例风险回归模型,2025/3/6 周四,23,生存分析与,Cox,回归,生存
11、分析的基本方法,统计描述,统计指标,:,生存率、中位生存时间,列表和绘图,:,生存曲线,统计推断,参数法:指数分布、威布尔分布等,非参数法:,log-rank,检验,(,单因素分析,),半参数法:,Cox,回归,(,多因素分析,),2025/3/6 周四,24,生存分析与,Cox,回归,二、生存资料的统计描述,生存率及其标准误,中位生存期,生存曲线,2025/3/6 周四,25,生存分析与,Cox,回归,基 本 概 念,2025/3/6 周四,26,生存分析与,Cox,回归,基 本 概 念,2025/3/6 周四,27,生存分析与,Cox,回归,基 本 概 念,2025/3/6 周四,28,生
12、存分析与,Cox,回归,基 本 概 念,2025/3/6 周四,29,生存分析与,Cox,回归,基 本 概 念,2025/3/6 周四,30,生存分析与,Cox,回归,基 本 概 念,2025/3/6 周四,31,生存分析与,Cox,回归,常 用 方 法,乘积极限法,(product-limit method),也称为-法,(Kaplan-Meier,法,),小样本资料或大样本未分段,(,未按时间分组,),资料,寿命表法,(life table method),大样本分段,(,按时间分组,),资料,2025/3/6 周四,32,生存分析与,Cox,回归,1.,未分组资料,(,乘积极限法,/Ka
13、plan-Meier,法,),2025/3/6 周四,33,生存分析与,Cox,回归,2025/3/6 周四,34,生存分析与,Cox,回归,2025/3/6 周四,35,生存分析与,Cox,回归,2.,分组资料,(,寿命表法,life-table method,),2025/3/6 周四,36,生存分析与,Cox,回归,2025/3/6 周四,37,生存分析与,Cox,回归,中位生存期为,2.3,2025/3/6 周四,38,生存分析与,Cox,回归,生存资料的统计描述,SPSS,实现,例,1,2025/3/6 周四,39,生存分析与,Cox,回归,2025/3/6 周四,40,生存分析与,
14、Cox,回归,2025/3/6 周四,41,生存分析与,Cox,回归,生存资料的统计描述,SPSS,实现,例,2,2025/3/6 周四,42,生存分析与,Cox,回归,2025/3/6 周四,43,生存分析与,Cox,回归,2025/3/6 周四,44,生存分析与,Cox,回归,三、生存曲线比较,(,单因素分析,),2025/3/6 周四,45,生存分析与,Cox,回归,对上例进行分析时两种错误的做法:,错误,1,:,采用平均生存时间而不是,中位生存时间,来表示生存时间的平均水平。,错误,2,:,采用常规,t,检验或方差分析进行组间比较。,2025/3/6 周四,46,生存分析与,Cox,回
15、归,2025/3/6 周四,47,生存分析与,Cox,回归,三、生存曲线比较,(,单因素分析,),2025/3/6 周四,48,生存分析与,Cox,回归,三、生存曲线比较,(,单因素分析,),2025/3/6 周四,49,生存分析与,Cox,回归,2025/3/6 周四,50,生存分析与,Cox,回归,2025/3/6 周四,51,生存分析与,Cox,回归,生存资料分析的基本要求,样本应由随机抽样得到,要保证一定的样本含量,死亡例数不宜太少,截尾例数不宜太多,生存时间应尽可能精确,2025/3/6 周四,52,生存分析与,Cox,回归,对数秩检验,(log-rank),注意事项,属于单因素分析
16、方法,适用于两组及多组间的比较,可用于时间未分组的资料,也可用于时间分组资料,各组间生存时间的比较根据各组生存曲线的高低及中位生存时间判断,需满足生存资料的基本要求,且各样本生存曲线不能交叉,生存曲线若出现交叉,则提示可能存在混杂因素,应采用分层对数秩检验或,Cox,比例风险回归模型进行分析,2025/3/6 周四,53,生存分析与,Cox,回归,生存曲线比较,SPSS,实现,例,3,2025/3/6 周四,54,生存分析与,Cox,回归,2025/3/6 周四,55,生存分析与,Cox,回归,四、,Cox,回归,对生存时间资料进行单因素分析,(log-rank,检验,),时,要求各对比组在非
17、处理因素方面均衡可比,而实际工作中却很难做到;很多因素会对生存时间产生影响,需用多因素分析方法。,Cox,回归也称比例风险模型,(Proportional hazards model),是对生存资料进行多因素分析常用的统计方法,2025/3/6 周四,56,生存分析与,Cox,回归,四、,Cox,回归,Cox,回归模型的一般形式,回归系数的解释,Cox,回归应用条件,回归系数的估计及假设检验,Cox,回归分析应注意的问题,2025/3/6 周四,57,生存分析与,Cox,回归,1.Cox,回归模型的一般形式,2025/3/6 周四,58,生存分析与,Cox,回归,2025/3/6 周四,59,
18、生存分析与,Cox,回归,1.Cox,回归模型的一般形式,2025/3/6 周四,60,生存分析与,Cox,回归,2.,回归系数的解释,相对危险度,RR,:,两个风险函数,(,率,),之比,(,风险比,),当,X,i,为有无某危险因素时,(0-1,变量,),2025/3/6 周四,61,生存分析与,Cox,回归,2.,回归系数的解释,在其他自变量固定不变时,自变量,X,i,每改变一个单位,得到的相对危险度,RR,的对数值。,RR,=exp(,),0,RR,1,危险因素,0,RR,1,无作用,0,RR,1,保护因素,RR,的解释与自变量的编码有关,2025/3/6 周四,62,生存分析与,Cox
19、回归,2025/3/6 周四,63,生存分析与,Cox,回归,2025/3/6 周四,64,生存分析与,Cox,回归,3.Cox,回归应用条件,独立性,等比例风险,风险比与时间无关,为常数,自变量的取值及作用大小不随时间变化而变化,例:在研究10中,有糖尿病的发生心脏病的风险始终是无糖尿病的3倍。,对数线性:自变量与对数风险比呈线性关系,2025/3/6 周四,65,生存分析与,Cox,回归,2025/3/6 周四,66,生存分析与,Cox,回归,2025/3/6 周四,67,生存分析与,Cox,回归,2025/3/6 周四,68,生存分析与,Cox,回归,4.,回归系数估计及假设检验,回归
20、系数的估计,极大似然法,(,偏似然函数,),假设检验方法,似然比检验,Wald,卡方检验,Score,比分检验,借助统计软件估计回归系数,进行假设检验,对,SPSS,软件:,Analyze/Survival/Cox Regression,2025/3/6 周四,69,生存分析与,Cox,回归,5.Cox,回归分析应注意的问题,等比例风险的假定,影响因素,(,协变量,),各水平的生存曲线无交叉,协变量与时间交互项无统计学意义,回归系数解释、变量赋值与编码、假设检验、建模策略等与,logistic,回归类似,样本含量估计,注意时依协变量,Cox,模型,2025/3/6 周四,70,生存分析与,Co
21、x,回归,Cox,回归分析,SPSS,实现,例,8.8,2025/3/6 周四,71,生存分析与,Cox,回归,Cox,回归分析,SPSS,实现,例,8.7,2025/3/6 周四,72,生存分析与,Cox,回归,2025/3/6 周四,73,生存分析与,Cox,回归,上海市青浦区,2002 2008,年新发胃癌患者队列生存分析,2025/3/6 周四,74,生存分析与,Cox,回归,2025/3/6 周四,75,生存分析与,Cox,回归,2025/3/6 周四,76,生存分析与,Cox,回归,牙齿缺失对食管癌的生存分析,2025/3/6 周四,77,生存分析与,Cox,回归,2025/3/6 周四,78,生存分析与,Cox,回归,2025/3/6 周四,79,生存分析与,Cox,回归,2025/3/6 周四,80,生存分析与,Cox,回归,小 结,生存资料的特点,生存资料统计描述方法,非参数的假设检验:,单因素分析,log-rank,检验,多因素分析,Cox,回归,2025/3/6 周四,81,生存分析与,Cox,回归,






