1、生存分析与生存分析与cox回归回归2024/5/24 周五周五生存分析与生存分析与Cox回归回归2生存分析与生存分析与生存分析与生存分析与CoxCox回归回归回归回归生存资料概述生存资料概述生存资料概述生存资料概述生存分析的基本概念生存分析的基本概念生存分析的基本概念生存分析的基本概念生存资料的统计描述生存资料的统计描述生存资料的统计描述生存资料的统计描述生存曲线的比较生存曲线的比较生存曲线的比较生存曲线的比较CoxCox回归回归回归回归2024/5/24 周五周五生存分析与生存分析与Cox回归回归3一、生存资料概述一、生存资料概述一、生存资料概述一、生存资料概述 举例举例举例举例 某医师分别
2、用中药、西药各治疗急性肝炎病人某医师分别用中药、西药各治疗急性肝炎病人4040例,结果如下表,试问:哪种药物的治疗效果好?例,结果如下表,试问:哪种药物的治疗效果好?2024/5/24 周五周五生存分析与生存分析与Cox回归回归4一、生存资料概述一、生存资料概述一、生存资料概述一、生存资料概述随访研究随访研究随访研究随访研究 (follow up)(follow up)是医学研究中常用的设计方法是医学研究中常用的设计方法是医学研究中常用的设计方法是医学研究中常用的设计方法随访研究不仅要考虑观察对象的结局,还要考虑出现结随访研究不仅要考虑观察对象的结局,还要考虑出现结随访研究不仅要考虑观察对象的
3、结局,还要考虑出现结随访研究不仅要考虑观察对象的结局,还要考虑出现结局所经历的时间局所经历的时间局所经历的时间局所经历的时间这类这类这类这类(既要考虑结局又要考虑结局出现的时间既要考虑结局又要考虑结局出现的时间既要考虑结局又要考虑结局出现的时间既要考虑结局又要考虑结局出现的时间)资料称为资料称为资料称为资料称为生存资料生存资料生存资料生存资料 (survival data)(survival data)生存分析生存分析生存分析生存分析(survival analysis)(survival analysis)是将观察的结局和出现结局是将观察的结局和出现结局是将观察的结局和出现结局是将观察的结局
4、和出现结局所经历的的时间结合起来进行分析的统计方法。所经历的的时间结合起来进行分析的统计方法。所经历的的时间结合起来进行分析的统计方法。所经历的的时间结合起来进行分析的统计方法。2024/5/24 周五周五生存分析与生存分析与Cox回归回归5一、生存资料概述一、生存资料概述一、生存资料概述一、生存资料概述医学随访研究一般有两种医学随访研究一般有两种医学随访研究一般有两种医学随访研究一般有两种所有研究对象同时进入研究所有研究对象同时进入研究所有研究对象同时进入研究所有研究对象同时进入研究(观察起始时间相同观察起始时间相同观察起始时间相同观察起始时间相同)例如,队列研究、动物的随访观察例如,队列研
5、究、动物的随访观察例如,队列研究、动物的随访观察例如,队列研究、动物的随访观察被研究对象逐个进入研究被研究对象逐个进入研究被研究对象逐个进入研究被研究对象逐个进入研究(观察起始时间不同观察起始时间不同观察起始时间不同观察起始时间不同)例如,临床随访研究例如,临床随访研究例如,临床随访研究例如,临床随访研究由于受经费和时间的限制,最终观察时间不能无限延长由于受经费和时间的限制,最终观察时间不能无限延长由于受经费和时间的限制,最终观察时间不能无限延长由于受经费和时间的限制,最终观察时间不能无限延长2024/5/24 周五周五生存分析与生存分析与Cox回归回归81.1.基本概念基本概念基本概念基本概
6、念 起始事件与终点事件起始事件与终点事件起始事件与终点事件起始事件与终点事件起始事件起始事件起始事件起始事件反映研究对象生存过程的起始特征事件。反映研究对象生存过程的起始特征事件。反映研究对象生存过程的起始特征事件。反映研究对象生存过程的起始特征事件。终点事件终点事件终点事件终点事件(outcome event)(outcome event)又称失效事件又称失效事件又称失效事件又称失效事件(failure event)(failure event)或死亡事件或死亡事件或死亡事件或死亡事件(death event)(death event)终点事件终点事件终点事件终点事件研究者所关心的研究对象的
7、特定结局,可以研究者所关心的研究对象的特定结局,可以研究者所关心的研究对象的特定结局,可以研究者所关心的研究对象的特定结局,可以标志某种处理措施失败或失效的特征事件标志某种处理措施失败或失效的特征事件标志某种处理措施失败或失效的特征事件标志某种处理措施失败或失效的特征事件起始事件和终点事件是由研究目的决定的,在设计时就起始事件和终点事件是由研究目的决定的,在设计时就起始事件和终点事件是由研究目的决定的,在设计时就起始事件和终点事件是由研究目的决定的,在设计时就明确规定,并在研究期间严格遵守不能随意改变明确规定,并在研究期间严格遵守不能随意改变明确规定,并在研究期间严格遵守不能随意改变明确规定,
8、并在研究期间严格遵守不能随意改变2024/5/24 周五周五生存分析与生存分析与Cox回归回归91.1.基本概念基本概念基本概念基本概念 举例举例举例举例 说明下列研究的起始事件与终点事件说明下列研究的起始事件与终点事件说明下列研究的起始事件与终点事件说明下列研究的起始事件与终点事件急性白血病患者进行骨髓移植后以是否复发来评价骨急性白血病患者进行骨髓移植后以是否复发来评价骨急性白血病患者进行骨髓移植后以是否复发来评价骨急性白血病患者进行骨髓移植后以是否复发来评价骨髓移植效果髓移植效果髓移植效果髓移植效果职业性铅中毒的危险因素职业性铅中毒的危险因素职业性铅中毒的危险因素职业性铅中毒的危险因素(开
9、始职业性接触至出现铅开始职业性接触至出现铅开始职业性接触至出现铅开始职业性接触至出现铅中毒症状中毒症状中毒症状中毒症状)冠心病患者两次发病的时间间隔冠心病患者两次发病的时间间隔冠心病患者两次发病的时间间隔冠心病患者两次发病的时间间隔大肠癌患者手术后存活情况大肠癌患者手术后存活情况大肠癌患者手术后存活情况大肠癌患者手术后存活情况(手术、死亡手术、死亡手术、死亡手术、死亡)接受健康教育对青少年戒烟到复吸的影响因素分析接受健康教育对青少年戒烟到复吸的影响因素分析接受健康教育对青少年戒烟到复吸的影响因素分析接受健康教育对青少年戒烟到复吸的影响因素分析接受某种保险方式后的中途退保分析接受某种保险方式后的
10、中途退保分析接受某种保险方式后的中途退保分析接受某种保险方式后的中途退保分析2024/5/24 周五周五生存分析与生存分析与Cox回归回归101.1.基本概念基本概念基本概念基本概念 生存时间生存时间生存时间生存时间(survival time)(survival time)或失效时间或失效时间或失效时间或失效时间(failure time)(failure time)生存时间指观察到的存活时间生存时间指观察到的存活时间生存时间指观察到的存活时间生存时间指观察到的存活时间常用符号常用符号常用符号常用符号 t t 表示表示表示表示生存时间是生存分析中的重要信息,必须准确生存时间是生存分析中的重要
11、信息,必须准确生存时间是生存分析中的重要信息,必须准确生存时间是生存分析中的重要信息,必须准确明确规定起始事件、终点事件明确规定起始事件、终点事件明确规定起始事件、终点事件明确规定起始事件、终点事件时间的测度单位时间的测度单位时间的测度单位时间的测度单位(年、月、日年、月、日年、月、日年、月、日)2024/5/24 周五周五生存分析与生存分析与Cox回归回归111.1.基本概念基本概念基本概念基本概念 整个研究的观察时间整个研究的观察时间整个研究的观察时间整个研究的观察时间研究开始到研究结束的时间研究开始到研究结束的时间研究开始到研究结束的时间研究开始到研究结束的时间因为有起始事件发生时间、终
12、点事件发生时间、观察开因为有起始事件发生时间、终点事件发生时间、观察开因为有起始事件发生时间、终点事件发生时间、观察开因为有起始事件发生时间、终点事件发生时间、观察开始时间、观察结束时间,生存资料数据分为完全数据始时间、观察结束时间,生存资料数据分为完全数据始时间、观察结束时间,生存资料数据分为完全数据始时间、观察结束时间,生存资料数据分为完全数据(complete datacomplete data)和截尾数据和截尾数据和截尾数据和截尾数据(censored data)(censored data)2024/5/24 周五周五生存分析与生存分析与Cox回归回归121.1.基本概念基本概念基本
13、概念基本概念完全数据:指从观察起点到发生死亡事件所经历的时间,完全数据:指从观察起点到发生死亡事件所经历的时间,完全数据:指从观察起点到发生死亡事件所经历的时间,完全数据:指从观察起点到发生死亡事件所经历的时间,生存时间是完整确切的。生存时间是完整确切的。生存时间是完整确切的。生存时间是完整确切的。截尾数据或截尾值截尾数据或截尾值截尾数据或截尾值截尾数据或截尾值(censored value)(censored value),又称删失值或终检,又称删失值或终检,又称删失值或终检,又称删失值或终检值。值。值。值。生存时间观察过程的截止不是由于死亡生存时间观察过程的截止不是由于死亡生存时间观察过程
14、的截止不是由于死亡生存时间观察过程的截止不是由于死亡/终点事件,而终点事件,而终点事件,而终点事件,而是由于其他原因引起的,称为截尾是由于其他原因引起的,称为截尾是由于其他原因引起的,称为截尾是由于其他原因引起的,称为截尾(censored)(censored)从观察起点到截尾时点所经历的生存时间称为截尾数据,从观察起点到截尾时点所经历的生存时间称为截尾数据,从观察起点到截尾时点所经历的生存时间称为截尾数据,从观察起点到截尾时点所经历的生存时间称为截尾数据,习惯上在生存时间右上角标注习惯上在生存时间右上角标注习惯上在生存时间右上角标注习惯上在生存时间右上角标注“”表示表示表示表示2024/5/
15、24 周五周五生存分析与生存分析与Cox回归回归131.1.基本概念基本概念基本概念基本概念 截尾的主要原因:截尾的主要原因:截尾的主要原因:截尾的主要原因:失访失访失访失访(withdrawal):(withdrawal):失去联系,如信访无回音、电话采失去联系,如信访无回音、电话采失去联系,如信访无回音、电话采失去联系,如信访无回音、电话采访不应答、上门采访找不到人、搬迁没留地址等访不应答、上门采访找不到人、搬迁没留地址等访不应答、上门采访找不到人、搬迁没留地址等访不应答、上门采访找不到人、搬迁没留地址等 退出退出退出退出:死于非研究因素或非处理因素而退出研究,如死死于非研究因素或非处理因
16、素而退出研究,如死死于非研究因素或非处理因素而退出研究,如死死于非研究因素或非处理因素而退出研究,如死于意外或其他疾病于意外或其他疾病于意外或其他疾病于意外或其他疾病 终止终止终止终止:设计时规定的研究时限已到而终止观察,但研究设计时规定的研究时限已到而终止观察,但研究设计时规定的研究时限已到而终止观察,但研究设计时规定的研究时限已到而终止观察,但研究对象仍然存活对象仍然存活对象仍然存活对象仍然存活2024/5/24 周五周五生存分析与生存分析与Cox回归回归161.1.基本概念基本概念基本概念基本概念完全数据提供了观察对象确切的生存时间,是生存分析完全数据提供了观察对象确切的生存时间,是生存
17、分析完全数据提供了观察对象确切的生存时间,是生存分析完全数据提供了观察对象确切的生存时间,是生存分析的主要依据;的主要依据;的主要依据;的主要依据;截尾数据仅提供了部分信息,研究者并不知道观察对象截尾数据仅提供了部分信息,研究者并不知道观察对象截尾数据仅提供了部分信息,研究者并不知道观察对象截尾数据仅提供了部分信息,研究者并不知道观察对象确切的生存时间。截尾数据太多会影响生存分析的效果确切的生存时间。截尾数据太多会影响生存分析的效果确切的生存时间。截尾数据太多会影响生存分析的效果确切的生存时间。截尾数据太多会影响生存分析的效果那么截尾数据能不能删除?那么截尾数据能不能删除?那么截尾数据能不能删
18、除?那么截尾数据能不能删除?2024/5/24 周五周五生存分析与生存分析与Cox回归回归171.1.基本概念基本概念基本概念基本概念 对生存资料的两种错误分析对生存资料的两种错误分析对生存资料的两种错误分析对生存资料的两种错误分析抛弃抛弃抛弃抛弃截尾截尾截尾截尾数据,只考虑确切数据数据,只考虑确切数据数据,只考虑确切数据数据,只考虑确切数据 损失样本含量、损失了信息,截尾数据提供部分信息,损失样本含量、损失了信息,截尾数据提供部分信息,损失样本含量、损失了信息,截尾数据提供部分信息,损失样本含量、损失了信息,截尾数据提供部分信息,说明在某时刻之前仍存活说明在某时刻之前仍存活说明在某时刻之前仍
19、存活说明在某时刻之前仍存活将将将将截尾截尾截尾截尾数据当作确切数据处理数据当作确切数据处理数据当作确切数据处理数据当作确切数据处理 低估了生存时间的平均水平,截尾数据中存在生存时低估了生存时间的平均水平,截尾数据中存在生存时低估了生存时间的平均水平,截尾数据中存在生存时低估了生存时间的平均水平,截尾数据中存在生存时间较长的数据,如果损失,会使结果产生偏性间较长的数据,如果损失,会使结果产生偏性间较长的数据,如果损失,会使结果产生偏性间较长的数据,如果损失,会使结果产生偏性2024/5/24 周五周五生存分析与生存分析与Cox回归回归181.1.基本概念基本概念基本概念基本概念对截尾数据进行分析
20、是生存分析的重要特点,在生存分对截尾数据进行分析是生存分析的重要特点,在生存分对截尾数据进行分析是生存分析的重要特点,在生存分对截尾数据进行分析是生存分析的重要特点,在生存分析中,结局变量常以析中,结局变量常以析中,结局变量常以析中,结局变量常以1 1表示出现结局,表示出现结局,表示出现结局,表示出现结局,0 0表示截尾。表示截尾。表示截尾。表示截尾。应变量有应变量有应变量有应变量有2 2个个个个:生存时间生存时间生存时间生存时间 t t 和结局变量和结局变量和结局变量和结局变量(0-1)(0-1)2024/5/24 周五周五生存分析与生存分析与Cox回归回归192.2.生存资料的特点生存资料
21、的特点生存资料的特点生存资料的特点 蕴涵有结局和时间两个方面的信息;蕴涵有结局和时间两个方面的信息;蕴涵有结局和时间两个方面的信息;蕴涵有结局和时间两个方面的信息;结局为两分类互斥事件;结局为两分类互斥事件;结局为两分类互斥事件;结局为两分类互斥事件;一般是通过随访收集得到,随访观察往往是从某统一一般是通过随访收集得到,随访观察往往是从某统一一般是通过随访收集得到,随访观察往往是从某统一一般是通过随访收集得到,随访观察往往是从某统一时间点时间点时间点时间点(如确诊、入院或实施手术等某种处理措施后如确诊、入院或实施手术等某种处理措施后如确诊、入院或实施手术等某种处理措施后如确诊、入院或实施手术等
22、某种处理措施后)开开开开始,观察到某规定时间点截止;始,观察到某规定时间点截止;始,观察到某规定时间点截止;始,观察到某规定时间点截止;常因失访等原因造成某些研究对象的生存时间数据不常因失访等原因造成某些研究对象的生存时间数据不常因失访等原因造成某些研究对象的生存时间数据不常因失访等原因造成某些研究对象的生存时间数据不完整;完整;完整;完整;分布类型复杂,需用生存分析分布类型复杂,需用生存分析分布类型复杂,需用生存分析分布类型复杂,需用生存分析2024/5/24 周五周五生存分析与生存分析与Cox回归回归203.3.生存资料的数据形式生存资料的数据形式生存资料的数据形式生存资料的数据形式202
23、4/5/24 周五周五生存分析与生存分析与Cox回归回归214.4.生存分析的基本内容生存分析的基本内容生存分析的基本内容生存分析的基本内容 描述生存过程:研究生存时间的分布特点,估计生描述生存过程:研究生存时间的分布特点,估计生描述生存过程:研究生存时间的分布特点,估计生描述生存过程:研究生存时间的分布特点,估计生存率及其标准误、绘制生存曲线等。存率及其标准误、绘制生存曲线等。存率及其标准误、绘制生存曲线等。存率及其标准误、绘制生存曲线等。例如,根据乳腺癌患者手术后的生存资料,可以估计例如,根据乳腺癌患者手术后的生存资料,可以估计例如,根据乳腺癌患者手术后的生存资料,可以估计例如,根据乳腺癌
24、患者手术后的生存资料,可以估计不同时间点的生存率及其标准误,如不同时间点的生存率及其标准误,如不同时间点的生存率及其标准误,如不同时间点的生存率及其标准误,如1 1年生存率、年生存率、年生存率、年生存率、3 3年生年生年生年生存率、存率、存率、存率、5 5年生存率等,还可以绘制生存曲线,观察乳腺年生存率等,还可以绘制生存曲线,观察乳腺年生存率等,还可以绘制生存曲线,观察乳腺年生存率等,还可以绘制生存曲线,观察乳腺癌患者手术后的生存过程。癌患者手术后的生存过程。癌患者手术后的生存过程。癌患者手术后的生存过程。常用方法有乘积极限法和寿命表法。常用方法有乘积极限法和寿命表法。常用方法有乘积极限法和寿
25、命表法。常用方法有乘积极限法和寿命表法。2024/5/24 周五周五生存分析与生存分析与Cox回归回归224.4.生存分析的基本内容生存分析的基本内容生存分析的基本内容生存分析的基本内容 比较生存过程:获得生存率及其标准误的估计值后,比较生存过程:获得生存率及其标准误的估计值后,比较生存过程:获得生存率及其标准误的估计值后,比较生存过程:获得生存率及其标准误的估计值后,可进行两组或多组生存曲线可进行两组或多组生存曲线可进行两组或多组生存曲线可进行两组或多组生存曲线(生存过程生存过程生存过程生存过程)的比较。的比较。的比较。的比较。例如,比较两种不同治疗措施治疗恶性肿瘤患者的生例如,比较两种不同
26、治疗措施治疗恶性肿瘤患者的生例如,比较两种不同治疗措施治疗恶性肿瘤患者的生例如,比较两种不同治疗措施治疗恶性肿瘤患者的生存曲线,可了解哪种治疗措施较优,从而为临床决策提存曲线,可了解哪种治疗措施较优,从而为临床决策提存曲线,可了解哪种治疗措施较优,从而为临床决策提存曲线,可了解哪种治疗措施较优,从而为临床决策提供依据。常用方法有对数秩检验。供依据。常用方法有对数秩检验。供依据。常用方法有对数秩检验。供依据。常用方法有对数秩检验。2024/5/24 周五周五生存分析与生存分析与Cox回归回归234.4.生存分析的基本内容生存分析的基本内容生存分析的基本内容生存分析的基本内容 生存过程的影响因素分
27、析生存过程的影响因素分析生存过程的影响因素分析生存过程的影响因素分析 例如,为了改善鼻咽癌患者的预后,应先了解可能影例如,为了改善鼻咽癌患者的预后,应先了解可能影例如,为了改善鼻咽癌患者的预后,应先了解可能影例如,为了改善鼻咽癌患者的预后,应先了解可能影响患者预后的因素,如年龄、病程、病情、术前健康状响患者预后的因素,如年龄、病程、病情、术前健康状响患者预后的因素,如年龄、病程、病情、术前健康状响患者预后的因素,如年龄、病程、病情、术前健康状况、有无淋巴结转移、术后有无感染、辅助治疗措施、况、有无淋巴结转移、术后有无感染、辅助治疗措施、况、有无淋巴结转移、术后有无感染、辅助治疗措施、况、有无淋
28、巴结转移、术后有无感染、辅助治疗措施、营养状况等,通过随访收集患者术后的生存时间和上述营养状况等,通过随访收集患者术后的生存时间和上述营养状况等,通过随访收集患者术后的生存时间和上述营养状况等,通过随访收集患者术后的生存时间和上述因素的资料,然后采用多因素生存分析方法确定影响患因素的资料,然后采用多因素生存分析方法确定影响患因素的资料,然后采用多因素生存分析方法确定影响患因素的资料,然后采用多因素生存分析方法确定影响患者预后的主要因素,从而为在手术前后进行预防或干预者预后的主要因素,从而为在手术前后进行预防或干预者预后的主要因素,从而为在手术前后进行预防或干预者预后的主要因素,从而为在手术前后
29、进行预防或干预提供参考依据。提供参考依据。提供参考依据。提供参考依据。常用的多因素生存分析方法:常用的多因素生存分析方法:常用的多因素生存分析方法:常用的多因素生存分析方法:CoxCox比例风险回归模型比例风险回归模型比例风险回归模型比例风险回归模型2024/5/24 周五周五生存分析与生存分析与Cox回归回归24生存分析的基本方法生存分析的基本方法生存分析的基本方法生存分析的基本方法统计描述统计描述统计描述统计描述统计指标统计指标统计指标统计指标:生存率、中位生存时间生存率、中位生存时间生存率、中位生存时间生存率、中位生存时间列表和绘图列表和绘图列表和绘图列表和绘图:生存曲线生存曲线生存曲线
30、生存曲线统计推断统计推断统计推断统计推断参数法:指数分布、威布尔分布等参数法:指数分布、威布尔分布等参数法:指数分布、威布尔分布等参数法:指数分布、威布尔分布等非参数法:非参数法:非参数法:非参数法:log-ranklog-rank检验检验检验检验(单因素分析单因素分析单因素分析单因素分析)半参数法:半参数法:半参数法:半参数法:CoxCox回归回归回归回归(多因素分析多因素分析多因素分析多因素分析)2024/5/24 周五周五生存分析与生存分析与Cox回归回归25二、生存资料的统计描述二、生存资料的统计描述二、生存资料的统计描述二、生存资料的统计描述生存率及其标准误生存率及其标准误生存率及其
31、标准误生存率及其标准误中位生存期中位生存期中位生存期中位生存期生存曲线生存曲线生存曲线生存曲线2024/5/24 周五周五生存分析与生存分析与Cox回归回归26基基基基 本本本本 概概概概 念念念念2024/5/24 周五周五生存分析与生存分析与Cox回归回归27基基基基 本本本本 概概概概 念念念念2024/5/24 周五周五生存分析与生存分析与Cox回归回归28基基基基 本本本本 概概概概 念念念念2024/5/24 周五周五生存分析与生存分析与Cox回归回归29基基基基 本本本本 概概概概 念念念念2024/5/24 周五周五生存分析与生存分析与Cox回归回归30基基基基 本本本本 概概
32、概概 念念念念2024/5/24 周五周五生存分析与生存分析与Cox回归回归31基基基基 本本本本 概概概概 念念念念2024/5/24 周五周五生存分析与生存分析与Cox回归回归32常常常常 用用用用 方方方方 法法法法乘积极限法乘积极限法乘积极限法乘积极限法 (product-limit method)(product-limit method)也称为也称为也称为也称为-法法法法(Kaplan-Meier(Kaplan-Meier法法法法)小样本资料或大样本未分段小样本资料或大样本未分段小样本资料或大样本未分段小样本资料或大样本未分段(未按时间分组未按时间分组未按时间分组未按时间分组)资料
33、资料资料资料寿命表法寿命表法寿命表法寿命表法 (life table method)(life table method)大样本分段大样本分段大样本分段大样本分段 (按时间分组按时间分组按时间分组按时间分组)资料资料资料资料2024/5/24 周五周五生存分析与生存分析与Cox回归回归331.1.未分组资料未分组资料未分组资料未分组资料 (乘积极限法乘积极限法乘积极限法乘积极限法/Kaplan-Meier/Kaplan-Meier法法法法)2024/5/24 周五周五生存分析与生存分析与Cox回归回归362.2.分组资料分组资料分组资料分组资料(寿命表法寿命表法寿命表法寿命表法 life-ta
34、ble methodlife-table method)中位生存期为中位生存期为2.3生存资料的统计描述生存资料的统计描述生存资料的统计描述生存资料的统计描述SPSSSPSS实现实现实现实现例例例例1 1生存资料的统计描述生存资料的统计描述生存资料的统计描述生存资料的统计描述SPSSSPSS实现实现实现实现例例例例2 22024/5/24 周五周五生存分析与生存分析与Cox回归回归45三、生存曲线比较三、生存曲线比较三、生存曲线比较三、生存曲线比较 (单因素分析单因素分析单因素分析单因素分析)2024/5/24 周五周五生存分析与生存分析与Cox回归回归46 对上例进行分析时两种错误的做法:对
35、上例进行分析时两种错误的做法:错误错误错误错误1 1:采用平均生存时间而不是采用平均生存时间而不是中位生存时间中位生存时间中位生存时间中位生存时间来表示来表示生存时间的平均水平。生存时间的平均水平。错误错误错误错误2 2:采用常规采用常规t t检验或方差分析进行组间比较。检验或方差分析进行组间比较。2024/5/24 周五周五生存分析与生存分析与Cox回归回归48三、生存曲线比较三、生存曲线比较三、生存曲线比较三、生存曲线比较 (单因素分析单因素分析单因素分析单因素分析)2024/5/24 周五周五生存分析与生存分析与Cox回归回归49三、生存曲线比较三、生存曲线比较三、生存曲线比较三、生存曲
36、线比较 (单因素分析单因素分析单因素分析单因素分析)2024/5/24 周五周五生存分析与生存分析与Cox回归回归52 生存资料分析的基本要求生存资料分析的基本要求生存资料分析的基本要求生存资料分析的基本要求样本应由随机抽样得到,要保证一定的样本含量样本应由随机抽样得到,要保证一定的样本含量样本应由随机抽样得到,要保证一定的样本含量样本应由随机抽样得到,要保证一定的样本含量死亡例数不宜太少死亡例数不宜太少死亡例数不宜太少死亡例数不宜太少截尾例数不宜太多截尾例数不宜太多截尾例数不宜太多截尾例数不宜太多生存时间应尽可能精确生存时间应尽可能精确生存时间应尽可能精确生存时间应尽可能精确2024/5/2
37、4 周五周五生存分析与生存分析与Cox回归回归53对数秩检验对数秩检验(log-rank)(log-rank)注意事项注意事项属于单因素分析方法,适用于两组及多组间的比较属于单因素分析方法,适用于两组及多组间的比较属于单因素分析方法,适用于两组及多组间的比较属于单因素分析方法,适用于两组及多组间的比较可用于时间未分组的资料,也可用于时间分组资料可用于时间未分组的资料,也可用于时间分组资料可用于时间未分组的资料,也可用于时间分组资料可用于时间未分组的资料,也可用于时间分组资料各组间生存时间的比较根据各组生存曲线的高低及中位生存时各组间生存时间的比较根据各组生存曲线的高低及中位生存时各组间生存时间
38、的比较根据各组生存曲线的高低及中位生存时各组间生存时间的比较根据各组生存曲线的高低及中位生存时间判断间判断间判断间判断需满足生存资料的基本要求,且各样本生存曲线不能交叉需满足生存资料的基本要求,且各样本生存曲线不能交叉需满足生存资料的基本要求,且各样本生存曲线不能交叉需满足生存资料的基本要求,且各样本生存曲线不能交叉生存曲线若出现交叉,则提示可能存在混杂因素,应采用分层生存曲线若出现交叉,则提示可能存在混杂因素,应采用分层生存曲线若出现交叉,则提示可能存在混杂因素,应采用分层生存曲线若出现交叉,则提示可能存在混杂因素,应采用分层对数秩检验或对数秩检验或对数秩检验或对数秩检验或CoxCox比例风
39、险回归模型进行分析比例风险回归模型进行分析比例风险回归模型进行分析比例风险回归模型进行分析生存曲线比较生存曲线比较生存曲线比较生存曲线比较SPSSSPSS实现实现实现实现例例例例3 32024/5/24 周五周五生存分析与生存分析与Cox回归回归56四、四、四、四、CoxCox回归回归回归回归对对对对生生生生存存存存时时时时间间间间资资资资料料料料进进进进行行行行单单单单因因因因素素素素分分分分析析析析(log-rank(log-rank检检检检验验验验)时时时时,要要要要求求求求各各各各对对对对比比比比组组组组在在在在非非非非处处处处理理理理因因因因素素素素方方方方面面面面均均均均衡衡衡衡可
40、可可可比比比比,而而而而实实实实际际际际工工工工作作作作中中中中却却却却很很很很难难难难做做做做到到到到;很很很很多多多多因因因因素素素素会会会会对对对对生生生生存存存存时时时时间间间间产产产产生生生生影影影影响响响响,需需需需用多因素分析方法。用多因素分析方法。用多因素分析方法。用多因素分析方法。CoxCox回回回回 归归归归 也也也也 称称称称 比比比比 例例例例 风风风风 险险险险 模模模模 型型型型(Proportional(Proportional hazards hazards model)model)是对生存资料进行多因素分析常用的统计方法是对生存资料进行多因素分析常用的统计方法
41、是对生存资料进行多因素分析常用的统计方法是对生存资料进行多因素分析常用的统计方法2024/5/24 周五周五生存分析与生存分析与Cox回归回归57四、四、四、四、CoxCox回归回归回归回归CoxCox回归模型的一般形式回归模型的一般形式回归模型的一般形式回归模型的一般形式回归系数的解释回归系数的解释回归系数的解释回归系数的解释CoxCox回归应用条件回归应用条件回归应用条件回归应用条件回归系数的估计及假设检验回归系数的估计及假设检验回归系数的估计及假设检验回归系数的估计及假设检验CoxCox回归分析应注意的问题回归分析应注意的问题回归分析应注意的问题回归分析应注意的问题2024/5/24 周
42、五周五生存分析与生存分析与Cox回归回归581.Cox1.Cox回归模型的一般形式回归模型的一般形式回归模型的一般形式回归模型的一般形式2024/5/24 周五周五生存分析与生存分析与Cox回归回归601.Cox1.Cox回归模型的一般形式回归模型的一般形式回归模型的一般形式回归模型的一般形式2024/5/24 周五周五生存分析与生存分析与Cox回归回归612.2.回归系数的解释回归系数的解释回归系数的解释回归系数的解释相对危险度相对危险度相对危险度相对危险度 RRRR:两个风险函数两个风险函数两个风险函数两个风险函数(率率率率)之比之比之比之比 (风险比风险比风险比风险比)当当当当X Xi
43、i为有无某危险因素时为有无某危险因素时为有无某危险因素时为有无某危险因素时(0-1(0-1变量变量变量变量)2024/5/24 周五周五生存分析与生存分析与Cox回归回归622.2.回归系数的解释回归系数的解释回归系数的解释回归系数的解释在其他自变量固定不变时,自变量在其他自变量固定不变时,自变量在其他自变量固定不变时,自变量在其他自变量固定不变时,自变量X Xi i每改变一个单位,每改变一个单位,每改变一个单位,每改变一个单位,得到的相对危险度得到的相对危险度得到的相对危险度得到的相对危险度RRRR的对数值。的对数值。的对数值。的对数值。RRRR=exp(=exp()0,0,RRRR 1 1
44、 危险因素危险因素危险因素危险因素 0,0,RRRR 1 1 无作用无作用无作用无作用 0,0,RRRR 1 1 保护因素保护因素保护因素保护因素RRRR的解释与自变量的编码有关的解释与自变量的编码有关的解释与自变量的编码有关的解释与自变量的编码有关2024/5/24 周五周五生存分析与生存分析与Cox回归回归653.Cox3.Cox回归应用条件回归应用条件回归应用条件回归应用条件独立性独立性独立性独立性等比例风险等比例风险等比例风险等比例风险风险比与时间无关,为常数风险比与时间无关,为常数风险比与时间无关,为常数风险比与时间无关,为常数自变量的取值及作用大小不随时间变化而变化自变量的取值及作
45、用大小不随时间变化而变化自变量的取值及作用大小不随时间变化而变化自变量的取值及作用大小不随时间变化而变化 例:在研究例:在研究例:在研究例:在研究1010中,有糖尿病的发生心脏病的风险始终中,有糖尿病的发生心脏病的风险始终中,有糖尿病的发生心脏病的风险始终中,有糖尿病的发生心脏病的风险始终是无糖尿病的是无糖尿病的是无糖尿病的是无糖尿病的3 3倍。倍。倍。倍。对数线性:自变量与对数风险比呈线性关系对数线性:自变量与对数风险比呈线性关系对数线性:自变量与对数风险比呈线性关系对数线性:自变量与对数风险比呈线性关系 2024/5/24 周五周五生存分析与生存分析与Cox回归回归694.4.回归系数估计
46、及假设检验回归系数估计及假设检验回归系数估计及假设检验回归系数估计及假设检验回归系数的估计回归系数的估计回归系数的估计回归系数的估计极大似然法极大似然法极大似然法极大似然法(偏似然函数偏似然函数偏似然函数偏似然函数)假设检验方法假设检验方法假设检验方法假设检验方法似然比检验似然比检验似然比检验似然比检验WaldWald卡方检验卡方检验卡方检验卡方检验ScoreScore比分检验比分检验比分检验比分检验借助统计软件估计回归系数,进行假设检验借助统计软件估计回归系数,进行假设检验借助统计软件估计回归系数,进行假设检验借助统计软件估计回归系数,进行假设检验对对对对 SPSSSPSS软件:软件:软件:
47、软件:Analyze/Survival/Cox RegressionAnalyze/Survival/Cox Regression2024/5/24 周五周五生存分析与生存分析与Cox回归回归705.Cox5.Cox回归分析应注意的问题回归分析应注意的问题回归分析应注意的问题回归分析应注意的问题等比例风险的假定等比例风险的假定等比例风险的假定等比例风险的假定影响因素影响因素影响因素影响因素(协变量协变量协变量协变量)各水平的生存曲线无交叉各水平的生存曲线无交叉各水平的生存曲线无交叉各水平的生存曲线无交叉协变量与时间交互项无统计学意义协变量与时间交互项无统计学意义协变量与时间交互项无统计学意义协
48、变量与时间交互项无统计学意义回归系数解释、变量赋值与编码、假设检验、建模策略回归系数解释、变量赋值与编码、假设检验、建模策略回归系数解释、变量赋值与编码、假设检验、建模策略回归系数解释、变量赋值与编码、假设检验、建模策略等与等与等与等与logisticlogistic回归类似回归类似回归类似回归类似样本含量估计样本含量估计样本含量估计样本含量估计注意时依协变量注意时依协变量注意时依协变量注意时依协变量CoxCox模型模型模型模型CoxCox回归分析回归分析回归分析回归分析SPSSSPSS实现实现实现实现例例例例8.88.8CoxCox回归分析回归分析回归分析回归分析SPSSSPSS实现实现实现
49、实现例例例例8.78.72024/5/24 周五周五生存分析与生存分析与Cox回归回归74上海市青浦区上海市青浦区上海市青浦区上海市青浦区2002 2008 2002 2008 年新发胃癌年新发胃癌年新发胃癌年新发胃癌患者队列生存分析患者队列生存分析患者队列生存分析患者队列生存分析牙齿缺失对食管癌的生存分析牙齿缺失对食管癌的生存分析牙齿缺失对食管癌的生存分析牙齿缺失对食管癌的生存分析2024/5/24 周五周五生存分析与生存分析与Cox回归回归81小小小小 结结结结生存资料的特点生存资料的特点生存资料的特点生存资料的特点生存资料统计描述方法生存资料统计描述方法生存资料统计描述方法生存资料统计描述方法非参数的假设检验:非参数的假设检验:非参数的假设检验:非参数的假设检验:单因素分析单因素分析单因素分析单因素分析log-ranklog-rank检验检验检验检验多因素分析多因素分析多因素分析多因素分析CoxCox回归回归回归回归