收藏 分销(赏)

生存分析.ppt

上传人:a199****6536 文档编号:1780216 上传时间:2024-05-09 格式:PPT 页数:108 大小:1.60MB
下载 相关 举报
生存分析.ppt_第1页
第1页 / 共108页
生存分析.ppt_第2页
第2页 / 共108页
生存分析.ppt_第3页
第3页 / 共108页
生存分析.ppt_第4页
第4页 / 共108页
生存分析.ppt_第5页
第5页 / 共108页
点击查看更多>>
资源描述

1、生生 存存 分分 析析(Survival Analysis)王王 静静安徽医科大学流行病与卫生统计学系安徽医科大学流行病与卫生统计学系5/6/20241安徽医科大学流统系王静制作例例1:25名恶性肿瘤病人随机分成名恶性肿瘤病人随机分成A(12人)、人)、B(13人)两组,分别采用手术及保守治疗两种方人)两组,分别采用手术及保守治疗两种方案进行治疗,之后随访观察直到案进行治疗,之后随访观察直到25名病人均死亡,名病人均死亡,记录下他们的存活时间(单位:天)。见下表所记录下他们的存活时间(单位:天)。见下表所示。示。5/6/20242安徽医科大学流统系王静制作5/6/20243安徽医科大学流统系王

2、静制作例例2:25名恶性肿瘤病人随机分成名恶性肿瘤病人随机分成A(12人)、人)、B(13人)两组,分别采用手术及保守治疗两种方人)两组,分别采用手术及保守治疗两种方案进行治疗,之后随访观察案进行治疗,之后随访观察10年,记录他们的存年,记录他们的存活、死亡情况。见下表所示。活、死亡情况。见下表所示。5/6/20244安徽医科大学流统系王静制作5/6/20245安徽医科大学流统系王静制作对于例对于例1 1,只比较两组的生存时间长短即可,采用,只比较两组的生存时间长短即可,采用两样本秩和检验。两样本秩和检验。对于例对于例2 2,若比较两组的存活率,可采用两样本卡,若比较两组的存活率,可采用两样本

3、卡方检验;但只考虑了生存效果评价的其中一个方方检验;但只考虑了生存效果评价的其中一个方面。面。而评价生存效果,不仅要看是否出现了某种结局而评价生存效果,不仅要看是否出现了某种结局(如:有效、治愈、死亡等),还要考虑出现这(如:有效、治愈、死亡等),还要考虑出现这些结局所经历的时间长短。(举例说明)些结局所经历的时间长短。(举例说明)5/6/20246安徽医科大学流统系王静制作措施:采用措施:采用生存分析方法。生存分析方法。生存分析方法特点:生存分析方法特点:(1 1)能将研究对象的)能将研究对象的随访结局随访结局和和生存时间生存时间两个因素同时结两个因素同时结合起来考虑的一种统计方法;合起来考

4、虑的一种统计方法;(2 2)能处理失访等不完全数据,充分利用所获得的信息,)能处理失访等不完全数据,充分利用所获得的信息,对生存时间的分布特征进行描述、比较,对影响生存时间对生存时间的分布特征进行描述、比较,对影响生存时间的主要因素进行分析,达到全面评价和比较随访资料的目的主要因素进行分析,达到全面评价和比较随访资料的目的。的。5/6/20247安徽医科大学流统系王静制作生存分析方法的用途:生存分析方法的用途:用于用于随访研究随访研究 (即:观察结果并非在短期内能够确定,(即:观察结果并非在短期内能够确定,而需做长期随访观察,如对一些慢性病或恶而需做长期随访观察,如对一些慢性病或恶性肿瘤的预后

5、及远期疗效观察等)。性肿瘤的预后及远期疗效观察等)。5/6/20248安徽医科大学流统系王静制作随访研究的特点随访研究的特点医学随访研究:医学随访研究:1 1、队列研究、队列研究所有被观察对象同时进入研究;所有被观察对象同时进入研究;2 2、临床随访研究(一般称、临床随访研究(一般称“临床试验临床试验”)被观察对被观察对象逐个进入研究。象逐个进入研究。在大多数研究中,由于受经费和时间的限制,最终观察在大多数研究中,由于受经费和时间的限制,最终观察时点是固定的,而不是无限制延长的,所以容易产生时点是固定的,而不是无限制延长的,所以容易产生截尾值。截尾值。5/6/20249安徽医科大学流统系王静制

6、作截尾值截尾值假设一组肺癌病人手术后,随访记录他们的存活情况,假设一组肺癌病人手术后,随访记录他们的存活情况,死于肺癌是终点。死于肺癌是终点。当观察到规定的时点,除了死于肺癌,还有:当观察到规定的时点,除了死于肺癌,还有:死于其他病、死于其他病、尚活着、尚活着、因迁移等原因失去联系(即失访)因迁移等原因失去联系(即失访),后三者的观察值都未达到终点,不能提供完全的信息,后三者的观察值都未达到终点,不能提供完全的信息,这种不完全数据称为截尾值(这种不完全数据称为截尾值(censoringcensoring)。)。5/6/202410安徽医科大学流统系王静制作 终点事件终点事件 失访失访 研究时间

7、研究时间 观察起点观察起点 观察终点观察终点 队列研究队列研究中的截尾情况中的截尾情况5/6/202411安徽医科大学流统系王静制作 终点事件终点事件 失访失访 研究时间研究时间 观察起点观察起点 观察终点观察终点 临床随访研究临床随访研究中的截尾情况中的截尾情况5/6/202412安徽医科大学流统系王静制作基基 本本 概概 念念5/6/202413安徽医科大学流统系王静制作1 1、生存时间生存时间(survival timesurvival time)(狭义)从发病到死亡所经历的时间;狭义)从发病到死亡所经历的时间;(广义)从某种起始事件到某种终点事件所(广义)从某种起始事件到某种终点事件所

8、经历的时间,又称失效时间经历的时间,又称失效时间(failure(failure time)time),表示为,表示为t t。5/6/202414安徽医科大学流统系王静制作“生存生存”和和“死亡死亡”扩展为具有两类互斥扩展为具有两类互斥结果的事件,结果的事件,“生存生存”是某事件某状态的是某事件某状态的持续,持续,“死亡死亡”是某终点事件的发生。是某终点事件的发生。“生存时间生存时间”扩展为某事件某状态所持续扩展为某事件某状态所持续的时间或过程的时间或过程。5/6/202415安徽医科大学流统系王静制作2 2、起点事件起点事件和和终点事件(终点事件(endpoint eventendpoint

9、 event)终点事件也称为观察结果(终点事件也称为观察结果(outcomeoutcome),是指研),是指研究者关心的研究对象的特定结局,当被观察对究者关心的研究对象的特定结局,当被观察对象出现终点事件通常记为象出现终点事件通常记为1 1,出现截尾记为,出现截尾记为0 0。起点事件是反映研究对象生存过程的起始特征的起点事件是反映研究对象生存过程的起始特征的事件。事件。生存时间的起点和终点要有严格、统一的定义,生存时间的起点和终点要有严格、统一的定义,以便于计算生存时间。以便于计算生存时间。5/6/202416安徽医科大学流统系王静制作3 3、暴露因素暴露因素及及混杂因素混杂因素除了要研究的危

10、险因素(暴露因素)外,还要控除了要研究的危险因素(暴露因素)外,还要控制混杂因素的影响。制混杂因素的影响。必须分清暴露因素和混杂因素。必须分清暴露因素和混杂因素。如:在比较如:在比较A A、B B两种治疗方案治疗某恶性疾病的两种治疗方案治疗某恶性疾病的生存情况的同时,病人的肾功能状况也影响治生存情况的同时,病人的肾功能状况也影响治疗后的生存情况。这项研究中,暴露因素为疗后的生存情况。这项研究中,暴露因素为A A、B B两种治疗方案,混杂因素是肾功能状况。两种治疗方案,混杂因素是肾功能状况。5/6/202417安徽医科大学流统系王静制作随随 访访 资资 料料 的的 特特 点点1 1、生存时间的分

11、布呈偏态。、生存时间的分布呈偏态。一般为正偏态,因为生存时间一般为单调递减。一般为正偏态,因为生存时间一般为单调递减。102102名黑色素瘤患者的生存时间资料,做直方图。名黑色素瘤患者的生存时间资料,做直方图。5/6/202418安徽医科大学流统系王静制作5/6/202419安徽医科大学流统系王静制作5/6/202420安徽医科大学流统系王静制作2 2、数据中常含有截尾值。、数据中常含有截尾值。如如4141+(天),表示该病人至少活了(天),表示该病人至少活了4141天;虽然不天;虽然不知道确切时间,但此类不完全数据包含一定信息,知道确切时间,但此类不完全数据包含一定信息,需要生存分析这特殊方

12、法来利用这些信息。需要生存分析这特殊方法来利用这些信息。组别组别生存时间(天)生存时间(天)A A27 35 4127 35 41+B B99 8099 80+102 102 5/6/202421安徽医科大学流统系王静制作5/6/202422安徽医科大学流统系王静制作生存分析的主要内容生存分析的主要内容及研究方法及研究方法5/6/202423安徽医科大学流统系王静制作 主要内容主要内容 研究方法研究方法1 1、生存过程的描述、生存过程的描述 乘积乘积-极限法(极限法(K Kaplan-aplan-M Meiereier)寿命表法(寿命表法(L Life ife T Tablesables)2

13、2、生存过程的比较生存过程的比较 对数秩检验(对数秩检验(log-ranklog-rank)3 3、影响因素的分析影响因素的分析 CoxCox比例风险模型比例风险模型 5/6/202424安徽医科大学流统系王静制作生存分析对资料中应变量的要求:生存分析对资料中应变量的要求:5/6/202425安徽医科大学流统系王静制作1 1、达到终点的例数所占的比例不能太少,即完全、达到终点的例数所占的比例不能太少,即完全数据占大部分,截尾值所占的比例要数据占大部分,截尾值所占的比例要10%;2 2、截尾原因无偏性;、截尾原因无偏性;3 3、生存时间尽可能精确。、生存时间尽可能精确。5/6/202426安徽医

14、科大学流统系王静制作常常 用用 的的 研研 究究 指指 标标5/6/202427安徽医科大学流统系王静制作1 1、生存函数生存函数(survival functionsurvival function)又称又称累积生存概率累积生存概率(cumulative survival cumulative survival probabilityprobability)、生存率生存率,表示个体生存,表示个体生存时间时间T Tt t的概率。的概率。5/6/202428安徽医科大学流统系王静制作生存概率生存概率与与生存率生存率生存概率生存概率:在:在单位时段单位时段开始存活的个体到该时段结束时仍开始存活的个

15、体到该时段结束时仍存活的可能性,用存活的可能性,用p p表示;表示;生存率生存率:观察个体活过:观察个体活过t t个单位时间的概率,用个单位时间的概率,用S(tS(t)表示。表示。如数据中无截尾值,则生存率计算公式为:如数据中无截尾值,则生存率计算公式为:S(tS(t)=)=生存时间生存时间t t的病人数的病人数 /随访病人总数随访病人总数如有截尾值,则分时段计算不同单位时段的生存概率如有截尾值,则分时段计算不同单位时段的生存概率p p1 1、p p2 2、ppt t,S(tS(t)=p)=p1 1p p2 2p pt t,即,即累积生存概率累积生存概率。5/6/202429安徽医科大学流统系

16、王静制作5/6/202430安徽医科大学流统系王静制作可采用可采用SPSSSPSS软件中生存分析方法计算出生存软件中生存分析方法计算出生存率大小,并画出生存函数图(或生存率曲率大小,并画出生存函数图(或生存率曲线)直接观察。线)直接观察。5/6/202431安徽医科大学流统系王静制作5/6/202432安徽医科大学流统系王静制作5/6/202433安徽医科大学流统系王静制作2 2、半数生存时间半数生存时间(median survival time)(median survival time)又称又称中位生存时间中位生存时间,表示累积生存概率(生存率),表示累积生存概率(生存率)为为50%50%

17、的时候所对应的生存时间;为中位数指的时候所对应的生存时间;为中位数指标,因为生存时间的分布是偏态的。标,因为生存时间的分布是偏态的。在分析结果中给出中位生存时间在分析结果中给出中位生存时间;从生存曲线图中也能估计出相同结果。从生存曲线图中也能估计出相同结果。5/6/202434安徽医科大学流统系王静制作5/6/202435安徽医科大学流统系王静制作3 3、风险函数风险函数(hazard function)(hazard function)又称危险率函数等,一般用又称危险率函数等,一般用h(th(t)表示,表示生存表示,表示生存时间已达时间已达t t的个体在的个体在t t时刻的瞬时风险率;在时刻

18、的瞬时风险率;在CoxCox比例风险模型中风险函数常用比例风险模型中风险函数常用(t)(t)表示。表示。h(t)=h(t)=死于区间(死于区间(t t,t+tt+t)的病人数的病人数 在在t t时刻尚存的病人数时刻尚存的病人数tt t t为极小时间段。为极小时间段。5/6/202436安徽医科大学流统系王静制作5/6/202437安徽医科大学流统系王静制作4 4、风险比风险比(hazard ratiohazard ratio)是指同一时点两组的风险函数之比,即是指同一时点两组的风险函数之比,即相对危险度相对危险度RRRR。风险比风险比=第一组个体的第一组个体的h h1 1(t)(t)第二组个体

19、的第二组个体的h h2 2(t)(t)(1 1)比例风险:风险比与时间无关,即任何时刻,两组比例风险:风险比与时间无关,即任何时刻,两组的风险比值是相等的;的风险比值是相等的;(2 2)非比例风险或时间依赖型:风险比与时间有关。)非比例风险或时间依赖型:风险比与时间有关。5/6/202438安徽医科大学流统系王静制作乘积乘积极限法(极限法(Kaplan-MeierKaplan-Meier)寿命表法(寿命表法(Life tableLife table)AnalyzeSurvival Life tableAnalyzeSurvival Life table、Kaplan-MeierKaplan-M

20、eier用途:用途:1 1、做出生存表、估计生存率,并绘出两组的生存曲、做出生存表、估计生存率,并绘出两组的生存曲线图和风险函数图;线图和风险函数图;2 2、进行两组生存资料的比较。、进行两组生存资料的比较。5/6/202439安徽医科大学流统系王静制作 Life table Kaplan-Meier共同点:共同点:非参数分析方法、一般用于单因素分析非参数分析方法、一般用于单因素分析适用条件适用条件 大样本资料大样本资料 大样本、小样本资料大样本、小样本资料生存表生存表 人为划分各时间段人为划分各时间段 每个时间值为一段每个时间值为一段多组间的生存率比较方法多组间的生存率比较方法 (方法选择途

21、径)(方法选择途径)“Options”对话框对话框 “Compare Factors”对话对话框框5/6/202440安徽医科大学流统系王静制作见下例见下例wordword文档中的数据及对应的文档中的数据及对应的SPSSSPSS数据文件数据文件KM1.savKM1.sav,采用乘积极限法进行分析。,采用乘积极限法进行分析。注意:注意:1)SPSS数据文件格式;数据文件格式;2)SPSS中中乘积极限法的操作过程;乘积极限法的操作过程;3 3)乘积极限法的具体结果解释。)乘积极限法的具体结果解释。5/6/202441安徽医科大学流统系王静制作5/6/202442安徽医科大学流统系王静制作5/6/2

22、02443安徽医科大学流统系王静制作5/6/202444安徽医科大学流统系王静制作5/6/202445安徽医科大学流统系王静制作5/6/202446安徽医科大学流统系王静制作5/6/202447安徽医科大学流统系王静制作5/6/202448安徽医科大学流统系王静制作5/6/202449安徽医科大学流统系王静制作注意事项:注意事项:组间的生存率比较时,要求组间的生存率比较时,要求各组的生存曲线不各组的生存曲线不能交叉能交叉,若出现交叉,提示可能存在混杂因,若出现交叉,提示可能存在混杂因素,应采用多因素方法来校正混杂因素或分素,应采用多因素方法来校正混杂因素或分层做统计分析。层做统计分析。5/6/

23、202450安徽医科大学流统系王静制作采用采用Life table法对某法对某生存数据生存数据进行分析进行分析5/6/202451安徽医科大学流统系王静制作5/6/202452安徽医科大学流统系王静制作5/6/202453安徽医科大学流统系王静制作生存分析中的生存分析中的多因素分析方法多因素分析方法5/6/202454安徽医科大学流统系王静制作5/6/202455安徽医科大学流统系王静制作5/6/202456安徽医科大学流统系王静制作(生存分析方法中单因素与多因素分析的区别)(生存分析方法中单因素与多因素分析的区别)若只比较男、女的生存情况优劣,则可采用前面若只比较男、女的生存情况优劣,则可采

24、用前面所述的单因素分析方法所述的单因素分析方法乘积极限法、寿命乘积极限法、寿命表法。表法。而在实际工作中,研究者关心的影响因素不止一而在实际工作中,研究者关心的影响因素不止一个,如在此例中,除了性别,还有年龄等其他个,如在此例中,除了性别,还有年龄等其他因素。因此,应采用多因素分析方法。因素。因此,应采用多因素分析方法。5/6/202457安徽医科大学流统系王静制作(多元线性回归、多元(多元线性回归、多元logisticlogistic回归与生存分析中多因素回回归与生存分析中多因素回归分析方法的区别)归分析方法的区别)如果仅以生存时间为反应变量做多元线性回归,则生存时间如果仅以生存时间为反应变

25、量做多元线性回归,则生存时间并不一定服从近似正态分布,不满足线性回归的要求;并不一定服从近似正态分布,不满足线性回归的要求;若仅以是否达到终点为反应变量做多元若仅以是否达到终点为反应变量做多元logisticlogistic回归,则未回归,则未能充分利用生存时间长短的信息。能充分利用生存时间长短的信息。而且两者均未考虑到资料中删失数据提供的信息。而且两者均未考虑到资料中删失数据提供的信息。5/6/202458安徽医科大学流统系王静制作解决措施:解决措施:采用生存分析中的多因素回归。采用生存分析中的多因素回归。生存分析中的多因素回归同时以生存时间、结局为生存分析中的多因素回归同时以生存时间、结局

26、为反应变量,有效利用不完全数据提供的信息,从反应变量,有效利用不完全数据提供的信息,从而探索生存的影响因素。而探索生存的影响因素。5/6/202459安徽医科大学流统系王静制作生存分析中的多因素回归包括:生存分析中的多因素回归包括:半参数方法半参数方法:coxcox比例风险模型、非比例风险模型比例风险模型、非比例风险模型参数方法参数方法:指数分布模型、:指数分布模型、WeibullWeibull分布模型、分布模型、GompertzGompertz分布模型、对数正态分布模型、对数分布模型、对数正态分布模型、对数logisticlogistic分布模型,等。分布模型,等。参数方法中均假设生存时间服

27、从某分布,而半参数参数方法中均假设生存时间服从某分布,而半参数方法中不需指定生存时间的分布情况。方法中不需指定生存时间的分布情况。5/6/202460安徽医科大学流统系王静制作Cox 比例风险模型比例风险模型5/6/202461安徽医科大学流统系王静制作适用情况:适用情况:用于分析带有伴随变量的生存时间资料,如:用于分析带有伴随变量的生存时间资料,如:肿瘤和其它慢性病的预后分析,临床疗效评价肿瘤和其它慢性病的预后分析,临床疗效评价和队列研究的病因探索。和队列研究的病因探索。优点:优点:适用条件宽,便于作适用条件宽,便于作多因素分析多因素分析。5/6/202462安徽医科大学流统系王静制作一、一

28、、cox回归模型简介回归模型简介5/6/202463安徽医科大学流统系王静制作1、模、模 型型 结结 构构即即Cox回归,它的一般形式是:回归,它的一般形式是:(t)=0(t)e(1*x1+2*x2+.+m*xm)=0(t)exp(1*x1+2*x2+.+m*xm)5/6/202464安徽医科大学流统系王静制作(t t)表示表示t t时刻暴露于各危险因素(时刻暴露于各危险因素(x x1 1,x x2 2,.x xm m)状态下状态下的风险函数。的风险函数。0 0(t t)为基线风险函数,表示所有的危险因为基线风险函数,表示所有的危险因素状态都为素状态都为0 0情况下的风险函数。情况下的风险函数

29、。(t)/0(t)=exp(1*x1+2*x2+.+m*xm)即:即:ln(t)/0(t)=1*x1+2*x2+.+m*xm将将cox回归与线性回归、回归与线性回归、logistic回归做一比较。回归做一比较。5/6/202465安徽医科大学流统系王静制作0 0(t t)的形式不限,使模型的适用范围如同非参的形式不限,使模型的适用范围如同非参数法那么广;模型中含有参数数法那么广;模型中含有参数,又使得其统,又使得其统计效率接近参数模型。(但参数计效率接近参数模型。(但参数就不能用传就不能用传统的方法进行估计和检验)统的方法进行估计和检验)模型中含有参数模型中含有参数 ,但基线风险函数但基线风险

30、函数0 0(t t)不要求服从特定分布形式,具有非参数的特点不要求服从特定分布形式,具有非参数的特点,故故CoxCox回归又称为回归又称为半参数模型半参数模型。5/6/202466安徽医科大学流统系王静制作英国生物统计学家英国生物统计学家D.R.CoxD.R.Cox于于19721972年建立年建立了条件死亡概率和偏似然函数方法,了条件死亡概率和偏似然函数方法,解决了参数解决了参数的估计和检验问题。故,的估计和检验问题。故,该统计分析方法称为该统计分析方法称为CoxCox模型。模型。5/6/202467安徽医科大学流统系王静制作2 2、参数的统计学意义、参数的统计学意义假设只有一个假设只有一个X

31、 X危险因素,危险因素,0 0为为“不暴露不暴露”,1 1为为“暴露暴露”,模型形式为:,模型形式为:(t t)=)=0 0(t t)exp(exp(*x)*x)X=1X=1时的风险函数为:时的风险函数为:1 1(t t)=)=0 0(t t)exp(exp(*1)*1)X=0X=0时的风险函数为:时的风险函数为:2 2(t t)=)=0 0(t t)exp(exp(*0)*0)1 1(t)(t)、2 2(t)(t)分别表示暴露于危险因素的两种不分别表示暴露于危险因素的两种不同状态下发病的风险函数。同状态下发病的风险函数。5/6/202468安徽医科大学流统系王静制作暴露于危险因素的两种不同状

32、态下发病的风险比即为暴露于危险因素的两种不同状态下发病的风险比即为相对相对危险度危险度RRRR。RRRR=1 1(t)/(t)/2 2(t)(t)=0 0(t t)exp(exp(*1)/*1)/0 0(t t)exp(exp(*0)*0)=exp(exp(*1)/*1)/exp(exp(*0)=exp*0)=exp()RRRR表示表示暴露组与非暴露组的风险函数之比,即:暴露组发暴露组与非暴露组的风险函数之比,即:暴露组发病的风险是非暴露组的病的风险是非暴露组的RRRR倍。倍。回归系数回归系数的流行病学含义是的流行病学含义是0 0、1 1协变量协变量X X的相对危险度的的相对危险度的自然对数自

33、然对数。5/6/202469安徽医科大学流统系王静制作如果如果X X为连续性变量为连续性变量年龄(岁),则年龄(岁),则1 1(t)(t)、2 2(t)(t)分分别表示别表示k k岁、岁、k+1k+1岁的两种不同状态下发病的风险函数。岁的两种不同状态下发病的风险函数。RR RR=1 1(t)/(t)/2 2(t)(t)=0 0(t t)exp(*)exp(*(k+1k+1))/)/0 0(t t)exp(exp(*k)*k)=exp(exp(*(k+1k+1)/exp(exp(*k)=exp*k)=exp():X X每增加一个单位时其相对危险度的自然对数值。每增加一个单位时其相对危险度的自然对

34、数值。RRRR表示表示某危险因素(或协变量)改变一个测量单位时风险函某危险因素(或协变量)改变一个测量单位时风险函数改变多少倍。数改变多少倍。5/6/202470安徽医科大学流统系王静制作当当0 0,说明相应协变量值的增加将增大所研究,说明相应协变量值的增加将增大所研究事件发生的可能性;事件发生的可能性;当当0 0,相应协变量值的增加将减少所研究事件,相应协变量值的增加将减少所研究事件发生的可能性;发生的可能性;当当=0 0,相应协变量与所研究事件的发生无关。,相应协变量与所研究事件的发生无关。5/6/202471安徽医科大学流统系王静制作3 3、模型假设、模型假设满足比例风险(满足比例风险(

35、proportional hazardsproportional hazards)假定,)假定,简称简称PHPH假定假定。即:相对危险度。即:相对危险度RRRR或风险比保持或风险比保持一个恒定的比例,与时间一个恒定的比例,与时间t t无关。无关。5/6/202472安徽医科大学流统系王静制作CoxCox回归无须对回归无须对0 0(t t)的形式作任何限制,因为不的形式作任何限制,因为不影响各危险因素相对危险度的估计,而相对危险影响各危险因素相对危险度的估计,而相对危险度正是多因素分析时最关注的问题。度正是多因素分析时最关注的问题。coxcox模型巧妙地将非参数模型巧妙地将非参数0 0(t t)

36、部分与参数部分与参数(回归系数(回归系数)的概念结合起来,这种灵活性使)的概念结合起来,这种灵活性使得它在生存分析的应用中备受青睐。得它在生存分析的应用中备受青睐。5/6/202473安徽医科大学流统系王静制作比值比比值比OR可以作为相对危险度可以作为相对危险度RR的估计值。的估计值。5/6/202474安徽医科大学流统系王静制作比例风险假设的检验:比例风险假设的检验:可分组(若为可分组(若为0 0、1 1两组)做两组)做二次对数生存率图(二次对数生存率图(Log Log minus Logminus Log,LMLLML),),进行目测判断,若两条曲线有进行目测判断,若两条曲线有交叉或间距变

37、动大,则提示风险比随时间而改变,交叉或间距变动大,则提示风险比随时间而改变,不具备不具备coxcox比例风险模型的适用性;反之,则资料适比例风险模型的适用性;反之,则资料适宜用宜用coxcox比例风险模型。比例风险模型。5/6/202475安徽医科大学流统系王静制作5/6/202476安徽医科大学流统系王静制作4 4、协变量的筛选策略、协变量的筛选策略与其他回归模型类似,如果协变量个数较多,则与其他回归模型类似,如果协变量个数较多,则通常采用逐步法。通常采用逐步法。5/6/202477安徽医科大学流统系王静制作二、二、coxcox回归模型的分析步骤及回归模型的分析步骤及主要结果主要结果5/6/

38、202478安徽医科大学流统系王静制作SPSSSPSS中的程序为:中的程序为:AnalyzeSurvival Cox RegressionAnalyzeSurvival Cox Regression将将coxcox回归的对话框与线性回归、回归的对话框与线性回归、Kaplan-Kaplan-MeierMeier、Life tableLife table做比较。见做比较。见文件文件cox1.savcox1.sav5/6/202479安徽医科大学流统系王静制作示例:评价示例:评价A A、B B两治疗方案对某病的治疗效果。两治疗方案对某病的治疗效果。A A组(组(group=0group=0)1212

39、人,人,B B组(组(group=1group=1)1313人;人;肾功能正常者为肾功能正常者为0 0,不正常者为,不正常者为1 1。应变量是治疗后的生存时间和观察结果(达到终应变量是治疗后的生存时间和观察结果(达到终点还是截尾值);点还是截尾值);groupgroup是研究因素是研究因素x x1 1,肾功能是混杂因素肾功能是混杂因素x x2 2。5/6/202480安徽医科大学流统系王静制作注意事项注意事项一般情况下,截尾值设为一般情况下,截尾值设为0 0,完全数据(即出现终,完全数据(即出现终点事件)为点事件)为1 1;但在具体资料中,没有限制,只;但在具体资料中,没有限制,只要能有两个分

40、别表示完全数据和截尾的数值,结要能有两个分别表示完全数据和截尾的数值,结果不受影响。果不受影响。但是一旦设定后,分析时,但是一旦设定后,分析时,“Status”Status”对话框中的对话框中的终点事件值一定要和资料中吻合,否则结果错误。终点事件值一定要和资料中吻合,否则结果错误。5/6/202481安徽医科大学流统系王静制作SPSSSPSS分析结果如下:分析结果如下:第一步、求第一步、求Cox Cox 比例风险模型比例风险模型5/6/202482安徽医科大学流统系王静制作5/6/202483安徽医科大学流统系王静制作(t t)=)=0 0(t t)e e(1.2431.243group+4.

41、105kidney group+4.105kidney)=0 0(t t)exp(1.243group+4.105kidney)exp(1.243group+4.105kidney)groupgroup、kidneykidney的的P P值分别为值分别为0.0380.038、0.0000.000,均均0.050.05,说明不同治疗方案及肾功能对病,说明不同治疗方案及肾功能对病人的生存有影响。人的生存有影响。5/6/202484安徽医科大学流统系王静制作groupgroup、kidneykidney的的OROR值分别为值分别为3.4663.466、60.67060.670,均大,均大于于1 1,

42、说明接受,说明接受B B治疗方案的病人死亡的风险是接治疗方案的病人死亡的风险是接受受A A治疗方案者的治疗方案者的3.4663.466倍、肾功能不正常的病人倍、肾功能不正常的病人死亡的风险是肾功能正常者的死亡的风险是肾功能正常者的60.67060.670倍。倍。5/6/202485安徽医科大学流统系王静制作第二步、由模型可求出不同状态下的相对第二步、由模型可求出不同状态下的相对危险度危险度RRRR值值5/6/202486安徽医科大学流统系王静制作1、肾功能正常者肾功能正常者接受接受B治疗方案比接受治疗方案比接受A治疗方案治疗方案在某时刻死亡的相对危险度为:在某时刻死亡的相对危险度为:RR=0(

43、t)e(1.243*1+4.105*0)0(t)e(1.243*0+4.105*0)=3.4665/6/202487安徽医科大学流统系王静制作2 2、肾功能不正常者肾功能不正常者接受接受B B治疗方案比接受治疗方案比接受A A治疗治疗方案方案在某时刻死亡的相对危险度为:在某时刻死亡的相对危险度为:RR=RR=0 0(t t)e)e(1.2431.243*1+4.105*1*1+4.105*1)0 0(t t)e)e(1.2431.243*0+4.105*1*0+4.105*1)=3.466 =3.4665/6/202488安徽医科大学流统系王静制作3 3、肾功能不正常者接受肾功能不正常者接受B

44、 B治疗方案治疗方案,比,比肾功能正常者肾功能正常者接受接受A A治疗方案治疗方案在某时刻死亡的相对危险度为:在某时刻死亡的相对危险度为:RR=RR=0 0(t t)e)e(1.2431.243*1+4.105*1*1+4.105*1)0 0(t t)e)e(1.2431.243*0+4.105*0*0+4.105*0)=210.300 =210.300可见在可见在CoxCox模型的建立中没有估计基线风险模型的建立中没有估计基线风险0 0(t t);在危险因素的在危险因素的RRRR分析中也没有涉及基线风险。分析中也没有涉及基线风险。所估计的风险比与时间无关。所估计的风险比与时间无关。5/6/2

45、02489安徽医科大学流统系王静制作第三步、画出风险函数曲线第三步、画出风险函数曲线5/6/202490安徽医科大学流统系王静制作5/6/202491安徽医科大学流统系王静制作第四步、画出第四步、画出二次对数生存率图二次对数生存率图(Log minus LogLog minus Log,LMLLML)从从LML图中,目测判断图中,目测判断PH假设是否成立。假设是否成立。5/6/202492安徽医科大学流统系王静制作5/6/202493安徽医科大学流统系王静制作目的目的:探讨影响胃癌患者长期生存的预后因素。探讨影响胃癌患者长期生存的预后因素。方法方法:采用采用CoxCox比例风险模型比例风险模型

46、对可能影响胃癌患者预后的对可能影响胃癌患者预后的1111项项临床病理参数进行单因素和多因素回归分析。临床病理参数进行单因素和多因素回归分析。结果结果:Cox:Cox单因素回归分析表明胃癌的分化程度、浸润深度、单因素回归分析表明胃癌的分化程度、浸润深度、淋巴结转移数、脉管内是否有癌栓、临床分期、肿瘤直径、淋巴结转移数、脉管内是否有癌栓、临床分期、肿瘤直径、淋巴细胞浸润量与胃癌的预后有关淋巴细胞浸润量与胃癌的预后有关(P P 0.05),0.05)0.05)。但经但经CoxCox多因素回归分析多因素回归分析,只有肿瘤的直径、脉管内是否有癌只有肿瘤的直径、脉管内是否有癌栓、淋巴细胞浸润量具有独立的预

47、后意义栓、淋巴细胞浸润量具有独立的预后意义(P P 0.05)0.05)。结论结论:肿块大小、脉管内是否有癌栓及局部淋巴细胞浸润量可肿块大小、脉管内是否有癌栓及局部淋巴细胞浸润量可以作为评估胃癌患者预后的独立指标以作为评估胃癌患者预后的独立指标,从而指导胃癌的治疗。从而指导胃癌的治疗。5/6/202494安徽医科大学流统系王静制作5/6/202495安徽医科大学流统系王静制作5/6/202496安徽医科大学流统系王静制作5/6/202497安徽医科大学流统系王静制作5/6/202498安徽医科大学流统系王静制作5/6/202499安徽医科大学流统系王静制作三、应用三、应用coxcox回归模型的

48、注意事项回归模型的注意事项1.1.对应变量的要求(前已阐述);对应变量的要求(前已阐述);2.2.自变量的编码;自变量的编码;3.Cox3.Cox回归必须满足回归必须满足PHPH假设;假设;4.4.建模策略。建模策略。5/6/2024100安徽医科大学流统系王静制作coxcox非比例风险非比例风险模型模型5/6/2024101安徽医科大学流统系王静制作即为即为含时依协变量的含时依协变量的模型模型。时依协变量:效应大小随时间而变化的协变量。时依协变量:效应大小随时间而变化的协变量。模型为:模型为:(t t)=)=0 0(t t)exp*x+)exp*x+x(x(t t)若若 无统计学意义,则该协

49、变量不是无统计学意义,则该协变量不是时依协变量,转时依协变量,转做前面的比例风险做前面的比例风险coxcox模型;反之,则必须引入该时模型;反之,则必须引入该时依协变量。(依协变量。(提示:此模型可用来考察实际资料是否提示:此模型可用来考察实际资料是否满足比例风险模型满足比例风险模型)5/6/2024102安徽医科大学流统系王静制作生存分析中的参数法生存分析中的参数法:分别指定风险函数的形式。分别指定风险函数的形式。5/6/2024103安徽医科大学流统系王静制作指数回归模型中的风险函数指数回归模型中的风险函数h(th(t)分布形式:分布形式:h(th(t)与时间与时间t t无关无关5/6/2

50、024104安徽医科大学流统系王静制作WeibullWeibull回归模型中的风险函数回归模型中的风险函数h(th(t)分布形式分布形式5/6/2024105安徽医科大学流统系王静制作对数正态分布回归模型中的风险函数对数正态分布回归模型中的风险函数h(th(t)分布形式分布形式5/6/2024106安徽医科大学流统系王静制作Log-logisticLog-logistic分布回归模型中的风险函数分布回归模型中的风险函数h(th(t)分布形式分布形式5/6/2024107安徽医科大学流统系王静制作GompertzGompertz分布回归模型中的风险函数分布回归模型中的风险函数h(th(t)分布形

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服