资源描述
生存分析生存分析 在临床医学中,对病人治疗效果的考查.一方面可以看治疗结局的好坏,另一方面还可以通过治疗时间的长短来衡量。例如某癌症病人手术后的存活时间,某种疾病治愈的时间 等,把这类与时间有关的资料统称为生存资料。“生存生存”的概念的概念生物生存生物生存与死亡与死亡电脑始使正常与出现故障疾病产生与治愈疾病治愈与复发阴性与阳性三个要点 一、起始事件一、起始事件二、终点事件二、终点事件三、生存时间三、生存时间 起始事件 随访时间 终点事件 疾病确诊 死亡 治疗开始死亡治疗开始痊愈接触危险物出现反映随访资料的记录生存资料一般通过随访收集,从某标准时刻(发病、手术或出院等)开始,按某种相等或不等时间间隔,对观察对象定期观察预定项目所得。它的结局是死亡,治愈、复发、阳性等。记录的项目通常包括开始观察日期,终止观察日期,处理方法,及协变量等。9例某癌症病人的随访记录病号 性别 开始日期 终止日期 结局 方法 01 男 08/31/82 10/01/89 死亡 手术 02 男 09/26/82 08/28/96 生存 手术 03 女 10/30/83 03/31/90 死亡 非手术 04 男 12/01/84 10/01/87 死亡 非手术 05 女 01/01/84 10/01/88 失访 手术 06 男 07/01/85 10/01/88 死亡 手术 07 男 08/31/87 12/30/90 退出 手术 08 女 07/11/86 12/17/90 死亡 手术 09 男 08/31/86 10/01/90 死亡 非手术 在临床上,往往由于某种原因致使在一定时期内,一部分病例得不到确切的生存期,主要有下列原因:(1)因迁移原因失去联系;(2)死于其他原因而造成失访;(3)因客观原因中途退出;(4)预定终止结果迟迟不发生;但它们提供了其生存期长于观察期的信息,这种数据为不完全数据。称为删失数据,也称截尾数据或终检值。截尾数据或终检值(censored data)生存分析的基本概念生存分析的基本概念l1、生存时间(survival time)l 生存时间指观察到的存活时间,包括完全数据和删失数据。l(1)完全数据是从进入观察到规定的结局出现所经历的时间,即病人存活时间。l(2)删失数据(censor time)是从进入观察到删失点所经历的时间,(3)结果变量(outcome)或终检变量(censor)结果变量记录预定的结果是否发生。变量的数据化方法CHISS规定对结果变量赋值,完全数据为0,删失数据为1。9例某癌症病人随访记录的数据库 n sex time outcome treat 1 1 7 0 1 2 1 14 1 1 3 0 6 0 0 4 1 3 0 0 5 0 4 1 1 6 1 3 0 1 7 1 3 1 1 8 0 4 0 1 9 1 4 0 0截尾数据的统计处理 在实际工作中,很多医学工作者将失访或中止等原因造成的删失数据抛弃掉。这样做不仅损失了大量信息,而且也不太科学。例某研究者追踪100名癌症患者,经治疗后的生存情况,随访第1年有30人死亡,随访第2年时,有20人死亡,有40人无法联系失访。试估计其生存率。法一:去掉截尾数据法二:不去掉截尾数据总例数N=60N=100l生存数生存率生存数生存率1年3030/60=50%7070/100=70%2、死亡概率 死亡概率是指死于某时段内的可能性大小.记为q。年死亡概率计算公式为 某年内死亡数q 某年年初人口数 若年内有删失,则分母用校正人口数,校正人口数年初人口数校正人口数年初人口数 1/2 删失数删失数3、生存概率 生存概率表示在某单位时段开始时存活的个体到该时段 结束时仍存活的可能性大小,记为p。年生存概率计算公式为 活满某一年人数p 1q 某年年初人口数 若年内有删失,则分母用校正人口数。4 4 、生存率与生存函数生存率与生存函数 生存率是生存率是从起点开始活到一定时间的概从起点开始活到一定时间的概率。率。亦即亦即研究对象存活时间长于时间研究对象存活时间长于时间t t的概的概率,它是时间率,它是时间t t的函数,记为的函数,记为S(t)S(t)亦称生亦称生存函数存函数 。例如例如s(1),s(3),s(5)s(1),s(3),s(5)表示一年、三年、五表示一年、三年、五年的生存率。若年的生存率。若S(5)0.18表示5年之后仍有18的病人存活。设病人在各个时段生存概率为pj,j1,2,,则各个生存概率pj的乘积为生存率:S(t)pjtjt生存率与生存概率的关系生存率与生存概率的关系例 今调查100例癌症患者的五年内生存状况如下表,试求各年的死亡概率、生存概率和生存率 时间 死亡 期初 死 亡 生 存 生存率 人数 人数 概 率 概 率 一年 20 二年 40 三年 30?五年 8 1平均生存时间生存时间的平均数(当有删失数据时,求不出)2 半半数数生存期即寿命的中位数表示有且只有50的个体可活这么长时间5 5、相关的统计量相关的统计量例5名癌症患者存活时间(月)610142020n=5平均生存时间平均生存时间,mean=185102030+50+n=7 中位生存时间中位生存时间median=20+表示尚生存78+253550?当截尾较早时,不能直接求当截尾较早时,不能直接求出半数生存期,出半数生存期,这时,可用生存这时,可用生存函数公式或生存曲线图,令生存函数公式或生存曲线图,令生存率等于率等于50%,然后反推时间。,然后反推时间。生存分析的主要内容生存分析的主要内容生存过程的描述 研究生存时间的分布特点,估计生存率,生存曲线;研究生存时间的分布特点,估计生存率,生存曲线;生存过程的比较对两组或多组生存率进行比较;对两组或多组生存率进行比较;影响因素的分析了解影响生存过程的主要因素为改善预后提供指导了解影响生存过程的主要因素为改善预后提供指导。常用的有两种方法:乘积极限法 (小样本时)(小样本时)l l寿命表寿命表法法 (大样本时)(大样本时)l12.1 生存率的估计生存率的估计1乘积极限法乘积极限法 又称Kaplan-Meier 法适用于小样本资料。基本思想:将生存时间由小到大依次排列,在每个死亡点上,计算其期初人数、死亡人数、死亡概率、生存概率和生存率。生存率的标准误生存率的标准误:生存率的生存率的95%可信区间可信区间:S(ti)1.96 SES(ti)2 CHISS实现实现点击 重复测量重复测量生存分析生存分析乘积极限法乘积极限法3 实例分析例例12-1 某疗法治疗白血病后的存活月数为:2+,13,7+,11+,6,1,11,3,17,7。带“”为存活终检值。P81。试估计其生存率,并求出:1)3个月、6个月、1年的生存率。2)半数据生存期。解步骤:1进进入入数数据据模模块块此数据库已建立在CHISSdata文件夹中,文件名为:a9_0生存分析.DBF。打开数据库点击 数据数据文件文件打开数据库表打开数据库表找到文件名为:找到文件名为:a9_0生存分析.DBF确认确认 2进入统计模块进入统计模块进行统计计算点击 重复测量重复测量生存分析生存分析乘积极限法乘积极限法 时间变量:时间变量:time 终检值指标:终检值指标:censor确认确认3进入结果模块进入结果模块查看结果点击 结果结果1)3个月、6个月、1年的生存率分别为:78.75%,42.19%,21.09%。4 Kaplan-Meier 生存曲线在直角坐标系中,将各个时刻的生存率所对应的点标在图上,然后向右连成与横轴平行的阶梯形成一条曲线,称为Kaplan-Meier生存。2)半数据生存期为11个月。12.2 时序检验时序检验(log rank test)用于比较两个或多个样本生存期,即对各样本不同时点生存率的综合分析。其原理是计算出不同时期两种疗法的观察人数和死亡人数,并由此根据两种疗法疗效相同的假设计算出两种疗法在该日期的理论死亡数.若无效假设是对的,则实际值和理论值不会相差很大,如相差过大,则不象仅仅由于机遇所产生的差异,对此可作2检验以推断。3 实例分析例例12-2两种疗法治疗白血病后的存活月数如下:对照组:2+,13,7+,11+,6,1,11,3,17,7中药组:10,2+,12+,13,18,6+,19+,26,9+,8+,6+,43+,9,4,31,24带“”为终检值试分析两种疗法治疗的生存期有无差别?P81。CHISS实现实现点击 重复测量重复测量生存分析生存分析时序检验时序检验实际发生数与期望发生数组别总例数删失数实际发生理论发生g.110373.21g.2168811.79Log-Rank检验,QPH=5.683 自由度=1 P=0.0171.说明两种疗法治疗的生存期差别有显著性。
展开阅读全文