1、生存分析的生存分析的SPSS实现实现预防系卫生统计学教研室预防系卫生统计学教研室 张彦琦张彦琦 Tel:023-6875234313996478364E-mail:2024/5/6 周一1SPSS 生存分析过程名生存分析过程名寿命表法寿命表法寿命表法寿命表法Analyze Survival Life TablesAnalyze Survival Life TablesKaplan-MeierKaplan-Meier法法法法Analyze Survival Kaplan-MeierAnalyze Survival Kaplan-MeierCoxCox回归分析回归分析回归分析回归分析Analyze
2、 Survival Cox RegressionAnalyze Survival Cox Regression2024/5/6 周一2生存分析生存分析生存分析生存分析寿命表法寿命表法寿命表法寿命表法Kaplan-MeierKaplan-Meier法法法法CoxCox回归回归回归回归2024/5/6 周一3寿命表法寿命表法2024/5/6 周一4实例分析实例分析生存率估计生存率估计寿命表法寿命表法例例例例17-117-117-117-1有人研究了甲种手术方法治疗某病的生存有人研究了甲种手术方法治疗某病的生存有人研究了甲种手术方法治疗某病的生存有人研究了甲种手术方法治疗某病的生存情况,定义从手术后
3、到死亡为生存时间,得到的情况,定义从手术后到死亡为生存时间,得到的情况,定义从手术后到死亡为生存时间,得到的情况,定义从手术后到死亡为生存时间,得到的生存时间(月)如下,其中有生存时间(月)如下,其中有生存时间(月)如下,其中有生存时间(月)如下,其中有“+”+”者表示截尾者表示截尾者表示截尾者表示截尾数据,表示仍生存或失访,括号内为重复死亡数,数据,表示仍生存或失访,括号内为重复死亡数,数据,表示仍生存或失访,括号内为重复死亡数,数据,表示仍生存或失访,括号内为重复死亡数,试作生存分析。试作生存分析。试作生存分析。试作生存分析。1 1 3 3 5 5(3 3)6 6(3 3)7 7 8 8
4、1010(3 3)1414+17 17 1919+2020+2222+2626+3131+34 34 3434+44 59 44 59 2024/5/6 周一5数据格式数据格式2323行行行行2 2列:生存时间、结局(列:生存时间、结局(列:生存时间、结局(列:生存时间、结局(1 1:完全数据、:完全数据、:完全数据、:完全数据、2 2:删失数据)删失数据)删失数据)删失数据)2024/5/6 周一6操作步骤操作步骤AnalyzeAnalyze Survival Survival Life Tables Life Tables2024/5/6 周一7Life Tables对话框对话框生存时间生
5、存时间生存时间生存时间结局变量结局变量结局变量结局变量定义生存时间定义生存时间定义生存时间定义生存时间范围及组距范围及组距范围及组距范围及组距定义结局变量定义结局变量定义结局变量定义结局变量2024/5/6 周一8Life Tables:Define Event对话框对话框2024/5/6 周一9Life Tables:Options对话框对话框寿命表寿命表寿命表寿命表生存曲线生存曲线生存曲线生存曲线风险函数曲线风险函数曲线风险函数曲线风险函数曲线生存曲线被生存曲线被生存曲线被生存曲线被1 1减后的曲线减后的曲线减后的曲线减后的曲线2024/5/6 周一10结果输出结果输出2024/5/6 周
6、一11寿命表寿命表2024/5/6 周一12寿命表寿命表生存时间生存时间生存时间生存时间组段下限组段下限组段下限组段下限初期观察例数初期观察例数初期观察例数初期观察例数期内删失例数期内删失例数期内删失例数期内删失例数有效观察例数有效观察例数有效观察例数有效观察例数期内死亡例数期内死亡例数期内死亡例数期内死亡例数条件死亡率条件死亡率条件死亡率条件死亡率中位生存时间为中位生存时间为中位生存时间为中位生存时间为11.5711.57月。月。月。月。2024/5/6 周一13寿命表寿命表条件生存率条件生存率条件生存率条件生存率累计生存率累计生存率累计生存率累计生存率累计生存率累计生存率累计生存率累计生存
7、率的标准误的标准误的标准误的标准误概率密度函数概率密度函数概率密度函数概率密度函数概率密度函概率密度函概率密度函概率密度函数的标准误数的标准误数的标准误数的标准误风险率风险率风险率风险率风险率风险率风险率风险率标准误标准误标准误标准误2024/5/6 周一14生存曲线生存曲线中位生存时间中位生存时间中位生存时间中位生存时间2024/5/6 周一15Kaplan-Meier法法2024/5/6 周一16实例分析实例分析生存率比较生存率比较Kaplan-Meier法法例例例例17-217-217-217-2假定我们用乙种手术方式治疗了与例假定我们用乙种手术方式治疗了与例17-1病情一致的同种疾病病
8、情一致的同种疾病20例。试比较两种手术方式例。试比较两种手术方式的生存时间。的生存时间。1 1 3 3 5 5(3 3)6 6(3 3)7 7 8 8 1010(3 3)1414+17 17 1919+2020+2222+2626+3131+34 34 3434+44 59 44 59 1 1(2 2)2 2 3 3(2 2)4 4(3 3)6 6(2 2)8 8 9 9(2 2)10 10 11 11 12 12 13 13 14 15 17 1814 15 17 18甲种手术甲种手术甲种手术甲种手术乙种手术乙种手术乙种手术乙种手术2024/5/6 周一17数据格式数据格式4343行行行行3
9、 3列:生存时间、列:生存时间、列:生存时间、列:生存时间、结局(结局(结局(结局(1 1:完全数据、:完全数据、:完全数据、:完全数据、2 2:删失数据)、:删失数据)、:删失数据)、:删失数据)、分组(分组(分组(分组(1 1:甲组、:甲组、:甲组、:甲组、2 2:乙组):乙组):乙组):乙组)2024/5/6 周一18操作步骤操作步骤 Analyze Analyze Survival Survival Kaplan-Meier Kaplan-Meier2024/5/6 周一19Kaplan-Meier对话框对话框生存时间生存时间生存时间生存时间结局变量结局变量结局变量结局变量定义结局变量
10、定义结局变量定义结局变量定义结局变量分组变量分组变量分组变量分组变量组间比较组间比较组间比较组间比较2024/5/6 周一20Kaplan-Meier:Define Event对话框对话框2024/5/6 周一21Kaplan-Meier:Compare Factor Levels对话框对话框对数秩检验对数秩检验对数秩检验对数秩检验2024/5/6 周一22Kaplan-Meier:Options对话框对话框寿命表寿命表寿命表寿命表平均和中位平均和中位平均和中位平均和中位生存时间生存时间生存时间生存时间生存曲线生存曲线生存曲线生存曲线2024/5/6 周一23结果输出结果输出2024/5/6
11、周一24基本统计描述基本统计描述例数例数例数例数死亡例数死亡例数死亡例数死亡例数删失例数删失例数删失例数删失例数删失率删失率删失率删失率2024/5/6 周一25寿命表寿命表生存时间生存时间生存时间生存时间结局结局结局结局累积生存率累积生存率累积生存率累积生存率及其标准误及其标准误及其标准误及其标准误累计死累计死累计死累计死亡例数亡例数亡例数亡例数存活例数存活例数存活例数存活例数2024/5/6 周一26寿命表寿命表2024/5/6 周一27平均生存时间与中位生存时间平均生存时间与中位生存时间中位生存时间即生存率为中位生存时间即生存率为中位生存时间即生存率为中位生存时间即生存率为50%50%时
12、的生存时间,时的生存时间,时的生存时间,时的生存时间,50%50%的的的的观察单位发生阳性事件(结局)的时间。观察单位发生阳性事件(结局)的时间。观察单位发生阳性事件(结局)的时间。观察单位发生阳性事件(结局)的时间。甲乙两组的中位生存时间分别是甲乙两组的中位生存时间分别是甲乙两组的中位生存时间分别是甲乙两组的中位生存时间分别是1010个月和个月和个月和个月和6 6个月。个月。个月。个月。平均生存时间平均生存时间平均生存时间平均生存时间及其标准误和可信区间及其标准误和可信区间及其标准误和可信区间及其标准误和可信区间中位生存时间中位生存时间中位生存时间中位生存时间及其标准误和可信区间及其标准误和
13、可信区间及其标准误和可信区间及其标准误和可信区间2024/5/6 周一28中位生存时间的对数秩检验中位生存时间的对数秩检验甲乙两组中位生存时间的差异有统计学意义甲乙两组中位生存时间的差异有统计学意义甲乙两组中位生存时间的差异有统计学意义甲乙两组中位生存时间的差异有统计学意义P=0.003P=0.003,甲组生存时间长于乙组。甲组生存时间长于乙组。甲组生存时间长于乙组。甲组生存时间长于乙组。2024/5/6 周一29生存曲线生存曲线2024/5/6 周一30Cox回归分析回归分析2024/5/6 周一31实例分析实例分析生存状态影响因素分析生存状态影响因素分析Cox回归回归例例例例17-317-
14、3:某癌症患者手术治疗后随访的生存时某癌症患者手术治疗后随访的生存时某癌症患者手术治疗后随访的生存时某癌症患者手术治疗后随访的生存时间资料收集了间资料收集了间资料收集了间资料收集了2828例患者年龄(岁)、性别(例患者年龄(岁)、性别(例患者年龄(岁)、性别(例患者年龄(岁)、性别(0-0-女、女、女、女、1-1-男)白蛋白含量(男)白蛋白含量(男)白蛋白含量(男)白蛋白含量(g/Lg/L)、胆红素)、胆红素)、胆红素)、胆红素(molmol/L/L)、结局()、结局()、结局()、结局(0-0-存活、存活、存活、存活、1-1-死亡)。试死亡)。试死亡)。试死亡)。试用用用用CoxCox模型进
15、行分析。模型进行分析。模型进行分析。模型进行分析。2024/5/6 周一32数据格式数据格式2828行行行行6 6列:生存月、年龄、性别、白蛋白含量、列:生存月、年龄、性别、白蛋白含量、列:生存月、年龄、性别、白蛋白含量、列:生存月、年龄、性别、白蛋白含量、胆红素、死亡胆红素、死亡胆红素、死亡胆红素、死亡2024/5/6 周一33操作步骤操作步骤AnalyzeAnalyze Survival Survival Cox Regression Cox Regression2024/5/6 周一34Cox Regression对话框对话框2024/5/6 周一35Cox Regression:Def
16、ine Event对话框对话框2024/5/6 周一36Cox Regression对话框对话框自变量自变量自变量自变量变量筛变量筛变量筛变量筛选方法选方法选方法选方法分类变分类变分类变分类变量定义量定义量定义量定义强迫进入法强迫进入法强迫进入法强迫进入法向前法向前法向前法向前法似然比似然比似然比似然比2024/5/6 周一37Cox Regression:Options对话框对话框相对危险度相对危险度相对危险度相对危险度RRRR可信区间可信区间可信区间可信区间2024/5/6 周一38结果输出结果输出2024/5/6 周一39统计描述统计描述2828例手术患者例手术患者例手术患者例手术患者中
17、:中:中:中:死亡死亡死亡死亡1616例,例,例,例,删失数据删失数据删失数据删失数据1212例例例例2024/5/6 周一40初始步模型检验初始步模型检验Block 0:Beginning BlockBlock 0:Beginning Block初始步初始步初始步初始步-2-2倍对数似然比为倍对数似然比为倍对数似然比为倍对数似然比为88.79688.7962024/5/6 周一41模型检验模型检验Block 1:Method=EnterBlock 1:Method=Enter似然比检验似然比检验似然比检验似然比检验全卡方检验全卡方检验全卡方检验全卡方检验37.594=88.796-51.20
18、237.594=88.796-51.202-2-2倍对数倍对数倍对数倍对数似然比似然比似然比似然比2024/5/6 周一42Cox模型中变量参数估计(最重要的表)模型中变量参数估计(最重要的表)P P值值值值相对危险度相对危险度相对危险度相对危险度及其可信区间及其可信区间及其可信区间及其可信区间WaldWald统计量统计量统计量统计量偏回归系数偏回归系数偏回归系数偏回归系数及其标准误及其标准误及其标准误及其标准误年龄与性别对生存状态的影响无统计学意义,进行逐步回归年龄与性别对生存状态的影响无统计学意义,进行逐步回归年龄与性别对生存状态的影响无统计学意义,进行逐步回归年龄与性别对生存状态的影响无
19、统计学意义,进行逐步回归(步骤略)(步骤略)(步骤略)(步骤略)2024/5/6 周一43逐步回归结果逐步回归结果向前法:似然比向前法:似然比forward:LR逐步回归分析结果最终显示,对术后生存时间影响的因素逐步回归分析结果最终显示,对术后生存时间影响的因素逐步回归分析结果最终显示,对术后生存时间影响的因素逐步回归分析结果最终显示,对术后生存时间影响的因素是胆红素和白蛋白含量。其中胆红素是一个危险因素,而是胆红素和白蛋白含量。其中胆红素是一个危险因素,而是胆红素和白蛋白含量。其中胆红素是一个危险因素,而是胆红素和白蛋白含量。其中胆红素是一个危险因素,而白蛋白含量是一个保护因素。白蛋白含量是一个保护因素。白蛋白含量是一个保护因素。白蛋白含量是一个保护因素。2024/5/6 周一442024/5/6 周一45