1、第十第十八八章章 logistic 回归回归方积乾方积乾中山大学公共卫生学院中山大学公共卫生学院2013.5第一节第一节 Logistic回归模型回归模型 Logistic regression model例例18-1 大肠癌患者的年龄可能影响大肠癌患者的年龄可能影响5年生存状态年生存状态(存存活活:0,死亡死亡:1)。现有。现有158例经手术治疗大肠癌患者例经手术治疗大肠癌患者,欲欲分析分析生存状态生存状态 Y 和年龄和年龄 X 的关系。的关系。能否采用线性回归?能否采用线性回归?线性回归要求:因变量线性回归要求:因变量Y是定量变量是定量变量但是本例但是本例“生存状态生存状态”Y 是二分类变
2、量!是二分类变量!因变量改为因变量改为“死亡概率死亡概率 ”?的数值在的数值在 范围内,范围内,但是回归后,因变量可以在但是回归后,因变量可以在 范围内范围内取值取值将将“死亡概率死亡概率 ”作一个变换作一个变换更复杂的实际问题!更复杂的实际问题!例例18-1 大肠癌患者临床病理因素对可能影响预后。大肠癌患者临床病理因素对可能影响预后。现有现有158例经手术治疗大肠癌患者:例经手术治疗大肠癌患者:性别性别(女女:0,男男:1)、年龄、)、年龄、组织学分类组织学分类(乳头状腺癌乳头状腺癌:0,管状腺癌管状腺癌:1)肿瘤大小肿瘤大小(6cm及以上及以上:0,6cm以下以下:1)Dures分期分期(
3、A:1,B:2,C:3,D:4)淋巴管浸润淋巴管浸润(无无:0,有有:1)、血管浸润)、血管浸润(无无:0,有有:1)5年生存状态年生存状态(存活存活:0,死亡死亡:1)欲预测经手术治疗大肠癌患者欲预测经手术治疗大肠癌患者5年生存概率。年生存概率。二、模型参数的意义二、模型参数的意义二、模型参数的意义二、模型参数的意义第二节第二节 回归的参数估计及假设检验回归的参数估计及假设检验一、回归的参数估计一、回归的参数估计似然函数似然函数(likelihood function)参数参数 的极大似然估计的极大似然估计 针对例针对例18-1资料,建立资料,建立Y 与与 关系的关系的回归方程,并预测大肠癌
4、患者回归方程,并预测大肠癌患者5年生存状况。年生存状况。二、假设检验和区间估计二、假设检验和区间估计 1.假设检验假设检验2.回归系数的区间估计回归系数的区间估计预测大肠癌患者预测大肠癌患者5年生存状况年生存状况三、自变量筛选三、自变量筛选与多重线性回归类似,自变量的筛选有前进法、后退法、逐步法与多重线性回归类似,自变量的筛选有前进法、后退法、逐步法与多重线性回归类似,自变量的筛选有前进法、后退法、逐步法与多重线性回归类似,自变量的筛选有前进法、后退法、逐步法.但检验统计量不再是但检验统计量不再是但检验统计量不再是但检验统计量不再是F F,而是似然比检验统计量,而是似然比检验统计量,而是似然比
5、检验统计量,而是似然比检验统计量GG或或或或WardWard统计量统计量统计量统计量采用后退法(剔除水平采用后退法(剔除水平=0.05)进行变量筛选。)进行变量筛选。(1)(1)利用似然比检验筛选自变量利用似然比检验筛选自变量利用似然比检验筛选自变量利用似然比检验筛选自变量(2)(2)关于选中变量的参数估计关于选中变量的参数估计关于选中变量的参数估计关于选中变量的参数估计危险因素:肿瘤家族史、职业有害接触、吸烟;危险因素:肿瘤家族史、职业有害接触、吸烟;保护因素:长期体育锻炼为保护因素保护因素:长期体育锻炼为保护因素 第三节第三节 条件条件logistic回归模型回归模型11:1配对设计的条件配对设计的条件 logistic 回归模型回归模型第四节第四节 回归的应用及注意的问题回归的应用及注意的问题一一.回归的应用回归的应用二二 回归应用中需注意的问题回归应用中需注意的问题小结小结4.1:1 配对设计的条件配对设计的条件 logistic 回归模型可用以回归模型可用以进行危险因素分析进行危险因素分析,但不能用作预测和判别。但不能用作预测和判别。Thanks