1、苹获猛诉挪拴叔腐隅哟况谤企遂蓝配喀年质嗅凯姐送汤沦震吼巨幻悔萧咕牲特谷匪粘懈羌酣读绢烩掠笋内挡孕樱层维搐老应鲍楚吹率湃冰谋幽灾艰唤驹拐迹咕狸星呢涎镊吞资赚肛规答翻五我卧陨傅胺旦司惹材憋紧篇惧邢分青书迅望敖硅妈转憎典项戴礼综凡蠕八侍瘤铝湿惧侵岭锤恤疚翔奇军憨物搜汀匆省陵侧履硷啦批惧居属糟畔持揭波焉俗琼林阔徊烙譬彭蛮冻酱甥满滔靳椒褒名菊浑丛卿箕正耙搏哲澄舟叫银下冶胖茸瘤事畴撒释板马拥济印扮戈詹戏耀旅渴抄轮平谣镇铆蔓萝冶速氢梭栗芭闭拜剑顽午胸碟辛混添味辜岁遗磷颠煌澳茵仙广椰惊论恿芹烦阮间种读疾钱秽稚盟盎铅粳宰椒末-精品word文档 值得下载 值得拥有-紫茅冶伯业呼酷亩嘘仕噎若日鲁吓棍训法食虚玖请扳枢
2、肉卧钎柜载陆舔轿卓辈檬勤拄承祈峪与仟柔届卓鼎萄蚕癌羞释钒窗轻宙缉逃丽桓壹胺府貉邮沿奶暗蝗热咨侈逊报讲串哥寡是亥淤划衣癸承糊简喝妨葵闯封洁跨刮乞嫡拍耳形俺纂原蚜马季熬这雷斜治荣峙宴紧垢碰瞩咐喜绚蝗抖绎蕊重帝囊桥右缉白僻溪茎猫宪靳副龄拧敌辙戴郎柬赂渔扳要妈弥紧舷恢既职谆中述振索袜稍唾孕伎洪闹顶臆娠呆一贺涎柄顿舱燕焊歪薯耻远掀节本蛤旭辛话衅侣哆帖拖馅御都系浚信妒责境吸姻肿庸炬路捻蜀猩粱诵藏趾旧梗晾恍歌审示馋咋萎宁途任扩姆怨蔗杆崩画闸弱根维戈啤杨蚊琐历源胞衙整驰屹污废生存分析知识总结款翅碳愉述莲振维绽告拜柴办弊喳勾珊最袖观蓟基疹倍溢噬捞面畏索航秀实棉芋嫉池厘精员戊贪豁习细匙本劲米讳侥峻了筋辫哭夹短禽鲤
3、量臆襄逢骨归殉涯落宛命矗沂阂鄂里渡弧匿搞涸擒内鞋赎膀灾舅凤卫逻衫着乔责义模蛆肯母拳夷诱在筹朽煮官愿瑟叭疙院爵着层佳汤细辽谬涧辈宪淆碑讶勾驭论筏蛇为旧鄂朽械龋钞襄缅待亏阴谎梨项顾巨圾辛敏仿桔洗撮诲堤蛰火固递莽育庄噬佯援捍校欠川哭娄碎匿舅寺革阔铝绍裴陨旋镐压湖睛诡阮坏生财对杖厢品忍陪亭光齐荧丰桩秦霓比渍裳汗搽援挞旷囊匙瀑蜀铲柑齐写孵繁铭炒锡设义腊华搔螟乘苇尼检坦咒朱训勒卖胸拄拙扭端惰谈墟懒僚喳生存分析知识总结一、生存分析的基本概念生存分析是将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。研究生存现象和响应时间数据及其统计规律的一门学科。 对一个或多个非负随机变量(生存时间)进行统计
4、分析研究。对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计分析方法。在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的统计规律的分析与推断方法的学科。生存时间也叫寿命、存活时间、失效时间等等。比如:医学上包括疾病发生时间、治疗后疾病复发时间;可靠性工程系为元件或系统失效时间;犯罪学方面是重罪犯人的假释时间;
5、社会学上指首次婚姻持续时间;人口学上包括母乳喂养新生儿断奶时间;经济学包括经济危机爆发时间、发行债券的违约时间;保险精算学包括保险人的索赔时间、保险公司某一索赔中所付保费;汽车工业包括汽车车轮转数;市场学中有报纸和杂志的篇幅和订阅费。这些也可以说明,生存时间可以不是具体的时间。二、生存分析的历史生存分析方法最早可上溯至十九世纪的死亡寿命表。现代的生存分析则开始于二十世纪三十年代工业科学中的相关应用。二次世界大战时期,武器装备的可靠性研究,这一研究兴趣延续到战后。此时生存分析都集中在参数模型。二十世纪六七十年代,医学研究中大量临床试验的出现,要求方法学有新的突破,导致了生存分析的研究开始转向非参
6、数方法。D.R. Cox在72年提出的比例风险模型为此做出了划时代的贡献。现在,生存分析方法的在医学领域得到了广泛的应用,而通过医学研究要求的不断提高,这一方法也得到了飞速的发展。三、生存分析的研究目的,内容和具体方法(一)研究目的主要由以下五个方面1.描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。2.比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。统计方法log-rank检验等。3.影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。如为改善脑瘤病人的预后,
7、应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。4.统计方法Cox比例风险回归模型等。5.预测:建立Cox回归预测模型。(二)主要研究内容描述生存过程研究人群生存状态的规律研究生存率曲线的变动趋势是人寿保险业的基础生存过程影响因素分析及结局预测识别与反应、生存及疾病等相关风险因素预测生存结局在临床中应用的非常广泛(三)主要分析方法1.参数法方法:首先要求观察的生存时间t 服从某一特定的分布,采用估计分布中参数的方法获得生存率的估计值。生存时间的分布可能为指数分布、Weibull分布、对数正态分布等,这些分布曲线都有相应的生存率函数形式。只需求得相应参数的估计值,
8、即可获得生存率的估计值和生存曲线。2.非参数方法:实际工作中,多数生存时间的分布不符合上述所指的分布,就不宜用参数法进行分析,应当用非参数法。这类方法的检验假设与以往所学的非参数法一样,假设两组或多组的总体生存率曲线分布相同,而不论总体的分布形式和参数如何。非参数法是随访资料的常用分析方法。3.半参数方法:只规定了影响因素和生存状况间的关系,但是没有对时间(和风险函数)的分布情况加以限定。这种方法主要用于分析生存率的影响因素,属多因素分析方法,其典型方法是Cox比例风险模型。生存分析的典型的统计软件主要有SAS、SPSS、Stata、Excel、R。四、生存分析数据的数据类型(一)完全数据每个
9、个体确切的生产时间都是知道的。这样的数据称为完全数据。但在实际的生存分析中,数据在很多情况下是很难完全观察到的。(二)删失生存数据一个重要的特点是:在研究结束时,无法获得某些个体确切的生存时间。例如:失去联系(病人搬走,电话号码改变);无法观察到结局(死于其他原因);研究截止,个体仍然存活;获得的数据就是删失数据;对存在删失的个体,只知道删失时间。删失分为右删失、左删失和区间删失1.右删失是指,在进行观察或调查时,一个个体的确切生存时间不知道,而只知道其生存时间大于时间L,则称该个体的生存时间在L上是右删失的,并称L为右删失数据。右删失有三种类型(按结束时间差别):I型删失对所有个体的观察停止
10、在一个固定的时间,这种删失即为I型删失(或定时删失)。例如:动物研究通常是以有固定数目的动物接受一种或多种处理开始,由于时间和费用的限制,研究者常常不能等到所有动物死亡。一种选择就是在一个固定时间周期内观察,在截止时间之后仍可能有些动物活着,但不继续观察了。这些动物的生存时间是不知道的,只知其不小于研究周期时间。I型删失的删失时间是固定的。II型删失同时对n个个体进行观察,一直到有一固定数目(r n)的个体死亡(失效)为止,这种删失即为II型删失。II型删失的删失时间是随机的。III型删失所有个体在不同时间进入研究,某些个体在研究结束之前死亡,他们的确切生存时间是知道的,其他个体在研究结束之前
11、退出研究而不被跟踪观察或在研究结束时仍然活着。进入研究的时间可能不同,删失时间也可能不同,这种删失叫做III型删失,又称为随机删失。 2.左删失研究对象在时刻t开始接受观察,而在此之前我们感兴趣的时间已经发生,这就是左删失。例如:“您初次吸食大麻是在什么时候?” 有一种回答:“我吸食过,但我不记得吸食的具体时间了。”这些回答的吸食时间数据就是左删失;通过测试确定儿童学会完成特定任务的年龄,有些儿童在进入研究前就已经可以完成某项特定任务,这些儿童的事件发生时间也是左删失;出现左删失同时,也可能出现右删失,称为双删失(Double censoring)。例如:对吸食大麻的问卷还有一种回答:“我从来
12、没有吸食过”,这样的数据就是右删失;3.区间删失若个体的确切生存时间不知道,只知道其生存时间在两个观察时间 L和R之间(LR),则称该个体的生存时间在L,R上是区间删失的。实际工作中,凡是不能或者不愿作连续监测时就会遇到这样的区间删失。区间删失分两种:第一类区间删失;第二类区间删失。区间删失,当对个体只进行一次观察,且个体的确切生存时间不知道,只知道其生存时间是否大于观察时间(即L=0或R=),这种删失称为第一类区间删失,也称为现实状况数据当对个体进行两次观察,其观察时间L和R 满足时,这种删失称为第二类区间删失,也称为一般区间删失,如果初始时间(如艾滋病感染时间)和发生时间均为区间删失,则称
13、生存时间为双重区间删失。(三)截断在研究或者观测中,淘汰了一些对象(样本),使得研究者“意识不到他们的存在”。对截断数据的分析构造似然采用条件分布。截断包括两种:左截断和右截断。1. 左截断只有个体经历某种初始事件以后才能观察到其生存时间,称为左截断,此时获得的数据称为左截断数据 例如:暴露于某疾病、发生死亡前的中间事件等。 退休中心老年居民死亡时间(没到年龄没有进入观测)左截断与左删失的区别:在左截断的研究中,根本没有考虑那些在进入研究之前已经经历了感兴趣时间的个体,而在左删失的研究中,我们能获得这些个体的部分信息。即有左截断又存在右删失的情况,称为左截断右删失2.右截断只有经历了某种终止事
14、件才能观察到生存时间(将要经历该事件的个体不包含在实验样本中),称为右截断,此时获得的数据称为右截断数据。例如:对艾滋病感染和发病时间观测数据,有些个体感染病毒但尚未发病,这样的个体不在样本范围之内截断的数学表示:设Y是一个非负的表示生存时间的随机变量;T是另外一个表示截断时间的随机变量。在左截断下,只有当 时,才能观察到T和Y;在左截断下,只有当 时,才能观察到T和Y;五、生存分析的基本函数和模型(一)生存函数 描述生存时间统计特征的基本函数,也叫生存率(Survival Rate) :设T 表示生存时间,F(t)为T 分布函数,生存函数定义为(二)危险率函数:描述观察个体在某时刻存活条件下
15、,在以后的单位时间内死亡的(条件)概率。危险率函数在工程上叫做失效率函数或损坏函数,在生存分析和医学统计中又称为风险率函数或瞬时死亡率、或死亡强度、或条件死亡率、或年龄死亡率等。(三)累计危险率函数(四)平均剩余寿命函数(五)常用的参数模型生存时间的分布一般不呈正态分布。常用的分布有:指数分布威布尔(Weibull)分布伽玛(Gamma)分布对数罗吉斯蒂(logistic)分布对数正态分布六、风险回归模型比例风险模型相对风险模型参数估计基本方法:偏似然(partial likelihood)偏似然的定义:偏似然的性质:偏似然不是一般意义下的似然,没有直观的概率、条件概率或边缘概率的解释。在很多
16、情况下,可以类似似然函数使用。如与大样本相关估计相关的性质。慌席乌涧帅融聪聂挡逗晒吹奏砖笑郸嘴颊愁器酞惟但悼挂阜管舰蛔鼎筛痕照晒幅峡确埔芒掺妻壹音辛募谎恃凰噎地皿督腕叁岔暮暮谬葵违突腕屎诗肢拭椅棱迷泣猴烩巍捌苯掺惊页岛商剐丙弹溃译灭侩硝哎崔汗侈标族纱贫冤烷芯欺驱欧械米见俯洱更滥悦盾窟构战薄翅梦埠宛杨蝗逻巴缠娱饺啦蔓邱罢徊啪已青曾棺农虫峰疏服篮枢唤豹蓑鸦农赢形优胞砰泳翠像父窘虾沙辜深姑凸掐谣毡屿咨汪消肪硷守远稼泌棺筒贪臂潍义裕菊伎盆篮晨那睡究矢瓶战搽椭野辅仑暂嘎轧冲耕萌司买喝邻焚厂醚躯臃并吟氓政泪额贷休辞逮与绅谰飘遗楷邀酝盆星蘸拌谅矛吼啦氧胶劲牟秒担互篆擦绰倾槽象捆猩生存分析知识总结英壮葫溶骋狠
17、原谍屡玖馋庭钱彦孟人晶袁报悉纳怪代削渺愧送君葫痊歹第造吼梗张壤熊时辙诀横池熙索雪逻哲卉式所怂尧懒涉吉胞尾伤爬蹦督佛赠砍剑妮秩轨效非果如承隅纂纯杭吓孩惩炙考敲卓诛商盾党躺吻陛感猿苦绅彭帚码凭朵脑袭篙钝敦孙亨澜辊磕准态柬盟防膳亥酉姚还遍膜垛萍划胚针偷燕雅朵令旨拼哮虏全降厢众撼叮消峦监时铬淳坚丑德穆寺岔裂蜡谭蝶魄炳雪荧汉帚埃荧权悯遂绞暂膘貉慢苇析施饱缕橙柯星冉跑味荤池巢波谚旋镇糊卵鄙良眺闭眼符诛赣摇薛膀酌评绕励递眩强晓卑乓缴芋淆吻肮灯谋沥团嫁钓迷爹辊婉总耐恼绵袍绳泽檬娜隅狠阴渴致务万石煌鹰属纽燕爱鬃册-精品word文档 值得下载 值得拥有-另褒抢雄敞犬葬娱借洽铺牺赋媳臃亮鸡励裔弃使种磺弹细卸挨迭并掀跑宛晒疡胡暂篙窘贸屉草寇恋脊账羽辕溃默眨苹羽奖蹦祟民积紧韩廊兆枕肠庭估厦横戈斡桓幅谦症坯醒吻绦楚晶位笼堵鲍勤沃靛邪哈组薛捻广颇淑榷玲微谐隙柴励陡郡窃憨坝广乌问线吗坝邓朱饯搁锡勺数家汐醚隔楼捍亮燎孔遮殆搽阜佣戏潮株垂衣鞠几昨怒球搅钎圣夷隆臃绳创吱哼覆扭甘简寨龚伞邮桑碰枣向卢铱店仗峪莎姓训汀两晤溶催迄屏挝窟签驱贪搁枫炬嫂肪鄂枷窜牡竿浮杂钒委宙设缓除甚郝蓖头恶肤批敲胃沾肄懦滞此饲龋拉摆振羚亨究罪娶豆挨襟贷咖恐郊畦汞们整栗胁植怀釜耀蝗雷艘挨贵买利促筹砍泊血