1、一、名词解释1、 SAS永久性数据集:存放于本地硬盘的SAS数据集,SAS系统关闭,数据集仍然保存。2、 SAS临时性数据集:放在SAS work目录中的数据集,SAS系统关闭,自动删除。3、 SAS程序的编写初步包括数据步、过程步。数据步:由一个或几个语句组成,作用是输入数据并建立SAS数据集。过程步:由一个或几个语句组成,作用是对已形成的SAS数据集通过调用现成的SAS过程进行统计分析、打印等处理。4、 检验功效:指当两总体参数确有差别时,按水准,假设检验能发现它们有差别的能力。5、 中位生存时间:刚好有50%个体的存活期大于该时间。二、填空题1、 SAS窗口包括编辑器窗口、日志窗口、结果
2、输出窗口、资源管理器窗口、结果窗口。2、 SAS系统全称Statistics Analysis System。3、 SAS过程包括数据步、过程步。4、 用SAS进行基本描述,有2个基本函数:Proc means 、Proc univariate。5、 纵向合并用set语句;横向合并用MERGE语句。6、 在input cards语句中,如果录入字符变量,则在变量后加$符号,如果是横行录入则加符号;7、 SAS运算符 *表示乘方。8、 实验设计三要素:受试对象、处理因素、实验效应。9、 实验设计基本原则:对照、重复、随机化。10. 方差分析用 Proc ANOVA模块非参数分析用 Proc np
3、arlway模块卡方分析用 Proc freq模块线性回归用 Proc Reg模块11、SAS计算样本量用Proc power模块。 三、统计分析题 t检验及t检验例1、为研究人尾加压素与高血压的关联性,某研究者做了预实验,在某个社区抽取年龄在4060岁的10名高血压患者和10名正常血压者,用ELISA法检测病例和对照血清中的人尾加压素的水平,得数据如下表。试比较高血压组和正常血压组人尾加压素水平是否有差别?表1 10名高血压患者和10名正常血压者的人尾加压素水平(ng/ml)高血压组正常血压组0.720.830.670.790.660.710.510.821.080.541.140.700.
4、871.040.740.640.850.890.900.851、正态性检验Tests for Normalityn50 用W检验 n50 用D检验答:本例n50,用W检验,两组P值分别为0.8007和0.9737均0.10,故认为两变量X符合正态分布。2、方差齐性Equality of Variances F=1.92,P=0.3461,按=0.10水准,方差齐,故按照t检验。方差不齐 按照t检验 齐 看 Equal(考试为不齐)不齐 看 Unequal 3、t检验结果:t=0.44,p=0.6685,按=0.05水准,不拒绝H0,两组样本均数差异无统计学意义。(考试看 Unequal P=4
5、0 且T=5 看Chi-Square N=40且1=T=5 看 Continuity Adj. Chi-Square 该资料为定性资料,采用卡方检验。建立假设检验H0:两种药物治疗冠心病心绞痛的总体有效率无差异,1=2。H1:两种药物治疗冠心病心绞痛的总体有效率有差异,12。=0.05。因本例n40,且有一个格子的理论频数5,需要用校正公式计算卡方值。F=4.3313,P=0.0374,P0.05,按=0.05水准,拒绝H0,可以认为两种药物治疗冠心病心绞痛的临床疗效不同,可以认为冠心软胶囊治疗冠心病心绞痛的临床疗效比复方丹参片好。等级资料的比较(单项有序)用非参统计Proc npar1way
6、;例4某研究者对肝舒贴穴位敷贴治疗肝癌肝区疼痛的临床疗效进行观察,将60例肝癌病人随机分成两组,治疗组用肝舒贴穴位敷贴,对照组应用常规治疗。两组病人肝区疼痛缓解情况见下表表4 两种方法治疗肝癌患者肝区疼痛的效果治疗方法完全缓解明显缓解中度缓解轻度缓解无效合计肝舒贴91243230常规治疗56107230建立假设检验H0:两种治疗病人肝区疼痛缓解无差异。H1:两种治疗病人肝区疼痛缓解有差异。双侧=0.05。当要比较完全随机化设计的两组资料为等级资料时,选用秩和检验,本例用Wilcoxon符号秩和检验检验,正态近似检验的结果为Z= -2.0630,双侧P=0.03910.05,差异有统计学意义,故
7、两种治疗病人肝区疼痛缓解有差异。秩次越高,效果越差,1组平均秩次25.97小于2组平均秩次的35.03,故1组效果比2组好。该题可以用CMH方法计算行平均分检验统计量程序中看(Row Mean Scores Differ)Logistic回归非线性概率型模型Y为分类变量,协变量为分类或连续性变量估计协变量与Y的关联用OR及95%CI,有wald卡方检验下表是运动和吸烟与冠心病关系的病例对照研究结果,变量赋值为:运动(:运动=1,不运动=0)、吸烟(:吸烟=1,不吸烟=0)、冠心病(:有=1,无=0)。本研究主要探讨运动与冠心病关系表5 运动和吸烟与冠心病关系的病例对照研究的资料整理表分析如下表
8、(需画表格):生存分析例19-5 为从基因遗传角度探索某恶性肿瘤的预后,研究人员收集了69名患者的生存时间,生存结局及影响因素。变量及其赋值见表19-7,实际资料见表19-8。试采用Cox回归模型进行分析。表19-7 变量赋值表变量名称因素量化值X1发病年龄岁X2性别1男;0女X3有无不良染色体1: 有;0: 无X4基因11: 突变型;0: 野生型X5基因21: 突变型;0: 野生型X6基因31: 突变型;0: 野生型Y是否死亡1: 死亡;0: 删失t生存时间月单因素Cox模型分析表19-9 单因素Cox模型分析结果变量参数()标准误似然比2P值RR95%下限95%下限age-0.009380
9、.019180.23920.62480.9910.9541.029gender-1.631920.4601612.57700.00040.1960.0790.482chr-0.571230.364872.45110.11740.5650.2761.155gene1-1.829190.5384511.54070.00070.1610.0560.461gene20.708850.384843.39280.06552.0320.9564.319gene30.289900.386160.56360.45281.3360.6272.848多因素Cox模型分析proc phreg data=cancer;model t*y(0)=age gender chr gene1 gene2 gene3 /risklimits selection=stepwise sle=0.05 sls=0.05;run;针对研究目的列出相应统计量:gender P=0.00020.05 RR=0.183 95%可信区间 0.074-0.452gen2 P=0.03280.05 RR=2.285 95%可信区间 1.070-4.880男性是女性风险的0.183倍,女性风险高。gen2突变型比野生型死亡风险增加2.285倍。