收藏 分销(赏)

统计学考试.doc

上传人:精**** 文档编号:4137797 上传时间:2024-07-31 格式:DOC 页数:11 大小:378.95KB 下载积分:8 金币
下载 相关 举报
统计学考试.doc_第1页
第1页 / 共11页
统计学考试.doc_第2页
第2页 / 共11页


点击查看更多>>
资源描述
一、名词解释 1、 SAS永久性数据集:存放于本地硬盘的SAS数据集,SAS系统关闭,数据集仍然保存。 2、 SAS临时性数据集:放在SAS work目录中的数据集,SAS系统关闭,自动删除。 3、 SAS程序的编写初步包括数据步、过程步。 数据步:由一个或几个语句组成,作用是输入数据并建立SAS数据集。 过程步:由一个或几个语句组成,作用是对已形成的SAS数据集通过调用现成的SAS过程进行统计分析、打印等处理。 4、 检验功效:指当两总体参数确有差别时,按α水准,假设检验能发现它们有差别的能力。 5、 中位生存时间:刚好有50%个体的存活期大于该时间。 二、填空题 1、 SAS窗口包括编辑器窗口、日志窗口、结果输出窗口、资源管理器窗口、结果窗口。 2、 SAS系统全称Statistics Analysis System。 3、 SAS过程包括数据步、过程步。 4、 用SAS进行基本描述,有2个基本函数:Proc means 、Proc univariate。 5、 纵向合并用set语句;横向合并用MERGE语句。 6、 在input cards语句中,如果录入字符变量,则在变量后加‘$’符号,如果是横行录入则加‘@@’符号; 7、 SAS运算符 **表示乘方。 8、 实验设计三要素:受试对象、处理因素、实验效应。 9、 实验设计基本原则:对照、重复、随机化。 10. 方差分析用 Proc ANOVA模块 非参数分析用 Proc nparlway模块 卡方分析用 Proc freq模块 线性回归用 Proc Reg模块 11、SAS计算样本量用Proc power模块。 三、统计分析题 t检验及t’检验 例1、为研究人尾加压素Ⅱ与高血压的关联性,某研究者做了预实验,在某个社区抽取年龄在40~60岁的10名高血压患者和10名正常血压者,用ELISA法检测病例和对照血清中的人尾加压素Ⅱ的水平,得数据如下表。试比较高血压组和正常血压组人尾加压素Ⅱ水平是否有差别? 表1 10名高血压患者和10名正常血压者的人尾加压素Ⅱ水平(ng/ml) 高血压组 正常血压组 0.72 0.83 0.67 0.79 0.66 0.71 0.51 0.82 1.08 0.54 1.14 0.70 0.87 1.04 0.74 0.64 0.85 0.89 0.90 0.85 1、正态性检验Tests for Normality n<50 用W检验 n≥50 用D检验 答:本例n<50,用W检验,两组P值分别为0.8007和0.9737均>0.10,故认为两变量X符合正态分布。 2、方差齐性Equality of Variances F=1.92,P=0.3461,按α=0.10水准,方差齐,故按照t检验。 方差不齐 按照t’检验 齐 看 Equal (考试为不齐)不齐 看 Unequal 3、t检验结果:t=0.44,p=0.6685,按α=0.05水准,不拒绝H0,两组样本均数差异无统计学意义。(考试看 Unequal P<0.05有统计学意义) 方差分析ANOVA 例2为研究母亲在妊娠期间的吸烟状态与婴儿出生体重的关系,国外有研究人员记录了在医院产前门诊所记录的母亲的吸烟状态,并跟踪记录了相应的婴儿的出生体重,根据吸烟情况,母亲被分为四组,分别为母亲是不吸烟者(group=1);母亲是戒烟者,孕前某段时间抽烟(group=2);母亲是吸烟者,每日吸烟少于1包(group=3);母亲是吸烟者,每日吸烟大于等于1包(group=4)。每组出生的体重数据如下。 表2母亲不同吸烟状态下婴儿出生体重(kg) group=1 group=2 group=3 group=4 3.4 2.6 2.7 2.8 2.8 3.3 2.8 3.1 3.1 3.7 2.6 2.6 3.4 3.2 2.1 2.2 4.2 3.5 3.8 2.8 3.8 3.3 3.3 3.2 3.5 3.4 2.8 2.6 3.3 3 2.7 2.5 3.6 3.1 2.9   3.2 3.2 2.6   3.7       答:(1)正态性检验Tests for Normality当n值不是很大时,一般n<50,用W检验,本例W检验结果,四组P值均>0.10,故认为四组变量X符合正态分布。 (2)方差齐性(Levene’s Test for Homogeneity of x variance 向下找)检验结果为:F=0.51,P=0.6808,按α=0.10水准,方差齐,满足方差分析的前提条件。 (3)方差分析结果:F=8.29,p=0.0003,按α=0.05水准,拒绝H0,接受H1,四个总体均数不全等或全不等。 卡方检验 例3某医生观察冠心软胶囊治疗冠心病心绞痛的临床疗效。用冠心软胶囊(治疗组)与复方丹参片(对照组)作对比治疗,以临床症状及心电图疗效等为观察指标。所有冠心病心绞痛患者均为门诊患者,均符合世界卫生组织(WHO)制定的《缺血性心脏病的命名及诊断标准》,将患者随机分为两组,其中患者性别、年龄、病情、病程等在两组间是均衡的,两组病人临床症状改善效果见下表。试比较两种药物治疗冠心病心绞痛的总体有效率有无差别? 表3 两组药物治疗心绞痛疗效的比较 组别 有效人数 无效人数 合计 有效率(%) 治疗组 32(28.64) 3(6.36) 35 91.43 对照组 13(16.36) 7(3.64) 20 65.00 合计 45 10 55 80.82 条件:N>=40 且T>=5 看Chi-Square N>=40且1=<T<=5 看 Continuity Adj. Chi-Square 该资料为定性资料,采用卡方检验。 建立假设检验 H0:两种药物治疗冠心病心绞痛的总体有效率无差异,π1=π2。 H1:两种药物治疗冠心病心绞痛的总体有效率有差异,π1≠π2。 α=0.05。 因本例n>40,且有一个格子的理论频数<5,需要用校正公式计算卡方值。F=4.3313,P=0.0374,P<0.05,按α=0.05水准,拒绝H0,可以认为两种药物治疗冠心病心绞痛的临床疗效不同,可以认为冠心软胶囊治疗冠心病心绞痛的临床疗效比复方丹参片好。 等级资料的比较(单项有序) 用非参统计 Proc npar1way; 例4某研究者对肝舒贴穴位敷贴治疗肝癌肝区疼痛的临床疗效进行观察,将60例肝癌病人随机分成两组,治疗组用肝舒贴穴位敷贴,对照组应用常规治疗。两组病人肝区疼痛缓解情况见下表 表4 两种方法治疗肝癌患者肝区疼痛的效果 治疗方法 完全缓解 明显缓解 中度缓解 轻度缓解 无效 合计 肝舒贴 9 12 4 3 2 30 常规治疗 5 6 10 7 2 30 建立假设检验 H0:两种治疗病人肝区疼痛缓解无差异。 H1:两种治疗病人肝区疼痛缓解有差异。 双侧α=0.05。 当要比较完全随机化设计的两组资料为等级资料时,选用秩和检验,本例用Wilcoxon符号秩和检验检验,正态近似检验的结果为Z= -2.0630,双侧P=0.0391<0.05,差异有统计学意义,故两种治疗病人肝区疼痛缓解有差异。秩次越高,效果越差,1组平均秩次25.97小于2组平均秩次的35.03,故1组效果比2组好。 该题可以用CMH方法计算行平均分检验统计量 程序中看(Row Mean Scores Differ) Logistic回归 非线性概率型模型 Y为分类变量,协变量为分类或连续性变量 估计协变量与Y的关联用OR及95%CI,有wald卡方检验 下表是运动和吸烟与冠心病关系的病例对照研究结果,变量赋值为:运动(:运动=1,不运动=0)、吸烟(:吸烟=1,不吸烟=0)、冠心病(:有=1,无=0)。本研究主要探讨运动与冠心病关系 表5 运动和吸烟与冠心病关系的病例对照研究的资料整理表 分析如下表(需画表格): 生存分析 例19-5 为从基因遗传角度探索某恶性肿瘤的预后,研究人员收集了69名患者的生存时间,生存结局及影响因素。变量及其赋值见表19-7,实际资料见表19-8。试采用Cox回归模型进行分析。 表19-7 变量赋值表 变量名称 因素 量化值 X1 发病年龄 岁 X2 性别 1=男;0=女 X3 有无不良染色体 1: 有;0: 无 X4 基因1 1: 突变型;0: 野生型 X5 基因2 1: 突变型;0: 野生型 X6 基因3 1: 突变型;0: 野生型 Y 是否死亡 1: 死亡;0: 删失 t 生存时间 月 单因素Cox模型分析 表19-9 单因素Cox模型分析结果 变量 参数(β) 标准误 似然比χ2 P值 RR 95%下限 95%下限 age -0.00938 0.01918 0.2392 0.6248 0.991 0.954 1.029 gender -1.63192 0.46016 12.5770 0.0004 0.196 0.079 0.482 chr -0.57123 0.36487 2.4511 0.1174 0.565 0.276 1.155 gene1 -1.82919 0.53845 11.5407 0.0007 0.161 0.056 0.461 gene2 0.70885 0.38484 3.3928 0.0655 2.032 0.956 4.319 gene3 0.28990 0.38616 0.5636 0.4528 1.336 0.627 2.848 多因素Cox模型分析 proc phreg data=cancer; model t*y(0)=age gender chr gene1 gene2 gene3 /risklimits selection=stepwise sle=0.05 sls=0.05; run; 针对研究目的列出相应统计量: gender P=0.0002<0.05 RR=0.183 95%可信区间 0.074-0.452 gen2 P=0.0328<0.05 RR=2.285 95%可信区间 1.070-4.880 男性是女性风险的0.183倍,女性风险高。 gen2突变型比野生型死亡风险增加2.285倍。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 统计财经学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服