资源描述
单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,医学数据统计处置和SAS软件的应用,*,医学数据统计处置和SAS软件的应用,SAS软件简介,SAS是美国与西欧使用最为广泛的三大著名统计分析软件(SAS,SPSS和SYSTAT)之一,是目前国际上最为流行的一种大型统计分析系统,被誉为统计分析的标准软件。是国际上公认的最权威的统计软件。,以苛刻严格著称于世的美国FDA新药审批程序中,新药试验结果的统计分析规定只能用SAS进行,其他软件的计算结果一律无效!哪怕只是简单的均数和标准差也不行!由此可见SAS的权威地位。,2004年开始中国新药临床试验结果规定应用SAS软件分析。,2,医学数据统计处置和SAS软件的应用,SAS与SPSS比较,作为统计软件大家族里的“傻瓜相机”,SPSS的功能是最弱的,但易用性排在所有统计软件之首。,不过SPSS的易用性也极大的限制了它的功能和可扩展性。除了SPSS本身的菜单提供的功能,用户无法通过编程或者插件来扩展它的功能,而且SPSS提供的都只是最基本的常用的方法。,3,医学数据统计处置和SAS软件的应用,SAS全球专业认证,SAS专业认证是一项拥有极高国际声誉的专业认证,在欧美等国的职场上流行的一句话“If you have a SAS certification,You will never lose your job”。,销售模式:只租不售(每5年一个周期),财富500强中97%的企业都在使用SAS商业智能解决方案,4,医学数据统计处置和SAS软件的应用,5,医学数据统计处置和SAS软件的应用,2003年(301医院与军事医科院博士生)各统计软件使用情况,6,医学数据统计处置和SAS软件的应用,Pubmed检索SCI英文文献各统计软件使用情况,7,医学数据统计处置和SAS软件的应用,SAS软件功能,进行数据管理,数据输入、建库、保存,进行统计分析,t,检验,方差分析,卡方检验,相关、回归,秩和检验,8,医学数据统计处置和SAS软件的应用,SAS的安装,SAS8.12版本是windows操作系统下的32位软件,和其他windows系统下的软件安装方法类似。用鼠标左键双击光盘根目录下的setup图标,然后按照提示安装。,9,医学数据统计处置和SAS软件的应用,SAS的启动,单击开始菜单“程序”项。,桌面上双击此快捷方式也可启动SAS。,10,医学数据统计处置和SAS软件的应用,执行开始菜单中程序单项,【程序】【The SAS,System】【The SAS,System for Windows】,11,医学数据统计处置和SAS软件的应用,SAS退出,方式1:选择关闭按钮,方式2:执行菜单命令【File】【Exit】,方式3:在命令框执行BYE或ENDSAS命令,12,医学数据统计处置和SAS软件的应用,SAS窗口,PGM窗口(Program Editor):,提供编写SAS程序的文本编辑器,LOG窗口:,显示执行程序过程中的相关信息,OUTPUT窗口:,显示程序运行的结果,命令窗口与探索者窗口,13,医学数据统计处置和SAS软件的应用,程序编辑窗口,日志窗口,结果输出窗口,探索者窗口,命令窗口,14,医学数据统计处置和SAS软件的应用,15,医学数据统计处置和SAS软件的应用,16,医学数据统计处置和SAS软件的应用,17,医学数据统计处置和SAS软件的应用,SAS程序的编写,一个完整的SAS程序一般由数据步(DATA步)和过程步(PROC步)两部分组成。,DATA步以DATA语句开始,通过指定数据集名称、定义变量名及类型和读入数据等建立SAS数据集。,过程步以PROC语句开始,通过调用不同的分析模块来分析SAS数据集。,18,医学数据统计处置和SAS软件的应用,其它格式的数据库直接导入转换:,excel(.xls,);,dbase(.dbf,);,lotus(.wk,),等,将数据读入系统,建立数据集(直接输入,Editor,窗口)。,SAS数据集建立,19,医学数据统计处置和SAS软件的应用,外部数据导入,例:有一批体检数据,包括受检者的姓名、性别、年龄、身高、体重信息。要求按性别分别计算身高、体重的描述性统计量:均值、标准差、最大值、最小值。,该数据以,Excel.xls文件形式储存。,文件名称:tijiandata.xls,20,医学数据统计处置和SAS软件的应用,21,医学数据统计处置和SAS软件的应用,Import Data,22,医学数据统计处置和SAS软件的应用,23,医学数据统计处置和SAS软件的应用,24,医学数据统计处置和SAS软件的应用,25,医学数据统计处置和SAS软件的应用,库标记,导入的SAS数据库文件名,26,医学数据统计处置和SAS软件的应用,27,医学数据统计处置和SAS软件的应用,探索者窗口,28,医学数据统计处置和SAS软件的应用,29,医学数据统计处置和SAS软件的应用,30,医学数据统计处置和SAS软件的应用,在Editor 程序编辑窗口输入源程序,数据步:将数据读入系统,建立数据集:,DATA语句开始,后面加上数据库的名字。,INPUT语句描述数据变量,用$表示变量是字符型,CARDS语句指示后面是数据,每行为一个观测数据,数据间无分号。,数据最后以“,;,”开头的空行结束。,每个语句都以“;”结束。,31,医学数据统计处置和SAS软件的应用,SAS程序数据步格式,Data ;,Input$.;,Cards;,.,.,.,;,32,医学数据统计处置和SAS软件的应用,数据步,过程步,33,医学数据统计处置和SAS软件的应用,SAS过程步,对数据集中数据进行分析、处理。,以PROC语句开始,调用SAS过程。,每个语句都以“;”结束。,整个程序最后要有RUN语句。,34,医学数据统计处置和SAS软件的应用,过程步,35,医学数据统计处置和SAS软件的应用,SAS程序的书写格式,不分大小写,单个名称中不能空格,不同名称间必须空格,一行可写多条语句,用分号分割,一条语句可写多行,数据行后不加分号,数据最后单独加分号行,程序用“RUN;”语句结束,36,医学数据统计处置和SAS软件的应用,运行SAS程序,方式一:鼠标点击执行按钮,方式二:按功能键“,F8”,方式三:执行菜单命令,RunSubmit,方式四:在命令框输入,SUBMIT,命令并执行,37,医学数据统计处置和SAS软件的应用,38,医学数据统计处置和SAS软件的应用,SAS程序实例,例子 某学生上学期8门课程的分数分别为88,90,87,76,92,78,80,86。试用SAS编程求其平均分数。,(1)在PGM窗口键入下列程序,data fenshu;,input chengji;,cards;,88 90 87 76 92 78 80 86,;,proc means;,var chengji;,run;,过程步,数据步,39,医学数据统计处置和SAS软件的应用,查看结果(output 窗口),Analysis Variable:chengji,N Mean Std Dev Minimum Maximum,-,8 84.6250000 5.8782286 76.0000000 92.0000000,-,从结果看出,该学生上学期8门课程的平均成绩为84.625。,40,医学数据统计处置和SAS软件的应用,查看运行过程及出错信息,激活,LOG,窗口,(F6),黑色文字,:源程序及运行情况,蓝色文字,:程序运行情况的说明信息,红色文字,:出错信息,绿色文字,:警告信息,41,医学数据统计处置和SAS软件的应用,42,医学数据统计处置和SAS软件的应用,保存SAS程序,及其他窗口内容,激活相应窗口,然后选择:,方式一:鼠标点击“存盘”工具按钮,方式二:执行菜单命令,【,File】【Save,】/【Save as】,可保存程序、数据文件、运行结果、日志等。,SAS,保存成纯文本格式文件(,.txt),。,43,医学数据统计处置和SAS软件的应用,保存的文件的名,44,医学数据统计处置和SAS软件的应用,在SAS系统内打开已保存的文件,只能在Program Edit窗口打开文件,选择:,方式一:鼠标点击“打开”工具按钮,方式二:执行菜单命令【File】【Open】,可打开以前保存的程序、数据文件、运行结果、日志等文件及其他文本格式的文件。,45,医学数据统计处置和SAS软件的应用,SAS程序主要关键词,means;,(n,mean,std,Q1,Q3,CV,median,clm),univariate normal;,(正态性检验,均数是否为0的,假设检验:参数与非参数检验),ttest;,(两个样本均数比较的t检验),anova;,(各样本含量相等的方差分析),glm;,(各样本含量不等的方差分析),npar1way;,(非参数检验),reg;,(线性回归方程:单元或多元),corr;,(线性相关:线性相关或秩相关),freq;,(卡方、Fisher检验),logistic;,(非线性回归),lifetest;,(生存分析),proc,46,医学数据统计处置和SAS软件的应用,定量资料的描述性分析,47,医学数据统计处置和SAS软件的应用,分析结果,48,医学数据统计处置和SAS软件的应用,定量资料的正态性检验,49,医学数据统计处置和SAS软件的应用,正态性检验结果,50,医学数据统计处置和SAS软件的应用,配对设计的t-test,为了比较两种方法对乳酸饮料中脂肪的含量测定结果是否不同,随机抽取了10份乳酸饮料制品,分别采用哥特里-罗紫法和脂肪酸水解法测定其结果,问两种方法检测结果是否不同?,编号,哥特里-罗紫法,脂肪酸水解法,1,0.840,0.580,2,0.591,0.509,3,0.674,0.500,4,0.632,0.316,5,0.687,0.337,6,0.978,0.517,7,0.750,0.454,8,0.730,0.512,9,1.200,0.997,10,0.870,0.506,51,医学数据统计处置和SAS软件的应用,52,医学数据统计处置和SAS软件的应用,53,医学数据统计处置和SAS软件的应用,成组设计资料的t-test,国产药,进口药,-5,-17,64,48,63,47,77,60,74,58,-2,-14,89,72,77,48,63,61,70,54,36,22,82,66,-14,采用国产药物和进口药物治疗绝经后妇女骨质疏松症,试比较两种药物的疗效是否有差别,54,医学数据统计处置和SAS软件的应用,55,医学数据统计处置和SAS软件的应用,56,医学数据统计处置和SAS软件的应用,完全随机设计资料的方差分析(,教科书73页),安慰剂组,2.4g组,4.8g组,7.2g组,3.53,2.42,2.86,0.89,4.59,3.36,2.28,1.06,4.34,4.32,2.39,1.08,2.66,2.34,2.28,1.27,3.59,2.68,2.48,1.63,3.13,2.95,2.28,1.89,4.04,2.63,2.32,1.74,3.53,2.86,2.61,2.16,3.65,2.93,3.64,3.37,3.85,2.17,2.58,2.97,4.07,2.72,3.65,1.69,3.93,2.22,3.68,2.11,4.19,2.90,2.65,2.81,2.96,2.97,3.02,2.52,57,医学数据统计处置和SAS软件的应用,58,医学数据统计处置和SAS软件的应用,方差齐性检验,59,医学数据统计处置和SAS软件的应用,60,医学数据统计处置和SAS软件的应用,61,医学数据统计处置和SAS软件的应用,62,医学数据统计处置和SAS软件的应用,63,医学数据统计处置和SAS软件的应用,64,医学数据统计处置和SAS软件的应用,65,医学数据统计处置和SAS软件的应用,四格表资料的,2,-test,组别,有效,无效,合计,有效率,胞磷胆碱,46,6,52,88.5%,神经节苷脂,18,8,26,69.2%,合计,64,14,78,82.1%,某医师欲比较胞磷胆碱与神经节苷脂治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,试比较两种药物的疗效,66,医学数据统计处置和SAS软件的应用,67,医学数据统计处置和SAS软件的应用,68,医学数据统计处置和SAS软件的应用,配对四格表资料的,2,-test,配对设计的卡方检验,70,医学数据统计处置和SAS软件的应用,71,医学数据统计处置和SAS软件的应用,72,医学数据统计处置和SAS软件的应用,73,医学数据统计处置和SAS软件的应用,非参数检验(配对),74,医学数据统计处置和SAS软件的应用,75,医学数据统计处置和SAS软件的应用,76,医学数据统计处置和SAS软件的应用,非参数检验,9D,11C,DSC,2,5,3,2,5,5,2,6,6,3,6,6,4,6,6,4,7,7,4,8,7,5,10,9,7,12,10,7,11,11,比较小白鼠接种三种不同菌型伤寒杆菌9D、11C、DSC1后存活的日数。,77,医学数据统计处置和SAS软件的应用,78,医学数据统计处置和SAS软件的应用,79,医学数据统计处置和SAS软件的应用,80,医学数据统计处置和SAS软件的应用,81,医学数据统计处置和SAS软件的应用,82,医学数据统计处置和SAS软件的应用,直线相关与回归,年龄,尿肌酐含量,13,3.54,11,3.01,9,3.09,6,2.48,8,2.56,10,3.36,12,3.18,7,2.65,某地方病研究所调查了,8,名正常儿童的尿肌酐含量,试估计尿肌酐含量对其年龄的回归方程。,83,医学数据统计处置和SAS软件的应用,回归,相关,84,医学数据统计处置和SAS软件的应用,85,医学数据统计处置和SAS软件的应用,86,医学数据统计处置和SAS软件的应用,
展开阅读全文