收藏 分销(赏)

SAS基础知识.ppt

上传人:天**** 文档编号:5887133 上传时间:2024-11-22 格式:PPT 页数:135 大小:1,009.50KB 下载积分:20 金币
下载 相关 举报
SAS基础知识.ppt_第1页
第1页 / 共135页
SAS基础知识.ppt_第2页
第2页 / 共135页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,*,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,SAS 统计分析系统,S,tatistical,A,nalysis,S,ystem,辽宁爱母医疗器械有限公司,研发中心,刘伟,1,SAS软件简介,1966年美国North Carolina大学的两位生物统计学研究生开始研制SAS系统,直至1976年成立了SAS软件研究所,正式推出了SAS软件,1985年推出微机版SAS。,SAS是用于决策支持的大型集成信息系统,软件系统最早的功能限于统计分析,现在统计分析功能也仍是它的重要组成部分和核心功能。SAS现在的最新版本为9.1版,大小约为1GB。,2,在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在9697年度被评选为建立数据库的首选产品,堪称统计软件界的巨无霸。,经过多年的发展,SAS已经被全世界120多个国家和地区的近三万家机构所采用,直接用户超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。,3,由于SAS系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行设计,因此操作以SAS语言编程为主,另外也有非编程方式的菜单系统,但人机对话的界面不太友好。,学习SAS软件时,需要用户有基本的统计学知识,对所选用的统计方法有较清楚的了解,没有统计学基础知识要掌握SAS软件较为困难。,4,第一节 SAS软件的使用基础,5,标题栏、菜单栏、命令框、工具栏,编辑器 程序编辑窗口,日志 运行过程日志窗口,输出 结果输出窗口,资源管理器,/,结果,SAS,常用功能键,窗口间切换,F5,编辑器,F8,SUBMIT (提交程序),F6,日志,F1,HELP (帮助),F7,输出,F9,KEYS (功能键列表),二、SAS的工作窗口,6,例:一组体检资料,包括姓名、性别、年龄、身高、体重,要求分性别计算身高、体重的均数、标准差、最大值、最小值。,姓名 性别 年龄 身高 体重,ZHANGLIN F 47 156.3 47.1,ZHAOHUA M 38 172.4 61.5,WANGQANG M 41 169.2 64.5,LIULI F 52 158.2 53.6,SHIDONG F 39 160.1 48.0,KONGYING M 29 174.1 64.6,LILING F 37 152.3 42.2,GUANFEN M 32 166.2 60.2,MIAOQING M 26 180.3 74.3,NIUHUA M 31 178.2 80.2,TANGJIE F 35 169.2 60.8,GAOJUN M 24 176.0 73.3,SUNHONG F 27 158.3 49.9,三、SAS程序构成,7,DATA AA1,;,INPUT NAME$SEX AGE HEIGHT WEIGHT;,CARDS;,ZHANGLIN 2 47 156.3 47.1,ZHAOHUA 1 38 172.4 61.5,WANGQANG 1 41 169.2 64.5,LIULI 2 52 158.2 53.6,SHIDONG 2 39 160.1 48.0,KONGYING 1 29 174.1 64.6,LILING 2 37 152.3 42.2,GUANFEN 1 32 166.2 60.2,MIAOQING 1 26 180.3 74.3,NIUHUA 1 31 178.2 80.2,TANGJIE 2 35 169.2 60.8,GAOJUN 2 24 176.0 73.3,SUNHONG 2 27 158.3 49.9,;,PROC MEANS;,CLASS SEX;,VAR HEIGHT WEIGHT;,RUN;,数据步,过程步,8,DATA STEP(,数据步,),以,DATA,语句开始,将数据读入,SAS,系统,建立,SAS,数据集,PROCEDURE STEP(,过程步,),以,PROC,语句,开始,调用各种已编好的,过程,处理和分析数据,RUN,(,结束,),整个程序的最后必须要有,RUN,语句结束,表示要执行以上全部任务。,9,1.SAS程序编写规则,SAS程序编写只能在编辑窗口,语句书写格式自由,每个语句以“,;,”结束;,可以在一行中写几个语句,或把一个语句写在几行中;,SAS,语言不区分字母大小写,变量,A1=,a1,、,PROC=,proc,、,DATA AA=data,aa,程序任何部位可以加注释语句,(,不执行语句,),:,/*,this is a small sample,*/,四、SAS软件的常用操作,10,2.运行SAS程序,工具栏提交按钮,功能键“,F8,”,(提交,),菜单栏,运行 提交,命令框键入“,Submit”,命令,自动激活,“,输出,”,窗口,出现程序运行结果,11,3.调试SAS程序,没出现结果窗口,或结果不理想时。,激活,日志,窗口(,F6,),查看运行过程及出错信息,黑色文字:源程序,蓝色文字:程序运行情况说明信息,红色文字:出错信息,绿色文字:警告信息,激活,编辑,窗口(,F5,),修改错误后重新发送,12,4.保存SAS各窗口的内容,激活相应窗口,常用工具栏 存盘按钮,菜单栏 文件 保存(另存为),命令框输入,File,命令,可以分别保存程序、运行结果、日志,13,5.打开已保存的程序、结果等,只能在编辑窗口,常用工具栏 打开按钮,菜单栏 文件 打开,命令框输入,Include,命令,可打开以前保存的程序、运行结果、日志等文件及其他文本格式的文件。,14,1.SAS的操作符,算术操作符:,加,+,、减,-,、乘,*,、除,/,、乘方,*,比较操作符:,等于,EQ,或,=,、大于,GT,或,、,小于,LT,或,=,、小于等于,LE,或,=,逻辑操作符:,AND,或,&,、,OR,或,、,NOT,或,五、SAS编程基础,15,2.常用SAS函数:,LOG(x)以e为底的自然对数,LOG10(x)以10为底的常用对数,EXP(x)以e为底的反对数,SQRT(x)平方根,ABS(x)绝对值,INT(x)取整数(不四舍五入),ROUND(x)取整数(四舍五入),MOD(x,y)取x/y的余数,SIN(x)正弦,COS(x)余弦 三角函数(x是弧度),TAN(x)正切,16,3.SAS表达式,用来赋值新的变量、转换变量、计算结果、建立条件表达式等,如:,赋值变量 Y=100,转换变量 X2=LOG(X1),计算结果 Y=35.12+X1*2.58/100,条件表达式 G=(AGE65)、Y=(X1=X2)、,AGE64,SEX=1 AND AGE40;,IF X1=3 (不等于),IF SEX=1 AND AGE60,IF AGE20 AND AGE|t|=|M|=|S|.0001,分位数(定义 5),分位数 估计值,100%最大值 2.110,99%2.110,95%2.070,90%1.870,75%Q3 1.615,50%中位数 1.270,分位数 估计值,25%Q1 0.825,10%0.640,5%0.640,1%0.540,0%最小值 0.540,38,极值观测,-最小值-最大值-,值 观测 值 观测,0.54 12 1.80 8,0.64 14 1.87 9,0.64 13 1.87 24,0.75 15 2.07 10,0.76 16 2.11 11,39,正态性检验,检验 -统计量-P值-,Shapiro-Wilk W 0.962132 Pr W D W-Sq A-Sq 0.0050,小样本(n50)时用W法,样本量50n1000时用D法,Normal选项结果,40,茎 叶#盒式图,90 0 1 0,88 000 3 0,86 00 2|,84 00 2|,82 000 3|,80 0000 4|,78 0000000000000000 16|,76 0000000000000000 16|,74 00000000 8 +-+,72 000000000000000 15|,70 00000000000000000000000000000 29 *-+-*,68 00000000000000000000000000 26|,66 000000000000000000000 21 +-+,64 000000000000000 15|,62 00000000000000 14|,60 0000000000000000 16|,茎叶图,盒式图,PLOT选项结果,41,91+*,|*,|*+,85+*+,|*+,|*+,79+*,|*+,|*+,73+*,|*,|*,67+*,|*,|*,61+*+,+-+-+-+-+-+-+-+-+-+-+,-2 -1 0 +1 +2,正态概率分布图(,Normal Probability Plot,),42,二、定性资料统计描述,FREQ 过程,可以产生频数表和 n 维列联表,PROC FREQ;,TABLES,A;RUN;,TABLES 指定要分析的定性变量,TABLES A 产生一维频数表,TABLES A*B 产生二维列联表(A是行B是列),TABLES A*B*C 产生三维列联表,(A是分层,B是行,C是列),TABLES A*(B C)产生A*B、A*C两,个二维表,TABLES X1-X3 产生X1、X2、X3三个一维表,TABLES (X1-X4)*Y 产生X1*Y X2*Y X3*Y X4*Y,四个二维表,43,如描述以下三个定性变量(258人),A文化程度(1=文盲2=初中以下3=高中4=大学),B工作强度(1=轻 2=中 3=重),C月收入 (1=|t|,236.67 586.60 151.46 1.56 0.1405,P0.05,不拒绝H,0,,尚不能认为开展孕期保健指导对新生儿体重有影响,。,50,用,UNIVARIATE,过程,DATA AA6;INPUT X;CARDS;,2800 3400 2900 2750 3000 3100 4600 3900,2350 3500 2600 3700 3800 2950 3200,;,PROC UNIVARIATE,MU0=3000,;VAR X;RUN;,结果,位置检验:Mu0=3000,Test -Statistic-p Value-,学生 t t 1.562584 Pr|t|0.1405,P0.05,不拒绝H,0,,尚不能认为开展孕期保健指导对新生儿体重有影响,。,51,二、配对设计 t 检验,为了比较新旧两个测声计的测定效果,随机选定10个场地,在每地同时用新旧两个测声计测量数据如下,问新旧两个测声计的测量结果是否不同?,场地 1 2 3 4 5 6 7 8 9 10,旧:87 65 74 95 65 55 63 88 61 54,新:86 66 77 95 60 53 62 85 59 55,52,配对设计 t 检验用,MEANS,过程,DATA AA7;INPUT X1 X2;,Y=X1-X2,;CARDS;,87 86 65 66 74 77 95 95 65 60,55 53 63 62 88 85 61 59 54 55,;,PROC MEANS MEAN STD STDERR T PRT;VAR Y;RUN;,结果,均值 标准偏差 标准误差 t值 Prob|t|,0.90 2.28 0.72 1.25 0.2440,P0.05,不拒绝H,0,,尚不能认为新旧两个测声计的测定结果有差别。,53,三、两样本均数比较,试比较克山病人与健康人的血磷值(mmol/L)是否不同?,克山病人 0.84 1.05 1.20 1.20 1.39 1.53,1.67 1.80 1.87 2.07 2.11,健康人 0.54 0.64 0.64 0.75 0.76 0.81,1.16 1.20 1.34 1.35 1.48 1.56,1.87,54,两样本均数比较用,TTEST,过程,DATA AA8;INPUT X;,IF _N_11 THEN G=1;ELSE G=0;,CARDS;,0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87,;,PROC,TTEST,;,CLASS G,;VAR X;RUN;,在,TTEST,过程中,分组变量,G,只能是两分类。,55,条件语句 IF THEN/ELSE,IF,后面是条件的表达式,如果满足条件就执行,THEN,后面操作,否则(不满足条件),就执行,ELSE,后面的操作(,ELSE可选,)。,IF X4=0 THEN X4=.;,IF CJ2 AND X5=1 THEN Y=1;ELSE Y=2;,_N_,是SAS数据步中自定义的变量,它的值表示观测的序号。,IF _N_11 THEN G=1;ELSE G=0;,也可用,G=(_N_11);,赋值分组变量G:前11个观测G=0,超过11时G=1。,56,Lower CL Upper CL,Variable G N Mean Mean Mean,变量 分组 人数 均数下限 均数 均数上限,X 0 11 1.2375 1.5209 1.8043,X 1 13 0.8295 1.0846 1.3397,X,Diff(1-2),0.0778 0.4363 0.7948,两组之差,Lower CL Upper CL,Std Dev Std Dev Std Dev Std Err,标准差下限 标准差 标准差上限 标准误,0.2947 0.4218 0.7402 0.1272,0.3027 0.4221 0.6969 0.1171,0.3264 0.4220 0.5973 0.1729,结果,Statistics,统计量描述,57,结果(续),T-Tests,t 检验,Variable Method Variances DF t Value Pr|t|,变量方法 方差自由度 t值 值,X Pooled Equal 22 2.52 0.0193,X Satterthwaite Unequal 21.4 2.52 0.0196,结论:P F,变量方法分子自由度 分母自由度 F值 值,X Folded F 12 10 1.00 1.0000,结论:,P0.10,不拒绝H0,可以认为两样本方差齐。,58,两大样本均数比较时,如只有均数标准差,而无原始数据时,无法直接调用SAS软件中的某个过程进行分析,只能在数据步中按照计算公式编写程序完成。,调查健康人群红细胞数(10,12,/L)资料如下:,男性360人,均数466.02,标准差57.46;,女性255人,均数417.80,标准差29.10。,试比较男女红细胞数有无差别?,59,DATA BB;,INPUT N1 X1 S1 N2 X2 S2;,SE=SQRT(S1*S1/N1+S2*S2/N2);,U=ABS(X1-X2)/SE;,P1=1-PROBNORM(U);,P=2*P1;,U=ROUND(U,0.001);,P=ROUND(P,0.00001);,IF P0.0001 THEN P=0.0001;,FILE PRINT;,PUT#2 10 U=25 P=;,CARDS;,360 466.02 57.46 255 417.80 29.10,;,RUN;,60,第五节 定量资料假设检验(2)方差分析,一、单因素方差分析,用于完全随机设计,(成组设计)资料,例:比较三组人群载脂蛋白测定值有无差别?,糖尿病,IGT异常,健康人,85.7,96.0,144.0,105.2,124.5,117.0,109.5,105.1,110.0,96.0,76.4,109.0,115.2,95.3,103.0,95.3,110.0,123.0,110.0,95.2,127.0,106.5,99.0,121.0,125.6,120.0,115.0,100.0,159.0,111.0,61,方差分析用,ANOVA,过程,DATA AA9;INPUT X;,IF _N_20 THEN G=3;,ELSE G=2;,CARDS;,85.7 105.2 109.5 96.0 115.2 95.3,;,PROC MEANS;CLASS G;VAR X;,PROC,ANOVA,;CLASS G;,MODEL X=G,;,MEANS G/SNK,;RUN;,在SNK后面加,HOVTEST,可以作方差齐性检验,62,结果,Analysis of Variance Procedure,方差分析过程,Dependent Variable:X,Source DF Sum of Squares Mean Square F Value Pr F,变异来源 自由度 SS MS F P,Model,模型,2 2384.02550505 1192.01275253 5.85 0.0077,Error,误差,27 5497.83616162 203.62356154,Total,总,29 7881.86166667,R-Square,R,2,Coeff Var,C.V.,Root MSE,Sy.x,X Mean,0.302470 12.93519 14.26967279 110.31666667,Source DF Anova SS Mean Square F Value Pr F,变异来源 自由度 SS MS F P,G,组间,2 2384.02550505 1192.01275253 5.85 0.0077,P0.01,拒绝H,0,,接受H,1,,可以认为三组人群载脂蛋白不同。,63,结果(续),Student-Newman-Keuls test for variable:X,均数间两两比较q检验(SNK法),Means with the same letter are not significantly different.,相同字母表示的均数无显著性差别,SNK Grouping Mean N G,A 122.800 10 3,B 105.455 11 1,B,B 102.389 9 2,第三组高于前两组,即健康人的载脂蛋白高于两组病人。,64,单因素方差分析时,如只有各组的均数、标准差,而无原始数据时,无法直接调用SAS软件中的某个过程进行分析,只能在数据步中按照计算公式编写程序完成。,例:研究不同季节人体肾上腺皮质3-HSD活性变化,季节,N,Means,Std dev,春季,42,0.78,0.13,夏季,40,0.69,0.22,秋季,32,0.68,0.14,冬季,36,0.58,0.20,65,DATA AA;INPUT K XX;,DO I=1 TO K;INPUT N X S;OUTPUT;,SS1+(XX-X)*(XX-X)*N;SS2+S*S*(N-1);NN+N;,END;,SS1=SS1/(K-1);SS2=SS2/(NN-K);F=SS1/SS2;,P=1-PROBF(F,K-1,NN-K);,F=ROUND(F,0.001);,P=ROUND(p,0.00001);,IF P F,Model,模型,9 2521.29375 280.14375 11.52 0.0001,Error,误差,14 340.54250 24.32446,Total,总,23 2861.83625,R-Square,Coeff Var Root MSE X Mean,0.881006 8.860514 4.93198381 55.6625,Source DF Anova SS Mean Square F Value Pr F,I,处理间,2 144.9175 72.45875 2.98 0.0836,J,区组间,7 2376.37625 339.48232 13.96 0.0001,处理间P0.05,不拒绝H,0,,尚不能认为三种营养素喂养小鼠增重有差别;区组间P F,Model 9 6396.5625 710.7292 4.02 0.0521,Error 6 1059.8750 176.6458,Total 15 7456.4375,R-Square C.V.Root MSE X Mean,0.857858 25.46743 13.29081763 52.1875,Source DF Anova SS Mean Square F Value Pr F,CX 3 773.1875 257.7292 1.46 0.3167,DW 3 270.68750 90.2292 0.51 0.6894,YW 3 5352.68750 1784.2292 10.10 0.0092,四种药物之间PB、C。而动物之间和用药次序均无影响。,75,四、析因实验设计的方差分析,可以分析各因素之间的交互作用。,例:用新、旧两法分别提取某食品中甲、乙两种化合物,观察回收率有无差别(包括方法间、化合物间及方法与化合物间交互作用)。,新法(A1),旧法(A2),甲物(B1),乙物(B2),甲物(B1),乙物(B2),52,84,52,47,48,88,44,64,44,90,40,52,44,88,26,45,合计,188,350,162,208,76,DATA AA12;,DO A=1 TO 2;DO B=1 TO 2;,DO I=1 TO 4;,INPUT X;OUTPUT;,END;END;END;,CARDS;,52 48 44 44 84 88 90 88,52 44 40 26 47 64 52 45,;,PROC ANOVA;CLASS A B;,MODEL X=A B,A*B,;,RUN;,77,结果,Analysis of Variance Procedure,Dependent Variable:X,Source DF Sum of Squares Mean Square F Value Pr F,Model 3 5309.00 1769.67 33.39 0.0001,Error 12 636.00 53.00,Total 15 5945.00,R-Square C.V.Root MSE X Mean,0.893019 12.82839 7.28 56.75,Source DF Anova SS Mean Square F Value Pr F,A 1 1764.00 1764.00 33.28 0.0001,B 1 2704.00 2704.00 51.02 0.0001,A*B 1 841.00 841.00 15.87 0.0018,不同方法、不同化合物间均有差别,且交互作用也有统计学意义。,新法高于旧法,乙物高于甲物,以新法+乙物为最佳组合。,78,五、交叉实验设计的方差分析,研究新药催醒宁对麻醉剂的作用,将6只大鼠配成3对,随机决定每对中1只接受处理的顺序(催醒宁或生理盐水),等动物完全清醒3天后将实验组和对照组动物互换,同法重复试验一次。结果如下:,(Y 药物组 D 对照组),动物编号,1,2,3,4,5,6,第1次,Y 15,D 31,Y 17,D 30,D 25,Y 5,第2次,D 27,Y 25,D 28,Y 14,Y 18,D 26,79,DATA AA13;,DO CX=1 TO 2;DO DW=1 TO 6;,INPUT YW$X;OUTPUT;,END;END;,CARDS;,Y 15 D 31 Y 17 D 30 D 25 Y 5,D 27 Y 25 D 28 Y 14 Y 18 D 26,;,PROC ANOVA;,CLASS CX DW YW;,MODEL X=CX DW YW;,RUN;,80,结果,Analysis of Variance Procedure,Dependent Variable:X,Source DF Sum of Squares Mean Square F Value Pr F,Model 7 621.5833 88.7976 5.85 0.0535,Error 4 60.6667 15.1667,Total 11 682.2500,R-Square C.V.Root MSE X Mean,0.911079 17.90547 3.8944 21.75,Source DF Anova SS Mean Square F Value Pr F,CX 1 18.75 18.75 1.24 0.3285,DW 5 158.75 31.75 2.09 0.2470,YW 1 444.08 444.08 29.28 0.0057,药物间P F,Model 5 141.0000000 28.2000000 11.28 0.0834,Error 2 5.0000000 2.5000000,Corrected Total 7 146.0000000,R-Square Coeff Var Root MSE X Mean,0.965753 1.747115 1.581139 90.50000,Source DF Anova SS Mean Square F Value Pr F,A 1 8.00000000 8.00000000 3.20 0.2155,B 1 18.00000000 18.00000000 7.20 0.1153,C 1 60.50000000 60.50000000,24.20 0.0389,D 1 4.50000000 4.50000000 1.80 0.3118,A*B 1 50.00000000 50.00000000,20.00 0.0465,C因素(土壤含水量)、A*B交互项(温度含氧量)对产卵数有影响,从实验结果可见,当A*B,=2且,C=2时,产卵数最高。,84,七、重复测量资料的方差分析,剂型,受试者,1h,2h,4h,6h,8h,胶,囊,型,1,9.73,54.61,55.91,46.81,47.56,2,5.50,50.87,79.90,62.37,55.03,3,7.96,23.43,64.10,56.00,45.15,4,2.37,18.65,73.10,76.05,60.80,5,6.50,32.08,73.45,76.27,60.23,片,剂,型,1,0.84,25.00,53.80,44.25,32.38,2,2.14,14.10,69.77,66.65,54.43,3,2.30,53.40,73.83,62.00,57.31,4,6.17,25.85,45.80,53.25,47.95,5,2.45,53.30,58.80,57.80,71.10,比较某药物不同剂型的体内代谢速度,将10名受试者随机分为两组,分别在服药后1、2、4、6、8小时测定血中药物浓度(ug/ml),数据如下表:,85,DATA AA10;,INPUT G T1 T2 T4 T6 T8;,CARDS;,1 9.7354.6155.9146.8147.56 1 5.5050.8779.9062.3755.03,1 7.9623.4364.1056.0045.15 1 2.3718.6573.1076.0560.80,1 6.5032.0873.4576.2760.23 2 0.8425.0053.8044.2532.38,2 2.1414.1069.7766.6554.43 2 2.3053.4073.8362.0057.31,2 6.1725.8545.8053.2547.95 2 2.4553.3058.8057.8071.10,;,PROC ANOVA;CLASS G;,MODEL T1 T2 T4 T6 T8=G;,REPEATED T 5/PRINTE;,RUN;,86,结果,协方差阵的球形性检验,Sphericity Tests,Mauchlys,Variables DF Criterion Chi-Square Pr ChiSq,Transformed Variates 9 0.0557167 18.527972 0.0295,Orthogonal Components 9 0.0515572 19.025819 0.0250,P F),87,结果(续),处理间比较,Repeated Measures Analysis of Variance,Tests of Hypotheses for Between Subjects Effects,Source DF Anova SS Mean Square F Value Pr F,G 1 240.945152 240.945152 1.11 0.3229,Error 8 1736.677488 217.084686,两种剂型间血药浓度差异无统计学意义(P=0.3229)。,组内时间比较,Repeated Measures Analysis of Variance,Univariate Tests of Hypotheses for Within Subject Effects,Adj Pr F,Source DF Anova SS Mean Square F Value Pr F,G-G H-F,T 4 24102.42614 6025.60654 55.46 .0001 .0001 .0001,T*G 4 111.78283 27.94571 0.26 0.9031 0.7711 0.8489,Error(T)32 3476.94159 108.65442,不同测量时间的血药浓度不同(P0.05,不拒绝H,0,,尚不能认为VC有增效作用,(1)二项分布直接概率法,90,(2)Poisson分布直接概率法,国家规定饮用水中大肠菌数平均不得超过3个/L。现从某水源地抽取水样1L测得大肠菌4个,问该水源是否符合饮用水条件?,该资料服从Poisson分布,己知=3,求X4的概率。可以用Poisson分布函数,POISSON(,x),求得。,DATA BB;Q=,POISSON,(3,3);P=1-Q;,PROC PRINT;RUN;,结果:,OBS Q P,1 0.64723 0.35277,P0.05,不拒绝H,0,,尚不能认为细菌数超标。,91,(3)大样本正态近似法u检验,一般胃溃疡患者中有20%会发生胃出血症状。某医院观察65岁以上溃疡病人304例,有96人发生胃出血。问老年胃溃疡患者是否容易出血?,己知=0.2,n=304,x=96,可以用u检验。,DATA BB;INPUT P N X;S=SQRT(P*(1-P)/N);,U=ABS(X/N-P)/S;P1=1-PROBNORM(U);,P=2*P1;U=ROUND(U,0.001);P=ROUND(P,0.00001);,IF P0.0001 THEN P=0.0001;,FILE PRINT;PUT#2 10 u=25 P=;CARDS;,0.2 304 96,;,RUN;,结果:,u=5.047 P=0.0001,92,二、样本率之间比较,2,检验,用两种药物治疗十二肠溃疡疗效比较,药物,愈合,未愈合,合计,愈合率,呋喃硝胺,54,8,62,87.10,甲氰咪胍,44,20,64,68.75,合计,98,28,126,77.78,93,DATA BB;DO I=1 TO 2;DO J=1 TO 2;,INPUT F;OUTPUT;END;END;,CARDS;,54 8 44 20,;,PROC FREQ;TABLES I*J/,CHISQ,;,WEIGHT F,;RUN;,WEIGHT,语句指明变量 F 是频数,加选项,EXACT,可以对R行C列表计算Fisher确切概率,EXPECTED,可以显示每个格子的理论值,CMH,可以计算队列研究和病例对照研究的RR值,NOROW、NOCOL、NOPERCENT,不显示相应百分数,NOPRINT,不显示表格,只显示计算的统计量,2,检验用FREQ过程加,CHISQ,选项,94,结果,I*J 表的统计量,统计量 自由度 值 概率,2,1,6.133,0.013,似然比,2,1 6.304 0.012,连续校正,2,1,5.118,0.024,Mantel-Haenszel,2,1 6.084 0.014,Phi系数 0.221,列联系数 0.215,Cramer的V 0.221,Fisher 精确检验,单元格(1,1)频数(F)54,左侧 Pr=F 0.9968,右侧 Pr=F,0.0112,表概率(P)0.0080,双侧 Pr=P 0.0179,样本大小=126,95,由原始数据计算:,如258人资料,三个定性变量,A文化程度(1=文盲2=初中以下3=高中4=大学),B工作强度(1=轻 2=中 3=重),C月收入 (1=300 2=300-3=500-4=1000-),试分析文化程度与月收入之间的关系,DATA AA4;INPUT A B C;CARDS;,3 2 3 4 1 4 4 1 3,;,PROC FREQ;TABLES A*C/CHISQ;RUN;,96,三、配对定性资料的,2,检验,用甲乙两种血清学方法检查鼻咽癌患者血清410份。问两法的检出率有无差别?,甲法,乙法,+,-,合计,+,261,87,348,-,31,31,62,合计,292,118,410,97,DATA BB;DO I=1 TO 2;DO J=1 TO 2;,INPUT F;OUTPUT;END;END;,CARDS;,261 87 31 31,;,PROC FREQ;TABLES I*J/,AGREE,;WEIGHT F;RUN;,AGREE,选项作定性资料的一致性检验,计算,2,和Kappa统计量,Kappa0.75很满意。,配对四格表资料计算 McNemars,2,统计量,配对RC表(方表)计算Bowker对称性检验Q,B,统计量,Q,B,近似服从DF=R(R-1)/2的,2,分布。,当PS 0.0001,P0.01,拒绝H,0,,接受H,1,,可以认为甲、乙两法的检出率不同,甲法检出率高于乙法。,简单 Kappa 系数,Kappa 0.1823 95%置信下限,0.2815,渐近标准误差 0.0506 95%置信下限 0.0832,Sample,Size=410,Kappa值的假设检验:H,0,:Kappa=0 H,1,:Kappa0,u=Kappa/SE=0.1823/0.0506=3.57 PS 0.4144,Kappa 统计量,统计量 值 标准误差 95%置信限,简单 Kappa 0.681 0.050 0.5830 0.7788,加权 Kappa 0.661 0.056 0.5516 0.7711,样本大小=147,对称性检验,:P0.05,不拒绝H0,认为该资料服从对称分布。,一致性检验,:u=Kappa/Ase=13.6,P|t|0.0575,符号检验,符号 M 2 Pr=|M|0.2891,符号秩和检验,符号秩,S,15 Pr=|S|0.0391,S=T,+,(T,+,+T,-,)/2,详细描述结果,103,(2)成组设计资料,成组设计资料秩和检验用,NPAR1WAY,过程,两组比较时,可作Wilcoxon法计算u值,加 EXACT 语句计算确切概率,多组比较时,可作Kruskal-Wallis法计算,2,值,例:试比较两组工人的血铅值有无差别。,铅作业组:0.82 0.87 0.97 1.21 1.64 2.08 2.13,非铅作业组:0.24 0.24 0.29 0.33 0.44 0.58 0.63 0.72 0.87 1.01,104,DATA AA15;INPUT X;G=(_N_Z 0.0043 Two,-Sided Pr,|Z|0.0034 t-Test,Approximation,t 近似,One
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服