收藏 分销(赏)

研究生SAS教程.ppt

上传人:丰**** 文档编号:10174804 上传时间:2025-04-25 格式:PPT 页数:65 大小:457.50KB
下载 相关 举报
研究生SAS教程.ppt_第1页
第1页 / 共65页
研究生SAS教程.ppt_第2页
第2页 / 共65页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第一次实验,1.了解SAS系统功能,2.熟悉SAS的页面操作,3.熟悉SAS/BASE一些常用的语句,要求,:,(1),掌握数据的输入输出(data input put output cards等语句的配合使用);,(2)掌握常用的基础统计计算(二项、正态等分布的概率函数值和分位数的计算);,(3)熟悉数据的图形显示功能,1,第一讲 SAS系统概述,一、什么是 SAS系统,二、SAS/BASE简介,2,一、什么是 SAS系统,SAS系统是一个模块化的集成软件系统,提供数据访问、数据管理、数据分析、数据呈现。包括:,1.基本部分(也是核心部分):BASE SAS;,2.统计分析:SAS/STAT;,3.高级绘图:SAS/GRAPH;,4.矩阵运算:SAS/IML;,5.运筹学和线性规划:SAS/OR;,6.经济预测和时间序列分析:SAS/ETS;,7.面向任务的菜单驱动界面:SAS/ASSIST,3,二、SAS系统的特点,2.SAS语言是编程能力强且简洁易学的非过程语言,3.SAS系统把数据处理与统计分析融为一体,4.适用性强、应用面广,二、SAS系统的特点,1.使用灵活方便、功能齐全,4,三、SAS/BASE简介,主要功能是:,可以单独使用,也可以同其它软件产品一起组成一个用户化的SAS系统。,3.报表生成和图形显示功能,1.数据管理,2.基础统计计算功能,5,1.数据管理功能:,(1)信息存贮和检索:,可用任何格式读入数据值,然后组成SAS数据集。具有很强的与外部文件交换信息的功能,可以用文件操作管理方法把不同数据集的数据组合在一起,供SAS过程分析处理,生成报表.,(2)数据修改与程序设计:,(3)文件操作:,用于,对数据进行编辑、整理、连接、合并及更新,的功能,还能同时处理多个输入文件,或者对一次输入的数据能够生成几种报表。,6,3.报表生成和图形显示功能,2.基础统计计算功能,.计算简单的描述性统计量,.SAS函数可用于计算概率分布函数、分位数、产生随机数等,7,一、SAS显示管理系统(Display Manager System,DMS),第二讲 SAS使用概述,()编辑窗口(PROGRAM EDITOR):,编辑程序和数据文件;,()日志窗口(LOG):,记录运行情况,显示信息;,()输出窗口(OUTPUT):输出运行的结果;()图形窗口(GRAPH):输出图形。,点击 Globals 菜单中的 Program editor、Log、Output、Graph 命令可以进入编辑、日志、输出及图形窗口。,按功能键F5、F6、F7也可以进入编辑、日志及输出窗口。,是用户和SAS系统交互式会话环境;点击图标后,即可进入的显示管理系统在中有四个主要的窗口:,8,二、的功能键,用功能键可以代替对菜单的点击,有时比较方便。,最常用的功能键有F1:显示帮助信息();,4:显示已经运行的程序();,5:进入编辑窗口();,6:进入日志窗口();,7:进入输出窗口();,8:程式提交运行();,9:显示功能键();,以上功能键的用法熟悉之后,还可以定义或修改功能键。例如,可以定义Ctrl+E为功能键,用来清屏。,9,三、SAS语句,一个SAS语句是由SAS关键词,SAS名字,特殊字符和运算符组成的字符串,并,以分号(;)结尾,。,SAS关键词:如data语句,proc语句,infile语句,等,SAS名字:,最多由1-8个字符组成,首字符必须是字母或下,下划线,(字符包括:字母、数字或下划线),如:变量名、SAS数据集名、过程名等,SAS语句 一般形式:,KEYWORD,parameteroption,;,注:SAS规定,每个语句以“;”作为该语句结束的标志。,10,四、SAS程序,1.DATA语句:产生SAS数据集,2.PROC语句:对SAS数据集内数据进行分析处理,输出结果,SAS程序:三明治,以DATA语句开始,(面包),告诉程序有关的数据集,最后是PROC语句,中间是数据,(肉),一序列语句组成一个SAS程序,完成一定的功能.,SAS程序中语句分为两种:,SAS程序构成:,一个或多个data语句、一个或多个proc语句,一个或多个proc语句,一个或多个data语句,11,程序示例:,data ex;,input no$sex$age h w;,cards;,10 f 47 156.3 47.1,24 m 38 172.4 61.5,53 m 41 169.2 64.5,46 f 52 158.2 53.6,38 f 39 160.1 48,;,proc sort;,by sex;,proc means;by sex;var h w;run;,12,第四讲 DATA步入门,一、什么是,二、创建SAS数据集,三、,DATA步语句及其类型,13,一、什么是DATA步,1.检索:把输入数据转化为SAS数据集;,2.编辑:检查数据中的错误并修改它们,计算新变量,;,3.按照用户设计的规格输出报告并存为磁盘文件;,4.从已经存在的数据集中通过取子集、合并和,更新原数据的方法来产生新的数据集。,DATA步是用DATA语句开始的一组或几组SAS语句。其目的:,14,1.数据在作业流中:从作业流中输入数据产生SAS数据集,二、创建SAS数据集,Ex.1 data d1,;,input x1 x2 x3,;,y=x1+x2+x3,;,cards,;,1 2 3,4 5 6,;,一般形式为:,注:,数据之间以空格隔开;数据行与行之间不用分号。,data 语句,;,input 语句;,(用于data步的其它SAS语句;),cards;,数据行,;,15,2.数据在磁盘上:从磁盘上读入数据文件产生SAS数据集,二、创建SAS数据集,Ex.2 data d2,;,infile e:da1.dat;,input x1 x2 x3,;,y=x1+x2+x3,;,run,;,一般形式为:,data 语句,;,infile,语句,;,input 语句,;,(用于data步的其它SAS语句;),run;,16,3.数据来自其它SAS数据集:从一个或几个已经存在的SAS数据集产生新的SAS数据集,二、创建SAS数据集,Ex.3 data d3,;,set da2;,if x10,;,run,;,一般形式为:,data 语句,;,set|merge|update|modify语句,;,(用于data步的其它SAS语句;),run;,Ex.4 data d3,;,merge da1 da2;,run,;,17,4.把SAS数据集转换为外部数据或输出报表,二、创建SAS数据集,一般形式为:,data null-,;,input语句和(cards|infile)语句,;或者,set|merge|updata|modify语句,;,file 语句;(*告诉SAS这里要输出报表或存贮文件),put 语句(*用一个或几个put语句输出这张报表或文件的一些行),(用于data步的其它SAS语句;),run;,18,三、,DATA步语句及其类型,只用于,DATA步的SAS语句共有56个,分为四类:文件操作语句、运行语句、控制语句、信息语句。,常用的data步语句:,文件操作语句:,data、input、cards、,file、infile、by、set、merge等,运行语句:赋值语句、累加语句等,控制语句:循环语句、条件语句等,信息语句,:(,略),19,(1)语句,语句的作用是表明数据步的开始并给出数据集的名称。语句的格式为:,数据集的名称;,注:1)数据集的名称必须以英文字母开始,最长不超过个字符。,2)数据集的名称都是由符号“”分隔的两个部分所组成。第一部分标记数据集所存储的位置,称作一级名或库逻辑名。第二部分标记一个特定的数据集,称作二级名。如果不想把数据集永久储存在指定的磁盘上,可以只使用二级名。,20,例:;,系统会自动地把作为数据集的二级名,并添加作为数据集的一级名,因此在日志窗口显示的信息中记该数据集为。但是这个数据集是临时的,它仅仅在程式运行期间有效,过后它就被复盖,不能重新调用。,21,(2)语句,语句的作用是与“;”呼应,标志数据行的开始与结束。,语句的格式为:,;,数据行,;,注:如果使用语句,在的后面必须紧跟数据行,并且在一个数据步中最多只能有一个语句。,22,(3)语句,语句的作用是描述输入记录中的数据,并把输入值赋给相应的变量。,语句的格式为:,数据的变量名、顺序及类型;,注1:,用语句是为了读外部文件的数据或跟在语句后面的数据。除非在语句中的变量名后有串符号或用字符的输入格式表示、或该变量事先已被定义为字符型,否则认定用语句读入的是数值型变量的值。,23,注2.用语句时,外部文件中的数据和语句后面的数据都采取列表输入的方法,各个变量的值由它们之间的空格来分隔。,为从一行读入多个观测值,应使用行保持符限制读数指针,使其保持在这一行上读数,直到数据读完为止。,Ex.1,data,ex1,;,input,x1 x2 x3,;,y=x1+x2+x3,;,cards;,1 2 3,4 5 6,;,Ex.1 data ex1,;,input x1 x2 x3,;,y=x1+x2+x3,;,cards,;,1 2 3 4 5 6,;,24,(4)语句,语句的作用是指明外部数据文件的名称,并从这个外部数据文件中读取数据。,语句的格式为:,外部数据文件名;,例如,在驱动器上有一个名称为ex2的数据文件,其中数据排列为:,3.12 2.23 3.4,4.12 4.2 .5,用语句读取数据的程式为:,;,:ex2.;,$;,用语句读取数据时,要求外部数据文件必须是可以在操作系统中用命令打印出全部内容的码文本文件。,25,(5)语句,语句的作用是按照指定的条件从指定的数据集中读取数据建立新的数据集或将两个数据集中的观测值纵向连接建立新的数据集。,语句的格式为:,数据集名表;,例如,从数据集中读取数据建立新的数据集,可编辑语句:,;,;,将两个数据集和中的观测值纵向连接建立新的数据集,可编辑语句:,;,;,26,data d1;input g$a b;,cards;,1 5 7 1 7 9 1 3 4,;,data d2;input g$a c;,cards;,2 4 8 2 6 6 2 8 10,;,data d3;set d1 d2;,proc print;,run;,运行结果,Obs g a b c,1 1 5 7 .,2 1 7 9 .,3 1 3 4 .,4 2 4 .8,5 2 6 .6,6 2 8 .10,27,(6)语句,语句的作用是将两个数据集中的各个观测值横向合并建立新的数据集。语句的格式为:,数据集名表;,例如,将数据集与中的观测值横向合并建立新的数据集,可编辑语句:,;,;,28,data d1;input a b c;,cards;,1 5 7 1 7 9 1 3 4 1 2 6,;,data d2;input x y z;,cards;,2 4 8 2 6 6,;,data d3;merge d1 d2;,proc print;run;,本程式运行的结果如下:,OBS A B C X Y Z,1 1 5 7 2 4 8,2 1 7 9 2 6 6,3 1 3 4 .,4 1 2 6 .,29,(7)do语句,简单do语句,循环do语句,do while 语句,do until 语句,30,简单do语句:常常用在if-then/else语句里来指定一个语句组根据if条件成立或不成立时被执行,格式为:,do;,一些sas语句,end;,例:,data a;,input x;,if x5 then do;y=x*10;,put x=y=;end;,cards;,12 4 11 5,;,输出结果:,x=12 y=120,x=11 y=110,31,例:data ex;,do x=1.645,1.96,2.576;,p=probnorm(x);,put x=p=;,end;,run;,在log窗口输出结果:,x=1.645 p=0.9500150945,x=1.96 p=0.9750021049,x=2.576 p=0.9950024677,32,循环do语句:,格式为:,do;,一些sas语句,end;,例:,data a;,do x=-3 to 3 by 0.25;,do y=-3 to 3 by 0.25;,p=x*x+y*y;,put x=y=p=;,end;,end;,run;,33,第五讲 PROC步入门,一、什么是PROC 步?,二、PROC语句,34,一、什么是PROC 步?,PROC 步是用PROC语句开始的一组或几组SAS语句。,一般形式为:,PROC,SAS过程名;,(用于proc步的其它SAS语句;),run;,Ex.4 proc print data=d1,;,run,;,注:1.不同的SAS过程可以使用的 也是不同的。,2.Proc步中常出现的,SAS,控制,语句,:,(1)var 变量名;,(2)by 变量名;(要求排序),(3)class 变量名;,(4)ID 变量名;,35,二、SAS基本输出过程,proc print;,或,proc print data=,文件名,;,Ex.5 data d1,;,input x1 x2 x3,;,y=x1+x2+x3,;,cards,;,1 2 3 2 3 4,;,proc print data=d1,;,run,;,36,2.proc plot;,语法:proc plot 选项;,by 变量列表;,plot 选项;,选项:如vpect=33(规定产生的散布图在垂直方向占一页的比例,hpct=50,formchar=字符串,plot 选项;plot vertical*horizontal,或plot vertical*horizontal=字符或变量,37,3.proc sort;,by variables;,run;,38,1.proc means;,var variables;,by variables;,freq variables;,output out=新文件名 变量名列表(统计关键词=),run;,三、SAS基础统计过程,Options:mean std clm alpha t prt,39,注1:proc means 可以计算的统计量由21种,分别用下述关键词表示:,n,nmiss,mean,std,max,min,range,sum,var,uss,css,cv,stderr,t,prt,skewness,kurtosis,clm,lclm,uclm,注2:output out=新文件名 变量名列表,(统计关键词=),40,Ex:proc means data=ex;,var weight height;,class sex;,output out=result mean=meanweight meanheight,std(weight)=stdweight,std(height)=stdheight,run;,pr,oc print data=result;,run;,41,偏态与峰度分布的形状,左偏分布,扁平分布,右偏分布,与标准正态分布比较!,尖峰分布,42,偏态,(概念要点),1、数据分布偏斜程度的测度,2.偏态系数,=0,为对称分布,3.偏态系数,0,为右偏分布,4.偏态系数,0,为左偏分布,5.计算公式为,43,偏态,(实例),【例】,已知1997年我国农村居民家庭按纯收入分组的有关数据。试计算偏态系数,表4-10 1997年,农村居民家庭纯收入数据,按纯收入分组(元),户数比重(%),500以下,5001000,10001500,15002000,20002500,25003000,30003500,35004000,40004500,45005000,5000以上,2.28,12.45,20.35,19.52,14.93,10.35,6.56,4.13,2.68,1.81,4.94,44,户数比重,(%),25,20,15,10,5,农村居民家庭村收入数据的直方图,偏态与峰度,(从直方图上观察),按纯收入分组(元),1000,500,1500,2000,2500,3000,3500,4000,4500,5000,结论:,1.为右偏分布,2.峰度适中,45,偏态系数,(计算结果),将计算结果代入公式得,结论:,偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大,46,峰度,(概念要点),1.数据分布扁平程度的测度,2.峰度系数,=3,扁平程度适中,3.偏态系数,3,为尖峰分布,5.计算公式为,47,峰度系数系数,(实例计算结果),代入公式得,【例】,根据表4-10中的计算结果,计算农村居民家庭纯收入分布的峰度系数,结论:,由于=3.43,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占有较大的比重,48,2.proc univariate,var variables;,by variables;,freq variables;,output,run;,Options:normal,注:计算分位数、频率表、数据的正态性检验等,49,Options:,1.Normal,2.Plot,(生成一个茎叶图或水平直方图、,一个盒形图、一个正态概率图),50,3.proc ttest ,class variables;,var variables;,run;,51,4.proc corr ,var variables;,with variables;,by variables;,freq variables;,run;,注:计算Pearson相关系数和显著性概率以及,单变量统计量,52,第六讲 全程语句,一、什么是全程语句?,二、常用的全程语句,53,一、什么是全程语句?,全程语句:,既可以用在data步,也可以用在proc步;,既可以用在data步和proc步的,外部,,,也可以用在data步和proc步的,内部,。,这些语句可以用在SAS程序的任何地方,称为全程语句.,54,二、常用的全程语句,1.注释语句:,*,messages,;,或,/*,messages,*/,(无需分号),2.Title语句:规定同SAS输出一起被打印的标题行,Title (n=110),e.g.Title2 Annual costs,3.run ;,4.endsas;,55,应用SAS计算二项分布的分位数,probbnml(p,n,k)=,而PX=k=,probbnml(p,n,k),probbnml(p,n,k,1),data,ex;,do k=,1,to,10,by,1,;,p=probbnml(,0.5,10,k)-probbnml(,0.5,10,k-,1,);,put p;,end;,56,data,ex;,do k=,1,to,10,by,1,;,do p=,0.5,;n=,10,;,value=probbnml(p,n,k)-probbnml(p,n,k-,1,);,output;,end;,end;,proc,print,data=ex;,run,;,57,应用SAS计算标准正态分布的分位数,在SAS中有probit(p)函数,用此函数可以求p分位数。SAS程序为,data ex;,do p=0.025,0.05,0.1,0.9,0.95,0.975;,u=probit(p);put u p;,end;run;,输出的结果如下:,-1.959963985 0.025,-1.644853627 0.05,-1.281551566 0.1,1.2815515655 0.9 1.644853627 0.95 1.9599639845 0.975,58,当=0.10,0.05,0.01时,应用SAS计算双侧分位数的程序为:,data ex;do x=0.1,0.05,0.01;,p=1-x/2;u=probit(p);put x p u;,end;run;,输出的结果如下:,0.1 0.95 1.644853627,0.05 0.975 1.9599639845,0.01 0.995 2.5758293035,59,应用SAS计算卡方分布的分位数,在SAS中有cinv(p,df)函数,用此函数可以求p分位数。SAS程序为,data ex;,do df=4;do p=0.025,0.05,0.1,0.9,0.95,0.975;,c=cinv(p,df);put p df c;,end;end;run;,输出的结果如下:,0.025 4 0.4844185571,0.05 4 0.7107230214,0.1 4 1.0636232168,0.9 4 7.7794403397,0.95 4 9.4877290368,0.975 4 11.143286782,60,应用SAS计算t分布的分位数,在SAS中有tinv(p,df)函数,用此函数可以求p分位数。data ex;,do df=4;,do p=0.025,0.05,0.1,0.9,0.95,0.975;,t=tinv(p,df);,put p df t;,end;end;run;,结果:0.025 4 -2.776445105,0.05 4 -2.131846786,0.1 4 -1.533206274,0.9 4 1.5332062741,0.95 4 2.1318467863,0.975 4 2.7764451052,61,应用SAS计算F分布的分位数,在SAS中有finv(p,df1,df2)函数,用此函数可以求p分位数。SAS程序为,data ex;,do p=0.025,0.05,0.1,0.9,0.95,0.975;,do df1=3;df2=4;,f=finv(p,df1,df2);,put p df1 df2 f;,end;end;run;,结果:0.025 3 4 0.0662208725,0.05 3 4 0.1096830108,0.1 3 4 0.1871732255,0.9 3 4 4.1908604389,0.95 3 4 6.5913821164,0.975 3 4 9.9791985322,62,data ex;,do p=0.025,0.05,0.1,0.9,0.95,0.975;,do df1=3;df2=4;f=finv(p,df1,df2);output;,end;end;run;,proc print;,run;,63,Obs p df1 df2 f,1 0.025 3 4 0.06622,2 0.050 3 4 0.10968,3 0.100 3 4 0.18717,4 0.900 3 4 4.19086,5 0.950 3 4 6.59138,6 0.975 3 4 9.97920,64,data ex;,input x;,if x10 then output;,cards;,1 2 23 12 34,;,proc print;,run;,Obs x,1 23,2 12,3 34,65,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服