ImageVerifierCode 换一换
格式:PPT , 页数:151 ,大小:820KB ,
资源ID:12707107      下载积分:25 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/12707107.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(SAS培训班讲义.ppt)为本站上传会员【精****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

SAS培训班讲义.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,1,课程名称:,SAS,培训班讲义,讲师:,赵坚毅,网址:,www.pinggu.org,2,第一部分 课程介绍,培训内容:使学员掌握,SAS,的界面使用和基本编程使用,为学习和应用,SAS,的其他专业功能奠定坚实的基础。,使用,SAS,进行数据分析和处理,3,推荐教材,1,SAS,系统的帮助以及在线文档,都是学习,SAS,的很好的工具。,SAS,软件使用手册,高惠璇等编译,中国统计出版社,1997,3.SAS,系统,

2、SAS/STAT,软件使用手册,高惠璇等编译,中国统计出版社,1997,4.,实用统计方法与,SAS,系统,高惠璇 北京大学出版社,2001,4,数据类型,a.,横截面数据集(,cross-sectional data set):,即给定时点对个人、家庭、企业、国家或一系列其他单位采集的样本所构成的数据集(应该忽略细小的时间差别),名词术语,1,、数据集:数据的集合,由样本(行)和变量(列)组成,5,数据类型,b.,时间序列数据集(,time series data set),:是由一个或几个变量在不同时间的观测值所构成的。,c.,混合横截面数据集(,pooled cross section

3、data set):,有些数据既有横截面数据的特点又有时间序列的特点,但每一时点的样本不同。,6,数据类型,d.,综列数据集(,panel data set):,由横截面数据集中每个样本的一个时间序列组成。(定点长期调查),其他专门数据类型:,1,、离散数据(,discrete data):,通常在考察个人、家庭或企业的决策行为时,通过问卷调查获得,由此发展出,“,离散选择模型,”,。定量数据与定性数据,9,数据处理的应用,天文学(,skicat,系统处理天文数据发现类星体),生物学(人类基因组计划处理人体数据研究基因),市场营销(货篮分析),公司财务的处理,(,记流水帐,),经济论文写作中的

4、实证部分,10,数据处理的应用,“,今天,我们不得不生存在全球化和信息革命影响下的世界,我们只有两个选择:适应它,或者被它抛弃。,”,英特尔公司主席安德鲁,格鲁夫,1995,年尼葛洛庞帝的,数字化生存,一书指明了即将到来的数字时代,而在未来一长段时间,数字化生存仍将是人类的主要生存方式,在经济学领域也不外如是。,11,第二部分,SAS,系统入门,SAS,系统概况,大型集成、跨平台软件系统,完备的数据访问,(Access),、管理,(manage),、分析,(analyze),和呈现,(present),及应用开发,(develop),的功能,在数据处理、统计分析和,IT,应用领域,,SAS,系

5、统已经成为国际上的标准软件系统。,12,SAS,的发展历程一,1966,年由美国北卡罗来纳州(,North,Carolina,)州立大学开始研制,1976,年成立美国,SAS,软件研究所,并开始对,SAS,系统进行维护、开发、销售和培训等工作,1985,年推出了,SAS/PC,(,6.02,)版本,13,SAS,发展历程二,1989,年推出,SAS/PC,(,6.04,)版本,1997,年下半年推出适用于多种操作系统的,6.12,版本,2000,年,2,月又正式推出,SAS,系统,8,版本,2002,年推出全新的,SAS9,版本,14,SAS,在中国的发展,SAS,公司于,1989,年在北京成

6、立了办事处,1997,年,,SAS,软件研究所正式宣布成立大中国区,1999,年,3,月在国内设立独资公司,赛仕软件(上海)有限公司。,15,SAS,的成绩,全球十大独立软件开发商之一,世界六大洲近,50,个国家或地区设有分公司及分支机构,应用遍及,120,多个国家和地区(包括中国)的,31000,多个机构中,全球,100,家最大公司中的,90,多家都在应用,SAS,系统。,16,SAS,模块介绍,Base SAS,:,1,、,数据管理功能,2,、基础统计计算功能,3,、,报表生成和图形显示功能,17,SAS/STAT,统计分析,SAS/INSIGHT,数据探索,SAS/ASSIST,面向任务

7、的易学易用模块,SAS/ETS,时间序列处理,SAS/OR,运筹学和工程管理,SAS/QC,质量控制,SAS/IML,矩阵运算,SAS/GRAPH,绘图,SAS/AF,面向对象编程,(OOP),的应用开发工具,拓展,SAS,的功能,18,SAS/EIS,面向对象编程的开发工具,用于开发企业信息系统,SAS/ACCESS,数据访问,SAS/TOOLKIT,扩充工具,把用其他软件编写的程序转化成,SAS,的组成部分,SAS/Warehouse Administrator,数据仓库管理,SAS/Enterprise Miner,数据挖掘,SAS/Text Miner,文本挖掘,SAS/SHARE,数

8、据库的并发式控制专门软件,SAS/CONNECT,使各平台,SAS,系统进行分布式处理,从而有效利用各平台机器资源,19,SAS/GIS,地理信息系统与空间数据的显示分析,SAS/SPECTRAVIEW,数据可视化分析工具,用几何成像的方式来分析多维数据,SAS/Intrnet,提供构建基于,SAS,的企业内部网络支持,SAS/FSP,快速数据处理的交互式菜单系统,SAS/CALC,功能完善的多维电子表格软件,SAS/ENGLISH,提供利用自然英语获取信息的能力,20,SAS/SECURE,网络传输加密,SAS/OLAP SERVER,多维数据存储及汇总结果呈现,SAS/GENETICS,:

9、SAS,公司的第一个科学研究应用软件,应用于遗传学,有,5,个分析过程,SAS/High-Performance Forecasting:,提供快速高效的预测结果,SAS/C,SAS/C+,针对,IBM,大型机的开发工具,SAS/LAB,向导式的数据分析软件,特别针对,day-to-day,类型数据,21,SAS,工作空间,程序窗口(,PROGRAM EDITOR,),运行记录窗口(,LOG,),输出窗口(,OUTPUT,),22,SAS,程序第一例,SAS/HelloWorld.sas,注:以后程序文件省略后缀,直接简记为文件名称,如此例简记为,HelloWorld,,需要说明文件类型时才

10、标明后缀。,23,SAS/Insight,模块,1,、界面介绍,2,、,Fill values,功能,3,、,Extract,功能,4,、,Edit/windows/tool,菜单使数据探索色彩缤纷,(,注意选项设置,)5,、打开分布、拟合、多元等的窗口之后主菜单,Tables,、,Graphs,、,Curves,菜单才被开放。,Fly,,,insurance,数据集示例,24,Insight,模块,其他功能:,1,、分布,(,输出大多数常用的统计量),2,、拟合,(,回归分析),3,、多元,(,方差分析,),25,SAS,程序的书写格式,1,、,SAS,程序由,语句,组成,语句用分号结束。,

11、2,、,SAS,语句可以从某一行的任意位置开始;,3,、几个,SAS,语句可以写在同一行上,但每句要使用分号,26,SAS,程序的书写格式,4,、一个语句也可以写成几行,只要语句中的单词不被断开就可以。在一个语句中各个单词之间至少要有一个空格。,5,、,SAS,程序中一般不区分大小写(字符串中要区分大小写),6,、用,/*,注释的内容*,/,来对程序进行注释,27,SAS,程序的结构,SAS,数据集样本(观测、记录)、变量(字段、域)、表(数据集)、数据库,许多,SAS,语句都是以关键词开始并用它识别语句的类型,(,如,data,、,input,、,proc),绝大部分的,SAS,语句都可分为

12、两步:,DATA,步和,PROC,步,28,SAS,的变量及格式,变量属性,(,名称、类型、长度、输入格式、输出格式、标签,),类型:数字型、字符串型输入格式:数据被,SAS,读取的格式输出格式:数据呈现给人们的格式,29,SAS,程序第二例,SAS/orange.sas,输入数据,-,形成数据集,-,排序,-,打印显示,30,SAS,文件及命名,1,、,SAS,数据集文件(后缀为,sas7bdat),2,、,SAS,程序文件,(,后缀为,sas),3,、,SAS,日志文件,(,后缀为,log),4,、,SAS,输出文件,(,后缀为,list),31,SAS,文件及命名,临时数据集和永久数据集

13、SAS,文件的,2,级命名方式:目录,.,文件名,work,目录和其他目录使用,Libname,语句创建永久数据集,,libname,自建目录名,目录地址,;,libname,例,32,建立,SAS,数据集的,5,种方法,1,、,data,步自己输入数据建立。,Orange,例,2,、,data,步利用,set,语句建立。,Set,例,3,、从外部调入。,Infile,例,4,、利用,“,导入数据,”,功能建立。,Id.xls,例、,data.txt,例,5,、利用,EFI,(,external file interface),功能导入。,Column.dat,例、,tests.dat,例、

14、comma.dat,例,Analyst分析家模块,1、界面介绍,2、浏览与编辑模式,3、生成示例数据与抽样,4、程序清单,5、假设检验,33,34,SAS,运算符(,operator,例),算术运算符:*,/,*,比较算符:,=(EQ)=(NE)(GT)=(GE),第二级:*,/,第三级:,第四级,:,|,第五级:其余比较算符,第六级:,第七级:,37,运算次序二,对于相同优先级的算符,左边的运算先做。但有两个例外:,1.,对最高优先级,右边的运算先做,2.,当两个比较算符围着一个量时,这个表达式看成是有一个,and,出现一样被计算。如:,12,age 20,,等价于:,12,age&age

15、20,38,SAS,函数一,(,部分,),数学函数:,abs(),、,max(),、,min(),、,mod(x,y),、,sign(x),、,sqrt(x),、,sum(),、,mean(),、,exp(x),、,log(x),、,log10(x),、,log2(x),、,sin(x),、,arsin(x),截取函数:,ceil(x),、,floor(x),、,int(x),、,round(x,,,n),字符函数:,index(S,S1),、,substr(S,p,n),、,scan(S2,n),、,upcase(S),、,compress(S,S1),39,SAS,函数二,(,部分,),S

16、AS,系统存贮日期值为,1960,年,1,月,1,日到指定日期之间的天数,SAS,存贮时间值为从午夜开始到指定时间的秒数,日期时间值存贮为,1960,年,1,月,1,日午夜到指定日期时间之间的秒数,日期时间函数:,weekday(),、,day(),、,month(),、,qtr(),、,year(),40,SAS,函数三,(,部分,),概率统计函数:,probnorm(x)n(of X1-Xn),、,nmiss(of X1-Xn),,,var(of x1-xn),、,std(of x1-xn),随机数函数:,rannor(seed),、,ranuni(seed),Functions,例,41

17、DATA,步,文件操作语句,运行语句,控制语句,信息语句,42,DATA,步流程,DATA,语句标志了数据步开始,并指定了数据步结束时要生成的数据集名字。,每次读入一行数据,读入后执行数据步中的其它语句,循环数据步读取整个数据。,_N_,变量表示,DATA,步已经执行的次数,_error_,变量值为,1,时表示程序出错,Flow,例,43,DATA,步流程(,Flow1,例),(*),读外部数据时,数据步迭代,(,即每一次,),的开始把变量的值置为缺失值,有几种情况例外:,1,、,retain,语句提到的变量,2,、,sum,语句中创建的变量,3,、数组,_temporary_,中的数据元,

18、4,、,file,和,infile,语句选项中创建的变量,5,、自动变量,读,sas,数据集时,只在第一次迭代时把变量值置为缺失,以后变量保留其值直至新值写入,44,文件操作语句,DATA,语句,DATA,语句的选项,DROP,选项,(,不列出某些变量,)KEEP,选项,(,列出某些变量,)LABEL,选项,(,给数据集加标签,)RENAME,选项,(,重命名变量,),Data,例,45,DATA,语句,数据集名字:,(data2,例,)1,、,data,语句后无数据集名字,则自动生成,data1,data2,等为数据集名字,相当于,data _data_;2,、,data _null_;,不

19、产生实际的数据集,只是把内容暂存于内存,以供,put,语句等读取结果,可以节约计算机资源,3,、,data _last_;,以最近产生的数据集命名并取代其内容。,46,Input,语句,分组格式:,input (g1-g5)(3*7.2,2*5.2);,input (a b)($5.)input (a b)($,5.),无需分行而按变量连贯读数据,固定该数据行;用于需要多个,input,语句同时读取一行数据。,input,例,,Input,例,47,Input,语句,利用,n +n#n,进行指针控制,input1,例,48,Input,语句,几个特殊符号的用法(,:&):,读值时第一次遇到分隔

20、符、或是数据行末尾、或是读满列数而结束 字符型输入值可以嵌有一个或几个空格,字符型输入值保留引号(与,infile,语句中选项,dsd,一起使用才有效),Input2,例,49,Cards,语句,Cards,语句与,datalines,语句可以通用,如果输入数据中含有分号,可用,cards4,语句或,datalines4,语句,同时,数据结尾用,4,个分号表示数据输入结束,Cards4,例,50,Put,语句,Put,语句负责在,log,窗口输出一些结果,,file print,选项可把输出转移到,output,窗口,Put _infile_ (,输出最新的数据行到,SAS log,窗口),P

21、ut _all_ (,输出所有变量的值),Put _page_,(输出新页),Put,例、,put1,例,51,File,语句,File print,把,put,语句产生的输出结果转移到,output,窗口,Put,例,52,By,语句,在,DATA,步中,,SAS,系统对每个,BY,组创建两个临时变量:,First.variableLast.variable,它们用来区别每个,BY,组的第一个和最后一个观测,By,例,53,Set,语句,使用,set,语句复制数据集,Point,选项指明要读入的记录序号,set,数据集,point=,指针变量,;,可用于抽样,一般与,output,语句连用,

22、Nobs,选项创建一个临时变量用来存储数据集的观测总数,见,set,例,,point,例,54,Set,语句,Set,语句可以串接多个数据集,形式如下,Data,数据集,;set,数据集,A,数据集,B,;Run;,Rename,选项负责改名;,in,选项产生变量负责记录观测来自该数据集;,见,set2,例,55,Merge,语句,使用,Merge,语句并接多个数据集,形式如下,Data,数据集;,merge,数据集,1,数据集,2,;by,变量,;run;,见,merge,例,56,Update,语句,Update,语句用一个升级数据集中的观测来修改一个主数据集。,Update,语句一定要与

23、BY,语句一起使用,,BY,语句给出了合并观测时共同变量的名字,主数据集中的共同变量必须是单值的,即不能有两个或两个以上的观测其共同变量值相同,Update,例,57,Infile,语句,Delimiter(DLM),选项:规定一个字符替代空格作为分隔符。,Firstobs,选项:不是从文件的第一个记录开始,而是从指定行开始读取记录,Obs,选项:规定用户想从输入文件中连续读取的最后一个记录号,Infile(dlm),例、,Infile(obs),例,58,Infile,语句,DSD,选项:,1,、使最外层引号括起的内容当成整个字符串输入,并去除最外层引号,2,、默认分隔符为逗号,3,、两个

24、相邻的分隔符意味着前一个分隔符后的字段为缺失值,Infile(dsd),例,(,回顾,input2,例),59,Infile,语句,当行末尾数据宽度少于规定宽度时,Flowover:,默认选项,将下一条记录读入,Missover,:将变量置为缺失,Truncover:,将数据直接读入,不管宽度是否少于规定宽度,Stopover:,系统终止数据步执行,报告出错,Missover,例,60,Infile,语句,Lrecl=n,选项:设定源数据文件行的物理长度,缺省为,256,,最大可设为,32767,Pad|Nopad,选项:,pad,选项指当宽度少于规定宽度时,在后面填充空格至,Lrecl=n,

25、规定的行长度,缺省为,nopad,Missover,例,61,运行,(,算,),语句赋值语句和累加语句,赋值,Variable=expression,例:,x=a+b;,累加,Variable+expression,例:,if x=5 then n+1;,例:,n+(-1),累加语句中的变量必须是数值型变量,初始值为,0,62,Delete,和,lostcard(*),语句,Delete,语句告诉,SAS,系统停止处理当前的观测,并且返回到这个,Data,步的开头处理其他观测,当,SAS,系统遇到用几个记录表示一个观测的时候,数据中有丢失记录时,使用,Lostcard,语句来重新对准输入数据,

26、delete,例,,lostcard,例,63,Stop,和,abort,语句,用,stop,语句来停止处理,data,步,正被处理的那个观测没有添加到,SAS,数据集中,,stop,语句不影响后面的任意,data,步或,proc,步的执行,用,abort,语句来中止,SAS,系统执行当前,DATA,步,,return,选项关闭,SAS,并返回操作系统。,Stop,与,abort,的区别在于,abort,语句置,_error_,变量为,1,Abort,例,64,Where,语句,从已存在的,SAS,数据集选择子集,在把观测读入之前规定数据必须满足一个条件,Where,语句与,if,语句相比在读

27、取数据时更为高效,因其在移动所有观测到子集之前先选择数据。,Where,语句丰富的表达式,where,例,65,Output,语句,DATA,步的每次迭代,后台自动使用,output,语句,但如果程序中主动加上,output,语句,即相当于取消自动,output,语句,变成在条件符合时输出。,output,例,66,Output,语句,用到,output,语句其他情况:,output123,例,1.,从一个输入的数据文件中,创建几个,SAS,数据集,2.,从输入的每个数据行中,创建二个或更多个观测,3.,把几个输入观测组合并成为一个观测,后面接名字表示输出到指定数据集,但名字必须也在,DATA

28、后出现,67,Call,语句,调用其他子程序,call routine(parameter-1),如,SAS,提供一系列随机数子程序,发布操作系统命令,call system(command),Call,例,(*),、,Call_system,例,68,控制语句,Do,语句,(,循环语句),DO,语句规定,在,DO,后面直到出现,END,语句之前的这些语句作为一个单元被执行。,简单,DO,语句,常用在,if-then/else,语句里,循环,DO,语句,用下标变量规定重复次数,do i=1 to 10;do i=1 to exit;do i=2 to 8 by 2;,Do_simple,例,

29、do,例,,do_exit,例,69,Do while,语句,当条件成立时重复执行,Do,组里的语句,Do while(expression);,括号里的表达式在,Do,组里的语句被执行前在循环的开头被计算。如果表达式是真的,,Do,组被执行,Do while,例,70,Do until,语句,有条件地执行,Do,组里的语句,在循环的最后而不是在循环的开头计算表达式,如果表达式是真的,,Do,组就不再被执行。,Do,组里的语句至少执行一次。,Do until,例,71,Select,语句,允许,SAS,去执行几个语句或者语句组中的一个。,当一个特殊条件为真时,执行对应,when,语句,如果所

30、有,when,条件均不成立,选择执行,otherwise,语句,用,end,结束,Select(when),例,72,If,语句,1.,形如:,IF expression THEN statement;ELSE statement;2.,形如:,IF variable,例:,if x then y=x;,当变量,x,的值为,0,和缺失之外的任意值时表达式均为真,If_else,例、,If_x,例,73,Return,语句,告诉,SAS,系统在,data,步当前这个位置上停止执行语句并在继续执行之前返回到一个预定的位置(通常是,data,步开头,),当,return,语句使得,SAS,返回到,d

31、ata,步开头时,,SAS,首先输出当前观测到新数据集中。,每个,data,步都有一个隐含的,return,语句作为最后一个可执行的语句,Return,例,74,Go to,语句,告诉,SAS,系统立即转到,Go to,语句所指示的那个语句,并从那个语句开始执行后面的语句。,形如:,GO TO label;label,规定语句标号来指示,Go to,的目标,它必须与,go to,语句在同一个,data,步,Return,选项规定返回而不执行下面语句,Go to,例,75,Link,语句,(*),形如,link label;,立即转到由,label,语句指示的位置,并从那里开始继续执行语句直到一

32、个,return,语句被执行。,与,goto,语句的区别是:标签内的,return,语句让,SAS,立即返回到,link,语句后面的那个语句并从那里继续执行,Link,例,76,Continue,和,leave,语句,Continue,语句使得某个,do,循环中当前这次循环过程停止进行,并继续进行下一次循环过程。,Leave,语句停止当前整个,do,组循环或,select,组的处理过程,并用跟在,do,组或,select,组后面的下一个语句继续执行,data,步,Continue,例,,leave,例,77,循环的嵌套,(*),Do(do),例、,select(do),例,78,怎样选择使用不

33、同的控制语句,DO:,多次执行同样的代码块,DO while,:当,while,条件为真时,多次执行同样的代码块,DO until:,多次执行同样的代码块,直到,until,条件为真,代码块总会执行一次,SELECT,:知道明确的离散选择项时使用,IF,:希望从,2,个或多个可能的事件中完成一个,允许连续选择项,79,怎样选择使用不同的控制语句,跳转代码(,go to,link),:需要暂停主代码,执行,“,标签,”,指明的其它代码,中止代码(,return,continue,leave),:负责某种形式的中止。,80,信息语句数组,(array),语句,当需要用同一种方法处理很多变量时,可以

34、用数组语句定义这组变量为某个数组中的元素。,1.,显示下标,array,语句:由一个数组名字,在数组中元素个数的说明,及元素列表组成。,2.,隐含下标,array,语句:由一个数组名字、一个下标变量和列表名组成。,81,显示下标,array,语句,形如:,ARRAY array-name subscript ,例,array simple3 red green yellow;array x5,3 score1-score15;array c3,等价于,array c3 c1-c3,array test3 t1 t2 t3(90 80 70),数组中的变量必须全是数值型或字符串型,,array,

35、例,82,显示下标,array,语句,规定数组中每一维的上下界:,array x1:5,1:3 score1-score15;,*,表示,SAS,系统通过数组中变量的个数来确定下标。可用,dim(,数组名,),函数计算数组元素个数。,_temporary_,建立一个临时数组元素列表,array(dim),例,,array(temporary),例,,array(prod),例,83,隐含下标,array,语句,形如:,ARRAY array-name array-elements,如果没有规定下标变量,,SAS,系统使用自动变量,_i_,作为下标变量,下标变量范围从,1,到这个数组元素的个数,

36、如:,array x x1-x5,Array(s),例,84,Do over,语句,Do over,语句对每个数组元素自动地执行,Do,组中的语句,它等价于,do i=1 to k;,其中,i,是这个数组的下标变量,,k,是数组元素的个数。,Do over,语句常用在对隐含下标数组元素执行,Do,组里的语句,Do over,例,85,Informat,语句,Informat,语句把输入格式与变量联系起来,在,data,步,可以用,informat,语句对,input,语句中列出的变量规定缺省时的输入格式,informat,例,86,Format,语句,在,data,步把变量同输出格式联系起来,

37、可以规定缺省选项,如:,format default=8.2;,Format(informat),例,,format_=,例,,87,Drop,和,keep,语句,Drop,语句:删掉变量语句,drop variable-list,Keep,语句:保留变量语句,keep variable-list,虽然出现在,drop,和,keep,语句中的变量不包含在正被创建的,SAS,数据集中,但这些变量仍可以用在程序语句中,Drop,和,keep,不能同时使用,88,Retain,语句,使用,retain,给变量赋予初值,并保留到读下一个观测,retain month1-month5 1retain v

38、ar1-var4(1,2,3,4),当,retain,后无变量时,用,input,或赋值语句创建的所有变量的值,保留上次,data,步执行的值,Retain,例、,retain2,例,89,Attrib,语句,在,data,步内允许用一个,attrib,语句来规定一个或几个变量的输出、输入格式,标签和长度,即规定变量属性,Attrib x label=,中国载人飞船,length=4 informat=8.5 format=8.2;,Attrib,例,90,Window,语句,创建用户专用的窗口,可用来显示文字说明或接受输入的数据,Window,例,91,上机练习,1,编制程序:六个变量,id

39、 d1-d5,,数据节选如下:,1 2 7 23 100 1000,2 3 33 54 56 10003 .4 6 44 100,要求:如果相邻数据小于等于,7,,则置为缺失,数据结果应如下:,1 .23 100 10002 3 33 .10003 .44 100,92,上机练习,2(ex2,例),编制程序:,3,个变量,d1-d3,,数据节选如下:,1 2 7,2 3 .3 .4,要求:如果发现缺失值,即用该列数据的平均值来代替,数据结果应如下:,1 2 7 2 3 5.5 3 2.5 4,93,Proc,步的通用语句(,Reg,例),Proc,用在,proc,步的开头并规定用户使用的,SA

40、S,过程名字及其他信息,Var,规定用这个过程分析的一些变量,Model,规定在模型中类似表示因变量(左)和自变量(右)的这样一些变量及其他信息,Weight,规定一个变量,它的值是这些观测的相应权数,94,Proc,步及通用语句,Freq,规定一个变量,其值表示频数,Id,规定一个或几个变量,他们的值在打印输出中或由此过程产生的,SAS,数据集中用来识别观测,Where,在,SAS,把观测引入,proc,步之前,用来选择符合特殊条件的观测,Class,在分析中指定一些变量为分类变量,95,Proc,步及通用语句,By,规定一些变量,,SAS,过程对输入数据集用,by,变量定义的几个数据组分别

41、进行分析处理,Output,给出用该过程产生的输出数据集的信息,Quit,结束交互式的过程,其他如,Attrib,属性语句、,format,输出格式语句、,label,标签语句等,96,Transpose(,转置过程,),Transpose,过程完成对,sas,数据集的转置,即把观测变为变量,变量变为观测。,Out,选项规定输出数据集,Prefix,选项规定转置后的变量名前缀,Id,选项使用其后规定的变量值作为输出数据集中被转置的变量名,Transpose,例,97,Means,均值过程,计算数据集中数值变量的简单统计量,T,选项:检验数据总体均值为,0,的假设时,,t,统计量的值,Prt,选

42、项:,Prob|T|,数据总体均值为,0,的概率是多少,默认生成的,_type_,和,_freq_,变量分别规定分组数(如果有)和频率,Means,例,weight,例,,freq,例,98,Means,均值过程,Maxdec,选项规定输出结果的小数部分最大位数,可以输出的统计量:,N,Nmiss,mean,std,min,max,range,sum,var,uss,css,cv,(变异系数),stderr,t,prt,sumwgt,skewness,(偏度),kurtosis,(峰度),clm,(置信限),lclm,(置信下限),uclm,(置信上限),99,Format,过程,(forma

43、t_num,char,lowhigh,例),使用,Format,过程把输出格式同,Data,步、,Proc,步的变量联系起来。,输出格式一:,SAS,格式,输出格式二:,Format,定义的格式,形如,value,格式名 变量值,=,自定义值,;proc,;format,变量 格式名,.;,100,Format,过程,输出格式三:图示输出,只适用于数值型变量,形如,picture,格式名,other,格式化值,;proc,;format,变量 格式名,.;,Format_picture,例,101,Plot,过程,对数据集中任两个变量的,n,个观测值画出散点图,第一个变量表示,y,轴,第二个表

44、示为,x,轴,两种情况:,plot y*x=,+,;,(规定一个字符作为作图字符),plot y*x=sex;,(作图字符由变量的值给出),102,Plot,过程,Vref(Href),要求散布图在垂直,(,或水平,),轴的一些规定值上画水平线,(,或垂直线,),作为参照线,/overlap,选项:在同一张图上作两个以上的散点图。如:,plot y*x a*b/overlay;,Plot(,函数,),例,103,Standard,标准化过程,目的是使不同量纲的变量能互相比较,Standard,过程按给定的均值和标准差对数据集中的变量进行标准化变换,并生成一个包含标准化值的新,SAS,数据集,M

45、ean=mean-value:,规定均值,Std=std-value:,规定标准差,Standard,例,104,Rank,过程,与其研究数值大小不如研究排序的情况,该过程把数值从最小到最大排列,对最小值赋予秩,1,,对第二小值赋予秩,2,,一直到赋予秩,n,,即未丢失的观测个数。,出现结值,(tie),时,其秩可以赋予平均秩或高秩或低秩。,Ranks,选项分配求秩后的变量名,Rank,例,105,Univariate,过程,又称单变量过程,可以求单个变量的大部分统计指标,Normal,选项:要求对数据服从正态分布(原假设)进行检验。当样本容量,2000,时,使用,D,统计量检验,106,Un

46、ivariate,过程,Output out=datasets,要求输出包含指定统计量的数据集,Pctlpts,规定该过程不能自动提供而用户又希望计算的百分位数,Pctlpre,要求给出百分位数的输出变量名的前缀,,pctlname,后缀。,Univariate,例,107,Corr,过程,计算变量间的相关系数,相关是对两个变量间线性关系强弱程度的一种测度。,如果一个变量恰好可表示成另一个变量,Y,的线性函数,那么相关系数为,1,或,-1,,即正相关或负相关。如果两变量间的相关系数为,0,,这意味着两变量无线性关系。,Corr,例,108,Options,过程,列出,SAS,系统选项的当前值。

47、SAS,系统选项是,SAS,系统用来控制,SAS,数据集的处理,输出的格式和内容等的全局选项,系统选项的优先次序:,options,语句,配置文件,缺省设置,例:,options nodate,;,Options(view),例,options,例,109,Printto,过程,该过程用来定义,SAS,过程输出和,SAS,日志输出的地点,Print,选项规定输出结果存放地点,Log,选项规定输出日志存放地点,New,选项表示要覆盖已存在的文件,如无,new,选项但有已存在的文件名,则在已有的文件内容后追加,Printto,例,110,Compare,过程,该过程用来比较两个,SAS,数据集中

48、的内容,用,base,和,compare,选项分别规定待比较的两个数据集,Compare,例,111,Datasets,数据库管理过程,该过程用来对,SAS,数据库中的,SAS,文件进行列表、拷贝、更名,添加和删除等操作,Datasets,是交互过程,可以不断插入并执行该过程的相关语句而不用重复调用,Datasets,,但可以使用,quit,语句或另一个,proc,步或,data,步来终止此过程,Datasets1,例,112,Datasets,过程,Index create:,创建简单或复合索引,Pw(read,、,write,、,alter):,设置密码,Repair member-nam

49、e:,在适当情况下试图重新存贮被损坏的,SAS,数据集或目录,Datasets(index),例、,datasets(pw),例,113,SQL,过程,SQL,结构查询语言,(Structured Query Language),是一个标准化的广泛使用的语言,可以检索和更新关系表格和数据库中的数据。,关系,类似于数学中的集合概念,实际上被表现为一些排列成行和列的二维表格,(,关系数据库,),114,SQL,过程,SQL,语句的特征:子句内的项用逗号分开;不需规定,Run,语句;,115,SQL,过程,Select,语句用来检索和操作存于表中的数据。,(order,从句,,format,选项,)

50、Create,语句生成表格,Update,语句增加或修改在表格的列里的数值,,Insert,和,Delete,语句插入和删除行,用,Alter,语句增加、修改、删去列来修改表格。,116,SQL,过程,Delete,语句从表中删去,where,表达式为真的所有行,Insert to,往一个新的或已存在的表中加入新的行,Sql,例,117,全程语句,Quit,run,endsas:,分别为结束、运行,SAS,语句、关闭,SAS,系统,Title,footnote,:添加标题和脚注,Filename,:对一个外部文件定义标记,Libname,:对一个,SAS,数据库定义标记,Filename,例

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服