1、,单击此处编辑母版标题样式,*,单击以编辑,母版标题样式,单击以编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击以编辑,母版标题样式,*,单击以编辑,母版标题样式,单击以编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击以编辑,母版标题样式,单击以编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击以编辑,母版标题样式,单击以编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击以编辑,母版标题样式,单击以编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击以编辑,母版标题
2、样式,单击以编辑母版文本样式,第二级,第三级,第四级,第五级,*,实用统计方法,2,课程介绍,统计方法是一种用于收集,表示(图解),分析和解释数据的方法.也可以说,统计方法就是从一大堆资料中提取有用信息的方法.“统计”常作为统计方法的缩写使用.,“统计”在我们日常生活生活和工作中,特别是社会调查和科研工作中,是随时都可能迂到的问题.统计不仅是简单的把一堆数据数数个数,算算平均值,列成表格,而是要进行分析整理,给出一些更有意义的“统计量”.,3,课程介绍,统计学是数据的科学,是对数据进行收集,整理,分析,并作出推断的一门科学.统计学是一门方法论的学科.,统计的重要性在于:它由单纯的综合分析转变为
3、统计推断,可超越观测的时间,空间范围,由过去推断未来,由局部推断总体.,统计方法在自然科学,社会科学各个领域都有广泛的应用.,4,课程介绍,统计方法包括的内容及一些应用:,基本统计推断(,估计和检验).,统计预报(回归和时间序列分析):,高中成绩预报高考成绩;用电量预报;气象预报;虫情预报;地震预报;火警预报;财政收入的预测;青少犯罪的预测.,分类(聚类和判别):,大气污染地区的分类;医学上的临床诊断;中医阴阳学说的研究;服装的定型分类;含矿的诊断;考古学中文物的分类;红楼梦的研究;企业经济效益的分类.,数据结构的简化(主分量,因子分析和典型相关):,进一步可应用于预报与分类.,方案设计(试验
4、设计,抽样),数量化理论等,5,第一章,描述统计,第二章,估计和检验,第三章,方差分析与协方 差分析,第四章,回归与回归诊断,第五章,属 性数据分析,第六,七章,聚类与判别,第八,九,十章,多变量分析,(主分量,因子分析和典型相关,),第十一章,时间序列预报系统,附录1,SAS,系统入门,本课程的内容,6,教学方式:,授课与上机实习相结合.,本课程的特点与教学方式,本课程的特点,是将实用统计方法的介绍与在计算,机上实现这些方法的软件紧密地结合起来,不仅,介绍每种统计方法的实际背景、统计思想、统计,模型和解题的思路,并结合实例介绍应用统计软,件解决问题的步骤和计算结果的分析。,本书不侧重严格的数
5、学推导。,提供,SAS,系统(6.12版本)供大家使用.,7,第一章 描述统计,统计的方法,通常包括描述统计和推断统计两方面。本章介绍描述统计,而以后几章介绍包括统计推断、统计预测等应用更广泛的推断统计。,描述统计是把观测数据本身包含的信息加以总结概括、整理简化。例如频数表、频率分布直方图及描述统计量的计算都属于描述性统计。,8,第一章 描述统计,1.1 描述统计量,已知一组观测数据:,x1,x2,xn.,描述这组数据,的特征量有:,描述取值位置的,特征,量:均值,众数,中,位,数,分位数,描述分散程度的特征量:方差,标准差,标准误,四分位数,极差,四分位极差.,描述分布形状的特征量:偏度,峰
6、度,分位数,9,第一章 描述统计,1.2 用图表概括数据,(1)频数表,10,第一章 描述统计,1.2 用图表概括数据,(2)直方图(条形图),11,第一章 描述统计,1.2 用图表概括数据,(3)茎叶图及盒须图,12,第一章 描述统计,1.2 用图表概括数据,(4)盒形(须)图,13,第一章 描述统计,1.2 用图表概括数据,(5)正态概率图,14,附录1,SAS,系统入门,1.,SAS,系统简介2.,SAS,系统对数据的管理,3.,SAS,数据集的建立、浏览、编辑,4.用数据步生成,SAS,数据集,5.增改删数据集中的记录或变量6.串接或并接,SAS,数据集,7.用,PROC PRINT,
7、制作列表报告,8.,SAS,图形入门,15,SAS,系统,SAS,系统是用于数据分析与决策支持的大型,集成式模块化软件系统。,其早期的名称为统计分析系统-,S,tatistical,A,nalysis,S,ystem(,缩写为,SAS),在数据处理和统计分析领域,SAS,系统被誉为,国际上的标准软件系统.,16,SAS,系统是用于决策支持 的大型集成信息系统,SAS,系统主要完成以数据为中心的四大任务:,数据访问-访问任何形式和来源的数据,数据管理-将数据转变成可用形式,(,SAS/WA),数据呈现-使信息产生效用,数据分析-获得有意义的信息(,SAS/EM),17,SAS,系统介绍,DATA
8、,数据访问,Base SAS,ACCESS,MDDB Server,ODBC,数据管理,Base SAS,FSP,SHARE,CONNECT,ASSIST,Warehouse Admin.,MDDB Server,数据分析,Base SAS,STAT,ETS,OR,QC,IML,INSIGHT,NNA,LAB,SPECTRAVIEW,数据呈现,Base SAS,GRAPH,GIS,CALC,INSIGHT,SPECTRAVIEW,ASSIST,开,发,工,具,AF,EIS,FSP,分,布,式,计,算,环,境,CONNECT,SHARE,IntrNET,The SAS System,18,SAS
9、,系统软件由模块构成,SAS,系统是一个可由几个到二、三十个工具模块及面向行业的子系统组成的可伸缩系统。其模块按功能大体有四类:,数据库部分:,Base SAS,FSP,ACCESS,.,分析核心:,STAT,ETS,QC,OR,INSIGHT,.,开发呈现工具:,AF,EIS,GRAPH,.,分布处理与数据仓库:,CONNECT,WA,.,19,第一章,SAS,系统简介,1 使用系统运行一个简例,例.(中学生数据的简单分析),数据集,SASUSER.CLASS,中收集了19名中学生的年龄(,AGE),性别(,SEX),身高(,HEIGHT),和体重(,WEIGHT),的数据.,.试求年龄,身
10、高,体重的平均值,最大值和最小值;,.分别求男女二组中学生身高的平均值和方差;,.试问男女中学生的平均体重是否有显蓍差异?,(数据见练习题,P2,SAS,程序见,BASE11.SAS),20,第一章,SAS,系统简介,1 使用系统运行一个简例,解题步骤,(用基本的编程方式),:,()启动,SAS,系统(使用最简单的快捷方式);,()告诉,SAS,系统您要做什么-在,PROGRAM EDITOR,窗口中 键入程序(,BASE11.SAS):,()SAS,系统按要求完成分析计算-提交程序(,SUBMIT);,(),由,LOG,窗口查看程序执行的信息,()重调已提交的,SAS,程序(,RECALL)
11、,修改后再次提交;,()在,OUTPUT,窗口查看运行结果;,()存储有用的信息(,SAS,程序或计算结果).,(转到,SAS,系统运行,BASE11.SAS),21,第一章,SAS,系统简介,1 使用系统运行一个简例,解题步骤,(用菜单系统,SAS/INSIGHT,或分析员应用,),:,1.启动,SAS,系统=进入,INSIGHT,环境=打开,CLASS,数据集=,Analyze=Multivariate(Ys)=,选变量,Age,Height,Weight,=Output=,在弹出窗口选,Univariate=OK=OK,显示结果.,2.在分布窗口指定,SEX(,性别)为,GROUP,变量
12、及变量,Age,Height,Weight,在,Output,窗选,Univariate=OK=OK.,3.,启动,SAS,系统=进入分析员应用=打开,CLASS,数据集,=,Statistics=Hypothesis Tests=Two-Sample t-test for Means,=,指定分析变量(,Weight),和分组变量(,Sex)=OK,则显示结果.,22,启动,SAS,的方法:,()在,Windows,桌面系统下双击,AS,图标,第一章,SAS,系统简介,SAS,提供的基本运行环境-启动,SAS,()运行,SAS,系统目录下(例,C:SAS,),的可执行程序,sas.exe,(
13、)从,“,运行,“,打开或从,”,资料管理器,”,双击某个已,有的,SAS,程序,也可启动,SAS,系统并调入该程序,工作界面介绍,23,第一章,SAS,系统简介,2,SAS,提供的基本运行环境-显示管理系统,SAS,显示管理系统是用户和,SAS,系统交互会话的环境.包括众多的窗口(三个基本窗口:,PROGRAM EDITOR,窗口,LOG,窗口,OUTPUT,窗口),命令.,发布显示管理命令有四种方式:,在命令框直接键入命令;,使用显示管理系统的下拉菜单(弹出菜单);,使用工具栏。,按功能键(命令显示功能键所表示的命令).,24,第一章,SAS,系统简介,2,SAS,提供的基本运行环境-显示
14、管理系统,常用的其它窗口:,KEYS,查看及改变功能键的设置,LIBNAME,查看已存在的,SAS,数据库,DIR,查看某个,SAS,数据库的内容,VAR,查看,SAS,数据集的有关信息,OPTIONS,查看及改变,SAS,的系统设置,HELP,完整的帮助信息窗口,25,第一章,SAS,系统简介,SAS,提供的基本运行环境,SAS,常用的交互式运行方式:,.用,SAS,提供的菜单系统实现各种任务,.用,SAS,编程实现各种任务,.用,SAS/ASSIST,.用,SAS,桌面系统,进菜单系统,26,第一章,SAS,系统简介,SAS,提供的基本运行环境,进入,SAS/ASSIST,1.,使用工具栏
15、图标,2.发命令,ASSIST,3.,下拉菜单选,Globals=ASSIST,进入,SAS,桌面系统,1.发命令,DESKTOP,2.,下拉菜单选,Globals=Desktop,P005,27,第一章,SAS,系统简介,2,SAS,提供的基本运行环境-,SAS,菜单,系统,SAS,系统提供几个交互式地菜单系统用来完成各种分析任务,.,.,SAS/INSIGHT,软件,.分析员应用(,ANALYST),.,市场研究应用(,MARKET),.SAS/LAB,软件,.,SAS/ETS,软件的时间序列预报系统,P005,28,第一章,SAS,系统简介,2,SAS,提供的基本运行环境-应用工作界面,
16、应用工作界面(,AWS),SAS AWS,是,Windows,环境下使用显示管理系统运行,SAS,系统的工作界面.,SAS AWS,的主窗口是标题为,SAS,的窗口,SAS AWS,还包括:,.所有打开的,SAS,窗口(含最小化的窗口),.子窗口和对话框,.菜单条,工具栏,命令框,状态栏,29,第二章,SAS,系统对数据的管理,SAS,对数据的分析与呈现都是面对,SAS,数据集进行的,SAS,数据集是一种,SAS,文件,SAS,文件是由,SAS,系统创建和管理的有特殊结构的文件。包括,SAS,数据集和,SAS,目录册(,CATALOG),等,30,第二章,SAS,系统对数据的管理,数据直接输入
17、,流行的数据库,其它文件格式,SAS,数据集,SAS,应用程序,31,第二章,SAS,系统对数据的管理,1,SAS,数据集,两种类型的数据对象:,.,SAS,数据集,(,Data sets):,包含描述部分和数据部分,2.,SAS,数据视窗,(,Data View):,只含描述部分(变量名,属性,长度,标签,输入输出格式,创建与修改日期),Ass=D.Manag.=Utilities=Contents.=B&E=Dst Attr.,32,第二章,SAS,系统对数据的管理,1,SAS,数据集-,描述部分,33,第二章,SAS,系统对数据的管理,1,SAS,数据集-,数据部分,变 量,34,第二章
18、,SAS,系统对数据的管理,2,SAS,数据库-,SAS,数据库 及其库标记,SAS,数据集存储在,SAS,数据库中,SAS,数据库还存储其它,SAS,专用文件,SAS,数据库文件用两级命名方式定名:,libname.SAS-filename,(,库标记.文件名),SAS,数据集,SAS,数据库,35,第二章,SAS,系统对数据的管理,2,SAS,数据库-,永久库和临时库,SAS,数据库有永久库和临时库两种:,临时库,:名为,WORK,系统自动指定,永久库,:系统自动指定永久库的库标记为,SASUSER,用户还可以规定,其它,永久库标记.,例如:,Libname out a:;,36,第二章,
19、SAS,系统对数据的管理,2,SAS,数据库-,Windows,下,SAS,数据库的设定,不同的主操作系统下,SAS,数据库文件以不同方式与主操作系统下的文件组织相联系,在,Windows,下每个,SAS,数据库置于主机硬盘的某个子目录之中.,例:,SASUSER:C:SASSASUSER WORK:C:SASSASWORK,COURSE:C:COURSE,连库 Libname 库名 目录1 目录2,37,第二章,SAS,系统对数据的管理,2,SAS,数据库-,Windows,下,SAS,数据库的设定,.系统指定的库(设,SAS,系统在目录,C:SAS,下),SASUSER,设置在,C:SAS
20、SASUSER,WORK,设置在,C:SASSASWORK,.,LIBNAME,语句,使用,LIBNAME,语句可以指定,SAS,数据库的库标记,LIBNAME,库标记名,目录名,;,挘,例如:,LIBNAME out a:;,挘,LIBNAME course c:course;,看库,38,第二章,SAS,系统对数据的管理,2,SAS,数据库-,Windows,下,SAS,数据库的设定,3.,Libname,窗口,DIR,和,VAR,窗口,()用工具栏中的图标进入库管理对话窗(或键入命令,Dlglib),可浏览库内容或操作库文件或,()用,LIBNAME,命令进入,Libname,窗口,用,
21、DIR,命令进入,Dir,窗口,用,VAR,命令进入,Var,窗口,39,第二章,SAS,系统对数据的管理,2,SAS,数据库-,浏览数据集,()用工具栏中的图标进入库管理对话窗,=选中数据集后点鼠标右键,=在弹出菜单选,Open table view,(),在命令框发命令:,FSV,数据集名,()提交程序:,proc print data=,数据集名;,run,;,40,第三章,SAS,数据集的建立、浏览、编辑,建立,SAS,数据集的各种途径,数据存于纸上,需直接键入,数据存于文本文件,数据存于流行,数据库文件中,用,VIEWTABLE,FSEDIT FSVIEW,编程:用,DATA,步,用
22、,Import,菜单,用,SAS/ACCESS,41,第三章,SAS,数据集的建立、浏览、编辑,1 变量属性与输入、输出格式-变量的属性,数据集中变量的属性描述:,变量名,(,Name):,字母或下划线开始且不超过 8个字符或数字构成,类型,(,Type):,数值型、字符型,长度,(,Length):,缺省8字节(),标记,(,Label):,缺省40字节,输入格式,(,Informat):$,输入格式名,w.d,输出格式,(,Format):$,输出格式名,w.d,必须,可选,42,第三章,SAS,数据集的建立、浏览、编辑,1 变量属性与输入、输出格式-缺失值,在数据集的一条记录的某个变量无
23、数据时,称为,缺失值,(,Missing Value),。,字符型变量的缺失值用空格符表示,数值型变量的缺失值用句号“.”表示,NAME SEXPOSITION AGESALARY,Alex MA 35 1500,Linda F 28 1400,Simon MC 45,.,43,第三章,SAS,数据集的建立、浏览、编辑,1 变量属性与输入、输出格式-输入/输出格式,输入、输出格式的例子:,12234.1234,12,234.1234,$12,234.1234,8.2,comma8.2,dollar8.2,输入数据,输入格式,实际存储,数据值,12234.12,输出格式,8.2,comma8.2
24、,dollar8.2,输出数据,12234.12,12,234.12,$12,234.12,看转换:data _null_;x=put(today(),date7.);put x;run;,44,第三章,SAS,数据集的建立、浏览、编辑,1 变量属性与输入、输出格式-日期的格式,日期输入、输出格式例:,20,OCT97,20/10/97,1997/10/20,DATE7.,DDMMYY8.,yymmdd10.,输入数据,输入格式,实际存储,数据值,13807,输出格式,date9.,mmddyy6.,yymmdd8.,输出数据,20,OCT1997,102097,97-10-20,45,第三章
25、,SAS,数据集的建立、浏览、编辑,1 变量属性与输入、输出格式,几种常用的输入、输出格式:,w.d,$w.,COMMA,w.d,DOLLAR,w.d,DATE,w.,MMDDYY,w,.,标准的数字型格式,标准的字符型格式,数字中嵌入逗号,数字中嵌入逗号,前加$,日期格式,日期格式,46,第三章,SAS,数据集的建立、浏览、编辑,1 变量属性与输入、输出格式,利用,HELP,查找,SAS,系统提供的输入、输出格式,Help,下拉菜单,SAS System,目录:,SAS Language,索 引:,SAS Informats and Formats,-Contents,SAS Formats
26、,and Informats,从分类功能找,从格式名找,操作:VT 输入,47,第三章,SAS,数据集的建立、浏览、编辑,2 创建,SAS,数据集-,直接输入,.键入命令:,VT(viewtable)-,表格方式输入,或用,SAS,菜单系统-,SAS/INSIGHT,软件和分析员应用,.逐条输入,PROC FSEDIT,NEW=,SAS-data-set,;RUN;,.成批输入,PROC FSVIEW,NEW=,SAS-data-set,;RUN;,.,DATA,步(见第四章),操作:看生成的数据集和sasuser.class,48,第三章,SAS,数据集的建立、浏览、编辑,3 浏览、修改,S
27、AS,数据集,1.键入命令:,VT,数据集(如:,VT SASUSER.CLASS),或用,SAS,菜单系统-,SAS/INSIGHT,软件和分析员应用,2.逐行浏览,PROC FSEDIT,DATA=,SAS-data-set,;RUN;,.成批浏览,PROC FSVIEW,DATA=,SAS-data-set,;RUN;,4.用,PRINT,过程显示,SAS,数据集,49,第四章 用数据步生成,SAS,数据集,1,SAS,程序的构成,SAS,的程序由两种程序步(,Step),构成:,数据步,(,DATA STEP),:,以,DATA,语句开始,用于创建和整理,SAS,数据集,过程步,(,P
28、ROC STEP),:,以,PROC,语句开始,用于分析处理,SAS,数据,SAS,程序是由一个或若干个,DATA,步和,PROC,步组成的.,50,DATA,步中设定变量属性的语句:,第四章 用数据步生成,SAS,数据集,在,DATA,步中规定变量属性,LENGTH,变量名 长度,.;,INFORMAT,变量名 输入格式,.;,FORMAT,变量名 输出格式,.;,LABEL,变量名=,字符串输入格式,.;,Length,还决定了变量在数据集中的次序,看testdata,testdt2,testdt3 不同格式文本本件,51,第四章 用数据步生成,SAS,数据集,直接输入数据生成,SAS,数
29、据集,在,DATA,步直接输入数据的,一般形式:,DATA,SAS-data-set,;,变量属性设定语句,;,INPUT,语句,;,其它语句,;,CARDS;,数据行,;,RUN;,在,DATA,步直接输入数据的例子:,data da1;,input x y z;,sum=x+y+z;,cards;,1 3.1 5,3 2.3 7,6 3.4 6,;,看testdata,testdt2,testdt3 不同格式文本本件,52,第四章 用数据步生成,SAS,数据集,5,由文本数据文件生成,SAS,数据集,在,DATA,步由文本数据文件生成,SAS,数据集的一般格式,:,DATA,SAS-dat
30、a-set,;,变量属性设定语句,;,INFILE,filename,;,INPUT,语句,;,其它语句,;,RUN;,在,DATA,步由文本数据文件生成,SAS,数据集的例子,:,data da2;,infile c:f1.txt;,input x y z;,mean=(x+y+z)/3;,run;,文本数据文件,f1.txt,的内容:,3.1 5,3 2.3 7,.,53,第五章 增改删数据集中的记录或变量,1 读入其它,SAS,数据集,要增加、修改、删除,SAS,数据集中的观测或变量可在,DATA,步中加入各种语句来实现,()生成,SAS,数据集(由外部文件或直接输入)时,在,INPUT
31、,语句之后加入;,()用,SET,语句读入已有,SAS,数据集再加入各种语句对读入数据集中的变量或观测进行增改.,或用数据集选项实现.,54,第五章 增改删数据集中的记录或变量,1 读入其它,SAS,数据集,增改删数据集中的记录或变量,或在,INPUT,语句后 或用,SET,语句并加入其它,SAS,语句:加入其它,SAS,语句,DATA,new,;,.;,INPUT,;,其它,SAS,语句,;,RUN;,DATA,new,;,SET,old,;,其它,SAS,语句,;,RUN;,操作,p047,55,第五章 增改删数据集中的记录或变量,2 选择数据集的变量和观测-,选择变量,在,DATA,语句
32、中用数据集选项,DROP=,和,KEEP=,在,SET,语句中用数据集选项,DROP=,和,KEEP=,在,DATA,步中加入,DROP,语句和,KEEP,语句,例:(1),data new(drop=x y);,(2)set old(keep=x y);,(3)data new;.,drop x y;,run;,操作:class,if 年龄,性别,56,第五章 增改删数据集中的记录或变量,2 选择数据集的变量和观测-,选择观测,用,SAS,语句,保留观测,IF,expression,;(,子集,IF,语句),剔除观测,IF,expression,THEN DELETE;,操作,57,第五章
33、增改删数据集中的记录或变量,2 选择数据集的变量和观测-,选择观测,用数据集选项,在,DATA,语句中用选项,WHERE=,在,SET,语句中用选项,WHERE=,在,SET,语句中用选项,FIRSTOBS=,和/,或,OBS=,例:(1),data new(where=(sex=F);,(2)set old(where=(age13);,(3)set old(firstobs=6 obs=20);,58,第五章 增改删数据集中的记录或变量,3,用,SAS,语句创建、赋值和修改,DATA,步中常用的语句:,设定变量属性的语句,赋值语句,条件语句,循环语句,转移语句,OUTPUT,语句与,PUT
34、,语句,操作:class,W/H h inch-cm,59,赋值语句的一般形式,var,新建或修改的变量名,expression,由变量、,SAS,函数和四则运算 (+,-,*,/,*)构成的表示式,赋值语句将表示式的值赋给变量,第五章 增改删数据集中的记录或变量,3,用,SAS,语句创建、赋值和修改,-赋值语句,var=expression;,fct132 取整,fct134 平均,求和,60,SAS,函数共19类,调用形式:,函数名,(,变元,),函数名,(,OF,变量名列,),其中变元可以是常数、变量、函数或表示式,例:,sqrt(x),probnorm(x),tinv(x,df),su
35、m(of x1,x10-x20,x25),第五章 增改删数据集中的记录或变量,3,用,SAS,语句创建、赋值和修改-,SAS,函数,(转到,SAS,系统运行,BASE53_3.SAS),61,第五章 增改删数据集中的记录或变量,3,用,SAS,语句创建、赋值和修改-,SAS,函数,利用,HELP,查找,SAS,系统提供的各种函数,Help,下拉菜单,SAS System,目录:,SAS Language,索引:,SAS Function,-Contents,从分类功能找,从函数名找,SAS Functions,62,第五章 增改删数据集中的记录或变量,3,用,SAS,语句创建、赋值和修改,-,
36、SAS,函数,63,第五章 增改删数据集中的记录或变量,3 用,SAS,语句创建、赋值和修改-,SAS,函数,测试函数功能的一个简单的程序:,data _null_;,y=sqrt(3);,put y=;,run;,p050 日期函数,64,第五章 增改删数据集中的记录或变量,3 用,SAS,语句创建、赋值和修改-,SAS,日期时间函数,SAS,日期常数和函数:,直接作为数字型常数:,ddMMMyyD(,例如:12,JAN96d),一些操作日期的函数:,DATE(),TODAY(),DATETIME(),TIME(),YEAR(SAS-date),QTR(SAS-date),MONTH(SAS
37、-date)DAY(SAS-date),HOUR(datetime|time),MINUTE(.),MDY(month,day,year),HMS(hour,minute,second),DHMS(date,hour,minute,second),书上例,p41开始,65,条件语句,IF,条件表达式,THEN,可执行语句,;,ELSE,可执行语句,;,第五章 增改删数据集中的记录或变量,3,用,SAS,语句创建、赋值和修改-,条件语句,比较操作符:,GT,=EQ,LE,GE,NE,IN,逻辑操作符:,&,AND,-OR,NOT,.,IF,expression,THEN,DO;,statemen
38、ts,;.,END;,ELSE,DO;,statements,;.,END;,66,第五章 增改删数据集中的记录或变量,3,用,SAS,语句创建、赋值和修改-例子,(1),tatol=x+y+z;tatol=sum(x,y,z);tatol=sum(of x1-x6);,(2)if sex=F then y=100+y;,if upcase(dest)=,LAX,then y=x+z;,(3)if sum le 170 then delete;,(4)if upcase(dest)=,LAX,then do;,y=x+z;city=Dallas;,end;,(5)length city$12;
39、,(6)date=01jan97d;,year=year(date);qtr=qtr(date);,month=month(date);day=weekday(date);,(参见,BASE53.SAS),67,第六章 串接或并接,SAS,数据集,A,B,AB,A,B,SAS,数据步,数据串接,SAS,数据集,SAS,数据集,数据并接,68,DATA,SAS-data-set,;,SET,SAS-data-set1 SAS-data-set2.,;,RUN;,第六章 串接或并接,SAS,数据集,1 串接,SAS,数据集,用,SET,语句串接,SAS,数据集,(变量相同或变量不同的连接),p05
40、8 最简,p059 变量不同,p060 变量改名,69,第六章 串接或并接,SAS,数据集,1 串接,SAS,数据集,NUM VARA,1 A1,2 A2,5 A3,DATA COMBINE;,set A B;,run;,A:,B:,NUM VARA VARB,1 A1,2 A2,5 A3,3 B1,4 B2,6 B3,COMBINE:,NUM VARB,3 B1,4 B2,6 B3,(参见,BASE61.SAS),70,DATA,SAS-data-set,;,SET,SAS-data-set1 SAS-data-set2.,;,BY,Variables,;,RUN;,第六章 串接或并接,SA
41、S,数据集,1 串接,SAS,数据集,用,SET,语句串接,SAS,数据集,(按,BY,变量的顺序交替连接数据集中观测),71,NUM VARB,3 B1,4 B2,6 B3,第六章 串接或并接,SAS,数据集,1 串接,SAS,数据集,NUM VARA,1 A1,2 A2,5 A3,DATA COMBINE;,set A B;,BY NUM;,run;,A:,B:,NUM VARA VARB,1 A1,2 A2,3 B1,4 B2,5 A3,6 B3,COMBINE:,(参见,BASE61.SAS),p061,72,第六章 串接或并接,SAS,数据集,1 串接,SAS,数据集-,SORT,过
42、程,用,PROC SORT,语句对,SAS,数据集排序,(当用,BY,语句时,要求对每个数据集先用,SORT,过程按,BY,变量排好次序),PROC SORT,DATA=,SAS-dat-set1,OUT=,SAS-dat-set2,;,BY,by-variables,;,RUN;,p063(比较有无by),73,第六章 串接或并接,SAS,数据集,2 并接,SAS,数据集,用,MERGE,语句合并,SAS,数据集,DATA,SAS-data-set,;,MERGE,SAS-data-set1 SAS-data-set2,;,BY,by-variables,;,RUN:,MERGE,SAS-d
43、ata-set1,(In=,var),SAS-data-set2(In=,var,),;,Set 258 内部变量,Set258_2 转为用户设定变量,74,第六章,串接或并,接,SAS,数据集,1,串接,SAS,数据集,NUM VAR,1 C1,2 C2,2 C3,3 C4,NUM VAR,2 D1,3 D2,3 D3,data combine;,set C D;,by num;,run;,C:,D:,NUM VAR,1 C1,2 C2,2 C3,2 D1,3 C4,3 D2,3 D3,COMBINE:,(参见,BASE61.SAS),75,第六章 串接或并接,SAS,数据集,2 并接,SA
44、S,数据集,NUM VARA,1 A1,2 A2,3 A3,NUM VARB,1 B1,2 B2,4 B3,DATA COMBINE;,merge A B;,by num;,run;,A:,B:,NUM VARA VARB,1 A1 B1,2 A2 B2,3 A3,4 B3,COMBINE:,(参见,BASE62.SAS),p066 by+in,p067 by+in+rename,76,第六章 串接或并接,SAS,数据集,2 并接,SAS,数据集,NUM VARA,1 A1,2 A2,3 A3,NUM VARB,2 B1,2 B2,3 B3,DATA COMBINE;,merge A B;,b
45、y num;,run;,A:,B:,NUM VARA VARB,1 A1,2 A2 B1,2 A2 B2,3 A3 B3,COMBINE:,(参见,BASE62.SAS),p070,77,PROC PRINT,DATA=,SAS-data-set,;,RUN;,第七章 用,PROC PRINT,制作列表报告,1 产生列表报告,PROC PRINT,语句的最简单形式:,例:,Proc print data=sasuser.class;,run;,P,78,第七章 用,PROC PRINT,制作列表报告,1 产生列表报告,PROC PRINT,过程的一般形式:,PROC PRINT,DATA=,S
46、AS-data-set,;,ID,variable,;,VAR,variables,;,WHERE,where-expression,;,SUM,variables,;,BY,by-variables,;,PAGEBY,by-variables,;,RUN;,79,第七章 用,PROC PRINT,制作列表报告,1 产生列表报告-例子,(1),proc print data=class noobs;,run;,(2)proc print data=class noobs;,var name height weight;,where age between 13,and 15;,run;,(3)
47、,proc sort data=class;,by sex;,proc print data=class;,by sex;,id name;,run;,(4)proc print data=class;,by sex;,sum age;,run;,(参见,BASE71.SAS),p079 title,p080 footnote,80,第七章 用,PROC PRINT,制作列表报告,2 改进列表报告,TITLE,n text,;,FOOTNOTE,n text,;,标题、脚注和选项:,OPTIONS,options,;,p088,81,第七章 用,PROC PRINT,制作列表报告,2 改进列表
48、报告,与,PRINT,有关的一些系统选项,CENTER|NOCENTERDATE|NODATENUMBER|NONUMBERLINESIZE=,width,PAGESIZE=,n,PAGENO=,n,定义方法,OPTIONS,语句,OPTIONS,窗口,82,第七章 用,PROC PRINT,制作列表报告,2 改进列表报告,PROC PRINT,选项,;,PROC PRINT,的一些选项:,HEADING=v|h,LABEL,SPLIT=,符号,WIDTH=Full|Min|U,p081 label 临时设定,p082 split.用cclass+opton label,83,第七章 用,PR
49、OC PRINT,制作列表报告,2 改进列表报告,LABEL,variable1=label,variable2=label,.,;,Print,选项,:,SPLIT=,符号,Label,语句:,例:,proc print data=class split=#;,label weight=weight#in#pounds;,run;,p084 用已有格式,p086 用定义格式,84,第七章 用,PROC PRINT,制作列表报告,2 改进列表报告,FORMAT,语句:,FORMAT,variables format,;,定义用户格式:,PROC FORMAT;,VALUE,format-nam
50、e,range1=label,range2=label,.,;,85,第七章 用,PROC PRINT,制作列表报告,2 改进列表报告-综合例子,proc format;,value group low-95=S 96-110=M 111-high=L;,run;,option ps=40 ls=80;,proc print data=class split=*label;,format weight group.;,var name sex height weight;,title,中学生数据;,footnote 1986;,label name=First*name,sex=Gender,