ImageVerifierCode 换一换
格式:PPTX , 页数:53 ,大小:470.67KB ,
资源ID:10293568      下载积分:8 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10293568.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(统计分析系统sas03学习教案.pptx)为本站上传会员【胜****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

统计分析系统sas03学习教案.pptx

1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,11/7/2009,#,#,单击此处编辑母版标题样式,会计学,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,会计学,1,统计分析系统(xtng)sas03,第一页,共53页。,计算中心(j sun zhn xn),数据(shj)步语句,选择语句(yj),SELECT(选择表达式);,WHEN(值列表)语句(yj);,WHEN(值列表)语句(yj);,OT

2、HERWISE 语句(yj);,END;,第1页/共53页,第二页,共53页。,计算中心(j sun zhn xn),数据(shj)步语句,其中“选择表达式”是一个取数值、字符型值的变量或表达式,“值列表(li bio)”为一项或者若干项,多项之间逗号分开,每项可以是一个与选择表达式相同取值类型的表达式。,“语句”可以是单个语句或复合语句。执行SELECT结构时,先计算出选择表达式和值列表(li bio)中的所有值,然后把选择表达式值由前向后与值列表(li bio)中的值相比,发现相等值则执行对应的语句,然后退出SELECT结构(不再查看后面的值列表(li bio)).,如果选择表达式的值不等

3、于任何值列表(li bio)中的值则执行OTHERWISE对应的语句,这种情况下没有OTHERWISE语句会出错。,第2页/共53页,第三页,共53页。,计算中心(j sun zhn xn),数据(shj)步语句,选择语句的另一种形式,SELECT;,WHEN(条件)语句;,WHEN(条件)语句;,OTHERWISE 语句;,END;,这种SELECT语句没有(mi yu)选择表达式,而是在每一个 HEN语句指定一个条件(逻辑表达式),执行第一个满足条件的WHEN后的语句,如果所有条件都不满足则执行OTHERWISE后的语句。,第3页/共53页,第四页,共53页。,计算中心(j sun zhn

4、 xn),数据(shj)步语句,SELECT;,WHEN(age=12)put 少年(shonin);,WHEN(age=5;,Run;,第16页/共53页,第十七页,共53页。,计算中心(j sun zhn xn),FREQ过程(guchng),Proc freq data=数据集名 选项;,tables 变量名列表/选项;,Run;,Tables语句(yj)中的选项:,nocum不要累计的频数和百分数,nopercent-不要百分数和累计的百分数,Proc freq语句(yj)中的选项:,order=internal-按变量值排序,freq-按频数降序排序,data-按数据集中的值的次序排

5、序,formatted-按变量格式化的值排序,第17页/共53页,第十八页,共53页。,计算中心(j sun zhn xn),MEANS过程(guchng),PROC MEANS DATA=;,VAR;,BY;,CLASS;,RUN;,第18页/共53页,第十九页,共53页。,计算中心(j sun zhn xn),可以计算的描述性统计(tngj)量关键字及其含义见下表,关键字,所代表的含义,关键字,所代表的含义,n,有效数据记录数,range,极差,nmiss,缺失数据记录数,skewness,偏度,mean,均值,kurtosis,峰度,std,标准差,t,分布位置假设检验之,t,统计量,s

6、tderr,标准误,probt,上述,t,统计量对应的概率值,var,方差,q1,第一四分位数,median,中位数,q3,第三四分位数,mode,众数,qrange,四分位数间距,cv,变异系数,p1,第一百分位数,max,最大值,p5,第五百分位数,min,最小值,p10,第十百分位数,sum,总计,p90,第九十百分位数,sumwgt,加权值总计,p95,第九十五百分位数,css,校正平方和,p99,第九十九百分位数,uss,未校正平方和,第19页/共53页,第二十页,共53页。,计算中心(j sun zhn xn),UNIVARIATE过程(guchng),PROC UNIVARIAT

7、E DATA=;,VAR;,BY|CLASS;,HISTOGRAM/;,OUTPUT OUT=;,RUN;,第20页/共53页,第二十一页,共53页。,计算中心(j sun zhn xn),UNIVARIATE过程(guchng),UNIVARIATE过程和MEANS过程的格式非常相似,相同的语句和选项其含义也相同,所不同的是某些统计(tngj)量只能在UNIVARIATE过程中计算(如众数),而且UNIVARIATE过程中具有绘图功能。,其中,HISTOGRAM语句用来指示SAS对其后所指定的变量绘制直方图,其后的选项用来指示SAS添加不同类型的拟合图形(如正态分布的分布密度曲线)。,第21

8、页/共53页,第二十二页,共53页。,计算中心(j sun zhn xn),用分析家作频数(pn sh)统计,选择”解决方案/分析/分析家”进入(jnr)分析家环境,点击”文件/按SAS名称打开”打开数据集,点击”统计/描述性统计/频数统计”,在弹出的对话框中:,AGE=Frequencies,Sex=Frequencies,点击OK,第22页/共53页,第二十三页,共53页。,计算中心(j sun zhn xn),FORMAT过程(guchng),PROC FORMAT;,VALUE 格式变量名 分组形式(xngsh);,RUN;,其中:格式变量名由用户命名,在其他在其他过程中可以引用该格式

9、名.,引用:,PROC 过程名 DATA=数据集名;,过程语句;,FORMAT 数据集中的变量名 格式名.;,RUN;,第23页/共53页,第二十四页,共53页。,计算中心(j sun zhn xn),FORMAT过程(guchng),Proc format;,Value wfmt low-13=“low 13-16=“13-16 16-high=“high“;,Run;,Proc print data=temp.class;,Format weight wfmt.;若没有该语句,数据集中(jzhng)的Weight数据仍按原始显示,Run;,第24页/共53页,第二十五页,共53页。,计算中

10、心(j sun zhn xn),SAS制作图形(txng)的过程,建立(或转换)数据文件,根据设计者的要求选用恰当的模型,生成图形,编辑(binj)、整理,得到满意的结果。,图形参数语句,Goptions 图形选项,设置图形输出的参数,如,goptions ftext=SWISS ctext=BLACK htext=1 cells;,Symbole 图形选项,常对GPLOT过程输出的图形进行参数设置,Pattern 图形选项,常对CHART过程输出的图形进行参数设置,第25页/共53页,第二十六页,共53页。,计算中心(j sun zhn xn),使用GPLOT过程(guchng)绘制散点图和

11、连线图,通常用散点图和连线图可以表示:,一个变量(binling)随另一个变量(binling)的变化;,变量(binling)之间的关系;,数据值的分布。,GPLOT过程的一般格式,PROC GPLOT DATA=;,PLOT *=/;,SYMBOLn;,RUN;,第26页/共53页,第二十七页,共53页。,计算中心(j sun zhn xn),选项,意义,说明,FRAM|NOFRAM,在图形四周加入或不加入边框,缺省为加入,CFRAM=,颜色,边框内的颜色,缺省为白色,AUTOHREF(AUTOVEREF),在水平,(,垂直,),轴的每个主刻度处加入水平,(,垂直,),参考线,NOAXIS

12、取消坐标轴及相关的图形元素,CAXIS=,颜色,设定轴的颜色,CTEXT=,颜色,设定与轴相关字符的颜色,HAXIS=,值列举,设定水平轴主刻度的值,VAXIS=,值列举,设定垂直轴主刻度的值,overlay,多个图共坐标,PLOT语句(yj)的选项,第27页/共53页,第二十八页,共53页。,计算中心(j sun zhn xn),选项,意义,取值,V=,符号,表示点使用的符号,plus,star,squar,diamond,triangle,point,dot,circle,C=,颜色,表示点的符号及连线的颜色,black,red,green,blue,cyan,magenta,gray,

13、pink,orange,brown,yellow,CV=,颜色,专指点的符号的颜色,H=n,指名符号的大小,单位有:,cell,cm,pct,pt,in,POINTLABEL,在点的附近表明,Y,轴变量的值,i=,连线方式,指明连线的方式,none,join,spline,needle,(从数据点到横轴画直线),Hl,(直线回归线,),CI=,颜色,专指连线的颜色,L=n,n,为线型的序号,0,空白线,,1-,实线,,2,虚线,W=n,n,表示线的宽度,SYMBOL语句用来控制表示点的符号和点间的连线(lin xin)。其中n是不同SYMBOL语句的序号,可以是1-99,缺省为1。选项见下表,

14、第28页/共53页,第二十九页,共53页。,计算中心(j sun zhn xn),绘制(huzh)函数y=sin(x)的曲线图,程序(chngx),DATA SIN;,DO X=-2*3.14,TO,2*3.14 BY 0.2;,Y1=SIN(X);Y2=COS(X);,OUTPUT;,END;,SYMBOL1 I=J V=PLUS;,PROC GPLOT;,PLOT Y1*X=1 Y2*X/OVERLAY;,RUN;,第29页/共53页,第三十页,共53页。,计算中心(j sun zhn xn),GCHART过程(guchng),GCHART过程用于绘制直方图、饼形图(扇形图)、三维直方图等

15、表示(biosh)变量分布的图形,语法格式,PROC GCHART DATA=;,图形关键字/绘制垂直条图;,BY;指明分组变量;,AXISn 定义坐标;,Run;,第30页/共53页,第三十一页,共53页。,计算中心(j sun zhn xn),图形(txng)关键字,GCHART过程可以使用的图形关键字及其所绘制(huzh)的图形类型见表,图形关键字后的变量名,用以指定进行图形描述时的分组变量,可以是数值型的(此时以各组的组中值为分组的标志),也可以是字符型的。,图形关键字,绘制的图形类型,图形关键字,绘制的图形类型,block,方块图,pie,饼形图,hbar,水平的条形图,pie3d,

16、三维饼形图,hbar3d,水平的三维条形图,donut,环形图,vbar,竖立的条形图,star,星形图,vbar3d,竖立的三维条形图,第31页/共53页,第三十二页,共53页。,计算中心(j sun zhn xn),选项列表(li bio),TYPE=freq|cfreq|pct|cpct|sum|mean,统计图形变量的频数|累计频数|,Discrete 把数字变量当成离散变量处理,GROUP=变量名,指定并排分组变量,SUBGROUP=变量名,按分组变量的值分段,Patternid=Midpoint,规定连续性图形变量按数字列表(li bio)中的中心点数字次序进行排列,SUMVAR=

17、变量名(数值变量),指定要进行统计计算的变量,也就是“TYPE=统计量关键字”选项中统计量的计算所依据的变量,第32页/共53页,第三十三页,共53页。,计算中心(j sun zhn xn),PATTERN语句(yj),语句格式:pattern 选项;,常用选项:,Color=颜色 设置花纹颜色,V=E|S|Ln|Rn|Xn 设置填充(tinchng)参数依次可选:实心|空心|左斜线|右斜线|交叉线,如:,Goptions reset=all;,Pattern v=x5 c=gray;,Proc gchart data=aa.class;,Vbar age/discrete;,Run;,第33

18、页/共53页,第三十四页,共53页。,计算中心(j sun zhn xn),画条形图(直方图),使用VBAR关键字可以(ky)画条形图,proc gchart data=aa.MYDATA;,vbar Income;,run;,结果如图所示,第34页/共53页,第三十五页,共53页。,计算中心(j sun zhn xn),PROC G3D options;,PLOT y*x=z/options;产生三维曲面图,Scatter y*x=z/options;产生三维散点图,PLOT语句中的选择项(/options),CAXIS=color 坐标轴颜色,CBOTTOM=color 曲面底部区域颜色,

19、CTOP=color 曲面顶部(dn b)颜色,CTEXT=color 文本颜色,用G3D过程(guchng)绘图,第35页/共53页,第三十六页,共53页。,计算中心(j sun zhn xn),绘制(huzh)三维曲面图,程序(chngx),Proc g3d data=aa.hat;,Plot y*x=z;,Run;,第36页/共53页,第三十七页,共53页。,计算中心(j sun zhn xn),用INSIGHT绘制(huzh)图形,生成条形图和直方图,生成盒形图和马赛克图,生成散点图,生成连线(lin xin)图,生成等高线图,生成三维旋转图,第37页/共53页,第三十八页,共53页。

20、计算中心(j sun zhn xn),生成(shn chn)条形图和直方图,条形图(或直方图)是用来研究一个(y)变量取值分布的图形表示法。,变量取值的范围分成若干区间,在横轴上,每个区间上画一个(y)矩形方块,矩形的宽度就是区间的宽度,矩形的高度可以是频数、百分数或比率。,第38页/共53页,第三十九页,共53页。,计算中心(j sun zhn xn),生成(shn chn)条形图和直方图,例从某大学总数为500名学生的“概率统计学”课程的考试成绩中,随机地抽取60名学生的考试成绩如表所示,绘制(huzh)这些数据的频数直方图。,学生成绩,63,75,83,91,45,81,93,30,7

21、2,80,82,83,81,76,67,84,72,58,83,64,93,63,75,99,74,76,95,91,83,61,82,85,83,44,88,72,66,94,68,78,88,71,94,85,82,79,100,90,83,88,84,48,72,80,85,80,87,76,62,96,第39页/共53页,第四十页,共53页。,计算中心(j sun zhn xn),生成(shn chn)条形图和直方图,建立数据集score,启动SAS/INSIGHT,打开score数据集,在数据窗口,选择cj变量,选择菜单命令“分析/直方图/条形图”,参数的设置(刻度,参考(cnko)

22、线等),图的复制与保存,第40页/共53页,第四十一页,共53页。,计算中心(j sun zhn xn),生成(shn chn)盒形图,盒形图由一个矩形盒和两个须构成。矩形盒的两侧(上下)分别位于上下四分位数的位置,所以矩形盒的宽度(高度)为四分位极差。,盒的中间在中位数位置也有一条(y tio)直线。,盒的两侧(上下)的须分别表示自四分位数的边出发延伸至1.5倍四分位极差范围内最远的数据点的位置,通常对四分位数之外1.5倍四分位极差以外的每个数据用点标出。这些点有可能是例外数据点,提示人们去考察它,在分析时是否需要剔除它。,第41页/共53页,第四十二页,共53页。,计算中心(j sun z

23、hn xn),生成(shn chn)连线图,例绘家庭收支情况对比(dub)图,启动SAS/INSIGHT,选择数据集mydata,选择“分析/连线图(Y X)”,将ID变量选定为X轴,Income,outgo变量选到Y轴,如图右上,单击“确定”。,线图如图右下所示。,第42页/共53页,第四十三页,共53页。,计算中心(j sun zhn xn),生成(shn chn)连线图,例绘sin 曲线的连线图和散点图,创建数据集 sin,DATA sin;,DO X=0,TO,6.28 BY 0.1;,y=SIN(x);OUTPUT;,END;RUN;,启动SAS/INSIGHT,选择(xunz)数据

24、集sin,选择(xunz)“分析/散点图(Y X)”绘散点图,选择(xunz)“分析/连线图(Y X)”绘线图,第43页/共53页,第四十四页,共53页。,计算中心(j sun zhn xn),生成(shn chn)等高线图,例绘等高线图,创建数据集HAT,DATA HAT;,DO X=-5,TO,5 BY 0.25;,DO Y=-5,TO,5 BY 0.25;,Z=SIN(SQRT(X*X+y*Y);,OUTPUT;,END;END;RUN;,启动(qdng)SAS/INSIGHT,选择数据集HAT,选择“分析/等高线图(Z Y X)”,第44页/共53页,第四十五页,共53页。,计算中心(

25、j sun zhn xn),生成(shn chn)三维旋转图,例绘三维旋转(xunzhun)图,启动SAS/INSIGHT,选择数据集HAT,选择 “分析/旋转(xunzhun)图(Z Y X)”,第45页/共53页,第四十六页,共53页。,计算中心(j sun zhn xn),用“分析家”绘制(huzh)图形,条形图,盒图,饼分图,饼图(Pie Chart)对分类变量(binling)描述其频数取值的比例,连线图,散点图,等值面图,概率图,曲面图等,第46页/共53页,第四十七页,共53页。,计算中心(j sun zhn xn),作业(zuy),1.使用编程方法对mydata数据集进行加工:

26、1)生成R_ID=1的子集;,(2)生成只包含id,income,outgo的子集(用,数据集选项或SAS语句(yj);,(3)增加新变量ratio=outgo/income;,(4)用SELECT和OUTPUT语句(yj)把mydata数,据集拆分为地区编号为1和2的两个数据集.,第47页/共53页,第四十八页,共53页。,计算中心(j sun zhn xn),作业(zuy),2.用DO循环语句(yj)读入下列数据表:,A 1 31.5,A 2 29.8,A 3 32.4,B 1 40.1,B 2 41.1,B 3 42.0,C 1 50.1,C 2 51.2,C 3 50.8,(1)生

27、成有个变量(TYPE,GROUP,Y)个观测的数据集DABC;,(2)用条件IF语句(yj)或数据集选项where 生成只包含TYPE=的数据集DAC.,第48页/共53页,第四十九页,共53页。,计算中心(j sun zhn xn),作业(zuy),2.用DO循环语句读入下列(xili)数据表:,A 1 31.5,A 2 29.8,A 3 32.4,B 1 40.1,B 2 41.1,B 3 42.0,C 1 50.1,C 2 51.2,C 3 50.8,(1)生成有个变量(TYPE,GROUP,Y)个观测的数据集DABC;,(2)用条件IF语句或数据集选项where 生成只包含TYPE=的

28、数据集DAC.,第49页/共53页,第五十页,共53页。,计算中心(j sun zhn xn),3、已知一批统计数据,包括学号、性别、年龄、计算机成绩、等级(dngj)等项,建立一永久数据集CLASS8,绘制等级(dngj)的条形图。数据如下:,94-001 F 25 88 良,94-002 M 27 90 优,94-003 M 24 80 良,94-004 F 24 75 中等,94-005 F 23 85 良,94-006 M 24 65 一般,94-007 M 22 70 中等,94-008 M 25 76 中等,94-009 F 22 60 一般,94-010 F 23 66 一般,94-011 F 22 78 中等,94-012 F 24 85 良,94-013 M 23 89 良,94-014 F 22 62 一般,作业(zuy),第50页/共53页,第五十一页,共53页。,计算中心(j sun zhn xn),4、调用数据集CLASS8,试做等级(dngj)变量的饼分图。,作业(zuy),第51页/共53页,第五十二页,共53页。,计算中心(j sun zhn xn),谢谢(xi xie)!,第52页/共53页,第五十三页,共53页。,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服