1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,Stata 基础,Stata 统计软件包是目前世界上最著名的统计软件之一,国外将Stata与SAS、SPSS 一起被并称为三大权威软件。它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,几乎可以完成全部复杂的统计分析工作。被广泛地应用于统计学、经济学、生物学、社会学、人口学等领域。,Stata有什么优势?,1。Stata 可以通过菜单和命令两种方式操作,命令语句简洁明快,易学易记。,2。强大的帮助信息。,本地帮助 Help 命令名,在线帮助Findit 命令名,3。始终处于计量经
2、济学和统计学的最前沿。许多Stata 程序员会针对计量经济学发展编写一些最新的程序(ADO 文件),Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,同时可随时到Stata 网站寻找并下载最新的升级文件。下载后可以直接使用,也可以自行修改、添加功能。,学习有什么困难?,1。不同于以往的软件较多的运用菜单,Stata较多运用命令操作。(菜单很难记住和找到)。,2。目前国内相关教材较少。,3。有些计量方法需要编程(如极大似然估计),编程需要一定的计算机基础(不是我们学习的重点)。,版本说明,最新版本Stata 12,我们使用的 Stata10,stata 10包括四种版本:
3、Small(,小型版)、IC(标准版)、SE(特殊版)和MP(多处理器版)。其中,MP,版本最为强大。,MP,版与,SE,版的功能完全相同,但,MP,版的运算速度比,SE,版的要快很多。用户可以在命令栏输入,about,查看所安装的,Stata,所属的版本。,命令回顾窗口,:即review 窗口,位于界面左上方,所有执行过的命令会依次在该窗口中列出,选中某一行单击后命令即被自动拷贝到命令窗口中;如果需要重复执行,用鼠标双击相应的命令行即可。,变量名窗口,:位于界面左下方,列出当前数据集中的所有变量名称。,其他窗口一般使用时会自动跳出。,以auto数据源为例使用上述窗口。,Stata的菜单介绍,
4、最重要的菜单项:,Data菜单,Graphic菜单,Statistics菜单,每执行一个菜单性会自动产生相应的命令。(我们以summarize和regress为例加以阐述)。,我们的讲述尽量兼顾到命令操作和菜单操作两种方法,以命令方式为主。,Stata的安装指南,分为安装版和简易版,安装版:(部分vista机器不支持),解压 setup.rar,运行 setup,安装时选择 Stata SE,安装到C盘或者D盘(最好D盘),安装完毕,第一次运行会出现注册信息,此时需运行keygen文件,将注册数据贴入。,Stata的文件,最重要的有三类文件,1。文件名.dta 数据文件,2。文件名.do 命令
5、文件,3。文件名.ado 程序文件,Stata的目录结构及打开文件的操作,如果不加改变,安装时Stata会将系统程序安装到:,C:Program filestata10 中。,将所用系统自带的一些系统数据、应用程序、帮助文件安装到,C:Program filestata10adobase 中,将所有升级程序安装到:,C:Program filestata10adoupdate 中,Stata自带的示例数据表,为了方便大家学习,stata中有很多自带示例数据,绝大部分数据都是美国的一些真实统计数据,较新的数据和统计资料可以到stata网站中下载。,Stata数据文件的打开,1。所有的系统示例数据
6、可以利用sysuse命令打开。,2。用户自己的统计数据需要用use命令打开。use命令默认打开 C:data 或者 D:data中的数据。,3。如果需要打开其他文件夹的数据,必须改变目录(例如,将自己的数据放入D:abc),cd D:abc”,或者直接 file-open,Stata命令格式,1。Stata的命令一定要区分大小写,除了极个别的情况下,stata命令全部用小写。,2。大部分命令可以缩写。,使用缩写可以使stata的命令书写大为简化:,例如:display-di,summarize-sum,describe-des,得到正确命令缩写的简单方法:看help。,几条最简单的命令,use
7、 打开数据文件,一般加clear选型清空内存中现有数据。,sysuse 打开系统数据文件。,describe 描述数据,edit 利用数据编辑器进行数据编辑,list 类似于edit,但只能显示不能修改数据。,display 显示计算结果。经常写为:di,summarize 求某个变量的观察值个数、平均值、标准差、最小值和最大值。经常写为:sum,scatter 生成两个变量的散点图。,set obs 定义样本个数(使用前一定要用drop或者clear命令清空当前样本),generate 建立新变量并赋值。经常写为gen,sort 按照某一个变量排序,一般用于升序。,gsort 按照某一个变量
8、排序,既可升序又可降序。,几个简单的例子,di,use,sysuse,sum,scatter,gen,sort,举例:画出,Y=X,2,的曲线图,drop _all,(drop data from memory),set obs 100,(make 100 observations),gen x=_n,(x=1,2,3,.,100),gen y=x2,(y=2,4,9,.,10000),scatter y x,(make a graph),命令格式简介,stata命令格式,by,varlist,:command,varlist,=,exp,if,exp,in,range,weight,opti
9、ons,1。Command 命令动词,经常用缩写。,2。varlist 表示一个变量或者多个变量,多个变量之间用空格隔开。如 sum price weight,3。by,varlist,分类信息 按照某一变量的不同特性分类,4。=,exp,赋值及运算,5。if,exp,挑选满足条件的数据,6。in,range,对数据进行范围筛选,7。,Weight,给数据赋一个权重,8。,options 命令增加一些可选信息,下面通过多个例子详解以上参数。,Stata数据处理,1。Stata的数据格式为 文件名.dta,2。对于系统自带数据文件,任何情况下可以用 sysuse 命令打开。,3。对于C:data
10、或者D:data)下的文件,可以使用use命令打开。,4。放在其他目录的文件可以利用设置目录或者“打开”菜单打开。,Stata数据类型,数值型,:用0、1、29 及+、(正负号)与小数点和()来表示。,字符型,:字符串变量由字母数字或一些特殊的符号组成(如地名、住址,职业等等)。,注意:数字不表示大小信息,如电话、身份证号等。字符型数据必须要加“”。,日期型:,在Stata中,1960 年1 月1 日被认为是第0 天,因此1959 年12 月31 日为第-1天,表示形式为:jan/10/2001或者10jan2001。,Stata数据的录入,1。直接录入。,2。在Excel或者记事本文件编辑
11、好后导入。,3。保存文件为cj.dta,code,english,math,finance,1001,90,76,90,1002,87,72,80,1003,76,80,85,1。直接录入。,利用data editor,2。在Excel或者记事本文件编辑好后导入。,直接粘贴,Import导入(必须将excel文件存成csv格式),除了csv格式,还可以导入txt格式和raw格式。,练习:利用import方法将wage2.xls导入,数据类型的转变,首先先学习两种最简单的:,1.数值型-字符型,tostring 变量列表,gen(新变量)|replace,2.字符型-数值型,destring 变
12、量列表,gen(新变量)|replace,添加标签,打开wage1数据文件。,1。为整个数据添加标签:例如,将数据命名为“工资表”。,菜单:Data-Labels-Label dataset,命令:label data“工资表“,2。为变量增加标签,例如,给变量wage增加标签“年工资总额”,菜单:Data-Labels-Label variables,命令 label variable wage“年工资总额,自己练习:为下列变量增加标签,educ:受教育年限。,exper:工龄。,tenure:现有岗位任期。,为变量值增加标签,例如:为变量marrid添加数值标签marry:1=married;0=Unmarried,菜单:Data-Labels-Label values-Define or modify label values,Data-Labels-Label values-Assign label values to variable,命令:,label define marry 1“married”0“unmarried,label values married marry,






