1、运用Stata做计量经济学运用Stata建模的7步骤:1、准备工作;目录、日志、读入数据、熟悉数据、时间变量、more、;2、探索数据:数据变换、描述统计量、相关系数、趋势图、散点图、;3、建立模型:regress、经济理论检验、实际经济问题要求、统计学检验、计量经济学检验:R2,T,t,残差;4、诊断模型:异方差、序列相关、多重共线性、随机解释变量问题、;5、修正模型:WLS、GLS、工具变量法(ivregress),;6、应用模型:置信区间、预测、结构分析、边际分析、弹性分析、常用模型回归系数的意义、;7、整理:关闭日志、生成do文件备用1、准备工作让STATA处于初始状态,清除所有使用过
2、的痕迹 clear指明版本号 version11设定并进入工作文件夹:cd D: (设定路径,将数据、程序和输出结果文件均存入该文件夹)关闭以前的日志 capture log close建立日志: log using , replace设定内存: set mem 20m关闭 more: set more off读入数据: use .dta, clear认识变量:describe建立时间变量:tsset2、用描述统计方法探索数据特征必要的数据转换: gen、replace、;描述统计量:summarize, detail相关系数矩阵:corr/pwcorr散点图和拟合直线图:scatter y
3、x | lfit y x矩阵散点图: graph matrix y x1 x2 x3,half线性趋势图:line y x3、建立模型OLS建立模型: regress y x1 x2 x3;由方差分析表并用F和R2检验模型整体显著性;依据p值对各系数进行t检验,一次只能剔出一个最不显著的变量,直到不包含不显著的变量;估计参数,判别变量的相对重要性;构造和估计约束模型,用以检验经济理论4、诊断模型(1)检验异方差残差拟合值散点图:rvfplot残差平方与某个自变量的散点图predict e, residualsgen e2=e2scatter e2 x1Breusch-Pagan拉格朗日乘数异方
4、差检验estat hettest通过信息矩阵检验执行的white异方差检验estat imtest, white解析检验的零假设H0:同方差(2)检验序列相关散点图法predict rgen lagr=l.rscatter r lagr,xline(0) yline(0)趋势图法line r year, yline(0)Breusch-Godfrey LM test for autocorrelationestat bgodfrey,lags(1 2 3)Durbins alternative test for autocorrelationestat dubinalt,lags(1 2 3)
5、Durbin-Watson dw-statisticestat dwatson(3)多重共线性检验多重共线性是否存在:R2和F很高,但t检验不显著判定系数检验法:某一自变量对其余自变量回归的R0.8,判定该自变量引起多重共线性方差膨胀因子大于5estat vif5、修正模型(1)异方差的修正WLSpredict r, residualsregress y x1 x2 x3 w=1/abs(r)(2)修正同时存在异方差和序列相关之prais选项是corc变换,循环迭代Prais m gdp, corc第一次迭代后停止,两步法prais m gdp, twostep矫正同时存在异方差和序列相关之N
6、ewey-West假定模型存在异方差和滞后3阶的序列相关,用OLS估计Newey-West标准误Newey m gdp, lag(3)(3)多重共线性的修正排除引起共线性的变量差分法(短期模型)岭回归法(有偏估计)逐步回归法A. 向前法(只进不出) sw reg .,pe(0.#)B. 向后法(只出不进) sw reg .,pe(0.#)C. (有进有出)向前法 sw reg .,pe(0.#) pr(0.#) forwardpe(0.#) pr(0.#)向前法是空模型的开始D. (有进有出)向后法 sw reg .,pe(0.#) pr(0.#)pe(0.#) pr(0.#)向后法是满模型的
7、开始(4)修正随机解释变量tsset yearivreg consp (gdpp=l.gdpp)用滞后一期的gdpp作gdpp的工具变量常数项虚拟变量自己作自己的工具变量。ivreg y1 x1 x2 (y2 y3 = z1 z2 z3) x3用z1 z2 z3作y2和y3的工具变量x1 x2 x3和常数项虚拟变量自己作自己的工具变量6、运用模型(regress postestimation)点估计:predict yhat残差: predict r, residuals均值预测的标准误:predict zxbzw, stdp个别值预测的标准误:predict rxbzw, stdfF的临界值
8、 invFtail(df1,df2,0.05)F的临界概率(边际概率)Ftail(df1,df2,ftest)t的临界值invttail(df,0.025)t的临界概率(边际概率)ttail(df,ttest)常用模型回归系数的意义线性模型:边际效应 线性-对数模型:自变量的相对变化引起因变量的绝对变化 对数-线性模型:自变量的绝对变化引起因变量的相对变化 双对数模型:弹性系数 差分模型:短期边际效应 自变量x比上期增加一个单位,平均来说因变量y比上期增加了个单位。无常数项。7、整理在results窗口审视整个估计过程,尤其注意出错的地方关闭日志文件:log close生成do文件:(1)记录和再现建模分析过程 (2)为分析类似项目提供借鉴操作:(1)在回顾窗口选择命令并复制 (2)点击do-file Editor,或打开一个已存在的do文件 (3)将复制的命令粘贴在do文件中 (4)编辑已执行过的命令,包括增加注释 (5)调试do文件 (6)保存