1、异方差性的检验和消除 15. √表6列出了2000年中国部分省市城镇居民每个家庭平均全年可支配收入x与消费性支出y的统计数据。 ①利用OLS法建立人均消费支出与可支配收入的线性模型和对数线性模型; ②检验模型是否存在异方差性; ③如果存在异方差性,试采用适当的方法加以消除。 表6 中国城镇居民人均可支配收入与消费性支出(单位:元) 地区 可支配收入x 消费性支出y 地区 可支配收入x 消费性支出y 北 京 10349.69 8493.49 浙 江 9279.16 7020.22 天 津 8140.50 6121.04 山
2、东 6489.97 5022.00 河 北 5661.16 4348.47 河 南 4766.26 3830.71 山 西 4724.11 3941.87 湖 北 5524.54 4644.50 内蒙古 5129.05 3927.75 湖 南 6218.73 5218.79 辽 宁 5357.79 4356.06 广 东 9761.57 8016.91 吉 林 4810.00 4020.87 陕 西 5124.24 4276.67 黑龙江
3、4912.88 3824.44 甘 肃 4916.25 4126.47 上 海 11718.01 8868.19 青 海 5169.96 4185.73 江 苏 6800.23 5323.18 新 疆 5644.86 4422.93 输入数据:data x y 绘制图形,确定模型:Plot x y(相关图) view-graph-scatter(散点图) (1)线性模型:ls x y S.E=216.8900 对数线性模型: GENR lnx=LOG(x) GEN
4、R lny=LOG(y) ls lny c lnx S=(0.263495) (0.030132) t=(0.946635) (31.39272) F=985.5030 S.E=0.038023 DW=1.512696 (2)检验是否存在异方差性 White检验:ls y c x 在方程窗口中 views-residual test-heteroscedasticity-white 此时可以选择要不要包含交叉乘积项。 一元的自由度为2 二元的自由度为5 取α=0.05,n 为样本数量,=12.65213
5、>,即对应的p值小于0.05,表面模型存在异方差性。 Goldfeld-Quandt检验(戈德菲尔德-匡特检验): 将观察值按解释变量的大小顺序排列,将排列在中间的约1/4的数据删掉,记为c,也可不删。由样本x数据排序,n=20,c=20/4=5,取c=4,从中间去掉4个数据,确定子样1(1~8) Sort x 将样本数据关于x排序 Smpl 1 8 确定子样本1 Ls y c x 求出RSS1 Smpl 13 20 确定子样本2 ls y c x 求
6、出RSS2 计算出F=RSS2/RSS1 取α为0.05, 查第一自由度和第二自由度为的F分布表,大于查的结果则存在异方差性。 子样本1 求出RSS1=126528.6。 子样本2 确定子样本2(13~20),求出RSS2=615472,计算出F= RSS2/ RSS1=4.86,给定显著性水平为0.05,查,所以模型存在异方差性。 Gleiser检验: iews-residual test-heteroscedasticity-gleiser nr2对应的p值小于0.05,存在异方差性。 Park检验: iews-residual test-he
7、teroscedasticity-harvey-输入log(x) Nr2对应的p值小于0.05,所以存在异方差性。 (3)消除异方差性 加权最小二乘法: 生成权数变量 1/x 1/x2 Ls(w=权数表达式) y c x 使用white检验是否已消除异方差性 采用加权最小二乘法估计,取权数w=1/x,得如下回归方程: F=699.7741 在方程窗口进行white检验 可知,用加权最小二乘法估计人均消费支出函数不存在异方差性。 自相关性的检验与消除 13√天津市城镇居民人均消费性支出(CO
8、NSUM),人均可支配收入(INCOME),以及消费价格指数(PRICE)见表4。定义人均实际消费性支出y= CONSUM/PRICE,人均实际可支配收入x=INCOME/PRICE。 表4 天津市城镇居民人均消费与人均可支配收入数据 年份 CONSUM(元) INCOME(元) PRICE 1978 344.88 388.32 1.000 1979 385.20 425.40 1.010 1980 474.72 526.92 1.062 1981 485.88 539.52 1.075 1982 496.56 576.72 1.081 1
9、983 520.84 604.31 1.086 1984 599.64 728.17 1.106 1985 770.64 875.52 1.250 1986 949.08 1069.61 1.336 1987 1071.04 1187.49 1.426 1988 1278.87 1329.7 1.667 1989 1291.09 1477.77 1.912 1990 1440.47 1638.92 1.970 1991 1585.71 1844.98 2.171 1992 1907.17 2238.38 2.418
10、 1993 2322.19 2769.26 2.844 1994 3301.37 3982.13 3.526 1995 4064.10 4929.53 4.066 1996 4679.61 5967.71 4.432 1997 5204.29 6608.56 4.569 1998 5471.01 7110.54 4.546 1999 5851.53 7649.83 4.496 2000 6121.07 8140.55 4.478 ①利用OLS估计模型 ②根据DW检验法、LM检验法检验模型是否存在自相关性。 ③如果存在一阶自相关
11、性,用DW值来估计自相关系数。 ④利用估计的值,用OLS法估计广义差分方程: ⑤利用OLS估计模型:,检验此模型是否存在自相关性,如果存在自相关性,如何消除? (1)输入数据 ls y c x F=1774.281 DW=0.598571 (2) DW检验: 由DW=0.598571,给定显著性水平α=0.05查DW统计表,n=23,k=1,得dl=1.26,du=1.44,因为DW=0.5986,根据判断区域可知,随机误差项存在一阶正相关。 判断区域: 一阶正自相关 一阶负自相关 不存在自相关 LM检验:(拉格朗日乘数检验
12、 方程窗口中单击view-residual test-serial correlation LM test 选择滞后期为1或2 LM(1)=9.794,p=0.0018,小于0.05,因此,随机误差项存在一阶自相关。 (3)用DW法估计自相关系数: =1-0.5DW 由于DW=0.59857,所以 (4)利用估计广义差分模型: 输入命令:ls y-值*y(-1) c x-值*x(-1) t=(3.685002) (19.92184) DW=2.310313 F=396.8798 DW=2.310313,给定
13、显著性水平为0.05,n=22,dl=1.24,du=1.43 14、关性。
应用估计的作广义差分变换,得
DW=2.336247 F=269.7892
由于DW=2.336247,给定显著性水平0.05,n=22,dl=1.24,du=1.43






