收藏 分销(赏)

应用回归分析-课后习题答案-何晓群.doc

上传人:xrp****65 文档编号:7027341 上传时间:2024-12-25 格式:DOC 页数:29 大小:1.25MB
下载 相关 举报
应用回归分析-课后习题答案-何晓群.doc_第1页
第1页 / 共29页
应用回归分析-课后习题答案-何晓群.doc_第2页
第2页 / 共29页
点击查看更多>>
资源描述
第二章 一元线性回归 2.14 解答:(1)散点图为: (2)x与y之间大致呈线性关系。 (3)设回归方程为 = (4) = (5)由于 服从自由度为n-2的t分布。因而 也即:= 可得 即为:(2.49,11.5) 服从自由度为n-2的t分布。因而 即 可得 (6)x与y的决定系数 (7) ANOVA x 平方和 df 均方 F 显著性 组间 (组合) 9.000 2 4.500 9.000 .100 线性项 加权的 8.167 1 8.167 16.333 .056 偏差 .833 1 .833 1.667 .326 组内 1.000 2 .500 总数 10.000 4 由于,拒绝,说明回归方程显著,x与y有显著的线性关系。 (8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。 (9)相关系数 = 小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系. (10) 序号 1 1 10 6 4 2 2 10 13 -3 3 3 20 20 0 4 4 20 27 -7 5 5 40 34 6 残差图为: 从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。 (11)当广告费=4.2万元时,销售收入 ,即(17.1,39.7) 2.15 解答: (1) 散点图为: (2)x与y之间大致呈线性关系。 (3)设回归方程为 = (4) =0.2305 0.4801 (5) 由于 服从自由度为n-2的t分布。因而 也即:= 可得 即为:(0.0028,0.0044) 服从自由度为n-2的t分布。因而 即 可得 (6)x与y的决定系数 =0.908 (7) ANOVA x 平方和 df 均方 F 显著性 组间 (组合) 1231497.500 7 175928.214 5.302 .168 线性项 加权的 1168713.036 1 1168713.036 35.222 .027 偏差 62784.464 6 10464.077 .315 .885 组内 66362.500 2 33181.250 总数 1297860.000 9 由于,拒绝,说明回归方程显著,x与y有显著的线性关系。 (8) 其中 接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。 (9) 相关系数 = 小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系. (10) 序号 1 825 3.5 3.0768 0.4232 2 215 1 0.8808 0.1192 3 1070 4 3.9588 0.0412 4 550 2 2.0868 -0.0868 5 480 1 1.8348 -0.8348 6 920 3 3.4188 -0.4188 7 1350 4.5 4.9688 -0.4668 8 325 1.5 1.2768 0.2232 9 670 3 2.5188 0.4812 10 1215 5 4.4808 0.5192 从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。 (11) (12), 即为(2.7,4.7) 近似置信区间为:,即(2.74,4.66) (13)可得置信水平为为,即为(3.33,4.07). 2.16 (1)散点图为: 可以用直线回归描述y与x之间的关系. (2)回归方程为: (3) 从图上可看出,检验误差项服从正态分布。 第三章 多元线性回归 3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵: 相关性 y x1 x2 x3 Pearson 相关性 y 1.000 .556 .731 .724 x1 .556 1.000 .113 .398 x2 .731 .113 1.000 .547 x3 .724 .398 .547 1.000 y . .048 .008 .009 x1 .048 . .378 .127 x2 .008 .378 . .051 x3 .009 .127 .051 . N y 10 10 10 10 x1 10 10 10 10 x2 10 10 10 10 x3 10 10 10 10 所以= 系数a 模型 非标准化系数 标准系数 t Sig. B 的 95.0% 置信区间 相关性 共线性统计量 B 标准 误差 试用版 下限 上限 零阶 偏 部分 容差 VIF 1 (常量) -348.280 176.459 -1.974 .096 -780.060 83.500 x1 3.754 1.933 .385 1.942 .100 -.977 8.485 .556 .621 .350 .825 1.211 x2 7.101 2.880 .535 2.465 .049 .053 14.149 .731 .709 .444 .687 1.455 x3 12.447 10.569 .277 1.178 .284 -13.415 38.310 .724 .433 .212 .586 1.708 a. 因变量: y (2) 所以三元线性回归方程为 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 更改统计量 R 方更改 F 更改 df1 df2 Sig. F 更改 1 .898a .806 .708 23.44188 .806 8.283 3 6 .015 a. 预测变量: (常量), x3, x1, x2。 (3) 由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高 (4) Anovab 模型 平方和 df 均方 F Sig. 1 回归 13655.370 3 4551.790 8.283 .015a 残差 3297.130 6 549.522 总计 16952.500 9 a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y 因为F=8.283 P=0.015<0.05所以认为回归方程在整体上拟合的好 (5) 系数a 模型 非标准化系数 标准系数 t Sig. B 的 95.0% 置信区间 相关性 共线性统计量 B 标准 误差 试用版 下限 上限 零阶 偏 部分 容差 VIF 1 (常量) -348.280 176.459 -1.974 .096 -780.060 83.500 x1 3.754 1.933 .385 1.942 .100 -.977 8.485 .556 .621 .350 .825 1.211 x2 7.101 2.880 .535 2.465 .049 .053 14.149 .731 .709 .444 .687 1.455 x3 12.447 10.569 .277 1.178 .284 -13.415 38.310 .724 .433 .212 .586 1.708 a. 因变量: y (6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。 去除x3后作F检验,得: Anovab 模型 平方和 df 均方 F Sig. 1 回归 12893.199 2 6446.600 11.117 .007a 残差 4059.301 7 579.900 总计 16952.500 9 a. 预测变量: (常量), x2, x1。 b. 因变量: y 由表知通过F检验 继续做回归系数检验 系数a 模型 非标准化系数 标准系数 t Sig. B 的 95.0% 置信区间 相关性 共线性统计量 B 标准 误差 试用版 下限 上限 零阶 偏 部分 容差 VIF 1 (常量) -459.624 153.058 -3.003 .020 -821.547 -97.700 x1 4.676 1.816 .479 2.575 .037 .381 8.970 .556 .697 .476 .987 1.013 x2 8.971 2.468 .676 3.634 .008 3.134 14.808 .731 .808 .672 .987 1.013 a. 因变量: y 此时,我们发现x1,x2的显著性大大提高。 (7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310) (8) (9) 残差统计量a 极小值 极大值 均值 标准 偏差 N 预测值 175.4748 292.5545 231.5000 38.95206 10 标准 预测值 -1.438 1.567 .000 1.000 10 预测值的标准误差 10.466 20.191 14.526 3.127 10 调整的预测值 188.3515 318.1067 240.1835 49.83914 10 残差 -25.19759 33.22549 .00000 19.14022 10 标准 残差 -1.075 1.417 .000 .816 10 Student 化 残差 -2.116 1.754 -.123 1.188 10 已删除的残差 -97.61523 50.88274 -8.68348 43.43220 10 Student 化 已删除的残差 -3.832 2.294 -.255 1.658 10 Mahal。 距离 .894 5.777 2.700 1.555 10 Cook 的距离 .000 3.216 .486 .976 10 居中杠杆值 .099 .642 .300 .173 10 a. 因变量: y 所以置信区间为(175.4748,292.5545) (10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好 3.12 解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产业每增加一个单位,GDP就增加0.607个单位。 在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加1.709个单位。 第四章 违背基本假设的情况 4.9 解: 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) -.831 .442 -1.882 .065 x .004 .000 .839 11.030 .000 a. 因变量: y 由SPSS计算得:=-0.831+0.004x 残差散点图为: (2)由残差散点图可知存在异方差性 再用等级相关系数分析: 相关系数 x t Spearman 的 rho x 相关系数 1.000 .318* Sig.(双侧) . .021 N 53 53 t 相关系数 .318* 1.000 Sig.(双侧) .021 . N 53 53 *. 在置信度(双测)为 0.05 时,相关性是显著的。 P=0.021 所以方差与自变量的相关性是显著的。 (3) 模型描述 因变量 y 自变量 1 x 权重 源 x 幂值 1.500 模型: MOD_1. M=1.5时可以建立最优权函数,此时得到: ANOVA 平方和 df 均方 F Sig. 回归 .006 1 .006 98.604 .000 残差 .003 51 .000 总计 .009 52 系数 未标准化系数 标准化系数 t Sig. B 标准误 试用版 标准误 (常数) -.683 .298 -2.296 .026 x .004 .000 .812 .082 9.930 .000 所以:-0.683+0.004x (4) 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) .582 .130 4.481 .000 x .001 .000 .805 9.699 .000 a. 因变量: yy 4.13 解: (1) 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) -1.435 .242 -5.930 .000 x .176 .002 .999 107.928 .000 a. 因变量: y =-1.435+0.176x (2) 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1 .999a .998 .998 .09744 .663 a. 预测变量: (常量), x。 b. 因变量: y DW=0.663 查DW分布表知:=0.95 所以DW<,故误差项存在正相关。 残差图为: 随t的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。 (3)=1-0.5*DW=0.6685 计算得: Y’ x’ 7.39 44.90 7.65 45.80 6.84 40.69 8.00 48.50 7.79 46.85 8.26 49.45 7.96 48.47 8.28 50.04 7.90 48.03 8.49 51.17 7.88 47.26 8.77 52.33 8.93 52.69 9.32 54.95 9.29 55.54 9.48 56.77 9.38 55.83 9.67 58.00 9.90 59.22 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1 .996a .993 .993 .07395 1.344 a. 预测变量: (常量), xx。 b. 因变量: yy 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) -.303 .180 -1.684 .110 xx .173 .004 .996 49.011 .000 a. 因变量: yy 得回归方程 =-0.303+0.173x’ 即:=-0.303+0.6685+0.173(—0.6685) (4) 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1 .978a .957 .955 .07449 1.480 a. 预测变量: (常量), x3。 b. 因变量: y3 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) .033 .026 1.273 .220 x3 .161 .008 .978 19.528 .000 a. 因变量: y3 △=0.033+0.161△ 即:=0.033++0.161(-) (5)差分法的DW值最大为1.48消除相关性最彻底,但是迭代法的值最小为0.07395,拟合的较好。 4.14解:(1) 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1 .541a .293 .264 329.69302 .745 a. 预测变量: (常量), x2, x1。 b. 因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) -574.062 349.271 -1.644 .107 x1 191.098 73.309 .345 2.607 .012 x2 2.045 .911 .297 2.246 .029 a. 因变量: y 回归方程为:=-574.062+191.098x1+2.045x2 DW=0.745<Dl 所以误差项存在正相关 残差图为: (2)=1-0.5*DW=0.6275 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1 .688a .474 .452 257.67064 1.716 a. 预测变量: (常量), x22, x12。 b. 因变量: y2 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) -179.668 90.337 -1.989 .052 x12 211.770 47.778 .522 4.432 .000 x22 1.434 .628 .269 2.283 .027 a. 因变量: y2 此时得方程:’=-179.668+211.77x1’+1.434x2’ 所以回归方程为: (3) 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 Durbin-Watson 1 .715a .511 .490 283.79102 2.042 a. 预测变量: (常量), x23, x13。 b. 因变量: y3 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) 7.698 39.754 .194 .847 x13 209.891 44.143 .544 4.755 .000 x23 1.399 .583 .274 2.400 .020 a. 因变量: y3 此时得方程:△ 所以回归方程为: 第五章 自变量选择与逐步回归 5.9 后退法:输出结果 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) 1438.120 2252.472 .638 .533 农业x1 -.626 .168 -1.098 -3.720 .002 工业x2 -.328 .207 -1.352 -1.587 .135 建筑业x3 -.383 .555 -.251 -.691 .501 人口x4 -.004 .025 -.014 -.161 .875 最终消费x5 .672 .130 3.710 5.178 .000 受灾面积x6 -.006 .008 -.015 -.695 .499 2 (常量) 1079.754 299.759 3.602 .003 农业x1 -.642 .130 -1.126 -4.925 .000 工业x2 -.303 .131 -1.249 -2.314 .035 建筑业x3 -.402 .525 -.263 -.765 .456 最终消费x5 .658 .095 3.636 6.905 .000 受灾面积x6 -.006 .007 -.017 -.849 .409 3 (常量) 1083.150 295.816 3.662 .002 农业x1 -.624 .127 -1.095 -4.931 .000 工业x2 -.373 .093 -1.535 -3.998 .001 最终消费x5 .657 .094 3.627 6.981 .000 受灾面积x6 -.005 .007 -.015 -.758 .460 4 (常量) 874.604 106.869 8.184 .000 农业x1 -.611 .124 -1.073 -4.936 .000 工业x2 -.353 .088 -1.454 -3.994 .001 最终消费x5 .637 .089 3.516 7.142 .000 a. 因变量: 财政收入y Anovae 模型 平方和 df 均方 F Sig. 1 回归 1.365E8 6 2.274E7 602.127 .000a 残差 528793.319 14 37770.951 总计 1.370E8 20 2 回归 1.365E8 5 2.729E7 772.734 .000b 残差 529767.852 15 35317.857 总计 1.370E8 20 3 回归 1.364E8 4 3.411E7 991.468 .000c 残差 550440.103 16 34402.506 总计 1.370E8 20 4 回归 1.364E8 3 4.547E7 1355.753 .000d 残差 570180.931 17 33540.055 总计 1.370E8 20 a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。 e. 因变量: 财政收入y 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 更改统计量 R 方更改 F 更改 df1 df2 Sig. F 更改 1 .998a .996 .994 194.34750 .996 602.127 6 14 .000 2 .998b .996 .995 187.93046 .000 .026 1 14 .875 3 .998c .996 .995 185.47913 .000 .585 1 15 .456 4 .998d .996 .995 183.13944 .000 .574 1 16 .460 a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。 b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。 c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。 d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。 回归方程为: 逐步回归法:输出结果 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 更改统计量 R 方更改 F 更改 df1 df2 Sig. F 更改 1 .994a .989 .988 285.68373 .989 1659.441 1 19 .000 2 .996b .992 .991 247.77768 .003 7.258 1 18 .015 3 .998c .996 .995 183.13944 .004 15.948 1 17 .001 a. 预测变量: (常量), 最终消费x5。 b. 预测变量: (常量), 最终消费x5, 农业x1。 c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。 Anovad 模型 平方和 df 均方 F Sig. 1 回归 1.354E8 1 1.354E8 1659.441 .000a 残差 1550688.654 19 81615.192 总计 1.370E8 20 2 回归 1.359E8 2 6.794E7 1106.637 .000b 残差 1105088.003 18 61393.778 总计 1.370E8 20 3 回归 1.364E8 3 4.547E7 1355.753 .000c 残差 570180.931 17 33540.055 总计 1.370E8 20 a. 预测变量: (常量), 最终消费x5。 b. 预测变量: (常量), 最终消费x5, 农业x1。 c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。 d. 因变量: 财政收入y 系数a 模型 非标准化系数 标准系数 t Sig. 相关性 B 标准 误差 试用版 零阶 偏 部分 1 (常量) 710.372 90.891 7.816 .000 最终消费x5 .180 .004 .994 40.736 .000 .994 .994 .994 2 (常量) 1011.912 136.901 7.392 .000 最终消费x5 .311 .049 1.718 6.374 .000 .994 .832 .135 农业x1 -.414 .154 -.726 -2.694 .015 .987 -.536 -.057 3 (常量) 874.604 106.869 8.184 .000 最终消费x5 .637 .089 3.516 7.142 .000 .994 .866 .112 农业x1 -.611 .124 -1.073 -4.936 .000 .987 -.767 -.077 工业x2 -.353 .088 -1.454 -3.994 .001 .992 -.696 -.062 a. 因变量: 财政收入y 回归方程为: 5.10 (1) 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 1 .908a .824 .736 625.88326 2 .000b .000 .000 1217.15945 a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量) Anovac 模型 平方和 df 均方 F Sig. 1 回归 1.830E7 5 3660971.683 9.346 .002a 残差 3917298.522 10 391729.852 总计 2.222E7 15 2 回归 .000 0 .000 . .b 残差 2.222E7 15 1481477.129 总计 2.222E7 15 a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量) c. 因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) 5922.827 2504.315 2.365 .040 x2 4.864 2.507 .677 1.940 .081 x3 2.374 .842 .782 2.818 .018 x4 -817.901 187.279 -1.156 -4.367 .001 x5 14.539 147.078 .050 .099 .923 x6 -846.867 291.634 -.899 -2.904 .016 2 (常量) 7542.938 304.290 24.789 .000 a. 因变量: y 回归方程为: (2)后退法:输出结果 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 1 .908a .824 .736 625.88326 2 .907b .824 .759 597.04776 a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量), x6, x3, x2, x4。 Anovac 模型 平方和 df 均方 F Sig. 1 回归 1.830E7 5 3660971.683 9.346 .002a 残差 3917298.522 10 391729.852 总计 2.222E7 15 2 回归 1.830E7 4 4575257.669 12.835 .000b 残差 3921126.262 11 356466.024 总计 2.222E7 15 a. 预测变量: (常量), x6, x3, x2, x4, x5。 b. 预测变量: (常量), x6, x3, x2, x4。 c. 因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) 5922.827 2504.315 2.365 .040 x2 4.864 2.507 .677 1.940 .081 x3 2.374 .842 .782 2.818 .018 x4 -817.901 187.279 -1.156 -4.367 .001 x5 14.539 147.078 .050 .099 .923 x6 -846.867 291.634 -.899 -2.904 .016 2 (常量) 6007.320 2245.481 2.675 .022 x2 5.068 1.360 .706 3.727 .003 x3 2.308 .486 .760 4.750 .001 x4 -824.261 167.776 -1.165 -4.913 .000 x6 -862.699 232.489 -.916 -3.711 .003 a. 因变量: y (3)逐步回归 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 1 .498a .248 .194 1092.83206 2 .697b .485 .406 937.95038 3 .811c .657 .572 796.60909 a. 预测变量: (常量), x3。 b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。 Anovad 模型 平方和 df 均方 F Sig. 1 回归 5502210.090 1 5502210.090 4.607 .050a 残差 1.672E7 14 1194281.918 总计 2.222E7 15 2 回归 1.079E7 2 5392697.554 6.130 .013b 残差 1.144E7 13 879750.910 总计 2.222E7 15 3 回归 1.461E7 3 4869041.506 7.673 .004c 残差 7615032.418 12 634586.035 总计 2.222E7 15 a. 预测变量: (常量), x3。 b. 预测变量: (常量), x3, x5。 c. 预测变量: (常量), x3, x5, x4。 d. 因变量: y 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) 5161.259 1142.744 4.517 .000 x3 1.511 .704 .498 2.146 .050 2 (常量) 472.298 2150.138 .220 .830 x3 3.188 .913 1.050 3.492 .004 x5 212.325 86.643 .737 2.451 .029 3 (常量) 1412.807 1865.912 .757 .464 x3 3.440 .782 1.133 4.398 .001 x5 348.729 92.220 1.210 3.782 .003 x4 -415.136 169.163 -.587 -2.454 .030 a. 因变量: y (4)两种方法得到的模型是不同的,回退法剔除了x5,保留了x
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 百科休闲 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服