资源描述
第二章 一元线性回归
2.14 解答:(1)散点图为:
(2)x与y之间大致呈线性关系。
(3)设回归方程为
=
(4)
=
(5)由于
服从自由度为n-2的t分布。因而
也即:=
可得
即为:(2.49,11.5)
服从自由度为n-2的t分布。因而
即
可得
(6)x与y的决定系数
(7)
ANOVA
x
平方和
df
均方
F
显著性
组间
(组合)
9.000
2
4.500
9.000
.100
线性项
加权的
8.167
1
8.167
16.333
.056
偏差
.833
1
.833
1.667
.326
组内
1.000
2
.500
总数
10.000
4
由于,拒绝,说明回归方程显著,x与y有显著的线性关系。
(8) 其中
接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。
(9)相关系数
=
小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.
(10)
序号
1
1
10
6
4
2
2
10
13
-3
3
3
20
20
0
4
4
20
27
-7
5
5
40
34
6
残差图为:
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)当广告费=4.2万元时,销售收入
,即(17.1,39.7)
2.15 解答:
(1) 散点图为:
(2)x与y之间大致呈线性关系。
(3)设回归方程为
=
(4)
=0.2305
0.4801
(5) 由于
服从自由度为n-2的t分布。因而
也即:=
可得
即为:(0.0028,0.0044)
服从自由度为n-2的t分布。因而
即
可得
(6)x与y的决定系数 =0.908
(7)
ANOVA
x
平方和
df
均方
F
显著性
组间
(组合)
1231497.500
7
175928.214
5.302
.168
线性项
加权的
1168713.036
1
1168713.036
35.222
.027
偏差
62784.464
6
10464.077
.315
.885
组内
66362.500
2
33181.250
总数
1297860.000
9
由于,拒绝,说明回归方程显著,x与y有显著的线性关系。
(8) 其中
接受原假设认为显著不为0,因变量y对自变量x的一元线性回归成立。
(9) 相关系数
=
小于表中的相应值同时大于表中的相应值,x与y有显著的线性关系.
(10)
序号
1
825
3.5
3.0768
0.4232
2
215
1
0.8808
0.1192
3
1070
4
3.9588
0.0412
4
550
2
2.0868
-0.0868
5
480
1
1.8348
-0.8348
6
920
3
3.4188
-0.4188
7
1350
4.5
4.9688
-0.4668
8
325
1.5
1.2768
0.2232
9
670
3
2.5188
0.4812
10
1215
5
4.4808
0.5192
从图上看,残差是围绕e=0随机波动,从而模型的基本假定是满足的。
(11)
(12),
即为(2.7,4.7)
近似置信区间为:,即(2.74,4.66)
(13)可得置信水平为为,即为(3.33,4.07).
2.16 (1)散点图为:
可以用直线回归描述y与x之间的关系.
(2)回归方程为:
(3)
从图上可看出,检验误差项服从正态分布。
第三章 多元线性回归
3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵:
相关性
y
x1
x2
x3
Pearson 相关性
y
1.000
.556
.731
.724
x1
.556
1.000
.113
.398
x2
.731
.113
1.000
.547
x3
.724
.398
.547
1.000
y
.
.048
.008
.009
x1
.048
.
.378
.127
x2
.008
.378
.
.051
x3
.009
.127
.051
.
N
y
10
10
10
10
x1
10
10
10
10
x2
10
10
10
10
x3
10
10
10
10
所以=
系数a
模型
非标准化系数
标准系数
t
Sig.
B 的 95.0% 置信区间
相关性
共线性统计量
B
标准 误差
试用版
下限
上限
零阶
偏
部分
容差
VIF
1
(常量)
-348.280
176.459
-1.974
.096
-780.060
83.500
x1
3.754
1.933
.385
1.942
.100
-.977
8.485
.556
.621
.350
.825
1.211
x2
7.101
2.880
.535
2.465
.049
.053
14.149
.731
.709
.444
.687
1.455
x3
12.447
10.569
.277
1.178
.284
-13.415
38.310
.724
.433
.212
.586
1.708
a. 因变量: y
(2)
所以三元线性回归方程为
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
更改统计量
R 方更改
F 更改
df1
df2
Sig. F 更改
1
.898a
.806
.708
23.44188
.806
8.283
3
6
.015
a. 预测变量: (常量), x3, x1, x2。
(3)
由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高
(4)
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
13655.370
3
4551.790
8.283
.015a
残差
3297.130
6
549.522
总计
16952.500
9
a. 预测变量: (常量), x3, x1, x2。
b. 因变量: y
因为F=8.283 P=0.015<0.05所以认为回归方程在整体上拟合的好
(5)
系数a
模型
非标准化系数
标准系数
t
Sig.
B 的 95.0% 置信区间
相关性
共线性统计量
B
标准 误差
试用版
下限
上限
零阶
偏
部分
容差
VIF
1
(常量)
-348.280
176.459
-1.974
.096
-780.060
83.500
x1
3.754
1.933
.385
1.942
.100
-.977
8.485
.556
.621
.350
.825
1.211
x2
7.101
2.880
.535
2.465
.049
.053
14.149
.731
.709
.444
.687
1.455
x3
12.447
10.569
.277
1.178
.284
-13.415
38.310
.724
.433
.212
.586
1.708
a. 因变量: y
(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。
去除x3后作F检验,得:
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
12893.199
2
6446.600
11.117
.007a
残差
4059.301
7
579.900
总计
16952.500
9
a. 预测变量: (常量), x2, x1。
b. 因变量: y
由表知通过F检验
继续做回归系数检验
系数a
模型
非标准化系数
标准系数
t
Sig.
B 的 95.0% 置信区间
相关性
共线性统计量
B
标准 误差
试用版
下限
上限
零阶
偏
部分
容差
VIF
1
(常量)
-459.624
153.058
-3.003
.020
-821.547
-97.700
x1
4.676
1.816
.479
2.575
.037
.381
8.970
.556
.697
.476
.987
1.013
x2
8.971
2.468
.676
3.634
.008
3.134
14.808
.731
.808
.672
.987
1.013
a. 因变量: y
此时,我们发现x1,x2的显著性大大提高。
(7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)
(8)
(9)
残差统计量a
极小值
极大值
均值
标准 偏差
N
预测值
175.4748
292.5545
231.5000
38.95206
10
标准 预测值
-1.438
1.567
.000
1.000
10
预测值的标准误差
10.466
20.191
14.526
3.127
10
调整的预测值
188.3515
318.1067
240.1835
49.83914
10
残差
-25.19759
33.22549
.00000
19.14022
10
标准 残差
-1.075
1.417
.000
.816
10
Student 化 残差
-2.116
1.754
-.123
1.188
10
已删除的残差
-97.61523
50.88274
-8.68348
43.43220
10
Student 化 已删除的残差
-3.832
2.294
-.255
1.658
10
Mahal。 距离
.894
5.777
2.700
1.555
10
Cook 的距离
.000
3.216
.486
.976
10
居中杠杆值
.099
.642
.300
.173
10
a. 因变量: y
所以置信区间为(175.4748,292.5545)
(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好
3.12 解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产业每增加一个单位,GDP就增加0.607个单位。
在固定第一产业增加值,考虑第三产业增加值影响的情况下,第二产业每增加一个单位,GDP就增加1.709个单位。
第四章 违背基本假设的情况
4.9 解:
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-.831
.442
-1.882
.065
x
.004
.000
.839
11.030
.000
a. 因变量: y
由SPSS计算得:=-0.831+0.004x
残差散点图为:
(2)由残差散点图可知存在异方差性
再用等级相关系数分析:
相关系数
x
t
Spearman 的 rho
x
相关系数
1.000
.318*
Sig.(双侧)
.
.021
N
53
53
t
相关系数
.318*
1.000
Sig.(双侧)
.021
.
N
53
53
*. 在置信度(双测)为 0.05 时,相关性是显著的。
P=0.021 所以方差与自变量的相关性是显著的。
(3)
模型描述
因变量
y
自变量
1
x
权重
源
x
幂值
1.500
模型: MOD_1.
M=1.5时可以建立最优权函数,此时得到:
ANOVA
平方和
df
均方
F
Sig.
回归
.006
1
.006
98.604
.000
残差
.003
51
.000
总计
.009
52
系数
未标准化系数
标准化系数
t
Sig.
B
标准误
试用版
标准误
(常数)
-.683
.298
-2.296
.026
x
.004
.000
.812
.082
9.930
.000
所以:-0.683+0.004x
(4)
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
.582
.130
4.481
.000
x
.001
.000
.805
9.699
.000
a. 因变量: yy
4.13 解:
(1)
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-1.435
.242
-5.930
.000
x
.176
.002
.999
107.928
.000
a. 因变量: y
=-1.435+0.176x
(2)
模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.999a
.998
.998
.09744
.663
a. 预测变量: (常量), x。
b. 因变量: y
DW=0.663 查DW分布表知:=0.95
所以DW<,故误差项存在正相关。
残差图为:
随t的变化逐次变化并不频繁的改变符号,说明误差项存在正相关。
(3)=1-0.5*DW=0.6685 计算得:
Y’ x’
7.39 44.90
7.65 45.80
6.84 40.69
8.00 48.50
7.79 46.85
8.26 49.45
7.96 48.47
8.28 50.04
7.90 48.03
8.49 51.17
7.88 47.26
8.77 52.33
8.93 52.69
9.32 54.95
9.29 55.54
9.48 56.77
9.38 55.83
9.67 58.00
9.90 59.22
模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.996a
.993
.993
.07395
1.344
a. 预测变量: (常量), xx。
b. 因变量: yy
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-.303
.180
-1.684
.110
xx
.173
.004
.996
49.011
.000
a. 因变量: yy
得回归方程 =-0.303+0.173x’
即:=-0.303+0.6685+0.173(—0.6685)
(4)
模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.978a
.957
.955
.07449
1.480
a. 预测变量: (常量), x3。
b. 因变量: y3
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
.033
.026
1.273
.220
x3
.161
.008
.978
19.528
.000
a. 因变量: y3
△=0.033+0.161△
即:=0.033++0.161(-)
(5)差分法的DW值最大为1.48消除相关性最彻底,但是迭代法的值最小为0.07395,拟合的较好。
4.14解:(1)
模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.541a
.293
.264
329.69302
.745
a. 预测变量: (常量), x2, x1。
b. 因变量: y
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-574.062
349.271
-1.644
.107
x1
191.098
73.309
.345
2.607
.012
x2
2.045
.911
.297
2.246
.029
a. 因变量: y
回归方程为:=-574.062+191.098x1+2.045x2
DW=0.745<Dl 所以误差项存在正相关
残差图为:
(2)=1-0.5*DW=0.6275
模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.688a
.474
.452
257.67064
1.716
a. 预测变量: (常量), x22, x12。
b. 因变量: y2
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-179.668
90.337
-1.989
.052
x12
211.770
47.778
.522
4.432
.000
x22
1.434
.628
.269
2.283
.027
a. 因变量: y2
此时得方程:’=-179.668+211.77x1’+1.434x2’
所以回归方程为:
(3)
模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
Durbin-Watson
1
.715a
.511
.490
283.79102
2.042
a. 预测变量: (常量), x23, x13。
b. 因变量: y3
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
7.698
39.754
.194
.847
x13
209.891
44.143
.544
4.755
.000
x23
1.399
.583
.274
2.400
.020
a. 因变量: y3
此时得方程:△
所以回归方程为:
第五章 自变量选择与逐步回归
5.9 后退法:输出结果
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
1438.120
2252.472
.638
.533
农业x1
-.626
.168
-1.098
-3.720
.002
工业x2
-.328
.207
-1.352
-1.587
.135
建筑业x3
-.383
.555
-.251
-.691
.501
人口x4
-.004
.025
-.014
-.161
.875
最终消费x5
.672
.130
3.710
5.178
.000
受灾面积x6
-.006
.008
-.015
-.695
.499
2
(常量)
1079.754
299.759
3.602
.003
农业x1
-.642
.130
-1.126
-4.925
.000
工业x2
-.303
.131
-1.249
-2.314
.035
建筑业x3
-.402
.525
-.263
-.765
.456
最终消费x5
.658
.095
3.636
6.905
.000
受灾面积x6
-.006
.007
-.017
-.849
.409
3
(常量)
1083.150
295.816
3.662
.002
农业x1
-.624
.127
-1.095
-4.931
.000
工业x2
-.373
.093
-1.535
-3.998
.001
最终消费x5
.657
.094
3.627
6.981
.000
受灾面积x6
-.005
.007
-.015
-.758
.460
4
(常量)
874.604
106.869
8.184
.000
农业x1
-.611
.124
-1.073
-4.936
.000
工业x2
-.353
.088
-1.454
-3.994
.001
最终消费x5
.637
.089
3.516
7.142
.000
a. 因变量: 财政收入y
Anovae
模型
平方和
df
均方
F
Sig.
1
回归
1.365E8
6
2.274E7
602.127
.000a
残差
528793.319
14
37770.951
总计
1.370E8
20
2
回归
1.365E8
5
2.729E7
772.734
.000b
残差
529767.852
15
35317.857
总计
1.370E8
20
3
回归
1.364E8
4
3.411E7
991.468
.000c
残差
550440.103
16
34402.506
总计
1.370E8
20
4
回归
1.364E8
3
4.547E7
1355.753
.000d
残差
570180.931
17
33540.055
总计
1.370E8
20
a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。
b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。
c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。
d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。
e. 因变量: 财政收入y
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
更改统计量
R 方更改
F 更改
df1
df2
Sig. F 更改
1
.998a
.996
.994
194.34750
.996
602.127
6
14
.000
2
.998b
.996
.995
187.93046
.000
.026
1
14
.875
3
.998c
.996
.995
185.47913
.000
.585
1
15
.456
4
.998d
.996
.995
183.13944
.000
.574
1
16
.460
a. 预测变量: (常量), 受灾面积x6, 建筑业x3, 人口x4, 农业x1, 最终消费x5, 工业x2。
b. 预测变量: (常量), 受灾面积x6, 建筑业x3, 农业x1, 最终消费x5, 工业x2。
c. 预测变量: (常量), 受灾面积x6, 农业x1, 最终消费x5, 工业x2。
d. 预测变量: (常量), 农业x1, 最终消费x5, 工业x2。
回归方程为:
逐步回归法:输出结果
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
更改统计量
R 方更改
F 更改
df1
df2
Sig. F 更改
1
.994a
.989
.988
285.68373
.989
1659.441
1
19
.000
2
.996b
.992
.991
247.77768
.003
7.258
1
18
.015
3
.998c
.996
.995
183.13944
.004
15.948
1
17
.001
a. 预测变量: (常量), 最终消费x5。
b. 预测变量: (常量), 最终消费x5, 农业x1。
c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。
Anovad
模型
平方和
df
均方
F
Sig.
1
回归
1.354E8
1
1.354E8
1659.441
.000a
残差
1550688.654
19
81615.192
总计
1.370E8
20
2
回归
1.359E8
2
6.794E7
1106.637
.000b
残差
1105088.003
18
61393.778
总计
1.370E8
20
3
回归
1.364E8
3
4.547E7
1355.753
.000c
残差
570180.931
17
33540.055
总计
1.370E8
20
a. 预测变量: (常量), 最终消费x5。
b. 预测变量: (常量), 最终消费x5, 农业x1。
c. 预测变量: (常量), 最终消费x5, 农业x1, 工业x2。
d. 因变量: 财政收入y
系数a
模型
非标准化系数
标准系数
t
Sig.
相关性
B
标准 误差
试用版
零阶
偏
部分
1
(常量)
710.372
90.891
7.816
.000
最终消费x5
.180
.004
.994
40.736
.000
.994
.994
.994
2
(常量)
1011.912
136.901
7.392
.000
最终消费x5
.311
.049
1.718
6.374
.000
.994
.832
.135
农业x1
-.414
.154
-.726
-2.694
.015
.987
-.536
-.057
3
(常量)
874.604
106.869
8.184
.000
最终消费x5
.637
.089
3.516
7.142
.000
.994
.866
.112
农业x1
-.611
.124
-1.073
-4.936
.000
.987
-.767
-.077
工业x2
-.353
.088
-1.454
-3.994
.001
.992
-.696
-.062
a. 因变量: 财政收入y
回归方程为:
5.10
(1)
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
1
.908a
.824
.736
625.88326
2
.000b
.000
.000
1217.15945
a. 预测变量: (常量), x6, x3, x2, x4, x5。
b. 预测变量: (常量)
Anovac
模型
平方和
df
均方
F
Sig.
1
回归
1.830E7
5
3660971.683
9.346
.002a
残差
3917298.522
10
391729.852
总计
2.222E7
15
2
回归
.000
0
.000
.
.b
残差
2.222E7
15
1481477.129
总计
2.222E7
15
a. 预测变量: (常量), x6, x3, x2, x4, x5。
b. 预测变量: (常量)
c. 因变量: y
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
5922.827
2504.315
2.365
.040
x2
4.864
2.507
.677
1.940
.081
x3
2.374
.842
.782
2.818
.018
x4
-817.901
187.279
-1.156
-4.367
.001
x5
14.539
147.078
.050
.099
.923
x6
-846.867
291.634
-.899
-2.904
.016
2
(常量)
7542.938
304.290
24.789
.000
a. 因变量: y
回归方程为:
(2)后退法:输出结果
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
1
.908a
.824
.736
625.88326
2
.907b
.824
.759
597.04776
a. 预测变量: (常量), x6, x3, x2, x4, x5。
b. 预测变量: (常量), x6, x3, x2, x4。
Anovac
模型
平方和
df
均方
F
Sig.
1
回归
1.830E7
5
3660971.683
9.346
.002a
残差
3917298.522
10
391729.852
总计
2.222E7
15
2
回归
1.830E7
4
4575257.669
12.835
.000b
残差
3921126.262
11
356466.024
总计
2.222E7
15
a. 预测变量: (常量), x6, x3, x2, x4, x5。
b. 预测变量: (常量), x6, x3, x2, x4。
c. 因变量: y
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
5922.827
2504.315
2.365
.040
x2
4.864
2.507
.677
1.940
.081
x3
2.374
.842
.782
2.818
.018
x4
-817.901
187.279
-1.156
-4.367
.001
x5
14.539
147.078
.050
.099
.923
x6
-846.867
291.634
-.899
-2.904
.016
2
(常量)
6007.320
2245.481
2.675
.022
x2
5.068
1.360
.706
3.727
.003
x3
2.308
.486
.760
4.750
.001
x4
-824.261
167.776
-1.165
-4.913
.000
x6
-862.699
232.489
-.916
-3.711
.003
a. 因变量: y
(3)逐步回归
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
1
.498a
.248
.194
1092.83206
2
.697b
.485
.406
937.95038
3
.811c
.657
.572
796.60909
a. 预测变量: (常量), x3。
b. 预测变量: (常量), x3, x5。
c. 预测变量: (常量), x3, x5, x4。
Anovad
模型
平方和
df
均方
F
Sig.
1
回归
5502210.090
1
5502210.090
4.607
.050a
残差
1.672E7
14
1194281.918
总计
2.222E7
15
2
回归
1.079E7
2
5392697.554
6.130
.013b
残差
1.144E7
13
879750.910
总计
2.222E7
15
3
回归
1.461E7
3
4869041.506
7.673
.004c
残差
7615032.418
12
634586.035
总计
2.222E7
15
a. 预测变量: (常量), x3。
b. 预测变量: (常量), x3, x5。
c. 预测变量: (常量), x3, x5, x4。
d. 因变量: y
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
5161.259
1142.744
4.517
.000
x3
1.511
.704
.498
2.146
.050
2
(常量)
472.298
2150.138
.220
.830
x3
3.188
.913
1.050
3.492
.004
x5
212.325
86.643
.737
2.451
.029
3
(常量)
1412.807
1865.912
.757
.464
x3
3.440
.782
1.133
4.398
.001
x5
348.729
92.220
1.210
3.782
.003
x4
-415.136
169.163
-.587
-2.454
.030
a. 因变量: y
(4)两种方法得到的模型是不同的,回退法剔除了x5,保留了x
展开阅读全文