资源描述
研究汽车销量与汽车特征的关系
一、研究的经济意义
近年来,随着人们生活水平的提高,越来越多的人们热衷于购买汽车来满足自己的消费需求,而汽车的销量与汽车的各项特征有密切联系,通过本次研究,可以看出特征对销量的影响。
二、数据来源
三、变量与模型设定
将“销售量”作为“因变量”,将“车长,车宽,耗油率,车净重等7个作为自变量。
则回归方程(i=1…7)
四、参数估计
对模型做普通最小二乘估计得下表
输入/移去的变量
模型
输入的变量
移去的变量
方法
1
车长, 二手销量, 价格, 车轮轴距, 马力, 车宽, 发动机a
.
输入
a. 已输入所有请求的变量。
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
更改统计量
R 方更改
F 更改
df1
df2
Sig. F 更改
1
.680a
.462
.211
35.481273
.462
1.839
7
15
.152
a. 预测变量: (常量), 车长, 二手销量, 价格, 车轮轴距, 马力, 车宽, 发动机。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
16208.824
7
2315.546
1.839
.152a
残差
18883.811
15
1258.921
总计
35092.635
22
a. 预测变量: (常量), 车长, 二手销量, 价格, 车轮轴距, 马力, 车宽, 发动机。
b. 因变量: 新车销量
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-242.074
457.240
-.529
.604
二手销量
-.228
1.352
-.057
-.168
.869
价格
-1.100
1.073
-.360
-1.025
.322
发动机
6.468
31.558
.153
.205
.840
马力
-.350
.492
-.421
-.712
.487
车轮轴距
4.577
3.296
.454
1.389
.185
车宽
-4.083
5.981
-.291
-.683
.505
车长
.824
1.759
.205
.469
.646
得到如下模型:
进行t检验可知,由于p值过大,未通过t检验,进行几次剔除分别将二手销量,发动机,车长,车宽删除。得到如下结果:
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
更改统计量
R 方更改
F 更改
df1
df2
Sig. F 更改
1
.665a
.442
.354
32.095029
.442
5.023
3
19
.010
a. 预测变量: (常量), 车轮轴距, 马力, 价格。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
15520.908
3
5173.636
5.023
.010a
残差
19571.727
19
1030.091
总计
35092.635
22
a. 预测变量: (常量), 车轮轴距, 马力, 价格。
b. 因变量: 新车销量
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-456.300
210.310
-2.170
.043
价格
-1.473
.750
-.482
-1.963
.064
马力
-.287
.199
-.345
-1.442
.166
车轮轴距
5.443
2.022
.541
2.692
.014
a. 因变量: 新车销量
P值在显著性水平0.1下近似通过,所以通过t和f检验。得到新回归方程:
五、残差分析
由未标准化残差的到残差图:
根据图的形态分布,推测可能存在异常值。
通过进行删除化残差,学生化残差,学生删除化残差,库克距离,杠杆值的计算,得到如下表:
通过检验学生删除化残差,第21个数据|SDR|=3.3226>3 中心化杠杆值ch=0.04988<2 D=0.18594<0.5 所以认为第21个数据为对于因变量的异常值,而不是关于自变量的异常值。
六、异方差检验
将价格,马力,车轮轴距与残差绝对值做等级相关系数检验得到如下结果:
相关系数
价格
马力
车轮轴距
abse
Spearman 的 rho
价格
相关系数
1.000
.706**
.554**
-.217
Sig.(双侧)
.
.000
.006
.319
N
23
23
23
23
马力
相关系数
.706**
1.000
.484*
-.025
Sig.(双侧)
.000
.
.019
.909
N
23
23
23
23
车轮轴距
相关系数
.554**
.484*
1.000
.356
Sig.(双侧)
.006
.019
.
.095
N
23
23
23
23
abse
相关系数
-.217
-.025
.356
1.000
Sig.(双侧)
.319
.909
.095
.
N
23
23
23
23
**. 在置信度(双测)为 0.01 时,相关性是显著的。
*. 在置信度(双测)为 0.05 时,相关性是显著的。
从表中得知:残差绝对值与自变量不存在异方差。
七、自相关检验
根据D.W检验,得到如下结果;
模型汇总b
模型
R
R 方
调整 R 方
标准 估计的误差
更改统计量
Durbin-Watson
R 方更改
F 更改
df1
df2
Sig. F 更改
1
.665a
.442
.354
32.095029
.442
5.023
3
19
.010
1.858
a. 预测变量: (常量), 车轮轴距, 马力, 价格。
b. 因变量: 新车销量
N=23 k=4 通过查表,得=1.08 =1.66 4-=2.34 D.W= 1.858 得出: <DW< 4-所以模型不存在序列的自相关性,为无自相关模型。
八、多重共线性诊断
用spss软件计算出特征根与条件数得到下表:
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
价格
马力
车轮轴距
1
1
3.878
1.000
.00
.00
.00
.00
2
.103
6.145
.00
.48
.00
.00
3
.019
14.283
.00
.43
.98
.00
4
.000
89.795
.99
.09
.02
1.00
a. 因变量: 新车销量
=89.795 存在较强的多重共线性,所以要消除多重共线性,剔除不重要的解释变量:车轮轴距。
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
价格
马力
1
1
2.901
1.000
.01
.01
.00
2
.082
5.940
.22
.59
.01
3
.017
13.138
.77
.40
.99
a. 因变量: 新车销量
剔除后多重共线性减轻,根据经济意义来说,马力是符合与销售量相关的变量。不予再次剔除。
得到新的回归方程
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
1
.479a
.230
.153
36.767478
a. 预测变量: (常量), 马力, 价格。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
8055.687
2
4027.844
2.980
.074a
残差
27036.948
20
1351.847
总计
35092.635
22
a. 预测变量: (常量), 马力, 价格。
b. 因变量: 新车销量
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
103.729
35.375
2.932
.008
价格
-.899
.824
-.294
-1.091
.288
马力
-.189
.224
-.227
-.843
.409
a. 因变量: 新车销量
根据模型得出:价格与马力影响销售量,其中价格每升高一个单位,销售量平均减少0.899万辆;马力每升高一个单位,销售量平均减少0.819万辆。符合经济意义。
九、预测分析
对已知的观察值和加入的一组数据进行预测检验,得到如下结果:
可以看出,实际观测的值在预测范围内,说明此模型能够较好的解释自变量与因变量之间的相关关系。
统计一班
20112430 王夕文
展开阅读全文