1、研究汽车销量与汽车特征的关系 一、研究的经济意义 近年来,随着人们生活水平的提高,越来越多的人们热衷于购买汽车来满足自己的消费需求,而汽车的销量与汽车的各项特征有密切联系,通过本次研究,可以看出特征对销量的影响。 二、数据来源 三、变量与模型设定 将“销售量”作为“因变量”,将“车长,车宽,耗油率,车净重等7个作为自变量。 则回归方程(i=1…7) 四、参数估计 对模型做普通最小二乘估计得下表 输入/移去的变量 模型 输入的变量 移去的变量 方法 1 车长, 二手销量, 价格, 车轮轴距, 马力, 车宽, 发动机a . 输入 a. 已输入所有
2、请求的变量。 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 更改统计量 R 方更改 F 更改 df1 df2 Sig. F 更改 1 .680a .462 .211 35.481273 .462 1.839 7 15 .152 a. 预测变量: (常量), 车长, 二手销量, 价格, 车轮轴距, 马力, 车宽, 发动机。 Anovab 模型 平方和 df 均方 F Sig. 1 回归 16208.824 7 2315.546 1.839 .152a 残差 18883.811 15 1258.
3、921 总计 35092.635 22 a. 预测变量: (常量), 车长, 二手销量, 价格, 车轮轴距, 马力, 车宽, 发动机。 b. 因变量: 新车销量 系数a 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) -242.074 457.240 -.529 .604 二手销量 -.228 1.352 -.057 -.168 .869 价格 -1.100 1.073 -.360 -1.025 .322 发动机 6.468 31.558 .153 .205
4、 .840 马力 -.350 .492 -.421 -.712 .487 车轮轴距 4.577 3.296 .454 1.389 .185 车宽 -4.083 5.981 -.291 -.683 .505 车长 .824 1.759 .205 .469 .646 得到如下模型: 进行t检验可知,由于p值过大,未通过t检验,进行几次剔除分别将二手销量,发动机,车长,车宽删除。得到如下结果: 模型汇总 模型 R R 方 调整 R 方 标准 估计的误差 更改统计量 R 方更改 F 更改 df1 df2 Sig. F 更改
5、 1 .665a .442 .354 32.095029 .442 5.023 3 19 .010 a. 预测变量: (常量), 车轮轴距, 马力, 价格。 Anovab 模型 平方和 df 均方 F Sig. 1 回归 15520.908 3 5173.636 5.023 .010a 残差 19571.727 19 1030.091 总计 35092.635 22 a. 预测变量: (常量), 车轮轴距, 马力, 价格。 b. 因变量: 新车销量 系数a 模型 非标准化系数 标准系数 t
6、 Sig. B 标准 误差 试用版 1 (常量) -456.300 210.310 -2.170 .043 价格 -1.473 .750 -.482 -1.963 .064 马力 -.287 .199 -.345 -1.442 .166 车轮轴距 5.443 2.022 .541 2.692 .014 a. 因变量: 新车销量 P值在显著性水平0.1下近似通过,所以通过t和f检验。得到新回归方程: 五、残差分析 由未标准化残差的到残差图: 根据图的形态分布,推测可能存在异常值。 通过进行删除化残差,学生化残差,学生删除
7、化残差,库克距离,杠杆值的计算,得到如下表: 通过检验学生删除化残差,第21个数据|SDR|=3.3226>3 中心化杠杆值ch=0.04988<2 D=0.18594<0.5 所以认为第21个数据为对于因变量的异常值,而不是关于自变量的异常值。 六、异方差检验 将价格,马力,车轮轴距与残差绝对值做等级相关系数检验得到如下结果: 相关系数 价格 马力 车轮轴距 abse Spearman 的 rho 价格 相关系数 1.000 .706** .554** -.217 Sig.(双侧) . .000 .006 .319 N 23
8、23 23 23 马力 相关系数 .706** 1.000 .484* -.025 Sig.(双侧) .000 . .019 .909 N 23 23 23 23 车轮轴距 相关系数 .554** .484* 1.000 .356 Sig.(双侧) .006 .019 . .095 N 23 23 23 23 abse 相关系数 -.217 -.025 .356 1.000 Sig.(双侧) .319 .909 .095 . N 23 23 23 23 **. 在置信度(双测)为 0.01 时
9、相关性是显著的。 *. 在置信度(双测)为 0.05 时,相关性是显著的。 从表中得知:残差绝对值与自变量不存在异方差。 七、自相关检验 根据D.W检验,得到如下结果; 模型汇总b 模型 R R 方 调整 R 方 标准 估计的误差 更改统计量 Durbin-Watson R 方更改 F 更改 df1 df2 Sig. F 更改 1 .665a .442 .354 32.095029 .442 5.023 3 19 .010 1.858 a. 预测变量: (常量), 车轮轴距, 马力, 价格。 b. 因变量: 新车销量 N=
10、23 k=4 通过查表,得=1.08 =1.66 4-=2.34 D.W= 1.858 得出: 11、99
.09
.02
1.00
a. 因变量: 新车销量
=89.795 存在较强的多重共线性,所以要消除多重共线性,剔除不重要的解释变量:车轮轴距。
共线性诊断a
模型
维数
特征值
条件索引
方差比例
(常量)
价格
马力
1
1
2.901
1.000
.01
.01
.00
2
.082
5.940
.22
.59
.01
3
.017
13.138
.77
.40
.99
a. 因变量: 新车销量
剔除后多重共线性减轻,根据经济意义来说,马力是符合与销售量相关的变量。不予再次剔除。
得到新的回归方程
模型汇 12、总
模型
R
R 方
调整 R 方
标准 估计的误差
1
.479a
.230
.153
36.767478
a. 预测变量: (常量), 马力, 价格。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
8055.687
2
4027.844
2.980
.074a
残差
27036.948
20
1351.847
总计
35092.635
22
a. 预测变量: (常量), 马力, 价格。
b. 因变量: 新车销量
系数a
模型
非标准化系数
标准系数
t
Sig.
13、B
标准 误差
试用版
1
(常量)
103.729
35.375
2.932
.008
价格
-.899
.824
-.294
-1.091
.288
马力
-.189
.224
-.227
-.843
.409
a. 因变量: 新车销量
根据模型得出:价格与马力影响销售量,其中价格每升高一个单位,销售量平均减少0.899万辆;马力每升高一个单位,销售量平均减少0.819万辆。符合经济意义。
九、预测分析
对已知的观察值和加入的一组数据进行预测检验,得到如下结果:
可以看出,实际观测的值在预测范围内,说明此模型能够较好的解释自变量与因变量之间的相关关系。
统计一班
20112430 王夕文
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818