资源描述
C逐步回归法逐步回归法“”班级:研1614 学生:秦培歌 序号序号111.216.56.2587213.420.56.4643340.726.39.363545.316.55.3692524.819.27.31248612.716.55.9643720.920.26.41964835.721.37.6153198.717.24.9713109.614.36.4749序号序号1114.518.16.078951226.923.17.47621315.719.15.827931436.224.78.67411518.118.66.56251628.924.98.38541714.917.96.77161825.822.48.69211921.720.28.45952025.716.96.73353分析:clc;clear all;y=11.2 13.4 40.7 5.3 24.8 12.7 20.9 35.7 8.7 9.6 14.5 26.9 15.7 36.2 18.1 28.9 14.9 25.8 21.7 25.7;%犯罪率(人犯罪率(人/十万人)十万人)x1=16.5 20.5 26.3 16.5 19.2 16.5 20.2 21.3 17.2 14.3 18.1 23.1 19.1 24.7 18.6 24.9 17.9 22.4 20.2 16.9;%低收入家庭百分比低收入家庭百分比 x2=6.2 6.4 9.3 5.3 7.3 5.9 6.4 7.6 4.9 6.4 6.0 7.4 5.8 8.6 6.5 8.3 6.7 8.6 8.4 6.7;%失业率失业率 x3=587 643 635 692 1248 643 1964 1531 713 749 7895 762 2793 741 625 854 716 921 595 3353;%总人口数(千人)总人口数(千人)figure(1),plot(x1,y,*);figure(2),plot(x2,y,*);figure(3),plot(x3,y,*);X1=x1,x2,x3;stepwise(X1,y)编写程序如下:运行的结果与结论:运行的结果与结论:犯罪率与低收入散点图 犯罪率与失业率散点图 犯罪率与人口总数散点图 低收入与失业率作为自变量 低收入与人口总数作为自变量 失业率与人口总数作为自变量由上图可以看出由上图可以看出:在图中可以明显看出前两图的线性程度很好,而第三个图的线性程度较差,从这个角度来说我们应该以失业率和低收入为自变量建立模型。我们也可以从相关性角度来选取自变量,可以看出:低收入与失业率作为自变量时的 RMSE=4.64848;低收入与人口总数作为自变量时的 RMSE=5.62245;失业率与人口总数作为自变量时的RMSE=5.04083;我们看到当低收入 与失业率作为自变量时 RMSE 最小,因此如果选择两个变量作为自变量的会,它们是最 适合的。并且可以得到三者的关系为:我们对同时选取三个自变量的模型进行分析:我们对同时选取三个自变量的模型进行分析:得出结论:得出结论:以上是用 stepwise()命令完成逐步回归,进而求得最优的方程模型。最后我们用多元回归程序检验一下求得线性方程的显著性,即用相关系数法来测定它的拟合优度。编写程序如下:y=11.2 13.4 40.7 5.3 24.8 12.7 20.9 35.7 8.7 9.6 14.5 26.9 15.7 36.2 18.1 28.9 14.9 25.8 21.7 25.7;ab,stats,yy,ylr=regress2(X,y)Table=stats1,Pj=stats2运行可得:ab=-34.0725 1.2239 4.3989stats=6x7 cell 0.8955 4.6485 2x1 doubleyy=ylr=table=方差来源方差来源 偏差平方和偏差平方和 自由度自由度 方差方差 F比比 F 显著性显著性 x1 100.2597 1 100.2597 4.6399 4.4513 显著显著 x2 179.5199 1 179.5199 8.3079 8.3997 显著显著 回归回归 1.4879e+003 2 743.9297 34.4278 3.5915 高度显著高度显著 剩余剩余 367.3426 17 21.6084 6.1121 总和总和 1.8552e+003 19 Pj=0.4016 0.5374方差来源方差来源偏差平方和偏差平方和自由度自由度方差方差F值显著性著性回回归1.4879e+0032743.929734.42783.5915高度显著误差差367.34261721.60846.1121总和和1.8552e+00319
展开阅读全文