1、云南大学数学与统计学实验教学中心 实验报告 课程名称:数学实验 学期:2010~2011学年下学期 成绩: 指导教师: 学生姓名: 学生学号: 实验名称:回归分析 实验编号:六 实验日期:6月6日 实验学时:2 学院: 专业:信息与计算科学 年级: 一、实验目的 1.熟悉MATLAB的运行环境. 2.学会初步建立数学模型的方法 3.运用回归分析方法来解决问题 二、实验内容 实验一:某公司出口换回成本分析 对经营同一类产品出口业务的公司进行抽样调查,被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。试分析两个变量之间的关系,并
2、估计某家公司商品流转费用率是6.5%的出口换汇成本. 公司 出口换汇成本(人民币 元/美元) 商品流转费用率 (%) 公司 出口换汇成本 (人民币 元/美元) 商品流转费用率 (%) 1 2 3 4 5 6 7 1.40 1.20 1.00 1.90 1.30 2.40 1.40 4.20 5.30 7.10 3.70 6.20 3.50 4.80 8 9 10 11 12 13 1.60 2.00 1.00 1.60 1.80 1.40 5.50 4.10 5.0
3、0 4.00 3.40 6.90 实验二:某建筑材料公司的销售量因素分析 下表数据是某建筑材料公司去年20个地区的销售量(Y,千方),推销开支、实际帐目数、同类商品竞争数和地区销售潜力分别是影响建筑材料销售量的因素。1)试建立回归模型,且分析哪些是主要的影响因素。2)建立最优回归模型。 地区i 推销开支(x1) 实际帐目数(x2) 同类商品竞争数(x3) 地区销售潜力(x4) 销售量 Y 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 5.5 2.5 8.0
4、3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.0 6.0 5.0 3.5 8.0 6.0 4.0 7.5 7.0 31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59 10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9 8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13
5、11 79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0 201.4 100.2 135.8 223.3 195.0 提示:建立一个多元线性回归模型。 三、实验环境 Windows操作系统; MATLAB 7.0. 四、实验过程 实验一:运用回归分析在MATLAB里实现 输入:x=[4.20 5.30 7.10 3.70 6.20 3.50 4.80 5.50 4.10 5.00 4.00
6、 3.40 6.90]'; X=[ones(13,1) x]; Y=[1.40 1.20 1.00 1.90 1.30 2.40 1.40 1.60 2.00 1.00 1.60 1.80 1.40]'; plot(x,Y,'*'); [b,bint,r,rint,stats]=regress(Y,X,0.05); 输出: b = 2.6597 -0.2288 bint = 1.8873 3.4322 -0.3820 -0.0757 stats = 0.4958 10.8168 0.0072 0.0903 即-0.2288
7、的置信区间为[1.8873 3.4322],的置信区间为[-0.3820 -0.0757]; =0.4958, F=10.8168, p=0.0072 因P<0.05, 可知回归模型 y=2.6597-0.2288x 成立. 估计某家公司商品流转费用率是6.5%的出口换汇成本。将x=6.5代入回归模型中,得到 >> x=6.5; >> y=2.6597-0.2288*x y = 1.1725 实验二:在MATLAB里实现, ①首先建立回归模型 输出: x1=[5.5 2.5 8.0 3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.
8、0 6.0 5.0 3.5 8.0 6.0 4.0 7.5 7.0]'; x2=[31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59]'; x3=[10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9]'; x4=[8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11]'; Y=[79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 1
9、07.2 155.0 201.4 100.2 135.8 223.3 195.0]'; X=[ones(20,1) x1 x2 x3 x4]; [b,bint,r,rint,stats]=regress(Y,X,0.05); b,bint,stats 输出: b = 191.9158 -0.7719 3.1725 -19.6811 -0.4501 bint = 103.1071 280.7245 -7.1445 5.6007 2.0640 4.2809 -25.1651 -14.1972 -3
10、7284 2.8283 stats = 0.9034 35.0509 0.0000 644.6510 即= 191.9158 =-0.7719 = 3.1725 =-19.6811 =-0.4501; 的置信区间为[103.1071 280.7245];的置信区间为[-7.1445 5.6007];的置信区间为[2.0640 4.2809];的置信区间为[-25.1651 -14.1972];的置信区间为[-3.7284 2.8283]; = 0.9034, F=35.0509, p=0.0000 因P<0.05, 可知回归模型 y=1
11、91.9158 -0.7719x1+3.1725*x2-19.6811*x3 -0.4501*x4成立. ②分析哪些是主要的影响因素 输入:x1=[5.5 2.5 8.0 3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.0 6.0 5.0 3.5 8.0 6.0 4.0 7.5 7.0]'; x2=[31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59]'; x3=[10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9]'; x4=[8 6 9 16 1
12、5 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11]'; Y=[79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0 201.4 100.2 135.8 223.3 195.0]'; X=[x1 x2 x3 x4]; stepwise(X,Y); 从表Stepwise Table中分析得出变量x2和x3为主要的影响因素。 ③移去非关键变量x1和x4后模型具有显著性. 虽然剩余标准差(RMSE)都有了变化,统计量F的值明显增
13、大,因此新的回归模型更好.就得到最优模型。 输入: X1=[ones(20,1) x2 x3]; [b,bint,r,rint,stats]=regress(Y,X1); b,bint,stats 输出: b = 186.0484 3.0907 -19.5140 bint = 110.4254 261.6715 2.1657 4.0156 -24.5597 -14.4683 stats = 0.9024 78.6295 0.0000 574.1580 P=0.0000<0.05,说明回归模型的回归效果显著; 最优回归方程为:y=186.0484+3.0907*x2-19.5140*x3 五、实验总结 1.遇到的问题及解决过程 2.产生的错误及原因分析 3.体会和收获 六、参考文献 [1]数学实验,重庆大学数学系傅鹂、龚劬、刘琼荪、何中市编著,科学出版社,2000年9月. 七、教师评语






