资源描述
云南大学数学与统计学实验教学中心
实验报告
课程名称:数学实验
学期:2010~2011学年下学期
成绩:
指导教师:
学生姓名:
学生学号:
实验名称:回归分析
实验编号:六
实验日期:6月6日
实验学时:2
学院:
专业:信息与计算科学
年级:
一、实验目的
1.熟悉MATLAB的运行环境.
2.学会初步建立数学模型的方法
3.运用回归分析方法来解决问题
二、实验内容
实验一:某公司出口换回成本分析
对经营同一类产品出口业务的公司进行抽样调查,被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。试分析两个变量之间的关系,并估计某家公司商品流转费用率是6.5%的出口换汇成本.
公司
出口换汇成本(人民币
元/美元)
商品流转费用率
(%)
公司
出口换汇成本
(人民币
元/美元)
商品流转费用率
(%)
1
2
3
4
5
6
7
1.40
1.20
1.00
1.90
1.30
2.40
1.40
4.20
5.30
7.10
3.70
6.20
3.50
4.80
8
9
10
11
12
13
1.60
2.00
1.00
1.60
1.80
1.40
5.50
4.10
5.00
4.00
3.40
6.90
实验二:某建筑材料公司的销售量因素分析
下表数据是某建筑材料公司去年20个地区的销售量(Y,千方),推销开支、实际帐目数、同类商品竞争数和地区销售潜力分别是影响建筑材料销售量的因素。1)试建立回归模型,且分析哪些是主要的影响因素。2)建立最优回归模型。
地区i
推销开支(x1)
实际帐目数(x2)
同类商品竞争数(x3)
地区销售潜力(x4)
销售量
Y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
5.5
2.5
8.0
3.0
3.0
2.9
8.0
9.0
4.0
6.5
5.5
5.0
6.0
5.0
3.5
8.0
6.0
4.0
7.5
7.0
31
55
67
50
38
71
30
56
42
73
60
44
50
39
55
70
40
50
62
59
10
8
12
7
8
12
12
5
8
5
11
12
6
10
10
6
11
11
9
9
8
6
9
16
15
17
8
10
4
16
7
12
6
4
4
14
6
8
13
11
79.3
200.1
163.2
200.1
146.0
177.7
30.9
291.9
160.0
339.4
159.6
86.3
237.5
107.2
155.0
201.4
100.2
135.8
223.3
195.0
提示:建立一个多元线性回归模型。
三、实验环境
Windows操作系统;
MATLAB 7.0.
四、实验过程
实验一:运用回归分析在MATLAB里实现
输入:x=[4.20 5.30 7.10 3.70 6.20 3.50 4.80 5.50 4.10 5.00 4.00 3.40 6.90]';
X=[ones(13,1) x];
Y=[1.40 1.20 1.00 1.90 1.30 2.40 1.40 1.60 2.00 1.00 1.60 1.80 1.40]';
plot(x,Y,'*');
[b,bint,r,rint,stats]=regress(Y,X,0.05);
输出: b = 2.6597 -0.2288
bint = 1.8873 3.4322
-0.3820 -0.0757
stats = 0.4958 10.8168 0.0072 0.0903
即-0.2288,的置信区间为[1.8873 3.4322],的置信区间为[-0.3820 -0.0757];
=0.4958, F=10.8168, p=0.0072 因P<0.05, 可知回归模型 y=2.6597-0.2288x 成立.
估计某家公司商品流转费用率是6.5%的出口换汇成本。将x=6.5代入回归模型中,得到
>> x=6.5;
>> y=2.6597-0.2288*x
y =
1.1725
实验二:在MATLAB里实现,
①首先建立回归模型
输出:
x1=[5.5 2.5 8.0 3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.0 6.0 5.0 3.5 8.0 6.0 4.0 7.5 7.0]';
x2=[31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59]';
x3=[10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9]';
x4=[8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11]';
Y=[79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0 201.4 100.2 135.8 223.3 195.0]';
X=[ones(20,1) x1 x2 x3 x4];
[b,bint,r,rint,stats]=regress(Y,X,0.05);
b,bint,stats
输出:
b =
191.9158
-0.7719
3.1725
-19.6811
-0.4501
bint =
103.1071 280.7245
-7.1445 5.6007
2.0640 4.2809
-25.1651 -14.1972
-3.7284 2.8283
stats =
0.9034 35.0509 0.0000 644.6510
即= 191.9158 =-0.7719 = 3.1725 =-19.6811 =-0.4501;
的置信区间为[103.1071 280.7245];的置信区间为[-7.1445 5.6007];的置信区间为[2.0640 4.2809];的置信区间为[-25.1651 -14.1972];的置信区间为[-3.7284 2.8283];
= 0.9034, F=35.0509, p=0.0000
因P<0.05, 可知回归模型 y=191.9158 -0.7719x1+3.1725*x2-19.6811*x3 -0.4501*x4成立.
②分析哪些是主要的影响因素
输入:x1=[5.5 2.5 8.0 3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.0 6.0 5.0 3.5 8.0 6.0 4.0 7.5 7.0]';
x2=[31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59]';
x3=[10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9]';
x4=[8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11]';
Y=[79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0 201.4 100.2 135.8 223.3 195.0]';
X=[x1 x2 x3 x4]; stepwise(X,Y);
从表Stepwise Table中分析得出变量x2和x3为主要的影响因素。
③移去非关键变量x1和x4后模型具有显著性. 虽然剩余标准差(RMSE)都有了变化,统计量F的值明显增大,因此新的回归模型更好.就得到最优模型。
输入:
X1=[ones(20,1) x2 x3];
[b,bint,r,rint,stats]=regress(Y,X1);
b,bint,stats
输出:
b =
186.0484
3.0907
-19.5140
bint =
110.4254 261.6715
2.1657 4.0156
-24.5597 -14.4683
stats =
0.9024 78.6295 0.0000 574.1580
P=0.0000<0.05,说明回归模型的回归效果显著;
最优回归方程为:y=186.0484+3.0907*x2-19.5140*x3
五、实验总结
1.遇到的问题及解决过程
2.产生的错误及原因分析
3.体会和收获
六、参考文献
[1]数学实验,重庆大学数学系傅鹂、龚劬、刘琼荪、何中市编著,科学出版社,2000年9月.
七、教师评语
展开阅读全文