资源描述
曲线拟合与回归分析
1、有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下:
企业编号
生产性固定资产价值(万元)
工业总产值(万元)
1
318
524
2
910
1019
3
200
638
4
409
815
5
415
913
6
502
928
7
314
605
8
1210
1516
9
1022
1219
10
1225
1624
合计
6525
9801
(1)说明两变量之间的相关方向;
(2)建立直线回归方程;
(3)计算估计标准误差;
(4)估计生产性固定资产(自变量)为1100万元时的总资产(因变量)的可能值。
解:由表格易知:工业总产值是随着生产性固定资产价值的增长而增长的,而知之间存在正向相关性。
用spss回归有:
(2)、可知:若用y表示工业总产值(万元),用x表示生产性固定资产,二者可用如下的表达式近似表示:
(3)、用spss回归知标准误差为80.216(万元)。
(4)、当固定资产为1100时,总产值可能是(0.896*1100+395.567-80.216~0.896*1100+395.567+80.216)即(1301.0~146.4)这个范围内的某个值。
另外,用MATLAP也可以得到相同的结果:
程序如下所示:
function [b,bint,r,rint,stats] = regression1
x = [318 910 200 409 415 502 314 1210 1022 1225];
y = [524 1019 638 815 913 928 605 1516 1219 1624];
X = [ones(size(x))', x'];
[b,bint,r,rint,stats] = regress(y',X,0.05);
display(b);
display(stats);
x1 = [300:10:1250];
y1 = b(1) + b(2)*x1;
figure;plot(x,y,'ro',x1,y1,'g-');
industry = ones(6,1);
construction = ones(6,1);
industry(1) =1022;
construction(1) = 1219;
for i = 1:5
industry(i+1) =industry(i) * 1.045;
construction(i+1) = b(1) + b(2)* construction(i+1);
end
display(industry);
display( construction);
end
运行结果如下所示:b =
395.5670
0.8958
stats =
1.0e+004 *
0.0001 0.0071 0.0000 1.6035
industry =
1.0e+003 *
1.0220
1.0680
1.1160
1.1663
1.2188
1.2736
construction =
1.0e+003 *
1.2190
0.3965
0.3965
0.3965
0.3965
0.3965
2、设某公司下属10个门市部有关资料如下:
门市部编号
职工平均销售额(万元)
流通费用水平(%)
销售利润率(%)
1
6
2.8
12.6
2
5
3.3
10.4
3
8
1.8
18.5
4
1
7.0
3.0
5
4
3.9
8.1
6
7
2.1
16.3
7
6
2.9
12.3
8
3
4.1
6.2
9
3
4.2
6.6
10
7
2.5
16.8
(1)、确定适宜的 回归模型;
(2)、计算有关指标,判断这三种经济现象之间的紧密程度。
解:用spss进行回归分析:
若用分别表示销售利润率、职工平均销售额和流通费用水平,则通过以上的分析结果可知;
并且由显著性水平可知:流通费用水平对销售利润率影响不大(0.131大于0.05),而职工平均销售额的显著性水平为0,说明它对销售利润率的影响很大。
第五章 方差分析与假设检验
1、(P75)为比较5种品牌的合成木板的耐久性,对每个品牌取4个样品作摩擦实验测量磨损量,得以下数据:
(1)、它们的耐久性有无明显差异?
(2)、有选择的作两品牌的比较,能得出什么结果?
解:(1)、用spss进行方差分析有:
A、B、C、D四种品牌的标准差相近,它们的耐久性没有明显的差异。
用MATLAP分析有:
function anova_1
fm1 = [2.2 2.1 2.4 2.5;2.2 2.3 2.4 2.6;2.2 2.0 1.9 2.1;2.4 2.7 2.6 2.7;2.3 2.5 2.3 2.4;];
p=anova1(fm1);
display(p);
得到:p= 0.5737>0.05,也能得到相同的结论。
(2)、从五种品牌的平均值可以判断这种品牌的总体耐久性的好坏,其方差和标准差可以说明它的各个样本之间耐久性的差异。例如A、B两种品牌,B的总体水平要稍高,而且它的各个样品间差异较小。
2、将土质基本相同的一块耕地分成5块,每块又均等分成4小块。在每块地内把4个品种的小麦分种在4小块内,每小块的播种量相等,册的收获量如下:
A1
A2
A3
A4
A5
B1
32.3
34.0
34.7
36.0
35.5
B2
33.2
33.6
36.8
34.3
36.1
B3
30.8
34.4
32.3
35.8
32.8
B4
29.5
26.2
28.1
28.5
29.4
考察地块和品种对小麦的收获量有无显著影响?并在必要时做进一步比较。
解:利用MATLAP进行分析:
function anova_2
fm1 = [32.3 34.0 34.7 36.0 35.5;33.2 33.6 36.8 34.3 36.1;30.8 34.4 32.3 35.8 32.8;29.5 26.2 28.1 28.5 29.4;];
p=anova2(fm1,2);
display(p);
得到:
p =
0.7770 0.0121 0.9393
由于,所以地块对小麦的收获量没有影响;
由于,所以品种对其收获量有显著影响;
由于,所以地块和品种的交互作用对收获量也没有影响。
进一步比较:
把种在B2中的小麦品种放在A3这块地中种植可得到最高产量。
第六章 计算机模拟
1、你到海边度假,听到当地气象台的天气预报每天下雨的机会是40%,用蒙特卡罗方法模拟你的假期中有4天连续下雨的概率。
解:可以假设该地方的天气情况为一个半径为5的大圆,然后下雨这种情况是它内部半径是的同心圆,利用蒲丰投针的方法,就可以知道“连续四次投到小圆”这种情况发生的概率就是连续4天下雨的概率。其MATLAP程序如下所示:
function rain_value
l = 5;
d = sqrt(10);
m = 0;b=0;
n = 10000;
for i = 1:(n-4)
a = unifrnd(0,d,n,1);
y = unifrnd(0,l,n,1);
for j= 1:4
if pi*a(i+j)*a(i+j) <= pi*y(i+j)*y(i+j)
b = b + 1 ;
end
end
if b == 10
m = m+1;
elseif n<10
b = 0;
end
end
p = 4*m/n;
display(p)
运行结果:
p =
4.0000e-003
由此可知:连续4天都下雨的概率为:0.4*0.4*0.4*0.4=0.0256
2、一个带有船只卸货的岗楼,任何时间仅能为一艘船只卸货。船只进港是为了卸货,相邻两艘船只到达的时间间隔在15分钟到145分钟之间变化。一艘船只卸货的时间由所卸货物类型决定,在45分钟到90分钟之间变化,请回答以下问题:
(1)、每艘船只在港口的平均时间和最长时间是多少?
(2)、若一艘船只的等待时间是从到达到开始卸货的时间,每艘船只的平均等待时间和最长等待时间是多少?
(3)、卸货设备空闲时间的百分比是多少?
(4)、船只排队最长的长度是多少?
解:这个问题可以看做是一个排队的例子,用MATLAP求解程序如下所示:
function timeWaiting = simu3_ship(n)
n = input('n=');m=0;
x = zeros(1,n);y = zeros(1,n);
D = zeros(1,n);leng = zeros(1,n);
t = unifrnd(65,130,1,n)+15; %两艘船到达的时间间隔
s = unifrnd(22.5,45,1,n)+45; %一艘船只的卸货时间
x(1) = t(1); %第一艘船到达的时间
for i = 2:n
y(i) = x(i-1) + t(i); %第2~n搜船到达的时间
j = i - 1;
c(j) = x(j) + s(j)+ D(j); %计算第一艘船离开的时间
if c(j) < y(i) %比较相邻两艘船离开、到达时刻的大小
D(i) = 0;
D3(i) = y(i)-c(j); %D3用来计算空闲的时间
else
D(i) = c(j) - y(i);
D3(i) = 0;
end
x(i) = y(i);
D1(i) = D(i)+s(i);
D2(i) = D(i);
for k = 2:n
if c(j) > y(k)
m = m+1;
end
leng(j) = m; %计算每艘船在卸货的时候,等待的船只个数
end
m = 0;
end
averageWaiting1 = mean(D1);maxWaiting1 = max(D1);
averageWaiting2 = mean(D2);maxWaiting2 = max(D2);
maxLength = max(leng);
freerate3 = sum(D3(i))/(sum(D3(i))+sum(s(i-1)));
display(averageWaiting1);display(maxWaiting1);
display(averageWaiting2);display(maxWaiting2);
display(freerate3);display(maxLength);
在命令窗口输入:n=10
运行结果:averageWaiting1 =
72.5714
maxWaiting1 =
72.5714
averageWaiting2 =
0.7345
maxWaiting2 =
7.3453
freerate3 =
0.2007
maxLength =
8
可知:
(1)、每艘船只在港口的平均时间和最长时间是72.5714和72.5714分种。
(2)、若一艘船只的等待时间是从到达到开始卸货的时间,每艘船只的平均等待时间和最长等待时间是0.7345和7.3453分种。
(3)、卸货设备空闲时间的百分比是20.07%。
(4)、船只排队最长的长度是同一时间有8艘船在等待卸货。
第七章 SPSS的基本应用
1、 某地调查居民心理问题的存在现状,资料如下表所示,试绘制线性比较不同性别和年龄组的居民心理问题检出情况。
年龄分组(岁)
心理问题检出率(%)
男性
女性
15-
10.57
19.73
25-
11.57
11.98
35-
9.57
15.50
45-
11.71
13.85
55-
13.51
12.91
65-
15.62
16.77
75-
16.00
21.04
由该图可以看出居民心理问题检出率受性别和年龄的影响情况。
2、为研究儿童生长发育的分期,调查1253名1月至7岁儿童的身高(cm)、体重(kg)、胸围(cm)和坐高(cm)的资料。资料作如下整理:先把1月至7岁划分成19个月份段,分月份算出个指标的平均值,将第1月的各指标平均值与出生时的各指标平均值比较,求出月平均增长率(%),然后第2月起的个月份指标平均值与前一月比较,亦求出月平均增长率(%),结果见下表。欲将儿童的生长发育分为四期,故指定聚类的类别数位4,请通过聚类分析确定四个儿童生长发育期的起止期间。
通过spss软件进行回归分析可以得到上面表格,我们可清楚地看到聚类结果;参照专业知识,将儿童生长发育分期定为 第一期,出生后至满月,增长率最高; 第二期,第2个月起至第3个月,增长率次之; 第三期,第3个月起至第8个月,增长率减缓; 第四期,第8个月后,增长率显著减缓。
展开阅读全文