资源描述
单因素方差分析的应用实例
PROC ANOVA [DATA= <数据集名>
MANOVA 按多元分析的要求略去有任一缺失值的记录
OUTSTAT= <数据集名>] ; 指定统计结果输出的数据集名
CLASS <处理因素名列>; 必需,指定要分析的处理因素
MODEL <应变量名=处理因素名列> / [选项]; 必需,给出分析用的方差分析模型
MEANS <变量名列> / [选项] ; 指定要两两比较的因素及比较方法
BY <变量名列>;
FREQ <变量名>;
MANOVA H= 效应 E= 效应 M= 公式...; 指定多元方差分析的选项
例1:研究6种氮肥施用法对小麦的效应,每种施肥法种5盆小麦,完全随机设计。最后测定它们的含氮量(mg), 试作方差分析
施氮法
1
2
3
4
5
6
12.9
14.0
12.6
10.5
14.6
14.0
12.3
13.8
13.2
10.8
14.6
13.3
12.2
13.8
13.4
10.7
14.4
13.7
12.5
13.6
13.4
10.8
14.4
13.5
12.7
13.6
13.0
10.5
14.4
13.7
12.52
13.76
13.12
10.66
14.48
13.64
SAS程序
data exam1;
input g x @@;
cards;
1 12.9 2 14.0 3 12.6 4 10.5 5 14.6 6 14.0
1 12.3 2 13.8 3 13.2 4 10.8 5 14.6 6 13.3
1 12.2 2 13.8 3 13.4 4 10.7 5 14.4 6 13.7
1 12.5 2 13.6 3 13.4 4 10.8 5 14.4 6 13.5
1 12.7 2 13.6 3 13.0 4 10.5 5 14.4 6 13.7
;
proc anova data=exam1;
class g;
model x=g ;
run;
data exam2;
input x1 g j @@;
cards;
60 1 1 62 2 1 61 3 1 60 4 1
65 1 2 65 2 2 68 3 2 65 4 2
63 1 3 61 2 3 61 3 3 60 4 3
64 1 4 67 2 4 63 3 4 61 4 4
62 1 5 65 2 5 62 3 5 64 4 5
61 1 6 62 2 6 62 3 6 65 4 6
;
proc anova data=exam2;
class g j;
model x1=g j;
run;
例2:对某地区农村的6名2周岁男婴的身高、胸围、上半臂围进行测量,得样本数据如下表。根据以往资料,该地区城市2周岁男婴的这三个指标的均值
现欲在多元正态性假定下检验该地区农村2周岁男婴是否与城市2周岁男婴有相同的均值。取a = 0.01。
编号
身高(cm)
胸围(cm)
上半臂围(cm)
1
78
60.6
16.5
2
76
58.1
12.5
3
92
63.2
14.5
4
81
59.0
14.0
5
81
60.8
15.5
6
84
59.5
14.0
data exam4_2_1;
input id x1 x2 x3;
cards;
1 78 60.6 16.5
2 76 58.1 12.5
3 92 63.2 14.5
4 81 59.0 14.0
5 81 60.8 15.5
6 84 59.5 14.0
;
proc corr noprint cov output=new;
var x1 x2 x3;
run;
proc iml;
use new;
read all where( _TYPE_='COV' ) into S;
read all where( _TYPE_='MEAN' ) into xm;
read all var{x1} where( _TYPE_='N' ) into n;
mu0 = {90, 58, 16};
xm = xm` ;
p = ncol(S);
T2 = n*(xm-mu0)`*inv(S)*(xm-mu0);
T2a = p*(n-1)*finv(0.99,p,n-p)/(n-p);
print T2 T2a ;
if T2 >= T2a then print '拒绝原假设H0';
else print '接受原假设H0';
run;
data exam4_2_1;
input id x1 x2 x3;
y1=x1-90;
y2=x2-58;
y3=x3-16;
cards;
1 78 60.6 16.5
2 76 58.1 12.5
3 92 63.2 14.5
4 81 59.0 14.0
5 81 60.8 15.5
6 84 59.5 14.0
;
proc anova;
model y1 y2 y3=/nouni;
manova h=intercept;
run;
题目:1. 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼16尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。
饲料
鱼的增重(xij)
A1
31.9
27.9
31.8
28.4
A2
24.8
25.7
26.8
27.9
A3
22.1
23.6
27.3
24.9
A4
27.0
30.8
29.0
24.5
试检验不同配合饲料对鱼的饲喂效果是否有显著影响(取)?运算结果要求列出方差分析表,并给出检验结论。
data siliao;
input num weight sort;
cards;
1 31.9 1
2 27.9 1
3 31.8 1
4 28.4 1
5 24.8 2
6 25.7 2
7 26.8 2
8 24.9 2
9 22.1 3
10 23.6 3
11 27.3 3
12 24.9 3
13 27.0 4
14 30.8 4
15 29.0 4
16 24.5 4
;
proc anova data=siliao;
class sort;
model weight=sort;
run;
例题:某灯泡厂用四种不同配料方案制成的灯丝生产四批灯泡,在每一批中取若干个作寿命试验,得如下数据(单位:小时):问灯丝的不同配料方案对灯泡寿命有无显著影响?
灯
泡
品
种
A1
1600,1610,1650,1680,1700,1720,1800
A2
1580,1640,1640,1700,1750
A3
1460,1550,1600,1620,1640,1660,1740,1820
A4
1510,1520,1530,1570,1600,1680
data p123;
input g y @@;
cards;
1 1600 1 1610 1 1650 1 1680 1 1700 1 1720 1 1800
2 1580 2 1640 2 1640 2 1700 2 1750
3 1460 3 1550 3 1600 3 1620 3 1640 3 1660 3 1740 3 1820
4 1510 4 1520 4 1530 4 1570 4 1600 4 1680
;
proc anova data=p123;
class g;
model y=g;
run;
双因素方差分析的应用实例
例2:用生长素处理豌豆,共6个处理。豌豆种子发芽后,移植24株,分成4组,每组6个木箱,每箱1株1个处理。试验共有4组24箱,试验时按组排列于温室中,使同组各箱的环境条件一致。然后记录各箱见第一朵花时4株豌豆的总节间数,其结果为:
处理
组
总和
平均
1
2
3
4
对照
60
62
61
60
243
60.8
赤霉素
65
65
68
65
263
65.8
动力精
63
61
61
60
245
61.3
吲哚乙酸
64
67
63
61
255
63.8
硫酸腺嘌呤
62
65
62
64
253
63.3
马来酸
61
62
62
65
250
62.5
总和
375
382
377
375
T=1509
SAS程序
data exam2;
input x1 g j @@;
cards;
60 1 1 62 2 1 61 3 1 60 4 1
65 1 2 65 2 2 68 3 2 65 4 2
63 1 3 61 2 3 61 3 3 60 4 3
64 1 4 67 2 4 63 3 4 61 4 4
62 1 5 65 2 5 62 3 5 64 4 5
61 1 6 62 2 6 62 3 6 65 4 6
;
proc anova data=exam2;
class g j;
model x1=g j;
run;
例4:在某种橡胶的配方中,考虑了三种不同的促进剂,四种不同分量的氧化锌。各种配方试验一次,测得300%定强如下:问不同促进剂、不同分量氧化锌分别对定强有无显著影响?
data exam3;
input y A B @@;
cards;
32 1 1 35 1 2 35.5 1 3 38.5 1 4
33.5 2 1 36.5 2 2 38 2 3 39.5 2 4
36 3 1 37.5 3 2 39.5 3 3 43 3 4
;
proc anova data=exam3;
class A B;
model y=A B;
run;
例5:考察合成纤维中对纤维弹性有影响的两个因素:收缩率A和总拉伸倍数B。A和B各取四种水平,整个试验重复一次,试验结果如下:试问收缩率和总拉伸倍数分别对纤维弹性有无显著影响,并问两者对纤维弹性有无显著交互作用?
data p149;
input y A B @@;
cards;
71 1 1 73 1 1 72 1 2 73 1 2 75 1 3 73 1 3 77 1 4 75 1 4
73 2 1 75 2 1 76 2 2 74 2 2 78 2 3 77 2 3 74 2 4 74 2 4
76 3 1 73 3 1 79 3 2 77 3 2 74 3 3 75 3 3 74 3 4 73 3 4
75 4 1 73 4 1 73 4 2 72 4 2 70 4 3 71 4 3 69 4 4 69 4 4
;
proc anova data=p149;
class A B;
model y=A|B;
run;
一元线性回归分析的应用实例
例5.5.1 考察15名不同程度的烟民的每日抽烟量、饮酒量(啤酒)与其心电图指标(zb)的对应数据,试建立心电图指标关于日抽烟量和日饮酒量的适合的回归模型。
data yanmin_sandian;
input g x y zb@@;
label x='日抽烟量(x)/支' y='日饮酒量(y)/升' zb='心电图指标(zb)';
cards;
1 30 10 280 1 25 11 260 1 35 13 330
1 40 14 400 1 45 14 410 2 20 12 270
2 18 11 210 2 25 12 280 2 25 13 300
2 23 13 290 3 40 14 410 3 45 15 420
3 48 16 425 3 50 18 450 3 55 19 470
;
Goptions cback=white hsize=8 vsize=5;
proc g3d ;
scatter y*x=zb/xticknum=10
yticknum=10
zticknum=10
rotate=30
shape='ballon'
size=0.5
color = 'blue'
noneedle;
run;
data yanmin_glm;
input g x y zb@@;
cards;
1 30 10 280 1 25 11 260 1 35 13 330
1 40 14 400 1 45 14 410 2 20 12 270
2 18 11 210 2 25 12 280 2 25 13 300
2 23 13 290 3 40 14 410 3 45 15 420
3 48 16 425 3 50 18 450 3 55 19 470
;
proc glm data=yanmin_glm;
model zb=x y x*x x*y y*y/p;
output out=new1 p=zhat r=resid;
run;
例2. 钢的强度和硬度都是反映钢质量的指标。现在炼20炉中碳钢,它们的抗拉强度Y与硬度x的20对实验值如下表。
(1) 试绘出散点图 (2)求Y对x的经验回归直线方程
(3) 对回归直线作显著性检验(取显著性水平为0.05)
编号
xi
yi
编号
xi
yi
编号
xi
yi
编号
xi
yi
1
277
103
6
268
98
11
286
108
16
255
94
2
257
99.5
7
285
103.5
12
269
100
17
269
99
3
255
93
8
286
103
13
246
96.5
18
297
109
4
278
105
9
272
104
14
255
92
19
257
95.5
5
306
110
10
285
103
15
253
94
20
250
91
一元线性回归分析的SAS程序
data reg3;
input x y @@;
u=x-240;
v=y-90;
cards;
277.0000 103.0000 257.0000 99.5000 255.0000 93.0000 278.0000 105.0000
306.0000 110.0000 268.0000 98.0000 285.0000 103.5000 286.0000 103.0000
272.0000 104.0000 285.0000 103.0000 286.0000 108.0000 269.0000 100.0000
246.0000 96.5000 255.0000 92.0000 253.0000 94.0000 255.0000 94.0000
269.0000 99.0000 297.0000 109.0000 257.0000 95.5000 250.0000 91.0000
;
proc reg data=reg3;
model v=u/cli clm;
plot r.*p.;
plot v*u='o' p.*u='-' u95.*u='U' l95.*u='L'/overlay;
run;
data liangang_reg;
input x y @@;
cards;
数据略。。。
;
proc sort data=liangang_reg out=new1;
by x;
proc reg data=new1;
model y=x/cli clm;
output out=new2 p=yhat r=resid l95=l u95=u l95m=lm u95m=um;
proc gplot data=new2;
plot yhat*x y*x l*x u*x lm*x um*x /legend grid overlay;
symbol1 c=red i=join v=star;
symbol2 c=black v=diamond;
symbol3 c=blue i=join;
symbol4 c=blue i=join;
symbol5 c=green i=join;
symbol6 c=green i=join;
run;
多元回归分析的应用实例
例3. 在酿酒工艺的无芽酶试验中,发现吸氨量y与吸氨时间x1及底水x2都有关系,试根据下列数据,找出y对x1,x2的线性回归模型。并作显著性检验。 运算结果要求写出经验回归方程和显著性检验的方差分析表。(取)
X1
215
250
180
250
180
215
180
215
250
215
215
X2
136.5
136.5
136.5
138.5
139.5
138.5
140.5
140.5
140.5
138.5
138.5
Y
6.2
7.5
4.8
5.1
4.6
4.6
2.8
3.1
4.3
4.9
4.1
SAS程序
data nine_sandian;
/*title '多元回归分析';*/
input y x1 x2 @@;
label y='吸氨量' x1='吸氨时间' x2='底水';
cards;
6.2 215 136.5 7.5 250 136.5 4.8 180 136.5
5.1 250 138.5 4.6 180 138.5 4.6 215 138.5
2.8 180 140.5 3.1 215 140.5 4.3 250 140.5
4.9 215 138.5 4.1 215 138.5
;
proc g3d ;
scatter x2*x1=y/xticknum=6
yticknum=6
zticknum=6
rotate=30
shape='ballon'
size=0.5
color = 'blue'
noneedle;
run;
data nine;
title '多元回归分析';
input y x1 x2 @@;
label y='吸氨量' x1='吸氨时间' x2='底水';
cards;
6.2 215 136.5 7.5 250 136.5 4.8 180 136.5
5.1 250 138.5 4.6 180 138.5 4.6 215 138.5
2.8 180 140.5 3.1 215 140.5 4.3 250 140.5
4.9 215 138.5 4.1 215 138.5
;
proc reg data=nine;
model y=x1 x2/r cli clm;
plot r.*p.;
/*plot y*x1='a' p.*x1='p' u95.*x1='u' l95.*x1='l'/overlay;*/
run;
data nine_reg;
input y x1 x2 @@;
label y='吸氨量' x1='吸氨时间' x2='底水';
cards;
6.2 215 136.5 7.5 250 136.5 4.8 180 136.5
5.1 250 138.5 4.6 180 138.5 4.6 215 138.5
2.8 180 140.5 3.1 215 140.5 4.3 250 140.5
4.9 215 138.5 4.1 215 138.5
;
proc reg data=nine_reg;
model y=x1 x2/p r cli clm;
output out=nine2 p=yp;
plot r.*p.;
plot y*x1 p.*x1 u95.*x1 l95.*x1/overlay;
proc g3grid out=out1;
grid x2*x1=yp/axis1=136.5 to 140.5 by 0.2 axis2=180 to 250 by 2;
proc g3d data=out1;
plot x2*x1=yp/xticknum=10 yticknum=10;
run;
例5.5.4 出钢时所用的盛钢水的钢包,由于钢水对耐火材料的浸蚀,容积不断增大。我们希望找到使用次数与增大的容积之间的关系。对一钢包做试验,测得数据列于下表:
(1) 作出散点图;
(2) 通过变换(化非线性回归为线性回归)求y 关于x 的经验
回归方程.
data gangbao_sandian;
input x y @@;
u=1/x;
v=log(y);
label u='u=1/x' v='v=lny';
cards;
2 6.42 3 8.20 4 9.58 5 9.50 6 9.70 7 10.00 8 9.93 9 9.99
10 10.49 11 10.59 12 10.60 13 10.80 14 10.60 15 10.90 16 10.76
;
proc gplot ;
plot y*x y*x/grid overlay; *原始数据散点折线图;
symbol1 c=blue i=join;
symbol2 c=red v=star;
plot v*u v*u/grid overlay; *变换后散点折线图;
symbol1 c=blue i=join;
symbol2 c=red v=star;
run;
data gangbao_reg;
input x y @@;
u=1/x;
v=log(y);
label u='1/x' v='lny';
cards;
2 6.42 3 8.20 4 9.58 5 9.50 6 9.70 7 10.00 8 9.93 9 9.99
10 10.49 11 10.59 12 10.60 13 10.80 14 10.60 15 10.90 16 10.76
;
proc reg;
model v=u/cli clm;
output out=new2 p=vhat r=resid l95=l95 u95=u95 l95m=lm u95m=um;
proc gplot data=new2;
plot vhat*u v*u l95*u u95*u lm*u um*u /grid overlay legend; *回归预测图;
symbol1 c=red i=join v=star;
symbol2 c=black v=diamond;
symbol3 c=blue i=join;
symbol4 c=blue i=join;
symbol5 c=green i=join;
symbol6 c=green i=join;
run;
例5.5.5 研究光合速率y与比叶重x1、气孔密度x2、叶绿素含量x3之间的关系,试验得到红薯性状观测值的数据如下表,试分析哪个因素对光合速率y影响最大。
data shiyan;
input x1 x2 y;
cards;
215 136.5 6.2
250 136.5 7.5
180 136.5 7.5
250 138.5 5.1
180 139.5 4.6
215 138.5 4.6
250 140.5 3.1
215 138.5 4.9
;
proc glm;(也可用reg)
model y=x1 x2;
run;
判别分析
例6.2.2(例6.1.2)中小企业的破产模型
对21个破产的企业收集它们在破产前两年的年度财务数据,同时对25个财务良好的企业也收集同一时期的数据。数据涉及4个变量:
x1= 现金流量/总债务,
x2= 净收入/总资产,
x3= 流动资产/流动债务,
x4= 流动资产/净销售额。
数据列于下表,1组为破产企业,2组为非破产企业。试建立判别函数,对某个未判企业x=(-0.16,-0.10,1.45,0.51)’进行判别。
data exam6_2_2;
input id g x1 x2 x3 x4;
list;
cards;
1 1 -0.45 -0.41 1.09 0.45
2 1 -0.56 -0.31 1.51 0.16
3 1 0.06 0.02 1.01 0.40
4 1 -0.07 -0.09 1.45 0.26
5 1 -0.10 -0.09 1.56 0.67
6 1 -0.14 -0.07 0.71 0.28
7 1 0.04 0.01 1.50 0.71
8 1 -0.07 -0.06 1.37 0.40
9 1 0.07 -0.01 1.37 0.34
10 1 -0.14 -0.14 1.42 0.43
11 1 -0.23 -0.30 0.33 0.18
12 1 0.07 0.02 1.31 0.25
13 1 0.01 0.00 2.15 0.70
14 1 -0.28 -0.23 1.19 0.66
15 1 0.15 0.05 1.88 0.27
16 1 0.37 0.11 1.99 0.38
17 1 -0.08 -0.08 1.51 0.42
18 1 0.05 0.03 1.68 0.95
19 1 0.01 0.00 1.26 0.60
20 1 0.12 0.11 1.14 0.17
21 1 -0.28 -0.27 1.27 0.51
22 2 0.51 0.10 2.49 0.54
23 2 0.08 0.02 2.01 0.53
24 2 0.38 0.11 3.27 0.35
25 2 0.19 0.05 2.25 0.33
26 2 0.32 0.07 4.24 0.63
27 2 0.31 0.05 4.45 0.69
28 2 0.12 0.05 2.52 0.69
29 2 -0.02 0.02 2.05 0.35
30 2 0.22 0.08 2.35 0.40
31 2 0.17 0.07 1.80 0.52
32 2 0.15 0.05 2.17 0.55
33 2 -0.10 -0.01 2.50 0.58
34 2 0.14 -0.03 0.46 0.26
35 2 0.14 0.07 2.61 0.52
36 2 0.15 0.06 2.23 0.56
37 2 0.16 0.05 2.31 0.20
38 2 0.29 0.06 1.84 0.38
39 2 0.54 0.11 2.33 0.48
40 2 -0.33 -0.09 3.01 0.47
41 2 0.48 0.09 1.24 0.18
42 2 0.56 0.11 4.29 0.44
43 2 0.20 0.08 1.99 0.30
44 2 0.47 0.14 2.92 0.45
45 2 0.17 0.04 2.45 0.14
46 2 0.58 0.04 5.06 0.13
47 . -0.16 -0.10 1.45 0.51
;
proc discrim list /*listerr crosslisterr*/;
class g;
var x1-x4;
run;
例6.3.2 Fisher于1936年发表的鸢尾花(Iris)数据被广泛的作为判别分析的例子。数据是对3种鸢尾花:刚毛鸢尾花(第一组)、变色鸢尾花(第二组)和弗吉尼亚鸢尾花(第三组)各抽取一个容量为50的样本,测量其花萼长x1、花萼宽x2、花瓣长x3、花瓣宽x4,单位为mm,数据列于下表。
ÐòºÅ ×é±ð x1 x2 x3 x4 ÐòºÅ ×é±ð x1 x2 x3 x4 ÐòºÅ ×é±ð x1 x2 x3 x4
1 1 50 33 14 2 51 1 48 30 14 3 101 1 47 32 13 2
2 3 64 28 56 22 52 1 51 38 16 2 102 1 46 31 15 2
3 2 65 28 46 15 53 3 61 30 49 18 103 3 69 32 57 23
4 3 67 31 56 24 54 1 48 34 19 2 104 2 62 29 43 13
5 3 63 28 51 15 55 1 50 30 16 2 105 3 74 28 61 19
6 1 46 34 14 3 56 1 50 32 12 2 106 2 59 30 42 15
7 3 69 31 51 23 57 3 61 26 56 14 107 1 51 34 15 2
8 2 62 22 45 15 58 3 64 28 56 21 108 1 50 35 13 3
9 2 59 32 48 18 59 1 43 30 11 1
展开阅读全文