1、Excel中的单因素方差分析一、目的要求为了解决多个样本平均数差异显著性的测验问题,需要应用方差分析。方差分析是把试验看成一个整体,分解各种变异的原因。从总的方差中,将可能的变异原因逐个分出,并用误差的方法作为判断其他方差是否显著的标准,如果已知变异原因的方差比误差方差大得多,那么,该方差就不是随机产生的,试验的处理间的差异不会是由于误差原因造成的,这时处理的效应是应该肯定的。通过学习Excel中方差分析,掌握基本的分析操作,能够处理实验的数据。二、实验工具Microsoft Excel三、试验方法1、基本模型:变异来源平方和自由度均方F值F(dft,dfe)总变异SSTdfT=nk-1ST2
2、=SST/dfTF=St2/Se2处理间SStdft=k-1St2=SSt/dft误差SSedfe=k(n-1)Se2=SSe/dfe2、例:在五个硼肥试验处理中测得苹果叶内硼含量(ppm),试比较各处理苹果叶内平均含硼量的差异显著性。5个硼肥试验处理中苹果叶内硼含量(ppm)处理叶内硼含量A87691012B414446403836C171614122215D283336292122E4043423944413、操作步骤:在Excel统计中,完全随机试验设计的方差分析,只须经过单因素方差分析即可得出结果,具体步骤如下: 打开Excel,向单元格中输入文字与数字,建立表格; 单击“工具”,在出
3、现的对话框中,选择“数据分析”,选取“方差分析:单因素方差分析”; 单击“确定”,单击“输入区域:”框右边的按钮,用鼠标选中数据,再次单击按钮;其他设置选择为0.05。分组方式:行。点选标志位于第一列。 单击“确定”,即可输出单因素方差分析结果。4、方差分析输出结果:SUMMARY组观测数求和平均方差A6528.6666674.666667B624540.8333313.76667C6961611.6D616928.1666734.96667E624941.53.5差异源SSdfMSFP-valueF crit组间5160.46741290.11794.16911.07E-142.75871组
4、内342.52513.7总计5502.967295、多重比较:由方差分析的结果,采用新复极差测验法,再稍加计算比较处理,即可得出:新复极差测验的LSR值秩次距K23456SSR0.052.923.073.153.223.28SSR0.013.964.144.244.334.39LSR0.054.414.644.764.864.95LSR0.015.986.256.406.546.63喷硼处理均数间的比较处理平均数差异 显著性5%1%EBDCA41.540.828.216.08.7aabcdAABCD6、结论:由方差分析结果F=94.17F0.05=Fcrit=2.76,可知5种喷硼处理间差异显
5、著,并可知除E与B二处理间无极显著差异外,其他均有极显著差异。SPSS中的单因素方差分析一、基本原理单因素方差分析也即一维方差分析,是检验由单一因素影响的多组样本某因变量的均值是否有显著差异的问题,如各组之间有显著差异,说明这个因素(分类变量)对因变量是有显著影响的,因素的不同水平会影响到因变量的取值。二、实验工具SPSS for Windows三、试验方法例一 某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡。在每批灯泡中随机地抽取若干个灯泡测其使用寿命(单位:小时),数据列于下表,现在想知道,对于这四种灯丝生产的灯泡,其使用寿命有无显著差异。 灯泡灯丝12345678甲16001610
6、16501680170017001780乙15001640140017001750丙16401550160016201640160017401800丁1510152015301570164016801.不使用选择项操作步骤(1)在数据窗建立数据文件,定义两个变量并输入数据,这两个变量是:filament变量,数值型,取值1、2、3、4分别代表甲、乙、丙、丁,格式为F1.0,标签为“灯丝”。Hours变量,数值型,其值为灯泡的使用寿命,单位是小时,格式为F4.0,标签为“灯泡使用寿命”。(2)按Analyze,然后Compared Means,然后One-Way Anova的顺序单击,打开“单因
7、素方差分析”主对话框。(3)从左边源变量框中选取变量hours,然后按向右箭头,所选去的变量hours即进入Dependent List框中。(4)从左边源变量框中选取变量filament,然后按向右箭头,所选取的变量folament即进入Factor框中。(5)在主对话框中,单击“OK”提交进行。2.输出结果及分析灯泡使用寿命的单因素方差分析结果ANQVASun of SquaresdfMean SquareFSigBetween Groups39776.46313258.8191.638.209Within Groups178088.9228094.951Total217865.425该表
8、各部分说明如下:第一列:方差来源,Between Groups是组间变差,Within Groups是组内变差,Total是总变差。第二列:离差平方和,组间离差平方和为39776.46,组内离差平方和为178088.9,总离差平方和为217865.4,是组间离差平方和与组内离差平方和相加而得。第三列:自由度,组间自由度为3,组内自由度为22,总自由度为25,是组间自由度和组内自由度之和。第四列:均方,即平方和除以自由度,组间均方是13258.819,组内均方是8094.951.第五列:F值,这是F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性,如果不显著说明模型对指标的变化
9、没有解释能力,F值为1.683.第六列:显著值,是F统计量的p值,这里为0.209.由于显著值0.209大于0.05,所以在置信水平0.95下不能否定零假设,也就是说四种灯丝生产的灯泡,其平均使用寿命美誉显著差异。四、作业表4-3 不同品种授粉对砀山酥梨坐果率影响Table 4-3 the effect of pollinators on fruit set in Chinese pear Dangshansuli授粉品种坐果率(%)平均坐果率(%)差异显著性5%1%紫 酥28.5714.2950.0010.00七月酥40.0028.5755.5641.33新世纪56.5229.0340.54
10、26.67马蹄黄66.6742.5718.1842.86茌 梨39.0250.0052.5442.22满天红52.9442.8646.6756.25鸭 梨66.6742.8640.0072.73黄 冠59.5750.0073.5848.28幸 水52.6371.4350.0066.67圆 黄80.0040.00100.056.25爱甘水75.8675.0072.7347.06红酥脆100.075.0042.1175.00Excel中的直线回归分析一、基本原理回归是研究某种变量受另一种或一种以上变量的影响程度。自变量X是事先设计的,没有误差或者误差很小,依变量Y随X变化而变化,并具有其自身的随机
11、误差。二者之间的依存关系或因果关系,称为回归关系,如果用直线回归方程来表示,一般通式为:y=a+bx。其中:a叫做回归截距;b叫做回归系数或斜率。二、实验工具Microsoft Excel三、试验方法在Excel统计中,任何回归分析都可以用“回归分析工具”来分析,具体方法如下。例:经调查,华农本地早柑橘10个果实的横径和单果重资料,现测验果实横径与单果重是否有显著的相关性。华农本地早柑橘10个果实的横径和单果重果实横径单果重x(cm)y(cm)71156.5965.8794.1445.5626.71066.3884.3486.1855.1551.选取“工具”菜单中“数据分析”,选定“回归”;2
12、.单击“确定”,在“Y值输入区域:”单击右边按钮,用鼠标选取数据,再次单击按钮结束,同理,在“X值输入区域:”选取X列数据,点选标志,置信度为95%,点选残差、标准残差、残差图、线性拟合图、正态概率图。3.单击“确定”。即可得出回归分析结果。4.回归输出结果:SUMMARY OUTPUT回归统计Multiple R0.97249R Square0.945738Adjusted R Square0.938955标准误差6.089802观测值10PROBABILITY OUTPUT百分比排位y(cm)54415482555356245795585658875968510695115方差分析dfSS
13、MSFSignificance F回归分析15170.9145170.914139.43152.42E-06残差8296.685537.08569总计95467.6RESIDUAL OUTPUT观测值预测 y(cm)残差标准残差1108.40586.5942491.14852296.26061-0.26061-0.04539379.25742-0.25742-0.04483437.963946.0360571.051299571.97033-9.97033-1.736536101.11874.8813330.850181791.40256-3.40256-0.59262842.8225.178
14、0010.901852986.5445-1.5445-0.269011062.25422-7.25422-1.26347Coefficients标准误差t StatP-valueIntercept-61.626211.96367-5.151110.000873x(cm)24.290282.05708411.808112.42E-06Lower 95%Upper 95%下限 95.0%上限 95.0%-89.2145-34.0379-89.2145-34.037919.5466329.0339219.5466329.03392回归输出正态概率图 回归输出最佳适配曲线图回归输出残差分析图5.结论:
15、由输出结果可知:a=-61.63,b=24.29。所以其回归方程为:y=24.29x-61.63。再由输出结果中的方差分析可知,Significance F=2.42E-06=0.05,说明果实横径与果重之间的回归关系显著。而由结果中回归系数的t Stat检验可知,截距a:P-value=0.000873132=0.05;斜率b:P-value=2.42386E-06=0.05,说明回归系数均达到显著水平。因此回归方程是可靠有效的。Excel中的成对数据测验(t-检测)一、基本原理农业试验各处理结果之间总会出现一定的差异,这差异的来源需要进行判断,才能获得可靠结论,这判断称为显著性测验。二、实
16、验工具Microsoft Excel三、试验方法成对数据测验时农业统计中较常见的一种,下面就这一类型的Excel统计介绍如下。1.例:如下表数据,现计算短枝型与普通型枝皮率有无明显差异。元帅苹果短枝型与普通型枝皮率(%)地点序号短枝型普通型154.3537.5243.6231.78340.7920.83432.3520.83539.5832.35641.3435.34737.5327.67838.4634.82935.5523.832.操作步骤:在单元格中输入原始数据和文字;单击菜单栏的“工具”,再单击“数据分析”,选择“t-检验:平均值的成对二样本分析”,单击“确定”。在变量1的区域选择短枝
17、型的数据,在变量2的区域选择普通型的数据,单击确定,即可得出结果。t-检验: 成对双样本均值分析短枝型普通型平均40.3966729.43889方差38.3755540.69136观测值99泊松相关系数0.667238假设平均差0df8t Stat6.406089P(T=t) 单尾0.000104t 单尾临界1.859548P(Tt双尾临界=2.31,因此两均值差异显著。同理,可以设置显著水平为0.01时,进行测验。SPSS中的多因素方差分析一、基本原理在多因素的试验中,使用方差分析而不用t检验的一个重要原因在于前者效率更高,本实验所讲的单因变量多因素方差分析是对于一个独立变量是否受一个或多个
18、因素或变量影响而进行的回归分析和方差分析。这个过程可以检验不同组之间均数由于受不同因素影响是否有差异的问题,即可以分析每一个因素的作用,也可以分析各因素之间的交互作用,还可以分析协方差和协方差交互作用。二、实验工具SPSS for Windows三、试验方法多因素方差分析.pdf四、作业:某生产队在12块面积相同的大豆试验田上,用不同方式施肥,大豆亩产(斤)的数据如下表编号氮肥(斤)磷肥(斤)亩产(斤)100400200390300420404450504460604455760430860420960440106456011645701264575氮肥用N表示,磷肥用P表示,两个因子各取两水
19、平。为了探明氮肥作用大,还是磷肥作用大,进行方差分析,写出主要结果。1.操作步骤(1)输入数据集,因素变量有两个,即N和P,均有两水平,0表示不用该肥料,1表示用该肥料;因变量:output(大豆亩产),单位为斤。(2)在“Analyze”菜单中打开“General Linear Models”子菜单,从中选择“Univariae”命令,打开“多因素方差分析”主窗口。(3)指令分析变量。选择因变量output进入Dependent框。选择因素变量N和P进入Fixed Factors框。(4)在主对话框中单击“Cintrasts”按钮,打开对比方法对话框,在该对话框下如下操作:在Factor框中
20、选择N。在Change Contrast栏内,单击Contrast参数框内向下箭头,打开比较方法表,选择Simple项,再选择First项作为比较参考类,然后单击“change”,在factors框中显示N。用相同方法指定P。单击“continue”按钮回到主对话框。(5)在主对话框中单击“option”按钮,打开选项对话框,作如下操作:在Factors框中选择因素变量N、P、NP ,单击向右箭头将因素变量送入Display Means For框中。在display栏内选中Spread vs.level plot和residual plot复选框单击OK按钮回到主对话框。SPSS中的多因变量方
21、差分析(Multivariate)比较5个品种大麦产量,连续二年观测的单产量作为指标,用三个不同地区的产量作为三次重复。品种第一年产量第二年产量1818111471001120992105822142116212162312080315111231249641108741921484141126598845146108512576SPSS中正交设计的方差分析一、实验工具SPSS for Windows二、试验方法操作步骤(1)输入数据集,五个因素分别用A、B、C、D、E表示,每因素均有两水平,试验结果用result表示。(2)在“Analyze”菜单中打开“general linear mod
22、els”子菜单,从中选择“univariate”命令,打开“多因素方差分析”主窗口。(3)指定分析变量:选择因变量results进入dependen框。选择因变量A、B、C、D、E进入fixed factors框。(4)在主对话框中单击“model”按钮,打开模型对话框,在对话框中如下操作:选中custom单选项。指定要求分析的五个主效应。单击“continue”按钮,返回主对话框。(5)在主对话框中单击“options”按钮,打开选项对话框,在该对话框中如下操作:在factors and factor框中选择因素变量A、B、C、D、E,单击向右箭头将因素变量送入display Means f
23、or 框。单击“continue”按钮,返回主对话框。(6)单击“OK”按钮完成。表47 九种不同培养基对鬼怒甘叶片愈伤组织诱导效果Tab.47 the effect of different culture media on the callus induction from leaf of Kunouwase试验编号BA(mg/L)2,4D(mg/L)IBA(mg/L)接种数(个)死亡数(个)愈伤组织(个)愈伤率(%)Y13.0 (1)0.2 (1)0.5 (1)18216100.00Y23.0 (1)0.1 (2)0.3 (2)1821381.25Y33.0 (1)0.0 (3)0.0
24、(3)1801161.11Y42.0 (2)0.2 (1)0.0 (3)1821593.75Y52.0 (2)0.1 (2)0.5 (1)2031058.82Y62.0 (2)0.0 (3)0.3 (2)192952.94Y71.0 (3)0.2 (1)0.3 (2)20119100.00Y81.0 (3)0.1 (2)0.0 (3)1831066.67Y91.0 (3)0.0 (3)0.5 (1)182850.00表48 方差分析表Tab.48 list of variance analysisDependent Variable:愈伤率SourceType III Sum of Squar
25、esdfMean SquareFSig.Partial Eta SquaredNoncent. ParameterObserved Power(a)Corrected Model3257.996(b)6542.999178.228.006.9981069.3651.000Intercept49068.525149068.52516105.659.0001.00016105.6591.000BA238.0252119.01339.063.025.97578.127.8652,4D2912.71821456.359478.018.002.998956.0351.000IBA107.253253.6
26、2717.602.054.94635.203.606Error6.09323.047Total52332.6149Corrected Total3264.0898a Computed using alpha = .05, b R Squared = .998 (Adjusted R Squared = .993)表49 单因素统计量表Tab.49 the list of oneway analysis of variance激素种类Hormone处理水平Treatment愈伤率平均值Mean标准误Std. Error值信区间95% Confidence Interval下限Lower Boun
27、d上限Upper BoundBA1.00 (3.0 mg/L)80.7871.00876.45185.1232.00 (2.0 mg/L)68.5051.00864.16972.8413.00 (1.0 mg/L)72.2221.00867.88676.5582,4D1.00 (0.2 mg/L)97.9171.00893.581102.2532.00 (0.1 mg/L)68.9131.00864.57773.2493.00 (0.0 mg/L)54.6841.00850.34859.020IBA1.00 (0.5 mg/L)69.6081.00865.27273.9442.00 (0.3
28、mg/L)78.0641.00873.72882.4003.00 (0.0 mg/L)73.8431.00869.50778.179从表48中可以看出,在0.05的水平下,BA,2,4D对鬼怒甘品种草莓叶片形成愈伤组织是显著的,在同等条件下,可以优先采用他们的最好水平。从表49可以看出BA的最好水平是水平1(3.0 mg/L),2,4D的最好水平也是水平1(0.2 mg/L),IBA的最好水平是水平2(0.3 mg/L)。从以上分析我们得出该正交设计的最佳诱导叶片愈伤组织的培养基是:MS+BA 3.0 mg/L+2,4D 0.2 mg/L+IBA 0.3 mg/L;若考虑到节省材料,我们还可以
29、选用诱导培养基:MS+BA 3.0 mg/L+2,4D 0.2 mg/L。作业:例:为了提高某种试剂产品的收率(指标),考虑如下几个因素对其影响A:反应温度1(50)2(70)B:反应时间1(1h)2(2h)C:硫酸浓度1(17%)2(27%)D:硫酸产地1(天津)2(上海)E:操作方式1(搅拌)2(不搅拌)把这5个因素放在表的5列上,得到如下实验设计与结果。试验编号ABCDE实验结果1111116521112274312212714122217352121270621221737221116282212269SPSS中的多因变量线性模型方差分析一、基本原理多因变量线性模型的方差分析属于多元方
30、差分析,与一元统计学中方差分析类似,多元样本资料也可以进行方差分析。二者的差别在于一元方差分析中要分析的指标是一元随机变量,多元方差分析中要分析的指标是多元随机变量。二、实验工具SPSS for Windows三、试验方法要比较五个品种大麦产量,用连续两年观测的单产量作为指标,用三个不同地区的产量作为三次重复,得到下表的数据。品种重复123A1811471208110099A21051421218211662A31201511248011296A411019214187148126A5981461258410876其中每个品种上面一排数字是第一年产量,下面一排是第二年产量,希望检查各品种之间是
31、否有显著差异。这里指标是两年的单产量,把它作为二元随机变量,影响指标的因素只有一个(品种),此因素分成五个等级(水平),进行了三次重复观测,因此这是一个多元方差分析的问题。1 操作步骤(1)输入数据集,用first表示第一年产量,second表示第二年产量,kind表示品种,它有五个水平。(2)在“Analyze”菜单中打开“General Linear Models”子菜单中,从中选择“Multivariate”命令,打开“多因变量方差分析”主窗口。(3)指定分析变量将变量first、second移入Dependent框,作为因变量。将变量kind移入Fixed Factors框,作为因素变量。(4)在主对话框中,单击【Contrast】按钮,打开相应的对话框,在该框中进行如下操作:在Factors框中选择kind变量在Change Contrast栏内,单击Contrast参数框内向下箭头,展开比较方法表,选择Simple项,再选择First项作为比较参数考类,然后单击【Change】按钮。单击【Continue】按钮,返回主对话框。(5)单击【OK】按钮结束。