1、正交试验设计对于单因素或两因素试验,因其因素少,试验的设计、实施与分析都比较简单。但在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因实验条件的限制而难于实施。正交试验设计就是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。一、正交试验设计的概念及原理1、 正交试验设计的基本概念 正交试验设计是利用正交表来安排与分析多因素试验的一种设计方法。它是由试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。 例如,一个三因素三水平试验,各因素的水平之间全部可能组合有2
2、7种。全面进行试验可以分析各因素的效应,也可以选出最优水平组合。但全面试验包含的水平组合数数多,工作量大。在有些情况下无法完成。 若试验的主要目的是寻求最优水平组合,则可利用正交表来设计安排试验。 正交试验设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 如对于上述3因素3水平试验,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 2、 正交试验设计的基本原理 在试验安排中,每个因素在研究的范围内选几个水平,就好比在选优区内打上网格,如果网上的每个点都做试验,就是全面试验
3、。如上例中,3个因素的选优区可以用一个立方体表示(图10-1),3个因素各取3个水平,把立方体划分成27个格点。若27个网格点都试验,就是全面试验。3因素3水平的全面试验水平组合数为33=27,4因素3水平的全面试验水平组合数为34=81,5因素3水平的全面试验水平组合数为35=243,这在科学试验中是有可能做不到的。正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点来进行试验。图10-1图10-1中标有试验号的九个点,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即:(1)A1B1C1;(2)A2B1C2;(3)A3B1C3;(4)A1B2C2;(5)A
4、2B2C3;(6)A3B2C1;(7)A1B3C3;(8)A2B3C1;(9)A3B3C2. 上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。对于A、B、C3个因素来说,是在27个全面试验中选择9个试验点仅是全面试验的三分之一。从图10-1中可以看到,9个试验点在选优区中分布是均衡的,在立方体的每个平面上,都恰是3个试验点:在立方体的每条线上也恰有一个试验点。9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映选优区内的基本情况。3、 正交表及其基本性质 正交表由于正交设计安排试验和分析试验结果都要用到正交表,因此,我们先对正交表作一介绍。常用的
5、正交表已由数学工作者制定出来,供进行正交设计师选用(详见有关参考书)。正交表记号为La(bc),其中L代表正交表,a表示试验的次数即行数,b表示因素的水平数,c表示因素的个数即列数。 正交表的基本性质l 正交性任一列中,各水平都出现,且出项的次数相等;任两列之间各种不同水平的所有可能组合都出现,且出现的次数相等;l 代表性一方面,任一列的各水平都出现,使得部分试验中包括了所有因素的所有水平;任两列的所有水平组合都出现,使任意两因素间的试验组合为全面试验。另一方面,由于正交表的正交性,正交试验的试验点必然均衡地分布在全面试验点中,具有很强的代表性。因此,部分试验寻找的最优条件与全面试验所找的最优
6、条件,应有一致的趋势。l 综合可比性任一列的各水平出现的次数相等;任两列间所有水平组合出现次数相等,使得任一因素各水平的试验条件相同。这就保证了在每列因素各水平的效果中,最大限度地排除了其他因素的干扰。从而可以综合比较该因素不同水平对试验指标的影响情况。根据以上特性,我们用正交表安排的试验,具有均衡分散和整齐可比的特点。所谓均衡分散,是指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均匀的。由图10-1可以看出,在立方体中,任一平面内都包含3个“()”,任一直线上都包含1个“()”,因此,这些点代表性强,能够较好地反映全面试验的情况。整齐可比是指每一个因素的各水平间具有可比性。因为正
7、交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比较某因素不同水平时,其它因素的效应都彼此抵消。如在A、B、C3个因素中,A因素的3个水平A1、A2、A3条件下各有 B、C的 3个不同水平,即:(1)A1B1C1;(2)A2B1C2;(3)A3B1C3;(4)A1B2C2;(5)A2B2C3;(6)A3B2C1;(7)A1B3C3;(8)A2B3C1;(9)A3B3C2.在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式不同,但B、C皆处于同等地位,当比较A因素不同水平是,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消。所以A因素3个水平间具
8、有综合可比性。同样,B、C因素3个水平间亦具有综合可比性。正交表的三个基本性质中,正交性是核心,是基础,代表性和综合可比性是正交性的必然结果。二、 试验方案设计(以阿司匹林合成条件研究为例)1、问题的提出及试验目的 阿司匹林是水杨酸类解热、镇痛药的代表,为医药史上三大经典药物之一,至今仍广泛用于治疗伤风、感冒、头痛、神经痛、关节痛、急性和慢性风湿痛及类风湿痛等。选用不同的催化剂或改变其反应条件,都会对其合成产品的后处理、质量、产率、成本有着重要的影响,也是一直以来造成阿司匹林产率不高的主要原因。 本试验的目的是应用正交试验法,找出合适的催化剂及其生产条件,以提高阿司匹林的产率,从而实现安全、无
9、毒、绿色化、经济简捷的合成路线,得到高产率、高纯度产品。2、简要工艺过程 水杨酸+醋酸酐 酰化反应 结晶 抽滤 粗产品 重结晶 红外干燥 阿司匹林3、试验方案v 指标 阿司匹林产率=(实际产物质量/理论产物质量)*100%,产率越高越好。 残余水杨酸含量不能超标,用FeCl3的稀溶液进行定性检验,水杨酸与FeCl3显紫色反应。v 选因素、定水平,列因素水平表根据专业知识、以往的研究结论和经验,从影响试验指标的诸多因素中,通过因果分析筛选出需要考察的试验因素。一般确定试验因素时,应以对试验指标影响大的因素、尚未考察过的因素、尚未完全掌握其规律的因素为先。试验因素选定后,根据所掌握的信息资料和相关
10、知识,确定每个因素的水平,一般以2-4个水平为宜。对主要考察的试验因素,可以多取水平,但不宜过多(6),否则试验次数骤增。因素的水平间距,应根据专业知识和已有的资料,尽可能把水平值取在理想区域。对本试验分析,影响阿司匹林的因素很多,如催化剂的种类、催化剂的用量、反应的温度、反应的时间、重结晶溶剂等等。经过前期的摸索性实验,我们发现催化剂的种类、反应的温度、反应的时间、催化剂的用量(催化剂的用量为水杨酸质量的百分比)和原料配比五个因素对本试验的产率影响较大,因此,选择这四个因素进行试验,分别记作A、B、C、D、E,进行五因素正交试验,以便选出有效优化的生产条件。各因素均取四个水平,列因素水平表(
11、见表1)表1水平因素催化剂A反应温度()B反应时间(min)C催化剂的用量D原料配比E1磷酸50301.5%1:12草酸60402%1:1.53分子筛70502.5%1:24离子液体80603%1:2.5v 选择合适的正交表正交表的选择是正交试验设计的首要问题。确定了因素及其水平后,根据因素、水平的多少来选择合适的正交表。 正交表的选择原则是在能够安排下试验因素和交互作用的前提下,尽可能选用较小的正交表,以减少试验次数。 一般情况下,试验因素的水平数应等于正交表中的水平数;因素个数应不大于正交表的列数;各因素的自由度之和要小于所选正交表的总自由度,以便估计试验误差。若各因素及交互作用的自由度之
12、和等于所选正交表总自由度,则可采用有重复正交试验来估计试验误差。正交表选择依据:列:正交表的列数c因素所占列数+交互作用所占列数+空列。自由度:正交表的总自由度(a-1)因素自由度+交互作用自由度+误差自由度。 本试验有五个四水平因素,且不考虑因素间的交互作用,依据以上原则,我们可以知道试验的次数应该大于等于15,同时又必须符合正交表的正交性,因此,试验的次数应该为16次,故宜选用L16(45)正交表。v 表头设计所谓表头设计,就是把试验因素和要考察的交互作用分别安排到正交表的各列中去的过程。在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按所选正交表的交互作用列表安排各因素
13、与交互作用,以防止设计“混杂” 。本试验中不考虑交互作用,可将催化剂种类(A)、反应温度(B)、反应时间(C)和催化剂用量(D)、原料配比(E)依次安排在L16(45)的第一、二、三、四、五列上(见表2)表2 列号12345因素ABCDEv 试验方案 按下列方案分别进行试验,记录试验结果(见表3)。表3表头设计A BCDE试验结果(产率%)试验号列号1234511111121222231333341444452123462214372341282432193134210324311133124123421313414231442314154324116441324、实验部分 主要试剂和仪器试剂
14、水杨酸,醋酸酐,95%乙醇,10%FeCl3溶液,饱和NaHCO3溶液,6mol/L盐酸,冰蒸馏水,85%磷酸,草酸,分子筛,酸性离子液体玻璃仪器试管,烧杯,玻璃棒,圆底烧瓶(100mL),球形冷凝管,布氏漏斗,锥形瓶,温度计,提勒熔点管仪器设备电子天平,磁力搅拌器,水浴锅,减压过滤装置,红外干燥箱,核磁共振谱(NMR),红外光谱(IR) 合成原理阿斯匹林为白色晶体,熔点135,微溶于水(37时,1g/100g H2O)。在18世纪,人们从柳树皮中提取乙酰水杨酸这种物质,并注意到这种物质可以作为镇痛剂、退热药和抗风湿病药。阿司匹林是一种广泛使用的解热、镇痛与抗炎药物。1847年Kolbe首次合
15、成了乙酰水杨酸,1899年合成的乙酰水杨酸正式用于临床。近年来,科学家还新发现了阿司匹林具有预防心脑血管疾病的作用。乙酰水杨酸是由水杨酸和醋酸酐合成的,由于水杨酸是一个既具酚羟基又具羧基的双官能团化合物,因此能与乙酸酐作用,得到乙酰水杨酸。反应是水杨酸的酚羟基在酸性条件下的乙酰化。在反应的过程中会形成少量的水溶性低的水杨酸聚合物,这是引起变态反应的主要杂质组分。产物用乙酸乙酯重结晶纯化。未反应的水杨酸用FeCl3稀溶液检验,形成深紫色溶液。乙酰水杨酸可以通过熔点、红外光谱和核磁共振谱鉴定。反应的方程式为: 制备方法l 酰化反应在100mL干燥的圆底烧瓶中加入设计好的水杨酸、乙酸酐配料比和相应的
16、催化剂,采用搅拌使水杨酸尽量溶解,然后在水浴上加热,水杨酸立即溶解。保持圆底烧瓶内温度在相应的试验温度。安装回流装置水浴加热,控制温度,同时保持低速匀速搅拌, 规定实验时间后停止加热。反应液稍微冷却,缓慢加入一定量的冰水用来水解过量的乙酸酐,冷却至室温,再将反应液倒入有少量冰水的锥形瓶中,即有乙酰水杨酸析出,将锥形瓶置于冰水浴中冷却,使结晶完全析出。l 产品的提纯减压过滤:用滤液淋洗锥形瓶,直至所有晶体被收集到布氏漏斗,每次用少量冷水洗涤结晶3次,减压过滤,即得到粗产物。产品重结晶:将粗产物转移至烧杯,在搅拌下加入饱和碳酸氢钠溶液,直至无二氧化碳产生。减压过滤,用少量水冲洗漏斗,除去少量的白色
17、聚合物,合并滤液,倒入预先盛有浓10mL浓盐酸和20mL水的烧杯中,使溶液pH呈弱酸性,此时即有阿司匹林析出。将烧杯放置冰水浴冷却,待结晶析出完全,减压过滤,用少量冷水洗涤结晶23次,抽干水分,产物红外干燥后称重,可以得到产物阿司匹林。l 产物的检验 (1)取2支试管,各加入1mL无水乙醇,1支加入0.05g的水杨酸,1支加入0.05g的产品。振摇使之溶解。然后各加入23滴10% FeCl3 溶液,记录实验结果。如果没有颜色反应现象,表明产物中无水杨酸。(2) 另外可以测定产品的熔点检验其纯度。乙酰水杨酸易受热分解,因此熔点不是很明显。它的熔点为135,分解温度为128135。在测定熔点时,可
18、先将载热体加热至120左右,然后放入样品测定。l 产品质量与表征方法 产品为白色针状晶体,难溶于水,易溶于乙醇。红外光谱显示在1761.7cm-1处有C=O吸收峰,1191.49cm-1处有C-O-C吸收峰,可见乙酰基已生成,O-酰化反应得到了阿司匹林。5、 试验结果分析v 分清各因素及其交互作用的主次顺序,分清哪个是主要因素,哪个是次要因素;v 判断因素对试验指标影响的显著程度;v 找出试验因素的优水平和试验范围内的最优组合,即试验因素各取什么水平时,试验指标最好;v 分析因素与试验指标之间的关系,即当因素变化时,试验指标是如何变化的。找出指标随因素变化的规律和趋势,为进一步试验指明方向;v
19、 了解各因素之间的交互作用情况;v 估计试验误差的大小。 直观分析法极差分析法 计算简便,直观,简单易懂,是正交试验结果分析最常用方法。Rj为第j列因素的极差,反映了第j列因素水平波动时,试验指标的变动幅度。Rj越大,说明该因素对试验指标的影响越大。根据Rj大小,可以判断因素的主次顺序。Kjm为第j列因素m水平所对应的试验指标和,kjm为Kjm平均值。由kjm大小可以判断第j列因素优水平和优组合。a、确定试验因素的优水平和最优水平组合 分析A因素各水平对试验指标的影响。根据正交设计的特性,对A1、A2、A3、A4来说,四组试验的试验条件是完全一样的(综合可比性),可进行直接比较。如果因素A对试
20、验指标无影响时,那么kA1、kA2、kA3、kA4应该相等。如果kA1、kA2、kA3、kA4不相等。说明,A因素的水平变动对试验结果有影响。因此,根据kA1、kA2、kA3、kA4的大小可以判断A1、A2、A3、A4对试验指标的影响大小。由于试验指标为产率,若kA2kA3kA1kA4,所以可断定A2为A因素的优水平。 同理,可以计算并确定B、C、D因素的优水平。b、确定因素的主次顺序 根据极差Rj的大小,可以判断各因素对试验指标的影响主次。极差越大的,该因素对产率的影响越大,反之越小。c、绘制因素与指标趋势图 以各因素水平为横坐标,试验指标的平均值(kjm)为纵坐标,绘制因素与指标趋势图。由
21、因素与指标趋势图可以更直观地看出试验指标随着因素水平的变化而变化的趋势,可为进一步试验指明方向。最后得出试验的最优组合和次优组合。 方差分析极差分析法简单明了,通俗易懂,计算工作量少便于推广普及。但这种方法不能将试验中由于试验条件改变引起的数据波动同试验误差引起的数据波动区分开来,也就是说,不能区分因素各水平间对应的试验结果的差异究竟是由于因素水平不同引起的,还是由于试验误差引起的,无法估计试验误差的大小。此外,各因素对试验结果的影响大小无法给以精确的数量估计,不能提出一个标准来判断所考察因素作用是否显著。为了弥补极差分析的缺陷,可采用方差分析。方差分析基本思想是将数据的总变异分解成因素引起的
22、变异和误差引起的变异两部分,构造F统计量,作F检验,即可判断因素作用是否显著。a、 偏差平方和 Ij、IIj、IIIj、IVj分别表示第j列中1,2,3,4水平对应的试验结果之和。 总偏差平方和各列因素偏差平方和+误差偏差平方和。b、自由度 f总=试验的次数-1;f因=因素的水平数-1。c、方差 A因素的方差=A因素的偏差平方和/A因素的自由度 误差的方差=误差的偏差平方和/误差的自由度d、构造F统计量 e、列方差分析表,作F检验当FAF0.01(f1,f2)时,说明该因子水平的改变,对试验结果有高度显著地影响,记作*。当F0.01(f1,f2)FAF0.05(f1,f2)时,说明该因子水平的改变,对试验结果有显著地影响,记作*。当F0.05(f1,f2)FAF0.10(f1,f2)时,说明该因子水平的改变,对试验结果有一定的影响,记作*-。查表可得F0.01(f1,f2)、F0.05(f1,f2)、F0.10(f1,f2)的值。6、 验证试验结果 经结果分析得出最优生产条件,进行最优试验条件的验证。7、 结论 通过了验证试验,最后可以得出结论。