1、响应面设计与实验数据处理.响应面优化法响应面优化法(相应曲面法;ResponseSurfaceMethodology,RSM),是20世纪90年代初西方所兴起的一种实验统计方法。响应曲面等值线的分析寻求最优工艺参数,将复杂的未知的函数关系,在小区域内用简单的一次或二次多项式模型来拟合因素与响应值之间函数关系的一种统计方法。适宜于解决非线性数据处理的相关问题。囊括了试验设计、建模、检验模型适合性、寻求最佳组合条件等众多实验和统计技术;通过对过程的回归拟合和响应曲面与等高线的绘制、可方便地求出响应于各因素水平的响应值。在各因素水平的响应值的基础上,找出预测的响应最优值以及相应的实验条件。前提:设计
2、的实验点应包括最佳的实验条件,如果实验点的选取不当,使用响应面优化法是不能得到很好的优化结果的。因而,在使用响应面优化法之前,应当确立合理的实验的各因素与水平。.响应面即回归的正交试验设计,考虑了实验随机误差;可以在因素的试验范围内选择适当的试验点,用较少的试验建立一个精度高,统计性质好的回归方程,并能解决试验优化问题。所获得的预测模型是连续的,与正交实验相比,其优势是:在实验条件寻优过程中,可以连续的对实验的各个水平进行分析,而正交实验只能对一个个孤立的试验点进行分析。正交试验设计所得到的优方案只能限制在已定的水平上,而不是一定试验范围内的最优方案;回归分析可以对结果进行预测和优化,但只能被
3、动的处理和分析。两者的优势结合起来,有合理的试验设计和较少的试验次数,建立有效的数学模型。许多试验设计与优化方法,特别是在做回归分析过程中,都未能给出直观的图形,因而也不能凭直觉观察其最优化点,虽然能找出最优值,但难以直观地判别优化区域。响应面分析是将体系的响应(如萃取化学中的萃取率)作为一个或多个因素(如萃取剂浓度、酸度等)的函数,运用图形技术将这种函数关系显示出来,以供我们凭借直觉的观察来选择试验设计中的最优化条件。.响应面设计模型种类u中心组合设计(CentralComposite,包括通用旋转组合设计、二次组合设计等)uBOX设计(Box-Behnken设计)u二次饱和和D-最优设计(
4、D-optimal设计)u均匀设计u田口设计u.可以进行响应面分析的实验设计有多种,比如Plackett-Burman(PB)、CentralCompositeDesign(CCD)、Box-BehnkenDesign(BBD)。最常见的是CCD与BBD。主要以BBD为例说明Design-Expert的使用注:选用的模型不同,设计方案也不同,所需做实验的次数也就不同的.二因素响应面分析 在化学量测实践中,一般不考虑三因素及三因素以上间的交互作用。因此假设二因素响应(曲)面的数学模型为二次多项式模型。通过次测量试验(试验次数应大于参数个数,一般认为至少应是它的倍),以最小二乘法估计模型各参数,从
5、而建立模型;求出模型后,以两因素水平为坐标和坐标,以相应的响应为坐标作出三维空间的曲面(这就是因素响应曲面)。应当指出,上述求出的模型只是最小二乘解,不一定与实际体系相符,也即,计算值与试验值之间的差异不一定符合要求。因此,求出系数的最小二乘估计后,应进行检验。一个简单实用的方法就是以响应的计算值与试验值之间的相关系数是否接近于或观察其相关图是否所有的点都基本接近直线进行判别。应当指出,上述求出的模型只是最小二乘解,不一定与实际体系相符,也即,计算值与试验值之间的差异不一定符合要求。因此,求出系数的最小二乘估计后,应进行检验。一个简单实用的方法就是以响应的计算值与试验值之间的相关系数是否接近于
6、或观察其相关图是否所有的点都基本接近直线进行判别。.响应面分析过程要构造响应面并进行分析以确定最优条件或寻找最优区域,首先必须通过试验获取大量的测量数据,并建立一个合适的数学模型(建模),然后再用此数学模型作图。建模最常用和最有效的方法之一就是多元线性回归方法。对于非线性体系可作适当处理化为线性形式。设有个因素影响指标取值,通过试验测量,得到组试验数据。假设指标与因素之间的关系可用线性模型表示,则可将各系数写成矩阵式。应用最小二乘法即可求出模型参数矩阵,将矩阵代入原假设的回归方程,就可得到响应关于各因素水平的数学模型,进而可以图形方式绘出响应与因素的关系图。模型中如果只有一个因素(自变量),响
7、应(曲)面是二维空间中的一条曲线;当有两个因素时,响应面是三维空间中的曲面。.响应面分析实例 在多因素数量处理试验的分析中,可以分析试验指标(依变量)与多个试验因素(自变量)间的回归关系,这种回归可能是曲线或曲面的关系,因而称为响应面分析。例如农作物产量与N、P、K的施肥量有关,可以通过回归分析建立产量与施肥要素间的回归关系,从而求得最佳施肥配方。.例1、有一个大麦氮磷肥配比试验,施氮肥量为每亩尿素0,3,6,9,12,15,18kg 7个水平,施磷肥量为每亩过磷酸钙0,7,14,21,28,35,42kg 7个水平,共49个处理组合,试验结果见表1,试作产量对于氮、磷施肥量的响应面分析。.对
8、于表1的数据可以采用二元二次多项式拟合,那么产量可表示为:yij=b0+b1Ni+b2Pj+b3NiPj+b4Ni2+b5Pj2+ij 其中Ni、Pj、ij 分别表示N、P施用量和误差,按此模型的方差分析见表2。从表2结果看,b2和b3这两个偏回归系数不显著,应该将模型缩减,逐步去掉不显著的回归系数,结果见表3。得到的模型为:yij=b0+b1Ni+b2Pj+b4Ni2+b5Pj2+ij.该模型的回归变异占总变异的98%,因此可以较好地说明施用N、P对产量的影响。二元二次多项式回归系数及其显著性检验见表4使用该模型分析的结果为表3,从表3中可以看出b1、b4、b5达到极显著水平,b2接近达到显
9、著性,只有b3达不到显著水平。.图1 大麦产量对于氮、磷肥的响应面图.用于响应面设计和分析的软件仅可以处理仅可以处理实验数据,实验数据,不可以进行不可以进行方案设计方案设计.Design-ExpertDesign-Expert是全球顶尖级的实验设计软件,最容易使用、功能最完整、界面最具亲和力的软件。在已经发表的有关响应曲面(RSM)优化试验的论文中,Design-Expert是最广泛使用的软件。PlackettBurman(PB)、CentralCompositeDesign(CCD)、Box-BehnkenDesign(BBD)是最常用的实验设计方法。以BBD为例说明Design-Exper
10、t的使用,CCD,PB与此类似。.打开design expert软件,进入主界面,然后点击file,点击new design选项卡创建一个新的试验设计工程文件。.RSM,找到理想过程,达到最佳性能,点击点击Response Surface选项卡,进入响应面试验设计。选项卡,进入响应面试验设计。因子设计,屏蔽无关因素,指出重要因素配方设计,找到最佳配方组合设计,结合过程变量,混合各组成和分类的因素.1.1ResponseSurfaceMethods(RSM)响应曲面Central Composite:中心组合设计:中心组合设计 Box-Behnken:Box-Behnken 设计设计OneFac
11、tor单因子设计Miscellaneous混杂设计Optimal最优设计User-Definded用户自定义HistoricalData历史数据1.2FactorialDesigns2-LevelFactorial2水平因子设计IrregularFraction不规则因子设计Generalfactorial普通因子设计Optimal最优设计Plackett-burmanPlackett-burman设计Min-RunResVMin-RunResIVTaguchiOA田口自动设计法1.3MixtureDesignSimplexLattice单纯形格子设计SimplexCentroid单纯型重心设
12、计Screening筛选设计Optimal最优设计User-Defined用户自定义HistoricalData历史数据1.4CombinedDesignsOptimal最优设计User-Defined用户自定义.Box Behnken(Design-Expert8.05b)打开Design-Expert软件新建Design选择响应面设计选用模型(BoxBehnken)选择因素个数,输入因素水平所对应的原始数据选择响应值并输入试验数据结果分析:得出二次回归方程及图形例题:某产品的得率与反应温度例题:某产品的得率与反应温度x1(70100 ),反应时间,反应时间x x2 2(1 14h)及某反应
13、物含量及某反应物含量x3(3060%)有关,不考虑因素)有关,不考虑因素间的交互作用,选用正交表间的交互作用,选用正交表L8(27)进行一次回归正交试验,)进行一次回归正交试验,并多安排并多安排3次零水平试验,试验结果依次为(次零水平试验,试验结果依次为(%):):12.6,9.8,11.1,8.9,11.1,9.2,10.3,7.6,10.0,10.5,10.3。(1)用一次回归正交试验设计求出回归方程;)用一次回归正交试验设计求出回归方程;(2)对回归方程和回归系数进行显著性检验;)对回归方程和回归系数进行显著性检验;(3)确定因素主次和最优方案。)确定因素主次和最优方案。.考察因素名称选
14、择要考察的因素数量实验中的绝对因素(默认值为0)因素单位因素最高值因素最低值主要用于以下两种情况:1、实验需要分两天完成,两天中其他不可控因素的变化会影响实验,就可以设置两个Block;2、实验分为两部分完成,一部分在甲实验室完成,另一部分在乙实验室完成。默认值,中点实验每个BLOCK重复次数默认值,本次试验分几个区块进行该处为响应面设计的几种方法,各种方法有自己的特点,适用于不同数据的处理(比如:PB设计主要是筛选显著变量)。最常用的就是BOX-BEHNKEN设计法。设置完后,点击Continue.BLOCK的含义例如:实验需要分两天完成,那么两天中因为其他不可控制因素的变化可能会对试验造成
15、影响,那么就可以设置2个BLOCK,软件会在两个BLOCK中设置对应的几个中点试验重复,检查中点试验的重复性是否良好,以观察这些不可控制因素对试验造成多大影响,从而最大限度的降低试验中不可控制因素对试验的干扰。再例如,本实验其中一部分在甲实验室完成,另一部分要在乙实验室完成,那么就可以设置2个BLOCK,原因同上。.因变量个数,即本试验中改因变量个数,即本试验中改变自变量会有几个因变量发变自变量会有几个因变量发生变化,一般试验指标都是生变化,一般试验指标都是一个,因此常常为一个,因此常常为1。例如,检测温度,pH,时间对某处理工艺对样品中含糖量的变化,那么含糖量即为唯一的指标,即因变量数量为1
16、,该处选1。如果检测温度,pH,时间对某处理工艺同时对样品中含糖量和蛋白质含量的影响,即因变量数量为2,该处选2,并在下方因变量设置中设置好对应的名称和单位。选择响应值(因变量)数量因变量单位因变量名称设置完后,点击Continue.编码值与实际值转换两种排序方式,可任选试验中设置的因素的水平试验中因变量数量各因素均为实际值的实验设计,也可以用编码值的实验设计把每个试验对应的试验结果填入本栏内,准备做数据分析.各因素的实际值变为编码值,比如,因素1的高点设置为0.5,编码值即为+1,低点设置为0,编码值即为-1,中点为0.25,编码值即为0.各因素转变为编码值后的页面.按照实验设计进行实验,记
17、录每组因素组合的实验结果,填在Response列中。完成每组实验,将实验结果填入对应的响应值框内。.点击Analysis下的COD(%)(分析的因变量名称)开始进行数据分析.2、点击Fit Summary选项卡1、点击Transform选项卡,取默认值.Fit Summary选项卡,是将数据模拟、建模、比对,最终选择试验最佳数学模型。.多种模型方差分析多种模型方差分析Sequential model sum of squares for central composite design方差来源平方和自由度均方F值概率F平均模型vs总计51795.84151795.84建议采用线性模型vs平均模
18、型2042.273680.762.23530.1236双因素 vs 线性模型249.23383.080.23360.8714二次方程vs 双因素2490.453830.153.89160.0443建议采用三次方程vs二次方程1852.625370.526.60290.0294较差剩余方差280.58556.12总计58710.98202935.55.R2综合分析Model summary statistics for central composite design类型标准R2R2R2预测残差偏差校正值预测值平方和线性模型12.9000.3070.146-0.1673639.323双因素13.
19、8310.3870.019-0.9666133.650二次方程6.9460.8920.752-0.6735219.480建议采用三次方程1.7890.9960.984较差.拟合公式的处理方法,一般取默认即可拟合公式的处理方法,一般取默认即可点击该处可以让一些变量在图中不显示Model选项卡取默认值,再点击ANOVA选项卡.模型要求显著失拟项要求不显著这两个参数是衡量有益于响应面分析的指标例如本试验例如本试验中,拟合的中,拟合的方程显著性方程显著性不好,显示不好,显示为不显著为不显著方差分析(ANOVA)选项卡,方差显著性检验、系数显著性检验、回归方程。再点击Diagnostics选项卡.编码自
20、变量A、B、C的二次多项回归方程 真实自变量停留时间 HRT、pH 值、Fe/C 比的二次多项回归方程拟合方程中的系数值.二次方程模型置信度分析Quadratic model analysis of confidence degree因素参数估计自由度标准偏差95%置信区间95%置信区间显著因素取值58.20013.10750.85465.546A-停留时间2.61312.456-3.1958.4201.000B-pH值-4.05012.456-9.8571.7571.000C-Fe/C比9.81312.4564.00515.6201.000AB4.67513.473-3.53812.8881
21、.000AC-1.15013.473-9.3637.0631.000BC-6.27513.473-14.4881.9381.000A214.17513.3856.17022.1801.006B211.70013.3853.69519.7051.006C22.77513.385-5.23010.7801.006.残差的正态概率分布图,越靠近直线越好.Residuals vs Predicted图(残差与方程预测值的对应关系图)分布越分散越分散、越无规无规律律越好.Predicted vs Actual图(预测值与试验实际值的对应关系图)点越靠近同一条直线靠近同一条直线越好.点击Influence
22、选项卡再点击Report选项卡,进入数据报告界面进入数据报告界面.点击Model Graphs选项卡进入响应面图形显示界面方程预测值实际实验值.等高线图 考察每两个因素每两个因素对因变量因变量造成的影响,并由拟合的方程形成等高线,为二维平面图形,可经由该图找出较好范围。.点击View的3D Surface看响应面3D图点击Term选择不同因素间的等高线图选中文字,点击右键,修改坐标名称.移动红线调整不同的因素大小点击Term选择不同因素间的响应面曲线三维响应面曲线可更直观的看出两因素对因变量的影响情况,可以很直观的找出最优范围,刚才所见二维等高线图为三维响应面图在底面的投影图投影图3D图.调整
23、后的响应面图右键编辑横纵坐标.保存并剪切图片.RSM预测最佳条件和最优处理效果点击Numerical选项卡,确定响应面试验最优值预测方法.首先,根据实际情况确定每个因素可以取值的范围,例如在酶催化条件优化试验,温度范围一般不会超过80,否则酶会变性,那么我们就可设置该因素取值范围为0-80,也可根据实际实验或者生产条件设置该值。确定各因素的取值范围.响应值目标的确定我们每个试验都有不同的目的:有的想结果最大,例如某种物质的提取率;有的想结果最小,例如检查几种因素对产品稳定性的影响,此时结果越小越好;有时候我们需要把结果稳定在某个范围或者需要一个固定的,无限趋近的目标值。确定响应值(因变量)的目
24、标(最大值、最小值、目标值、范围值),此实例是优化三个因素使响应值最大,选择Maximize.低值取默认值高值项中输入一个尽可能大的无法达到的值。例如,本实验中我们想得到一个结果最大,例如,本实验中我们想得到一个结果最大,那么我们选择那么我们选择MAXIMIZE,然后在下面两个,然后在下面两个框中,左侧低值可不管,右侧高值项中填入框中,左侧低值可不管,右侧高值项中填入一个尽可能大的无法达到的值。一个尽可能大的无法达到的值。例如,某物质提取试验,提取率最高不会超例如,某物质提取试验,提取率最高不会超过过100%,那么我们在右侧填入,那么我们在右侧填入100%即可达即可达到我们的目的,当然,填入到我们的目的,当然,填入200%亦可。亦可。点击Solution选项卡RSM预测最佳条件和最优处理效果.获得最佳优化条件和预测处理效果此处为最优条件此处为最优条件经过分析得到最优值,其中经过分析得到最优值,其中第一个方案就是各因素取最第一个方案就是各因素取最优值后的结果可取得最大化优值后的结果可取得最大化的解决方案,为预测值。的解决方案,为预测值。.