1、6 6 中国农机化学报2 0 2 3年D O I:1 0.1 3 7 3 3/j.j c a m.i s s n.2 0 9 55 5 5 3.2 0 2 3.0 9.0 1 0王渊龙,张艳,柳平增.基于逐步主成分回归的设施番茄果期生长模型研究J.中国农机化学报,2 0 2 3,4 4(9):6 6-7 1W a n g Y u a n l o n g,Z h a n g Y a n,L i u P i n g z e n g.R e s e a r c h o n f r u i t g r o w t h m o d e l o f f a c i l i t y t o m a t o
2、b a s e d o n s t e p w i s e-p r i n c i p a l c o m p o n e n t r e g r e s s i o n J.J o u r n a l o f C h i n e s e A g r i c u l t u r a l M e c h a n i z a t i o n,2 0 2 3,4 4(9):6 6-7 1基于逐步主成分回归的设施番茄果期生长模型研究*王渊龙1,2,3,张艳1,2,3,柳平增1,2,3(1.山东农业大学信息科学与工程学院,山东泰安,2 7 1 0 1 8;2.山东农业大学农业大数据研究中心,山东泰安,2
3、 7 1 0 1 8;3.农业农村部黄淮海智慧农业技术重点实验室,山东泰安,2 7 1 0 1 8)摘要:为研究日光温室内环境要素对番茄果期生长发育的影响,探究环境要素与番茄果实生长发育的量化关系。基于山东省德州市陵城区糜镇智慧农业产业园日光温室秋冬茬番茄果期生长数据和环境数据,分析数据间的相关性和多重共线性,采用逐步回归和主成分回归组合方法,构建设施番茄果期生长模型。结果表明:果实横径与各环境因子累计量存在较强的线性相关关系,果实横径与各环境因子(空气温度、空气湿度、光照强度、C O2浓度、土壤温度)累计量的相关系数分别为0.9 6、0.9 5、0.9 5、0.9 4、0.9 4。温室内环境
4、因子间存在较强的多重共线性,通过逐步回归分析出3个显著环境因子:空气温度、光照强度和C O2浓度。通过主成分回归建立的设施番茄果期生长模型确定系数为0.9 3,拟合效果较好。关键词:设施番茄;番茄果期;逐步回归;主成分回归中图分类号:S 6 4 1.2 文献标识码:A 文章编号:2 0 9 5 5 5 5 3(2 0 2 3)0 9 0 0 6 6 0 6收稿日期:2 0 2 2年3月3日 修回日期:2 0 2 2年4月7日*基金项目:山东省农 业重大应用技术 创新项目(S D 2 0 1 9 Z Z 0 1 9);山东省 重大科技创新工 程项目(2 0 1 9 J Z Z Y 0 1 0 7
5、 1 3);山东省科 技特派员项 目(2 0 2 0 K J T P Y 0 7 8);2 0 1 9年度山东省重点研发计划项目(2 0 1 9 GN C 1 0 6 1 0 3);泰安市科技发展计划(引导计划)项目(2 0 1 9 G X 0 2 0)第一作者:王渊龙,男,1 9 9 7年生,山东烟台人,硕士研究生;研究方向为农业工程与信息技术。E-m a i l:w y l 1 0 3 4 4 4 8 5 7 21 6 3.c o m通讯作者:张艳,女,1 9 7 9年生,山东泰安人,硕士,副教授;研究方向为农业大数据、农业物联网、区块链。E-m a i l:z h a n g y a n
6、 d x y s d a u.e d u.c nR e s e a r c h o n f r u i t g r o w t h m o d e l o f f a c i l i t y t o m a t o b a s e d o n s t e p w i s e-p r i n c i p a l c o m p o n e n t r e g r e s s i o nW a n g Y u a n l o n g1,2,3,Z h a n g Y a n1,2,3,L i u P i n g z e n g1,2,3(1.S c h o o l o f I n f o r m
7、a t i o n S c i e n c e a n d E n g i n e e r i n g,S h a n d o n g A g r i c u l t u r a l U n i v e r s i t y,T a i a n,2 7 1 0 1 8,C h i n a;2.A g r i c u l t u r a l B i g D a t a R e s e a r c h C e n t e r o f S h a n d o n g A g r i c u l t u r a l U n i v e r s i t y,T a i a n,2 7 1 0 1 8,C
8、h i n a;3.H u a n g h u a i h a i K e y L a b o r a t o r y o f S m a r t A g r i c u l t u r a l T e c h n o l o g y,M i n i s t r y o f A g r i c u l t u r e a n d R u r a l A f f a i r s,T a i a n,2 7 1 0 1 8,C h i n a)A b s t r a c t:I n o r d e r t o s t u d y t h e i n f l u e n c e o f e n v
9、i r o n m e n t a l f a c t o r s i n t h e s o l a r g r e e n h o u s e o n t h e g r o w t h a n d d e v e l o p m e n t o f f a c i l i t y t o m a t o d u r i n g t h e f r u i t i n g p e r i o d,t h e q u a n t i t a t i v e r e l a t i o n s h i p b e t w e e n e n v i r o n m e n t a l f a
10、c t o r s a n d t h e f r u i t g r o w t h a n d d e v e l o p m e n t o f f a c i l i t y t o m a t o w a s e x p l o r e d.B a s e d o n t h e a u t u m n a n d w i n t e r t o m a t o f r u i t g r o w t h d a t a a n d e n v i r o n m e n t a l d a t a i n t h e S m a r t A g r i c u l t u r a
11、l I n d u s t r i a l P a r k,M i T o w n,L i n g c h e n g D i s t r i c t,D e z h o u C i t y,S h a n d o n g P r o v i n c e,t h e c o r r e l a t i o n a n d m u l t i c o l l i n e a r i t y b e t w e e n t h e d a t a w e r e a n a l y z e d,a n d t h e g r o w t h m o d e l o f f a c i l i t
12、y t o m a t o i n f r u i t s t a g e w a s c o n s t r u c t e d b y t h e m e t h o d o f s t e p w i s e r e g r e s s i o n a n d p r i n c i p a l c o m p o n e n t r e g r e s s i o n.T h e r e s u l t s s h o w e d t h a t t h e r e w a s a s t r o n g l i n e a r c o r r e l a t i o n b e t
13、w e e n t h e f r u i t t r a n s v e r s e d i a m e t e r a n d t h e c u m u l a t i v e a m o u n t o f v a r i o u s e n v i r o n m e n t a l f a c t o r s,a n d t h e c o r r e l a t i o n c o e f f i c i e n t s b e t w e e n t h e f r u i t t r a n s v e r s e d i a m e t e r a n d t h e c
14、u m u l a t i v e a m o u n t o f v a r i o u s e n v i r o n m e n t a l f a c t o r s(a i r t e m p e r a t u r e,a i r h u m i d i t y,l i g h t i n t e n s i t y,C O2 c o n c e n t r a t i o n,s o i l t e m p e r a t u r e)w e r e 0.9 6,0.9 5,0.9 5,0.9 4,0.9 4,r e s p e c t i v e l y.T h e r e w
15、 a s a s t r o n g m u l t i c o l l i n e a r i t y a m o n g t h e e n v i r o n m e n t a l f a c t o r s i n t h e g r e e n h o u s e,a n d t h r e e s i g n i f i c a n t e n v i r o n m e n t a l f a c t o r s w e r e a n a l y z e d b y s t e p w i s e r e g r e s s i o n,i n c l u d i n g a
16、 i r t e m p e r a t u r e,l i g h t i n t e n s i t y a n d C O2 c o n c e n t r a t i o n.T h e 第4 4卷 第9期2 0 2 3年9月中国农机化学报J o u r n a l o f C h i n e s e A g r i c u l t u r a l M e c h a n i z a t i o nV o l.4 4 N o.9S e p.2 0 2 3第9期王渊龙 等:基于逐步主成分回归的设施番茄果期生长模型研究6 7 d e t e r m i n a t i o n c o e
17、f f i c i e n t o f t h e f a c i l i t y t o m a t o f r u i t g r o w t h m o d e l e s t a b l i s h e d b y p r i n c i p a l c o m p o n e n t r e g r e s s i o n w a s 0.9 3,a n d t h e f i t t i n g e f f e c t w a s g o o d.K e y w o r d s:f a c i l i t y t o m a t o;t o m a t o f r u i t s
18、t a g e;s t e p w i s e r e g r e s s i o n;p r i n c i p a l c o m p o n e n t r e g r e s s i o n0 引言设施农业是由传统农业向现代化集约型农业转变的有效方式,是实现农业现代化的必由之路,在国内外农业结构调整中发挥重要作用12。其中番茄是我国设施蔬菜主栽品种之一,具有易于栽培、市场需求量大、经济效益高等特点,栽培面积和产量均居我国设施农业首位3。设施番茄具有较高的科研和经济价值,以设施番茄为研究对象具有重要的意义4。在国内外关于番茄生长模型的研究中,大多数学者以光温或光温湿为主要因素构建了番茄生
19、长模型,如张智优等5对不同播期、品种、氮素水平及茬口的试验数据进行处理,构建了反映果实生长与温度、光照关系的果实横、纵径生长模型,以及果实干物质机理性模型和果实鲜重与横、纵径关系的线性模型,并建立了以上述模型为基础的番茄产量预测模型;程智慧等6将空气温湿度和光照强度细分为7个变量,运用逐步回归建立了显著环境因子与果实日增量的回归模型;U z u n7通过分析温度和光照强度,建立了番茄叶片数生长发育模型;G u p t a等8研究了设施条件下累积辐热积对番茄幼苗长势的影响。部分学者在光温湿基础上以空气C O2浓度、水分、营养元素等为主要因素构建了番茄生长模型,如刘新英等9以C O2浓度和营养液含
20、氮量为自变量,利用多元线性回归方法建立了番茄全周期的光合速率预测模型;雷涛等1 0为探究不同水分沸石量埋深条件下番茄的生长特性,采用L o g i s t i c模型模拟了番茄生长动态过程,揭示了各因素对番茄物候期和生长参数的影响;李佳佳等1 1为研究高温胁迫下设施番茄植株氮素运营规律,开展了高温和施氮量双因素全面试验,发现设施番茄临界氮浓度与地上部干重之间符合幂指函数关系;荷兰的S p i t t e r s等1 2建立了T OM S I M番茄生长模型,综合考虑了番茄植株不同冠层的光照、叶面积指数、其他生理作用及温室环境等要素。综上所述,国内外学者在研究环境要素对番茄生长发育的影响上,多以
21、温光为主;在分析方法上,多以相关性分析、多元线性回归为主。但温室环境要素较复杂,还需考虑变量间是否存在多重共线性,否则会难以区分每个解释变量的单独影响,变量的显著性检验失去意义,回归模型也会缺乏稳定性1 1。设施番茄果实生长是影响产量形成的一个重要指标1 3,本文拟用设施番茄果期生长数据和环境数据,分析数据间的相关性和多重共线性,然后采用逐步回归和主成分回归组合方法构建设施番茄果期生长模型。1 材料与方法1.1 试验区概况试验于2 0 2 0年8月2 0 2 1年2月在山东省德州市陵城区糜镇智慧农业产业园进行。温室呈东西走向,长1 2 5m,宽1 0m,北侧墙体厚7.5m。试验供试番茄品种为“
22、凯德8 7 1 7 0”,此品种为大红果,无限生长型。温 室 采 用 龚 作 种 植 模 式,龚 宽0.6 5 m,沟 宽0.5 5m,垄内双列栽种,分别于8月6日、8月3 1日和9月2 4日在番茄幼苗5叶1心时按株距3 0c m、行距3 5 c m各定植1 2 0 0颗,共种植3 6 0 0颗。试验统一水肥及其他农事操作。1.2 指标测定设施番茄果期生长模型由设施番茄生长数据和温室内环境数据构建,它们分别由物联网设备、信息化设备及人工方式采集。设施番茄生长数据由信息化设备和人工每7天采集一次,采集时选取1 0株长势一致的样本并采集样本株高、茎粗、叶片数、叶面积、果实横纵径等指标,共采集2 1
23、 0条生长数据,其中叶面积使用国产L A-S植物图像分析仪计算测得,茎粗由作物茎粗测量仪测得,株高采用卷尺测得。温室内环境数据由山东农业大学大数据研究中心自主研发的“神农物联”设备每隔3 0m i n自动采集一次,共采集4 7 0 4条环境数据,采集指标包括空气温度、空气湿度、二氧化碳浓度、光照强度、土壤温度等,使用传感器型号如表1所示。表1 传感器型号T a b.1 S e n s o r t y p e传感器名称型号量程精度空气温湿度传感器D B 1 7 1-1 0温度:(-4 0+1 2 0)湿度:0%1 0 0%RH温度:0.5(2 5)湿度:5.0%RH光照强度传感器T B Q-6
24、2 0 02 0 0 0 0 0 L u x?5%二氧化碳传感器E E B 8 002 0 0 0 m g/k g?5 0 m g/k g1.3 数据预处理温室内环境数据由物联网设备每隔3 0m i n采集6 8 中国农机化学报2 0 2 3年一次,用程序处理后得到各环境变量日平均值及累计值;设施番茄生长数据由人工和信息化设备每隔7天采集一次,用程序处理后得到各生长指标的平均值。将处理后数据进行标准化得到试验最终数据。本研究使用前两批数据进行分析,第三批数据进行验证。1.4 相关方法1)逐步回归。逐步回归分析方法的基本思路是自动从大量可供选择的变量中选取最重要的变量,建立回归分析的预测或解释模
25、型。其基本思想是:将自变量逐个引入,引入的条件是其偏回归平方和经检验后是显著的。同时,每引入一个新的自变量后,要对旧的自变量逐个检验,剔除偏回归平方和不显著的自变量。一直这样边引入边剔除,直到既无新变量引入也无旧变量删除为止。它的实质是建立“最优”的多元线性回归方程。依据上述思想,可利用逐步回归筛选并剔除引起多重共线性的变量,其具体步骤如下:先用被解释变量对每一个所考虑的解释变量做简单回归,然后以对被解释变量贡献最大的解释变量所对应的回归方程为基础,再逐步引入其余解释变量。经过逐步回归,使得最后保留在模型中的解释变量既是重要的,又没有严重多重共线性。2)主成分回归。主成分回归通过以主成分为自变
26、量解决多重共线性,它先用主成分分析消除回归模型的多重共线性,然后将主成分作为自变量进行回归分析,最后根据得分系数矩阵将原变量代回得到新模型。主成分分析是考察多个变量间相关性的一种多元统计方法,它把多个变量化为少数几个互相无关的综合变量,并使综合变量尽可能地代表原来信息,具有明显的降维优势。用主成分提取的新变量组内差异小而组间差异大,可以有效地消除多重共线性问题。2 基于逐步主成分回归的设施番茄果期生长模型的构建 番茄的果实生长是影响产量形成的重要指标,果实横径能在一定程度上反映番茄在果期的生长变化情况1 4,因此以果实横径为因变量,以温室内空气温度、光照强度、空气湿度、二氧化碳浓度以及土壤温度
27、累计量为自变量构建设施番茄果期生长模型。用Y表示果实横径,用X1X5分别表示果期温室内各环境因子。2.1 设施番茄果期数据相关性分析数据分析前应先对数据从整体上有所认识。散点图阵表示各变量随其他变量变化的大致趋势,能够反映多个变量间的相关关系,据此选择合适的函数对数据点进行拟合。用果实横径同各环境因子绘制散点图阵,观察数据间的相关关系。图1为果实横径与各环境因子的散点图阵。图1 果实横径与各环境因子散点图阵F i g.1 S c a t t e r p l o t o f f r u i t h o r i z o n t a l s t e m s a n d e n v i r o n m
28、 e n t a l f a c t o r s由图1可知,果实横径与各环境因子间均存在明显的线性相关关系。散点图阵可以直观地展示数据间的关系,判断数据间的变化趋势,但只能用来大致观测数据的特点。在统计学中,皮尔逊相关系数,又称皮尔逊积矩相关系数,是用于度量两个变量X和Y之间的线性相关,其值介于-11之间1 5,它可以用数值精确地说明数据间的相关关系,使用散点图阵初步分析数据特点,再利用皮尔逊相关系数能进一步探明数据间的线性相关程度。使用皮尔逊相关系数的前提条件是数据服从正态分布1 6,因此在使用皮尔逊相关系数之前应先用正态分布检验方法判断数据是否服从正态分布。在显著性水平为0.0 5的情况下
29、所有变量的p值均通过检验,且所有变量的w值接近于1,故各变量均服从正态分布,符合使用皮尔逊相关系数的前提条件,因此可以使用皮尔逊相关系数来查看数据间的相关程度。表2为果实横径与各环境因子的相关系数表。表2 相关系数表T a b.2 C o r r e l a t i o n c o e f f i c i e n tYX1X2X3X4X5Y1.0 00.9 60.9 50.9 50.9 40.9 4X11.0 00.9 80.9 90.9 80.9 7X21.0 00.9 70.9 40.9 7X31.0 00.9 80.9 7X41.0 00.9 4X51.0 0 由表2可知,果实横径与各环
30、境因子间的相关系第9期王渊龙 等:基于逐步主成分回归的设施番茄果期生长模型研究6 9 数分别为0.9 6、0.9 5、0.9 5、0.9 4、0.9 4,说明果实横径与各环境因子间存在较强的相关关系,此外各环境因子间也存在较强的相关关系,故将五个环境因子全部引入用来构建模型。2.2 设施番茄果期数据多重共线性分析由皮尔逊相关系数分析结果发现果实横径与各环境因子间存在较强的相关关系,因此每个环境因子都不能被忽略。多元线性回归是构建模型最常见的方法,因此首先使用多元线性回归建立果实横径与各环境变量间的关系模型,量化分析果实横径与各环境因子间的关系,同时观察多元线性回归对于设施番茄果期数据是否有效。
31、多元线性回归结果如表3所示。表3 多元线性回归结果T a b.3 M u l t i p l e l i n e a r r e g r e s s i o n r e s u l t s变量估计量标准差t值T检验 显著性截距1 3.4 75.9 8 32.2 5 2 0.0 3 9*X10.2 4 0 80.1 1 5 92.0 7 9 0.0 5 5X2-6.9 8 11 0-25.2 4 51 0-2-1.3 3 1 0.2 0 3X3-3.0 2 51 0-39.7 4 71 0-3-0.3 1 0 0.7 6 1X4-3.1 8 91 0-32.2 5 11 0-3-1.4 1 7
32、0.1 7 7X51.2 5 11 0-21.9 3 21 0-20.6 4 8 0.5 2 7 注:*表示T检验结果大于等于0.0 1,小于等于0.0 5;*表示T检验结果大于等于0.0 0 1,小于等于0.0 1;*表示T检验结果大于等于0.0 0 0 1,小于等于0.0 0 1。下同。由表3可知,在显著性水平为0.0 5情况下,只有常数项的参数估计结果通过检验,X1X5的参数估计结果未通过检验。X1、X5的参数估计结果为正值,故随着X1、X5的增加,Y不断增加;X2、X3、X4的参数估计结果为负值,故随着X2、X3、X4的增加,Y不断减小,这与相关性分析结果不符,造成上述情况最有可能的原
33、因是未充分考虑自变量间的耦合性和多重共线性,从而使多元线性回归分析结果失效。方差膨胀因子是诊断变量多重共线性严重程度常用的方法之一,因此使用方差膨胀因子衡量多元线性回归模型中各环境因子间的多重共线性。由多重共线性诊断结果可知所有变量的方差膨胀系数V I F均大于1 0,其中X1、X2、X4的方差膨胀系数高达1 3 5 2.6 6、5 2 6.6 4、4 5 8.6 9,说明温室内环境因子间存在多重共线性,且空气温度、光照强度以及C O2浓度的多重共线性更为严重,说明空气温度、光照强度以及C O2浓度分别与不包括自身的其余四个变量间的耦合性较高,其余变量可用上述变量通过线性组合得到,猜想可用上述
34、变量代替全部变量进行回归分析。以空气温度为例,从实际情况出发,一般空气温度的升高或降低会直接影响其他变量的大小,如土壤温度会随空气温度的升高而升高,空气湿度会随空气湿度的升高而降低等。多重共线性会导致一些严重后果;完全多重共线性会导致最小二乘法下的参数估计量不存在;近似共线性时会导致参数估计量的方差与协方差增大,使最小二乘参数估计量失效,进而导致参数区间估计不合理,并使得各解释变量的t检验与方程的F检验失效1 7。故应选择能够解决多重共线性的回归方法进行分析。2.3 设施番茄果期生长模型构建由多重共线性诊断结果可知环境因子间存在较为严重的多重共线性,在构建设施番茄果期生长模型时应该使用能够处理
35、多重共线性的建模方法。解决多重共线性的方法大致分为四类:第一类为添加惩罚项的岭回归、l a s s o回归等;第二类为筛选变量的逐步回归;第三类为重组主成分的偏最小二乘回归和主成分回归;第四类为神经网络。由于本试验数据较少,而神经网络需要大量数据用于练习,因此先用最常见解决多重共线性的方法岭回归来构建设施番茄果期生长模型,分析果实横径与各环境因子间的关系,同时观察岭回归分析结果是否有效。表4为岭回归分析结果。表4 岭回归分析结果T a b.4 R i d g e r e g r e s s i o n a n a l y s i s r e s u l t s变量估计量标准差t值T检验显著性截
36、距2 3.3 1NANANANAX12.2 7 01 0-27.7 0 34.0 8 44.4 21 0-5*X21.2 8 31 0-21 1.1 52.1 2 10.0 3 3 9*X31.7 7 81 0-41 1.9 90.0 8 00.9 3 5 9X42.5 8 11 0-41 0.7 90.9 9 30.3 2 0 5X52.6 8 91 0-31 3.6 50.2 5 20.8 0 0 9 由表4可知,在显著性水平为0.0 5的情况下,X1、X2的 参 数 估 计 结 果 通 过 检 验,X3、X4、X5、I n t e r c e p t的参数估计结果未通过检验,说明岭回归效
37、果较差,故选择其他解决多重共线性的回归方法。逐步回归的思路与岭回归完全不同,其基本思想是先用被解释变量对每一个所考虑的解释变量做简单回归,以贡献最大的解释变量对应的回归方程为基础,再逐步引入其余解释变量。经过逐步回归,最后保留在模型中的解释变量既是重要的,又没有严重多重共线性1 8。表5为对数据进行逐步回归分析的过程。A I C(赤池信息准则)是一个运算退出的标志,当A I C值最小时运算退出。由表可知第一步在全部变量的基础上除去一个变量进行回归分析时A I C最小值为6 4.9 6 6,此时保留的变量为X1、X2、X4、X5,第二步在第一步基础 上除去一 个 变 量 进 行 回 归 分 析
38、时A I C最小值为6 3.4 8 7,此时保留的变量为X1、X2、X4,第三步在第二步基础上除去一个变量进行回归分析时A I C最小值仍为6 3.4 8 7,保留的变量与第二步相7 0 中国农机化学报2 0 2 3年同,此时A I C值最小,逐步回归退出运算。表5 逐步回归分析过程T a b.5 S t e p w i s e r e g r e s s i o n a n a l y s i s p r o c e s s步数变量A I C1X1、X2、X4、X56 4.9 6 61X1、X2、X3、X46 5.4 1 01X1、X2、X3、X4、X56 6.8 3 11X1、X3、X4、
39、X56 7.1 7 61X1、X2、X3、X56 7.4 7 01X2、X3、X4、X57 0.1 4 72X1、X2、X46 3.4 8 72X1、X2、X4、X56 4.9 6 62X1、X4、X56 6.1 4 22X1、X2、X56 7.1 7 02X2、X4、X56 8.7 9 83X1、X2、X46 3.4 8 73X1、X46 4.2 9 73X1、X26 5.2 6 23X2、X46 6.9 2 6 表6为对数据进行逐步回归分析的结果。逐步回归选取的最优自变量集为X1、X2、X4,由表6可知,在显著性水平为0.0 5情况下,各变量的参数估计结果显著性比岭回归分析明显提高,但X2
40、的参数估计结果仍未通过检验,且X2、X4的参数估计结果为负值,与相关性分析结果不符。逐步回归通过选取变量初步解决了多重共线性问题,但是仍然存在分析结果与相关性不符、部分变量的参数估计结果未通过检验等问题。表6 逐步回归分析结果T a b.6 S t e p w i s e r e g r e s s i o n a n a l y s i s r e s u l t s变量估计量标准差t值T检验 显著性截距1 4.5 14.7 8 33.0 3 4 0.0 0 7 4*X10.2 1 9 19.7 7 41 0-22.2 4 2 0.0 3 8 6*X2-5.8 7 71 0-23.7 6 7
41、1 0-2-1.5 6 0 0.1 3 7 2X4-2.9 7 91 0-31.6 2 91 0-3-1.8 3 0 0.0 8 4 9 主成分回归是通过线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映总体信息的指标,从而在不丢掉重要信息的前提下避开变量间共线性问题,便于进一步分析1 9。在主成分分析中提取出的每个主成分都是原来多个指标的线性组合。考虑将逐步回归选取的变量进行主成分回归分析,尝试解决逐步回归尚未解决的问题。由主成分分析结果可知第一主成分C o m p 1的方差累计贡献率为9 8.0 7%,第二主成分C o m p 2的方差累计贡献率为9 9.9 7%,第三主成分C
42、o m p 3的方差累计贡献率为1 0 0%,由于C o m p 1即可解释大部分变差,故用第一主成分进行回归分析。现用Z1表示第一主成分,Z1为X1、X2和X4三个变量的线性组合且由主成分分析结果知Z1=0.5 8 3X1+0.5 7 5X2+0.5 7 4X4,用Z1进行回归分析的结果如表7所示。表7 主成分回归分析结果T a b.7 P r i n c i p a l c o m p o n e n t r e g r e s s i o n r e s u l t s变量估计量标准差t值T检验显著性截距-4.8 4 51 0-1 75.9 3 81 0-20.0 01Z10.5 4 8
43、 63.3 4 6 21 0-21 5.8 5 2.0 91 0-1 2*由 表7可 知,第 一 主 成 分 的 参 数 估 计 结 果 为0.5 4 8 6,在显著性水平为0.0 5情况下通过检验。根据主成分回归分析结果知常数项可以忽略不计,回归方 程 为Y=0.5 4 8 6Z1,将Z1=0.5 8 3X1+0.5 7 5X2+0.5 7 4X4代入Y=0.5 4 8 6Z1,可得Y=0.3 1 9 8X1+0.3 1 5 4X2+0.3 1 4 9X4,最后将回归方程中的变量还原为原始变量,得到最终回归方程为Y=0.1 6 9 8X1+0.0 1 2 1 5X2+0.0 0 0 5 5
44、7 7X4+2 4.0 8分析拟合方程可知X1、X2、X4的系数为正值符合相关性分析结果,解决了岭回归分析和逐步回归分析不符合相关性分析结果、参数估计结果未通过检验的问题。2.4 设施番茄果期生长模型评价与验证用逐步主成分组合算法构建的设施番茄果期生长模型所有参数估计结果在显著性水平为0.0 5情况下均通过检验,且全为正值,符合相关性分析结果。通过均方差、均方根和确定系数对模型进行评价,其中均方差 为0.0 7 0 3,均 方 根 为0.2 7 2 1,确 定 系 数 为0.9 2 9 7,模型误差较小,拟合效果较好。取试验第三批数据进行模型的验证,图2为模型验证结果。图2 模型验证结果F i
45、 g.2 M o d e l v e r i f i c a t i o n r e s u l t s设施番茄果实自坐果期开始,横径和纵径均随生育进程的进行而不断增大,呈“S”型曲线的变化规律,至成熟期达到最大值1 2。由图2可知,设施番茄果期生长模型预测值比真实值更加平稳,因此前期误差较大,后期误差较小,总体来看拟合效果较好,能较好地表达温室内环境因子与果实横径间的关系。第9期王渊龙 等:基于逐步主成分回归的设施番茄果期生长模型研究7 1 3 结论本文以设施番茄果期为例,空气温度、空气湿度、有效光辐射、C O2浓度、土壤温度的累计量为输入,果实横径为输出,将前两批数据用逐步回归分析出显著环
46、境变量,然后进行主成分回归构建设施番茄生长模型,用第三批数据验证模型,解决了其他方法分析结果与相关性分析不符、部分参数估计结果未通过检验等问题。1)设施番茄结果期果实横径与空气温度、空气湿度、有效光辐射、C O2浓度、土壤温度存在较强的正相关性,相关系数分别为0.9 6、0.9 5、0.9 5、0.9 4、0.9 4。2)温室内环境因子间存在较强的多重共线性,逐步回归分析出显著环境变量为空气温度、有效光辐射、C O2浓度。3)主成分回归建立的设施番茄生长模型对果实横径的拟合效果较好,确定系数为0.9 3,能够较好地表示果实横径与各环境因子间的关系。基于日光温室内主要环境因子构建的设施番茄结果期
47、生长模型,为设施番茄数字化的深入研究奠定了基础。本文通过试验构建了设施番茄果期生长模型,但仍需要进行以下探索。未来工作可以考虑更换试验场地或者控制环境变量单一验证模型的有效性。本文只考虑了设施番茄果期,后续可以考虑设施番茄不同时期环境因子对番茄植株生长的影响。参 考 文 献1 范拴喜,崔佳茜,李丹,等.不同改良措施对设施蔬菜土壤肥力和 番 茄 品 质 的 影 响 J.农 业 工 程 学 报,2 0 2 1,3 7(1 6):5 8-6 4.F a n S h u a n x i,C u i J i a x i,L i D a n,e t a l.E f f e c t s o f d i f
48、f e r e n t i m p r o v e m e n t m e a s u r e s o n s o i l f e r t i l i t y a n d t h e t o m a t o q u a l i t y o f f a c i l i t i e s v e g e t a b l e s J.T r a n s a c t i o n s o f t h e C h i n e s e S o c i e t y o f A g r i c u l t u r a l E n g i n e e r i n g,2 0 2 1,3 7(1 6):5 8-6 4
49、.2 郑健,殷李高,朱传远,等.施用沼液对设施番茄生长与土壤生态环境 的 影 响 J.农 业 机 械 学 报,2 0 1 9,5 0(1 0):2 7 8-2 8 8.Z h e n g J i a n,Y i n L i g a o,Z h u C h u a n y u a n,e t a l.E f f e c t s o f d i g e s t a t e o n t o m a t o g r o w t h a n d s o i l e c o l o g i c a l e n v i r o n m e n t i n g r e e n h o u s e J.T r
50、a n s a c t i o n s o f t h e C h i n e s e S o c i e t y f o r A g r i c u l t u r a l M a c h i n e r y,2 0 1 9,5 0(1 0):2 7 8-2 8 8.3 刘中良,高俊杰,谷端银,等.施氮量对设施基质栽培番茄品质、产量及 养 分 吸 收 的 影 响J.干 旱 区 资 源 与 环 境,2 0 1 9,3 3(7):1 6 3-1 6 7.4 方伟,张青,惠成章,等.沈阳市设施蔬菜产业发展问题及对策J.农业经济,2 0 1 1(1):1 8-2 0.5 张智优,曹宏鑫,陈兵林,等.