1、DOI:10.12171/j.10001522.20210551小兴安岭兴安落叶松人工林冠幅模型构建刘索名王君杰燕云飞姜立春(东北林业大学林学院,森林生态系统可持续经营教育部重点实验室,黑龙江哈尔滨150040)摘要:【目的】使用非线性回归、混合效应模型、分位数回归以及分位数组合构建兴安落叶松冠幅模型,为小兴安岭落叶松冠幅的准确预测提供参考。【方法】利用 2019 年马永顺林场的 60 块兴安落叶松人工林实测样地数据,分别构建了广义非线性模型、分位数回归模型以及混合效应模型。使用 10 折交叉检验,在每块样地分别随机抽取 18 株样木对两种分位数组合模型 QRc-1(=0.1,0.5,0.9)
2、和 QRc-2(=0.3,0.5,0.7),以及混合效应模型进行校正,确定分位数组合与混合效应模型的最佳抽样方案并进行不同方法的对比分析。【结果】(1)模型拟合结果表明:混合效应模型拟合效果最好;中位数回归为最优的分位数回归模型,中位数回归与非线性模型的拟合统计量比较差异不大,但略优于非线性回归模型。(2)抽样校正的结果表明:当抽样数量大于 2 株时,模型的排序为:分位数组合 QRc-2混合效应模型分位数组合 QRc-1。(3)交叉检验结果显著性检验表明:两种分位数组合的最佳抽样方案均为 4 株,混合效应模型的最佳抽样方案为 5 株。【结论】本研究中混合效应模型和分位数组合都能提升冠幅模型的预
3、测精度,在最佳抽样方案下,分位数组合 QRc-2(=0.3,0.5,0.7)时的检验统计量略高于混合效应模型的检验统计量,且抽样数更少,更加节约时间和成本,因此选择抽样数为 4 株的分位数组合 QRc-2(=0.3,0.5,0.7)作为最终的冠幅预测模型。关键词:冠幅;分位数回归;混合效应模型;分位数组合中图分类号:S791.22文献标志码:A文章编号:10001522(2023)05007909引文格式:刘索名,王君杰,燕云飞,等.小兴安岭兴安落叶松人工林冠幅模型构建 J.北京林业大学学报,2023,45(5):7987.Liu Suoming,Wang Junjie,Yan Yunfei,
4、et al.Construction of crown width model of Larix gmelinii plantation inXiaoxinganMountainsofnortheasternChinaJ.JournalofBeijingForestryUniversity,2023,45(5):7987.Construction of crown width model of Larix gmelinii plantation inXiaoxingan Mountains of northeastern ChinaLiuSuomingWangJunjieYanYunfeiJi
5、angLichun(SchoolofForestry,KeyLaboratoryofSustainableForestEcosystemManagementofMinistryofEducation,NortheastForestryUniversity,Harbin150040,Heilongjiang,China)Abstract:ObjectiveThispaperusesnonlinearregression,mixedeffectmodel,quantileregressionandquantileregressioncombinationtoconstructthecrownwid
6、thmodelofLarix gmelinii,whichprovidesareferencefortheaccuratepredictionofthecrownwidthofLarix gmeliniiinXiaoxinganMountainsofnortheasternChina.MethodInthisstudy,thedatawerecollectedfromsampleplotof60Larix gmeliniiplantationsinMayongshunForestFarm,thegeneralizednonlinearmodel,quantileregressionmodela
7、ndmixed effect model were constructed,respectively.10-fold cross validation was used to compare theprediction.Thenumberof1to8sampletreeswererandomlyselectedfromeachsampleplottocalibratethetwokindsofquantileregressioncombinationmodels,includingQRc-1(=0.1,0.5,0.9)andQRc-2(=0.3,0.5,0.7),andmixedeffectm
8、odeltodeterminethebestsamplingschemeforquantileregressioncombination收稿日期:20211226修回日期:20220417基金项目:国家自然科学基金项目(31170591、31570624)。第一作者:刘索名,博士生。主要研究方向:林分生长与收获模型。Email:地址:150040 黑龙江省哈尔滨市香坊区和兴路 26 号东北林业大学林学院。责任作者:姜立春,教授,博士生导师。主要研究方向:林分生长与收获模型。Email:地址:同上。本刊网址:http:/;http:/第45卷第5期北京林业大学学报Vol.45,No.52023年
9、5月JOURNALOFBEIJINGFORESTRYUNIVERSITYMay,2023and mixed effect model,and comparison was carried out and analyzed for different methods.Result(1)Themodelfittingresultsshowedthatthemixedeffectmodelhadthebestfittingstatistics.Medianregressionwasthebestquantileregressionmodel.Therewaslittledifferencebetwe
10、enthefittingstatisticsofmedianregressionandnonlinearregressionmodel,butitwasslightlybetterthannonlinearregressionmodel.(2)Theresultsofsamplingcalibrationshowedthat,whenthenumberofsampleswasgreater than 2 trees,the order of the models was QRc-2 the mixed effect model QRc-1.(3)Thesignificance test of
11、cross validation showed that the best sampling scheme of the two kinds quantileregressioncombinationswas4trees,andthebestsamplingschemeofthemixedeffectmodelwas5trees.ConclusionInthisstudy,bothmixedeffectmodelandquantileregressioncombinationcanimprovethepredictionaccuracyofcrownwidthmodel.Quantilereg
12、ressioncombination(=0.3,0.5,0.7)isslightlyhigherthanthemixedeffectmodelinthevalidationstatisticswhenusingthebestsamplingscheme.Duetothesamplenumberofquantileregressioncombinationisless,whichsavesmoretimeandcost,therefore,thequantileregressioncombination(=0.3,0.5,0.7)of4sampletreesisselectedasthebest
13、modeltopredictthecrownwidth.Key words:crownwidth;quantileregression;mixedeffectmodel;quantileregressioncombination树冠大小是树木的基本属性之一。在森林资源管理中,树冠大小能够直观地反映树木的生长情况1,树冠大小也是森林生态系统的关键结构2。冠幅是衡量树冠大小的重要指标,经常作为林业上构建各种模型的协变量,如削度方程3、材积方程4、生物量方程5等将冠幅变量引入模型,使模型的预测精度得到提升,并能解释各模型的因变量随冠幅的变化规律。此外,冠幅还可以计算林冠盖度(canopycover)
14、6。由于林冠是承载着森林生物多样性的主体,具有维持生态系统多样性的重要作用78,故研究冠幅在一定程度上有助于量化森林的生物多样性。在样地调查过程中,受限于树冠的空间位置,有时冠幅的实际测量难度较大且成本较高,而胸径易于获取且精度较高,因此通常采用构建冠幅与胸径的模型来预测冠幅。目前,冠幅模型的主要构建方法是混合效应模型法911。由于混合效应模型在参数估计时引入区组水平或样地水平的随机效应参数使模型的精度大大提高,因此成为目前分析分层和分组数据的主要方法。近年来,分位数模型由于不需要满足独立、正态、等方差的假设条件,在林业建模上得到一定的应用1214,尤其是 Bohora 等15和 Cao 等1
15、6以及zelik等17提出分位数组合以来,扩大了该方法在林业建模上的应用。分位数组合不是模型的拟合方法,而是基于分位数模型得到不同分位数的预测值的组合来预测因变量。这种方法在应用时,类似混合效应模型,也需要对未测量样地进行一定数量的样本抽样,然后对随机参数进行校正进而提高模型的预测精度。兴安落叶松(Larixgmelinii)是黑龙江省的主要造林树种之一,具有较高的经济价值和生态价值。林分生长和收获模型经常需要冠幅变量,因此准确预测冠幅对森林经营和森林生态的研究具有重要的作用。目前应用分位数组合和混合效应模型对落叶松冠幅预测的对比研究还未见报道。因此,本研究的主要目的包括以下几点:(1)构建广
16、义冠幅模型、冠幅分位数模型和混合效应模型;(2)分别对混合效应模型和分位数模型进行校正,确定最佳抽样数量;(3)比较各种预测方法的差异,确定最优冠幅预测方法。1研究区概况与研究方法 1.1 研究区概况研究地点为黑龙江省马永顺林场(47014712N,1281812826E)。马永顺林场位于小兴安岭南麓。地形属中低山区,海拔高程在 400800m 之间。水系较发达。气候类型为寒温带大陆性季风气候,夏季短暂炎热,冬季严寒漫长。极端最高气温36.3,极端最低气温42.6,年平均气温 2.5。年平均降水量 630mm,降雨多集中在 78 月。年光照时数 2420h,无霜期 128d。马永顺林场自 20
17、 世纪 60 年代开始就营造了大量的兴安落叶松。研究所用数据为 2019 年调查的60 块落叶松人工林样地。样地涵盖从幼龄林到成过熟林,面积大小取决于林分密度,范围在0.020.09hm2之间。使用胸径尺实际测量了胸径大于 5cm 的单木胸径(D,cm),使用 VertexIV 激光测高仪测量了单木的树高(H,m)和枝下高(HCB,m),使用钢尺分别测量了树冠的东、南、西、北 4 个方向的最大树冠半径,相加后求均值来获得冠幅(LCW)。通过当地林业80北京林业大学学报第45卷局获得了样地林龄(A,a)。根据样地面积得到林分密度(N,株/hm2)、胸高断面积(SBA,m2/hm2),并计算每块样
18、地的优势木平均高(HDOM,m)、优势木平均胸径(DDOM,cm)、林分平均高(HD,m)、林分平均直径(Dg,cm)、相对直径(DQMD)、高径比(RHD,m/cm)等多种因子。部分因子的统计量见表 1。表1落叶松单木和林分因子的统计量Tab.1StatisticsofindividualtreeandstandvariableforLarixgmelinii变量Variable最小值Min.value最大值Max.value均值Meanvalue标准差SD胸径Diameteratbreastheight(D)/cm5.5050.3019.446.63树高Treeheight(H)/m6.1
19、029.7018.733.26枝下高Heighttocrownbase(HCB)/m1.902112.772.48冠幅Crownwidth(LCW)/m0.308.303.361.03林龄/aTreeage(A)/year1961298.77样地面积/hm2Sampleplotarea(S)/ha0.020.090.040.02林分密度/(株hm2)Standdensity(N)/(treeha1)44420891245372胸高断面积/(m2hm2)Basalareaperhectare(SBA)/(m2ha1)22.7841.9431.554.42优势木平均高Average Hofdomi
20、nanttree(HDOM)/m18.272921.752.47优势木平均胸径AverageDofdominanttree(DDOM)/cm19.0845.5826.445.57林分平均高AverageH ofstand(HD)/m15.3726.0618.732.41林分平均直径Meandiameterofstand(Dg)/cm14.5732.8618.653.76高径比Heightdiameterratio(RHD)/(mcm1)0.441.721.020.21相对直径Relativediameter(DQMD)0.201.971.040.26 1.2 基础和广义冠幅模型的构建基于 12
21、 个候选冠幅基础模型18,利用落叶松数据分别对这些模型进行拟合,将不收敛和模型参数不显著的候选模型剔除,经初步分析比较最终选择拟合效果较好的 Logistic 型模型作为基础模型,模型形式如下:LCWij=01+1exp(2Dij)+(1)LCWij式中:为第 i 块样地的第 j 株冠幅,Dij为第 i 块样地的第 j 株胸径,02为模型参数,为误差项。基础模型只含有胸径变量,不能反映其他单木和林分因子对冠幅的影响。基础模型中引入如枝下高、优势木平均高、胸高断面积等单木因子和林分因子,不仅能反映这些因子对冠幅的影响,还能提高模型的预测精度1011,13,1820。因此,本研究首先针对基础模型采
22、用混合效应模型技术确定随机效应参数,然后研究随机效应参数与林分和单木变量间的相关关系,通过逐步回归法筛选引入的变量,同时考虑变量的多重共线性,剔除方差膨胀因子(VIF)大于 5 的自变量21。最终确定引入的变量包括:优势木平均高(HDOM)、相对直径(DQMD)和高径比(RHD)。具体的广义冠幅模型(2)形式如下。LCWij=0HDOMi1+(1+3DQMDij)exp(2+4RHDij)Dij)+(2)式中:HDOMi为第 i 块样地的优势木平均高,DQMDij为第 i 块样地的第 j 株相对直径,RHDij为第 i 块样地的第 j 株高径比,3、4为模型参数。1.3 混合效应模型构建和随机
23、效应参数的估计基于模型(2),假设混合效应冠幅模型所有参数都添加随机效应参数,模型形式如下。LCWij=(0+u0)HDOMi1+(1+u1+(3+u3)DQMDij)exp(2+u2+(4+u4)RHDij)Dij)+(3)uk式中:04为固定效应参数,u0u4为候选的随机效应参数。随机效应参数的具体形式如下。uk=DZTi(ZiDiZTi+Ri)1yi f(,ui,xi)+Ziui(4)ZiRiD式中:k为每块样地的随机效应参数的 k 维向量,ui*是随机效应 ui的最佳无偏估计的向量,f()是非线性混合效应模型,是固定效应参数 的估计向量,xi是预测变量的向量,为设计矩阵,和分别为样地内
24、方差协方差矩阵 R 和随机效应参数的方差协方差矩阵 D。R 和 D 的形式如下:D=21.n1.1n2n(5)R=2G0.5iiG0.5i(6)212nn11n2G0.5ii式中:为第一个参数的方差,为第 n 个参数的方差,和都为两个参数的协方差,是模型残差的方差22,是描述方差异质性的对角矩阵,为样地内误差相关性结构。总的来说,混合效应冠幅模型的构建主要采用以下 3 个步骤:(1)基于广义冠幅模型(2),使用 R 软件的 nlme函数拟合混合效应模型,通过 anova 函数比较,选择AIC、BIC 以及 logLik 最小的模型,确定随机效应参数的位置和添加随机效应参数的个数。第5期刘索名等
25、:小兴安岭兴安落叶松人工林冠幅模型构建81(2)确定样地内方差协方差矩阵 R 和随机效应参数的方差协方差矩阵 D2324。(3)在模型应用时对每块样地进行随机抽样,利用 R 和 D 以及抽样数据计算每块样地的随机效应参数值 uk25。1.4 分位数回归模型基于模型(2)构建分位数回归模型,模型的形式如下:LCW,ij=0,HDOMi1+(1,+3,DQMDij)exp(2,+4,RHDij)Dij)+(7)LCW,ij0,1,2,3,4,式中:是第 个分位数的冠幅,、是第 个分位数模型的参数。分位数回归模型的参数通过最小化残差绝对值的非对称损失函数获得26,构建分位数回归模型时 的取值为 0.
26、10.9,共 9 组分位数,当=0.5 时称为中位数回归。通过 9 组分位数的拟合统计量对比,得到中位数回归模型拟合效果最好。分位数拟合使用 R 软件的 quantreg 包的 nlrq 函数实现。1.5 分位数组合法分位数组合(quantileregressioncombination,QRc)是利用检验数据对不同分位数()回归进行判别,选择最接近检验数据实测值的两个分位数回归进行插值来实现对模型的校正15。分位数组合方法一般包括 3 种:三分位数、五分位数和九分位数,分别代表使用 3 个、5 个和 9 个分位数回归来校正模型。初步分析比较以上 3 种分位数组合的预测精度相差不大。因此,本研
27、究决定使用两种最简单的三分位数组合(QRc-1,=0.1、0.5、0.9 或 QRc-2,=0.3、0.5、0.7)来进行预测校正。yk(xij)yk(xij)LCWij yk+1(xij)在进行分位数组合校正时,需要对每块样地进行一到多株树的抽样。将抽样树的胸径等变量代入分位数组合中的各分位数回归曲线,得到预测值为,其中 k=1,2,n,xij为抽样树的各变量,k 代表分位数组合中由小到大的分位数回归曲线。当每块样地的抽样数量 m=1 时,选择最接近抽样冠幅实测值的两条分位数回归曲线进行插值(即),得到校正后经过该点的回归曲线,并获得校正后的冠幅估计值。LCWij=yk(xij)+(1)yk
28、+1(xij)(8)=yk+1(xij)LCWij yk+1(xij)yk(xij)yk yq1 yk+1 yq式中:,为插值系数;若抽样的冠幅实测值大于最大分位数回归的预测值,则将定义为,定义为,下标 q 为最大分位数;若抽样的冠幅实测值小于最小分位数回归的预测 yk y1 yk+1 y2值,则将定义为,定义为,下标 1 为最小分位数。mj=1(CWijdCWij)2 yk y1 yk+1 y2 yk yq1 yk+1 yq当每块样地的抽样数量 m1 时,选择使平均误差(meanerror,ME)符号改变的两个分位数回归曲线,要求插值系数 使最小17。若所有分位数回归的 ME 都为正,则将定
29、义为,定义为;若所有分位数回归的 ME 都为负,则将定义为,定义为;然后将得到的插值系数 代入式(8),得到校正后的冠幅预测值。1.6 分位数组合和混合效应模型抽样设计混合效应模型和分位数组合的应用都需要在每块样地进行抽样校正来预测随机效应参数。抽样数量的大小和抽样方案的选择会对模型校正的准确性产生影响。根据对混合效应模型和分位数组合抽样校正的多个研究结果9,17,2729来看,模型校正基本都采用样地抽取最大值、最小值、平均值和随机抽取样木等 4 种方案,由于最小值和最大值是 2 种极端情况,平均树抽样又需要计算每块样地的平均胸径,故随机抽样方案在实际应用时更便于操作,因此,本研究选择随机抽样
30、方案。抽样时进行不放回抽样,分别随机抽取 18 株样木。为了得到可靠的预测结果,该抽样过程重复 100 次并计算平均值。1.7 模型的评价与检验本研究采用交叉检验法30,将数据按样地号随机划分为 10 组用于 10 折交叉检验(10-foldevaluation)。模型拟合和检验的评价指标包括:平均绝对误差(MAB)、相对百分误差(MPB)、均方根误差(RMSE)以及确定系数(R2)。各评价指标形式如下。MAB=1nni=1|yi yi|(9)MPB=ni=1|yi yi|ni=1yi100%(10)RMSE=vt1nni=1(yi yi)2(11)R2=1ni=1(yi yi)2ni=1(y
31、iyi)2(12)yi yiy式中:和 分别为冠幅的实测值和预测值,为冠幅实测值的平均值,n 为样本数。2结果与分析 2.1 随机效应参数的选取与模型参数的估计对模型(2)中对所有固定效应参数添加随机效应参数,共有 31 种组合方式,剔除不收敛的情况,共82北京林业大学学报第45卷有 8 种随机效应参数组合,如表 2 所示。根据统计指标 AIC、BIC、logLik 进行对比选择加入随机效应参数的最佳位置。在参数 0或参数 2上添加随机效应参数得到的 AIC、BIC、logLik 的绝对值都为最小,且两者相差不大,但在参数 0上添加随机效应参数更易收敛,因此选择参数 0添加随机效应参数,得到最
32、终的混合效应模型(13)。LCWij=(0+u0)HDOMi1+(1+3DQMDij)exp(2+4RHDij)Dij)+(13)式中:u0为随机效应参数。广 义 非 线 性 回 归 模 型(generalized nonlinearregressionmodel,NLS)、分位数回归模型(quantileregressionmodel,QR)和混合效应模型(mixedeffectmodel,MIXED)的参数估计值如表 3 所示,所有参数均显著(P0.05)。由于进行分位数组合校正时用到了=0.1,0.3,0.5,0.7,0.9,共 5 个分位数回归模型,因此表中只列出了这 5 个分位数回归
33、模型的参数估计值。3 种模型的 02均为正数,3、4为负数,其中 0为 HDOM的参数,HDOM值变大,冠幅值变大,成正相关;3为 DQMD的参数,DQMD的值变大,冠幅变大,成正相关;4为 RHD的参数,RHD的值变大,冠幅变小,成负相关。表3模型的参数估计值Tab.3Parameterestimationofthemodel模型Model 分位数Quantile()0123422u0NLS0.1620(0.0037)0.3668(0.0750)0.0764(0.0083)0.3314(0.0671)0.1176(0.0157)MIXED0.1629(0.0067)0.6032(0.1019
34、)0.0531(0.0058)0.5265(0.0793)0.0697(0.0114)0.1531 0.0008QR0.10.1252(0.0049)1.4358(0.6116)0.1833(0.0292)1.2357(0.5258)0.1680(0.0368)0.30.1502(0.0034)0.5656(0.1616)0.1355(0.0180)0.5174(0.1463)0.1598(0.0296)0.50.1593(0.0043)0.3513(0.1127)0.0813(0.0154)0.3372(0.1092)0.1165(0.0283)0.70.1768(0.0059)0.2999
35、(0.0883)0.0547(0.0097)0.2744(0.0812)0.0948(0.0210)0.90.2176(0.0130)0.3048(0.1142)0.0421(0.0143)0.2408(0.0765)0.0918(0.0251)22u022u0注:和分别为混合效应模型残差的方差和随机效应参数的方差。NLS.广义非线性回归模型;QR.分位数回归模型;MIXED.混合效应模型。Notes:andarethevarianceoftheresidualofthemixedeffectmodelandthevarianceoftherandomeffectparameter,respe
36、ctively.NLS,generalizednonlinearregressionmodel;QR,quantileregressionmodel;MIXED,mixedeffectmodel.2.2 模型拟合结果评价对广义非线性模型(NLS)、中位数回归模型(QR,=0.5)、混合效应模型的固定效应模型(FIXED)和混合效应模型(MIXED)分别计算冠幅模型的拟合统计量 MAB、MPB、RMSE 和 R2。如表 4 所示,可以看出,MIXED 的 4 种拟合统计量都显著的优于其他模型;NLS、QR、FIXED 这 3 种模型的拟合指标相差并不大,从图 1 的残差图中可以看出 MIXED
37、模型的残差较其余 3 种模型的残差分布更均匀,残差绝对值更小。其余 3 种模型在预测值和残差分布范围上都十分接近,模型间拟合效果差异较小。4 种模型的残差分布图都没有显示明显的异方差分布趋势,因此在拟合各模型时没有加入方差函数。2.3 分位数组合和混合效应模型抽样数量的确定三分位数组合的两种方案(QRc-1,=0.1、0.5、0.9 和 QRc-2,=0.3、0.5、0.7)和混合效应模型(MIXED)在应用时都需要在每块样地中进行一定数量的抽样,也就是先要测量抽样木的冠幅。一般随机抽取 18 株样木来进行校正的时候就能看出预测精度的变化。本研究利用 10 折交叉检验分别计算 MPB、MAB、
38、RMSE 和 R2检验统计量。为了直观的分析各模型预测精度随抽样数量的变化,图 2 绘表2模型拟合不同随机效应参数添加位置统计量Tab.2Modelfittingstatisticsofdifferentrandomeffectparameterpositions随机效应参数位置ParameterpositionofrandomeffectAICBIClogLik无随机效应参数Norandomeffectparameter4271.247 4304.617 2129.62403 152.311 3 191.242 1 569.15514273.247 4312.179 2129.6242315
39、2.486 3191.418 1569.24334273.247 4312.179 2129.62443173.954 3212.885 1579.9770、43177.970 3228.025 1579.9851、34277.247 4327.302 2129.6242、44277.247 4327.302 2129.624注:第一列的参数为基于式(2)添加随机效应参数的位置。加粗的统计量为最优统计量。下同。Notes:theparameterinthefirstcolumnisthepositionwheretherandom-effectparameterisaddedbasedoneq
40、uation(2).Thestatisticinboldistheoptimalstatistic.Thesamebelow.表4模型的拟合统计量Tab.4Fittingstatisticsofmodels模型ModelMPB/%MAB/mRMSE/mR2NLS17.1850.5780.7330.493QR17.0550.5730.7380.485FIXED17.4170.5850.7360.488MIXED11.4350.3840.5090.755第5期刘索名等:小兴安岭兴安落叶松人工林冠幅模型构建83制了分位数组合和混合效应模型检验统计量散点折线图。为了与传统方法进行比较,在图中也标注了非
41、线性回归(NLS)、中位数回归(QR,=0.5)和固定效应模型(FIXED)的检验统计量。从图中可以看出,NLS、QR、FIXED 的 3 种检验统计量相差不大,与拟合时的情况基本相同。QRc-1、QRc-2、MIXED模型在 MPB、MAB、RMSE 都呈现抽样数量越多,检验统计量值越小,精度越高,R2值也随抽样数量的2.502.55.0残差 Residual/m预测值 Predicted value/mNLSQRFIXEDMIXED68242.502.55.068242.502.55.068242.502.55.06824图1冠幅模型的拟合残差分布图Fig.1Distributionoft
42、heresidualsforfittingmodelsofthecrownwidth80.400.450.500.550.60MAB/m0.50.60.70.8R212141618MPB/%0.60.70.8RMSE/m样本数 Sample sizeQRc-1QRc-2FIXEDQR(=0.5)MIXEDNLS1234567812345678123456781234567图2不同抽样数量检验统计量折线图Fig.2Linechartofvalidationstatisticsfordifferentnumbersofsamples84北京林业大学学报第45卷增大而增大。当抽样数量为 1 时,4
43、种检验统计量结果都为 MIXED 优于 QRc-1 优于 QRc-2;当抽样数量为 2 时,3 种模型的检验统计量都显著提高,并且抽样数量从 3 开始,检验统计量的优劣顺序都为QRc-2、MIXED、QRc-1;抽样数量从 4 开始,检验统计量的精度提升相较之前不明显,折线图中的斜率也由陡变缓,抽样数量从 7 开始,MIXED 的检验统计量基本与 QRc-1 或 QRc-2 接近重合。通过对不同抽样数量间检验统计量的显著性比较中(表 5)可以看出,MIXED 抽样数量从 5 开始,也就是抽样株数为 5 和 6 株对比时检验统计量不再显著,QRc-2 和QRc-1 都是从抽样数量为 4 时,也就
44、是抽样数株树为 4 和 5 株对比时检验统计量不再显著。因此,分位数组合的最佳抽样数量为随机抽取 4 株样木,混合效应模型为抽取 5 株样木。表5不同抽样数量对比显著性检验Tab.5Significancetestofdifferentsamplesizes对比ComparisonQRc-1QRc-2MIXED1vs20.00010.00010.00012vs30.00010.00010.95000.95000.31066vs70.95000.95000.95007vs80.95000.95000.9500注:表中的“1vs2”表示抽样数量为1株和2株时进行比较的统计量显著性检验,其余同理;表
45、中数据小于0.05时,表明两组数据差异显著。Notes:“1vs2”indicatesthestatisticalsignificancetestforcomparisonwhenthesamplequantityis1and2plants,andtherestisthesame.Whenthedatainthetableislessthan0.05,itindicatesthatthedatabetweenthetwogroupsaresignificantlydifferent.2.4 模型应用评价对 NLS、QR、QRc-1、QRc-2、FIXED、MIXED6 种形式的模型分别进行 1
46、0 折交叉检验。根据上述最佳抽样方案,QRc-1 和 QRc-2 选取抽 4 株样木;MIXED 选取抽 5 株样木。结果如表 6 所示,可以看出,NLS、QR 和 FIXED 的评价指标都很接近,与拟合统计量的结果基本一致。QRc-1、QRc-2 和 MIXED比其他 3 种模型预测精度都有显著提高,其中 QRc-2的 MPB 和 MAB 最小,较 NLS 分别减少了 5.2%、30.1%;MIXED 的RMSE 最小,较NLS 减少了25.5%,R2最大,较 NLS 增加了 23.1%。QRc-2 和 MIXED都优于 QRc-1。与 MIXED 相比,QRc-2 的 MPB、MAB 和R
47、2分别减少了0.33%、2.63%和0.20%,RMSE增加了 0.18%,除了 QRc-2 的 MAB 优于 MIXED,其余统计量间差距不足 1%,没有明显的差异,因此可以认为 QRc-2 较 MIXED 有更好的预测能力。表6模型的检验统计量Tab.6Validationstatisticsofmodels模型ModelMPB/%MAB/mRMSE/mR2NLS17.3770.5840.7410.482QR17.3220.5820.7480.472FIXED17.5920.5910.7440.477QRc-112.955(0.286)0.435(0.010)0.580(0.012)0.6
48、83(0.013)QRc-212.150(0.128)0.408(0.004)0.553(0.007)0.711(0.008)MIXED 12.482(0.198)0.419(0.007)0.552(0.007)0.713(0.007)注:()内为100次重复抽样获得的各检验统计量标准差。Notes:SDofeachteststatisticobtainedfrom100repeatedsamplesisshowedinparenthesis.3讨论研究表明:仅使用胸径作为单一预测因子构建冠幅模型可能会对一些林分的冠幅预估产生较大的偏差31,而通过在基础冠幅模型中添加立地和竞争因子提高模型预测
49、精度的同时还能解释冠幅与胸径异速生长间的变化19。考虑到过度参数化会导致模型收敛困难,因此本研究选择加入对冠幅模型影响较大的优势木平均高(立地)、相对直径(林分竞争)和高径比(单木竞争)构建了广义非线性冠幅模型。优势木平均高(HDOM)反映了样地的立地质量,当林分密度和物种组成确定时,HDOM越大,代表样地的林分具有更多的生长资源,林木的生长情况更好,树冠生长的更大11,18,20。相对直径(DQMD)是单木直径与林分平均胸径的比值。相同密度的林分,林木胸径的大小在一定程度上能反映出该林木在林分中竞争力的大小,因此相对直径可以表示该林木在林分中相对竞争力的大小,单木的 DQMD越大,表示其生长
50、活力越大,在竞争中越处于有利地位32,冠幅可以生长的更大。高径比(RHD)是衡量树木稳定性的重要指标,一般来说具有较大 RHD的树木更易受到雪、风和结冰的损害,而具有小 RHD的树木重心较低,根系发育较好,因此稳定性更好,更易具有较大的树冠19,33。在模型拟合中,广义非线性模型(NLS)、固定效应模型(FIXED)和分位数模型(QR)的拟合统计量虽然差异不大,但综合来看还是 QR 的拟合效果略好。QR 通过多组分位数回归曲线的不同参数值,使分位数回归能灵活地反应响应变量实际分布16。在本研究中,中位数回归的拟合效果较其他分位点更好,这与 Zang 等34和王君杰等13在构建分位数模型时的选择
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100