1、经贸动态952018年中非合作论坛北京峰会的召开推出了一系列以人民为中心的合作举措,为中非开展农业合作注入了新的活力源泉。在农产品贸易方面,中非双方一直保持着良好的贸易关系。2020年,中非农产品双边贸易总额达到99.1亿美元,较2010年增长84.1%,其良好的发展前景引起不少学者的广泛关注。大多学者运用贸易引力模型研究中非农产品影响因素,其中,张雅从自然资源要素禀赋、经济发展水平、劳动力资源、农业科技水平四方面对影响因素进行实证分析1,发现中国国内生产总值、非洲国内生产总值、非洲各国人口对中国出口非洲农产品贸易额产生正向影响,中非各国距离、非洲各国汇率、中国农业用地面积对中国出口非洲农产品
2、贸易额有负向影响;张海森和谢杰采用贸易引力模型,检验了产品的互补性、经济规模、人口、政策等因素对双边贸易流量的正向促进作用,同时,表明地理距离不利于双边贸易发展2。鉴于此,本文采用机器学习方法,研究影响中非农产品贸易的主要因素,并分析这些因素与农产品贸易的动态变化关系,且提出合理的政策建议,助力中非合作未来实现更好的发展。一、模型及变量数据说明(一)随机森林模型随机森林是由统计学家LeoBreiman在2001年提出的一种机器学习算法。用于集成学习的弱学习器也称为基学习器,决策树作为最常见的基学习器,被用于随机森林算法(RandomForest)。随机森林算法在装袋法的基础上,依然使用自助样本
3、,其在决策树的每个节点进行分裂时,仅随机选取部分变量(比如m个变量)作为候选的分裂变量。同时,以牺牲少量偏差为代价,换取方差的更大幅下降,以此降低均方误差。与装袋法相比,随机森林通过减低决策树之间的相关性,提高了预测准确性3。(二)变量说明与数据来源为统计中非农产品贸易数据,本文将农产品范围定义为HS编码1-24章的全部农产品,另外包括22个HS四位编码的农产品、6个HS六位编码的农产品。此外,本文选取的是20002021年共22年间46个非洲国家的相关数据作为样本。各变量说明详见表1。表1变量说明变量符号变量说明数据来源中非农产品进出口规模TotalTrade中国每年从非洲进出口农产品的贸易
4、总额(美元)UNCIMTRADE数据库经济规模GDP各国的名义国内生产总值(美元)世界银行数据库人均经济发展水平RealGDPPerCapita各国的人均GDP(美元)世界银行数据库人口Population各国的人口总数(人)世界银行数据库地理距离Discap两国首都之间的简单距离(公里)法国前景研究与国际中心(CEPII)数据库官方汇率Exrate各国的官方汇率UNCTAN数据库农业用地面积Agr农业用地(占土地面积的百分比)(公顷)世界银行数据库基于随机森林机器学习算法的中非农产品贸易的影响因素研究雷文静(江西科技师范大学,江西南昌330038)摘要:中非合作论坛召开以来,中非双方积极推进
5、了多项务实的农业合作,取得了显著成效。文章基于20002021年中国与46个非洲国家的农产品贸易的面板数据,采用机器学习的随机森林算法,对影响中非农产品进出口规模的因素进行实证研究。研究发现,最重要的三个因素是经济规模、人口、科技发展水平。中国应综合判断非洲国家的各项水平,选取经济规模体量大、人口总数和科技发展水平高的国家作为贸易伙伴,合理分配贸易计划,深化中非经贸合作,促进非洲农业发展,同时,更好地提升中国农产品的竞争力。关键词:机器学习;中非农产品贸易;随机森林模型作者简介:雷文静(2000),女,汉族,河南淮阳人。主要研究方向:国际经济合作。经贸动态96续表1变量符号变量说明数据来源通货
6、膨胀水平Inflation按消费者价格指数衡量的通货膨胀(年通胀率)世界银行数据库耕地资源Land耕地(人均公顷数)世界银行数据库科技发展水平Technology科技期刊支出世界银行数据库劳动力资源Labor15-24岁人口的劳动力参与率,总量(%)(模拟劳工组织估计)世界银行数据库二、基于机器学习算法的实证分析(一)随机森林实证结果分析本文实证部分使用Python软件展开计算,将全部1012个样本按照留出法,将数据随机分为互不重叠的两部分,按照7:3的比例将数据分为训练集与测试集,为避免泄漏测试集信息,采用10折交叉验证,选择随机森林的最优参数(mtry)为4(如图1所示);考虑到决策树只要
7、足够大,其对计算结果影响微弱,因此,将决策树个数设为500,采用随机森林模型计算,计算结果得到测试集的拟合优度为0.897,该拟合优度大于0.8,结果比较满意。对测试集预测结果进行可视化处理,预测值pred与实际值y_test的散点图如图2所示。由图2可以看出,随机森林预测值与实际值的散点较为紧密地围绕在45度线周围,表明随机森林取得了较好的预测结果。图1随机森林的交叉验证图图2测试集预测值与实际值散点图计算变量重要性并排序,所得结果如图3所示。从图中结果可知,影响中非农产品贸易的三个最重要因素是经济规模、人口和科技发展水平。其中,经济规模影响占29.4%,人口占15.3%,科技发展水平占12
8、.3%,合计约57%。第四个重要因素是农业用地面积,占比10.4%。其他影响因素依次为人均经济发展水平、劳动力资源、地理距离、官方汇率、耕地资源、通货膨胀水平,其影响程度均在5%左右。图3变量重要性排序图图4变量GDP、Population、Technology与Total Trade的偏依赖图为了观察各变量与相应变量的关系,观察它们的偏依赖图。基于研究需要,设x=(GDP,RealGDPPerCaptia,Labor)考虑第一个特征变量x1(GDP)对y(Total Trade)的边际效应,在随机森林模型下得到:)().aptiaealGDPPerC (1GDPLaborRGDPfxy=,(
9、GDP,RealGDPPerCaptia,.,Labor)上式结果不是常数,统计上一般采用样本均值计算,得:(GDP,RealGDPpercaptia,.,Labor)=niLRGDPfnx1)abor.,aptiaealGDPperc,(1)1(。任意给定特征变量xp,均可得到)px(,因此,可画出偏依赖图),(pxxp(。根据重要性图显示GDP、Population与Technology是三个经贸动态97最重要的变量,因此,分别画出它们的偏依赖图(如图4所示)。根据图4可知,中非农产品进出口规模与各国的经济规模、人口、农业科技发展水平三者总体呈现正向非线性关系。具体看,非洲各国的经济规模越
10、大,其与中国产生的农产品贸易总规模越大,这一结论与传统的贸易引力模型的结论保持一致。第二,一国的人口流量越大,国内对于农产品的市场需求越大,由于国内的农产品产量有限,进而会加大农产品的进口。而对于出口国来说,一国的人口越多,生产能力和供给都会有相应的提高,从而出口国的能力得到提高。第三,科技水平与中非农产品呈现正向关系。一方面,非洲各国科技发展水平的提高自然会提升农业科技水平,农业科技水平提升会提高各国农业生产效率,降低产品成本,从而提升国际竞争力,会促进中国自非洲进口农产品;另一方面,科技水平提升会提高各国经济发展水平,提高非洲各国的购买力,会促进非洲各国进口所需的中国农产品。两方面力量汇总
11、就会提升中非进出口总额。(二)可靠性讨论一是考虑到随机森林模型的计算结果对调节参数(mtry)较为敏感,先通过测试集选择最优mtry,所得结果如图5所示。从测试集的拟合优度可知,当每次分裂变量为9时,拟合优度最高为0.900。可见,前文得到的拟合优度接近最大值,因此,模型可靠。二是进一步比较随机森林、装袋法以及单棵决策树的测试误差,结果如图6所示。结果显示随机森林的测试误差最小,因此,本文采用的方法比较科学。三是考虑到将缺失数据填充为0可能影响计算结果,于是将其他变量存在缺失值的样本删除,得到838个样本,将该样本同样采取随机森林方法估计,得到测试集的拟合优度为0.87,同样超过0.8,研究发
12、现最重要的三个影响因素相同。可见,前文结论是可靠的。图5调节参数与测试集拟合优度图6三种算法的测试误差比较三、结论研究发现:第一,对中非农产品贸易值采用随机森林算法计算,得到测试集的拟合优度为0.897,该拟合优度大于0.8,结果比较满意。与单棵决策树(SingleTree)、装袋法(Bagging)相比,随机森林的测试误差最小。第二,影响中非农产品贸易的三个最主要因素是各国经济规模、各国人口数量、各国科技发展水平。其中,经济规模影响占29.4%,人口占15.3%,科技发展水平占12.3%,合计约57%。第四个重要的影响因素是农业用地面积占比10.4%。第三,各因素对中非农产品贸易的影响均表现
13、为非线性关系。其中,最重要的三个因素,即经济规模、人口、科技发展水平对中非农产品贸易的影响均表现为正向非线性关系。影响中非农产品贸易的因素不尽相同。随着“一带一路”的推行,中国与非洲58国农产品贸易总额不断提升,双方贸易关系日益紧密,但与此同时,由于非洲不同地区的国家之间在文化特色、经济发展水平以及人口分布情况具有较大的差异,中国在开展对非贸易时应综合判断非洲国家的经济规模、人口总数、农业科技发展水平,利用双方农产品贸易的互补性,选取更加合适的贸易伙伴,提高中非农产品贸易的总体效率,并根据各影响因素的情况,对非洲国家的消费群体合理分配贸易计划,深化中非经贸合作,拓展中非农产品贸易市场,使中国同非洲的农产品贸易造福更多非洲国家,并进一步拓展对非农产品贸易及科技研发,积极拉动非洲农业的发展,同时,增强中国农产品在国际上的竞争力。参考文献:1张雅.中非农产品贸易的基本特征、影响因素及潜力研究D.长沙:湖南农业大学,2020.2张海森,谢杰.中国非洲农产品贸易的决定因素与潜力基于引力模型的实证研究J.国际贸易问题,2011(3):45-51.3陈强.机器学习及Python应用M.北京:高度教育出版社,2021:347-359.