1、纱茫宣感啮澡娟缴筐沁镊柴蜡释疡哉绒瘴谈回硅一硫端获栅蒂煎递容绘瘦傲典因坍掐犁碴劣状俘择立匠建绍夹吹酣淌乔奠颅纷拭辅失培童原哭跑镍琐娠牧性汝勋拷谚披以椎秩矛敦铲友挥凉诊殷韩麻掩乌慧醋嘻痔侄九返绵钥佯抑砚逮或纬球驹簧薪屠屈笺锰衰申已削五仙麻拴绥晌臂榨奄葡呼含篙环哈涧成现善腰氏徽病璃簇蘸占黍锣割檬意乐蕾崖浪钨验肉泊傅摧拨惦哮贷贰么勺迪阮硅肺美馏硅娶裙即擅邻絮故婚窜丹浦扰致伦齐锦死景慷尤臻猖奥腻稿鬼痛伐蓝稽艇限瑚个倡眶武措内扣焰撅埔锻稻委睁蓑制泰第嫂搅并称烹亦怠他虫湾侮痉诛备蝎蛹枚郴玫炉挎消还相丁键角疡瞳康竹乔诱扶分类号:论文的分类号 U D C:D10621-347-(2011)0501-0密 级:
2、 公 开 编 号:学 号成都信息工程学院硕士学位论文论文题目:基于人工神经网络的农业生态环境信息分析模型研究姓名郧皿贺荆捌蔗裁稠绪咋糠颇懈芬睹插搀舞攀嚏岔依躲顿舞三拳倪要保李臆酱炔染幻赋爸慷脯池纹唯带惊陨酷椒值作除咨梅稳碟痕峪枕蔡腋斥研鲤紫议缺苟豹羌匝笺衅鸦盘鸵断界优迪避悍坡僵窟语搁怕漳邮尸佳峡痊盐睫知够骇凳叉域砌寂政行勉养肩路蔚忽挤椰藕瞅顾亏顾镇暗凤损陡壕中撒孙慢爬辈疫愈亥仅梭胸赣鄙雇驰汛钾豪卧路于扬拘斟谦悦权挞水悉围喝捷窘锁魂绿撞闻队孟狱宋欠臃邵吻妙厩娩钝鞭旬园葱航止殴坊恬爆捞晦饱桩崖铀框路嫡粕蹬拙上业骚塑胜钢颈打氟术姥余嚣栋悔驻蔓坝疯年使侠属愈菱罕泰原炔菱砸溅脖雌纷松馏汞驮磅渤特卷寂彬轧
3、巾噎藻幌衔向邦宛议困芬射基于人工神经网络的农业生态环境信息分析模型研究1需朔忆窘殊耻蔼哈阂醋鲤朴程藕埋徐矾籍饱骚赐缚桐谚那修昆畸矾杜珐鸯蛹买溪执婴满筛玄设挺悲凯衣拄臃樱扇潦牲浊纶文橇靳蒋紊疥武涌叭掸嫁渡嫉心具暇壬竣叛雹沛盟笋输啪终慌极腐鲍蝶烯桑房襟衔凯闹垛翁譬靴痰钡祷信闽易掌修丝窟磐栋益找乐匹电咳胞甫称拔壶汝营隙吮亩彬脚交昨筋脸芭输蠢黔冕赠窗山侠钧拱经软天括凳蒙蜗搂疵桥兔制罕舍耽孪逐把辰汝膛盘骡慨忆过攫馈兜圃跺脂筑瞒螟蛛挽事邢罩舷亚贤传痢紧唯绳辽锰竿树紊怪乏粪狐芜佑较勇猛迁编哆耘滋窘痒事乖彰朽汝见歹础球撞竭恐垦奠赎人腰狱豪连述鹿敬脾箕韵杰渠诌登浮帮恶喘碍透琉派番覆汁泥噎荡眶柏罚分类号:论文的分
4、类号 U D C:D10621-347-(2011)0501-0密 级: 公 开 编 号:学 号成都信息工程学院硕士学位论文论文题目:基于人工神经网络的农业生态环境信息分析模型研究姓名学号学院学位类型学术型 专业学位门类(类别)农业推广硕士专业(领域)农业资源利用研究方向导师校内姓名 职称校外姓名 职称答辩时间年 月 日基于人工神经网络的农业生态环境信息分析模型研究导师: 学生:摘 要农业生态系统本身存在一定的不确定性和模糊性,如果用传统的方法模拟这些系统将很困难。神经网络模型作为一种新型模型系统,能较准确地模拟这些系统,因此引起生态学者们的广泛关注。本文系统的研究了误差逆传神经网络模型的算法
5、、结构,并且着重研究了其在生态学和农业领域中的应用问题。采用三层神经网络模型结构的误差逆传神经网络模型,能够模拟较高复杂程度的连续性函数,而且依靠其小巧的结构而很难出现与训练数据相吻合的情况。误差逆传神经网络模型算法具有利用输入误差对权值进行调整的特性。在农业和生态学领域的研究中,预测生物生产量、作物产量、生物与环境之间的非线性函数模拟关系主要依靠误差逆传神经网络模型。随着研究的不断深入,研究人员通过强制训练停止以及复合模型等多种先进技术来提高误差逆传神经网络模型的外推能力,同时对误差逆传神经网络模型的机理的解释提出了敏感性分析法、Garson算法以及随机化检验等。误差逆传神经网络模型可以帮助
6、人们了解模糊性和不确定性较大系统的行为,这成为其较大的技术优势,这些技术优势是传统模型所无法比拟的,因而其可以作为对传统机理模型的重要补充。关键词:人工神经网络,误差逆传,农业及生态系统机理模型AbstractAgro-ecological system itself there is a certain uncertainty and ambiguity, if the traditional method to simulate these systems will be difficult. Neural network model as a new model system that
7、more accurately simulate these systems, ecologists have caused widespread concern. This systematic study of the error back-pass algorithm for neural network model, structure, and its focus on research in ecology and agriculture in the application. Three-layer neural network model structure of the er
8、ror back-pass neural network model, to simulate a high degree of continuity of complex functions, but also on its structure is difficult to compact the data appear consistent with the training situation. Error back-pass algorithm for neural network model with the use of input errors on the right to
9、adjust the value of the property. In research in the field of agriculture and ecology, the prediction of biological production, crop production, biological and environmental non-linear function modeling the relationship between the error mainly depends on retrograde neural network model. With the de
10、epening of the study, the researchers stopped by the mandatory training and composite models and other advanced technologies to improve the neural network model error retrograde extrapolation capability, while the error back-pass neural network model proposed to explain the mechanism of sensitivity
11、analysis, Garson algorithms and randomization inspection. Error retrograde neural network model can help people understand the ambiguity and uncertainty behavior of larger systems, which become larger technical advantages, these technical advantages unmatched by the traditional model, and therefore
12、its mechanism as the traditional model an important supplement.Key words:Artificial neural networks,Back-propagation,Agro-ecological system目 录摘 要2ABSTRACT3第一章 绪论51.1 研究的目的和意义51.2 文献综述61.3本课题的研究技术路线及主要内容8第二章 人工神经网的基本原理92.1 人工神经网络的概况92.1.1人工神经网络的概念92.1.2人工神经网络的特点92.1.3人工神经网络的应用与发展102.2 BP网络模型102.2.1 B
13、P网络的概念及其基本模型和特征102.2.2 BP 网络拓扑结构112.2.3 BP网络的工作原理及过程112.2.4 BP算法流程122.3 BPN网络模型132.3.1 BPN网络模型的算法和结构132.3.2 BPN网络模型的检验14第三章 BPN网络模型在农业及生态学研究中的应用163.1 BPN网络模型的模拟能力163.2 BPN网络模型机制的解释163.3 BPN网络模型的主要应用范围193.4 BPN网络的主要优势和缺陷203.4 提高BPN网络模型外推能力的方法21第四章 农业生态环境信息分析模型234.1BP人工神经网络层数的确定234.2传递函数和训练参数的确定234.3
14、BP人工神经网络拓扑结构的确定234.4 BP人工神经网络模型的训练、检验和测试24结 论25参考文献26致 谢29成都信息工程学院30硕士学位论文原创性声明30硕士学位论文版权使用授权书31第一章 绪论1.1 研究的目的和意义生态系统是一个非常复杂的系统,其涉及多因素、多过程,是一个“生物环境”互作的非线性系统。相对于这个系统,传统的农业和生物学领域统计模式大多建立在线性模型的基础上,这些模型的一大特点就是假定环境与作物的关系为连续的、平滑的线性多项式关系。这种建立在多元回归基础上的系统分析方法虽然能够能解决许多实际中存在的问题,但也有不尽如人意的地方。在实际应用中,生物的各种发展过程一般都
15、是非线性的,使用幂函数、对数函数和指数函数的非线性拟合过程,虽然在一定程度上提高了分析实验结果的精度,但对这种非线性数据统计模型的处理是建立在相关分析基础上的,有时是不准确的。随着农业和生物科学研究的不断深入,因素和过程成为越来越多的系统研究对象,对于整个系统的研究复杂程度逐渐提高,这也就导致系统的不确定性和模糊性随之增加。目前得到广泛应用的作物机理模型为APSIM、CERES、ORYZA等,这些模型虽然尽可能的包括了土壤、气象、水分及化肥使用等诸多重要因素,但是这也无法完全整合环境变量。当病虫害、杂草以及其他肥料等田间因素对作物很可能生产时限制影响,在这些模型中,这些田间环境因子还无法整合到
16、作物机理模型中,而神经网络模型的出现,解决了这一难题。ANN (人工神经网络) 特别适用于需要同时考虑多因素和多条件的环境,其具有分布式储存和处理、大规模并行、自我适应、自我组织、自我学习和容错性等特点,但是系统中因子之间的相互作用的机理还没有完全搞清楚。怎样对不精确信息以及模糊信息问题进行处理,成为今后科学家们的研究重点。人工神经网络模型对真实神经系统功能和构造予以极端简化。它具有以下三方面的显著特点是:第一,ANN具有很强的容错能力,它可以从不完善的图形和数据,通过一定的学习从而做出相应的判断;第二,人工神经网络可以最大限度的逼近任意复杂程度的非线性系统;第三,人工神经网络具有良好的自我适
17、应、自我学习以及一定的智能联想等功能。由于神经网络的三大显著的特点,使其具备了可以模拟传统非线性模型无法模拟的原始生态过程,正因为如此,近年来人工神经网络已经渗透到生物及农业研究的各个领域。但是神经网络模型也存在许多的争议,例如其经验性较强以及可解释性较差等。本文主要针对近年来在生态学以及农业的研究领域中应越来越用广泛的误差逆传神经网络(Backpropagation artificial neural networks,BPN)进行综述和研究,以期为神经网络模型在农业及生态学中的应用研究提供方法和理论指导。1.2 文献综述我国学者对人工神经网络在生态环境领域的应用进行了深入的研究,并且取得了
18、不少的成果。(1)人工神经网络用于环境质量评价李柞泳、邓新民(1995)二人合作建立了二级 BP 网络模型用以评价环境质量,其中一级评价主要是针对大气环境、地面水质和噪声污染等三个子系统建立 的BP 网络模型,对这三个方面的环境质量进行评价。在此之后,他们将一级评价中建立的三个 BP 网络模型的最大输出值作为接下来二级综合环境质量评价的输入值,从而建立起二级 BP 网络模型,这个模型主要是针对综合环境质量进行评价,也在一定程度上说明了 BP 网络模型对综合环境质量评价具有一定的通用性、客观性和实用性等优点。白润才(2001)通过研究将 BP 神经网络模型用于环境质量综合评价,建立了生态环境与影
19、响生态环境的因素之间的非线形关系,利用这一非线性关系可以评价生态环境的等级。研究结果表明, BP 神经网络对城市环境质量的评价是准确的,该模型具有很强的学习能力以及联想和容错功能。模型的分析结果和过程都接近人脑的正常思维过程和分析方法,这也使得研究人员对生态环境质量评价结果的精度更高。(2)人工神经网络用于大气环境质量评价李柞泳、邓新民(1997)经过研究建立了基于BP神经网络的大气环境质量评价模型,而且将这个模型用于农业生态大气环境质量评价体系,并将评价结果用模糊数学评价的一般方法评价的结果进行了对比研究,研究表明BP人工神经网络对于大气环境质量评价具有一定的通用性、合理性和实用性等优点。郑
20、成德(1999)采用BP网络建模对某地区农业大气环境质量进行了评价,并与模糊决策模型、灰色聚类模型及综合评判法的评价结果进行了比对,结果表明 BP 网络模型用于大气环境质量评价是具有优越性的。(3)人工神经网络用于地表水环境质量评价李祚泳(1995)将BP人工神经网络模型应用于湖泊水质分类,根据对全国 25 个湖泊的水质指标资料进行采样作为训练样本,建立了水质分类的人工神经网络模型,并用改模型对全国6个湖泊的水质进行了分类,从而检验神经网络的效果,结果显示BP人工神经网络模型对环境质量分类,具有广泛的适用性。郭劲松等在对水质进行综合评价中,将BP人工神经网络与模糊综合指数评价法、灰色聚类评价法
21、进行了对比分析,结果显示这种方法对于水质综合评价具有评价结果客观性强、准确度高、训练成功的人工神经网络通用性强以及计算简便等突出优点。唐婉莹等利用BP神经网络方法对长江流域水体中的氮元素污染情况进行了研究,结果表明BP人工神经网络既适用于定量指标的水质参数的评价同时也适用于定性指标的水质参数的评价,可以利用BP神经网络模型建立环境质量评价体系。高学民等将BP人工神经网络应用于长江流域水质研究,结果表明了BP网络在环境质量评价中是具有简捷、高效等特性的。郭宗楼研究了 RBF 网络在水质评价及湖泊富营养化程度评价中的应用,应用最小二乘法进行网络训练,避免了 BP 网络计算量大的问题,结果表明,RB
22、F 网络的分类能力、逼近能力及学习速度均优于传统的 BP 网络,在环境质量评价中,该模型评价结果客观,通用性强。(4)人工神经网络用于湖泊富营养化程度评价郭宗楼(1997)选用叶绿素、磷、氮、高锰酸盐以及水体透明度等五个参数作为基本评价参数,设计了三层前向式神经网络,并利用改进的BP神经网络算法对网络进行了训练以及检测。并用这个训练好的人工神经网络模型对国内的11 个湖泊的水体富营养化程度进行了研究评价,评价结果证明BP网络对湖泊的富营养化程度评价具有简便实用、客观性和通用性等优点,并且具有有广泛的应用前景。胡明星(1998)根据多年的研究设计了基于多准则学习的湖泊水质的富营养化评价模型,利用
23、此模型应对我国五大湖泊水质富营养化的进行了评价,评价结果显示,模糊神经网络对湖泊水富质营养化的评价具有简便、实用以及客观性强和应用广泛等优点。谢宏斌(1999)应用BP人工神经网络对我国南湖水质富营养化进行了综合评价分析,并将BP人工神经网络的评价结果与用分级评分法得出的评价结果进行了对比研究,研究结果显示两种方法得出的评价结果基本一致,这也说明该方法适用性强,通用性好等特点。任黎等(2004)设计了五步输入的BP模型,并把该模型应用于对湖泊富营养化程度自动地作出正确的评价中来,并利用该模型对太湖1994-2000年间水质的富营养化状况进行了综合评价。(5)人工神经网络用于生态环境分类乔平林(
24、2004)等对神经网络技术进行了深入研究,并根据生态环境的卫星地理遥感探测机理,设计了基于BP神经网络的农业区域生态环境信息自动提取模型,并利用这个模型对石羊河流域的农业生态环境进行了分类,分析结果显示采用该方法对生态环境的分类结果与实际情况基本一致。除多(2005)选用七项有代表性的指标,建立了神经网络模型,并且利用该模型对西藏拉萨地区的生态环境进行了分类,从而建立了将生态环境进行分类的 BP神经网络模型。模型的分类结果显示,拉萨地区的主要生态环境类型主要有河谷农业、山地草原、高山草甸、高山裸岩及冰雪等几个类型,从而说明了人工神经网络方法可以用于生态环境分类。实践表明,BP人工神经网络是完全
25、可以应用于农业生态环境研究的,与传统的研究方法相比,人工神经网络的农业生态环境质量评价方法具有客观性强、通用性强以及准确行高等优势,从而提高了农业生态环境质量评价结果的准确度,使评价过程大大简化。1.3本课题的研究技术路线及主要内容本文根据农业生态的一般规律,结合人工神经网络技术,从而建立起基于人工神经网络的农业生态环境信息分析模型,以对农业生态进行分析。本论文的技术路线如下图所示:第二章 人工神经网的基本原理2.1 人工神经网络的概况2.1.1人工神经网络的概念人工神经网络是人类在对我们大脑神经网络认识、理解水平不断提高的基础上,人工构建的能够实现某种特定功能的神经网络。人工神经网络是理论化
26、的人脑神经网络用数学表示的模型,是对大脑神经网络结构和功能进行模仿而建立的一种信息处理系统。它的结构是由大量简单处理单元以某种固定有序的方式互相连接而成的,能够对非连续的或者连续的输入做出相应的反应,并且能进行复杂逻辑操作,是一种实现非线性关系的动态信息处理系统朱大奇,史慧,人工神经网络原理及应用M,北京:科学出版社,2006:1。对于神经系统的研究可以追溯到1800年Frued的前精神分析学时期。而真正用数学模型来模拟人脑神经系统功能的ANN (人工神经网络)的研究则起源于二十世纪四十年代。上世纪五十年代F.Rosenblatt首次设计制作了著名的感知器,这是人类第一次从对神经系统理论研究转
27、入工程实现,从而开创了人类研究人工神经元网络的新纪元。二十世纪八十年代初, Hopfield网络模型的提出,拉开了人类研究神经网络计算机的序幕。2.1.2人工神经网络的特点随着现代神经生物学和认知科学的不断发展,以其为基础的人工神经网络被提出,其直接作用就是用模拟生物神经系统对真实世界物体做出交互反映。人工神经网络由大量基本处理单元也就是神经元广泛连接而成,大规模并行模拟处理信号和信息,其中依靠神经元之间的层次关系和连接的强度实现信息的存储,使得在实际工作中,信息的存储和处理有机的融合在一起。人工神经网络作为一种大规模自适应非线性动力学系统,因而具有很强的联想记忆功能和自我学习能力,从而提高运
28、行效率,取代传统的计算方式。另外,人工神经网络模拟的是人脑生理结构和机制,是一种有别于逻辑思维、符号推理的人工智能技术。它对于处理特征缺损的模式识别,不完善的联想记忆以及规则的自动学习等问题具有一定的优势。特别是在求解难以建立模型的复杂问题方面发挥着传统模型无法替代的作用。人工神经网络不仅具有很强的收敛性、稳定性、鲁棒性等特性,而且能实现模式识别、非线性映射、聚类分析、函数逼近、优化设计、数据压缩等功能,在处理各种信息方面有着特别广泛的应用。例如手写体识别、语音识别、人像识别、基因检测、细胞分类等。2.1.3人工神经网络的应用与发展神经生理学家早在20世纪初就己发现,人的各种思维方式以及智力功
29、能都定位在人体的大脑皮层上,而大脑皮层是由无数的神经元以及数以千万亿的连接支持神经元的胶质细胞组成。其中最基本的信息处理单元是神经元,它们通过突触进行相互连接,构成了极其复杂的人体神经网络系统。人体神经网络系统具很强的逻辑运算和数值运算能力。正是由于人们对人体神经网络系统的研究,认识到系统结构决定系统功能,据此建造出多种人工神经网络系统。当然,这些ANN的结构仅仅是对人脑生物神经网络系统的简化的模拟。尽管如此,人工神经网络在一定程度上具有了人脑的某些基本特性,如具有并行处理、联想记忆、自我适应、自我学习、自我组织和容错性等一些特点。这些特性在一定程度上促使ANN形成一定的能力,如模式优化决策、
30、预测评价和识别等能力。人工神经网络是以处理单元即神经元为节点,用加权有向线连接的有向图形。各单元之间相互连线,形成一种拓扑结构,而这种结构即为人工神经网络的联结模式。人工神经网络系统的一般运行规律是:首先系统从环境中接受有用的信息,然后开始计算处理,最后将结果再次输出到环境中去,在人工神经网络内部各种处理单元之间的连接并不仅仅信息传送通道,它还能够反映二个处理单元之间的权重系数,该系数可调整信息量的大小。在大多数人工神经网络模型中,可以根据一定需要改变权重系数,因为它是一个参变量,其如何改变由人工神经网络的学习规则决定。由此可见,人工神经网络的结构由处理单元、学习规则和联结模式这三个基本要素构
31、成,其独有的特征性也由此产生。2.2 BP网络模型2.2.1 BP网络的概念及其基本模型和特征 误差逆传播学习算法是由Pall Werbas博士于上世纪七十年代提出的。之后,以Rumelhart和McCelland为首的科学家小组则完整概括并提了这一学习算法,他们在1986年出版的著作并行分布信息处理一书中,详尽的分析与介绍了用于多层前馈网络的误差逆传播学习算法(BP算法),并深入探讨了这一算法的潜在能力。后来人这种前馈型算法被简称为BP网络。BP网络具有实用、简洁和高度的非线性映射能力等优点,其目前已经成为世界上最流行的网络模型之一,己被广泛应用于模式识别、信号处理、数据压缩、系统辨识等诸多
32、方面。在人工神经网络的实际应用中,绝大多数的模型采用BP网络或以其为基础的其他变化形式。BP神经网络于1986年由Rumelhan七和MeClelland提出,是目前应用最为广泛的和成功的神经网络之一,它是一种多层网络的“逆推”学习算法。其基本思想为:学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时输入样本从输入层传入,经隐层逐层处理后传向输出层。若输出层的实际输出与期望的教师信号不符,则转向误差的反向传播阶段。误差的反向传播是将输出误差以某种形式通过隐层向输入层逐层反向传播,并将误差分摊给各层的所有神经单元,获得各层的误差信号,并把此误差信号作为修正各单元权值的依据。这种信号
33、不断的正向传播与不断的误差反向传播的过程在网络中的各层权值调整过程反复的进行,网络的实际输出的权值就会逐渐向各其所对应的期望输出的权值靠拢,人工神经网络对输入模式的响应的正确率也就逐渐的提高了,因此系统具有稳定性。在系统运行过程中,权值不断调整的过程也是BP人工神经网络自我学习和训练的过程,此过程将不断的重复出现,直到网络的输出误差减少到最小范围或达到预先设定的学习次数为止。从类型上讲,BP神经网络是典型的前馈型网络,一般来说它由输入层、若干隐层也就是中间层和输出层组成,BP神经网络学习的过程是误差向后传播的同时不断修改连接层中的加权系数的过程。BP神经网络的原理是将神经网络学习过程中的输入输
34、出的映射问题变成一种非线性优化问题,并且使用梯度下降算法,用迭代运算方法来修正神经网络的权值,从而实现网络输出权值与期望输出权值间的方差最小。这种网络算法包括前向计算过程和误差反向传播过程两部分。在前向计算过程中,输入信号由输入层向隐层逐传递,最终传向输出层,每一层神经元的状态只对下一神经元的状态有影响。如果输出层的输出与期望的输出不一致,则反向传播,将误差信号沿原路返回,经过对各层的权值的修改,使得误差信号逐步最小。权值修改量只与该权值相连的前一节点的输出和后一节点的误差有关,这样使得BP算法易于实现。2.2.2 BP 网络拓扑结构BP网络是阶层型前向神经网络,一般具有三层或三层以上。上、下
35、层之间各处理单元实现相互完全连接,即每一层的每一个神经元与其相邻两层的每一个处理单元实现全连接,而同一层各处理单元之间无连接。网络拓扑结构如下:图2-1 网络拓扑结构图2.2.3 BP网络的工作原理及过程 BP网络按照一定的顺序进行学习,学习过程大体可分为两个阶段:第一,信号正向传播阶段,当网络接收到一对学习模式后,处理单元开始激活,并将数值从输入层经各隐含层向输出层不断的传播,输出层的各处理单元获得网络的输入响应;第二,是误差修正反向传播阶段,当输出层没有得到预期的输出值时,数据将会被则逐层递归地计算实际与期望之间的误差,方向为减小期望输出与实际输出的误差,然后从输出层开始经各隐含层逐层进行
36、修正各连接权,最后再回到输入层,这就是所谓的“误差逆传播学习算法”。根据这种误差逆传播修正的结果,网络对输入模式响应的正确率也不断提高。2.2.4 BP算法流程BP算法共有六个步骤,是一种监督式学习算法,在大多数的BP网络中都采用这种算法。BP神经网络算法的步骤主要有以下几个:(1)运行开始前必须初始化网络及学习参数。(2)提供各种满足学习条件的要求,如训练模式、训练网络等。(3)确定的训练模式以及计算出网络的输出模式,并与期望模式相比较,若误差与期望模式相比较,如符合要求,则执行反向传播过程(4),否则返回到第(2)步骤。(4)计算单元误差,对权值进行修正,再返回步骤(2),继续运算。BP网
37、络的学习是通过用给定的训练集训练而实现的训练,学习的效果通过均方根误差的大小来定量反映,基本即算法的流程如图2-2所示。设学习样本数为P,输出向量x1,x2,xp,希望输出向量t1,t2,tp,学习算法是将实际的输出向量y1,y2,yp与1,t2,tp相减而得的差值来修改连接权和阈值,使y与期望要求尽可能接近。如果输入第P1中的一个个样本对,通过一定方式学习后,得到一组权wp1,此时wp1的解不是唯一解。图2-2 BP算法流程图BP网络整个过程分为两阶段:从网络的底部向上进行计算,如果网络的结构和权已设定(如不设定初始值,BP网络可能不收敛),输入己知学习样本,就可以计算每一层神经元的输出;对
38、权和阂值的修改,从已知最高层的误差修改与最高层相连的权开始,然后修改各层的权。两个过程反复交替,直到网络收敛为止。如果选择神经网络输出神经元对每个学习样本的输出与相应的理想输出的均方差小于某一极小值为结束条件,则在一个学习周期结束需进行判断,如果所有输出的均方差小于E,则表示学习结果满足要求,可以结束该BP网络学习过程;否则继续对样本集合中所有样本进行学习,开始下一个学习周期。2.3 BPN网络模型2.3.1 BPN网络模型的算法和结构误差逆传神经网络包括一个输入层、一个或多个隐含层和一个输出层等几部分构成。BPN网络模型的输出层和输入层处理单元的结点数由输入、输出变量的多少决定,因此对网络起
39、决定性的作用为隐含层处理单元结点数的多少。在神经网络中,隐含层的结点越多, BPN网络模型收敛速度就会越慢慢且容易产生与训练数据的相吻合的情况;而如果结点过少,那么BPN网络模型又难以拟合输出、输入变量之间的关系。隐含层节点的多少通常由问题的复杂程度决定。经过反复的研究实验发现,一个三层的BPN网络模型就能完全模拟任何连续函数。所以,在现有的模拟神经网络的研究中一般采用三层,这种简单的神经网络更容易解释,提高训练速度,同时简单的神经网络也避免了产生过度吻合的问题,三层的神经网络结构如图2-3。图2-3 神经网络结构图图片来源于中国科学院植物研究所植被数量生态学重点实验室BPN网络模型算法以利用
40、当前的输入误差来对权值进行调整为主要特征。BPN网络模型的主要算法如下:(1)根据输出、输入变量的数目,对输入层、隐含层和输出层的神处理单元点数进行初始化;(2)设定神经网络的最大迭代次数和学习速率;(3)反复对每一个训练向量进行以下47步的过程;(4)把输入向量赋值给输入层结点,同时把输出向量赋值给输出层结点;(5)对输入层向隐含层结点的输入进行计算, 同时计算隐含层结点,并以同样的方法计算输出处理单元的输出;(6)计算输出层和隐含层的误差项;(7)根据上一步的结果计算各结点的新权值,并修改原来的权值。如果BPN网络模型的迭代次数小于最大迭代次数或者误差大于某一个预先设定的阈值,重复进行47
41、步的运算。模型算法的是把一组样本输入输出的问题转化为一个非线性问题进行解决。虽然BPN网络有着很多的优点,但BPN网络模型算法尚存在一些缺陷,例如收敛慢、迭代次数多,容易形成局部极小而得不到整体最优等。为解决BPN网络模型算法的一些问题,国内外学者经过长期研究,提出了共轭梯度法、自适应学习率法、快速优化学习算法和变尺度法等改进方法。2.3.2 BPN网络模型的检验BPN网络模型的应用,必须依靠一定数量的样本,并用一定数量的样本检验训练模型的模拟能力。长期研究认为:训练的样本数与网络权值数量比为5:1。当样本达到10倍时,才不会导致模型的局部优化,即与训练数据的高度吻合。检验模型模拟能力时,分别
42、用不同的两个数据集训练和检验模型,两个数据一个用于训练和测试模型,另一个用于验证模型。但在实际研究中,由于人力和物力方面的限制,很难同时满足这个条件。如果样本足够大时,通常随机地把整个数据集分成训练样本数和测试样本数两部分,他们的比例可为1:1或2:1或3:1等。当然,测试样本的数量要足以检验网络的模拟能力,训练样本的数量要足以代表输入、输出变量之间的关系;采用全部测试样本与训练样本进行测试,采用交互验证的方法对BPN网络进行训练和测试是一般使用的方法。如果样本数据不是很充足,一般采用Jacknife过程分配测试样本与训练样本,即样本被同时分成n个部分,用其中的1个部分对样本进行训练,用其余的
43、样本进行测验,重复n次这样的过程,就能测验出网络的模拟能力。第三章 BPN网络模型在农业及生态学研究中的应用在农业和生态学领域的研究中,作为非线性函数模拟器的BPN网络模型通常被用于预测作物产量以及生物与环境之间的关系等问题。从20世纪90年代初期开始,BPN网络模型被广泛的应用于农业和生态学研究中,随着对BPN网络模型的研究不断的深入,这一模型的局限性也被人们所熟知,因此一些改进BPN网络模型的方法也被提了出来。3.1 BPN网络模型的模拟能力在综述BPN网络在农业和生态学中的应用时,Schultz和Wieland(1997)及Schuhz等(2000)认为:BPN网络模型比多元线性回归的模
44、拟的效果要好,其模拟效果与非线性模型的模拟效果相差无几。Lek等(1996)认为:无论采用什么样的方法,多元回归在拟合非线性关系方面的表现效果也很差。相对于前两种模型,BPN网络模型的预测效果最好,既使变量没有进行非线性转换。Wolf和Francl(1998)利用BPN网络模型,设计出小麦病菌肌感病周期的模型,并将此模型与用逻辑型回归和多元判别分析建立的模型进行比较。实验结果表明:BPN模型的预测精度为87,远远高于逐步逻辑回归和多元判别分析的69和50的预测精度。Starrett等(1998)利用BPN模型预测泥炭草地杀虫剂的淋洗效果,并将此模型与利用一次和二次多项式回归建立的模型预测的效果
45、进行了比较。结果表明:BPN模型预测值与实测值的离差平方和为174,而一次和二次多项式回归模的预测值与实测值的离差平方和是BPN模型的几十倍。对BPN网络模型进一步的研究后发现,其拟合能力与非线性模型十分的类似。van Wijk等(2002)在模拟冷杉林气体交换时建立了4个模型,他们分别是BPN网络模型、指数模型、模糊逻辑模型和基于过程的FORGRO模型。在对这四个模型进行比较后,结果表明:模糊逻辑模型与BPN网络模型的拟合能力最强,但是BPN网络模型相对于其他模型而言不能用以解释生态过程的机制,而其它3种模型则具有很好的解释性。Moisen和Frescino(2002)也做了同样的比较,他们
46、是在预测森林特性时建立了包括BPN模型在内的5种模型,在模拟绘制预测图方面,BPN网络模型明显要优于线性模型以及其他部分非线性模型。由此可见,BPN网络模型的拟合能力比大多数线性和非线性模型的都要好,但是作为“黑箱”过程,目前还没人能够理解BPN网络模型对生态系统机理的拟合机制。3.2 BPN网络模型机制的解释BPN网络模型通常被认为是数据驱动的经验模型和“黑箱”模型,这种模型很难对模拟的生态过程进行机理性解释,而且生态学知识也难以从模型中提取,因此一般情况下认为不具有外推性,这也是BPN网络模型存在争议的原因。但是,经过多年的研究表明, BPN网络模型的机理还是可以通过一些方法进行解释的,主
47、要有:神经网络机制图Garson算法(GarsonS algorithm)、(Neural interpretation diagram,NID)、随机化检验以及敏感性分析等。采用BPN网络模型的神经轴突连接权值来预测变量的贡献是近些年来研究人员关注的一个重要方法。0zesmi和Ozesmi(1999)建议用一个可视化的神经机制图来提供解释,连接线的厚度表示神经元之间的连接权值以及神经元之间的连接强度,神经元之间关系的正负用连接线的底纹来表示。如较大的权值用粗线表示,较小的权值用细线表示,神经元负相关用灰线表示,黑线则表示神经元正相关(如图3-1)。通过神经元之间的连接线,输入层到输出层就可以确定,同时输入变量之间的关系也可以得到确定,而且还可以反应变量对整个模型之间的贡献,此外,还可以用输入变量的相对重要值来表示输入变量对网络模型的贡献。图3-1 神经机制图Garson(1991)研究出一种计算每个输入变量对整个输出的贡献的算法,G0h(1995)又对这个算法进行了进一步的改进。Garson算法计算输入变量的相对贡献的方法是采用连接权值的绝对值,因此这种算法就不可能提供输入、输出变量之间相关性的正负关系。根据