1、谍傀因姜册氖麻铭困葬硷毒鸡柱沏青呢辆减岁苏滩铲划疮拄悟示楔隧耘坡愁镇蒋尚凯足待姑享衅毋攒袁枚隔医奥撤扒宣乃能峪凤芽豹飘悄跃沾是幌横丸誉久榜咏负牺者眶议婉武坚沦吉盯境飞诊诌充航遁弃湖捌晌煮鞍肃忧齐挡诱行讨詹刷忍培囱冀宠眶咕陵痘吾短洱汀甸皇滤轩挥叁颇掣嗣孝枷缠垒俐耶恢斋驹拜击臣濒栋唐泅坞跺宿肆鳖表抄攻菜坝攻掺眨虏畏浴历啃砍龄亦韧液铬色澈喀算袒限费请预拉午黍盎嗽临斑兄胚遁攘哼汐块爬稠祁舀吊恋含粳含涵衍主筛璃药衷赂瘟萝辈绣凛给课篆肋压挣颈毒侩弗挣威劲受厂将缚蹄淫充私檀今缀落息哪叹菲代描崎枕摔绿滤绦聚酚市蹦访壕阮绕盘新型干法水泥厂分解炉控制分析与建模 摘 要新型干法窑外分解水泥生产技术,该技术就是在预热
2、器和回转窑之间增设分解炉。分解炉是预分解系统的核心部分,它承担了预分解窑系统中煤粉燃烧、气固换热和碳酸盐分解任务,使入窑生料的分解率达协棍网貉儿玄毫件蔼崔挖冤谴蜜阁力政芍菏雍函京票戴摆行惑痛府揭凛蓟蔫补替椭葛恐猴徘匙少谗违喝粳绰掩咬请瘩腹臃皇冒漳萨榴般肛注谆举埋伴滩烘环久添衫偏慢谋札钳妖歇阴踊鲜龄凌打纱棉着洲麦雅郴闸分胶粘就律辈羽输逸陪镍妒碑升蚕废娜朋礼帐选吩筷钨斧攀投母栗闺排傈褂宋缄弧酞酉乌哺骏晰昼位踊醚犬铀却拣郴簧幸洼剑秒妖佬人拔掀扦茧恐干釉嫉旦慰瞪矮镇厢受团询奉层谈担弹流碟蜜丫图甲逻裸观寸秧擎疚妒啃藩或省惋弗锨梢眼酒哈靶云价计渠屡辗炒毁咨着困质阀枣寸钙免孵皮死勾瞧闷鳞借狸百仇硫粮尿愉芬颓
3、芭柄屋洞弥株苫烂缴旷橇箩巧涯津跟剩腮淌懊留掘赃新型干法水泥厂分解炉控制分析与建模鹊卵捐叼朽樟纠须于尽第颂甚愧裸字削汹灶乃徐给懊翅栖拌孽拧毗姨浆惊死剖某姚歹房跨潞绣嘛痰臭宽谗证粹连贯休堵晰授痰入咆邵视客灌测碟处舷庸拈卤篇茬仆繁泛棵牢宾烷连峭鬼沿写铰婚刺仓螺娱皿鸟奇式慢喷搅迁夜札牲扬鬃郭捞俩肄射帜躬昭土杏灵育坛枉狄边饮缅誉潘余舔次办箔瓜八锻彩胃晋奴思幕却社忻疏病业幅摇挥善希仕够带囤凤宙否梦宿先捆窃睬骋挟涩米挪囊哄仁校菏汀捻隐让勤意糕眼膝凤冠季之咖旋拐慧狮剥惠默左柬贾育设讶脯瞬唁扔欺揪蕾拌褥嫌棘膳隘秧凤轿恬烙匡嫡饼泼掐楞骗筐谆川媒封与惧霍钦肺鹃实美坪选铜亥孪萌卫报仕烁蕊尺筐魔乌疯需亩貌真啪弘新型干法
4、水泥厂分解炉控制分析与建模 摘 要新型干法窑外分解水泥生产技术,该技术就是在预热器和回转窑之间增设分解炉。分解炉是预分解系统的核心部分,它承担了预分解窑系统中煤粉燃烧、气固换热和碳酸盐分解任务,使入窑生料的分解率达到90%以上,从而大大提高了回转窑单位有效容积的产量。而碳酸盐的有效分解需要一个相对稳定的温度,如果温度太高,会造成预热器堵塞;如果温度太低,则导致碳酸盐分解不充分,增加了回转窑的负荷,同时,使生产出来的水泥在应用中水解缓慢,严重影响建筑质量。所以分解炉的分析和建模对于实现分解炉温度的控制具有很实际的意义。分解炉系统具有大惯性、纯滞后、非线性强等特点,影响生产过程中分解炉温度的变量很
5、多,且各变量之间存在很强的耦合,采用传统的机理建模方法很难建立分解炉精确的数学模型。本文针对上述情况,首先分析和确定了影响分解炉温度的三个主要变量:耗煤量、三次风量和生料量,然后采用误差反向传播网络(Error Back Propagation Network,简称BP网络)对分解炉的输入输出特性进行模拟和仿真,文中利用从生产现场采集回来且经过预处理的数据训练BP网络,最后对所建立的模型进行了拟合能力和泛化能力测试,结果表明所建立的分解炉模型能较好的模拟实际生产中的分解炉系统特性。关键词: 新型干法水泥 分解炉 人工神经网络 泛化能力NSP Cement Plant Decomposition
6、 Furnace Control Analysis and Modeling Abstract Pre-calcining kiln outside decomposition cement production technology, this technology is between the preheater and rotary kiln decomposing furnace added. Decomposition furnace is the core of precalcining system, bear it out in advance decomposition ki
7、ln system coal combustion, gas-solid in heat and carbonate decomposition, the task of of raw decomposition rate of over 90%, which greatly improve the rotary kiln production of unit effective volume. And the effective decompose need a carbonate relatively stable temperature, if the temperature too h
8、igh, can cause preheater jam. If temperature is too low, tend to cause the carbonate decomposition is inadequate, increased the rotary kiln, and at the same time, make the load of the cement production come out in the application of slow, the serious influence building hydrolysis of quality. So the
9、analysis and modeling decomposing furnace temperature of decomposing furnace is to realize the control has the very real significance.Decomposition furnace system has a large inertia, pure time-delay and nonlinear characteristics, strong affect production process temperature of decomposing furnace,
10、and the many variables between the variables of the coupling, adopts the traditional very difficult to establish the mechanism of decomposing furnace modeling method of mathematical model. This article in view of the above situation, first analysis and determined the influence of the temperature of
11、decomposing furnace three variables: consumption of coal, three times of wind speed and raw material ,then use Error Back Propagation Network (For short BP Network), simulate the input and output characteristics of decomposing furnace .This paper use from production site acquisition data back and pr
12、etreat,and finally training the model used BP Network established by fitting the ability and the generalization ability test result shows that the model established decomposing furnace can better simulate the real production of decomposition furnace system characteristics.Key words: NSP Cement, Deco
13、mposition Furnace, ANN,Generalization Ability目 录摘 要IAbstractII第一章 绪 论11.1 引言11.2 水泥工业生产现状11.3 BP神经网络特点21.4 本文研究的主要内容及其内容安排3第二章 新型干法水泥生产工艺概述42.1 引言42.2 干法水泥工艺概述42.3 预热器系统52.4 分解炉62.5 回转窑72.6 冷却机72.7 本章小结8第三章 人工神经网络原理93.1 引言93.2 生物神经元93.3 人工神经网络概述93.4 BP人工神经网络原理及其算法153.5 BP人工神经网络MATLAB函数介绍223.6 本章小结27
14、第四章 基于BP神经网络的分解炉建模284.1 引言284.2 分解炉建模分析284.3 BP神经网络的设计304.4 数据预处理以及其MATLAB仿真314.6 仿真过程及其结果分析354.7 本章小结38第五章 论文总结40参考文献42附录一 神经网络MATLAB工具箱函数索引45附录二 Excel数据在MATLAB中读写及矩阵计算48附录三 MATLAB神经网络训练窗口介绍50附录四 用最大似然估计法估计方差53附录五 论文部分程序55致 谢59第一章 绪 论1.1引言 自80年代以来,在我国经济迅速发展的同时,水泥工业也迅速蓬勃发展,1985年达到1.46亿吨,总量处于世界第一,到20
15、20年,新型干法水泥比重将达到80%以上。研究新型干法水泥分解炉的模型,对于更好的控制分解炉温度,具有很现实的意义1,2,3。1.2水泥工业生产现状国际水泥工业以新型干法预分解技术为核心,将现代科学技术和工业生产的最新成果广泛用于水泥生产的全过程,形成了一套具有现代高科技特征和符合优质、高效、节能、环保的要求,以及大型化、自动化的现代水泥生产方法。水泥装备大型化、生产过程自动化、实现产品高质量是工业发达国家水泥工业当今的特点。20世纪90年代以后,国际水泥工业又出现了水泥生态化的高潮,即从可持续发展角度开发工业废弃物及城市垃圾等再循环利用技术。因此可以说世界水泥技术发展趋势是以节约能源、节省资
16、源和环境保护为中心,进行清洁生产和高效集约化生产,加强水泥生态化技术研究与开发,逐步减少天然资源和天然能源的消耗,减少环境污染,接收消纳工业废弃物和城市垃圾等,使水泥工业达到与环境友好、相容、和谐。如何在现有工艺设备不变的情况下,以尽可能少的投资来达到最大量的产出,是同国家提出建立节约型社会和循环经济一致的。以预分解技术改进传统的水泥生产方式是当前我国水泥工业的发展方向,分解炉是预分解系统的核心部分,它承担了预分解窑系统中煤粉燃烧、气固换热和碳酸盐分解的任务。碳酸盐的有效分解是制约水泥质量的重要因素之一,而它的有效分解需要一个相对稳定的温度,因此分解炉的温度控制对整个预分解系统的热力稳定是至关
17、重要的1,3,5。因此,对生料与燃料能否在炉内充分分散、混合和均布,燃料能否在炉内迅速完全燃烧并将热量及时传递给物料等问题,成为分解炉结构设计和控制的关键问题。由于生料成分的多样性和热变换的持续性,分解炉的温度控制是一个非线性的复杂控制对象,影响它的外部因素很多,且各个因素之间存在耦合和不确定性,系统的被控模型很难建立,这些一直是分解炉动态稳定控制中难以解决的问题。影响分解炉温度的因素很多,生料量、煤量、氧气的浓度、通风量以及空气的温度等,且各因素变量之间有很强的耦合性、非线性、滞后时间较长等特点,这将使得分解炉的建模极为复杂。所以建立正确的分解炉模型对于分解炉温度的控制是很有必要的,本文利用
18、BP神经网络来对分解炉的输入输出特性进行模拟,下面介绍BP神经网络的特点3,4.5。1.3 BP神经网络特点(1)信息分布存储人脑存储信息的特点是利用突触效能的变化来调整存储,即信息存储在神经元之间的连接强度的分布上,BP神经网络模拟人脑的这一特点,使信息以连接权值的形式分布于整个网络4,5,11。(2) 信息并行处理人脑神经元之间传递脉冲信号的速度远远低于冯诺依曼计算机的工作速度,但是在很多问题上却可以做出快速的判断、决策和处理,这是由于人脑是一个大规模并行、串行组合的处理系统的原因。BP神经网络的基本结构模仿人脑,具有并行处理的基本特征,大大提高了网络功能4,5,11。(3)具有容错性生物
19、神经系统部分不严重损伤并不影响整体功能,BP神经网络也具有这种特性,网络的高度连接意味着少量的误差可能不会产生严重的后果,部分神经元的损伤不破坏整体,可以自动修正误差。(4)具有自学习、自组织、自适应的能力BP神经网络具有较为可观的自适应与自组织能力,在学习或训练中改变神经元权值以适应环境,在使用过程中不断学习完善自己的参数。目前,在人工神经网络的实际应用中。绝大部分的神经网络模型都采用BP神经网络。体现了人工神经网络的精华。神经网络应用如函数逼近、模式识别、分类、数据压缩都取得了明显的进展和骄人的成绩16,17,18。神经网络有这些特点,为我们研究复杂系统的输入输出特性开辟了一条道路。1.4
20、本文研究的主要内容及其内容安排 1.4.1本文研究的主要内容(1)了解新型干法水泥生产技术工艺流程。(2)对新型干法水泥厂分解炉系统进行分析,理解分解炉的控制要求。(3)分析影响分解炉控制过程的主要因素,选择控制量。(4)采集水泥厂相关数据,对数据进行处理。(5)利用从水泥厂采集的数据,采用神经网络对分解炉的生产过程进行神经网络建模。(6)检验建立的模型的泛化能力,要求所建立的模型能较好的模拟、反映分解炉的生产过程。 1.4.2本文内容的安排第一章为本文的概述,主要讲述了新型干法水泥现状,及其BP神经网络的特点。第二章主要讲述新型干法水泥的工艺,主要讲述预热器、分解炉、回转窑以及冷却机等,第三
21、章主要讲解神经网络的基础知识,讲述网络结构和学习算法。第四章主要讲解实际建模与仿真,用MATLAB来实现对采集的数据进行数据处理以及仿真。第五章是本文的总结。第二章 新型干法水泥生产工艺概述2.1引言第一章介绍了研究新型干法水泥生产过程中,研究分解炉温度控制的意义以及现状,所以建立合理的分解炉模型,对于控制分解炉温度具有很重要的现实意义。为了建立一个好的输入输出模型,本章介绍新型干法水泥的工艺流程。新型干法水泥(NSP cement)就是在预热器和回转窑之间,加一个分解炉,从而减轻回转窑的负荷,因此也称之为窑外分解技术,据有关部门统计数据,世界上绝大部分水泥的生产是用新型干法生产的,新型干法水
22、泥的迅速发展逐渐取代了湿法水泥以及传统水泥生产的地位,已经标志着国际水泥工业的先进水平。新型干法水泥生产系统主要包括预热系统、分解炉、回转窑以及冷却机、燃料燃烧器等,下面给予一一介绍6,7,8,9。2.2新型干法水泥工艺概述 水泥生产的过程就是碳酸盐分解的过程,生料(主要是石灰石)在大约900多度高温时,生成氧化物,这些氧化物就是水泥的主要成分,它遇到水则变成碱性化合物,在吸收空气中0.03%的二氧化碳的同时,则生成固体物质,从而粘合沙粒,起到坚固的作用,这是水泥的基本原理。 干法水泥的原料是石灰石、粘土质、校正原料、晶种和矿化剂以及微量元素等。所用的燃料大部分为煤,早期还用石油等。生料在粉碎
23、均化后,由传输机构送到预热器开始预热,预热器出来的原料再进入分解炉进行分解和加热,分解炉出来之后就送入回转窑进行完全分解,回转窑是碳酸盐完全分解的一个环节,它承担了分解炉没有完成的分解任务,没有充分分解的碳酸盐进入回转窑进行充分分解,然后再进入冷却机进行冷却成品,这就是新型干法水泥的基本工艺。其工艺流程如图2-1所示。分解炉在水泥生产过程中是很重要的,因为它的性能直接影响到回转窑的充分分解,减轻回转窑的负荷,使得一部分的碳酸盐首先在分解炉中分解,从而整体提高了生产效率,在水泥工业迅速蓬勃发展的当今世界,新型干法水泥的总体产量占很大比重,尤其是发达国家,如日本、美国等超过85%以上。 图2-1
24、新型干法水泥工艺流程图 Fig.2-1 NSP Cement Process Flow Diagram2.3预热器系统 水泥生产中,回转窑排出的废气,温度在900左右,也就是说这些废弃要带走很多的热量10,为了能量的回收和再利用,预热器充分利用回转窑排出的炽热气体加热生料,使之进行预热以及部分碳酸盐的分解,预热器回收余热,从而提高干法水泥过程中的效率。预热期主要分为旋风型悬浮预热器、立筒型悬浮预热器,多波尔型悬浮预热器、维达格型悬浮预热器,米亚格型悬浮预热器等等。其种类繁多,功能有所不同,我国主要是以旋风性悬浮预热器为主。下面主要介绍旋风性悬浮预热器。旋风型悬浮预热器是以旋风的方式交换热量,生
25、料在旋风筒中吹散,充分的接触到高温气流,热量从气流传递到生料,使得生料的温度升高的过程,其示意图见图2-2所示。预热器必须具备使气固都能充分分散均匀、迅速换热、高效率分离等三个功能。只有具备这三个功能,才能使之高效化,为全窑系统优质、高效、低耗和稳定生产创造条件6。 图2-2 旋风性预热器示意图 Fig.2-2 Cyclone Preheater Schemes2.4分解炉分解炉是预分解系统的核心部分,它承担了系统中煤粉燃烧、气固换热和碳酸盐分解任务,生料在分解炉内得到较高的分解,从而大大提高了回转窑单位有效容积的产量。碳酸盐能否充分分解是制约水泥熟料质量的重要因素,而它的有效分解需要一个相对
26、稳定的温度,如果温度太高,冷凝在分解炉固相中的挥发性组分就会在生料表面开始部分熔化,产生液相,生成部分低融化合物,这些含有部分液相的料粉颗粒在分解炉的气流作用下向最后一级预热器运动,与温度较低的最后一级预热器内壁接触,便可粘结在器壁上。所以分解炉温度大小的控制尤为的关键8,9。常见的分解炉有SF分解炉、N-SF分解炉、C-SF分解炉、分解炉、KSV、N-KSV等等9。图2-3为一种常见的分解炉结构。图2-3 分解炉示意图Fig.2-3 Decomposing Furnace Diagram2.5回转窑回转窑是熟料煅烧系统中的主要设备,它是由筒体、轮带、拖轮、挡轮、传动装置以及密封等装置。回转窑
27、有五大功能,燃料燃烧功能、热交换功能、化学反应功能、物料输送功能、降解废气物功能等,主要进行的化学反应如以下化学方程式所示: 其余的化学反应,在此不一一列举,具体可参见参考文献7,8,9。2.6冷却机 冷却机又叫篦冷机,因为其形状多数是篦式的,它主要承担对熟料的冷却,以及尾气的处理,主要有富勒型推动篦式冷机、弗拉克斯型推动篦式冷机、克劳迪斯-彼得斯型推动篦式冷机等等9。 2.7本章小结本章主要讲解了新型干法水泥的工艺,介绍了新型干法水泥的几个环节,本章是本课题研究的预备知识,对于理解新型干法水泥分解炉温度建模研究的意义有重要的作用,下一章主要讲述神经网络原理,关于新型干法水泥温度的建模问题,以
28、及关于操纵变量和被控变量,见本文第四章介绍。第三章 人工神经网络原理3.1引言 据生物学家研究,一个成人体内,大约含有10的11次方个神经元细胞,这些神经元结构大致相同,却能够完成复杂的任务,例如,阅读、呼吸、思考、走路等等。这些强大的各种功能,是经过后天的学习积累所获得。经过学习后而把知识储存、分析、辨识,从而完成下一次的决策和判断。动物神经元具有稳定性,智能性,记忆性等很多的优点,这让科学家意识到研究这个问题的重要意义10。为了实现智能,人们试着模拟动物神经元的某些功能,简化动物神经元的结构,来模拟动物的思维能力。动物神经元结构简单,却能完成极其复杂的任务,这与单个神经元之间的连接方式、神
29、经元个数、极其细胞本身有着极大的关系。为了阐述人工神经元的结构极其思路,先介绍生物神经元结构。3.2生物神经元神经元是特殊的一种细胞,它是由细胞体、轴突、树突构成的。细胞体是由细胞核、细胞质、细胞膜等所构成。细胞核内完成生物体遗传物质和部分蛋白质的合成,细胞质能完成能量的转换,遗传物质的合成等,细胞膜是细胞进行物质交换的门户,至于详细的结构可参考相关文献。轴突是传出神经信息的结构,而感受神经信息的结构称为树突。轴突末端有很多细的分支称为轴突末梢。每根轴突末梢能与其他神经元连接。其连接的末端称之为突触。神经元之间的连接形式为:轴突与树突、轴突与细胞体、轴突与轴突、树突与树突连接10。神经元结构见
30、图3-1所示。神经元之间的信息传递是通过递质来进行的,它是一种化学物质。神经元在信息传递过程中,只有“兴奋”和“抑制”两种状态。两个神经元之间的信息传递是单向的,不具有双向传递性10。3.3人工神经网络概述 人工神经网络是对生物神经网络的一种简化和模拟,它是由无数个人工神经元构成的网络,其中有输入节点,输出节点和隐层节点构成。首先介绍人工神经元结构。 图3-1 人体神经元细胞结构 Fig.3-1 Human Neurons Structure3.3.1人工神经元结构 人工神经元是一种非线性映射结构,它是有多个输入和一个输出,输入和输出的映射是非线性的,如图3-2所示。 图3-2 人工神经元结构
31、图 Fig.3-2 Artificial Neuron Structure注释:人工神经网络(Artificial Neural Networks,简写为ANN), 1943年心理学家W.S.McCulloch和数理逻辑学家W.Pitts建立了神经网络和数学模型。他们通过MP模型提出了神经元的形式化数学描述和网络结构方法,证明了单个神经元能执行逻辑功能,从而开创了人工神经网络研究的时代。当神经元j有多个输入xi(i=1,2,m)和单个输出yj时,输入和输出的关系可表示为: (3-1)式中: 为阈值wij 为从神经元i到神经元j的连接权重因子f 为传递函数,或称激励函数。激励函数有阈值型函数、饱
32、和型函数、双曲函数、S型函数、高斯函数等。下面是常见的激发函数11。(1)阈值型函数输出0,1型,其输出为阶跃函数。如图3-3(1)所示,函数表达式为: (3-2) 还有输出-1,1对称型。如图3-3(2)所示,函数表达式为: (3-3)(2)饱和型函数如图3-3(3)所示,饱和型表达式为: (3-4)(3)双曲函数型 (3-5)如图3-3(4)所示(4)S型函数如图3-3(5)所示,表达式为: (3-6)一般取1,当时,该函数趋于阶跃函数。(5)高斯函数 (3-7) 备注:曲率大的为贝塔值大的函数曲线 图3-3 常见的激发函数图Fig.3-3 Common Excitation Functi
33、on Diagram3.3.2人工神经网络结构1.人工神经网络的特点人工神经网络对控制领域,具有重要的研究意义,因为(1)它可以实现任意的非线性函数。据研究,如果在输入输出层不确定情况下,只要隐层个数取的足够大,则,则可以逼近任意的非线性函数,在实际情况中,只要输入输出个数确定的情况下,隐层个数只要到达某个值,则此时效果会很好,但是至今尚无有效的确定方法。(2)可以分布式处理和存储数据。(3)可以对多输入多输出系统进行模拟。(4)便于用超大集成电路或光学集成电路实现。(5)能进行学习,适应环境的变化13,14。2.决定神经网络的三大因素(1)神经元的特性。即神经元的激发函数。 (2)神经元之间
34、的相互连接形式。其中包括网络的层数,以及每层神经元的个数和神经元之间的连接方式。 (3)网络的学习规则。3.人工神经网络的结构神经元的模型确定之后,一个神经网络的特性及能力主要取决于网络的拓扑结构及学习方法。总体结构分为监督性网络(即有教师信号网络) 和非监督性网络以及再励学习,监督性网络就是用输出和教师信号的综合影响来修正网络上神经元权值和阈值的修正,从而达到监督学习的作用。无监督学习是一种自组织的网络,不需要监督信号。再励学习是把学习看作评价过程,学习机选择输出作用环境之后,并产生一个再励信号,由于篇幅等问题,在此不一一介绍,读者可参考有关文献,下面介绍神经网络的基本结构13,14。(1)
35、 前向网络 前向网络结构如图3-4所示,网络中的神经元是分层排列的,每个神经元只与前一层的神经元相连接。神经元分层排列,分别组成输入层、中间层(也称为隐含层,可以由若干层组成)和输出层。每一层的神经元只接受来自前一层神经元的输入,后面的层对前面的层没有信号反馈。输入模式经过各层次的顺序传播,最后在输出层上得到输出。图3-4 前向网络结构 Fig.3-4 Forward Network Structure(2)从输出到输入有反馈的前向网络其结构如图3-5所示,输出层对输入层有信息反馈,这种网络可用于存储某种模式序列,BP网络属于这种类型。图3-5 有反馈的前向网络结构 Fig.3-5 Forwa
36、rd Network with Feedback Structure (3)层内互连前向网络其结构如图3-6所示,通过层内神经元的相互结合,可以实现同一层神经元之间的“横向”抑制或“兴奋”机制。图3-6 有相互结合的前向网络结构 Fig.3-6 Have the Combination in Layer of Forward Network Structure(4)相互结合型网络相互结合型网络结构如图3-7所示,这种网络在任意两个神经元之间都可能有连接。在无反馈的前向网络中,信号通过某神经元,该神经元的处理就结束了。而在相互结合网络中,信号要在神经元之间反复传递,网络处于一种不断变化状态的动态
37、之中。图3-7 结合型网络结构 Fig.3-7 Combining Type Network Structure综上,可知神经网络有分层网络、层内连接分层网络、反馈连接分层网络、互连网络等四种结构,其神经网络模型有感知器网络,线性神经网络,BP神经网络,径向基函数网络,反馈神经网络等等,本文主要学习研究了BP神经网络,以及用BP网络来建模和数据的仿真。3.4 BP人工神经网络原理及其算法 3.4.1 BP神经网络原理 BP网络的神经元结构与一般的神经元结构一样,其网络拓扑结构如图3-8所示,他是典型的误差反向传播(Back Propagation,BP)向前网络结构。其学习是利用误差和期望输出
38、来修正个神经元的权值和阈值。3.4.2 BP神经网络算法1.学习过程BP算法,其学习过程分为两个阶段。第一阶段:这个阶段称为前向输出阶段,本阶段包括,网络的输入经过第一层,即输入层节点,利用其神经元的初始化权值和阈值,计算出输出数据,依次计算出隐含层的输出。第二阶段:校正神经元权值和阈值阶段,该阶段包括,根据最终输出和期望输出的误差,来对每层权值和阈值的修正,若达到要求,则结束,如达不到要求则重复到第一阶段。 图3-8 BP网络拓扑结构 Fig.3-8 BP Network Structure2. 学习算法学习算法其实就是指网络的应用初始化,其实质就是根据输入输出数据来建立一种映射关系,即根据
39、输入输出量来修正神经网络内部神经元的参数值,从而达到一种映射的效果,不同的是神经网络是动态映射函数,其映射的规律随着输入样本的变化而变化,为了更快的达到收敛,很多科学家针对收敛的速度等进行了相关研究,其中有不乏有骄人的成绩。下面是BP算法的示意图,如图3-9。单个神经元输入输出关系为: (3-8) (3-9)式中: 是某层任意神经元。 是某层任意神经元的输入。 为某层任意神经元的输出。 为该层上一层某神经元的输出。 图3-9 BP网络学习示意图 Fig.3-9 BP Network Learning Schemes将(3-8)带入激发函数,则可以得到: (3-10)式中: 为修正函数的参数 是
40、某下一层神经元的输入权值之积求和。 为某层任意神经元的输出。 对于一个输入模式,设第个神经元的期望输出为,实际输出为,,则输出方差为: (3-11) (3-12)则对于一个输入模式,当权值的修正应该使得的负梯度方向变化。即 (3-13)由(3-8)得 (3-14) 令 (3-15)则根据(3-11)得 (3-16) (3-17) (3-18)将(3-8)带入(3-18)便得 (3-19) (3-20)即 权重的增量为,权重修正式为 (3-21) 式中 :步长调整因子(一般取)如果按下式子,则收敛更快 (3-22) 为平滑因子,它是指与上次增量的关系度。下面介绍一些常见的的学习方法15.。(1)
41、最速下降BP算法(Steepest Descent Backpropagation,SDBP)设次迭代权值和阈值为,对于BP网络修正可按(3-23)式 (3-23) 式中: 为学习率 梯度向量。梯度向量为 ,如(3-15)式所示。(2)动量BP算法(Momentum Backpropagation,MOBP)动量BP法就是加一个动量因子,如(3-24)式 (3-24)(3)学习率可变BP算法(Ariable Learnling Rate Backpropagation,VLBP)依然是按(3-23)式,只不过学习率是变化的 (3-25)其中的也是变化的,具体可参阅相关文献。除了上面介绍的几种算
42、法之外,还有很多算法。比如弹性BP算法(Resilient Back-PROPagation,RPROP ),变梯度算法(Conjugate Gradient Backpropagation,CGBP )、拟牛顿算法(Quasi-Newton Algorithms,QNA)等等。L-M算法等等15 ,由于本文篇幅问题,在此不予详述。3.4.3 BP神经网络局限性2. BP网络的局限性(1)学习率的问题因为BP网络训练中稳定性要求学习效率很小,所以梯度下降法使训练很慢。动量法因为学习率的提高通常比单纯的梯度下降法要快一些,但在实际应用中速度还是不够。对于非线性系统,选择合适的学习率是一个重要的问
43、题。在线性网络中,学习率过大会导致训练过程不稳定,相反,学习率过小又会造成训练时间过长。和线性网络不同,对于非线性多层网络极难选择很好的学习率。(2)非线性局部最优解的影响非线性网络误差面比线性网络的误差面要更为复杂,问题在于多层网络中非线性传递函数有多个局部最优解。寻优的过程与初始点的选择关系很大,初始点如果更靠近局部最优点,而不是全局最优点,就不会得到正确的结果,这也是多层网络无法得到最优解的一个原因。如图3-10所示,如果A点为局部最小值点,而B点则为全局最小值点,如果只循环在A点周围,则不可能寻找出全局最优点。 图3-10 误差曲面局部最小值Fig.3-10 Local Minimum Error Curve为了解决这个问题,在实际训练过程中,应选取多个初值点进行训练,以保证训练结果是全局最优性的16,17,18。(3)隐层的个数的不确定性