收藏 分销(赏)

基于Matlab的BP神经网络在大气污染预报中的应用.doc

上传人:s4****5z 文档编号:8820671 上传时间:2025-03-03 格式:DOC 页数:6 大小:58.50KB 下载积分:10 金币
下载 相关 举报
基于Matlab的BP神经网络在大气污染预报中的应用.doc_第1页
第1页 / 共6页
基于Matlab的BP神经网络在大气污染预报中的应用.doc_第2页
第2页 / 共6页


点击查看更多>>
资源描述
环境污染与防治 网络版 第2期 2007年2月 基于Matlab的BP神经网络在大气污染预报中的应用 雷 蕾 第一作者:雷 蕾,女,硕士研究生,1982年生,研究方向为人工神经网络在环境科学中的应用。 秦 侠 姚小丽 (北京工业大学, 北京 100022) 摘要 介绍了运用Matlab神经网络工具箱进行BP神经网络设计的基本方法与过程。并将BP网络模型引入到大气污染预报领域,根据2004年至2005年英国伦敦Marylebone Road监测站的PM2.5监测数值,构建并选用合适的BP神经网络建立了大气污染物含量的神经网络预报模型。计算结果表明,BP模型应用于大气污染预报具有较高的预测精度和良好的泛化能力,它为信息社会的城市空气污染预报工作提供了一种全新的思路和方法。 关键词 BP神经网络 Matlab 大气污染 Application of BP neural network based on Matlab in air pollution forecasting Lei Lei, Qin Xia, Yao Xiaoli. (Beijing University of Technology, Beijing 100022) Abstract: The basic procedures of designing BP neural network utilizing Matlab neural network toolbox were introduced. BP model was applied by the authors in the field of air pollution forecasting, and a neural network forecasting model for air pollution based on the dataset of Marylebone Road London, UK was set up as well, the computation results showed that the BP model had good quality on forecasting precision and generalization ability. Besides, it provided a new method for urban air pollution forecasting. Keywords: BP neural network Matlab Air pollution 1974年,WERBOS在其博士论文中提出了第一个适合多层网络的学习算法,但该算法并未受到足够的重视和广泛的应用,直到20世纪80年代中期,美国加利福尼亚的PDP(Parallel Distributed Procession)小组于1986年发表了Parallel Distributed Processing一书,将该算法应用于神经网络的研究,才使之成为迄今为止最著名的多层网络学习算法——BP算法,由此算法训练的神经网络,称之为BP神经网络。在人工神经网络的实际应用中,BP网络广泛应用于函数逼近、模式识别/分类、数据压缩等,80%~90%的人工神经网络模型是采用BP网络或它的变化形式,它也是前馈网络的核心部分,体现了人工神经网络的最精华部分[1]。 然而,依靠操作人员的经验来建立合理的神经网络算法,编写程序仿真再到分析结果需要很长时间的试探,并且网络结构、训练参数及训练方法的改变往往会引起程序的改变,为设计和仿真带来很多不便。Matlab神经网络工具箱(Neural Network Toolbox)以神经网络理论为基础,用Matlab的语言构造出各种神经网络激活函数、训练函数及各种网络集成块等。设计者通过对激活函数、网络函数等的调用,仅需写很少的源代码,即可完成必须的科学计算。根据各种典型的修正网络权值的规则,配合网络的训练过程,用Matlab编写出各种网络设计与训练的子程序,网络的设计者可以根据自己的需要去调用工具箱中有关神经网络的设计训练程序,使自己能够从繁琐的编程中解放出来,集中精力去思考问题和解决问题,取得事半功倍的效果。 1 BP神经网络设计的基本方法 Matlab的NNbox提供了建立神经网络的专用函数newff()。用newff函数来确定网络层数、每层中的神经元数和传递函数,其语法为: net=newff(PR,[S1,S2,… ,SN],{TF1,TF2,… ,TFN},BTF,BLF,PF) 式中:PR表示由每个输入向量的最大最小值构成的Rx2矩阵;Si表示第i层网络的神经元个数;TF表示第i层网络的传递函数,缺省为tansig,可选用的传递函数有tansig,logsig或purelin;BTF表示字符串变量,为网络的训练函数名,可在如下函数中选择:traingd、traingdm、traingdx、trainbfg、trainlm等,缺省为trainlm;BLF表示字符串变量,为网络的学习函数名,缺省为learngdm;BF表示字符串变量,为网络的性能函数,缺省为均方差’mse’。 newff在确定网络结构后会自动调用init函数用缺省参数来初始化网络中各个权重和阈值,产生一个可训练的前馈网络,即该函数的返回值为net。 下面针对以上各参数的确定作简要介绍。 1.1 网络层数 BP网络可以包含不同的隐层,但理论上已经证明,在不限制隐层节点数的情况下,两层(只有一个隐层)的BP网络可以实现任意非线性映射。在模式样本相对较少的情况下,较少的隐层节点,可以实现模式样本空间的超平面划分,此时,选择两层BP网络就可以了;当模式样本数很多时,减小网络规模,增加一个隐层是必要的,但BP网络隐层数一般不超过两层。 1.2 输入层节点数 输入层起缓冲存储器的作用,它接受外部的输入数据,因此其节点数取决于输入矢量的维数。 1.3 输出层节点数 输出层节点数取决于两个方面,输出数据类型和表示该类型所需的数据大小。 1.4 隐层节点数 一个具有无限隐层节点的两层BP网络可以实现任意从输入到输出的非线性映射。但对于有限个输入模式到输出模式的映射,并不需要无限个隐层节点,这就涉及到如何选择隐层节点数的问题,而这一问题的复杂性,使得至今为止,尚未找到一个很好的解析式,隐层节点数往往根据前人设计所得的经验和自己进行试验来确定。一般认为,隐层节点数与求解问题的要求、输入输出单元数多少都有直接的关系。另外,隐层节点数太多会导致学习时间过长;而隐层节点数太少,容错性差,识别未经学习的样本能力低,所以必须综合多方面的因素进行设计。 隐层节点数的初始值可先由以下两个公式中的其中之一来确定[2,3]。 (1) 或 (2) 式中:m、n分别为输入结点数目与输出结点数目,a为1~10之间的常数。 隐层结点数可根据式(1)或(2)得出一个初始值,然后利用逐步增长(先从一个较简单的网络开始,若不符合要求则逐步增加隐层单元数到合适为止)或逐步修剪(从一个较复杂的网络开始逐步删除隐层单元)法。 1.5 传输函数 BP网络中的传输函数通常采用S(sigmoid)型函数: (3) 在某些特定情况下,还可能采用纯线性(pureline)函数。如果BP网络的最后一层是Sigmoid函数,那么整个网络的输出就限制在一个较小的的范围内(0~1之间的连续量);如果BP网络的最后一层是Pureline函数,那么整个网络的输出可以取任意值。 1.6 训练方法及其参数选择 针对不同的应用,BP网络提供了多种训练、学习方法,可供选择。在Matlab中训练网络有两类模式:增加方式(incremental mode)和批处理方式(batch mode)。在增加方式中,每提交一次输入数据,权值和阈值都更新一次,增加方式更普遍的应用于动态网络;在批处理方式中,当所有的输入数据都被提交以后,权值和阈值才被更新,使用批处理方式只需为整个网络指定一个训练函数,在样本数比较多时,批处理方式比增加方式收敛速度快,而且许多改进的快速训练算法只能采用批处理方式。故本文只讨论批处理方式,以批处理方式来训练网络的函数是train,其语法主要格式为: [net,tr]=train(NET,p,t) 式中:p和t分别为输入输出矩阵,NET为由newff产生的要训练的网络,net为修正后的网络,tr为训练的记录(训练步数epoch和性能perf)。train根据在newff函数中确定的训练函数来训练,不同的训练函数对应不同的训练算法,详见表1。 训练时直接调用上述的函数名,调用前为下列变量赋初始值:net.trainParam.show——每多少轮显示一次;net.trainParam.lr——学习速度;net.trainParam.epochs——最大训练轮回数;net.trainParam.goal——目标函数误差。 2 BP网络在大气污染预报中的应用实例 目前由于自动环境监测技术的发展,积累了大量环境信息,如果能找到行之有效的方法或技术来揭示这些历史时序数据内部所隐藏的对人类有用的知识或信息,将对分析环境状况的变化、污染源的变迁和环境管理的变革起到非常重要的作用。通过对污染物资料的分析,发现大气污染物浓度的变化具有较强的非线性特性,要对其进行较为准确的预测,就必须采用能捕捉非线性变化规律的预报方法,传统统计预报方法或数值预报逐渐显示出其局限 表1 训练算法列表 函数 训练算法 备注 traingd 最速梯度下降算法 收敛速度慢,网络易陷于局部极小,学习过程常发生振荡 traingdm 有动量的梯度下降算法 收敛速度快于traingd traingdx 学习率可变的BP算法 收敛速度快于traingd,仅用于批量模式训练 trainrp 弹性BP算法 用于批量模式训练,收敛速度快,数据占用存储空间小 traincgf Fletcher-Reeves变梯度算法 是一种数据占用存储空间最小的变梯度算法,且速度通常比traingdx快得多,在连接权的数量很多时,时常选用该算法 traincgp Polak-Ribiére变梯度算法 存储空间略大于traincgp,但对有些问题有较快的收敛速度 traincgb Powell-Beale变梯度算法 性能略好于traincgp,但存储空间较之略大 trainscg 固定变比的变梯度算法 比其他变梯度算法需要更多迭代次数,但无需在迭代中进行线性搜索使每次迭代的计算量大大减小,存储空间与traincgf近似 trainbfg BFGS拟牛顿算法 每次迭代过程所需的计算量和存储空间大于变梯度算法,数据存储量近似于Hessian矩阵,对规模较小的网络更有效 trainoss 变梯度法与拟牛顿法的折中算法 trainlm Levenberg-Marquardt算法 对中等规模的前馈网络(多达数百个连接权)的最快速算法 trainbr 贝叶斯归一化法 可使网络具有较强的泛化能力,避免了以尝试的方法去决定最佳网络规模的大小 性,因此笔者将BP神经网络引入到大气污染预报中来,用历史时序数据预测未来大气污染水平,弥补传统预报方法的不足。 有研究表明,一天中某指定时段内的PM2.5浓度与前一日各小时平均浓度有关;虽然污染物浓度与气象条件等多种因素密切相关,常规预测方法不可忽略,但对于三层前向神经网络,如果输入向量为浓度历史时间序列,输入层窗宽足够大,那么网络结构本身就包含了其他污染物和气象条件对待预测污染物浓度的影响[4]。故本实例采用英国伦敦Marylebone Road监测站2004年和2005年4月1日~7月31日的PM2.5小时平均浓度监测值(共2×122×24个数据点)进行研究。用2004年数据训练网络,训练好的网络用于预测2005年第二日PM2.5的24 h各小时平均浓度。 2.1 定义输入向量和目标向量 对于每一年,都建立2个矩阵,即训练集输入向量矩阵P,训练集目标向量矩阵T,待预测输入向量矩阵PC和待预测目标向量矩阵TC。每个矩阵都有24行121列,其中第i行(i=1,2…,24)代表第i小时,第j列(j=1,2,…,121)代表4个月中的第j天;输入向量矩阵的第(j+1)列为目标向量矩阵的第j列,表示目标值为第二日该小时平均浓度。 一般来说,在实际应用中,由于所采集的数据跨度较大, 为了便于网络训练, 防止计算过程出现“过拟合”等问题, 需先将数据进行“标准化”处理。标准化方法可采用零均值标准差标准化方法或归一化等方法。在实践中,作者发现,采用归一化方法效果较好(注意,如果进行了这一步,则对以后BP网络训练输出的结果一定要进行相反的处理过程,即将输出值还原为原量纲值)。根据公式可将数据“归一化”, 即限定在[0, 1 ]区间内。归一化公式为: (4) 2.2 创建BP网络和定义训练函数及参数 本研究采用三层BP网络,选取输入层节点数为24(分别为一天24 h各小时平均浓度);输出层节点数为1(为第二日该小时PM2.5小时平均浓度);根据前述经验公式,选取隐层节点数为5。但通过实际应用发现网络预测性能并不理想,经分析研究后发现对于一个具有ni个输入、no个输出、nh个隐层节点的三层前向网络,自由度=no+nh(ni+no+1);本例共有121个训练样本,ni=24,no=1,计算得隐层节点数不能大于4;故最终确定隐层节点数为nh=4。对于学习算法,根据前述各种算法特点和实践比较,选用贝叶斯归一化学习算法。 2.3 训练网络并用于预测仿真 完成上述步骤后,即可编写程序用04年数据训练神经网络,用训练好的网络预测05年输入向量,仿真输出结果,并将输出结果还原为归一前量纲。为验证所建立BP网络的预测性能,本研究还将预测值与待预测目标值比较,计算相对误差,结果见图1,相对误差在20%上下波动,结果表明BP网络经有效训练后应用于大气污染预报具有较高的预测精度和良好的泛化能力。 图1 预测误差 3 结 论 BP神经网络具有很强的学习、联想和容错功能,具有高度非线性函数映射功能,将其应用于大气污染预报预测精度较高,泛化能力好;Matlab中的工具箱使BP网络的建立、训练以及仿真都变得非常简单,而且训练过程及效果非常直观,使神经网络应用于实际具有更大的可行性。 以往报道的神经网络在大气环境预测领域的应用多是基于大气污染物含量与气象因素建立的网络,本文初步尝试采用历史时序数据建立网络,由于数据量有限,在使用更大数据集建立网络,去除原始数据噪声等对网络预报精度的影响方面还有待进一步研究。 参 考 文 献 [1] 周开利,康耀红.神经网络模型及其MATLAB仿真程序设计[M].北京:清华大学出版社,2005. [2] 徐庐生.微机神经网络[M].北京:中国医药科技出版社,1995. [3] 高大启.有教师的线性基本函数前向三层神经网络结构研究[J].计算机学报,1998,21(1):80-85. [4] PéREZ P,TRIER A,REYES J.Prediction of PM2.5 concentrations several hours in advance using neural networks in Santiago,Chile [J].Atmospheric Environment, 2000, 34:1189-1196. 责任编辑:陈泽军 (收到修改稿日期:2006-10-10) ©版权所有 《环境污染与防治》杂志社 6
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 学术论文 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服