1、人工神经人工神经网络的基网络的基本模型本模型2006-5-9北京科技大学 自动化系2第二章第二章人工神经网络的基本模型人工神经网络的基本模型人工神经元的基本模型人工神经元的基本模型几种典型的激活函数几种典型的激活函数人工神经网络的学习算法概述人工神经网络的学习算法概述人工神经网络的基本拓扑结构人工神经网络的基本拓扑结构2006-5-9北京科技大学 自动化系3 生物神经元结构生物神经元结构生物神经元结构生物神经元结构(1)细细胞胞体体:细细胞胞核核、细细胞胞质质和和细细胞胞膜膜。(2)树树突突:胞胞体体短短而而多多分分枝枝的的突突起起。相相当当于于神神经经元元的的输输入入端端。(3)轴轴突突:胞
2、胞体体上上最最长长枝枝的的突突起起,也也称称神神经经纤纤维维。端端部部有有很很多多神神经经末末稍稍传传出出神神经经冲冲动动。(4)突突触触:神神经经元元间间的的连连接接接接口口,每每个个神神经经元元约约有有1万万10万万个个突突触触。神神经经元元通通过过其其轴轴突突的的神神经经末末稍稍,经经突突触触与与另另一一神神经经元元的的树树突突联联接接,实实现现信信息息的的传传递递。由由于于突突触触的的信信息息传传递递特特性性是是可可变变的的,形形成成了了神神经经元元间间联联接接的的柔柔性性,称称为为结结构构的的可可塑塑性性。(5)细细胞胞膜膜电电位位:神神经经细细胞胞在在受受到到 电电 的的、化化 学
3、学 的的、机机 械械 的的 刺刺 激激 后后,能能产生兴奋与抑制。产生兴奋与抑制。2.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动化系4 生物神经元结构生物神经元结构2.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动化系5 生物神经元功能生物神经元功能生物神经元功能生物神经元功能(1)兴兴奋奋与与抑抑制制:当当传传入入神神经经元元冲冲动动,经经整整和和使使细细胞胞膜膜电电位位升升高高,超超过过动动作
4、作电电位位的的阈阈值值时时,为为兴兴奋奋状状态态,产产生生神神经经冲冲动动,由由轴轴突突经经神神经经末末稍稍传传出出。当传入神经元的冲动,经整和,使细胞膜电当传入神经元的冲动,经整和,使细胞膜电位位降降低低,低低于于阈阈值值时时,为为抑抑制制状状态态,不不产产生生神神经经冲动。冲动。(2)学学习习与与遗遗忘忘:由由于于神神经经元元结结构构的的可可塑塑性性,突突触触的的传传递递作作用用可可增增强强与与减减弱弱,因因此此,神神经经元元具具有有学学习习与遗忘的功能。与遗忘的功能。2.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006
5、-5-9北京科技大学 自动化系62.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型 人工神经元的六个基本特征:人工神经元的六个基本特征:人工神经元的六个基本特征:人工神经元的六个基本特征:1 1)神经元及其联接;)神经元及其联接;2 2)神经元之间的联接强度决定信号传递的强弱;)神经元之间的联接强度决定信号传递的强弱;3 3)神经元之间的联接强度是可以随训练改变的;)神经元之间的联接强度是可以随训练改变的;4 4)信号可以是起刺激作用,也可以是起抑制作用;)信号可以是起刺激作用,也可以是起抑制作用;5 5)一个神经元接受的信号的累
6、积效果决定该神经元)一个神经元接受的信号的累积效果决定该神经元的状态;的状态;6)6)每个神经元可以有一个每个神经元可以有一个“阈值阈值”。神经元是构成神经网络的最基本单元(构件)。神经元是构成神经网络的最基本单元(构件)。人工神经元模型应具有生物神经元的六个基本特性。人工神经元模型应具有生物神经元的六个基本特性。2006-5-9北京科技大学 自动化系7图图2.1 MP神经元模型神经元模型(a)2.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型 神经元神经元i i的输入的输入yj 输出输出yi 描述描述:设设则则每一神经元的输出,
7、或每一神经元的输出,或0 0或或1 1,0 0表示表示抑制抑制,1 1表示表示兴奋兴奋:基本基本基本基本MPMP模型模型模型模型2006-5-9北京科技大学 自动化系8f(x):作用(激发)函数作用(激发)函数是一种阶跃函数。是一种阶跃函数。从神经元的结构示意图上可见:当输入从神经元的结构示意图上可见:当输入yj的加权和的加权和 大于大于域值域值 时,神经元的输出时,神经元的输出yi =1,即神经元处于,即神经元处于“兴奋状态兴奋状态”;反之,当输入反之,当输入yj的加权和的加权和 大于域值大于域值 时,神经元的输时,神经元的输出出yi=0,即神经元处于,即神经元处于“抑制状态抑制状态”在基本
8、在基本MP模型中取整数。模型中取整数。2.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动化系9人工神经元模拟生物神经元的人工神经元模拟生物神经元的人工神经元模拟生物神经元的人工神经元模拟生物神经元的一阶特性一阶特性一阶特性一阶特性。输入输入:Y=(y0,y1,y2,yn)联接权:联接权:W=(w0,w1,w2,wn)T网络输入:网络输入:netj=wjiyi向量形式:向量形式:netj=WYyn wny1 w1y2 w2neti=WYMPMP模型的另一种形式模型的另一种形式模型的另一种形式模型的另
9、一种形式令令,则,则MP神经元模型可以表示为:神经元模型可以表示为:2.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动化系102.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型M-PM-P模型从哪些方面刻画了自然神经元?模型从哪些方面刻画了自然神经元?前面已介绍过生物(自然)神经元具有如下特点:两态工作:即工作于兴奋或抑制两种状态;阈值作用:即超过某一阈值则神经元兴奋;多输入单输出特性;空间叠加性;可塑性联接:即突触部分的联接强度可以
10、调节。虽然M-P模型无法实现生物神经元的空间、时间的交叉叠加性,但其它生物神经元功能都具备。2006-5-9北京科技大学 自动化系11M-PM-P模型在人工神经网络中的地位模型在人工神经网络中的地位 首先M-P模型是所有人工神经元中第一个被建立起来的,它在多个方面都显示出生物神经元所具有的基本特性。其次,目前其它形式的人工神经元已有很多,但大多数都是在M-P模型的基础上经过不同的修正,改进变换而发展起来。因此M-P人工神经元是整个人工神经网的基础。2.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动
11、化系122.1 2.1 人工神经元的基本模型人工神经元的基本模型第二章第二章 人工神经网络的基本模型人工神经网络的基本模型对对M-PM-P人工神经元进行改进的主要方式有如下几个方面人工神经元进行改进的主要方式有如下几个方面:神经元的内部改造:对人工神经元取不同的非线性函数;对输入和输出做不同的限制:离散的(某些离散点)和连续的(整个实数域)。神经网络的结构上的改造:人工神经元之间的联接形式不同。算法的改进:在人工神经网络权值和阈值取求的方法上 不同。其它形式的改造。2006-5-9北京科技大学 自动化系13 激激活活函函数数执执行行对对该该神神经经元元所所获获得得的的网网络络输输入入的的变变换
12、,也常称为激励函数、活化函数:换,也常称为激励函数、活化函数:o=f(net)线性函数(线性函数(线性函数(线性函数(Liner FunctionLiner FunctionLiner FunctionLiner Function)f(net)=k*net+c netooc2.2 2.2 几种典型的激活函数几种典型的激活函数(Activation Function)(Activation Function)第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动化系142 2 2 2、非线性斜面函数、非线性斜面函数、非线性斜面函数、非线性斜面函数(Ramp
13、Function)(Ramp Function)(Ramp Function)(Ramp Function)if netf(net)=k*net if|net|0为为一一常常数数,被被称称为为饱饱和和值值,为该神经元的最大输出。为该神经元的最大输出。-net o 2.2 2.2 几种典型的激活函数几种典型的激活函数(Activation Function)(Activation Function)第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动化系15if netf(net)=-if net均为非负实数,均为非负实数,为阈值。为阈值。二值形式:二值形
14、式:1if netf(net)=0if net双极形式:双极形式:1if netf(net)=-1if net-onet02.2 2.2 几种典型的激活函数几种典型的激活函数(Activation Function)(Activation Function)第二章第二章 人工神经网络的基本模型人工神经网络的基本模型阈值函数(阈值函数(阈值函数(阈值函数(ThresholdFunctionThresholdFunction)阶跃函数)阶跃函数)阶跃函数)阶跃函数2006-5-9北京科技大学 自动化系162.2 2.2 几种典型的激活函数几种典型的激活函数(Activation Function)
15、(Activation Function)第二章第二章 人工神经网络的基本模型人工神经网络的基本模型 其他形式的作用函数其他形式的作用函数其他形式的作用函数其他形式的作用函数:不同的作用函数,可构成不同的神经元不同的作用函数,可构成不同的神经元模型。模型。非对称型非对称型Sigmoid函数函数:简称简称S型作用函数,是可微的,用下式表示:型作用函数,是可微的,用下式表示:如图如图(a)和和(b)f xex()=+-11 或或 fxex()=+-11b b 02006-5-9北京科技大学 自动化系17第二章第二章 人工神经网络的基本模型人工神经网络的基本模型对称型对称型 Sigmoid函数函数
16、是可微的,是可微的,用下式表示:如用下式表示:如图图(a)(a)和和(b)(b)fxeexx()=-+-11 或或 fxeexx()=-+-11bb ,b 0或或 f xeeeexxxx()=-+-bbbb ,b 02006-5-9北京科技大学 自动化系18对称型阶跃函数对称型阶跃函数第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动化系19第二章第二章 人工神经网络的基本模型人工神经网络的基本模型高斯函数高斯函数:是可微的,分一维和高维,用下式表示:如图是可微的,分一维和高维,用下式表示:如图(a)和和(b)2006-5-9北京科技大学 自动化系20
17、神经元演示神经元演示非线性作用函数非线性作用函数(激发函数)(激发函数)2.2 2.2 几种典型的激活函数几种典型的激活函数(Activation Function)(Activation Function)第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动化系21非线性作用函数非线性作用函数1非对称型非对称型Sigmoid函数函数2006-5-9北京科技大学 自动化系22非线性作用函数非线性作用函数2对称型对称型Sigmoid函数函数2006-5-9北京科技大学 自动化系23非线性作用函数非线性作用函数3非对称型阶跃函数非对称型阶跃函数2006-5-
18、9北京科技大学 自动化系24非线性作用函数非线性作用函数4对称型阶跃函数对称型阶跃函数2006-5-9北京科技大学 自动化系25非线性作用函数非线性作用函数2006-5-9北京科技大学 自动化系26非线性作用函数非线性作用函数5高斯高斯RBF(RBF(一维一维)2006-5-9北京科技大学 自动化系27非线性作用函数非线性作用函数5高斯高斯RBFRBF(二维)(二维)2006-5-9北京科技大学 自动化系28非线性作用函数非线性作用函数5高斯高斯RBFRBF(二维)(二维)2006-5-9北京科技大学 自动化系29非线性作用函数非线性作用函数6B样条函数(次)样条函数(次)2006-5-9北京
19、科技大学 自动化系30非线性作用函数非线性作用函数6B样条函数(样条函数(1 1次)次)2006-5-9北京科技大学 自动化系31非线性作用函数非线性作用函数2006-5-9北京科技大学 自动化系322.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型学习过程就是调整权值的过程。学习过程就是调整权值的过程。1、竞争学习2、有监督学习3、无监督学习4、Hebb和Delta学习5、有、无监督混合学习6、随即自适应学习模拟退火7、模糊学习 等等几种常见类型学习算法:2006-5-9北京科技大学 自动化系33对于竞争学习规则,有
20、三个基本元素:1.一个神经元集合,这些神经元除了一些随机分布的突触权值之外是完全相同的,并且由于突触权值的不同而对一个给定的输入模式集合由不同的响应。2.在每个神经元的强度上给定一个极限。3.一个机制,它允许神经元为响应一个给定输入子集的权利而竞争,从而使得每次只有一个输出神经元或者每组只有一个神经元是激活的(即,“开”).竞争获胜神经元被叫做胜者通吃(winner-takes-all)神经元。2.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型竞争学习竞争学习2006-5-9北京科技大学 自动化系342.3 2.3 人
21、工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型竞争学习竞争学习按照标准的竞争学习规则,作用于突触权值wkj的改变量wkj定义为获胜神经元k的输出信号yk被置为1;竞争失败的所有神经元的输出信号被置为0。我们有:2006-5-9北京科技大学 自动化系352.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型有教师学习(称为监督学习)有教师学习(称为监督学习)神经网络神经网络的参数可以综的参数可以综合训练向量和合训练向量和反馈回的误差反馈回的误差信号进行适当信号进行
22、适当调整。调整。2006-5-9北京科技大学 自动化系362.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型如果我们能给定一个设计好的算法来使成本费如果我们能给定一个设计好的算法来使成本费用最小,而且有足够的输入用最小,而且有足够的输入/输出的数据集,那么输出的数据集,那么有指导的学习系统往往可以较好地完成诸如模式有指导的学习系统往往可以较好地完成诸如模式分类,函数逼近之类的任务。分类,函数逼近之类的任务。有教师学习(称为监督学习)有教师学习(称为监督学习)误差信号可以定义为:神经网络实际输出与预误差信号可以定义为:神
23、经网络实际输出与预期响应之差。这种调节可以逐步而又不断反复地进期响应之差。这种调节可以逐步而又不断反复地进行,其最终目的就是要让神经网络模拟老师行,其最终目的就是要让神经网络模拟老师学学习样本;从统计的角度来看,这种模拟是最优的。习样本;从统计的角度来看,这种模拟是最优的。2006-5-9北京科技大学 自动化系372.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型无教师学习模式中无教师学习模式中没有老师来监视学习过没有老师来监视学习过程的。即神经网络没有程的。即神经网络没有任何带标号的例子可以任何带标号的例子可以学习参
24、考。这学习模式学习参考。这学习模式又分又分2类:类:无教师学习(称为无监督学习)无教师学习(称为无监督学习)加强学习加强学习/神经动神经动态规划态规划2006-5-9北京科技大学 自动化系382.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型无教师学习(称为无监督学习)无教师学习(称为无监督学习)无监督学习无监督学习 在在无无监监督督或或自自组组织织学学习习系系统统中中,不不再再有有外外在在的的老老师师或或者者评评价价来来监监督督学学习习的的过过程程。提提供供独独立立于于任任务务的的表表示示质质量量的的度度量量,要要求
25、求网网络络学学习习该该度度量量而而且且参参数数将将根据这个度量来逐步优化网络。根据这个度量来逐步优化网络。为为了了实实际际地地使使用用无无监监督督系系统统,我我们们可可能能会会使使用用竞竞争性学习规则。争性学习规则。2006-5-9北京科技大学 自动化系392.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型学习任务学习任务模式联想 存储阶段回忆阶段模式联想xy输入向量输出向量模式联想输入输出关系图2006-5-9北京科技大学 自动化系402.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章
26、人工神经网络的基本模型人工神经网络的基本模型学习任务学习任务模式识别 模式识别将收到的模式或信号置以一个预先定义好的分类号。识别机设计成一个采用监督学习算法的多层前馈网络。特征抽取的非监督网络分类的监督网络12:r 输入模式x 特征向量y 模式分类的经典分类方法图解模式分类的经典分类方法图解.mm维观维观察空间察空间g g维特维特征空间征空间r r维维 决决策空间策空间2006-5-9北京科技大学 自动化系412.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型其中向量x 是输入,向量d 为输出。向量值函数 假定为未知。
27、为了弥补函数 未知的知识缺乏,我们假定有如下确定的训练样本集合:考虑下面的一个非线性输入输出映射函数关系式:T=(xi,di)i=1N 对于所有的是一个很小的正数.其中d=f(x)学习任务学习任务函数逼近函数逼近 逼近问题其实是一个很完整的监督学习网络系统。其中xi是输入向量,而di是期望的反馈向量。反之,完全可以将监督学习网络系统看成是一个函数逼近问题。2006-5-9北京科技大学 自动化系422.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型学习任务学习任务函数逼近函数逼近 神经网络的函数逼近问题实际上也是逼近一个
28、未知输入输出映射函数问题:系统识别模块图系统识别模块图 2006-5-9北京科技大学 自动化系432.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型学习任务学习任务函数逼近函数逼近 逆模式系统图逆模式系统图 2006-5-9北京科技大学 自动化系44 Hebb学习规则学习规则按照生物学的条件反射原理,按照生物学的条件反射原理,Hebb构造了一种简单的构造了一种简单的神经网络神经网络权值权值调整原则:调整原则:若第若第i 与第与第j个神经元同时处于兴个神经元同时处于兴奋状态,则它们间的联接应加强奋状态,则它们间的联接应加
29、强。即:。即:Dwy yijij=a,a 0这和这和“条件反射条件反射”学说一致学说一致,并已得到证实。,并已得到证实。Hebb 学习规则的相关假设,是许多学习规则的基础。学习规则的相关假设,是许多学习规则的基础。2.3 2.3 人工神经网络的学习算法概述人工神经网络的学习算法概述第二章第二章 人工神经网络的基本模型人工神经网络的基本模型2006-5-9北京科技大学 自动化系45 Delta学习规则(学习规则(误差校正规则误差校正规则 如梯度方法、如梯度方法、BPBP算法算法)Widrow和和Hoff的写法:的写法:Wij(t+1)=Wij(t)+(yj-aj(t)neti(t)也可以写成:也
30、可以写成:Wij(t+1)=Wij(t)+Wij(t)Wij(t)=jneti(t)j=yj-aj(t)Grossberg的写法为:的写法为:Wij(t)=ai(t)(netj(t)-Wij(t)更一般的更一般的Delta规则为:规则为:Wij(t)=g(ai(t),yj,netj(t),Wij(t)其中:其中:ai(t)是网络目标输出;是网络目标输出;yj是网络计算输出;是网络计算输出;netj(t)网络内部叠加信号;网络内部叠加信号;Wij(t)网络权值。网络权值。2006-5-9北京科技大学 自动化系462.4 2.4 人工神经网络的基本拓扑结构人工神经网络的基本拓扑结构第二章第二章 人
31、工神经网络的基本模型人工神经网络的基本模型四种常见类型的网络结构1、前向型2、反馈型3、随机型4、自组织竞争型2006-5-9北京科技大学 自动化系472.4 2.4 人工神经网络的基本拓扑结构人工神经网络的基本拓扑结构第二章第二章 人工神经网络的基本模型人工神经网络的基本模型前向网络特点 1.神经元分层、多层排列;2.层间无连接;3.方向由入到出。应用最为广泛前向网络前向网络+2006-5-9北京科技大学 自动化系482.4 2.4 人工神经网络的基本拓扑结构人工神经网络的基本拓扑结构第二章第二章 人工神经网络的基本模型人工神经网络的基本模型反馈网络反馈网络反馈网络的特点:反馈网络的特点:网
32、络在内部连接上有反馈连接。网络在内部连接上有反馈连接。2006-5-9北京科技大学 自动化系492.4 2.4 人工神经网络的基本拓扑结构人工神经网络的基本拓扑结构第二章第二章 人工神经网络的基本模型人工神经网络的基本模型 Output与 Input相连(全反馈)特点:1.内部前向;2.输出反馈到输入。Hopfield网络是其一种特例。Fukushima网络网络特点:Fukushima网络反馈网络的一种特例2006-5-9北京科技大学 自动化系502.4 2.4 人工神经网络的基本拓扑结构人工神经网络的基本拓扑结构第二章第二章 人工神经网络的基本模型人工神经网络的基本模型(1)层内神经元互相连接;(2)层间神经元采用前向连接。Inner recurrent 网络特点:Inner recurrent 网络反馈网络的一种特例2006-5-9北京科技大学 自动化系512.4 2.4 人工神经网络的基本拓扑结构人工神经网络的基本拓扑结构第二章第二章 人工神经网络的基本模型人工神经网络的基本模型互联网络特点:每个元都与其它元相连 例:Hopfield Boltzmann结构图结构图互联网络反馈网络的一种特例2006-5-9北京科技大学 自动化系52本章结束,谢谢大家!本章结束,谢谢大家!