1、书书书华南师范大学学报(自然科学版)Journal of South China Normal University(Natural Science Edition)2022,54(6):115doi:106054/jjscnun2022079收稿日期:20220616华南师范大学学报(自然科学版)网址:http:journalnscnueducn基金项目:国家自然科学基金项目(61674059);广东省科技计划项目(2020B0101030008,2022A0505050066);广东省教育厅人工智能专项重点项目以及特色创新项目(2019KZDZX1010,2017KTSCX050);广东省
2、高职院校产教融合创新平台项目(2020CJPT016)*通信作者:陈心满,Email:xmchenscnu 163com;史艳丽,Email:sylscau78 scaueducn忆阻器类脑神经突触的研究进展陈心满1*,钟智坚1,岳志秀1,朱俊2,高芳亮1,史艳丽3*,章勇1(1 华南师范大学半导体科学与技术学院,佛山 528225;2 中山火炬职业技术学院,中山 528436;3 华南农业大学图书馆,广州 510642)摘要:大脑之所以能够控制人和动物的复杂生命活动,使生物体在多变的自然环境得以生存,得益于大规模神经网络中高效、快速、精准的信息传递。神经突触作为神经元之间信息传递的重要机构,
3、保证了神经网络的高效运转,因此构建具有神经突触功能的电子突触是研究仿生系统和类脑神经网络的必经之路。研究人员尝试各种电子元件对神经突触进行模拟,其中忆阻器由于其独特的器件结构和具有“记忆特性”的电学性能,成为构建类脑神经突触的最佳选择。文章全面概述近年来忆阻器模拟神经突触的研究进展,包括忆阻器模拟神经突触的可塑性、再可塑性、非联想学习、联想学习等功能,总结了忆阻器神经突触在人工神经网络中的应用、存在的问题和挑战,并对忆阻器神经突触的研究进行展望。关键词:忆阻器;神经突触;可塑性;神经网络中图分类号:O469;O59文献标志码:A文章编号:10005463(2022)06000115esearc
4、h Progress of Memristorbased Neuromorphic SynapsesCHEN Xinman1*,ZHONG Zhijian1,YUE Zhixiu1,ZHU Jun2,GAO Fangliang1,SHI Yanli3*,ZHANG Yong1(1 College of Semiconductor Science and Technology,South China Normal University,Foshan 528225,China;2 Zhongshan Torch Technical and Vocational College,Zhongshan
5、528436,China;3 Library of South China Agricultural University,Guangzhou 510642,China)Abstract:The efficient,fast and accurate information transmission in the largescale neural network in the brain isthe exact origin that the brain can control the complex life activities of humans and animals and ena
6、ble organisms tosurvive in the changeable natural environment As an important medium for information transmission between neu-rons,the synapses ensure the efficient operation of neural networks Therefore,to build electronic synapses withsynaptic functions is one essential way to study bionic systems
7、 and brainlike neural networks esearchers havepreviously tried to simulate synaptic functions with various electronic devices,among which memristor has becomeone good candidate to build neuromorphic synapses due to its unique device structure and memory characteristicsThe researches of memristorbase
8、d synapses in recent years are comprehensively summarized in this article,inclu-ding the synaptic plasticity,metaplasticity,nonassociative learning,associative learning and other functions It al-so summarizes the application,problems and challenges in artificial neural networks,as well as the resear
9、ch pros-pects of memristorbased synapsesKeywords:memristor;synapse;plasticity;neural network随着智能时代对大规模数据处理要求不断提高,基于 Von Neumann 架构的计算机正面临着严峻的挑战。例如,Google Brain 团队利用上万个通用处理器建立了人工神经网络并应用于面部识别、国际象棋等场景;基于深度学习算法的 AlphaGo 机器人需要在上千个通用处理器和数百个图形处理器的帮助下才能玩一局围棋,耗费巨大。无人驾驶、深度学习和智能机器人等智能技术是人类科学技术发展的重要方向,但基于传统通用处理
10、器的实现方案无疑会增加成本并限制性能。因此,构建新一代低成本、高效率、低功耗的人工神经网络是智能技术的重要步骤。人脑中存在约 1 000 亿个神经元,神经元通过神经突触连接共同构成复杂但高效、低功耗的神经网络,维持人的正常生命活动。像人脑一样能够对信息进行学习、记忆和灵活处理的智能计算机是未来计算机发展的方向和目标。神经形态网络就是一种受人脑启发提出的类脑计算系统。由于生物体神经突触是完成大脑神经元信息传递和协调的基本单元,也是生物神经网络进行学习、记忆、感知等复杂生命活动的重要基础结构,其中突触可塑性(Syn-aptic plasticity)是神经细胞学习、记忆功能的前提14。因此,基于电
11、子器件实现类脑突触功能是构造大规模人工神经形态网络首先需要解决的问题。电子类脑神经突触,主要是依据器件导电状态在物理信号刺激下的变化来模拟突触权重的改变。利用 CMOS、晶体管、电阻、电容等传统基本元件,配合数模转换、模数转换等复杂电路系统模拟突触功能亦有报道57,但除了功能器件,往往需要复杂的电路系统和其他元件的配合,导致系统复杂,功耗高,与超低功耗的生物神经网络系统相悖。忆阻器是一种新型电子器件,被认为是继电阻、电容、电感后的第四种电子元件,相关理论由蔡少棠于 1971 年首次提出8,并于 2008 年由惠普公司首次成功制备9。由于忆阻器具有可高密度集成、低功耗且高速开关等优点,可以与传统
12、的 CMOS 工艺兼容,已被广泛应用于数据存储、逻辑运算等领域。同时因为忆阻器具有精确可调的电导,被认为是模拟神经突触的最佳选择。本文在比较忆阻器和神经突触相似性的基础上,就近些年基于忆阻器在类脑神经突触应用方面的研究进展进行简要综述。1忆阻器和生物神经突触的相似性忆阻器是具有“三明治”结构的两端器件,跟生物突触的“突触前膜突触间隙突触后膜”相似(图1)。忆阻器具有非易失性,有“记忆”功能,其电阻或电导的变化取决于施加于器件的信号,即忆阻器的阻态与施加于器件的电激励历史有关,这与生物神经突触的特征高度相似12。从忆阻器阻变特性的机理来看,其阻态变化主要基于介质内部离子(如氧空位、活性金属离子等
13、)在外部电激励的作用下产生迁移所导致。这种离子迁移过程与生物神经突触信号传输过程中的 K+、Ca2+等离子迁移类似。表 1 比较了忆阻器和生物突触在结构、性质等方面的差异。另外,忆阻器简单的器件结构、纳米级的介质层以及忆阻器与 CMOS 工艺的兼容性,使得构建类脑大规模集成电路成为可能。目前,忆阻器是构建电子神经突触的最佳方案13。图 1忆阻器与生物神经突触的比较2 Figure 1The comparison diagram of memristor and biologicalnerve synapse2 表 1忆阻器与生物神经突触的比较Table 1The comparison diag
14、ram of memristor and biologicalnerve synapse忆阻器神经突触结构顶电极阻变层底电极 突触前膜间隙后膜性质非易失性(阻态依赖特性)可塑性工作原理离子迁移神经递质迁移主要参数电导突触权重2基于忆阻器类脑突触可塑性的模拟突触可塑性(Synaptic Plasticity)是神经突触的基本属性,是指在神经刺激信号作用下,突触的形态和功能发生一定的改变,且可以维持一段时间的特性。这是大脑神经系统实现学习、记忆和维持其他生命功能的重要基础。突触的可塑性可以通过“突触权重”(Synaptic Weight)进行衡量,以反映神经元之间的连接强度4。因此,神经突触具有可
15、塑性,是指突触权重根据突触前后神经元的活动发生改变。根据神经刺激信号作用下突触权重的变化,突触可塑性表现为多种形式。权重变化的时间长和短2华 南 师 范 大 学 学 报(自 然 科 学 版)第 54 卷分别对应于生物系统中的长时记忆和短时记忆,因此可塑性主要可分为长时程可塑性(Long TermPlasticity,LTP)和短时程可塑性(ShortTerm Plastic-ity,STP)。以上 2 种可塑性都具有兴奋(Potentia-tion)和抑制(Depression)可塑性类型,分别对应于长时程增强(LongTerm Potentiation,LTP)和长时程抑制(Long Ter
16、m Depression,LTD)、双脉冲易化(Paired Pulse Facilitation,PPF)和 双 脉 冲 抑 制(PairedPulse Depression,PPD)。神经刺激信号多为脉冲形式,根据突触前后神经信号脉冲到达时间及脉冲速率产生的可塑性,分别称为放电时间依赖可 塑 性(Spiking Timing Dependent Plasticity,STDP)和放电速率依赖可塑性(SpikingateDe-pendent Plasticity,SDP)等。当然,除了基本的可塑性功能,神经突触也具有高级学习功能,如:非联想学习(Nonassociative Learning
17、)、联想学习(Associ-ative Learning)。大脑正是通过结构复杂的神经元和突触神经网络系统,调节神经突触可塑性以适应外界刺激,从而控制生命活动。21STP 的模拟神经突触 STP 指短暂性的突触权重变化,对神经系统的瞬时记忆和短时程适应具有重要作用。STP 的形式多样,现有的文献中主要研究 PPF 和PPD 这 2 个重要的学习规则,对应突触权重的增强和抑制1012。在 PPF 规则中,当第二个电压脉冲紧跟在前一个脉冲之后,第二个脉冲将引起突触权重的增加。MILANO 等12 基于 ZnO 纳米线忆阻器,观察了纳米线表面 Ag 导电细丝在电压脉冲作用下的形成/溶解转变过程,并实
18、现了神经突触的 STP 功能。如图2A 所示,通过施加幅度 25 V、脉冲宽度 2 ms、脉冲间距 2 ms 的电压信号,器件的响应电流逐渐提高,相应的电导也逐渐增加。通过对电导的归一化处理发现:器件的电导权重随电压脉冲的作用逐渐上升,这与 PPF 过程中的权重变化类似。PPF 产生的权重会受脉冲间隔的影响,脉冲间隔越大,权重越小(图 2B)。类似的 PPF 功能在其他忆阻器上也得以实现,如 IZO 忆阻器13、有机金属卤化物钙钛矿忆阻器14、Ag/Ag2S/SiO2/ITO 忆阻器15。PPD 规则与 PPF 相反,当第二个电压脉冲紧跟在前一个脉冲之后,第二个脉冲引起的突触电流减小,即 2
19、次脉冲刺激后器件的权重减小。许多文献已对忆阻器模拟 PPD 规则进行了报道1618。JO-SEPH 等19 基于两端生物分子忆阻器提出 PPF 和PPD 规则的模拟方法,发现通过增大电压脉冲的间隔,可以使响应电流的变化趋势由随脉冲数目逐渐上升转变为逐渐下降,分别对应神经突触的 PPF 和PPD 过程,成功模拟 PPF 向 PPD 的转换。图 2ZnO 忆阻器突触的 PPF 功能19 Figure 2The PPF function of ZnO memristor synapse19 22LTP 的模拟神经突触 LTP 由持续的、强度较大的刺激引起,造成长期性的突触权重变化,可以保持几个小时甚
20、至更久20。LTP 的持续时间比 STP 时间长,但也会随时间衰减。LTP 主要有 2 种形式,其中在神经刺激作用下突触权重逐渐增加的称为“长时程增强(LTP)”,相反,突触权重逐渐减小的称为“长时程抑制(LTD)”,两者往往会成对出现。利用忆阻器的非易失特性,可以 对 LTP 规 则 进 行 模 拟2125。ILYAS等25 制备的 Ag/SiOxAg/TiOx/p+Si 忆阻器3第 6 期陈心满等:忆阻器类脑神经突触的研究进展具有典型的双极型阻变性质(Bipolar esistive Switc-hing),并且分别用幅度为+12 V 和12 V 的电压脉冲信号模拟神经突触的兴奋信号和抑制
21、信号,成功模拟了 LTP 和 LTD 过程(图 3)。图 3Ag/SiOx:Ag/TiOx/p+Si 忆阻器模拟长程可塑性功能25 Figure 3Ag/SiOx:Ag/TiOx/p+Si memristor simulates longrange plasticity function25 23STP 向 LTP 的转化通过充分的训练可以使 STP 向 LTP 转换,这是记忆和学习的基本过程26 27。采用忆阻器模拟人工神经突触可塑性的过程中,可以通过改变脉冲刺激数目25,28、脉冲时间参数29 等实现 STP 向 LTP的转换。LI 等30 研究表明,在 Au Ag 纳米粒子忆阻器上施加的
22、脉冲数在 1030 范围时(图 4),归一化的权重电流在去除刺激后迅速下降,与记忆保持率相对应的突触权重下降至近零。但当脉冲数增加到 50 时,突触权重下降到大约 30%的相对稳定状态,并且没有进一步衰减至初始状态。通过增加脉冲刺激数目,可实现 STP 向 LTP 的转换。YI 等29 基于 ZnO 光子忆阻器,通过减小电压脉冲的间隔使STP 转换为 LTP。图 4Au Ag 纳米粒子阻器模拟神经突触 STP 到 LTP 转换过程30 Figure 4AuAg nanoparticle arrestor simulates the process of STP to LTP conversio
23、n of synapses30 24SDP 的模拟SDP 是生物神经突触的一项重要功能2,反映了突触权重对神经刺激频率的依赖。通常,随着脉冲刺激频率的上升,突触的权重会相应增加。已有较多基于忆阻器实现类脑神经突触 SDP 功能的报道,如 MAPbI3钙钛矿忆阻器件31、CMOS/忆阻器混合器件32、硫族化物忆阻器33、Ag/AgInSbTe/Ag相变忆阻器34。XIAO 等31 实验发现,施加电压脉冲刺激 MAPbI3钙钛矿忆阻器,脉冲间隔较长时,即脉冲频率较低,器件的电导经过短暂上升后很快恢复到初始状态,提高脉冲刺激的频率可以提高器件的电导权重(图 5)。该研究结果表明:忆阻器的记忆特性可通
24、过刺激信号频率来调控,从而实现 STP、LTP 的变换。4华 南 师 范 大 学 学 报(自 然 科 学 版)第 54 卷图 5忆阻器模拟神经突触 SDP 的过程31 Figure 5Memristor simulates the process of synaptic SDP31 25STDP 的模拟STDP 是大脑神经突触的一种高级学习功能,遵从 Hebbian 学习规则3538:当突触前膜的刺激先于突触后膜刺激时,突触的权重会增加;相反,当突触后膜刺激先于突触前膜刺激,突触的权重会减弱。假定 t 为突触后膜和突触前膜刺激的时间差,为突触权重的变化,则 STDP 规则可以描述为:=0et/
25、(t0)0et/(t0)(1)其中,0代表权重,代表权重的变化速率。在忆阻器模拟 STDP 的研究中,器件两端脉冲代表神经突触前后神经元传递的神经刺激,器件两端的电压为VM=VpreVpost,脉冲序列施加在器件两端的时间差 t=tpretpost,器件的电导权重变化依赖于t25,3942。图 6A、B 提供了 2 种模拟 STDP 的脉冲序列25。EPSC/IPSCExcitatory Postsynaptic Current(EPSC)、Inhibitory Postsynaptic Current(IPSC)变化代表脉冲序列施加后器件电导权重变化的归一化数值。t0 时,若VM大于 LTP
26、 的阈值Vth1,器件获得有效的刺激,0 且随着 t 的增加而增加,出现 LTP 性质;相反,当 t0 时,若VM小于 LTP 的阈值Vth2,0 并且随着 t 的增加而减小,出现LTD 性质。图 6C、D 是利用外电路构建神经网络系统的 STDP 形式,在 t0 和 t0 时,突触权重根据时间差的大小表现出 3 种不同的变化。当然,生物体不同部位或不同刺激下的 STDP 规则有所差异。根据神经回路中信息获取和处理的方式不同,STDP 可以分为以下 4 种4346:(1)反对称型 Hebbian 学习规则(AntisymmetricHebbian learning rule)STDP,即 t0
27、 时突触权重增加,t0 时突触权重减少;(2)反对称反 Hebbian 学习规则(AntisymmetricantiHebbian learning rule)STDP,即 t0 时突触权重减少;t0 时突触权重增加;(3)对称型 Hebbian 学习规则(Symmetric Heb-bian learning rule)STDP,这种规则不依赖于 t 的正负,只跟 t 大小有关;(4)对称反 Hebbian 学习规则(Symmetric antiHebbian learning rule)STDP,无论 t 大小、极性如何,突触权重都为抑制状态。KUZUM 等46 基于 Ge2Sb2Te5相
28、变型忆阻器(PCM)通过施加不同的脉冲序列实现了 STDP 的 4种规则,如图 7 所示。5第 6 期陈心满等:忆阻器类脑神经突触的研究进展图 6Ni/07Pb(Mg1/3Nb2/3)O303PbTiO3/Ni 忆阻器模拟及简化后神经突触 STDP 过程25 Figure 6Ni/07Pb(Mg1/3Nb2/3)O303PbTiO3/Ni memristor simulates and the process of synaptic STDP25 图 7Ge2Sb2Te5相变型忆阻器模拟神经突触 4 种 STDP 功能46 Figure 7Ge2Sb2Te5phase change memri
29、stor simulates fourSTDP functions of synapse46 26再可塑性的模拟再可塑性(Metaplasticity)指神经突触可塑性能力受其活动历史调节的现象,是突触可塑性的高级形式,也称为“突触可塑性的可塑性”4748。一般来说,前期刺激或经历会影响突触可塑性(如 STP 的阈值),且对后续的突触可塑性的性质产生影响,从而对突触可塑性进行再塑造。研究表明:通过改变前期的刺激,LTP、LTD 的可塑性效果会相应地改变,这种调节作用可以维持至少 2 h4951。此外,再可塑性对生物个体学习记忆的调节起重要作用。例如:一定程度增加神经细胞的兴奋性,有利于学习能力
30、的提高5257。如图 8A 所示,再可塑性的研究要求在获得可塑性行为之后引入前期刺激,并观察前期刺激对可塑性的性质影响(图8A)。TAN 等56 利用具有遗忘特性的 Pt/WO3 x/Pt 忆阻器模拟了突触再可塑性的功能(图 8B),脉冲刺激(17 V,10 s)作为前期刺激不会引起电导变化,但施加前期刺激之后使当前刺激(21 V,10 s)触发更大的电导增加,体现了前期刺激对当前可塑性的影响。LEE 等57 利用 Pt/KNbO3/TiN 忆阻器实现了 LTP、LTD 和 STDP 功能,通过改变脉冲序列参数,影响氧空位导电细丝的状态,从而对之后的 LTP、LTD、STDP 的可塑性进行调节
31、,可以实现对突触可塑性的可塑性研究,即再可塑性。最近,本课题组58 在 Ag/HfOx/ITO 忆阻器上发现了一种特殊的阻态依赖阈值开关(Stateful Thresh-old Switching)。忆阻器分别处于双极性阻变的 ON、6华 南 师 范 大 学 学 报(自 然 科 学 版)第 54 卷OFF 态时,在毫伏级的工作电压区间,依然具有阈值开关特性(TSON和TSOFF),且开关窗口依赖于 ON、OFF 态的电阻。这种特殊的电致阻变特性,可以简化类脑学习遗忘过程中再可塑性的实现过程(图9):通过施加 3 个 02 mV 的增强脉冲进行学习,遗忘过程为 001 mV 响应电流的衰减,在
32、ON 和 OFF状态下的学习遗忘过程通过Veset或VSet脉冲作为前期刺激来调制。图 8生物神经突触再可塑性示意图及忆阻器模拟神经突触再可塑性过程56 Figure 8The memristor mimics synaptic metaplasticity56 图 9忆阻器阻态依赖阈值开关特性模拟神经突触学习遗忘行为的突触再可塑性58 Figure 9The metaplasticity of learningforgetting based on“stateful”threshold switching of memristor58 27忆阻器突触在感知神经系统中的应用生物体在形成触觉、视
33、觉、味觉等过程中,需要外部感知器、神经链路、神经中枢等共同作用,其中少不了神经突触的参与。忆阻器突触在构建仿生感知系统中可以起到非常重要的作用,可以使仿生系统更接近生物体性能。最近,集成忆阻器和压阻传感器或其他类皮肤传感器所构建人工触觉神经系统备受关注5963,这对模拟皮肤的触觉、痛觉等具有重要意义。动物感知触觉的过程(图 10):由触觉感受器感知触觉,再经过神经回路传到大脑进行信息处理,该过程的信息传递离不开神经突触的作用。ZHANG等59 首次集成压阻传感器和忆阻器并组成了人工触觉神经系统。压阻传感器和忆阻器制备简单的结构及成分组成,其中忆阻器作为神经突触传递触觉信号,可稳定模拟神经突触的
34、 PPF、PPD、STDP 等基本功能,提高了人工触觉系统手写识别过程的精确度。GE 等61 利用柔性忆阻器构成触觉感知回路,对柔性电子皮肤的研究具有较大参考意义。YOON 等63 利用扩散型忆阻器构建了人工伤害感受器,经过忆阻器处理后的热信号逐渐衰减至正常状态,模拟了受损组织(伤害感受器)的自愈过程(图 11)。总之,利用忆阻器构建人工神经突触,再将其运用于人工神经系统中,有利于搭建贴近生物体特性的仿生系统。28非联想学习的模拟非联想学习(Nonassociative learning)反映动物面对单一刺激引起的适应过程,是人和动物具备的简单的学习能力,是其他复杂学习行为的基础,主要包括习惯
35、化(Habituation)和敏感化(Sensitization)两种类型6467。习惯化是指当不产生伤害的刺激持续施加到个体上时,个体逐渐对这种刺激的自发反应减弱或消失的现象。习惯化会随着时间而消退或被新的刺激所取代,该过程即去习惯化(Dishabitu-ation)。YANG 等61 制备了 HfOx忆阻器和 NMOSFET 集成的突触器件,模拟了突触的习惯化和非习惯化过7第 6 期陈心满等:忆阻器类脑神经突触的研究进展程,如图 12 所示。首先对器件施加 100 个脉冲,幅度为1 V,作为习惯化脉冲;之后施加幅度为045 V的脉冲,作为去习惯化脉冲(图 12A)。随着刺激的增加,器件的响
36、应电流在习惯化脉冲的作用下逐渐衰减,对应于神经突触的长时程抑制(LTD)过程,表明器件在连续的脉冲作用下逐渐适应了这种弱刺激,减小了对习惯化脉冲的注意力;在去习惯化脉冲作用下器件的响应电流逐渐上升,代表新刺激的出现导致此前建立的习惯化现象被取代,模拟了去习惯化过程。器件模拟的习惯化和去习惯化过程与生物实验中的非联想学习过程对应(图 12B64)。除了电脉冲,ZHAO 等68 基于 ZnO 纳米线光敏忆阻器,利用 UV光脉冲引起的非联想学习过程,可以很好地模拟习惯化、敏感化过程:无 UV 光照射时器件响应电流逐渐衰减,对应于习惯化过程;UV 光照射是器件响应电流逐渐增加,对应于敏感化过程。图 1
37、0触觉感知系统及其模拟过程60 Figure 10The tactile sensing system and its simulation process60 图 11忆阻器模拟伤害感受器63 Figure 11The memristor mimics nociceptor63 8华 南 师 范 大 学 学 报(自 然 科 学 版)第 54 卷图 12忆阻器模拟神经突触非联想学习功能Figure 12The memristor simulates non associative learning of synapse29联想学习的模拟联想学习普遍存在于人和动物的神经系统中,是个体在复杂环境中
38、生存的重要保障,具体指环境刺激与生物体自身反应之间形成联系的过程,最早由 PAVLOV 提出。在经典的联想学习实验中,PAV-LOV 在给予狗食物的同时用铃声刺激狗,经过一段时间的训练,狗在听到铃声时就会分泌唾液,说明狗将食物和铃声建立了联系。在这个实验中,食物作为非条件刺激,任何情况都会使狗分泌唾液;铃声为条件刺激,在联想学习训练前不会引起狗分泌唾液,经过训练后变成了条件刺激,可以在一定的时间内刺激狗分泌唾液,说明联想学习成功建立。目前报道的忆阻器联想学习方案多采用忆阻器配合运算放大器、电阻等元件进行模拟,或通过仿真软件建立复杂的电路系统实现。YUIY 等69 通过微处理器和数模转换电路,在
39、实现忆阻器功能的基础上,模拟了联想学习的各项基本性能。MA-TIN 等70 通过一个忆阻器配合加法器、比较器电路构建了基本的二输入联想学习系统,通过忆阻器的非易失特性实现了联想学习功能。BICHLE 等71 通过具有记忆特性的场效应晶体管配合同步时钟信号,实现了联想学习功能。WAN 等72 提出了一种氧化铟锌基晶体管配合反相器的方案,可模拟联想学习的部分功能。通常,联想学习的过程包括新信息的学习、旧信息的消退、再恢复、泛化以及抑制性保护等基本过程。然而以往报道仅仅能够模拟联想学习的某部分功能,很少能够实现联想学习的整个过程。本课题组58 利用 Ag/HfOx/ITO 忆阻器特殊的阻态依赖阈值开
40、关(图 9),分别采用04 mV 和075 V脉冲为非条件刺激和条件刺激信号,并设定阈值电流 1 A。研究表明:狗对铃声产生反应,并将食物和铃声建立了联系。模拟巴普洛夫狗联想学习建立过程模拟见图 13A,其消退、再恢复、泛化以及抑制性保护见图 13B。同时,由于器件特殊的阻变特性,联想学习的全过程均可实现无极性操作。值得一提的是,Ag/HfOx/ITO 突触器件的功耗仅为571 pW,与生物突触(约 10 pW)相当,但远低于此前报道的电子突触,因此这对仿生人工神经网络具有重要意义。人的视觉是通过视网膜接收外界图像,再通过神经回路传至大脑处理而形成的。对类脑智能而言,构建人工视觉神经网络同样具
41、有重要意义。具有光电响应的忆阻器,利用器件的光电响应和非易失特性,可以模拟视觉神经对图像信息的传感及存储。ZHONG 等74 利用受 UV 光控的聚(2乙烯基萘)有机薄膜忆阻器模拟神经突触的 STP 功能,利用 UV 光实现了对 PPF 和 PPD 功能的调控。HU等75 报道了基于 ZnO1 x/AlOy异质结的光电忆阻器,所制备的器件对 UV 光具有较好的响应特性和易失性阻变性质,施加 UV 光可以使忆阻器突触的兴奋性突触后电流(Excitatory Postsynaptic Current,EPSC)逐渐上升,通过提高 UV 光的开关频率或光功率可以实现从 STP 到 LTP 的转换(图
42、 14)。视觉信号的获取、传输、处理是构建人工神经网络的重要一环,利用光电忆阻器构建神经突触,模拟图像的处理过程7678 是一种系统简单、功耗低和操作简易的方法。ZHOU 等79 利用光电忆阻器模拟了 STP、LTP 功能,同时利用忆阻器阵列应用到人工视网膜的图像处理过程中,提高人工视觉神经网络对图像识别准确性(图 15)。9第 6 期陈心满等:忆阻器类脑神经突触的研究进展图 13Ag/HfOx/ITO 忆阻器模拟联想学习过程及消退、再恢复、泛化以及抑制性保护58 Figure 13Ag/HfOx/ITO memristor simulates associative learning pro
43、cess,extinction,recovery,generalization and inhibitory protec-tion58 图 14光电忆阻器光刺激频率和功率模拟 STP 到 LTP 的转换75 Figure 14The Photoelectric memristor simulates STP to LTP conversion75 图 15光电忆阻器阵列的人工视网膜79 Figure 15The photoelectric memristor arrays for artificial retina79 除了探究 UV 光对光电神经突触的权重影响,LI等80 利用 ZnO/P
44、bS 异质结器件在全光谱范围内光电突触的活动,其中短波长的红外光可模拟突触的抑制可塑性,长波长的 UV 光可诱导突触兴奋可塑性。同时还模拟了神经突触的其他性能(如 LTP、STP 和SDP 等),该器件对光响应的波长范围大,适用于多种环境中光电神经突触的模拟。文献 81报道了一种对红外光和可见光有响应的钙钛矿光电忆阻器,将该光电忆阻器用于光电神经突触的模拟,采用红外光作为忆阻器神经突触的兴奋刺激,采用红光作为抑制刺激,分别使光电神经突触的权重逐渐增加或减少。01华 南 师 范 大 学 学 报(自 然 科 学 版)第 54 卷3基于忆阻器的人工神经网络在利用单一忆阻器模拟实现单个神经突触的功能模
45、拟之后,研究人员把研究重点放在如何构建高密度的人工神经网络工作中。忆阻器结构简单、体积微小,为构建大规模神经网络奠定基础。如图 16所示,忆阻器神经交叉阵列中每个交叉点的忆阻器都代表一个连接前后神经元的突触结构,其中突触的权重可以用忆阻器的电导来表示。通过规模化集成的忆阻器神经网络已实现了稀疏编码82、模式识别8384、特征提取8586、数据聚类87 等研究。稀疏编码算法是一种无监督学习方法,SHEI-DAN 等82 利用 3232 交叉忆阻器阵列在硬件上实现稀疏编码算法,该算法可以提取图像中的学习特征值进而提取隐藏特征,以较少的神经元重建图像输出,从而实现自然图像的稀疏编码(图 16)。PA
46、K 等88 通过硬件,实现了基于忆阻器的神经网络 HNN(Hardware Neural Network),并用于脑电波(EEG)信号的识别。研究人员首先采集人在想象出和说出不同元音字母(a、i、u)时产生的不同EEG 信号,接着在 FPGA 等设备的协助下,忆阻器HNN 神经网络对 EEG 信号进行处理,实现语音信号的识别(图 17)。此外,研究人员还利用忆阻器神经网络实现了对图像8990、文字9192 等信息的识别和分类。图 16忆阻器神经交叉阵列及用于稀疏编码82 Figure 16The memristor neural cross arrays towards sparse codi
47、ng82 图 17EEG 模式识别忆阻器系统88 Figure 17The EEG pattern recognition memristor system88 4总结与展望忆阻器以其独特的记忆电学性质,称为模拟神经突触的最佳选择。本文首先总结了不同忆阻器模拟神经突触的可塑性,包括短时程可塑性(STP)和长时程可塑性(LTP)及 STP 到 LTP 的转换过程、SDP、STDP,并着重介绍了可塑性的“可塑性”性质(即再可塑性)的模拟,并概述了忆阻器神经突触的高级应用,如非联想学习、联想学习以及忆阻器突触在感知神经系统中的应用;其次总结了忆阻器模拟神经突触性能的研究情况;最后研究了忆阻器神经交叉
48、网络在稀疏编码、模式识别等方面的应用。忆阻器可以很好地模拟神经突触的各项功能,能和CMOS 器件、电子线路、嵌入式系统等组成具有神经形态的电路系统,未来在神经形态计算、图像处理、11第 6 期陈心满等:忆阻器类脑神经突触的研究进展类脑人工智能等方面存在很大的发展空间。尽管如此,忆阻器模拟神经突触、构建类脑神经系统仍存在一些问题需要解决,可概括为以下几个方面:(1)忆阻器制备技术受限,影响器件的稳定性和均一性,使大规模器件的集成应用受限制。基于忆阻器神经突触的神经网络要求器件阵列具有良好的性能,以提高系统的稳定性,但大部分对于忆阻器性能的研究重点集中在单个器件上,对于忆阻器大规模交叉阵列的稳定性
49、、均一性的关注较少93 94。目前忆阻器的工作机理还不够清楚,给忆阻器神经突触性能增加了更多不确定性。另外,器件组成的神经网络系统中,漏电流影响集成阵列中器件的性能,使器件之间产生串扰,限制了大规模集成阵列的应用。目前,解决忆阻器集成阵列中漏电流的方法主要是运用 1T1M(Onetransistoronememristor)结构代替单一忆阻器,或者运用忆阻器和 CMOS 电路进行集成,这在一定程度上可以解决串扰问题,但会限制系统的集成密度。(2)忆阻器或忆阻器交叉系统工作功率相对较大,不利于低功耗类脑神经网络的模拟。生物神经系统中单个突触的工作能耗约为 10 pW,这种超低功耗是神经系统高效工
50、作的保障。通过文献调研发现,忆阻器神经突触虽然可以模拟生物突触的基本功能,但功耗远大于生物突触,这是限制忆阻器神经网络发展的重要因素。因此制备具有超低工作电压或电流的忆阻器突触器件,进而构建超低功耗忆阻器神经网络,是一项重要的研究方向。总之,将忆阻器运用到神经突触模拟进而构建大规模神经网络中,还有巨大的开发空间,随着忆阻器制备技术的提高和阻变机理研究的深入,忆阻器在仿生系统和类脑神经网络中所起的作用会越来愈大。参考文献:1 LAI Q,ZHANG L,LI Z,et al Ionic/electronic hybrid ma-terials integrated in a synaptic t