收藏 分销(赏)

数据驱动与知识引导结合下人工智能算法模型.pdf

上传人:自信****多点 文档编号:581121 上传时间:2024-01-02 格式:PDF 页数:15 大小:3.46MB
下载 相关 举报
数据驱动与知识引导结合下人工智能算法模型.pdf_第1页
第1页 / 共15页
数据驱动与知识引导结合下人工智能算法模型.pdf_第2页
第2页 / 共15页
数据驱动与知识引导结合下人工智能算法模型.pdf_第3页
第3页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、数据驱动与知识引导结合下人工智能算法模型金 哲 张 引*吴 飞 朱文武 潘云鹤(浙江大学计算机科学与技术学院 杭州 310012)(清华大学计算机科学与技术系 北京 100084)摘 要:当前人工智能的学习模式主要以数据驱动为主要手段,以深度神经网络为主流的机器学习算法取得了显著进展。但是这种数据驱动的人工智能手段依然面临数据获取成本高、可解释性弱、鲁棒性不强等不足。该文认为在现有机器学习算法中引入先验假设、逻辑规则和方程公式等知识,建立数据和知识双轮驱动的人工智能方法,将推动更通用计算范式的变革创新。该文将可用于引导人工智能算法模型知识归纳为4种逻辑知识、视觉知识、物理定律知识和因果知识,探

2、讨将这些知识与现有数据驱动模型相互结合的典型方法。关键词:人工智能;大数据;数据驱动;知识引导中图分类号:TN911;TP391文献标识码:A文章编号:1009-5896(2023)07-2580-15DOI:10.11999/JEIT220700Artificial Intelligence Algorithms Based on Data-driven andKnowledge-guided ModelsJIN Zhe ZHANG Yin WU Fei ZHU Wenwu PAN Yunhe(College of Computer Science and Technology,Zhejia

3、ng University,Hangzhou 310012,China)(Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China)Abstract:Nowadays,artificial intelligence is in the era of big data-driven manner.Machine learning algorithmswith deep neural networks as the mainstream have achieved great dev

4、elopment and achievements.However,data-driven artificial intelligence still faces problems such as the cost of annotating data,the lack ofinterpretability,and the weak robustness.The Introduction of knowledge such as prior hypothesis,logic rulesand physical equations into existing machine learning a

5、lgorithms will build artificial intelligence approachespowered by both data and knowledge which could promote innovations of computing paradigm.Four types ofknowledge(logical knowledge,visual knowledge,laws of physics knowledge and causal knowledge)that can beused to guide artificial intelligence al

6、gorithm models are summarized in thus paper,and typical approaches toguide the combination of these knowledge with data-driven models are discussed.Key words:Artificial intelligence;Big data;Data-drive;Knowledge-guided 1 引言图灵奖得主Gray把人类的科学研究模式归纳为4种范式:第1种范式是实验科学,通过基于实验或经验的观察来完成对自然现象描述的研究;第2种范式是理论科学,对自

7、然现象背后隐藏的模式和规律进行抽象,通过数学模型来刻画(如对海浪、水波、燃烧和飞机颠簸乱流等刻画的纳维-斯托克斯方程);第3种范式是模拟仿真,即搭建计算系统去模拟复杂的客观物理世界,从仿真系统中观察各种因素的此消彼长,再指导客观物理世界的改造;Gray认为现在进入了被称为数据密集型计算的第4范式阶段。在数据密集型计算时代,随着物联网、5G和传感器等技术进步,世界已从2元空间结构人-物理社会(Physics,Human society,PH)演变为3元空间结构人-物理-信息社会(Cyber,Physics,Hu-man society,CPH),在3元空间可以史无前例地获得记录了人类社会生产、生

8、活和工作等方面的海量数据。从这些海量数据出发,挖掘其结构、模式和规律等知识,从数据到知识、从知识到决策与服务是数据密集型计算要解决的难点问题。收稿日期:2022-05-20;改回日期:2022-08-24;网络出版:2022-08-29*通信作者:张引基金项目:中国工程科技知识中心项目(CKCEST-2021-1-8),国家自然科学基金(62037001)Foundation Items:China Knowledge Centre for EngineeringSciences and Technology Project(CKCEST-2021-1-8),The NationalNatur

9、al Science Foundation of China(62037001)第45卷第7期电 子 与 信 息 学 报Vol.45No.72023年7月Journal of Electronics&Information TechnologyJul.2023数据密集型计算当前集中于数据驱动下的机器学习,即算法来学习拟合数据分布。然而,当前数据驱动的人工智能面临若干挑战:需要大量数据以监督学习或自学习来进行参数拟合;机器学习算法以黑盒子方式优化而缺乏可解释性;人工智能难以应对对方样本攻击导致模型鲁棒性脆弱。潘云鹤院士1提出将数据驱动和知识引导结合到机器学习中将是人工智能2.0的显著特征。李国杰

10、院士2指出,基于最基础科学原理的机器学习需要人类多领域科学家的智慧和机器“智能”有机融合,是科研第5范式的雏形。国际上,因在统计学和因果推理方面的基础性工作获得图灵奖的Pearl3认为机器学习应当利用大量现存的科学知识,结合可收集到的数据,去解决各领域的关键问题。本文认为在现有机器学习算法中引入先验假设、逻辑规则和方程规律等知识,建立数据和知识双轮驱动的人工智能方法,将推动更通用(moregeneral)计算范式的变革创新。2 人工智能中知识引导的算法模型一般而言,可以与数据驱动机器学习模型相互结合的知识包括逻辑知识、视觉知识、科学定律知识、因果知识等,如图1所示。2.1 逻辑知识逻辑知识作为

11、最传统的知识之一,包括谓词逻辑、时序逻辑等,一直以来受到研究者的关注。回顾人工智能的发展历史,人工智能经历了符号主义(symbolicism)和联结主义(connectionism)两个相互补充的研究范式。符号主义表达人类思维的基本单元是符号,人类认知的过程是符号运算,因此使用公理和逻辑搭建人工智能系统;联结主义则源于仿生学,主张用神经网络以及神经网络之间的连接机制来实现人工智能。20世纪60年代,符号主义的代表,专家系统的出现曾开启了人工智能的黄金时代,其将系统分为知识库和推理引擎,分别负责知识的存储和基于知识的逻辑推理。然而人们逐渐发现,专家系统难以较为便利地获得抽象知识,应用范围局限性大

12、,符号主义逐步走向衰弱。在这个背景下,联结主义开始走向复兴,神经网络及后续的深度学习在数据驱动机制推动下,成为大数据时代研究核心工具。过去的逻辑知识以专家库的形式呈现,它所能模拟的知识和符号只能局限于人类整理出来的小部分知识,因此在遇到真实世界的复杂问题时,仅仅使用单一谓词无法解决场景任务。在新的人工智能时代,如何将逻辑知识与已有的数据驱动型神经网络相结合,一直受到研究者关注。逻辑知识目前正在往知识图谱(Knowledge Graph,KG)方向发展。知识图谱作为揭示实体之间关系的语义网络,阐述了实体的描述性知识以及实体与实体之间的关系,是采用计算机符号表示和处理知识的方法。知识图谱早期主要支

13、持搜索引擎对搜索结果按照关系进行综合呈现。随着研究的不断深入,目前基于知识图谱的自动问答、推荐系统等技术已被广泛应用在智能客服、商品推荐、金融风控等领域中,例如阿里巴巴构建了阿里巴巴概念图谱(Alibaba ConceptualGraph,AliCG)4和第2代阿里巴巴电商认知概念网(Alibaba e-commerce Cognitive Concept Net 2,AliCoCo2)5并有效应用在交互式搜索、开放式对话系统和广告推荐等电商业务场景中;警方针对电信诈骗案,根据通话数据构建知识图谱,并基于知识图谱挖掘欺诈案中的线索6,7等。图 1 可与数据驱动机器学习模型相互结合的4种知识第7

14、期金 哲等:数据驱动与知识引导结合下人工智能算法模型25812.2 视觉知识视觉知识是知识表达的一种新形式,在20世纪70年代,认知心理学家对视觉记忆进行了一系列实验8,以心象(mental Imagery)扫描实验为例,参与者需要将注意力从照片中的一个物体转移到另一个物体,实验结果表明远距离物体之间注意力的转移需要更长的时间,扫描结果显示在大脑记忆图像中扫描两个物体所需时间和现实世界两个物体之间的距离存在强线性关联。心象这种视觉记忆是形象思维的知识形式9,也可被称作视觉知识。人类记忆中的视觉知识相比于语言知识,具有以下几个特征:(1)能够表达对象的空间形状、大小、空间关系、色彩和纹理;(2)

15、能够表达对象的动作、速度和时间关系;(3)能进行对象的时空变换、操作和推理。而要将视觉知识用在人工智能中进行表达和推理,需要将现有的图形表达重构为视觉概念。视觉概念包括典型和范畴、层次结构以及动作结构。典型表示这个概念的形状、色彩、大小等核心要素,范畴则是典型中各种参数的变化域,也可表达为典型和若干非典型形状、色彩所构成的综合场10,层次结构表示子概念空间组织的结构,动作结构表示子概念的典型运动及动作范畴11。在目前的计算机视觉领域,一般使用深度神经网络模型对大量的图像数据进行训练,在图像分类1214、目标检测15,16、语义分割17,18等多个子领域取得了优异的成果。但是,即使近年来涌现出部

16、分基于零样本和小样本进行训练的算法与模型19,20,大部分深度神经网络模型依旧无法摆脱对大规模标识数据的依赖。相比之下,人类使用视觉知识完成视觉任务,一方面视网膜将不同波长、亮度的光线转换为生理信号后,通过视神经和神经通路传递到大脑视觉皮层,实现短期记忆;另一方面激活了工作记忆过程中长期记忆的视觉知识。因而人类在完成视觉任务时往往只需要少量数据,同时具有推理基础21。因此,相比逻辑知识,视觉知识能够表达语言符号所无法刻画的信息,具有更为综合的生成能力,是对事物更为全面的理解和表示,可以反映事物的时空演化。视觉知识具有整合多源、跨领域数据的优势,可以系统性地提升模型泛化能力。2.3 科学定律知识

17、科学定律由特定的事实推理得出,通常以科学手段经过多年重复的科学实验和观察得出的结论,并且为科学界普遍接受。包括热力学3大定律、牛顿运动定律、能量守恒定律等都可以作为科学定律知识在特定任务中的知识引导。目前,基于物理模型的模拟依然被广泛地使用在各个领域,例如天气预报主要基于斜压流体力学原始方程自洽的动力框架和合理的大气上下界边界条件实现22;蛋白质结构预测中,描述蛋白质构象能量景貌立场的力场需要综合考虑键伸展能、角弯曲能、范德瓦尔斯相互作用、静电以及氢键相互作用等物理定律23等。这些领域具有相同的特点:一方面现有的模拟依赖众多物理和化学定律,往往需要大量的计算工作,一定程度上难以得到精确计算结果

18、;另一方面这些领域每时每刻都在产生大量新的数据,这些领域大数据往往需要数月乃至数年时间才有机会被传统的物理模型纳入迭代,无法及时对模型产生纠正。因此,基于数据驱动的深度学习方法被采纳,如杜其通等人24提出了基于人工神经网络的动力学参数辨识法,提高机器人控制精度,黄铭枫等人25建立了耦合数值天气预报模式和现场实测数据的风速预测神经网络模型等。这些方法在一定程度上解决了一些用经典物理、化学手段难以求解的问题,但由于仅仅是数据驱动,模型的参数计算纯粹依赖训练数据,缺乏科学定律支撑,难以有效利用领域核心知识,在模型的可解释性和计算精度方面仍有待提高。2.4 因果知识现实世界中充满了因果关系。事物和行为

19、之间的因果关系在很大程度上指导着人类的行为模式。在儿童成长过程中,认知世界是儿童首要的发展任务,其中对因果关系的学习是重中之重26,因为因果知识可以有效地说明事物为何存在以及事物变化背后的原因,如:人摔倒就会痛,所以走路不能摔倒;玻璃杯摔到地上就会碎,所以不能碰到玻璃杯,儿童就是在外界和自身的信息源中不断获取这些因果知识不断成长。人工智能与儿童相似,加入因果知识可以帮助模型有效感知、揭示、预测和控制周围环境。3 数据和知识双轮驱动人工智能方法现有的数据驱动人工智能算法面临如下挑战:往往利用海量数据以自监督或自学习方法对众多参数进行拟合。大多数参数拟合机制以黑盒子方式进行,无法合理利用逻辑、规则

20、、约束等知识。由于学习过程以数据驱动进行,无法获得变化更为广泛数据使得学习结果的鲁棒性和泛化性不强,难以应对攻击样本和更为广泛任务场景。当前,新一代人工智能由于如下特点正在迅速发展,为研究更通用人工智能提供了时代背景:(1)信息环境发生了深刻变化。随着移动终2582电 子 与 信 息 学 报第 45 卷端、互联网、传感器网、车联网、穿戴设备等的流行,计算与感知已经广泛遍布世界,与人类密切相伴。网络不但遍布世界,更史无前例地连接着个体和群体,开始快速反映与聚集他们的意见、需求、创意、知识和能力。世界已从2元空间结构人-物理社会(PH)演变为3元空间结构人-物理-信息社会(CPH)。CPH的互动将

21、形成大量3元空间中的新计算,包括感知融合、“人在回路中”、增强现实(Augmented Reality,AR)、跨媒体计算等。(2)社会新需求不断爆发。目前的人工智能虽然在特定任务上表现优异,但在复杂场景、复杂系统中仍然效果不佳。随着人与人、人与机器、机器与机器之间的信息交流更加频繁,社会对于人工智能需求将不断攀升,人工智能需要解决包括智慧城市、智慧医疗、智能交通、智能制造等复杂系统的智能化问题。仅仅使用现有的数据驱动型人工智能,只能从数据中发现所隐藏模式。知识的引入能够有效缓解上述数据驱动模型所面临的问题,首先可以显著减少模型训练所需数据,例如医学图像领域中,数据集稀缺一直是限制该领域深度学

22、习模型发展的因素,此时引入医生知识27,28可以极大程度地提高了这些领域深度学习模型的效果29;训练数据较少的任务可以通过弱监督学习使用标签模型创建更多数据来训练下游模型30,31。其次可以增加模型的可解释性,例如求职筛选辅助决策中使用心理学知识构建整套打分流程32,使机器学习模型的输入、映射和输出都是人类所可以理解的,从而提高整个模型的可解释性;最后可以提高机器学习的可靠性和鲁棒性,例如通过领域知识进行更为合理的数据增强33,34。因此,新的研究范式,应当是面对领域问题,建立以海量数据为驱动,以领域知识为引导和约束的人工智能方法,研究双轮驱动下的人工智能。这就需要将上述领域知识、视觉知识、科

23、学规律和因果知识等外部知识融合到现有模型中。双轮驱动学习算法的常见模式如图2所示。3.1 数据与逻辑知识双驱动方法以逻辑知识的典型代表知识图谱为例,目前知识图谱引入到深度学习技术主要有两种方式:一是将知识图谱的语义信息输入到深度学习中,例如以翻译嵌入(Translating Embeddings,TransE)、旋转嵌入(Rotation Embedding,RotatE)35,36为代表的知识表示算法和图卷积网络37、图注意力网络38等图神经网络模型。二是使用知识图谱的知识作为优化的约束条件,例如Hu等人39提出将1阶谓词逻辑与深度神经网络融合解决情感分类和命名实体识别问题,Chen等人40

24、提出基于知识协同优化的调优方法,将关系知识引入模型并使用知识约束实现协同优化。数据驱动与知识图谱结合的具体应用可以分为知识图谱内部应用和知识图谱外部应用。知识图谱 图 2 双轮驱动学习算法的常见模式第7期金 哲等:数据驱动与知识引导结合下人工智能算法模型2583内部应用包括基于命名实体识别、实体链接等知识图谱构建技术范围内的工作,这些研究工作41,42的主要思路即先通过知识表示算法学习知识图谱中实体和关系的表示,再与神经网络模型进行融合。知识图谱外部应用包括:语言表示模型,例如知识图谱语言模型(knowledge graph language model)等算法4346将知识图谱知识引入语言模

25、型中,学习到了更优异的语言表示;自动问答,例如Chen等人47将知识图谱作为外在智慧源,使用基于双向注意力记忆网络来模拟问题与知识图谱之间的双向交互,完成答案匹配,Bauer等人48额外使用和问题相关性高的常识,以注意力机制引入,实现知识图谱上的多跳搜索;推荐系统,Wang等人49提出了知识图注意力网络(Knowledge Graph Attention neTwork,KGAT),递归地基于邻居节点的嵌入更新节点嵌入,以线性时间复杂度捕获高阶连接,使用注意力机制学习传播期间每个邻居的权重;知识推理,Wan等人50提出了一个两阶段强化学习框架实现自动从知识图谱中学习推理链,Wen等人51提出了

26、多层知识迁移网络和基于知识图谱的推理方法实现视觉常识推理。除知识图谱外,同样有研究探索逻辑知识的其他引入形式,例如Gan等人52使用1阶谓词逻辑对法律知识进行编码,并以1阶逻辑表达式的输出调整神经网络的预测结果,从而实现让模型学习法律判案知识,进行辅助司法判案。知识图谱与深度学习的融合虽然已有较多研究工作,但目前仍未实现深度融合,知识表示产生的损失、常识和领域知识的融合等问题都有待进一步解决。3.2 数据与视觉知识双驱动方法一直以来,有研究围绕人类视觉机制来改进图像质量评价、图像分类检测53,54等方法,主要使用视觉对比、多通道分解、对比度敏感、双通道等机制来改进算法,也有部分研究者从大脑皮层

27、视觉双通路机制出发开展双通路网络模型研究55,56,但这些方法主要基于人类视觉系统的先验知识,与本文提到的视觉知识存在本质区别。视觉知识目前主要依赖变分自动编码器57、胶囊网络58、3维重建等算法对图像进行处理和建模来实现视觉知识的学习,可以广泛应用在视觉识别、图像生成、3维重建等后续计算机视觉任务中,例如:手势生成任务中要求根据输入的语音信息自动生成语义一致的手势。Liang等人59基于语音信号的分解,将语音节奏和语义内容解耦,之后基于典型语义知识库监督训练语义类别,在范畴内实现语义丰富的手势生成。自动驾驶任务中,由于传感器对视觉特征的感知容易受到环境的影响导致适应新环境的速度较慢,Luo等

28、人60设计了基于单张观测的模型,以端到端的形式搜索未知环境并进行迁移,以提高自动驾驶系统在新范畴下视觉感知的鲁棒性。目标检测任务中,现有的深度学习模型无法有效准确地检测新场景中的物体,Wu等人61通过建立知识解耦和知识生成的闭环学习机制,通过图像解耦出场景无关的特征,提高模型性能,增加模型泛化能力。Pu等人62从无标注数据中提取候选目标并聚类,构建目标概念的视觉知识字典,每个聚类中心代表一种目标原型,之后通过基于图的群体信息传播策略判断目标概念归属,从而区分候选目标,实现目标检测。视觉知识具有典型和范畴结构、层次结构和动作结构,可以清晰地限定类别边界和层级关系,降低模型对大规模标注数据的依赖。

29、因此,如何进一步将视觉知识与目前数据驱动下的深度学习技术进行融合是重要的研究方向。3.3 数据与科学定律知识双驱动方法科学领域中大量的知识已经被数学定义和表达,包括代数、微分方程和不等式等。人工智能与科学研究相互结合可以对刻画物理世界的复杂方程进行求解,如预测化学反应中分子之间微观运动和揭示大气中湍流变化规律,以计算方式合理应用科学定律来系统化地解决现实中复杂问题。简单形式的方程可以作为约束来规范训练过程,例如使用动力学方程作为正则化项预测重力作用下的物体轨迹63;复杂形式的方程例如偏微分方程,就可以研究人工智能与科学相互结合的途径,探索相关的智能模型和解算方案,助力实现在这些方程所属科学领域

30、的重大科学问题的研究突破(详见4.1节)。3.4 数据与因果知识双驱动方法哲学上把现象和现象之间“引起和被引起”的关系,叫做因果关系,其中引起某种现象产生的现象叫做原因,被某种现象引起的现象叫做结果。Pearl将推理按照由易到难程度分成3个层次:从可观测结果中得到的数据关联(association)、对观测结果进行干预介入(intervention)后的决策问题、对已经发生的结果进行否定的反事实推理(counterfactual)64。因果效应评估是洞悉观测数据中因果关联的重要途径,其关键挑战在于消除混淆变量(confounder)对干预变量(treatment)的影响。目前将因果知识与机器学

31、习的融合主要包括以下两个方向:(1)大数据驱动因果推理:旨在通过机器学习2584电 子 与 信 息 学 报第 45 卷赋能因果推理。传统机器学习算法在使用大数据相关关系进行模型推理时,忽略了潜在的混淆变量可能导致的数据间的虚假相关和虚假独立,从而影响推理结果。因此因果推理采用因果视角识别数据中潜在的混淆变量并消除混淆误差。在大数据环境下,传统因果推理面临噪声变量、高维变量、未观测变量等多种形式的混淆变量的挑战,目前文献6567的研究工作已经逐渐提出针对的解决方案。(2)因果启发的机器学习:旨在将因果关系引入机器学习,解决传统机器学习的不可解释、不可泛化问题。相关研究工作包括:Losch 等人6

32、8提出了语义瓶颈网络,在神经网络中添加一个小的语义瓶颈层来控制哪些概念应该在神经网络中保留,哪些则不需要,从而确保模型学习因果知识。Kuang等人69使用样本重采样因果恢复模型实现在未知环境中获得更加精准的参数估计;Kuang等人70提出了一种基于条件独立性测试的算法,根据因果特征选择解耦模型,从而精准区分因果变量和非因果变量,实现跨数据集的稳定预测。这些算法都尝试将因果引入了机器学习,从样本、特征等维度提出了因果启发的机器学习算法。4 双轮驱动下的新时代人工智能在数据和知识双轮驱动下,人工智能理论出现了一些新的研究趋势,其中已有数个具有代表性的方向初见端倪。4.1 数据与逻辑知识双驱动方法数

33、据驱动方法与科学定律知识相结合是未来科学计算的主流研究方向。目前已有若干领域逐渐采纳数据驱动与科学定律知识的研究思路并取得了一定的成果,具体如下。4.1.1 偏微分方程求解如前文所述,物理、化学、工程学等众多领域长期研究的重点即是物理模型,长久以来各领域积累了丰富的物理模型,这些模型大多以偏微分方程的形式呈现,如流体力学中的纳维斯托克斯方程(Navier-Stokes equations)使用微分方程来描述物体的流动;电磁领域的麦克斯韦方程组(Maxwellsequations)用一组偏微分方程描述电场、磁场和电荷密度、电流密度之间关系;量子力学中的薛定谔方程(Schrdinger equat

34、ion)是描述物理系统的量子态随时间演化的偏微分方程。复杂模型直接求解复杂度太高,因此常用的机器学习算法以纯数据驱动为主,建立输入数据到输出数据的函数映射,以求解近似方程。基于物理信息的神经网络(Physics-InformedNeural Network,PINN)正是在数据驱动的机器学习基础上,引入研究场景中包含的物理信息,不仅能够向传统神经网络学习特征表达,还能够遵守由偏微分方程描述的物理规律。PINN由Karniadakis教授所在课题组7173提出。传统的偏微分方程的求解方法通常是有限差分、有限元等数值方法。PINN则通过自动微分技术74,将偏微分方程中的微分形式约束条件融入到神经网

35、络的损失函数设计中,从而使训练出来的神经网络能够不断逼近观测数据,并且可以自动满足偏微分方程所遵循的对称性、不变性、守恒性等物理性质75。在流体力学领域,Raissi等人76,77的研究成果将流场图像数据、不可压纳维斯托克斯方程组等方程与神经网络损失函数融合,显著提升了多个物理参数的预测精度。在生物医学领域,Sahli Cos-tabal等人78提出了一个基于PINN,用于心脏激活映射的神经网络,加入了程函方程(Eikonal equa-tion)的物理约束,实现了更准确、更高效的心房激活图创建算法。在材料领域,Fang等人79通过深度PINN解决频域麦克斯韦方程组和超材料设计问题,Zhang

36、等人80基于PINN求解连续体固体力学中的几何识别问题。除了PINN之外,Li等人81使用傅里叶神经算子(Fourier Neural Operator,FNO)直接建立函数到函数之间的映射过程,大幅提高了求解速度。Lu等人82提出了深度算子网络DeepONet。Brand-stetter等人83提出了端到端神经求解器来从数值上求解偏微分方程,都大幅提高了求解速度。4.1.2 基于人工智能的蛋白质预测蛋白质作为生命活动的主要承担者,一直以来都是生命科学的研究重点。其中蛋白质结构的研究极为重要,有助于了解蛋白质的作用,分析蛋白质如何行使其生物功能,认识蛋白质与非蛋白质之间的相互作用,因此如何预测

37、蛋白质的结构长期受到研究关注。传统的蛋白质结构预测方法主要是2维核磁共振、X射线晶体衍射和冷冻电镜,但这些方法成本高昂,并且效率不高,对每种结构的研究都需要耗费数年的时间。1994年,美国科学家Moult发起了国际蛋白质结构预测竞赛(Critical Assessment of proteinStructure Prediction,CASP),试图寻找能够完美解决蛋白质预测问题的计算机模型。2018年,DeepMind公司提出了一种基于深度学习的蛋白质结构预测方法(AlphaFold)84,输入氨基酸序列,预测氨基酸链条会如何折叠,输出拓扑结构,在第7期金 哲等:数据驱动与知识引导结合下人工

38、智能算法模型258598支参赛队伍中排名第1。2020年,AlphaFold285实现了真正的突破,使用机器学习方法对几乎所有的蛋白质都预测出了正确的结构,其中有大约2/3的预测精度达到了结构生物学的测量精度。Al-phaFold2在使用深度学习的同时,在多处加入了专业知识进行引导,包括:(1)在输入序列特征中加入了基于迭代隐马尔可夫模型-隐马尔可夫模型比较的同源检测方法(Homology detection methodbased on iterative HMM-HMM comparison,HHblits)86特征和多序列对齐(Multiple SequenceAlignment,MSA

39、)特征。HHblits特征代表HHblits工具算法对每个氨基酸计算出的特征向量,类似于自然语言处理中预先得到的每个单词的嵌入向量。在蛋白质库中搜索和输入氨基酸序列相近的序列并进行多序列比对,这些接近的氨基酸序列和其结构就可以作为特征的一部分被引入。这些引入外部知识的特征从而为结构预测模型提供了更多先验知识;(2)广泛使用了注意力机制,例如通过三重自注意力机制(triangular self-attention)实现氨基酸对之间的关系建模。受AlphaFold启发,近年来也涌现了数量众多的相关研究,RoseTTAFold87提出了3轨注意力机制,信息在1维氨基酸序列信息、2维距离图和3维坐标中

40、流动,是神经网络能同时学习3个维度层次的信息。Humphreys等人88将氨基酸协同进化分析的领域知识和RoseTTAFold,AlphaFold集合,建立了真核生物核心蛋白质复合物的精确模型。AlphaFold,RoseTTAFold等模型的成功都进一步证明了使用领域数据驱动和领域模型知识引导的可行性,这类方法自然也适用于其他具有大量领域知识的学科。4.2 群体智能群体智能源于对自然界群居生物的观察所提出的一种智能形态。早期对群体智能的研究集中在蚂蚁、蜜蜂等社会学昆虫的群体行为分析上89,90,群体智能技术的优点在于,可以在中心控制缺乏或对全局环境认知不足的情况下,完成很多复杂任务91,适用

41、于众多领域实用场景。近年来,随着物联网和互联网的迅速发展,群体智能的发展转向与大数据、协同计算和人机物共融等结合的方向上。相对于群体智能,个体智能的发展随着AlphaGo92以4:1战胜李世石,AlphaGo Zero93以100:0战胜AlphaGo这一标志性事件,说明人工智能已经可以模拟出强大的个体智能。但个体智能的能力和规模始终是有限制的,因此群体智能思维的引入可以有效推动新时代人工智能的发展。对此,李未院士提出了“人工智能2.0”大背景下群体智能的新定义:超越个体智能的限制,群体智能是在某种基于互联网的组织架构下被激励进行有挑战性计算任务的大量自主个体共同作用下形成的94。目前,群体智

42、能包括以蚁群算法95、粒子群优化算法96、狼群算法97为代表的传统群体智能算法研究,群体智能系统以及互联网时代下群智感知计算、众包系统和联邦学习等分支。群体智能系统主要基于知识驱动和数据驱动两大类方法,知识驱动方法98可以充分利用已有知识,包括物理模型知识99、规则经验知识100等,但对于大规模集群,知识驱动方法难以普适,鲁棒性会受到大幅影响。数据驱动方法则基于深度学习和强化学习101,102等模型,但对于复杂物理约束等现实场景问题仍然十分棘手。两种方法都受限于各自瓶颈,对此,基于数据驱动+知识引导的双轮驱动提供了新的解决思路。通过领域先验知识指导协同概念模型,从而将复杂问题分割成数个子问题,

43、对于每个子问题根据实际情况选用数据驱动方法或知识驱动方法103。群智感知计算以每个用户的移动设备为感知单元,实现对感知任务的分发和数据收集104,具有数据来源覆盖面广和随机性强的优点,可以有效获取大规模数据。众包系统的思想是通过整合互联网上的大众来汇聚群体智慧,以众包平台为中介,实现任务发布者和任务参与者之间的信息交互,常见的众包平台包括维基百科、亚马逊众包平台(Amazonmechanical turk)等。Han等人105将词汇网络(WordNet)等外部知识和众包融合,自动学习参与者的能力和任务的简单程度来定制算法,提高了参与者的投票能力。在真实的群体智能场景中,大数据分散在企业、机构、

44、政府乃至个人手中,数据与数据之间存在壁垒,导致了数据孤岛现象的发生,各国数据隐私安全法律法规的出台更加剧了数据孤岛现象,在这样的大背景下联邦学习的概念被提出,在分布式机器学习的基础上,强调模型训练过程对数据拥有方的数据隐私保护,引入了同态加密106等密码学知识。旨在使群体原始数据在不离开本地,确保数据隐私和安全的前提下,联合构建机器学习模型107,108。群体智能已在智慧交通109,110、军事指挥控制111,112、智慧金融113,114等众多领域发挥了重要作用,未来,各领域智能体数量必然呈增加的趋势,如何能够使用知识有效引导所带来的更为庞大的数据将是后续研究的重点问题。5 结论如前所述,当

45、下的深度学习模型在标注数据获2586电 子 与 信 息 学 报第 45 卷取、可解释性和脆弱性等方面都存在不足。加入知识引导可以有效缓解这几个方面的问题,增加模型可解释性,减少模型对数据量的依赖,增加模型的鲁棒性。表1总结了知识引导的典型方法。Baddeley等人115提出的工作模型记忆指出了人类大脑中工作记忆和长时记忆的存在。长时记忆存储着我们过去的经验和知识,为大脑的心理活动提供知识基础,有需要时大脑将相关信息从长时记忆中调出放到工作记忆中以供使用;工作记忆则是一个短期对信息进行储存和加工的资源系统116,同时执行保存从长时记忆中调取的知识和暂时存储外界信息的两大任务。工作记忆被形容为人类

46、的认知中枢,实现了人类的高级认知功能,应当是人工智能所模仿的智能对象,一方面接受外部数据,进行加工和存储,另一方面调取智能体存储的相关知识,跟外部数据产生交互,例如判断猫的照片是否是认知中的猫,判断是否听过这段音乐等。对于双轮驱动下的人工智能,知识引导部分的融入可以视为认知过程中调取知识的阶段,从而使人工智能更符合人类的认知模式。参 考 文 献PAN Yunhe.Heading toward artificial intelligence 2.0J.Engineering,2016,2(4):409413.doi:10.1016/J.ENG.2016.04.018.1李国杰.国内AI研究“顶不

47、了天、落不了地”,该想想了EB/OL.https:/ Guojie.Domestic AI research cannot be broken throuthand implemented.It is time to think about it.EB/OL.https:/ J.Radical empiricism and machine learningresearchJ.Journal of Causal Inference,2021,9(1):7882.doi:10.1515/jci-2021-0006.3ZHANG Ningyu,JIA Qianghuai,DENG Shumin,et

48、 al.AliCG:Fine-grained and evolvable conceptual graphconstruction for semantic search at alibabaC.The 27thACM SIGKDD Conference on Knowledge Discovery&Data Mining,Singapore,2021:38953905.doi:10.1145/3447548.3467057.4LUO Xusheng,BO Le,WU Jinhang,et al.AliCoCo2:Commonsense knowledge extraction,represe

49、ntation andapplication in E-commerceC.The 27th ACM SIGKDDConference on Knowledge Discovery&Data Mining,Singapore,2021:33853393.doi:10.1145/3447548.3467203.5凡友荣,杨涛,孔华锋,等.基于知识图谱的电信欺诈通联特6表 1 知识引导的典型方法知识方法具体思路例子逻辑知识知识图谱表示将知识图谱中的实体和关系表示为向量。Bordes等人35、Lin等人117、Dettmers等人118约束条件使用知识作为优化的约束条件。Hu等人39、Chen等人4

50、0视觉知识视觉知识抽取及应用建立基于视觉知识的闭环学习机制。Wu等人65构建目标概念的视觉知识字典。Pu等人62科学定律知识偏微分方程求解流体力学中将不可压纳维-斯托克斯方程组与神经网络损失函数结合。Raissi等人76、Jin等人119生物医学中基于PINN求解心脏激活映射、心血管动脉压力相关函数。Sahli Costabal等人78、Kissas等人120材料领域中基于PINN解决频域麦克斯韦方程组和超材料设计问题、连续体固体力学的几何识别问题。Fang等人79、Zhang等人80电力学中基于PINN求解电力系统动力学中的摆动方程。Misyris等人121使用神经算子和深度算子网络求解。L

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      联系我们       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号  |  icp.png浙ICP备2021020529号-1 浙B2-2024(办理中)  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服