收藏 分销(赏)

6G语义通信及语义认知网络架构研究.pdf

上传人:Stan****Shan 文档编号:1300378 上传时间:2024-04-22 格式:PDF 页数:83 大小:4.57MB
下载 相关 举报
6G语义通信及语义认知网络架构研究.pdf_第1页
第1页 / 共83页
6G语义通信及语义认知网络架构研究.pdf_第2页
第2页 / 共83页
6G语义通信及语义认知网络架构研究.pdf_第3页
第3页 / 共83页
6G语义通信及语义认知网络架构研究.pdf_第4页
第4页 / 共83页
6G语义通信及语义认知网络架构研究.pdf_第5页
第5页 / 共83页
点击查看更多>>
资源描述

1、北京稻壳科技有限公司Beijing Rice Hull Technology Co.,Ltd.地址:北京市朝阳区九住路 188 号IMT-2030(6G)推进组IMT-2030(6G)Promotion GroupIIMT-2030(6G)推进组IMT-2030(6G)Promotion Group前言前言本研究报告介绍了语义通信以及语义认知网络的驱动力、应用场景,探讨语义通信和语义认知网络的目标、基础理论、架构设计、关键技术和应用需求。本研究报告是在 IMT-2030 6G 网络总体架构指导下,着重介绍语义通信与语义认知网络技术概述、语义通信及语义认知网络的基础理论与关键技术、语义通信的要素

2、以及语义认知网络的应用需求和典型业务,希望能为业界在语义通信和语义认知网络架构的关键技术的研究提供参考和指引。IIIMT-2030(6G)推进组IMT-2030(6G)Promotion Group目录目录1语义通信与语义认知网络技术概述.11.1语义通信和语义认知网络的研究动机与目标.11.2语义通信和认知赋能的 6G 网络智能.11.3国内外研究现状.31.3.1语义信息论的历史与研究现状.41.3.2语义网的应用.51.3.3基于深度学习的语义通信.51.3.4隐性语义通信与语义认知通信网络.61.4语义通信和语义认知网络国际标准化现状.72语义通信的基础理论与关键技术.72.1语义信息

3、的数学表征.82.1.1基于概念知识的语义表征.82.1.2基于命题的语义表征.92.1.3受知识图谱启发的语义表征.102.1.4基于规则的语义表征.152.2语义通信的要素.162.2.1语义知识库.162.2.2语义编码器.172.2.3语义译码器.172.2.4语义评估器.182.2.5语义解释器.182.2.6语义噪声.182.3语义通信的基本理论与框架.192.3.1基于经典信息论的语义通信理论基础.192.3.2策略语义通信理论.212.3.3通用语义通信理论.232.3.4基于深度学习的语义编解码技术.242.3.5隐性语义认知通信理论.27IIIIMT-2030(6G)推进组

4、IMT-2030(6G)Promotion Group2.3.6多模态语义通信技术.292.4语义通信的性能刻画.302.4.1语义率失真.302.4.2语义率失真-感知效果平衡关系.312.4.3语义相似度.312.4.4语义信息新鲜度.322.4.5其他性能指标.323语义认知网络参考架构.333.1从语义通信向语义认知网络的演进趋势.333.2语义认知网络的组成.353.2.1面向网络的语义表征.363.2.2边缘计算和存储服务单元.363.2.3全局知识与模型库.373.2.4私有知识与模型库.373.2.5用户终端.373.2.6语义识别器.373.2.7语义解释与还原器.383.3

5、语义认知网络架构.383.3.1基于联邦边缘智能的语义认知网络.383.3.2人工智能模型驱动的语义认知网络.403.3.3分布加集中处理协同的编排式语义认知网络.413.3.4基于感算通融合的语义认知网络架构.443.3.5基于云边协同的分层合作推理语义认知网络.463.4语义认知网络性能评估.484语义认知网络的应用需求与典型业务.514.1自动驾驶.514.2远程监测.534.3元宇宙.544.4故障检测.56IVIMT-2030(6G)推进组IMT-2030(6G)Promotion Group4.5情感与思想智能交互.574.6触觉互联网.584.7通感融合.604.8全息通信.61

6、4.9语义认知网络的应用前景.635语义通信和语义认知网络的发展趋势与开放性问题.645.1感-算-通-学深入融合的多层优化与实现.645.2多学科领域不断融合和演进的基础理论与关键技术.655.3基于“语义”的空天地一体化万物无缝智联生态构建.655.4分布加集中的云边知识协同更灵活、更敏捷、适配差异化网络业务.655.5构建基于语义的内生安全体系,保障用户数据的安全性.656总结与展望.66参考文献.67附录 1:“语意通信”与“语义通信”的区别.72附录 2:缩略语简表.73主要贡献单位和编写人员.75VIMT-2030(6G)推进组IMT-2030(6G)Promotion Group

7、图目录图目录图 1高维知识图谱关系与对应的基于实内积语义空间表征的语义信息星座图.12图 2策略语义通信模型.21图 3通用语义通信模型.24图 4基于神经网络的语义提取系统框架.25图 5基于神经网络的语义信源编码系统框架.26图 6基于神经网络的语义信源信道联合编码系统框架.26图 7基于神经网络的编码调制联合设计系统框架.27图 8隐性语义认知通信模型.27图 9面向万物智联的语义认知网络架构示意图.36图 10基于联邦边缘智能的语义认知网络架构.38图 11AI 驱动的语义认知网络参考架构.40图 12分布与集中编排式语义认知网络架构.42图 13基于云边协同的语义认知网络架构.47图

8、 14SRZ 示例.49图 15故障检测服务用例.56图 16情感与思想智能交互服务用例.58图 17感知交互服务用例.59图 18通感融合环境交互服务用例.60图 19全息通信服务用例.62VIIMT-2030(6G)推进组IMT-2030(6G)Promotion Group表格目录表格目录表 1 常用的概率距离.14表 2 训练 3 种目前主流图像数据集和简单卷积神经网络训练模型精度与耗时.35表 3不同应用场景涉及的主要智联模式.511IMT-2030(6G)推进组IMT-2030(6G)Promotion Group1语义通信与语义认知网络技术概述语义通信与语义认知网络技术概述1.1

9、 语义通信和语义认知网络的研究动机与目标语义通信和语义认知网络的研究动机与目标信息的传播与交互一直是推动人类社会发展的重要引擎。人类社会文明在信息沟通和交互过程中产生、发展和演进。人类信息沟通以语义知识传播和社会交互为主要目的,辅助和推动人类社会生活的新知识在沟通和交互过程中不断产生,并最终推动社会发展和进步。随着信息技术的发展,移动通信和网络在人类信息沟通和交互中扮演越来越重要的角色,并已成为现代社会信息传播的重要基础设施。现代通信网络拉近了人类的沟通距离并极大地方便了人们的沟通和信息交互方式。现代通信系统的主要理论基础源于 Shannon 经典信息论。Shannon 建立经典信息论时,刻意

10、回避了信息中的语义信息,仅聚焦符号的传输和还原。这就导致现代通信系统仅关注在传输和还原发送端传感设备所观察和接收到的源信号,而忽略信号中包含的语义、知识及发送端用户发送源信号及接收端接收信号希望达成的目标。IMT-2030 6G 推进组发布的6G 网络架构愿景与关键技术展望白皮书指出,6G 的重要愿景之一是实现智慧内生。其内涵是围绕人类用户和网络需求,并按需提供通信和网络服务,最终实现服务随心所想、网络随需而变、资源随愿共享的目标。换而言之,6G 网络将不再仅聚焦信号的传输和复现,而将具备语义认知、识别、分析、理解和推理能力。语义认知与通信将成为 6G 内生智能的基石,推动通信网络架构从传统的

11、数据驱动向语义驱动的范式转变,促进移动通信网络在人类信息沟通和社会发展中扮演更加重要的角色。1.2 语义通信和认知赋能的语义通信和认知赋能的 6G 网络智能网络智能6G 语义通信和语义认知网络架构将成为海量智能设备和网络实现资源和谐共享与智能交互的基础,打通人-人、人-机和机-机之间的壁垒,实现智联互通,为最终实现网络的智能认知、学习、决策和演进奠定基础。具体而言,语义通信和语义认知将为 6G 网络智能引入如下能力提升和性能增强。(1)信息沟通效率增强:)信息沟通效率增强:大部分自然信号属于连续信号。数字通信网络需要首先对连续信号进行离散化处理,如采样,随后进行离散信号的压缩和传输,而在接收端

12、则需要在解压缩2IMT-2030(6G)推进组IMT-2030(6G)Promotion Group后进行插值等方法恢复成模拟或近似模拟的信号。人类在沟通与交互过程中仅从所观察到的连续信号中提取少量有含义的信息,并自动过滤掉其余无意义的信号。这导致传统数字通信技术从人类信息沟通和交互的角度来看效率极为低下。相比之下,语义通信以达意通信为主要目标,并不强调发送信号在接收端精确还原。在语义认知和通信过程中发射端和接收端可根据沟通历史、上下文信息和沟通目的实现关键语义信息的准确提取与解析,自动删除和过滤和语义无关的信息传输。因此,可在大幅度降低数据传输量和通信资源占用同时实现语义信息高效传输和高保真

13、还原。(2)业务体验增强:)业务体验增强:传统通信网络架构的基本设计思路是以数据为核心,即数据传输速度越高、数据量越大,则用户体验越好。现有通信系统一般仅关注与数据传输性能相关的客观指标,例如数据的传输速率和误码率等。然而,这些指标难以反映人类用户和网络沟通的具体需求和目标。6G 智慧内生需要针对用户的特定需求提供个性化、可定制和沉浸式业务体验。网络架构从以数据为核心向以用户为核心转变的重要前提是网络能够理解和感知用户的语义,并让用户参与定义业务需求和网络定制过程中。通过将语义通信与语义认知网络融入网络架构设计中,可以实现海量业务和场景的自动感知、理解与资源自动适配,为海量用户提供更贴合人类用

14、户需求的业务体验1。(3)机)机-机、人机、人-机和人机和人-人交互增强人交互增强:作为一种全新通信范式,6G 语义通信和语义认知网络架构有望将通信网络从传统的基于数据协议和格式的单一固化通信架构中解放出来,通过采用更具有普适性的信息含义作为衡量信息通信性能主要指标,构建丰富的人-机交互接口和语义认知模型,实现机-机、人-机和人-人交互的无缝衔接。具体而言,语义通信将实现下列三类交互模式性能提升与能力增强2。机机机(机(M2M,machine-to-machine)交互)交互增强:增强:基于语义通信的通用网络协议将可以大幅度降低网络管控的复杂度,为未来实现大规模智简网络奠定基础。目前,已有大量

15、无线通信协议和接口(如蓝牙、Wi-Fi及 LTE/5G 等)支持不同类型网络设备之间的数据连接。然而,不同网络、协议和传输技术之间一般无法实现数据互通。虽然近年来出现了一3IMT-2030(6G)推进组IMT-2030(6G)Promotion Group些跨协议数据互通技术,但目前仍缺乏简单且通用的跨网络、跨协议的数据互通技术和方法3。随着各种新兴协议和通信技术(如 Google 的QUIC、Wi-Fi 6 和 Wi-Fi 7 等)的出现,未来通信网络大量采用不同技术,且互不兼容协议共存的场景范围将进一步扩大。基于语义通信和语义认知的网络协议将能实现不同技术与协议之间的自动转换,将智能交互与

16、智能决策有机结合,为跨设备、跨资源和跨模态协同感知与合作决策奠定基础。人人机机(H2M,human-to-machine)交互交互增强增强:通过设计和构建可满足用户体验和个性化需求的人机交互通信技术和接口,语义通信可以大幅度改善人-机交互的沟通效率和用户体验。随着包括触觉互联网、AR/VR/XR、元宇宙和数字孪生在内的大量新兴应用的出现,未来通信网络中将会包含大量复杂的人机交互应用和服务4。语义通信有望根据不同模态传感器和虚拟或实体人机交互设备所感知到的信息和场景,识别与感知人类用户和网络的个性化需求,并按需实现网络资源的适配与调度。人人人人(H2H,human-to-human)交互交互增强

17、增强:语义通信将实现不同人类用户之间通过通信网络实现接近真实情境的信息、情感、经验和知识等方面的交互与沟通增强。随着人们对网络应用和服务需求不断提高,传统的以文本、语音和图像为主要载体的人人交互已经不能满足需求,而 3D 立体全息投影、触觉互联网等大量新兴人人交互技术将会逐渐普及并在未来通信网络中占据越来越重要的地位。传统通信网络架构将难以满足这些新兴应用所需的大数据传输速率和高精度的数据采样、还原和处理能力。1.3 国内外研究现状国内外研究现状语义通信和语义认知网络的发展与语义信息理论、经典通信系统、以及人工智能技术息息相关。这些关键的使能技术提供了现代语义通信技术分析、验证、构建的方法,构

18、成了现代语义通信的基石。4IMT-2030(6G)推进组IMT-2030(6G)Promotion Group1.3.1语义信息论的历史与研究现状语义信息论的历史与研究现状语义通信的基本概念由Weaver和Shannon在1949年发表的论文中首次提出5。该论文受到 Shannon 经典论文启发,将通信的基本问题分为三个层次,分别是通信的技术问题、语义问题和有效性问题。其中 Shannon 信息论被归类为技术问题。语义通信问题被定义为第二层通信问题,即研究“所传输的符号是否准确地表达了预期含义”问题。与技术问题不同,通信的语义问题不仅与传输的信号及信道的物理特征有关,还与信号所包含的信息类别、

19、收发双方对消息的理解与识别准确度及接收端用户收到信息的满意度等复杂因素有关。Weaver 指出,虽然通信的语义问题表面上看和技术问题有较大差异,但是 Shannon 信息论可以在加入少量改变后直接推广和应用到解决通信的语义和有效性等问题中,例如将Shannon 理论中用于刻画符号不确定性的“熵”概念推广为刻画接收端对语义理解不确定性的“语义熵”。Weaver 的上述结论建立在语义可以看作一种特殊符号这一推论的基础上。随后,学术界对语义通信的研究可大致分为两类,一类延续Shannon 信息论的基本思路,主要聚焦于将信息熵概念扩展和推广到语义熵。例如,Carnap 和 Bar-Hillel 在 1

20、952 年使用逻辑概率代替统计概率,在给定的语言系统中衡量句子所蕴含的语义信息量6。Bao 等人通过简单地用模型的熵代替二进制符号的 Shannon 熵来导出语义熵7。Guler 等人研究了在基于字典的常用数据集中定义的单词替换二进制符号时的编码错误8。另一类研究尝试跳出 Shannon 信息论的基本框架,并根据语义信息特点建立新的理论体系。例如,2004 年,Floridi 发现 Carnap 和 Bar-Hillel 将 Shannon 信息论拓展后得到的语义信息论存在一个基本悖论,称为 Carnap-Bar-Hillel 悖论,即当任何事实与其自身矛盾时都会拥有无穷大的信息量,如熵 H(

21、AA)(表示“事件 A 与事件非 A”同时发生的概率)等于无穷大。因此,Floridi 建立了强语义信息论9,并定义语义信息需要包含三类属性,(形式)合理性、真实性和有用性。Shi 和 Xiao 等人注意到语义信息具有结构化特征,并利用结构化特征设计语义认知和推理方法实现未知语义的自动学习和更新。该团队近期的工作引入博弈论在分析多智能体交互和学习方面的优势,建立了策略语义通信率失真理论,并给出了给定辅助信息和博弈策略下的语义率失真容量界11。5IMT-2030(6G)推进组IMT-2030(6G)Promotion Group1.3.2语义网的应用语义网的应用利用数据中包含的语义信息实现网络数

22、据的自动标注与理解也引起了工业界的关注。例如,在 20 世纪 90 年代在计算机网络领域出现的语义网(SemanticWeb)12 尝试利用数据中普适性语义信息建立一种通用的互联网协议。语义网的概念一经提出立即引起工业界的广泛关注,随后成立的万维网联盟(WorldWide Web Consortium,W3C)成功建立了包括 XHTML、XML 和 CSS 等在内的结构化的互联网标记语言。语义网除了在互联网领域发挥了重要作用,也应用于其他领域。例如,Chen H.等人利用语义网对跨学科数据进行整合,帮助研究人员实现跨应用程序和网站限制共享研究内容,并构建开放、标准化和支持互操作的数据网络解决方

23、案,以实现全球范围内的跨学科集成13。1992 年,美国软件公司 Business Objects 注册并获得了建立通用语义层(Semantic layer)的专利。该专利建议在数据和用户之间建立一个通用语义层,用于自动转换和识别数据中包含的已在客户和产品之间熟悉的商业术语,从而在不同商业客户与终端用户之间建立公共的术语沟通与表达方式。此外,美国思科公司在 2017 年提出了意图驱动网络概念,通过自动识别不同网络域(如不同的子网络、广域网、数据中心及混合云计算中心等)用户、设备、应用和服务之间的需求或意图,据此对网络架构及工作流程实施自动控制、管理和优化。1.3.3基于深度学习的语义通信基于深

24、度学习的语义通信近年来,随着深度学习算法不断演进以及数据处理能力的不断提升,在许多领域的迁移及应用取得了巨大成功。将深度学习运用在语义通信研究主要集中在信源编码与信源-信道联合编码两个方向。通过将图像、语音和文本中包含对象标签或特征定义为语义符号。通过利用如变分自编码器等在内的神经网络技术对信源符号进行压缩和特征提取,实现数据的压缩与恢复。具体而言,在信源编码过程中,通过较为成熟的深度学习算法将图像14、语音15 和文本16 等源信号转换为语义标签,提取下游语义通信任务,将语义通信问题转化为模式识别和/或分类问题,再采用传统通信网络对标签进行传输,从而有效降低数据传输所需带宽及其占用的通信网络

25、资源。6IMT-2030(6G)推进组IMT-2030(6G)Promotion Group在信源-信道联合编码方面,OShea 等人17 首先提出将通信视为端到端重构优化任务,使用自动编码器在没有任何先验知识情况下联合学习发射机和接收机实现信号编码,该团队还提出了一些变体18 扩展和优化端到端通信系统,给出衰落信道应对方案。N.Farsad 等人研究了自然语言等结构化数据在噪声信道上的源信道联合编码问题,通过开发基于深度学习编码器和解码器来降低单词错误率19。需要说明的是,上述方案较多采用比特级作为目标函数,如交叉熵(crossentropy,CE)或均方误差(mean square err

26、or,MSE),本质上还是从比特级别来优化语义相似度,这会引入了额外的“语义差”。另一方面,目前大多数工作都研究了可微目标的优化,很少有人提出一个通用框架,允许可微目标和不可微目标的优化,而这在真实的无线场景中很常见强化学习(reinforcement learning,RL)用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题,取得了不错的成果。基于以上观察,Lu 等人20 首次将 RL 应用于编解码的过程中,提出一个基于自我批评的语义通信解决方案,能够对任意用户定义语义相似度指标进行高效稳定的学习,完成了对语义传输的优化从比特级准确性到语义

27、级相似度的转变,并解决目标函数不可微的问题21。1.3.4隐性语义通信与语义认知隐性语义通信与语义认知通信通信网络网络语义通信和传统数字通信系统的另一个主要区别在于,前者所传输的语义信息一般包含比所观察到的源信号更加丰富的含义信息。具体而言,基于认知神经学的相关研究表明,人类可以根据部分线索或有限信息推测出丰富的语义信息。基于上述观察,Shi 和 Xiao 等人提出了隐性语义概念,即与所观察到的源信号中的部分线索或有限信息密切相关但却无法直接从源信号中观察得到的隐性含义22。该团队还基于上述概念提出了隐性语义认知通信网络架构。该架构中发射端的主要目标不是最大化所发送的数据量,而是尝试帮助接收端

28、用户理解发送端用户从显性语义到隐性语义的推理规则映射23。该团队还将隐性语义认知通信架构推广到多层云/边缘协同计算网络,并提出了一种基于联邦边缘智能的多用户合作隐性语义认知学习和通信架构24。7IMT-2030(6G)推进组IMT-2030(6G)Promotion Group1.4 语义通信和语义认知网络国际标准化语义通信和语义认知网络国际标准化现状现状为了推动语义通信和语义认知网络的全球共识,国际电信联盟 ITU-T 和IMT-2030 6G 推进组均已开展相关的技术规范化和标准化工作。鹏城实验室石光明和华中科技大学肖泳在2021年10月召开的 ITU第20 研究组(简称ITU SG20)

29、全会上提交了国际标准技术报告面向物联网和智慧城市/社区的语义通信架构(“Architectural Framework for Semantic Communication in IoT and Smart City&Community Services”),并获批正式立项。该技术报告主要面对语义通信在物联网和智慧城市中的应用与规范,对使用细节进行规范化,该立项的支持单位包括华中科技大学、中兴通信、中国联通和中电科集团信息科学研究院,是全球首个面向大规模物联网的语义通信参考架构。该团队于 2022 年 7 在国际电信联盟未来网络与新兴网络技术工作组,即 ITU-T 第 13 研究组(简称 IT

30、U SG13)全体会员会议上,提交了国际标准技术报告面向未来网络的语义认知网络需求(“Requirements of semantic-aware networking for future networks”)并获得批准正式立项,该技术报告对语义认知网络三方面需求,即服务需求、网络需求和数据需求进行了标准化建议。该技术报告计划于 2023 年 10 月正式发布。除此之外,IMT-2030 6G 推进组也对语义通信和语义认知网络开展了初步尝试。前期发布的系列研究报告和白皮书中均将语义通信和语义认知网络定义为6G 的潜在技术和架构之一。由鹏城实验室石光明和华中科技大学肖泳团队联合撰写的 IMT-

31、2030面向 6G 网络的智能内生体系架构研究研究报告中“智能化赋能的通信关键技术”之“语义通信”章节和6G 网络架构愿景与关键技术展望白皮书中“语义通信:语义驱动、万物智联”等内容均已正式发布。除了通信网络领域外,视觉语义也在最新的图像和视频编解码国际标准中得到采纳。例如,在视频编解码国际标准MPEG正在积极推动的机器视觉编码VCM,其中采纳了一系列通过利用视觉语义信息进一步提高视频编码效率,降低延迟,并增强机器视觉应用的兼容性的方法。随着上述标准化工作的推动和逐步完善,语义通信和语义认知技术将会得到更加广泛的应用和推广,为 6G 实现内生智能奠定基础。2语义通信的基础理论与关键技术语义通信

32、的基础理论与关键技术8IMT-2030(6G)推进组IMT-2030(6G)Promotion Group2.1 语义信息的数学表征语义信息的数学表征构建简单高效且具有普适性的语义信息的数学表征是构建、实现和应用语义通信和语义认知网络的关键。语义的数学表征和刻画不光影响信源或应用层的设计,还将会在物理层波形设计和通信网络等底层架构产生影响。由于语义信息的多义性、随机性和个性化等特征,目前尚未出现学术界和工业界公认的语义信息归一化表征。当前主流的语义信息数学表征方法可大致分为下列几类:2.1.1基于概念知识的语义表征基于概念知识的语义表征语义学指出,语义的本质是人类构建的各种符号与其通过对世界的

33、感知所构建出来的“世界模型”(World Model),以及在该世界模型中,各对象及属性之间的对应关系。相同的世界模型(下面简称世界)可对应不同的符号系统,相同的符号也可以在不同的世界中对应不同的含义。例如“零,一”和“0,1”都对应数学世界中最小和第二小的自然数。“0,1”既可以对应数学世界中的自然数,也可以对应数字信号世界中的“低电位,高电位”或数字计算机世界中的“假,真”。通过赋予世界中特定对象更多属性信息,丰富有关该对象的概念知识,可以实现不同符号系统之间的互通、互换并消除一些符号的歧义。人类用户可根据符号类别、上下位关系、组成和其他属性来表征对象所表征的概念知识,常用的方式有语义网络

34、(Semantic networks)25 和图式(Schemas)78 等。基于语义网络的语义表征:基于语义网络的语义表征:语义网络是一种采用有向图或者无向图表示概念及之间关系的语义知识表征方式。在语义网络中,与某一概念相关的信息及对应的属性特征被存储在表示该概念的节点中,节点之间的连接表示不同概念之间存在的特定关系。语义网络已被广泛应用于自然语言处理相关应用中,如语义解析和词义消歧等。比较典型的语义网络是 Collins&Quillian 模型25。该模型受人类记忆结构的启发,是一种能够被计算机存储和处理的分类层级语义网络。具体来说,语义网络中的概念依据其所属类别被整理成树状结构,上层节点

35、包含较为宽泛的概念知识,下层节点则表示相对具体的概念知识,节点之间的连接用于表述概念间存在的关系,比如上下位或从属关系等。为了节约存储空间,上位概念的属性特9IMT-2030(6G)推进组IMT-2030(6G)Promotion Group征仅存储于上位节点中,且可由表示下位概念的节点继承,下位节点则仅存储关于该概念的特有属性。语义网络的典型例子是 WordNet 知识数据集,该数据库由普利斯顿大学的心理学家、语言学家和计算机工程师联合设计,目前涵盖 200 多万种语言,包含15 万 5 千多个概念,并在持续更新中。在 WordNet 数据集中,表示不同概念的词汇连同与其相关的属性被分为多个

36、同义词集(synsets),概念之间用特定语义关系相连接,这些语义关系主要体现了概念之间存在的同义词关系(synonym)、上/下位词关系(hypernym/hyponym)以及部分-整体关系(meronym)。WordNet 已被广泛应用于词义消歧、信息检索、自动文本分类、自动文本摘要以及机器翻译等诸多应用中。其中,最常见的用法是基于 WordNet 和特定算法衡量不同概念间的语义相似度。例如,通过计算不同概念在 WordNet 数据集中的距离来定义概念之间语义相似度。2.1.2基于命题的语义表征基于命题的语义表征命题将多个对象和它们之间的链接关系依序连接起来,进而表征比单个对象或关系更加丰

37、富的语义信息。单个的命题是语义信息表征中的最小知识单元,即能够从语义上判断出真伪的最小信息组合79。例如,“地球绕太阳公转”这一基于事实的命题中,“公转”这一关系将“地球”与“太阳”这两个对象联系起来,表征出了相比单独对象更加丰富的语义。命题可以用不同的方式来实现表征。例如,我们可以用三元组的形式表达上述命题,即(地球,公转,太阳);也可以用多元关系的形式表达上述命题,即“公转(地球,太阳)”。命题表征在人工智能领域中已经得到了广泛应用。例如,在专家系统中,通过将各种规则转化为统一的命题表征形式为后续任务提供服务;在自然语言处理领域,命题表征已被用于语义表示和理解;此外,在计算机科学中,命题表

38、征也是许多知识和语义算法和模型的基础。数理逻辑数理逻辑:命题演算是数理逻辑的重要组成部分,数理逻辑是数学的一个分支,其研究对象是对证明和计算这两个直观概念进行符号化以后的形式系统,旨在以数学的方法研究形式逻辑,使之更为精确和严谨。在数理逻辑中,有关命题语言的逻辑表征方法经历了以下扩展:10IMT-2030(6G)推进组IMT-2030(6G)Promotion Group命题逻辑命题逻辑:命题逻辑由原子命题经逻辑连接词构建的形式系统组成,采用具有真值的完整命题作为其最基本的组成部分,只能表示由简单命题构建复杂命题时的逻辑关系,不能表示由命题的自身结构所产生的推论。一阶逻辑一阶逻辑:一阶逻辑包括

39、与命题逻辑相同的命题连接词,不同的是,一阶逻辑阐明了命题的内部结构。例如一阶命题用单数术语表示特定的对象,用谓词表示属性和关系,用量词表示“一些”和“所有”这样的概念。一阶逻辑包含各种推理规则,这些规则决定了表达式如何形成有效的论证。二阶逻辑二阶逻辑:二阶逻辑是一阶逻辑的扩展,两者都使用了论域(有时叫做“域”或“全集”)的想法,论域是可以量化的个体元素的集合。一阶逻辑只包括论域中个体元素上的变量和量词。例如在一阶句子 x(x x+1)中变量 x 被用来表示一个任意的个体。二阶逻辑扩展了一阶逻辑,增加了个体集合和个体关系上的变量和量词。例如,二阶句子 S x(x S x S)声称对于所有个体的集

40、合 S 和所有的个体 x,要么 x 属于 S,要么不属于(二值原理)。二阶逻辑的引入增强了命题语言的表达能力,能够帮助人们更加方便地描述复杂的问题。另一方面,在经典逻辑的二值方案中,命题语言一般具有布尔性,即一个命题要么是真的,要么是假的。为了形式化地表征命题真实程度的模糊性,L.Zadeh 提出了模糊集合的概念,后逐渐衍生出模糊逻辑。模糊逻辑模糊逻辑:模糊逻辑是布尔逻辑的扩展,也是多值逻辑的一种形式,能够处理部分真实的概念。经典逻辑坚持所有事物(陈述)都可以用二元项(0 或 1,黑或白,是或否)来表达,而模糊逻辑用真实度替代了布尔真值。这种方式在实际上能更好地表述日常人们的问题和语意陈述,因

41、为事物的“真实性”和结果在多数时候是部分(非二元)的或不精确的(不准确的,不清晰的,模糊的)。2.1.3受知识图谱启发的语义表征受知识图谱启发的语义表征知识图谱是近年来出现的较为主流的知识表征和处理方法,通过将人类对客观世界的认知以图结构的形式进行整合、存储和计算等处理实现知识的高效表征、计算和转换。为了解决基于高维图结构的知识和语义表征带来的低计算和存储效率,知识图谱嵌入(Knowledge Graph Embedding,KGE)技术研究是目前知识表征和处理领域的热点57。该技术可将高维的概念知识和属性及相互间的复杂关系转化为在低维语义向量空间中的表征形式,可在保留语义信息以及概念知11I

42、MT-2030(6G)推进组IMT-2030(6G)Promotion Group识之间的复杂语义关联的同时大幅度降低语义的表征、计算及处理复杂度。目前,主流语义表征空间的类型大致可分为五类:(1)实内积空间;(2)复数空间;(3)高斯空间;(4)流形空间和(5)概率空间。具体内容详述如下。(1)基于实内积空间的语义表征空间)基于实内积空间的语义表征空间基于欧氏空间的实内积语义空间表征已被广泛应用于表征高维图谱中实体和关系中。通过将复杂高维图表征的语义信息转换到低维的欧氏空间中,可以采用简单的欧氏距离作为衡量语义距离和语义相关性的表征。在该空间中,欧氏距离越短则语义概念之间的相似度越高。目前已

43、有大量将高维语义表征转化为低维实内积语义空间表征的方法,包括 TransE26、TransR27、TransD28、NTN29 和 HAKE30 等。例如,TransE 将实体和关系表示成低维欧氏空间向量,并设计表征头实体与关系的向量之和趋近于真实语义的尾实体向量的效用函数。该模型具有高效和复杂度低等优点。但也存在语义空间容量受限,难以应对复杂关系和大规模概念知识表征等问题。为了应对此问题,TransR 针对每一关系构建独立的语义空间,通过设计投影矩阵将实体和关系投射至不同的空间并通过设计效用函数对它们进行区分,解决了空间不足和复杂关系的问题。除此之外,还有很多其他的改进方法。例如,Trans

44、D 在 TransR 的基础之上进一步将投影矩阵分解为两个向量的乘积,从而降低了转换模型的复杂度。另外,NTN 通过一个双线性张量神经层对实体进行多维建模,并利用一个特定张量捕获不同实体间的关联信息。HAKE 利用极坐标代替笛卡尔坐标,用模长和相位两部分信息表征实体,并反映出了不同实体间的层级结构。12IMT-2030(6G)推进组IMT-2030(6G)Promotion Group(a)(b)(c)(d)图 1(a)高维语义知识表征,(b)对应的基于实内积语义空间表征的语义星座图,(c)任意点的幅度与相位示意图及(d)对应的调制波形如图 1-(a)是一个语义知识表征示例,我们从 NELL-

45、995 知识库数据集中随机抽取与“城市”和“足球队”这两个类相关的 11 个实体,这些实体由 13 条关系连接;图 1-(b)展示的是使用 TransE 方法将(a)中的高维知识概念映射到低维实内积空间得到的低维信号星座图表征,可以看出语义概念越相近的实体在低维空间中的距离越近,且星座图中的不同实体可以通过对应波形的不同幅度和相位加以区分22 57。(2)基于复数空间的语义表征空间)基于复数空间的语义表征空间基于复数空间的语义空间表征使用复空间取代实值空间表示实体与关系,即将表征实体与关系的嵌入向量放至包含实部与虚部的复杂空间中讨论。在该空间中使用内积对关系、头尾实体做共轭复合运算。目 前 将

46、 高 维 语 义 表 征 转 化 为 低 维 复 数 语 义 空 间 表 征 的 方 法 包 括ComplEx31、RotatE32 和 QuatE33 等。ComplEx 首次引入复数空间对语义进行表征,通过对所得向量进行实部和虚部的区分,使用 Hermite 内积,能够很好地捕捉高维知识中经常出现的对称和反对称关系。受欧拉等式的启发,RotatE利用复数空间的旋转模型将实体间的关系建模为复数空间中头实体到尾实体的旋转,使用 Hadamard 积,能够很好地应对知识图谱中经常出现的反转和复合型知识模式,以及对称和反对称关系。QuatE 将二维复数空间拓展到四维复数空间,并利用 Hamilto

47、n 内积捕捉实体和关系的潜在内部依赖性,展现出更强大的语义表现能力。(3)基于高斯空间的语义表征空间)基于高斯空间的语义表征空间13IMT-2030(6G)推进组IMT-2030(6G)Promotion Group受高斯词嵌入启发,将高斯分布引入语义表征的语义表征空间可以有效处理高维语义中实体和关系之间的不确定性。典型的将高维语义映射至低维高斯语义空间表征的方法有 KG2E34 和TransG35。KG2E 将实体和关系嵌入到多维高斯分布中,(,)和 (,),其中均值向量 表示实体和关系的位置,协方差矩阵(covariance matrix)表示它们的不确定性。KG2E 遵循平移原则(Tra

48、nslationalprinciple,类似于 TransE 中的+=),实体变换 的概率分布可表示为:,+。TransG 则在关系嵌入表示中引入混合高斯分布,通过混合高斯分布的原则限制实体与关系之间的关联。(4)基于流形空间的语义表征空间)基于流形空间的语义表征空间从几何角度,现有方法将实体和关系投射到连续的低维向量空间,其中表示某一知识的头尾实体和连接它们之间的关系在语义空间中的位置几乎总是一个点,这对于复杂关系并不适用,当许多尾实体争夺一个“点”时,目标函数将有较大损失。针对上述问题,基于流形空间的语义空间表征根据集合理论将流形定义为一个具有领域点集的拓扑空间。ManifoldE36 通

49、过将某一知识概念从一个点扩展到一个流形(例如高维球体),通过这种方式避免了语义噪声以及错误知识对真实知识的影响,提高了知识表征的精度。ManifoldE 把基于点的嵌入表征扩展到了基于流形的嵌入表征,该方法提出了球面和超平面两种方法:对于球面空间,用 Reproducing KernelHilbert Space 表示流形方程;对于超平面空间,则引入相交的嵌入表征(intersectedembeddings)来增强模型。该方法将实值实内积空间(real-valued pointwise space)放宽为流形空间,并从几何角度表现出更具表现力的表示,当流形方程和流形参数设置为 0 时,流形空间

50、塌缩为一个点。(5)基于概率空间的语义表征空间)基于概率空间的语义表征空间和确定的符号信息不同,语义信息具有一定的随机性,因此可采用基于统计距离的指标刻画具有随机性的语义信息之间的距离。图卷积神经网络(GraphConvolutional Network,GCN)是一种用于处理图的深度学习模型。与传统的深度学习模型不同,GCN 将卷积神经网络的思想推广到图结构上,能够学习到节点在图中的位置信息,进而实现节点和关系的分类、预测。GCN 的基本思想是14IMT-2030(6G)推进组IMT-2030(6G)Promotion Group将图上的每个节点和它的邻居节点作为输入特征,构成一个节点特征矩

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 研究报告 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服