收藏 分销(赏)

6G知识体系构建:面向全域全场景的学术知识挖掘及其按需应用.pdf

上传人:自信****多点 文档编号:832024 上传时间:2024-03-27 格式:PDF 页数:15 大小:2.63MB
下载 相关 举报
6G知识体系构建:面向全域全场景的学术知识挖掘及其按需应用.pdf_第1页
第1页 / 共15页
6G知识体系构建:面向全域全场景的学术知识挖掘及其按需应用.pdf_第2页
第2页 / 共15页
6G知识体系构建:面向全域全场景的学术知识挖掘及其按需应用.pdf_第3页
第3页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、2023 年 9 月 Journal on Communications September 2023 第 44 卷第 9 期 通 信 学 报 Vol.44 No.96G 知识体系构建:面向全域全场景的学术知识挖掘及其按需应用 沙子凡,承楠,惠一龙,岳文伟,付宇钏,孙瑞锦(西安电子科技大学空天地一体化综合业务网全国重点实验室,陕西 西安 710071)摘 要:当前 6G 相关概念并未统一,亟待一致性的认知和定义,学术和产业界对 6G 的发展全貌和相关领域研究进展缺少清晰认识。为此,构建了 6G 知识库及知识体系。首先,对现有 6G 学术文献进行自动化筛选和结构化存储;其次,在对文本数据进行标注

2、和规范化的基础上构建了 6G 知识库;再次,利用 6G 知识库实现了对 6G全领域的统计分析;利用自然语言处理、深度神经网络和潜在树模型等技术实现对 6G 知识的抽取和生成。最后,在大模型训练的基础上,面向多样化的服务需求实现按需的知识应用。关键词:6G;知识库;知识体系;知识树;按需服务 中图分类号:TN929.5 文献标志码:A DOI:10.11959/j.issn.1000436x.2023181 6G knowledge system construction:academic knowledge mining and on-demand application for full d

3、omains and omni scenarios SHA Zifan,CHENG Nan,HUI Yilong,YUE Wenwei,FU Yuchuan,SUN Ruijin State Key Laboratory of Integrated Services Network,Xidian University,Xian 710071,China Abstract:At present,the concepts related to 6G have not been unified,and there is an urgent need for consistent cogni-tion

4、 and definition.Academics and industries lack a clear understanding of the overall development of 6G and the re-search progress in related fields.Therefore,the 6G knowledge base and knowledge system was constructed.Firstly,the existing 6G academic documents were automatically screened and stored in

5、a structured way.Secondly,a 6G knowledge base was constructed on the basis of labeling and standardizing text data.In addition,a comprehensive statistical analysis was conducted across all domains of 6G based on the knowledge base and the technologies such as natural language pro-cessing,deep neural

6、 network and latent tree model were used to realize the extraction and generation of 6G knowledge.Finally,on the basis of large-scale model training,the on-demand knowledge application was realized for diversified ser-vice requirements.Keywords:6G,knowledge base,knowledge system,knowledge tree,on-de

7、mand service 0 引言 随着 5G 技术的蓬勃发展和商用进程的推进,对 6G 的探索日益成为学术界和产业界关注的焦点。标准化组织 3GPP 已完成对 5G NR Rel-17 标准的冻结1,Rel-18 标准的推进工作也正在进行。各大组织和企业纷纷发布 6G 愿景和白皮书,展望 6G并对相关技术和产业进行布局。其中,芬兰奥卢大学发布了全球首个 6G 白皮书,提出了泛在无线智能的愿景2;三星在其 6G 技术白皮书中指明 6G 三大关键服务,分别为真正的沉浸式扩展现实(XR,extended reality)、高质量移动式全息体验以及数字化身3。我国也高度重视 6G 建设,东南大学尤肖

8、虎和王承祥教授联合国内外 24 家科研院校及企业收稿日期:20230506;修回日期:20230906 通信作者:承楠, 基金项目:国家重点研发计划基金资助项目(No.2020YFB1807700)Foundation Item:The National Key Research and Development Program of China(No.2020YFB1807700)174 通 信 学 报 第 44 卷 的50位业内专家发布了面向6G无线通信网络的长文综述,文章从 6G 性能指标、应用场景、垂直行业应用、使能技术、新的范式转换等方面对新一代无线通信进行剖析和展望4。未来 10 年

9、,6G 将引领全领域的技术深化和认知变革,并赋能海量及新型场景、业务下的按需服务。具体来说,6G 有望提供全球覆盖,增强频谱、能源、成本效率,具备更优越的智能水平和安全性5-6,如通过引入雾计算实现未来移动通信网络中通信与计算的融合7。为实现上述愿景,6G 需要具备更高级别的自主决策能力,实现对人机接口的改进更新,并在多样化的环境中实现深度连接8-9。同时,6G 需要具备支持需求动态变化的新业务及未知业务的能力,以构建智能和开放的 6G 生态10-13。由此可见,6G 的变革覆盖各方各面,而智能化是其显著特征和重要内核14-16。然而,当前 6G 学术领域的发展存在两点问题。其一,由于开展研究

10、时间尚短,对 6G 相关领域的探索缺少整体的系统构建和脉络梳理,限制了 6G 理论和技术的深入研究。具体来说,6G 技术的多样性、场景的差异性以及需求的不确定性使整体的研究呈现多元化特征,缺少整体性的 6G 脉络认知将进一步加剧研究工作的发散性。同时,对 6G 相关要素的定义和定性相对滞后于最新 6G 理论探索,6G 全领域知识体系的构建可以为 6G 标准化的阶段性推进提供重要依据。此外,缺少对 6G 全领域的整体性认识和领域间关联的把握,易导致相关研究不具备普适性和泛化性,进一步降低 6G 研究的生命力。其二,仅在现有通信系统中简单应用人工智能算法无法实现“服务随心所想,网络随需而变,资源随

11、愿共享”的 6G 按需服务愿景,在知识嵌入的新型架构体系中实现移动通信和人工智能技术的深度融合已成为迫切需求。为解决上述问题,本文构建了 6G 知识库和知识体系,在对 6G 全领域知识进行抽取和归纳的基础上实现知识的按需应用。对于当前 6G 学术知识的剖析有利于引导 6G 各领域的战略布局和未来发展。同时,6G 知识的引入可实现对于服务需求及其管控的立体感知、决策推断和动态调整4,如长期积累的网络与通信领域知识用来赋能相关的网络管控、优化等。本文提出的 6G 知识库和知识体系是面向 6G 全领域构建的知识集群,对于总览 6G 全貌并赋能全场景按需服务具有重要意义。具体来说,6G 知识库对目前已

12、有的 6G 学术文献进行结构化存储,在初始字段的基础上扩充知识维度。6G 知识体系以 6G 知识库为载体,是 6G 知识库实现知识生长和应用的重要内核,其包含对 6G全领域的统计分析、6G 知识的抽取和生成以及对特定知识的标注,并在此基础上实现按需的知识应用。其中,6G 全领域统计分析利用 6G 知识库中的文献元数据,对 6G 的发展趋势进行呈现和预测,并对 6G 学术领域和热词等进行分析;面向 6G 知识抽取与生成,本文利用海量 6G 文献的语料信息生成了 6G 知识树;知识标注方面,本文对 6G 典型场景、使能技术、关键性能指标(KPI)等重要属性进行标注;在知识标注和知识抽取的基础上,实

13、现场景识别、技术关联、按需知识推荐等知识应用。综上所述,本文的主要贡献如下。1)构建了 6G 知识库和知识体系,实现了对 6G学术知识从抽取、挖掘到按需应用的全生命周期闭环管控。2)基于 6G 知识库,对 6G 学术进行统计分析,包含文献随时间的分布情况、热点领域和热词的分布情况,在此基础上实现了对 6G 学术发展的预测以及 4G、5G、6G 的对比分析。3)利用分层主题检测算法从海量学术数据中生成了 6G 知识树,实现了对 6G 全领域知识结构的提炼,以及关键词、主题和文献之间的三层关联。本文对 6G 知识树节点及结构数据进行了开源。4)以基于文本生成的 6G 热点推荐为例,展示6G 学术知

14、识的应用,并阐释知识应用对 6G 网络配置、运行和维护的意义。1 6G 知识库及知识体系构建 面对快速发展的 6G 技术,如何对 6G 研究的全貌和具体技术的发展脉络进行智能分析已成为众多科研人员和工程人员的共同需求。为实现对 6G知识的挖掘以及原生智能的嵌入,本文构建了 6G知识库和知识体系。传统的知识库是基于知识且具有 智 能 性 的 系 统,是 人 工 智 能(AI,artifi-cial intelligence)和数据库(DB,database)2 种计算机技术的有机结合17。本文构建的 6G 知识库和知识体系包含对数据智能的存储和挖掘,旨在打造学术知识全生命周期的智能管控平台,有利

15、于洞悉6G 的学术、产业布局高地和未来发展的热点,通过深层次的知识挖掘可实现按需的知识应用。本文将知识的全生命周期管控分为如下 3 个环节。第 9 期 沙子凡等:6G 知识体系构建:面向全域全场景的学术知识挖掘及其按需应用 175 1)从海量非结构化数据中获取目标信息,并进行结构性和规范化的知识存储,即构建知识库。2)对 1)中规范化数据进行处理、标注、分析和推理,从而生成新的知识。3)利用 2)中新获取的知识进行按需的知识应用,并将知识驱动的策略存储至知识库中,实现知识闭环。基于上海交通大学 Acemap18的文献数据库,本文共筛选出 1 754 篇 6G 相关的学术文献,文献主题涵盖 63

16、3 个不同的领域。本文首先对筛选得到的 6G 文献进行预处理,形成规范化的文本数据,从而构建 6G 数据库。6G 数据库中包含 6G 文献的结构化数据,其只具备存储能力;而 6G 知识库在涵盖 6G 数据库的基础上,可以对数据进行标注、分析和推理,从而实现新知识的抽取、生成及存储,具备自扩展和自维护的能力。目前,6G 数据库包含已有 6G 文献的特定 ID、标题、摘要、领域、发表年份以及 DOI 号等初始数据字段。同时,6G 知识库支持纵向(文章数量)和横向(文章属性类别)的扩展,目前已扩充包含场景、技术、KPI 在内的多个属性维度。Acemap 作为完全由国内自主研发的新式学术搜索系统,目前

17、已涵盖全领域共计221 302 966 篇学术文献,基于此构建的 6G 知识库也延续了其全面性的特点。同时,Acemap 将学术实体组织成网络,通过网络分析和数据挖掘的方法展现实体间的关联性,使基于此构建的 6G 知识库具有准确性的特点。此外,基于 Acemap 构建的 6G知识库具备文献的补充和知识的抽取、生成及存储能力,因此具备可扩展性。6G 知识库在结构化 6G 学术数据的基础上,结合专家知识和自然语言处理技术19-21,实现自顶向下和自底向上相结合的知识体系构建。本文对专家知识、自顶向下构建和自底向上构建进行如下说明。1)专家知识22是指特定领域专家水平的经验与认知,能够利用人类专家的

18、先验性认识和共识性准则来理解、归纳和总结该领域要素及问题,如当前对 6G 场景和应用方向的一致性认识,以及移动通信发展过程中的普遍性原理。2)自顶向下构建是指从结构化数据源中提取本体和模式信息,并加入知识库中。3)自底向上构建是指利用标注和归纳等方法得到所需的数据模式,选择其中置信度较高的信息,加入知识库中。专家知识具备可靠性和规范性,然而其往往面向特定领域及方向,具有领域的局限性。而且专家知识的形成需要长时间的经验积累,需要结合基于人工智能技术的自顶向下构建方式,提升知识体系构建的整体性和高效性。6G 知识体系包含统计分析、知识抽取及生成、知识标注三层内核,并面向按需的知识应用。同时,依据特

19、定字段,可自动化分析对应场景、技术以及服务需求,实现真正意义上的全场景按需服务。6G知识库及知识体系构建流程如图 1 所示。图 1 6G 知识库及知识体系构建流程 176 通 信 学 报 第 44 卷 具体来说,6G 数据库包含 1 754 篇 6G 文献的元数据字段和扩展属性,对这些结构性数据按照发表年份、文献领域等进行统计分析,可实现对当前 6G 学术的发展态势的整体把握,在此基础上可进一步预测未来的发展趋势。除了统计分析,可应用自然语言处理技术和深度学习方法对 6G语料进行处理和训练,实现 6G 知识的抽取和生成。本文利用主题分析算法对 6G 脉络进行梳理,生成 6G 知识树;同时,本文

20、利用获取的 6G 文献语料进行语言模型23的训练,结合 Transformer24、注意力机制25,以及 BERT 模型26,训练了面向6G 的语言模型 6G-BERT,未来可应用于多种6G 相关的下游知识服务;此外,利用神经网络模型,本文实现了基于文本生成的 6G 热点推荐,未来可面向 6G 各子场景,进行细粒度的热点推荐和关联。除了面向元数据的统计分析和知识抽取外,本文还进行了规则化的知识标注工作,目前主要对每篇文献的场景、技术、指标进行针对性标注。标注后的数据可应用于广泛的按需知识服务,目前主要涉及场景识别、技术关联和 KPI 聚类等,未来将面向更多科研及应用需求。此外,上述三层内核之间

21、也存在交互关联。知识标注为知识抽取及生成提供数据样本,用于相关的模型训练驱动;知识抽取及生成为知识标注提供标注维度;知识抽取及生成为统计分析提供有统计意义的数据维度;统计分析结果可以引导特定知识的抽取和生成。三层内核推动 6G 知识体系实现面向 6G 特定领域的知识蒸馏,其输出进一步反馈至6G 数据库,实现知识的循环运作,即知识闭环。本文所提到的知识抽取、知识生成和知识蒸馏定义如下。1)知识抽取是指从各种信息源中自动或半自动地提取与 6G 通信技术相关的信息、数据和概念的过程。这可以从语料等来源中抽取关键词、场景、需求、技术参数等,以建立一个关于 6G 全领域的知识库或信息集合。2)知识生成是

22、指基于已有的信息和数据,通过分析、合成、推理等方式,产生新的 6G 领域知识的过程27。这包括提出的新理论、架构、策略以及技术方案等,以填补现有知识中的空白,推动 6G领域的研究和发展。3)知识蒸馏是指将复杂的6G领域知识转化为更简单、更易理解的形式,以便向 6G 受众传递和共享28。这可以通过总结、归纳、概括和解释等方式实现,使各类人群能够按需理解和获取有关 6G研究的基本概念和原理。由此可见,6G 知识库具备可扩展性,知识并非局限于已定义好的规则,而是在领域范围内,实现意料之外、情理之中的推理和发掘。此外,利用 AI 技术,可实现对特定知识概念的呈现、服务需求的挖掘、决策的推荐等,这些结果

23、将继续作为知识库的输入,实现真正意义上的知识生长和知识闭环。Mestres 等29提出一种知识定义的网络(KDN,knowledge-defined network)架构,KDN 利用知识平面接收分析平台的数据并进行分析,在此基础上将数据通过机器学习算法转化成知识,借助知识进行网络配置与优化决策。6G 知识库和知识体系可以融合知识平面中的知识,该融合有助于在 6G 网络的配置、优化和决策过程中更好地利用多源、多维度的知识30-34,从而提升网络性能,具体来说包含如下 5 个方面。1)知识共享与整合。将从 6G 知识库中标注和生成的知识与知识平面中经数据分析得到的知识进行共享和整合。可以通过建立

24、统一的知识表示方式,使从不同来源获取的知识可以相互关联、映射和融合。2)知识更新与动态调整。知识平面中的数据分析可以持续地为 6G 知识库提供新的信息和数据,从而使知识库能够保持更新和动态调整。这有助于知识库持续地适应 6G 网络的发展和变化。3)智能决策支持。与知识平面融合后的 6G 知识库可进一步提升网络配置和优化决策的智能性和按需部署能力。知识平面提供的分析结果可以为决策提供实时性支持,6G 知识库生成的知识可以为决策提供更多的背景及理论支持。4)跨领域知识应用。与知识平面融合后的知识库可以关联多个领域知识,促进不同领域间的融合与创新。例如,将网络通信知识与人工智能、物联网等领域的知识结

25、合,推动 6G 网络在多个跨域场景中的知识应用。5)知识质量检测与验证。与知识平面融合后的知识库可以更好地进行知识质量的验证与优化。从6G 知识库中生成的知识可以通过与知识平面中数据分析结果的对比,实现对知识的检验和修正,从而提升知识的准确性和可靠性。在对知识库进行多轮的规则清洗和人工筛查第 9 期 沙子凡等:6G 知识体系构建:面向全域全场景的学术知识挖掘及其按需应用 177 之后,本文归纳并定义了 6G 的十大典型场景,分别为全感官沉浸式通信、立体多栖交通、孪生虚拟交互、全功能全自动绿色工业、通感算一体化网络、智慧城市与生活、全覆盖跨域空间通信、泛在智能按需交互、抗干扰安全可信网络、灾害适

26、应性网络。同时,本文也归纳出 6G 十大核心技术,分别为全息通信、太赫兹技术、可见光技术、数字孪生、智能超表面、知识图谱、意图驱动、大规模多输入多输出(MIMO,multiple-input multiple-output)、区块链、大数据。6G 典型场景和核心技术之间紧密关联,两者相辅相成,共同描绘了 6G 未来发展的蓝图和方向。6G 十大典型场景及十大核心技术如图 2 所示。由于对 6G 的探索尚处于起步阶段,学术界对6G 场景和技术的定义目前仍是众说纷纭、各有侧重,尚无统一的定论。本文的 6G 知识库从“全”的角度进行了 6G 场景和技术的总结;从众多文献的特殊性中归纳普遍性,从“准”的

27、角度诠释了 6G领域的分布和扩展。更重要的是,6G 场景并非一成不变,而是处于动态演进和持续补充的状态,且场景间的交互和技术间的融合是 6G 一大典型特征。因此,在对 6G 场景及技术进行“全”和“准”定义的基础上,6G 知识库及知识体系的优势更在于对新场景、新需求的归纳和对场景、技术内部及之间关联性的体现。2 6G 学术文献统计与分析 2.1 移动通信学术统计与代际对比 统计是对数据的首轮发掘、对知识的初步解读。本文针对 6G 学术文献进行统计分析,有助于洞悉其发展趋势和热点分布,预见未来的发展方向。移动通信的发展历经漫长的演进过程,虽然不同的代际在场景、需求、技术、指标等方面各有侧重,但都

28、服从一定的演进规律,相邻代际之间也具有相似的关联性。赵亚军等35从“10 年周期法则”和“鲶鱼效应”等角度定性阐明了开启 6G 研发的必然性,本文从知识挖掘和学术统计分析的层面进一步定量佐证并丰富了上述观点。此外,相关挖掘得到的结论也作为先验知识存储于 6G 知识库中。具体来说,经过自动和人工相结合的清洗筛查,知识库共得到 1 754 篇 6G 文献和 36 682 篇5G 文献。本文对这些文献进行了时间跨度为20002021 年的分布统计,统计结果如图 3 所示。图 2 6G 十大典型场景及十大核心技术 178 通 信 学 报 第 44 卷 图 3 5G 和 6G 文献分布统计 从图 3 可

29、知,6G 学术研究萌芽于 2018 年开始出现,20192021 年以加速度趋势上升,2021 年的文献数量已达到了 1 067 篇,发展势头迅猛,处于高速上升期,未来几年内预计会保持突破性增长。然而,6G 学术仍处于起步阶段,仅从近几年的数据无法具像化描摹今后的 6G 发展态势。为更好地洞悉 6G 未来的发展趋势,本文利用 5G 文献的分布情况作为参考和佐证,对比分析并预测 6G学术的生长趋势。从图 3 可知,5G 学术研究萌芽于 2010 年开始出现;20132018 年处于急速增长时期;2018 年后增长速度放缓,并于 2020 年达到 5G 文献数量的峰值,高达 7 945 篇;从萌芽

30、到峰值的发展周期为810 年。2020 年后,呈现下降的趋势,预计在未来 5 年将呈现由缓降到陡降的论文发表趋势。为更好地对移动通信发展趋势进行把握,本文对4G6G 的学术发展状况进行了对比分析,对比项包含上述三大阶段、发展周期、峰值年、峰值文献数量以及我国商用开始时间,在此基础上进一步提炼4G6G 的更迭关系。本文将学术发展周期定义为自发展期起始年至峰值年的年份跨度。根据表 1 不难发现,4G6G 的学术发展周期均为 8 年左右,加上萌芽期对应移动通信网络十年一代的更迭规律36。当某一代进入学术成熟期时,也是其进入商用的开端,而下一代移动通信也在该时段迈入学术萌芽期。2.2 6G 子领域统计

31、分析 除了统计分析文献的年份分布情况,本文还统计了6G知识库中的领域属性,共得到633个不同的领域,6G Top-20 子领域分布统计如图4 所示。出现频率较高的热点领域包含通信技术、计算机科学、计算机网络、无线网络、电子工程、人工智能、数据科学、密码学、接入网络、传输技术、云计算、物联网、分布式计算、光学、蜂窝网、信道、安全、波束成形、MIMO 以及区块链等。这些领域涉及重点学科、热点产业、新兴技术和潜力应用,在6G 以及未来的移动通信发展中占表 1 4G、5G、6G 三代发展对比 对比项 4G 5G 6G 萌芽期 20032006 年 20102012 年 20182019 年 发展期 2

32、0072012 年 20132018 年 20202026 年(预计)成熟期 2013 年以后 2019 年以后 2027 年以后 发展周期/年 8 7 8 峰值年 2015 年 2020 年 2028 年(预计)峰值文献数量/篇 947 7 945 17 500(预计)我国商用开始时间 2013 年 12 月 2019 年 11 月 2028 年(预计)第 9 期 沙子凡等:6G 知识体系构建:面向全域全场景的学术知识挖掘及其按需应用 179 据重要地位。2.3 6G 学术热词分析 同时,本文对 6G 知识库中出现的高频热词进行了抽取和分析,并对 6G Top-20 的热词进行了统计分析,统

33、计结果如图 5 所示。6G Top-20 的热词按热度排序依次为边缘计算、AI、安全、物联网、太赫兹、车联网、MIMO、蜂窝网、云计算、智能超表面、光学、虚拟化、区块链、卫星、数字孪生、软件化、波束成形、量子通信、网络切片以及大数据等。这些热词清晰对应了 6G 的典型场景、使能技术以及发展方向。具体来说,典型场景包括空天地海一体化建设、车联网立体交通、云边端智能协同、分布式集中式融合部署,使能技术包括太赫兹、大规模 MIMO、区块链 图 5 6G Top-20 热词分布统计 图 4 6G Top-20 子领域分布统计 180 通 信 学 报 第 44 卷 等新兴技术;发展方向包括虚拟化、软件化

34、、按需服务等发展理念和新型框架。这些热词分布与领域分布共同为 6G 学术发展和产业布局提供当前的全领域发展概况并引领今后的研究方向。在此基础上,本文进一步提炼了热词的热度变化情况,图 6 展示了近 4 年 6G Top-10 热词的学术发展趋势。图 6 6G Top-10 热词的学术发展趋势 从图 6 可知,6G 热词的学术热度只增不减,然而不同热词的热度增长速率不尽相同。对热词的分析进一步揭示了 6G 发展的中坚领域,也印证了6G 技术成长的足迹。3 6G 知识树构建 3.1 构建流程 作为新生事物,6G 对于大多数研究者和工程人员而言是较陌生的,因此 6G 知识的出发点在于对 6G 全领域

35、的总结和梳理,并引导受众对相关子类进行探索。为此,本文基于 6G 知识库中的海量学术数据以及分层主题检测技术生成了 6G 知识树。6G知识树的构建依托6G知识库中的结构性数据,从属于 6G 知识体系中知识抽取及生成模块,是其中一种典型用例。同时,6G 知识树生成的数据关联可作为新知识存储进知识库中,从而提升知识库的可扩展性。6G 知识树和知识库之间相辅相成,促进差异性 6G 知识间的关联和融合。知识库中存储了规范化的文本数据,本文从中抽取形成了关键词集合,集合共计包含 10 000 个关键词。此外,利用专家知识进行筛选和检验,本文构建了 6G 领域的匹配词表,词表用于与知识脉络节点进行模糊匹配

36、,包含 4 278 个 6G 知识体系主题节点候选词。利用分层潜在树分析(HLTA,hierarchical latent tree analysis)37,本文实现了关键词、主题和文献集之间的三层关联。1)通过计算词与主题之间的相关度,找到主题及其对应的关键词集。2)通过计算主题间的相关度,建立知识树的层级结构。3)通过计算主题与论文的相关度,找出主题对应的文献集。综合上述三层关联实现对 6G 知识树的完整构建,构建流程如图 7 所示。具体来说,第一层关联包含对关联性词语的抓取和主题词的确定,其中,关联性词语的抓取主要通过关键词的共现特征来确定,即关键词在文本语料中共同出现的频率,当出现的频

37、率达到设定的阈值时,则认定这些关键词具有相关性,即属于同一个主题。主题词由某一主题下相关度最高的 5 个关键词来确定,本文利用互信息量(;)I X Y38对关键词的相关度进行排序,其表达式为 ,(,)(;)(,)lb()()X YP X YI X YP X YP X P Y=(1)然而,知识应以凝练的方式呈现,以 5 个关键词命名主题稍显冗余且不利于知识树可视化的直观表达,所以本文进一步利用构建的 6G 候选词表对主题进行模糊匹配,本文采用最佳匹配 25(BM25,best match25)39算法对相似度进行评分,评分最高的作为最终的主题词,其表达式为 111score(,)IDF()(,)

38、(1)1(,)1 avgdlniiiiD Qqf q D kDf q Dkbb=+(2)其中,D 表示特定的语料;Q表示语料集合;IDF()iq表示第 i 个关键词iq在Q中的IDF值,即iq在Q中的重要程度,越稀有权重越高,所以它随着单词数量的增加而降低;(,)if q D表示关键词iq在语料 D中的TF值,即iq在D 中的重要程度,随着单词数量的增加而增加;1k表示调节因子,设置为常数;b表示字段长度归约,即D 与Q的语料长度之比;D表示语料长度;avgdl 表示Q中所有语料的平均长度。第 i 个关键词的TF和IDF的计算式分别 第 9 期 沙子凡等:6G 知识体系构建:面向全域全场景的学

39、术知识挖掘及其按需应用 181 1TFiinkknn=(3)IDFlg1:iijDj td=+(4)其中,in表示第 i 个关键词在语料中出现的次数;1nkkn=表 示 D 中 所 有 关 键 词 出 现 的 总 数。1:ijj td+表示Q中出现该关键词的语料总数,为防止分母为 0,故加 1。在第一层关联的基础上,将所获得的一级主题当成关键词再次进行上述关联,不断重复,即可得到第二层关联中的知识树层级结构。获取了主题及其层级结构之后,本文再次对主题和论文语料进行相似度匹配,进而推荐与主题相关的论文集合。3.2 可视化分析 本文利用 G6 图分析引擎进行 6G 知识树的可视化,结果如图 8 所

40、示,其包含 6 个层级,共计1 453 个主题。整体来看,6G 知识树覆盖了 6G 全领域的各方各面,尤其对应了前文罗列的 6G 十大典型场景及十大核心技术。具体来说,物联网节点包含了工业物联网和车联网,工业物联网涉及传感器融合技术、设备检测和数据安全等方面,车联网涵盖车对车(V2V,vehicle-to-vehicle)、车对云(V2C,vehicle-to-cloud)、车对基础设施(V2I,vehicle-to-infrastructure)等子领域;空天地海节点包含天基网络、空基网络和陆基网络,天基网络包含各种卫星通信,空基网络包含高海拔空间和近地空间,涉及无人机(UAV,unmann

41、ed aerial vehicle)通信及其相关技术,陆基网络涵盖了蜂窝网、Wi-Fi、设备到设备(D2D,device-to-device)通信等;5G 通信节点涵盖了 5G 三大典型场景,三大场景也对应不同的业务。可以说,6G 主题树在实现 6G 学术全领域总览的基础上,兼顾了知识的准确性和可靠性。此外,进入上述节点可提供相关论文的推荐,方便对特定领域的知识搜索。综上所述,6G 知识树提取了 1 754 篇 6G 文献的核心内容,涵盖了 6G 的典型场景和技术,囊括了 6G 全领域的要素及特征,展现了 6G 研究的发展全貌,也为 6G 相关子领域的关联和搜索提供参考。同时,6G 知识树具备

42、智能化的知识关联和理解能力,随着输入数据的动态变化,其将调整原先的归纳体系并添加新的知识节点。未来,6G 知识树将提供不同粒度和维度的知识抽取及呈现,助力实现知识的按需切片和关联。4 6G 知识体系应用:知识驱动的按需服务 构建 6G 知识体系的目的是驱动相关的知识应用,以赋能全域全场景按需服务。本文首先对相关概念的关联逻辑进行梳理。所谓“按需服务”,属于 6G 服务的范畴,如通信、接入、自动驾驶等,图 7 6G 知识树构建流程 182 通 信 学 报 第 44 卷 旨在为 6G 中包含不同主体、环境、需求特征的用户提供定制化服务;所谓“知识驱动”,是一种致力于使按需服务更加精准、高效且低消耗

43、的新型技术;所谓“知识应用”,即 6G 知识体系能为知识驱动按需服务提供的一些程序化应用,通过调用具体的应用或方法可实现知识驱动的按需服务;所谓赋能“知识驱动的按需服务”,即针对已知或未知、标准化或定制化的服务需求,在进行相应数据模式和实体属性抽取的基础上,实现满足服务需求的知识分析、生成、推理、推荐等,并具备全生命周期的知识服务管控能力。本文以场景认知为例阐述“知识驱动的按需服务”的实现过程。首先,对 6G全场景要素进行分解,构建包含环境、主体、资源、服务的本体结构;其次,利用知识图谱对不同实体及实例之间的关系进行表征和认知,在此基础上形成多维多粒度快速资源感知方案;最后,根据对网络意图的感

44、知与转移,实现不同场景下的精准需求识别和策略生成。为进一步阐释 6G 知识体系按需应用的能力,本节总结了按需服务的三大内涵:其一是需求的相关性,即知识本身须有助于对需求的分析和认识,使提供的服务切实反映需求;其二是需求的模糊性,即需求不设固定的粒度和特征,知识可以为其提供一定的选择空间;其三是需求的可扩展性,即知识服务需要具备处理新需求或未知需求的能力。4.1 基于文本生成的 6G 热点推荐 为实现知识和按需服务的融合,本文构建的 6G知识库和知识体系提供了丰富的知识应用。具体来说,6G 知识库包含丰富的语料数据,通过对这些文本进行训练,可以进行诸多 6G 领域相关的需求任务,如场景识别、技术

45、关联和 KPI 聚类等,进而实现 6G 知识体系的应用。本文以基于文本生成的6G 热点推荐为例,利用深度学习、神经网络等理论工具,实现面向 6G 按需服务的知识应用。常用的文本生成方式包括基于语言模型的文本生成40-43和基于深度学习方法的文本生成44-46,6G 知识体系集成并应用了上述 2 种方式。对于前者,6G 知识体系利用 6G 文献语料训练了 6G-BERT模型,其架构如图 9 所示。随着知识库和语料的不断扩展,6G-BERT 也日趋完备,未来将应用于大量基于语言模型的下游应用。基于语言模型的方法可以理解和保持上下文的一致性,生成更加连贯且具有多样性的文本。同时,其可以用于各种文本生

46、成任务,包括生成文章、回答问题、自动摘要、对话系统等,具有很高的灵活性。对于后者,考虑到自然语言的序列顺序和上下文关联,本文通过训练长短期记忆(LSTM)模型47,来实现文本序列的自动生成。基于深度学习的方法可以融合多模态数据进行文本生成,使生成的文本更具表现力。同时,由于其长记忆性的特点,更适用于生成需要考虑大量上下文信息的文本。此外,其可以针对特定任务进行模型设计和优化,并且可以在相对较小的数据集上进行训练。6G 知识体系,基于语言模型和基于深度学习的 6G 文本生成方法都属于其中知识抽取及生成模 图 8 6G 知识树部分可视化图形 第 9 期 沙子凡等:6G 知识体系构建:面向全域全场景

47、的学术知识挖掘及其按需应用 183 块,基于文本生成实现的 6G 热点推荐属于知识应用模块。基于语言模型和深度学习的方法都可以助力 6G 知识体系实现知识生成,然而两者在知识生成的效果和知识应用方面存在差异。1)在知识生成的效果方面。基于语言模型的方法侧重于生成具有多样性和创造性的知识,面向知识生成的广度;而基于深度学习的方法侧重于生成更具针对性的知识,面向知识生成的精准度。2)在知识应用方面。基于语言模型的方法可以通过微调适应更多交互式的应用,如知识图谱生成及推理、智慧人机对话等;而基于深度学习的方法则广泛面向检测及分析类的知识应用,如 6G 场景识别、技术关联等。文本生成任务本质上是一个多

48、分类问题,对于字符级别的文本生成任务,待区分的类即文本中的字符种类。本文将 6G 学术语料按照每 100 个字符进行切割,共得到了 2 022 120 条样本,将其按照 4:1划分训练集和验证集,并进行模型的训练。借鉴文献48,本文的系统参数设定如表 2 所示。表 2 系统参数设定 参数项 参数值 样本总数/条 2 022 120 训练集样本数:验证集样本数 4:1 批次大小/条 128 序列长度 100 特征个数 148 隐层节点数 512 批次个数 8 迭代周期 30 LSTM 层数 2 学习率 0.01 优化器 Adam 损失函数 交叉熵 在 预 测 阶 段,将 测 试 文 本“futu

49、re sixth-generation”输入模型,输出经过 Softmax 层,得到 148 维的概率结果。最后利用 Top-k 采样,对排名前五的概率根据其分布进行采样,并输出对应的字符。部分生成结果如图 10 所示。从整体上看,模型有效生成了 6G 领域相关信息,包含了 6G 场景、技术和属性及其特征,如人工智能、网络安全、蜂窝网、接入网、移动边缘计算、天线技术、数据传输技术、非正交技术、时延、容量、能效等,实现了与输入文本一致且关联的热点推荐。在上述知识体系应用的基础上,通过引入更多人工智能理论和技术可提高文本生成的流畅性和正确性,进一步提升按需知识服务的能力。定性地看,面向 6G 热点

50、推荐的知识应用贴合了上述按需服务的三大内涵,其推荐结果与需求内容高度相关,且包含了场景、技术、特征、属性等多个维度,满足需求的相关性和模糊性。同时,其输入可以为任意的字符和句子,即可应对新兴或未知的需求,充分满足需求的可扩展性。除此以外,6G 知识库和知识体系还提供了多种按需服务和知识应用,在进一步实现需求分析和粒度划分的基础上,未来有望实现场景智联和跨域服务。4.2 知识驱动的 6G 网络配置及运维 知识应用在未来 6G 网络的网络配置、运行和维护中具有重要的作用。它可以实现智能化的网络管理、提高服务质量、降低故障风险,并促进可持续发展。通过有效应用知识,6G 网络可以更好地满足日益增长的通

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服