收藏 分销(赏)

文化遗产领域知识纲要研究_侯西龙.pdf

上传人:自信****多点 文档编号:465037 上传时间:2023-10-12 格式:PDF 页数:13 大小:1.97MB
下载 相关 举报
文化遗产领域知识纲要研究_侯西龙.pdf_第1页
第1页 / 共13页
文化遗产领域知识纲要研究_侯西龙.pdf_第2页
第2页 / 共13页
文化遗产领域知识纲要研究_侯西龙.pdf_第3页
第3页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷 第 期 年 月文化遗产领域知识纲要研究侯西龙,王晓光,翁梦娟曲阜师范大学传媒学院 日照 武汉大学文化遗产智能计算实验室 武汉 武汉大学信息管理学院 武汉 摘 要:目的 意义面向文化遗产领域的知识分析研究,对领域知识建模、知识组织、智慧数据资源建设等具有重要意义。方法 过程为明确文化遗产领域知识结构与特征,基于对领域本体的计算与分析,系统剖析文化遗产领域核心共享概念以及领域知识关联关系,提出并构建文化遗产领域知识纲要。结果 结论文化遗产领域核心共享概念包括领域对象与实体、类型与概念、时间与空间、事件与活动、文献与作品、代理者等内容,领域知识关联关系丰富多样且较为复杂。研究结论有助于更全面

2、地理解与认识文化遗产领域知识体系,指导领域本体开发与知识建模,促进领域知识的有效组织与管理。关键词:文化遗产 知识纲要 本体 知识组织 知识关联分类号:本文系国家社会科学基金青年项目“文化遗产图像资源关联数据集成与叙事化呈现研究”(项目编号:)和湖北省科技厅重点研发计划项目“文旅大数据关键技术研发与应用示范”(项目编号:)研究成果之一。作者简介:侯西龙,副教授,博士;王晓光,教授,博士生导师,通信作者,-:;翁梦娟,博士研究生。收稿日期:修回日期:本文起止页码:本文责任编辑:易飞 引言 文化遗产领域知识的有效表示、组织与管理,是建设文化遗产智慧数据资源、实现文化遗产智能计算的基础和前提。语义网

3、环境下,基于本体的领域知识组织方法通过提供对领域知识的共同理解实现知识共享,被认为是对领域知识组织最有效的技术与方法。本体作为领域对象及其关系的概念化、形式化的统一表示,可以实现对主观知识的客观表达以及隐性知识的显性表达,在文化遗产数据化过程中发挥着重要的桥梁和枢纽作用。本体基础设施建设也已经成为文化遗产数据资源开发与建设、领域知识共享与重用、解决高层语义互操作问题的核心与关键。目前,围绕文化遗产领域本体设计构建、信息组织实践等主题开展了丰富的研究,但对文化遗产领域知识体系的独特内涵、领域知识表示与组织的核心内容等问题及其原理的研究仍不足。实现文化遗产领域知识的有效组织与管理,核心是对领域知识

4、及知识间关联进行描述与揭示。领域知识纲要可以被认为是从领域知识抽象出的概要性的概念体系,是某一领域内的核心概念以及概念之间的相互关系的集合,反映了领域知识更高语义层面上的基本知识体系与结构。领域知识纲要作为领域知识组织的顶层架构,决定了领域知识组织的最终形式,是领域知识组织与知识服务的基础性工作。而本体恰是对领域知识进行逻辑抽象而构筑起来的体现概念及其关系的概念模型。因此,通过对领域本体与概念模型的剖析,归纳其表现出的共同的知识纲要,可以从更高抽象层次表征领域知识体系的一个“剖面”。为此,本文从领域本体视角解析文化遗产领域核心概念以及知识关联关系,在此基础上构建文化遗产领域知识纲要,进而分析文

5、化遗产领域本体构建与知识表示中存在的问题与挑战,并提出具体的解决思路和对策建议。本文对文化遗产领域知识纲要的分析与构建,有助于增强对文化遗产领域知识体系的整体性认识与理解,促进领域本体的开发与知识建模,为文化遗产领域知识组织、知识重用与知识服务等奠定基础。相关研究综述 每一门科学都包含着大量的概念,即众多事实、思想和专业名词,这些概念构成了科学知识的基本单元。本体以结构化的方式呈现特定领域中复杂的知侯西龙,王晓光,翁梦娟 文化遗产领域知识纲要研究 图书情报工作,():识概念,进而建立概念的一致性。本体通过对概念、术语及其相互关系的规范化描述,勾画出某一领域的基本知识体系,反映特定领域知识结构的

6、概念体系。面向领域知识组织与分析时,概念表达了某个词汇背后所包容的、错综复杂的领域背景知识,知识内涵往往通过领域术语间的关联形式化揭示。因此,本体实质上反映了特定领域的知识结构,领域知识的核心内容和概念关联都会在本体模型中得到体现。随着文化遗产领域本体复杂度与规模的不断增加,带来了本体理解与复用、本体互操作等问题。因此,国内外学者提出本体剪枝、本体模块化、本体概要等方法,其核心思想都是从本体中提取概要性的关键信息,有效解决本体查询效率低、内涵难以理解、本体复用较难等问题。针对文化遗产相关领域,从机器自动化理解和解释的视角,对文化遗产领域本体的可用性开展评估和数据剖析。等从词表规模、树结构、耦合

7、度等指标对文化遗产领域本体的设计复杂度进行测度。等构建了知识组织系统质量测量指标,对文化遗产领域常用的知识组织系统进行了深入的质量调查与分析。等提出识别提取领域本体共同概念组件的方法,支持对多个本体词表的理解与比较,并选择文化遗产领域本体词表开展社区聚类划分实验。在对、等模型的属性与关系分析的基础上,提出了围绕文化遗产对象的文化相关关系词表。贾君枝等利用本体映射技术实现对人物本体词表的聚合与映射,提供清晰明了的人物本体词表体系。夏翠娟提出本体应用纲要的设计方法和流程,并结合一体化本体融通模型为文化记忆资源的知识融通提供了方法和路径,一体化本体知识融通模型旨在厘清各类实体与概念体系之间高度抽象的

8、关系。苏新宁认为领域知识组织实施的科学与高效,在于对领域知识结构的认知和把握,需要探索知识单元间的关联结构、属分结构、交叉关系等,但领域知识结构认知的研究仍有待深入。目前,文化遗产领域本体的相关研究目前主要集中在领域本体设计与开发、本体互操作以及本体应用等方面,但对文化遗产领域本体的整体特征与领域知识分析的研究仍不够系统和深入,缺少对文化遗产领域概念体系与知识结构认知的研究。为此,本文拟基于对文化遗产领域本体的分析,从更高抽象层次构建整个领域的知识纲要,进而明确领域知识体系与知识结构,指导领域本体开发、领域知识组织与知识服务等。研究设计 总体研究框架 本文采用定量计算与定性分析相结合的方法,基

9、于领域本体分析文化遗产领域知识纲要,总体研究框架如图 所示。首先在对文献调研与专家咨询的基础上,确定本文的研究对象,收集领域本体与词表。其次,根据本体映射的思想,设计基于词汇语义相似度的概念相似度计算方法,形成领域的共享概念类簇。在此基础上,结合对领域本体结构与内容的人工分析,梳理领域本体的对象属性及其定义域与值域,归纳领域核心概念之间的知识关联关系,最终建构出文化遗产领域知识纲要。图 文化遗产领域知识纲要分析框架第 卷 第 期 年 月 文化遗产领域本体样本选择 随着语义网技术的发展与应用,文化遗产领域本体规模和本体复杂度快速增长。依据与文化遗产领域密切相关且应用较为广泛的筛选原则,本文结合文

10、献调研和专家咨询的方式,最终确定了 个具有代表性的文化遗产领域本体模型,如表 所示。从关联开放词表(,)等本体存储库或项目官方网站,获取样本本体的 或 编码文件。本文选取的领域本体主要包括文化遗产领域通用型本体,图书馆、档案馆与博物馆等机构常用本体以及项目应用型本体等,涉及文献、档案、文物、建筑、艺术、戏剧、图像志等多个主题。()通用型本体包括文化遗产领域广泛应用的 模型、模型等。其中,模型旨在将异构的文化遗产信息资源进行融合、交换和整合,为文化遗产领域信息的共同理解而制定的通用且可扩展的语义框架。欧盟数字图书馆 项目构建的 模型,在统一各机构数字资源的数据格式、元数据语义融合与语义关联方面发

11、挥着重要作用。()图书馆、档案馆与博物馆等机构常用本体包括书目本体、书目框架 与 模型、针对档案资源的整理与描述的“档案描述本体”()以及国际档案理事会“上下文记录本体”()等。同时,选取了文化遗产领域广泛使用的、等盖蒂词表的 本体。()项目应用型本体选取国外文化遗产资源建设领域比较知名的项目,包括意大利文化遗产知识图谱项目构建的 本体、欧洲数字文化遗产 项目构建的顶层本体模型。项目旨在利用数字技术,通过文化数字资源、公民观点和历史场景之间的互联,推动对欧洲历史和社会的反思与重新诠释。则是为描述文化机构与场所以及文化事件而制定的标准化本体模型。此外,还选取了描述与编码戏剧作品的戏剧综合本体 以

12、及描述图像与照片档案等视觉要素和视觉符号的“视觉表示本体”()等。表 选取的文化遗产领域本体编号前缀本体名称命名空间类数量 个对象属性数量 个说明 :书目记录的功能需求 :书目框架 :书目本体 :文化遗产领域信息整合、交换、共享和重用的概念参考模型 :欧盟数字图书馆项目制定的统一数据模型 :盖蒂词表本体 :文化对象的历史情境信息描述本体模型:欧洲数字文化遗产 项目顶层本体 :文化机构和文化事件本体:意大利文化遗产知识图谱本体 :档案描述本体:戏剧综合本体 :书目参考本体 :国际档案理事会档案本体,概念模型的本体表示 :视觉表示本体总计 注:本体的类数量和对象属性数量通过解析其本体编码文件进行统

13、计,包括了其复用的类或对象属性侯西龙,王晓光,翁梦娟 文化遗产领域知识纲要研究 图书情报工作,():领域共享概念计算方法 领域概念是知识纲要的基础要素。领域共享概念可以理解为领域本体建模时通常会考虑或涉及的维度和术语,本文主要通过跨本体之间的实体相似度计算来提取领域本体共享概念。具体是在本体的元素层面,通过本体类名称标签的语义相似度计算和聚类,发现文化遗产领域本体之间共同的核心概念。本体中类的相似度计算主要分为词汇相似度和结构相似度两大类型;由于文化遗产领域本体往往针对不同的描述对象或细分领域,本体之间的结构差异较大,本文主要探讨领域的共享核心概念和语义建模维度;因此,概念之间相似度计算主要采

14、用基于词汇的语义相似度计算方法,计算流程如图 所示:图 不同本体之间类的相似度计算流程 本体解析与预处理 利用 库对本体编码文件进行解析,获取本体包含的类、对象属性、约束与公理等。随后进行数据清洗与预处理,对类与属性的名称标签进行分词、去停用词、提取词干等处理。首先,利用正则表达式对字符串进行单词分割,并将本体术语的缩写改成单词全拼的形式。然后,对分割后的单词去停用词,并进行词干提取。由于英文单词会存在时态、单复数形式不同的情况,使用词干提取方法得到单词的词根。基于向量空间的相似度计算 由于本体间存在类复用与继承的情况,因此在计算不同本体之间类的相似度时,区分类之间的相等关系、父子关系和独立关

15、系 种类型。除了相等关系外,对于存在父子关系的情况也视为具有较高的相似度。本体类之间的相似度(,)计算方法如下:(,),相等关系,父子关系(,)独立关系公式()()类相等关系:(,:,)。其中,、代表不同的本体。通过类的资源标识符 和:陈述声明,判断两个类之间是否存在相等关系。()父子关系:(,:,)。其中,、代表不同的本体。对于复用外部本体的类并将其作为直接父类的情况,定义二者存在较高的相似度。()独立关系:类 的词向量表示为,类 的词向量表示为。计算二者之间的余弦距离作为类之间的语义相似度。本文采用基于 词向量模型获取类名称短语的向量化表示。作为非监督学习技术,考虑上下文的语义关系,将文本

16、内容的处理转化为向量空间中的向量运算,用向量空间中的相似度来表示文本语义的相似度。文化遗产领域知识纲要分析 文化遗产领域核心共享概念及其存在的多类型的知识关联关系构成了文化遗产领域的知识纲要。本节从本体视角研究领域核心共享概念与知识关联关系,构建文化遗产领域知识纲要。领域本体复用分析 复用现有的本体是构建本体的一个重要参考原则。本体复用不仅可以减轻本体设计工作,更重要的是有助于提高互操作性,避免表述的歧义及冲突,减少冗余。本体的复用可以体现在不同的方面,从复用方式角度可以分为外部本体导入式的“硬复用”以及参考本体中某些元素的“软复用”,具体又可以分为直接的实体复用、间接的本体模块复用、直接的本

17、体设计模式复用、间接的本体设计模式复用。依据用户第 卷 第 期 年 月关注点的差异,词表重用类型划分为词表层复用、概念层复用,两者通常结合在一起使用来实现对数据的描述与表示。本文对 个领域本体模型与外部本体或词表之间的复用情况进行数量统计和可视化。表 列出了被复用比例较高的本体或词表,图 所示是领域本体之间及与外部词表间的复用关系,节点大小表示被复用的次数。分析发现,文化遗产领域本体的复用情况大部分属于概念层面的直接实体复用,仅有很少的领域本体在设计时对其他本体的设计模式进行了借鉴,比如,本体利用极限设计方法借鉴了现有的本体设计模式。表 领域本体复用外部词表情况统计前缀本体名称命名空间统计 :

18、图 领域本体与外部词表间的复用关系可视化 通过对领域本体复用分析发现,文化遗产领域本体的形式化表示普遍采用 国际标准以保证本体的通用性和互操作性。除了采用、和 描述语言对本体进行形式化编码外,、和 元数据标准等通用型词表常被用于参考与复用。此外,文化遗产突出的时空特性也体现在本体复用中。文化遗产领域本体较多采用能够表示经纬度、高度等地理位置信息的 本体,以记录和保存文化遗产信息资源的空间信息,使用以事件为中心的 本体表示文化遗产的事件知识。同时,在文化遗产领域具有较强的影响力,被国内外众多机构与项目所采用。语义网中本体模型的使用呈现出长尾现象,少数的本体得到了较多的参考与复用,而大多数的本体较

19、少得到复用;这一现象也在文化遗产领域有所体现。此外,文化遗产领域本体之间的相互复用以及不同数据集之间的开放关联,促进了文化遗产领域信息资源的集成、共享与重用。侯西龙,王晓光,翁梦娟 文化遗产领域知识纲要研究 图书情报工作,():文化遗产领域核心共享概念 类是本体中重要的组成部分,是对同一类实体对象的抽象。文化遗产领域本体中类的设计,可以看作是对文化遗产对象语义描述的维度。针对同一领域,一般使用特定的术语来表示特定事物,虽然术语命名存在多元化的表示方式,但从概念术语的语义层面推测事物的相似性是一个很好的线索。因此,本文采用基于语义的相似度计算方法测度类之间的相似度,并根据相似度矩阵对所有的类进行

20、聚合;在此基础上,发现文化遗产领域的核心共享概念与本体建模维度,从宏观角度提供对文化遗产领域知识的认识与理解。本文根据公式()计算本体间类的相似度矩阵,将结果导入 工具进行可视化聚合,利用 进行剪枝,结果如图 所示。图中节点大小采用平均加权度,并利用模块度社区发现算法进行聚类。图 领域核心共享概念聚合结果可视化 从图 中的类簇可以看出文化遗产领域的核心概念主要包括领域对象与实体()、类型()、地点()、事件与活动()、文献()、概念()等。其中,人、事、时、地、物是文化领域本体建模的必备要素和基本建模维度,而文化遗产涉及的各类对象和实体成为语义建模时重点关注的内容。本文将文化遗产领域核心共享概

21、念归纳为以下 个方面:第 卷 第 期 年 月 领域对象与实体 对象和实体()是文化遗产领域本体建模的核心内容。从图 可以看出,对象与实体是图中最密集的区域,主要包括“概念对象”“物质对象”“信息对象”及“陈述性对象”等概念术语。由于文化遗产的内容表达与载体表现丰富,包含着众多复杂的对象类型,既包括具体的物质实体对象,也包括抽象的观念或思想的概念对象。因此,不同的本体模型在目标、场景、范畴、视角等方面表现出差异化与个性化的特征。如表 所示,主要针对文化遗产的信息资源的聚合,区分信息资源以及非信息资源。主要围绕文化遗产物质对象和场所等,并将图像、音视频等数字对象定义为创造性作品。则涵盖了信息对象、

22、概念对象和物质对象等更多的内容。此外,文化遗产领域对象和实体不仅指单一的实体对象,还往往以集合和组合的形式存在。在网络信息环境下,这些模型的共同特征是区分智力创造与物理或数字对象,兼从物理空间、数字空间对文化遗产领域对象进行知识表示与知识建模。表 文化遗产领域对象或实体的分类本体前缀()分类层级解释说明将“万物”分为“法律对象”与“人造物”,其中“人造物”细分为概念对象与物质人造物将图像与音视频对象等定义为“创意作品”,将文化实体分为文化遗产对象以及文化机构或场所模型区分信息资源与非信息资源,将人物、时间、物质实体与抽象概念等作为非信息资源对象 类型与概念 与文化遗产领域对象与实体紧密相连的是

23、“类型与概念”()。由于文化遗产对象的复杂性和多样性,需要明确指定不同事物所属的类型,比如,遗产类型、对象类型、用户类型以及事件类型等,其术语一般来自分类表、主题词表、受控词表等知识组织系统。语义网环境下,此类知识组织系统一般使用 提出的 作为表示知识组织系统的标准规范,来表达概念的基本结构和内容,实现不同应用程序间的数据共享。面向文化遗产领域进行本体建模时,类型与概念的设计能够充分表达文化遗产领域对象的多样性与差异性,从多个维度揭示领域知识系统之间的复杂的语义关系。国外在文物、艺术品和图像领域已经建立较为成熟的叙词表,包括盖蒂词表()、图像志分类系统、美国国会图书馆的 等,用于馆藏资源的编目

24、、分类、标注与检索。同时,国内学者也越来越关注文化遗产细分领域的主题词表建设问题,如敦煌壁画叙词表、中国文物纹饰叙词表等,以期实现对领域知识系统、全面、语义化的组织,进而促进资源互通与共享。时间与空间 时间与空间是人类社会发展及人类文明的两大基本描述维度,文化遗产往往具有明显的时间特征和空间特征。文化遗产的形成、发展与演变以及社会历史变迁、文化习俗演变等都体现出丰富的时空关联。时空数据建模技术在历史地理知识库、历史事件、非遗文化空间、家谱、考古等专业领域得到应用。地理信息系统与数字人文研究的深入融合解决了研究资料离散、时空分离的难题,促进了对文化遗产所承载的历史文化动态演变的时空分析与研究。因

25、此,时间与空间成为文化遗产领域本体建模的基本构成要素,空间信息的表示较多地复用 地理位置词表、地名本体、研究中心的地名词表()等,时间信息的表示一般采用时间本体、事件本体等。设计表达能力优秀、灵活可拓展的文化遗产时空信息的多粒度、多尺度的时空语义建模是实现对领域数据时空统一表达与知识组织的关键。事件与活动 事件是理解现实世界的基本语义单元,以事件为侯西龙,王晓光,翁梦娟 文化遗产领域知识纲要研究 图书情报工作,():中心的知识建模能够捕捉文化遗产的动态与演化信息。事件的构成要素主要包括时间、空间、事件参与者、行为以及伴随的状态改变等。文化遗产领域中的人物、实物、思想等物质对象或非物质对象都能够

26、通过事件产生关联,事件之间的逻辑关系对理解文化遗产的历史起到了重要作用。当前的文化遗产领域本体侧重于过去的物质和物理方面,而物理世界中的事件信息是理解文化遗产信息的核心,事件的明确形式化表示是整合文化遗产信息的关键要素。从认知角度看,事件也更符合人类的理解与思维习惯。因此,事件与活动是文化遗产特别是非物质文化遗产知识表示与语义建模的基本参考对象。文献与作品 文化遗产领域涵盖的古籍、档案、绘画、音乐、舞蹈等文学作品和艺术作品,往往以文献资源的形态存在,通常使用图书馆领域的书目元数据或模型对其进行语义描述和书目控制。全面记录并保持人类所有的文献,实现对文献的有效检索和广泛利用被认为是书目控制的基本

27、任务。在书目资源的规范控制与开放关联过程中,形成了较为丰富的模型与规范。模型采用“作品()内容表达()载体表现()单件()”层结构,该设计理念受到广泛的借鉴和复用。美国国会图书馆 模型设计中,核心类包括作品()、实例()、单件(),个核心类是 框架的基础和精髓。可以看出,“作品”()是书目数据模型中的核心概念与重要对象,作品类表达编目项或编目资源的概念本质,是抽象概括所得。在 家族模型基础上,国际图联提出书目资源的统一概念模型,旨在明确控制书目信息逻辑结构的一般原则,为书目资源的语义一致化、丰富化与集成化提供数据基础架构。代理者 一般译为“代理者”或“代理”,表示发生作用(或产生某种结果)的人

28、(或物)。对代理者的规范化描述使用比较广泛的是 词表,其定义了一套 词汇来描述用户、用户兴趣、用户关系和活动,对人物信息的描述较为全面。词表将“代理者”类分为“个体()”“团体()”和“组织()”个子类。模型则使用 表示代理者对象,将其细分为 与 两个子类。其中,人物作为文化的行为主体,是领域本体建模的核心要素,文化遗产领域人物实体在家族关系、社会关系、所属组织或工作角色、权利等方面表现出独特特征。此外,人物实体通常与人名规范库、人名传记数据库等关联开放数据集进行关联,以保证人物的规范性与一致性,包括、等。此外,从聚类形成的类簇来看,文化遗产领域涉及的术语与概念众多,领域知识建模的维度复杂且多

29、样,注重对文化遗产领域各类知识要素及其之间的语义关系的揭示,侧面反映出文化遗产领域涉及内容众多、知识内涵庞杂。文化遗产领域知识关联关系分析 揭示与利用知识关联是知识组织、知识管理和知识发现的起点。知识关联关系可以被抽象地认为是知识概念之间的逻辑关系。为实现对文化遗产领域知识纲要的构建,本文在计算得出的文化遗产领域核心共享概念的基础上,进一步分析领域概念之间的知识关联关系。文化遗产领域知识关联的丰富度 本体的对象属性定义了领域概念之间的关联关系。对象属性的丰富度和规范化,直接影响着对描述对象的语义揭示与表达。采用关系丰富度和属性丰富度指标侧面评价领域知识关联的丰富度和多样性。关系丰富度是定量评价

30、本体的常用指标,反映了一个本体中除“父子”关系之外的其他关联关系的丰富度,其计算公式为:公式()其中,表示本体中继承关系的数量,即表示类之间“父子”关系的数量;表示本体中非继承关系的数量,即对象属性的数量;一个本体的关系丰富度越接近,表示大多数关系是类 子类(即)关系,其结构更接近于分类法;相反,关系丰富度越接近,表示该本体中类之间的关联更加丰富和多样。属性丰富度用每个类定义的平均属性数量表示,其值越大,说明本体中类所传达的知识越丰富,计算公式为:公式()其中,表示所有类的属性数量总和,本文仅统计对象属性的数量,表示类的数量。领域本体的关系丰富度与属性丰富度计算结果见表。此外,对象属性同样也存

31、在复用情况,本文对文化遗产领域本体的对象属性复用情况进行统计分析,结果见图。第 卷 第 期 年 月表 领域本体的丰富度统计本体前缀对象属性复用的本体关系丰富度()属性丰富度()、均值 注:本体前缀及其命名空间:;:;:;:;:;:;:;:图 复用属性与自定义属性的统计 注:图 只统计了本体编码文件中出现的直接复用情况 对领域本体的对象属性进行统计分析发现,虽然本体的对象属性存在不同程度的复用,但总体上,自定义对象属性的数量普遍高于复用的对象属性数量。同时,本文选取的文化遗产领域本体的关系丰富度平均值为,对象属性丰富度均值为 ,可以看出文化遗产领域概念之间的关联关系较为丰富与多样,领域本体更倾向

32、于通过定义较为细化的对象属性来揭示概念间错综复杂的语义关系。因此,对领域本体对象属性的分析结果,反映出文化遗产领域事物和属性间的语义关系较为丰富,领域知识表现出复杂性与关联性等特征。文化遗产领域知识关联关系 领域知识关联反映了知识所代表事物本身存在的某种关联,是语义信息上的多角度、多层次的关联。而本体作为知识关联的表示模型,是对领域概念内涵及其关系的明确的、规范化定义与显性化描述。领域本体开发的重要工作就是获取核心概念以及组成概念的关系。领域本体通过定义对象属性、规则与约束来描述领域事物之间的各种关联关系,对象属性实质表达了领域知识之间的多重语义蕴涵。因此,本文在提炼文化遗产核心共享概念的基础

33、上,进一步梳理领域知识关联关系和知识结构,形成文化遗产领域知识纲要。根据对象属性的定义域和值域,绘制六大核心共享概念之间的知识关联关系(见图),连接线的粗细表示二者之间对象属性的数量。如图 所示,文化遗产领域知识概念之间存在多类型、多层次的知识关联关系,主要包括人物关系、事件关系、时空关系、类型关系及相关关系等,具体的关系类型及其涉及的核心概念与代表性对象属性详见项目网站(:)。()人物关系。作为知识主体的人在信息与知识的生产、传播与使用中占有重要的位置。对人物身份进行准确识别与确认,才能保证碎片化知识的有效整合和组织。人物关系细分为亲属关系与人际关系、个体与集体间的成员关系以及代理者的角色。

34、()责任关系。责任关系主要指代理者对其他事物的责任行为或负有的责任者角色。主要包含事件与活动的实施者、组织者、参与者等行为主体,物件的拥有者、创作者等责任主体。此外,在书目框架和书目本体中,责任关系还体现在作品、内容表达、载体表现、单件与代理者之间的责任关系,比如,作品由代理者所拥有、创作、制作、发行等。()事件关系。事件关系能够对实体的不同状态、演化发展过程进行描述。事件的内容、参与人员、时间与地点、原因等语义要素,能够与领域各类实体对象建立语义关联。事件关系主要包括人物个体的出生、结婚、死亡等人物生平事件,还包括领域物理实体的创建、管护、销毁等生命周期有关的事件活动。()时空关系。文化遗产

35、领域包含着众多与时空特征相关的信息,利用知识的时间空间的二重性可以刻画事物结构与状态的有效关联与演化过程。文化遗产领域概念实体间广泛存在时空关系,主要表现为“人、物与时空”的关系,具体包括事件与活动发生侯西龙,王晓光,翁梦娟 文化遗产领域知识纲要研究 图书情报工作,():图 文化遗产领域知识纲要的时间与地点,人物的人生轨迹与生命历程以及各类实体对象所处的时空环境。()类型关系。类型关系是描述事物间分类知识的基础,也是表达领域知识多层次、多刻面结构特征的关键。文化遗产领域事物往往存在多分类关系,归属于不同的类别。通过类型关系能够从不同角度描述领域蕴含的多个类别的知识。()书目关系。书目关系是书目

36、实体之间以某种方式发生关联所产生的特定关系,主要存在于书目框架中作品与作品、内容表达与内容表达、载体表现到载体表现之间的关系。书目关系被细分为等同关系、继承关系、描述关系、联系关系、整体与部分关系等,以揭示书目资源中较为细致的关系。此外,文化遗产领域知识关联还存在主题关系、包含关系、相关关系等类型;比如,文献与作品对其他事物的记录与描述关系,以及多个关联关系形成的复杂的主题关系与相关关系等。文化遗产领域知识建模的难点在于对人、事、时、地、物等之间复杂关系和情况的处理。因此,显式地揭示与表达语义关系日益成为知识建模与知识组织工作的重点。通过对领域核心概念间语义关系的梳理与分析,发现文化遗产领域知

37、识关联关系复杂多样,主要表现在“人与物”“人与事”以及“人与人”“物与物”等概念之间的知识关联。讨论 文化遗产领域知识表现出复杂性与语义异构 通过对文化遗产领域知识纲要的分析与计算,可以发现领域概念体系庞杂、知识内涵丰富且知识关联复杂。这也导致文化遗产领域本体之间存在较大的异质性,语义异构与语义互操作等问题给领域资源整合与知识融通带来了挑战。本体作为一种开放数据资源,领域本体开发与建设时也应该遵循 原则,包括可发现、可访问、可互操作和可重用。加强本体标准化建设,研究智能化的本体映射与对齐方法,增强不同本体间的语义互操作能力。此外,文化遗产领域本体的开发与语义异构问题的解决,一方面可以设计开发轻

38、量级的本体词表,发挥其在通用性、灵活性、适应性与易发现性等方面的优势,使其能够针对不同的对象与场景进行灵活的组配和扩展。遵循本体应用纲要的原则,保证本体模型的可重用性与一致性,同时满足应用需求的多样性与特殊性。利用一体化本体设计的思想与方法,保证知识建模的统一性和知识表示的一致性。另一方面,针对整个文化遗产领域,借鉴 采用基于社区的自底向上的本体建设模式,构建具有广泛术语覆盖的大型本体模型,为解决语义异构问题提供最终的解决方案。细化文化遗产领域知识建模的维度和粒度 文化遗产对象往往存在于特定的历史环境中,有着丰富的历史背景信息,涵盖了文学、历史、思想、意识形态等众多信息。然而,目前文化遗产领域

39、语义建模时,往往关注于文化遗产的物质层面,缺失了对其所处的特定情境知识的表示与描述,知识表示的角度第 卷 第 期 年 月单一、知识组织基本单元的颗粒度仍不够细化。此外,领域本体多采用以对象为中心的语义建模思想,不能充分揭示文化遗产的复杂网络结构形态与动态特征。从知识关联的角度,应构建多层次、多刻面、可变粒度的语义模型,以提高资源描述的灵活性及内容揭示的深度,实现碎片化、多维异构数据开放关联与跨领域的知识融通。加强对文化遗产领域知识关联关系的研究以及规范化的领域语义关系词表的建设。同时,文化遗产领域本体的建模维度和模式要体现出足够的灵活性,不仅要支持以对象为中心的知识表示,还要能够满足以事件或事

40、理逻辑为中心的知识表示方式。增强对文化遗产动态知识的表示 传统的语义建模大都属于先验型设计模式,很少对知识演化过程进行描述。文化遗产种类及其表现形态多元化,领域知识具有演化性、不确定性的特征,如何表示动态的而非静态的领域知识内容,尚缺乏普遍使用的方法。此外,随着对文化遗产相关研究的深入,文化遗产信息资源存在更新、修正等情况,如何保证信息与知识的可信度与可溯源性等,都是在文化遗产领域本体开发与知识组织时应该考虑的问题。基于动态与演化的视角,应考虑文化遗产领域知识内容与结构的状态变化过程,实现知识组织与语义描述方式由单一静态向多维动态转化。同时,构建文化遗产领域动态本体,着重刻画事物或概念的运动和

41、变化。构建融合时间与空间信息的演化知识网络表示模型,进而对文化遗产的历史脉络、社会记忆演化、文化空间等给予立体式的描述与揭示。此外,还应在数据层面综合运用数据溯源模型与方法,保证文化遗产动态信息的可溯源、可追踪与可信。结语 面向文化遗产领域的知识分析研究,是开展领域知识表示与建模、知识组织的基础。本文选取文化遗产领域具有代表性的本体,通过概念语义相似度计算识别领域核心共享概念;在此基础上,对领域知识关联关系进行梳理和归纳,提出并构建了文化遗产领域知识纲要。从本体视角计算与分析了文化遗产领域知识体系的基本结构与特征,以期为文化遗产领域知识体系提供更全面的理解与认识。研究发现,文化遗产领域核心共享

42、概念可以分为领域对象与实体、类型与概念、时间与空间、事件与活动、文献与作品、代理者等维度,同时也是设计开发各种领域本体和模型的基本参考。文化遗产领域知识关联关系较为丰富多样,以揭示文化遗产领域知识之间复杂的语义关系,但也为领域本体复用与语义互操作带来了挑战。本研究促进了对文化遗产领域本体的理解,为领域本体的建设开发与知识重用提供了理论依据和参考借鉴,同时为实现文化遗产领域知识组织与知识融通提供了基础和思路。然而,本研究也存在一定的局限和提升空间,由于文化遗产领域相关本体的数量众多、应用场景复杂,在研究对象选取的全面性方面有待进一步深入,异构本体之间的语义映射和语义相似度计算方法的准确性也有待优

43、化与完善。未来将深入细致地分析文化遗产领域知识体系,建立领域本体的术语库,为文化遗产领域知识组织提供智慧化服务。参考文献:朱晓峰,蒋旭牧,张卫 领域知识组织研究的历史演化与未来展望 情报资料工作,():,():马文峰,杜小勇 关于知识组织体系的若干理论问题 中国图书馆学报,():,王子舟 图书馆学的基本概念与核心概念 中国图书馆学报,():,:,():陈涛,张靖 本体服务中心框架设计与探索 图书馆杂志,():陈果,陈晶,肖璐 词汇语义链:领域分析视角下的词汇语义挖掘理 论 框 架 情 报 理 论 与 实 践,():,:,():,:,:,:,:,:,:,:侯西龙,王晓光,翁梦娟 文化遗产领域知识

44、纲要研究 图书情报工作,():,():贾君枝,崔西燕 人物本体词表之间的互操作及分类体系构建 情报学报,():夏翠娟 文化记忆资源的知识融通:从异构资源元数据应用纲要到一体化本体设计 图书情报知识,():苏新宁 面向知识服务的领域知识组织纵论 情报学报,():,():,():,:,:,:,:,:,:,():贾君枝 词表生态系统:构成要素及关联关系 中国图书馆学报,():,?,:,:,:贾君枝 资源描述中的词表重用类型与实现方式 中国图书馆学报,():,?,():潘有能,刘朝霞 本体映射技术在关联数据中的应用研究情报科学,():,:,:贾君枝,李衎 传统知识组织系统的关联数据化发展 数字图书馆论

45、坛,():王晓光,侯西龙,程航航,等 敦煌壁画叙词表构建与关联数据发布 中国图书馆学报,():苗孟荍,黄明玉,潜伟 中国文物纹饰叙词表构建探索 以兽面纹为例 自然与文化遗产研究,():高劲松,陈雅倩,付家炜 基于对象 事件的文物时空数据模型构建研究 现代情报,():,陈金菊,欧石燕,林泽斐 典型通用事件语义模型比较分析研究 现代情报,():,:,:陈涛,张永娟,单蓉蓉,等 书目数据语义化知识模型构建与关联研究 图书馆杂志,():范炜 书目资源的统一概念模型 论纲 文献与数据学报,():,:()?,():文庭孝,刘晓英,刘进军 知识关联的理论基础研究 图书馆,():,:,:,洪亮,马费成 面向大

46、数据管理决策的知识关联分析与知识大图构建 管理世界,():蒋勋,朱晓峰,肖连杰 大数据环境领域知识组织方法研究情报资料工作,():董桂存,姜广强 扩展 模型作品概念的分析与研究图书馆学研究,():李章超,何琳 文化遗产语义组织研究进展 图书情报工作,():,?,():,:,:李旭晖,秦书倩,吴燕秋,等 从计算角度看大规模数据中的知识组织 图书情报知识,():王娜,蒋智慧 动态本体构建的国内外研究现状综述 现代情报,():作者贡献说明:侯侯西西龙龙:确定研究方案,撰写论文;王王晓晓光光:提出研究问题,理论指导;翁翁梦梦娟娟:数据分析计算,论文修改。第 卷 第 期 年 月 ,:,:图书情报工作 年

47、重点选题指南 国家重大战略需求与图情档研究的作用与能力 图书馆学、情报学、档案学研究方法与技术创新 开放科学环境下科学交流范式的新变革 后疫情时代学术信息交流模式的变化与影响 新时代“信息资源管理”学科内涵与理论体系构建 新文科建设视角下“信息资源管理”学科战略规划 科技竞争背景下国家文献资源保障策略研究 全媒体数字资源中心的设计与研究 政府数字资源管理与长期保存 政府开放数据管理与隐私保护 开放科学数据、数据安全与个人信息保护 数字经济中的数据功能及作用机制 面向深度知识服务的拓展型信息资源标准与规范研究 基于数据挖掘的文献资源智能采选推荐算法研究 面向高价值专利培育的知识产权信息服务理论研

48、究与实践探索 面向交叉学科的跨学科知识组织方法与实践研究 国内外情报工作制度演变与我国情报工作制度创新 支持高水平科技自立自强的情报学理论方法 关键核心技术重大突破情报监测与识别理论与方法 聚焦创新驱动的核心关键领域情报分析服务研究 面向国家发展战略需求的安全情报研究 中美科技对抗下国家情报战略研究 智能情报与数据智能研究 国家总体安全观下应急管理信息服务及情报体系 重大突发事件下应急情报协同及舆情引导 高校图书馆在履行高校五大基本职能过程中的作用研究 智慧图书馆研究与应用实践创新 图书馆高质量发展的内涵与评价 图书馆大安全管理与应急服务 国际图书馆管理与服务发展趋势研究 图书馆多源数据融合及

49、治理 图书馆小数据与暗数据的价值评估与应用研究 教育新基建与图书馆建设 图情档机构重组与队伍的专业化研究 图书馆助力乡村振兴的策略研究 健康信息学的理论与方法 健康信息行为和个人健康信息管理 虚假健康信息治理 风险信息的识别、监测与传播 区块链与信息安全问题 面向全民全社会的数字素养能力与数字素养教育 图书情报与档案管理学科课程思政建设“元宇宙”场域下图情档学科的研究课题设置 文旅融合背景下图书馆与档案馆服务创新 数字人文与数字学术的新发展 面向文化遗产的数字人文研究 少数民族文献遗产建档研究 红色文献、红色档案与红色记忆研究 档案治理能力提升研究 档案计算学 数字出版与新型出版研究 学术评价改革与创新 数智赋能的创新评价 其他图书情报工作杂志社 年 月

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 品牌综合 > 临存文档

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服