收藏 分销(赏)

数字人文视域下图像知识复用语义模型研究_陈涛.pdf

上传人:自信****多点 文档编号:461414 上传时间:2023-10-11 格式:PDF 页数:10 大小:2.66MB
下载 相关 举报
数字人文视域下图像知识复用语义模型研究_陈涛.pdf_第1页
第1页 / 共10页
数字人文视域下图像知识复用语义模型研究_陈涛.pdf_第2页
第2页 / 共10页
数字人文视域下图像知识复用语义模型研究_陈涛.pdf_第3页
第3页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、106数字人文图书馆杂志(2023年第2期 总第382期)Library Journal(Vol.42 No.2)数字人文视域下图像知识复用语义模型研究陈 涛(中山大学信息管理学院)摘要 知识是人类认识的结晶,当知识转移时便产生了知识复用。数字技术高度发展的今天,图像应纳入数据流通环节,成为一种“活”的资源。论文从描述层面、组织层面和内容层面 3 部分构建了图像知识语义模型,分别对应图像的元数据复用、图像复用和内容复用。其中,内容层面的语义模型又涉及对象目标的内容、标签、方位和语义关联 4 个维度。在图像知识语义模型基础上,论文从“图像复用”“标注复用”和“混合复用”3 方面构建图像知识复用链

2、。案例分析部分从“图像复用”“研究独立”和“知识传承”3 个角度探讨了图像知识复用的优势,尽可能为图像资源的数字人文应用提供崭新的研究视角和可操作路 径。关键词 数字人文 知识复用 图像知识语义模型 关联数据DOI:10.13663/ki.lj.2023.02.013Research on Semantic Model of Image Knowledge Reuse from the Perspective of Digital HumanitiesChen Tao(School of Information Management,Sun Yat-sen University)Abstrac

3、t Knowledge is the crystallization of human cognition,and knowledge reuse occurs when knowledge is transferred.Today,with the high development of digital technologies,images should be incorporated into the data circulation link and become a“living”resource.The thesis first constructs the semantic mo

4、del of image knowledge from three parts:description level,organization level and content level,which correspond to image metadata reuse,image reuse and content reuse respectively.Among them,the semantic model at the content level involves the four dimensions of the object targets text,tag,region and

5、 semantic association.Based on the semantic model of image knowledge,the paper discusses the construction of the image knowledge reuse chain from“reuse of images”,“reuse of annotations”and“hybrid reuse”.The case analysis part explores the advantages of image knowledge reuse from the perspectives of“

6、image reuse”,“research independence”and“knowledge inheritance”,and tries to provide new research perspectives and operable paths for the digital humanities application of image resources.Keywords Digital humanities,Knowledge reuse,Image knowledge Semantic model,Linked data0 引言知识是人类认识世界的概念化表达,是人类活动的精

7、神遗产。辞海对“知识”的定义是人类认识的成果或结晶。中国大百科全书对“知识”的定义是人类认识的成果,是在实践的基础上产生,又经过实践检验的对客观实际的反映。人们在日常生活、社会活动、科学研究、生产实践中获得对事物的认识,其中可靠的成分即为知识1,知识可分为显性知识和隐性知识。通常以书面文字、图表和数学公式*本文系国家社科基金“智慧数据驱动的公共数字文化资源知识图谱构建与应用研究”(项目编号:21BTQ105)和中国图书馆学会重点项目“知识互联下的文化遗产图像多模态语义框架研究”(项目编号:2022LSCKYXM-ZZ-ZD002)的研究成果之一。陈 涛Chen Tao(图表扫码读取)陈 涛:数

8、字人文视域下图像知识复用语义模型研究Chen Tao:Research on Semantic Model of Image Knowledge Reuse from the Perspective of Digital Humanities107加以表述的知识,称为显性知识;而在行动中所蕴含的未被表述的知识,称为隐性知 识。知识复用是知识管理的重要环节之一,当知识从拥有它的人转移到使用它的人时,便产生了知识复用。“知识复用”意味着知识的转移是公开的、可重复的,并且对未来的知识使用者有益。与简单的知识共享有所不同,知识共享强调的是知识的传播,知识复用强调的是知识的再生产与重新发布。知识复用通常

9、包括知识获取、知识再加工、知识发布或传播 3 个步骤。通过复用,可以提高图像知识的利用效率,快速实现资源与知识的共 享。虽然人类社会有了文献就已经有了信息资源(Information Resources),但是图像资源作为数字人文中非文本资源的主要形式之一,蕴藏着大量的知识财富有待挖掘。信息技术发展的今天,图像不再仅仅作为某些资源的附属品,更多地是作为珍贵史料、珍稀手迹以及非物质文化遗产知识传承的重要载体。我们认为,图像知识复用不能仅仅认为是图像的复制,而应该从图像自身载体、图像元数据信息、图像蕴含知识等多方面进行考虑。本文将聚焦在图像资源的知识复用环节,试图厘清图像知识传播中的多种途径,并尝

10、试构建图像资源知识复用框架,尽可能为图像资源的数字人文研究探索新的应用方向,从而让知识得到合理、有效的传播与利 用。1 相关研究当前数字人文领域中,以图像资源为对象的相关研究正成为学术热点,目前学者对图像资源开展的研究主要集中于图像数据库、图像标注和数字人文众包等方面。其中,图像数据库主要关注知识共享与传播,图像标注和数字人文众包则聚焦于知识的生成与加 工。(1)图像数据库方面。陈亮指出图像数据库的发展与图像学研究相辅相成,高清图像库、技术图像库的建设,以及各种图像志索引和图像数据库的结合将对艺术史的发展起到重塑根基的作用2;颜佳等指出数字人文研究的兴起,引发了图档博等文化记忆机构构建图像数据

11、基础设施的需求3;杨敏等从内容描述层面、数据库建设技术层面、服务和版权层面深入分析,提出图像库建设呈现出深度融入互联网、跨学科融合以及图像的多维度语义标注趋势4。平台方面,如上海图书馆的中国近代文献图库结合先进的数字化现代技术处理手段,收录了中国近代时间跨度近 200 年的报刊图片数字资源,为人文学者开展学术研究提供了大量珍贵的图像资 源。(2)近年来,数字人文领域不少学者开展了图像标注方面的研究,陈涛等从“图像层面的元数据注入”“对象层面的内容抄录”和“语义层面的深度标注”3 个维度提出了图像资源多方位注释模型5;徐雷等结合开放标注协同框架(OAC),以情节、实体、活动、情境为核心,解决了叙

12、事型图像时空信息组织表达以及叙事模型和标注信息映射的问题6;王晓光等为了满足对文化遗产图像的细粒度标注和语义增强的新兴需求,设计了针对文化遗产图像的 DSA(深度语义标注)框架7;陈金菊等也从图像语义标注模型、图像语义标注工具、语义鸿沟问题以及解决该问题的方法出发,对图像语义标注研究进行了总结和分析8;王若宸等则针对非遗图像资源,提出了专门面向非遗图像语义信息的描述方法9;曾子明等根据用户认知特征制定图像语义结构化描述框架,提出了一种面向数字人文的图像语义描述模型10。(3)数字人文众包以聚集大众智慧为数字人文研究提供可分析资源,往往通过大众抄录实现图像的标注,因此常和人机交互相结合。伦敦大学

13、学院发起的边沁手稿抄录项目通过收录用户抄录的手稿全文数据,建设可全文搜索的边沁文集数据库11。考虑到手稿、古籍、家谱中由于书写笔记凌乱、风格迥异、形式复杂,OCR 识别正确率低,上海图书馆分别建设了元数据深度标引和全文著录的“历史文献众包平台”12。韩文婷等借助盛宣怀档案众包抄录项目,探讨了不同任务复杂度和领域知识水平下,众包抄录任务的绩效差异13。近年来,也有相关学者开展了知识复用方面的研究。如穆向阳采用模型构建和系统分析方法,对图书馆、档案馆、博物馆(LAM)的知识重用体系进行总体理论框架设计和相关具体方法探讨,构建了基于协同编辑关联表方法的 LAM 知识重用体系14;傅柱等构建面向知10

14、8数字人文图书馆杂志(2023年第2期 总第382期)Library Journal(Vol.42 No.2)识重用的设计过程知识语义模型,并利用本体对语义模型进行形式化表示15;李国洋对国外关于知识重用的研究进行了简单评述,并主要介绍了用于创新的知识重用(KRI)模型16;Jianyu Zhao 等将知识重用分为知识搜索、知识评估、知识重组和知识创造 4 个阶段,并围绕这些阶段开发了知识重用机制模型17。综上所述,图像标注和数字人文众包这两种方法都可以看成是图像知识的生产过程,而非知识的复用。图像标注可以看成是知识生产者单方面的知识发布过程,目的是图像深度知识的共享和传播,当多人对图像进行协

15、同标注,则成了众包;数字人文众包中的图像可以认为是一种知识协同加工过程,本质也是一种标注。与这两者有所不同,图像知识复用追求的是图像某个状态的知识被再次利用或被多次利用的过程。在针对知识复用的研究中,也很少有针对图像资源的知识复用方面的探 索。2 图像知识语义模型数字人文研究中大量的图像级应用都会对图像资源进行描述和组织,但仍然是传统的关系型存储方式,图像知识虽然可以复用,但开放程度不够,知识的共享与交互难度较大。万物互联时代加速了数据的融合与联动,也给知识的复用提出了新的要求。图 1 从描述层面(元数据)、组织层面(框架)和内容层面(注释)3 部分组织图像语义模型,横向描述层面和纵向内容层面

16、针对图像进行元数据和内容方面的语义组织,实现内容的复用;而垂向的组织层面则在建立图像之间的相互结构关系,实现图像的复用。每个层面的数据皆采用资源描述框架(RDF)进行结构描述,并用图数据库进行存 储。2.1 描述层面语义模型描述层面的知识主要是元数据信息,语义模型见图 2,主要是从元数据层面进行一些结构化的信息描述。需要注意的是,进行元数据描述时,描述的对象并非具体的图像本身,而是由一张图像或多张图像组织而成的藏品。常用的元数据描述字段有题名、创作者、创作时间、描述、收藏机构、分类、许可声明、页码、尺寸等,这些信息大量存在于各馆藏机构中,因此在实际应用时,可以直接从馆藏信息中进行转换和导入。这

17、里的元数据描述也将使用三元组方式进行存储,以支持后续的知识检索,对应的元数据描述见表 1。除了 iiif:metadataLabels 属性外,其他的属性都比较容易理解,这里不再赘述。论文的图像语义模型使用了国际图像互操作框架(IIIF),因 此 这 里 使 用 了 iiif:metadataLabels 对 象 属性(Object Property)来连接更多的元数据信息,连接的元数据信息通常使用空节点(Blank Node)来组织。扩展的元数据信息都将使用rdfs:label 和 rdf:value 来表示元数据字段名和取值,如可将作者、创作时间、分类信息描述为:a iiif:Manife

18、st;iiif:metadataLabels(_:genid1 _:genid2 _:genid3)._:genid1 rdf:value 韩干 xsd:string;rdfs:label 作者 xsd:string._:genid2 rdf:value 唐代 xsd:string;rdfs:label 创作时间 xsd:string._:genid3 rdf:value 国画 xsd:string;rdfs:label 分类 xsd:string.组织的元数据信息属于结构化的数据,采用图数据库进行存储,可提供检索、导出,乃至实现在线的对外关联链接服务,这些应用都是元数据层面知识复用的主要形

19、式。2.2 组织层面语义模型组织层面的知识主要是图像之间的组织,类似于 PPT 或者 PDF,如何对图像进行组织,形成特定的研究专题或者图册资源。更为重要的是,组织后的研究专题中的图像如何提供快速的图像复用,是组织层面需要探索和解决的问题。IIIF 提供了很好的图像组织、交互与共享模式。然而绝大多数 IIIF 的应用都只聚焦于资源的呈现,很少涉及图像资源的复用。我们基于 IIIF 框架,从图像复用层面进行了探索和陈 涛:数字人文视域下图像知识复用语义模型研究Chen Tao:Research on Semantic Model of Image Knowledge Reuse from the

20、 Perspective of Digital Humanities109思考,组织层面语义模型见图 3,该语义模型很好地描述了图像、画布和藏品三者之间的关系1819。图像(Image):图像通过图像服务器提供对外访问地址,每幅图像都拥有唯一的 URI 地址,图像在进行复用时并不直接下载图像,而是在线引用图像的 URI 地 址。画布(Canvas):图像在使用时,并不直接组织起来,而是通过画布(Canvas)形式进行连接。画布可以理解为 PPT 中的某一页,在画布中可以放置各种图像资 源。藏品(Manifest):一个或多个画布组织成藏品,即藏品中可以含有一幅或多幅图像,并按照一定的顺序(从左

21、到右、从右到左)组 织。语义模型中藏品 A 由图像 A、B、C、D 组成;藏品 B 由图像 C、D、E 组成;藏品 C 由图像 D 组成。由此可见,图像 C 同时存在于藏品A 和藏品 B 中;图像 D 同时存在于藏品 A、藏品 B 和藏品 C 中。图像节点用了不同的颜色表示图像来源于不同的机构,它们都通过各自的唯一 URI 接入到整个知识网络,形成不同来源图像的复用。需要注意的是,这里仅列出了部分核心节点和关系,详细的可以参考 IIIF 官方文 档。藏 品 和 画 布 之 间 使 用 属 性 iiif:hasCanvases 链接,画布和图像之间通过 oa:hasBody 属性链接,组织的语义

22、模型最终同样以 RDF 进行描述,并存储于图数据库中。复用时,将会获取不同图像的发布地址(URI),进行组织20。2.3 内容层面语义模型内容层面的知识涉及面较广,从对图像内容的抄录、注释到图像对象目标的分类、语义关联等。注释的知识主要针对图像中的对象而言,对象可以理解为图像中的具体目标,一匹马、一棵树、一个地名、一个人名,甚至一段文本、一个文字,只要是可描述的区域,都可以称之为对象。对象知识涉及“内容”和“分类”两种类型信息,内容方面知识可以包括对象的内容、色泽、纹理、形状等可见部分的阐述;分类方面知识为目标对象的分类和标签信息。对象的知识如果是对整个图像的描述,如质地,建议在描述层面(元数

23、据)中进行描 述。内容层面语义模型采用 W3C 推荐的 Web注释数据模型(WADM:Web Annotation Data Model),该模型见图 4。WADM 模型提供了一个可扩展的和互操作的框架,用于描述标注信息,同时可方便地在平台之间轻松共享批注。这样既可以有足够的丰富表达方式来满足复杂的标注需求,同时又能使结构保持足够简单。在实际实施中,为了实现图像知识的快速获取和更多知识的融入,在 WADM 模型基础上集成了语义知识关联模型和目标检测算法。WADM将注释目标(Target)和标注主体(Body)分离,分 别 用 oa:hasBody 和 oa:hasTarget 属 性进行组织,

24、标注主体又可分为内容(Text)和标签(Tag)两类。内容方面的知识可以通过OCR、抄录或众包形式产生,标签知识和目标方位信息可以通过目标检测算法来快速获取。目标检测通常通过深度学习算法,快速进行目标对象的批量自动定位和分类识别,并辅以人工校正完成。语义方面的知识可以通过关联数据和知识图谱相关技术将目标对象和开放的链接数据进行关联。内容层面产生和组织的内容、标签、方位、语义知识,都将采用 RDF 框架进行资源描述,这些知识都易于被其他图像进行关联,达到知识复用的目 的。3 图像知识复用模型从图像知识语义模型可知,图像的知识体系主要由元数据、图像、标注内容 3 部分组成,其中,元数据知识仅针对藏

25、品而言,而并非具体的每张图像。因此在对元数据进行复用时,需要从藏品层面进行整体复用,而不能通过对其中某张具体图像的复用来实现。与元 数据的复用不同,图像和标注内容则可以通过选择具体的图像来达到知识的复 用。3.1 图像知识复用链图 5 为图像知识复用链(流程),图像知 https:/iiif.io110数字人文图书馆杂志(2023年第2期 总第382期)Library Journal(Vol.42 No.2)识在传递过程中除了正常著录的元数据知识的获取复用外,还主要存在“图像复用”和“标注复用”两类方式。“图像复用”指复用其他藏品中的图像,这里只引用图像的 URI 地址以生成新的藏品,这些 U

26、RI 地址存在于组织层面语义模型中;“标注复用”指在引用图像 URI 地址的同时引用其已有的标注信息。基于这两类复用方式,共可产生 3 种复用链,即图 5 中链1、链 2 和链 3。下面详细探讨图像知识的 3 类知识复用流 程。(1)图像复用(链 1)图 5 中,“图像复用”流程由藏品 1、藏品 2 和藏品 3 组成。藏品 1 中的图像被藏品 2复用,复用后藏品 2 对图像做了标注,此时藏品 3 再次复用藏品 2 中的同一张图像。在此流程中,后续藏品并不记录该图像在前位藏品中的标注信息,也就是藏品 1 和藏品 2 中的标注信息,并不会在藏品 2 和藏品 3 中得到继承。此时,只复用图像,并不复

27、用图像中的附加知识。图 6 是多重复用的原理图,每一次复用都会将原始图像作为起点,不同复用之间呈现并列关系,互不干 扰。(2)标注复用(链 2)“标注复用”流程由藏品 1、藏品 5 和藏品 6 组成,在复用图像的同时也复用前位藏品中的标注信息。图 5 中,藏品 5 在复用图像后增加了一条标注信息,同时复用了藏品 1 中该图像的 2 条标注内容,共产生 3 条标注信息;藏品 6 在复用藏品 5 中的图像后,也增加了一条新的标注信息,此时将有 4 条标注 信 息。图 7 为“标注复用”原理图,该流程中,每一次的复用都以前一次复用状态为起点,向后顺延;此时,不同复用层级之间将呈现串行关系。复用标注时

28、,不能通过“引用”的方式,而需要重新生成“标注副本”,这样才能保证图像被复用后,还能使其在原来的藏品中保持原始状态,而不受后续流程藏品的影响。也就是尽管被其他藏品复用,但藏品 1 和藏品5 可以继续在之前的状态中进行研究(如新增的标注),但是新增的标注信息将不会自动传递到后续复用的藏品 中。(3)混合复用(链 3)“混合复用”综合了“图像复用”和“标注复用”,由藏品 1、藏品 2 和藏品 4 组成。藏品 2 复用了藏品 1 中的图像,此时不会带入藏品 1 中该图像的标注信息;藏品 4 则从藏品 2中进行了标注复用,此时会将藏品 2 中对该图像的标注信息带入藏品 4 中,而不会将藏品 1中的标注

29、信息写入藏品 4。相比链 1(123 流程),生成了新知识分支(124 流程)。当藏品4 中的图像再被其他藏品复用,如果选择“图像复用”将回归到链 1 的复用流程;如果选择“标注复用”将回归到链 2 的复用流 程。3.2 图像复用存储与获取图 8 为图像复用时信息的存储原理图,M1-M4 表示每套藏品,它们存于各自独立的图(Graph)中,藏品中包含的图像信息也一同存储。当图像复用时,将会在图像信息中存入复用来源(Manifest URI)地址。对于藏品 2(Graph M2)来 讲,将 存 入 三 元 组“:image dct:isPartOf:M1.”,表示该图像是藏品M1 中的图像。藏品

30、 M3 的存储中,同样记录“:image dct:isPartOf:M2.”,表示 M3 中的这幅图像来源于藏品 M2。当图像被复用多次后,将会记录每条完整的复用链以重塑图像的复用过程。在使用时,通过 SPARQL 检索可以快速地抽取出图像的复用路径,SPARQL 中?image_uri 为需要传入的图像地址。/查询图像 image_uri 所在的藏品(graph)地址和复用的上层藏品地址(manifest)PREFIX dct:SELECT DISTICNT?graph?manifest WHERE GRAPH?graph dct:isPartOf?manifest.结果将返回包含该图像地址

31、的所有 Graph地址,以及每个 Graph 里面的上一层 Manifest地址,进而根据当前节点将所有结果串联起来即形成图像的最终复用路径。表 2 为复用某幅图像的所有藏品节点,可以快速计算出某幅图像的使用次数,这里共涉及 5 个节点。同时,也可以复原出图像的复用路径,如当前节点为陈 涛:数字人文视域下图像知识复用语义模型研究Chen Tao:Research on Semantic Model of Image Knowledge Reuse from the Perspective of Digital Humanities111M1,可知上层节点为 M2,即复用路径为M1-M2;如当前

32、节点为 M3,复用路径为M3-M1-M2。4 案例分析与思考寒食帖又名黄州寒食诗帖或黄州寒食帖,此帖是苏轼撰诗并书,墨迹素笺本,横 119.5 厘米,纵 18.9 厘米,行书 17 行,129 字,现藏台北故宫博物院。此帖在书法史上影响很大,被称为“天下第三行书”,也是苏轼书法作品中的上乘。寒食帖中除了苏轼所作寒食诗二首外,更伴有大量的名家印章和题跋。这里以寒食帖为例探讨图像资源知识复用所带来的研究体 验。多维度图像智慧系统(MISS)正是按照文中所阐述的图像知识语义模型构建,寒食帖在 MISS 中进行了语义组织。图像描述层面的语义模型以元数据组织,该类模型较为常见,这里不做具体分析;组织层面

33、的语义模型以 JSONLD 形式组织到 Manifest文件中。图 9 为图像内容层面知识复用案例,其中图(a)为寒食帖诗作正文标记资源,这里标记了寒食帖中的两首诗作;图(b)为采用图像复用方式复用图(a)的图像资源后采用人工方式进行了部分印章标注,从这里可以看到此时并没有将图(a)中标记的诗作正文信息继承到该版本;图(c)为采用标注复用方式复用图(a)的图像资源后进行了题跋标记,复用时将图(a)中的诗作正文标记信息继承到该版本。至此,图(a)到图(c)共产生了寒食帖的 3 个研究版本,这些不同研究版本之间的深层关系如 下:(1)3 个研究版本中使用的图像只有一份,即图(b)和图(c)在研究时

34、,并没有复制或修改图(a)中的原始图像,而只是将图(a)中的图像 URI 进行了引 用。(2)依据文中设计的存储机制,每条标注信息都存于独立的 Graph 中,即图(a)的诗作存于 2 个 Graph(共 2 首诗);图(b)中的印章标注则存于 9 个不同的 Graph(共标记 9枚印章);图(c)中的题跋信息则存于 10 个Graph 中(共 10 处题 跋)。(3)不同的版本为继承关系,相同的标记也需要存于不同的 Graph,也就是图(c)中的诗作部分标记和图(a)中的诗作标记需要存储于不同的 Graph 中。这样的好处在于,当图(c)中的诗作知识进行修改后,并不影响原始图(a)的内 容。

35、史学研究者在研究时,可以根据不同需要去复用不同的研究版本,如研究诗作时,可以复用图(a),研究题跋信息的学者可以复用图(c)。采用这样的设计和存储机制主要出于以下3 点考 虑:(1)图像:复用,而非复制。不同研究版本之间使用的图像为同一幅底图,进行不同专题研究时,都是在线复用图像的唯一地址,而不是去复制图像本身。这样从图像源头保证了图像版本的一致性与权威性,同时又由于使用的是图像的 URI 地址,因此可以实现不同机构之间图像的唯一发布与共享,从而可以将图像看成是网络中参与流通的数据 之 一。(2)研究:独立,而非孤立。对不同研究涉及的相同注释内容,采用了不同的图(Graph)进行存储,隔离了相

36、同内容在复用时的互相牵连,从而保证每个研究版本的独立性和多态性。当对复用后的资源进行变更时,并不改变原始资源的知识状态。但是,独立并不等于孤立,我们知道这些知识在复用时,各自记录了传递的来源路径,从而保证了知识的可回溯 性。(3)知识:传承,而非传播。知识传播是为了让某些知识被更多人所认知,而知识传承除了传播外,还强调了知识的继承与发展。继承保证了知识传播的共性(即一致性),而发展则同时可以兼顾不同学者对知识理解的个性(即差异性)。我们认为,文化是多元的,认知也应是多元的,对图像资源的认知和理解并非 http:/ http:/ 总第382期)Library Journal(Vol.42 No.

37、2)简单的判断题或者单选题,而应是在更为广阔的空间中进行探 讨。5 结语图像资源是数字人文研究中不可或缺的数字资源类型之一,存量巨大的图像资源有着无限的研究价值和传播价值。图像资源的组织、呈现、语义化建设、图像标注等的研究与探索,都是为了更好地促使图像资源在数字人文领域发挥最优价值,相较于其他非结构化数据信息,图像资源具有天然优势。虽然当前对于纷繁复杂的不同种类图像的标注、元数据模型设计尚未形成统一标准,但对于知识复用的探讨仍具有前瞻性意 义。本文基于关联数据、IIIF、本体等语义技术,以图像资源为研究对象,提出的图像知识语义模型已应用于上海图书馆历史人文大数据平台、上海交通大学民国报刊、华东

38、师范大学数字人文支撑平台等。语义模型基础上提出的“图像复用”“标注复用”“混合复用”3 类图像内容层面的知识传播模式,具有一定的研究价值和可扩展性。整个图像知识语义模型采用了图像共享交互的理念,保证了图像本身的唯一性;同时又采用独立存储的方式确保了资源研究的独立性。图像知识语义模型不仅可以作为数字人文图像资源建设的基础设施存在,也可以作为学者进行图像资源研究的支撑环境。当然随着应用需要的扩大和技术的不断发展,可能会出现更多的知识复用模式,后续仍需持续跟踪研 究。参考文献 1 陈恒.知识史研究的兴起及意义 N.光明日报,2020-12-21(14).2 陈亮.数字人文中的图像数据库和图像志库引典

39、 J.美术观察,2021(4):2426.3 颜佳,杨敏,彭梅.面向数字人文的图像数据基础设施建设研究以我国图档博领域为视角 J.图书馆,2021(5):5158.4 杨敏,夏翠娟,颜佳.数字人文视域下图像库建设的现状分析与趋势前瞻 J.图书馆杂志,2021,40(4):9099.5 陈涛,单蓉蓉,李惠.数字人文中图像资源的语义化标注研究J.农业图书情报学报,2020,32(9):614.6 徐雷,王晓光.叙事型图像语义标注模型研究 J.中国图书馆学报,2017,43(5):7083.7 Wang X,Song N,Liu X,et al.Data modeling and evaluatio

40、n of deep semantic annotation for cultural heritage imagesJ.Journal of Documentation,2021,77(4):906925.8 陈金菊,欧石燕.数字图像语义标注模型比较与分析 J.图书情报工作,2018,62(6):116124.9 王若宸,朱学芳.面向非物质文化遗产的图像语义描述研究J.信息资源管理学报,2021,11(2):128136.10 曾子明,周知.面向数字人文的图像语义描述模型研究 J.情报理论与实践,2018,41(1):116121.11 Tim Causer,Valerie Wallace.B

41、uilding a volunteer community:results and findings from Transcribe BenthamJ.Digital Humanities Quarterly,2012,6(2):128.12 贺晨芝,张磊.图书馆数字人文众包项目实践 J.图书馆论坛,2020,40(5):39.13 韩文婷,宋士杰,赵宇翔,等.数字人文类众包抄录平台中任务绩效的影响因素研究基于任务复杂度与领域知识视角J.图书与情报,2019(3):7384.14 穆向阳.图书馆、博物馆、档案馆合作领域知识重用策略与方法研究 J.图书馆理论与实践,2019(6):106112.

42、15 傅柱,王曰芬,丁绪辉.面向知识重用的设计过程知识语义表示研究 J.数据分析与知识发现,2019,3(6):2129.16 李国洋.国外知识重用研究述评及新进展 J.情报科学,2006(5):777782.17 Jianyu Zhao,Xi Xi,Baizhou Li,et al.Research on radical innovation implementation through knowledge reuse based on knowledge flow:A case study on academic teamsJ.Information&Management,2020,57(

43、8):103260.18 IIIF Presentation API 2.1.1 EB/OL.2021-04-12.https:/iiif.io/api/presentation/2.1/.19 Web Annotation Data Model EB/OL.2021-02-26.https:/www.w3.org/TR/annotation-model/.20 陈涛,刘炜,孙逊,等.IIIF 与 AI 作用下的文化遗产应用研究新模态 J.中国图书馆学报,2021,47(2):6778.陈 涛中山大学信息管理学院,副教授。研究 方向:数字人文、知识图谱。E-mail: 广东广州 510006(

44、收稿日期:2022-01-21 修回日期:2022-06-30)附 录图书馆杂志(2023年第2期 总第382期)Library Journal(Vol.42 No.2)图 2 描述层面语义模型图 1 图像知识语义模型框架图 3 组织层面语义模型图 4 内容层面语义模型陈 涛:数字人文视域下图像知识复用语义模型研究Chen Tao:Research on Semantic Model of Image Knowledge Reuse from the Perspective of Digital Humanities 图 8 图像复用存储设计图 5 图像知识复用链图 6“图像复用”原理图图 7

45、“标注复用”原理图附 录图书馆杂志(2023年第2期 总第382期)Library Journal(Vol.42 No.2)表 1 藏品元数据字段表属 性名 称描 述rdfs:label题名图像组织后的藏品名称dc:description描述藏品描述信息dct:rights许可声明藏品使用声明iiif:attributionLabel馆藏机构藏品馆藏机构名称foaf:logoLogo馆藏机构 Logordfs:seeAlso参考参考(链接)其他资源iiif:metadataLabels元数据信息更多的元数据信息表 2 图像复用节点地址Graph(当前节点)Manifest(上层节点)http:

46、/localhost:8080/sas/manifest/kuua5f6lw9jmxrsefvf-hgmcr6mqmzmjx.json(M1)http:/localhost:8080/sas/manifest/tdvv9s96jut21a8c6em-nmftinayst3qa.json(M2)http:/localhost:8080/sas/manifest/9383jmbh66t71wodmp-p5fn49iy8jqxd4.json(M3)http:/localhost:8080/sas/manifest/kuua5f6lw9jmxrsefvf-hgmcr6mqmzmjx.json(M1)h

47、ttp:/localhost:8080/sas/manifest/kom63ybfavwx7-ph7pslffqz8k7b4f4t4.json(M4)http:/localhost:8080/sas/manifest/kuua5f6lw9jmxrsefvf-hgmcr6mqmzmjx.json(M1)http:/localhost:8080/sas/manifest/twxn812u3fy8m-g2714uykbb7jdlu9on4.json(M5)http:/localhost:8080/sas/manifest/9383jmbh66t71wodmp-p5fn49iy8jqxd4.json(M3)图 9 寒食帖图像资源知识复用图解

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服