收藏 分销(赏)

本体在村级数据资源共享中的应用.pdf

上传人:自信****多点 文档编号:886721 上传时间:2024-04-02 格式:PDF 页数:6 大小:1.35MB
下载 相关 举报
本体在村级数据资源共享中的应用.pdf_第1页
第1页 / 共6页
本体在村级数据资源共享中的应用.pdf_第2页
第2页 / 共6页
本体在村级数据资源共享中的应用.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、引用本文格式薛晓娟,邸小康,王剑,等本体在村级数据资源共享中的应用 J农业工程,2023,13(7):29-34 DOI:10.19998/ki.2095-1795.2023.07.005 XUE Xiaojuan,DI Xiaokang,WANG Jian,et alApplication of ontology in village-level data resource sharingJAgricultural Engineering,2023,13(7):29-34本体在村级数据资源共享中的应用薛晓娟,邸小康,王剑,王晓丽,王淼,程旭,唐朝,王彩虹(北京市数字农业农村促进中心,北京 1

2、00101)摘要:针对多源、异构农业农村数据资源难以有效相互理解和共享利用的问题,提出了一种基于本体论的数据组织方法。从村级数据资源组织和共享的角度出发,探讨构建所需本体的方法路径。基于案例试验,阐述了如何将本体应用于村级数据资源的组织、共享,以及将基于规则的本体推理应用于村级数据资源开发利用,最后提出了本体在农业农村数据资源管理、共享、挖掘中的应用场景展望。关键词:本体;村级数据资源;数据共享;本体推理中图分类号:S126文献标识码:A文章编号:2095-1795(2023)07-0029-06DOI:10.19998/ki.2095-1795.2023.07.005Application

3、of Ontology in Village-level Data Resource SharingXUE Xiaojuan,DI Xiaokang,WANG Jian,WANG Xiaoli,WANG Miao,CHENG Xu,TANG Chao,WANG Caihong(Beijing Digital Agriculture Rural Promotion Center,Beijing 100101,China)Abstract:Aiming at effectively understanding,sharing and utilizing multi-source and heter

4、ogeneous agricultural and rural data re-sources,a data organization method was proposed based on ontologyFrom perspective of organizing and sharing village-level data re-sources,method path for constructing required ontology was exploredBased on case experiments,how to apply ontology to organiza-tio

5、n and sharing of village level data resources,as well as how to apply rule-based ontology reasoning to development and utilization ofvillage level data resources was elaboratedFinally,it proposed an application scenario outlook for ontology in management,sharing,and mining of agricultural and rural

6、data resourcesKeywords:ontology,village-level data resource,data sharing,ontology-based reasoning 0引言随着信息技术在农业农村经济社会发展中的应用推进,农业农村数据资源整合共享的重要性日益显现。数字乡村发展战略纲要数字农业农村发展规划(20192025 年)等文件均指出,要推进数据融合、挖掘与应用,推动农业农村基础数据整合共享。未来越来越多的多源、异构的数据汇聚后,如何有效地理解、组织和应用,是当前面临的一个难题。本研究应用计算机科学领域的本体论探讨解决方案。本体是共享概念模型的明确形式化规范说明

7、,是用人和计算机都可以识别的术语及关系描述某一领域内的实体、概念、属性,以及概念实体之间的相互关系1。通过本体形式化、规范化的表示,不同的数据设计者和使用者可以对数据的表达和使用方式达成共识,实现知识融合和数据融合。WACHE H 等2提出了利用本体将不同异构的数据源中的数据/信息有效整合。这种方法在生物信息学和生物医药学领域已得到大量的实践,在大数据整合与复用的过程中发挥着日益重要的作用3。另外,在交通异构数据集成、政务异构数据集成等领域也有相关研究4-5。在农业领域,联合国粮农组织(FAO)自 2001 年开始建设农业本体论服务(AOS)项目,在多语种农业叙词表的基础上构建农业本体。本体在

8、农业信息分类、信息库和知识库构建、智能搜索引擎研发及信息协同服务等方面具有广泛的应用前景6。已开展的研究主要应用在农业科研文献检索、农业生产知识服务系统、农业知识库构建7-11。收稿日期:2023-03-03修回日期:2023-06-15作者简介:薛晓娟,高级工程师,主要从事农业信息化研究E-mail:邸小康,通信作者,工程师,主要从事农业信息化、农村创新创业及社会化服务体系有关数据监测、分析研究E-mail:第 13 卷 第 7 期农业工程Vol.13No.72023 年 7 月AGRICULTURAL ENGINEERINGJul.2023本体在数据融合、共享、检索和分析等方面具有重要的应

9、用价值。本研究将本体论应用于村级数据资源的组织、共享和利用,通过行政村本体的案例试验,探讨构建所需本体的方法路径,提出基于本体的村级数据资源整合方法,以及基于本体推理进行数据利用和知识共享。1领域本体构建方法以斯坦福大学提出的七步法为指导,结合领域本体构建案例所采用的具体方法,以行政村本体为例,探讨构建村级数据资源整合共享所需本体的方法。1.1确定本体专业领域和范畴 1.1.1构建本体目标以行政村本体为例,是对行政村数据资源的模式提练,服务于农村政务部门对村级数据资源的组织和管理,应用于各方面村级数据资源的整合和共享。1.1.2本体所要覆盖的领域范畴从根本上来说,本体构建是一个从客观世界信息世

10、界计算机世界的映射过程。其构建的根本原则即,本体是关于真实世界中的现实模型,本体中的概念需要反映这些现实。行政村是依据中华人民共和国村民委员会组织法设立的村民委员会进行村民自治的管理范围,是我国基层群众性自治单位。因此,行政村本体应是描述行政村及其管理范围内的各类管理对象的特征和内在逻辑关系的模型,其范畴是行政村本级及其基本属性,和行政村空间内的人、地、财、物、事等方面中市级政务部门关注的实体,以及它们之间的关系。1.1.3本体中信息所要解答的问题本研究的行政村本体,是要探讨在计算机世界中如何描述行政村及其空间内的事物,支撑从数据层对行政村各方面特征的刻画。1.2考查复用现有本体的可能性在领域

11、本体方面,已有的研究多是农业领域的,并且构建的本体未在网络空间共享。在可能转化为本体的资源(如已有文献多采用的主题词表、斜词表等)方面,目前搜集到的可利用的是北京市地方标准农村基础信息数据元系列(DB11 T 699.162010),该标准对农村基础信息数据单元 12 项属性的定义详尽,包括定义、语境、数据类型和同义名称等,但缺乏关系的描述,可作为主要的术语提取来源。综上所述,未找到可直接复用的本体。1.3列出本体中的重要术语按照七步法,本体构建的第 3 步是要列出一个想要阐述的术语清单,并明确具体要讨论哪些术语。在以往国内的研究中主要的术语来源是叙词表、主题词表。关于行政村目前尚未找到可用的

12、叙词表或主题词表。而本研究要满足的是农村政务数据资源管理的需要,因此进一步考虑从政策文件、信息资源分类体系、相关数据标准或统计数据中提取。资源分类体系方面目前农村领域仍没有权威的论述,政务信息资源目录体系(国标)中仅有城乡建设、农业两个相关主题。数据标准方面目前较全面和权威的是北京市地方标准农村基础信息数据元,包括个人基础信息、组织基础信息、经济基础信息、社会基础信息和自然资源基础信息。因此,最终采用的提取术语的来源包括:北京市地方标准农村基础信息数据元、北京市农业农村局的机构职能及发文、北京农村年鉴、中国农村统计年鉴及第三次全国农业普查中行政村普查指标。1.4定义类和类的等级体系采用自顶向下

13、的方法定义类的等级体系,从上述查阅得到的术语清单中,首先按照客观性原则,对照客观事物初步提取关键类,包括行政村、农村人员、基层组织、农业经营主体、农村资源、农村基础设施和农村经济,其次定义这些关键类之间的关系,如行政村管理农村人员、基层组织和农业经营主体位于行政村、行政村拥有村集体资源和农村基础设施、行政村产生农村经济。形成的核心概念模型如图 1 所示。图 1核心概念模型Fig.1 Core concept model scheme 在核心概念模型的基础上将清单中的术语进行层次整理,填充到概念体系中。如自然资源、人文历史资源是农村资源的子类,土地资源、土壤资源、林木资源、农村能源和气候资源等是

14、自然资源的子类,特色人文活动、特色建筑与遗址遗迹、特色特产与工艺是人文历史资源的子类,农村生活性基础设施和农村社会发展基础设施等是农村基础设施的子类,公厕、户厕、太阳能浴室、污水处理站、供水站、街坊路、照明灯杆和照明灯具等是农村生活性基础设施的子类,农村义务教育、农村卫生、农村文化基础设施等是农村社会发展基础设施的子类等。30 农业工程信息与电气化 1.5定义类属性由于村级数据资源的覆盖面较广,需要根据实际的需求展开,因此仅以行政村本身的属性为例进行定义,包括统计用区划代码、常住户数、常住人口、户籍户数、户籍人口、劳动力人口、村域面积、地理位置、地形地貌、政策称号(全国特色景观旅游名村、中国传

15、统村落、北京最美乡村等)及村庄类型(集聚提升类村庄、城郊整合类村庄、特色保护类村庄、搬迁撤并类村庄等)等。在实际应用中,可以根据需要对类的属性进行扩展。1.6定义属性限制即定义属性的值类型(字符型、数字型、布尔型、枚举型)和值域。如统计用区划代码是字符型,只能有唯一值,政策称号可以有多个字符型的子属性等。最终定义的行政村属性及其限制如图 2 所示。图 2属性及其限制Fig.2 Object properties and restrictions scheme 1.7创建实例建立概念层模型后,可以创建相应的实例,图 3为一个简单的实例及实例层与概念层关系的展示。从实例层来看行政村本体的实例化是关

16、于每个行政村的知识图谱。2基于本体的村级数据资源共享应用围绕如何将上述构建的行政村本体应用于村级数据资源整合共享进行探讨,从方法论和案例说明两个维度展开,一是整体阐述基于本体的村级数据资源整合的方法,二是以美丽休闲乡村创建相关数据为例具体说明如何应用本体进行数据整合和共享,以及如何通过基于规则的本体推理进一步应用数据整合成果得到新的知识和实现知识共享。2.1基于本体的村级数据资源整合共享方法基于本体的数据整合是通过建立数据源到本体的映射关系及不同本体之间的集成或映射来建立数据源间的统一语义关联。一般有 3 种方式:一是基于单本体的整合,二是基于多本体的整合,三是基于全局局部本体的整合。抽取各个

17、数据源之间的共同知识建立一个全局顶层本体,各数据源可以拥有自己的本体,称为局部本体,局部本体可以在全局本体的基础上根据自己的需要扩充,只需要建立局部本体与全局本体之间的映射,实现本体之间的互操作。鉴于村级数据资源来自多个系统或其他来源,覆盖面广,同时为确保局部本体之间的互操作,本研究认为村级数据整合宜采用全局局部本体的方式。主要环节包括村情全局本体构建、数据映射和局部本体构建、本体映射和实例融合。2.1.1村情全局本体构建所构建的行政村本体旨在应用于村级数据资源整合共享,正是这里所指的村情全局本体,其中定义了行政村与各类反映村情的要素之间的关系,不同的数据源可以对应到不同的村情要素,不同的要素

18、可以有各自的局部本体。2.1.2数据映射和局部本体构建首先需要建立数据源到本体的映射,对于结构化的村情数据,如各涉农信息系统的数据库中与行政村相关的表单、以表格形式存储的数据,最简单的方式是直接映射,即直接从数据源中提取数据字典并构建相应的本体。数据库的表作为对应的本体中的类,表的列作为属性,表的行作为实例,表的单元格值是属性的字面量。另一种方式就是自定义映射,建立逻辑表存储从关系型数据库到本体元素的映射规则,并通过逻辑表从数据库中检索获取数据。对于半结构化数据,如百度百科中关于村的介绍,其中包含标签来分离语义元素和保持层次结构,因此可以直接转化为类 图 3概念层与实例层关系Fig.3 Rel

19、ationship between concept and instance 薛晓娟等:本体在村级数据资源共享中的应用 31 的属性。对于非结构化数据源,如村庄报道等文本,则需要实体识别,从自然语言中提取实体和属性。总之,不同来源、不同结构的村情数据都可以映射到各自的局部本体上。2.1.3本体映射和实例融合将村级数据资源映射到局部本体后,一方面需要通过本体映射实现全局本体和局部本体概念层的融合,通过唯一的行政村代码建立局部本体和行政村本体的映射关系;另一方面需要进行实例层的融合。这一步需要对数据源进行处理,包括实体消歧和实体统一。实体消歧是对实例同名不同意的处理,如同样的村名实际是两个不同的村

20、;实体统一是对同意不同名的处理,如同一个村在不同数据源中以不同的名称存在,可能是全称、简称、曾用名和同音字等情况。2.2基于规则的本体推理和知识共享以美丽休闲乡村判定场景为例。基于本体所包含的丰富语义,可以进行一系列推理,获得额外的信息。基于本体整合后的数据资源可以通过推理得到原有分散数据资源所难以产生的新知识,实现“数据+”,使数据共享应用的价值得到提升。同时用于推理的规则可以形式化地存储在本体中,随着本体的应用得以共享,从而实现知识的共享。结合北京“十百千万”畅游工程中创建百余个美丽休闲乡村的场景,对如何基于本体组织村级数据资源和如何基于规则进行本体信息推理和共享进行具体说明。假设制定了若

21、干判定标准,提取美丽休闲乡村创建村。假设拥有 1 家以上的精品民宿或星级休闲园区的最美乡村获奖村为美丽休闲乡村创建村(此处为举例说明,不考虑该标准是否合理)。2.2.1数据资源现有的相关数据源有来自网络整理的精品民宿数据、来自休闲农业协会的星级休闲园区数据、来自北京美丽乡村网站公布的最美乡村获奖村名单 3 个数据。这些数据已经整理为结构化表格。具体结构如表 1、表 2 和表 3 所示。2.2.2数据映射以案例中的星级休闲园区数据为例,转化为本体则有一个星级休闲园区类,表格的列所在区、所在乡镇、所在村、名称和地址等则作为星级休闲园区类的属性,表格的每一行就是星级休闲园区类的具体实例。星级休闲园区

22、类局部本体如图 4 所示。2.2.3本体映射案例中的数据源转化形成的本体中,星级休闲园区、精品民宿可以作为农业经营主体的子类,与行政村类的关系通过对应的行政村实例进行映射,最美乡村获奖村则转化为行政村类的属性。本体映射示意如图 5 所示。2.2.4本体推理在行政村下建立子类“美丽休闲乡村创建村”,定义拥有 1 家以上精品民宿或 1 家以上星级休闲园区,并且获得最美乡村称号的村为美丽休闲乡村创建村。即条件 1:行政村.政策称号 最美乡村;条件 2:行政村精品民宿.count1;条件 3:行政村星级休闲园区.count1;满足(条件 1条件 2)OR(条件 1条件3)的行政村美丽休闲乡村创建村。当

23、在行政村类下建立一个实例“房山区周口店镇黄山店村”,定义其政策称号属性值为“最美乡村”,在农业经营主体类下建立“姥姥家”“云上石屋”“桃叶谷”和“黄栌花开”4 个实例,与黄山店村建立关系“位于”,之后启动 Protg中的 reasoner 推理器,可以自动推理得出黄山店村是美丽休闲乡村创建村的一个实例。从以上案例可以看到,基于本体将数据资源一一映射、整合关联之后,通过快速地在本体中定义规则,实现工作人员所设定的假设,再运用基于规则的本体推理,就可以获得原本需要通过查询多张表逐一分析得到的结果,并且这些规则可以存储在易于共享使用的本体中,使得工作人员的知识能够共享和复用。表 1精品民宿示例数据T

24、ab.1 Sample data of boutique rural homestay序号所在区所在乡镇所在村名称地址特色1怀柔区九渡河镇花木村水源别院怀柔九渡河镇花木村200 多年的核桃树2怀柔区九渡河镇九渡河村九度山居怀柔九渡河镇九渡河村3怀柔区九渡河镇撞道口村水源红瓦怀柔九渡河镇撞道口村镇虏关长城脚下 表 2星级休闲园区示例数据Tab.2 Sample data of star rated leisure park序号所在区所在乡镇所在村园区名称详细地址北京市星级全国星级1朝阳区金盏乡楼梓庄村蓝调庄园朝阳区金盏乡楼梓庄村南552朝阳区金盏乡皮村中农春雨休闲农场朝阳区金盏乡皮村东553朝阳

25、区崔各庄乡圣雅圣露国际酒庄朝阳区崔各庄乡奶东工业园5 32 农业工程信息与电气化 3应用场景展望 3.1应用于农业农村数据资源管理和共享目前农业农村领域数据资源平台多采用传统的标准分类法,即先制定标准的目录分类体系,再将所需要分类的数据放入目录体系中,这种分类方式相对固定不够灵活,在数据检索方面也不能很好地满足用户需求,并且仅实现数据的汇集,尚未实现数据的融合,数据的价值也就得不到充分体现。引入基于本体的数据组织方式,将有效提升检索查询效率,同时也能为实现数据全面整合提供模型支撑。一是可以实现基于本体的查询,结合自然语言处理(分词、实体识别)和语义匹配,提高涉农数据查询的查全率和查准率。二是可

26、以实现数据的融合,在采用本体之前,当需要查找某个村的信息时要逐一查询这几张表,而通过本体建立数据之间的联系之后,只需对行政村本体进行一次查询,无需知道数据来源、数据来源之间的关系及数据的编码等,可直观获取关于该村的各方面信息。当查询某一方面的信息时,也可直接展示出与之相关联的信息。这样农业农村数据资源的价值将得以充分体现,也能更有效地进行共享。3.2应用于支撑农业农村数据资源深度挖掘基于本体整合多种来源数据后,一是可以通过知识图谱和语义技术增强数据之间的关联,使得用户可以用更加直观的图谱方式对涉农政务数据进行关联挖掘与分析。如可以将行政村知识实例化,提供关于每个行政村的知识图谱,其中整合了关于

27、行政村的多个维度的数据,用户可以从传统的纵深钻取的查看方式转变为横向联系的图式查看方式,更易于分析和发现问题。二是可以基于这些知识图谱开发知识库和问答系统,让数据转化为用户易于理解和查询的村情、农情、乡情知识。三是在涉农领域的本体模型的支撑下,还可以快速建立起一系列的“三农”领域画像标签,用于“三农”领域各类对象的画像刻画,支撑涉农大数据分析。4结束语应用计算机科学领域的本体论探讨解决多源异构村级数据资源共享问题的解决方案,探讨了如何构建所需本体的方法路径,进行了案例试验,将本体应用于村级数据资源的组织、共享,并应用基于规则的本体推理进行村级数据资源分析。结果表明,通过本体将数据映射、关联后,

28、可以快速有效地实现跨数据查询,实现知识利用。本体方法论对于农业农村领域数据资源管理、共享、挖掘具有实际应用价值。参考文献 STUDER B,BENJAMINS V R,FENSEL DKnowledge engineering:principles and methodsJData and Knowledge Engineering,1998,25(1/2):161-1971 WACHE H,VOEGELE T,VISSER U,et alOntology-based integ-ration of informationC/Proceedings of the IJCAI,2002 2 何勇

29、群,余红,杨啸林,等本体:生物医学大数据与精准医学研究的基础J生物信息学,2018,16(1):7-14HE Yongqun,YU Hong,YANG Xiaolin,et alOntology:founda-tion of biomedical big data and precision medicine researchJChineseJournal of Bioinformatics,2018,16(1):7-143 刘文韬,陈智宏,许焱,等基于本体论的交通异构数据集成系统J计算机系统应用,2010,19(3):7-11LIU Wentao,CHEN Zhihong,XU Yan,et

30、 alTraffic heterogeneousdata integrating system based on ontologyJComputer Systems&Ap-plications,2010,19(3):7-114 李永忠,胡思琪基于混合本体的政务异构数据集成研究J电子科技大学学报(社科版),2016,18(5):17-20LI Yongzhong,HU Siqi Research on e-government heterogeneousdata integration with hybrid ontology methodJJournal of Universityof Ele

31、ctronic Science and Technology(Social Science Edition),2016,18(5):17-205 郑业鲁,何绮云,钱平,等基于本体的农业知识管理系统构建6 表 3最美乡村获奖村示例数据Tab.3 Sample data of the most beautiful village award-winning village序号所在区所在乡镇所在村1朝阳区高碑店乡高碑店村2朝阳区崔各庄乡何各庄村3朝阳区黑庄户乡郎各庄村 图 4星级休闲园区类局部本体Fig.4 Local ontology scheme of star rated leisure pa

32、rk 图 5本体映射示意Fig.5 Sketch map of ontology mapping 薛晓娟等:本体在村级数据资源共享中的应用 33 方法J中国科学:信息科学,2010,40(S1):196-204ZHENG Yelu,HE Qiyun,QIAN Ping,et alConstruction of the on-tology-based agricultural knowledge management systemJ ChineseScience:Information Science,2010,40(S1):196-204常春Ontology 在农业信息管理中的构建和转化D北京

33、:中国农业科学院,2004CHANG ChunConstruction and conversion of ontology in agriculturalinformation managementD Beijing:Chinese Academy of Agricul-tural Sciences,20047李景本体理论及在农业文献检索系统中的应用研究:以花卉学本体建模为例D北京:中国科学院研究生院,2004LI JingStudy on the theory and practice ofontology and ontology-basedagricultural document r

34、etrieval system:floricultural ontology modelingD Beijing:Graduate School of Chinese Academy of Sciences,20048王向前,张宝隆,李慧宗本体研究综述J情报杂志,2016,35(6):163-170WANG Xiangqian,ZHANG Baolong,LI HuizongOverview of on-tology researchJJournal of Intelligence,2016,35(6):163-1709徐勇,安祥生,王志强基于农业资源分类的农业资源本体架构设计J农业网络信息,

35、2009(10):8-12,27XU Yong,AN Xiangsheng,WANG Zhiqiang Design of ontologyframework of agricultural resources based on classification of agricultur-al resourcesJ Agricultural Network Information,2009(10):8-12,2710张磊基于叙词表和文献数据库的农业领域本体构建方法研究D北京:中国农业科学院,2011ZHANG LeiStudy on the construction method of agricultural domain-ontology based on agricultural thesaurus and documentsD Beijing:Chinese Academy of Agricultural Sciences,201111 34 农业工程信息与电气化

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 自然科学论文

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服