收藏 分销(赏)

转载关于声像电子档案归档本体在城建档案信息管理系统中的应用.doc

上传人:仙人****88 文档编号:9464654 上传时间:2025-03-27 格式:DOC 页数:8 大小:58KB
下载 相关 举报
转载关于声像电子档案归档本体在城建档案信息管理系统中的应用.doc_第1页
第1页 / 共8页
转载关于声像电子档案归档本体在城建档案信息管理系统中的应用.doc_第2页
第2页 / 共8页
点击查看更多>>
资源描述
本体在城建档案信息管理系统中的应用 孙庆辉 霍建飞 [内容提要]本体,作为一种能在语义和知识层次上描述信息系统的概念模型的建模工具,已在许多领域得到了广泛的应用。本文应用基于本体的方法来建立城建档案信息管理系统的分析设计工作,借鉴该领域内现有的本体研究,提炼出了档案信息系统模型,阐述了本体在城建档案信息系统中的应用情况实例。 [关键词] 本体 系统模型 城建档案 信息系统 一、引言 本体,作为一种能在语义和知识层次上描述信息系统的概念模型的建模工具,迅速成为信息系统与人工智能领域的一个研究热点,并在许多领域得到了广泛的应用,如知识工程,软件复用,信息系统间异构信息处理,自然语言理解等。特别是在信息检索领域,本体提供了一种对信息和知识进行规范化描述和建模方法,在构建智能化的检索系统、构建语义等方面具有重要的意义[1]。 二、本体的基本知识 2.1本体的定义 本体是由Neches与Fikes在1991年提出的[2],是领域术语及其关系的外在形式化表示,术语及其联系是现实世界的提取。本体作为一种服务方式作用于领域知识的抽取、描述、传递与共享[3]。本体能使智能代理更加清晰地理解相关的元素、关系以及概念,使知识表示更加合理与方便,帮助人们作出更恰当的选择。 2.2基于本体的信息检索的基本原理 本体是把现实世界中的某个应用领域抽象成一组概念及概念间的关系。在传统信息检索技术中融入本体,既能够发挥概念信息检索的优势,又可以克服概念信息检索的局限性,即它不能对概念关系进行处理。由于本体能够对概念关系进行处理,并通过概念之间的关系来表达概念语义,所以检索的查全率和查准率会得到提高。基于本体的个性化信息检索是对需求集合和信息集合进行了匹配与选择,并在其中加入了本体的元素。 三、本体在城建档案信息管理系统的中的应用 利用本体理论指导并开发城建档案信息管理系统,目的是使城建档案管理的过程信息化、现代化,以适应当前工作的需要。城建档案信息管理系统是以城建档案为核心,以馆藏档案资源为基础,以计算机技术为载体,用本体理论来建立档案信息的检索模型,将现代的计算机技术与传统档案查询服务方式相融合。它不仅做到了统一、完整,而且还具有容量大、速度快等特点,还能够做到较为准确的查询,充分开发城建档案信息资源、提高了工作效率和管理水平。 3.1 本体知识在城建档案信息检索中的应用 由于城建档案系统数据量大且复杂繁琐,为减少数据检索时间,提高数据的匹配效率,故引入本体知识来改善检索的效率。信息检索过程涉及 3个方面: 用户任务 (用户需求 )、文献的逻辑表示 (文档替代物 )、相关性判断。为了提高系统的响应速度,信息检索系统一般不直接进行用户需求和文档的相关性分析,而是使用表现形式既简单又相似的需求替代物和文档替代物进行相关性匹配 。 文档替代物,如关键词向量,可以通过人工标引或者自动标引获得,生成之后一般不再更新;需求替代物,如查询表达式,一般由用户或者检索系统辅助构造而成。文档替代物是档案的元数据,文档类的替代物是文档类的元数据。从检索效率的角度来看 , 标引能显著提高全文数据库的查全率和查准率,并能缩短检索时间。检索结果可以是题名、知识、概念含义水平上的信息或全文等多种形式。城建档案文本标引工作至少应该包含主题标引和实体关系标引两个方面 , 因为文本内部既包含主题信息,又包含实体关系信息,这是两类不同类型的信息,文本信息检索系统应该提供这两类信息的检索入口。 到目前为止,主题标引技术已经比较成熟 , 被广泛用于信息检索系统之中,实体关系标引技术还需进一步完善。 城建档案信息检索引入本体技术的一个重要目的是变关键词 (或者主题词 ) 匹配为基于语义的匹配,使系统在查全率和查准率上有更好的保证。然而,现有的基于本体的信息检索系统在标引过程中对本体的利用过于简单,只是借助于领域本体,判断文档所属的领域,对文档按领域进行分类。领域本体能否在标引过程中发挥更多的作用,有没有必要对标引功能进行相应的改造,例如,使用本体描述档案文档,用本体作为档案文档的替代物,这些都有待继续进行研究。 在标引过程中,本体技术可以发挥更多的作用。但是,应该将领域本体分为两类:一类是反映特定领域内概念之间关系的本体,简称概念关系本体;一类是反映特定领域内实体之间关系的本体,简称实体关系本体。这两类领域本体的作用不同。 实体关系标引属于信息抽取技术,可视为信息检索技术的一个深化。在标引过程中,实体关系本体可以充当信息抽取框架。实体关系标引的过程可以按以下几个步骤进行: 1.标引系统对城建档案进行主题标引,识别文本中所包含的主题,并根据文本主题将文本按照领域进行归类。 2. 利用文本的领域归属信息从文本中识别出命名实体。 3. 利用信息抽取模板将特定的描述信息与实体联系起来。 4.在实体识别的基础之上标注出实体之间的关系。 对文本信息检索系统而言,没有必要使用本体形式的文档替代物,因为文档的多个主题词之间的概念关系比较简单。文档主题词只是某些概念关系本体上的几个概念节点 ,用标引词向量作为文档替代物就可以了。 3.2系统流程 图1 城建档案管理流程图[4] 3.3 结构与功能设计 图2 结构设计图[4] 3.4 模式特色 该系统模式主要有以下特色 1.一切从实际需要出发,完全根据城建档案馆档案管理工作的实际需要来进行功能分析、系统架构甚至是界面设计,档案馆工作人员对系统的使用不存在过长的熟悉时间。 2.实现了数据库管理系统的“瘦管理”,用户无须过多的了解SQL Server 2000的使用和管理技术就可以对系统进行维护和管理。 3.系统采用分布式体系结构(客户/服务器(C/S)模式),全部数据管理采用开放式数据结构/接口设计,用于数据共享与数据交换,方便档案管理系统的升级、功能扩充。 4.系统在档案管理中广泛采用了报表技术,实现了对用户编目时所需的资料文件内容的打印功能,提高了工作效率和准确度。 5.数据库实现了对图片和文件的存储,在方便了档案文件的管理的同时也提高了档案文件的安全性。 6.通过使用OLE技术,工作人员可以系统的将处理结构进行有自己特色的二次加工。 7.建立电子文件归档系统,解决存量档案的电子化工作,建立了法规标准体系。[5] 四、讨论 城建档案信息化管理,是形势发展之必然,也是建立节约型社会,坚持科学发展观的重要手段。“保定市城建档案管理信息系统”的立项研发,是由保定市城建档案馆和河北工业大学共同开发进行的,如今已正常运转多年。实践结果证明,随着计算机在社会生活中的广泛应用,大众对数字信息的需求越来越强烈,信息技术开始面临种种新的挑战,如知识的表示、信息的组织、软件的复用等。本体作为一种新兴的概念建模工具,迅速在信息系统诸多领域得到广泛的应用。因此,本体必将为人机对话架起便捷的桥梁。 参考文献: [1] 张书祥,董永峰,候向丹.本体及其信息在检索中的应用[J] .河北省科学院学报.2005,8:176~178. [2] Neches R,Fikes R E,Gruber T R,eta. Enabling Technology for Knowledge Sharing [J].AI Magazine,1991,12(3):36-56. [3] Studer R, Benjamins V R, ensel D, Knowledge Engineering, Principles and Methods[J]. Data and Knowledge Engineering, 1998, 25(122):161-197 [4] 孙庆辉.城建档案电子政务管理的设计与应用.城建档案 . 2009.119期 [5] 张书祥,董永峰,杨彦卿等.城建档案管理信息系统的原理与架构设计[J] .河北经贸大学学报.2007,7:119~120. (作者单位:保定市城建档案馆)
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 教育专区 > 小学其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服