收藏 分销(赏)

基于TopicMaps的叙词表再工程样本.doc

上传人:精*** 文档编号:4657978 上传时间:2024-10-08 格式:DOC 页数:12 大小:384KB
下载 相关 举报
基于TopicMaps的叙词表再工程样本.doc_第1页
第1页 / 共12页
基于TopicMaps的叙词表再工程样本.doc_第2页
第2页 / 共12页
点击查看更多>>
资源描述
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。 基于Topic Maps的叙词表再工程 朱良兵1,纪希禹2 1.四川大学公共管理学院 成都 610064 2. 四川大学公共管理学院 成都 610064 [摘要]本文介绍了叙词表的定义、 词间关系的种类以及传统叙词表存在的不足, 总结了主题图技术的内涵、 发展历程及其优点, 选择了18个主题词作为研究样本, 分析其词间关系并进行建模, 用Ontopia公司提供的三个免费工具分别进行创立、 浏览和可视化主题图。 [关键词]叙词表 主题图 知识组织 Reengineer the Thesaurus Based on Topic Maps Zhu Liangbing Ji Xiyu 1. the School of Public Administration, Sichuan University, Chengdu, Sichuan 610064 2. the School of Public Administration , Sichuan University, Chengdu, Sichuan 610064 [Abstract]The article firstly introduces the definition of thesaurus and the kinds of relationship between descriptors, and the shortage of the traditional thesaurus.Then summarizes the meaning , history and merit of Topic Maps. Finally chooses eighteen descriptors as the research swatch, analyzes and models the relationship between them, uses three free tools to create, browser and visualize the topic map. [Keywords]Thesaurus; Topic Maps; Knowledge Organization; Relationship Information   在网络信息海量增长的现实面前, 只有对信息主题进行更好的识别才能在浩如烟海的信息资源中及时、 准确地获得信息。为此, 图书情报界迫切需要对传统的信息管理工具加以创新, 以利于网络资源的描述和发现。叙词表独有的知识组织体系和语义结构在组织和检索网络信息资源方面将发挥重要作用, Topic Maps作为一个ISO国际标准, 提出了一种基于主题的元数据组织和描述方式, 提供了语义级的数据导航和组织方式,是一个表示和交换结构化信息的元数据模型, 将对叙词表在网络环境下的改进和重塑中发挥重要作用。 1叙词表概述 1.1 叙词表的定义 叙词法形成于上世纪50年代末, 是在吸取元词法、 标题法及分面组配式分类法等知识组织方法优点的基础上发展起来的。根据GB13190-91《汉语叙词表编制规则》, 叙词表是将文献、 标引人员或用户的自然语言转换成规范语言的一种术语控制工具; 它是概括各门或某一学科领域并由语义相关、 族性相关的术语组成的能够不断补充的规范化的词表。 1.2叙词表词间关系的种类 叙词表由叙词及叙词之间关系组成, 采用参照符号显示并清楚地区分叙词间基本语义关系。叙词表中包括以下3 种关系: 1) 等同关系( Equivalence Relationship) , 又称同一关系、 用代关系, 包含同义、 近义以及用代关系, 这种关系含有概念相同或用法相同的关系。揭示等同关系有利于增加检索入口和根据检索系统需要对标引和检索的专指度进行控制。 2) 等级关系(Hierarchical Relationship) , 又称属分关系, 这种关系包含属种、 整部和多层级关系, 每种层级关系的下位词都必须与上位词的概念类型相同, 即两者都必须属于同一范畴内的事物、 行为或性质。揭示等级关系有助于经过它扩大和缩小查找范围, 提高族性检索能力。 3) 相关关系(Associative Relationship) , 又称类缘关系, 是确立由标引和检索角度需要相互关联的一种关系。相关关系是揭示叙词间各种主要联系、 扩大检索范围、 进行相关信息查找的重要手段。相关关系范围广、 种类多、 灵活性大, 很难严格界定。 叙词语言对语义关系的揭示方法, 主要经过各种语义参照符号来反映和联系。其语义参照系统见表1 , ”Y、 D、 S、 F、 Z、 C”一系列语义关系符号, 显示出叙词之间同义、 属分、 相关关系, 形成了叙词表的语义关系网。 语义参照关系 参照项 中文符号 英文符号 作用 同义关系 用 Y USE 从非叙词指引到叙词 代 D UF 从叙词指引到非叙词 属分关系 属 S BT 从下位叙词指引到上位叙词 分 F NT 从上位叙词指引到下位叙词 族 Z TT 从下位叙词指引到最高位叙词 相关关系 参 C RT 从某一叙词指出其相关叙词 表1  叙词的语义参照关系 其中, ”Y”和”D”揭示的是词间同义关系, 可帮助用户区分规范和非规范检索词; ”S”、 ”F”、 ”Z”揭示的是词间属分关系, 可帮助用户扩检或缩检; ”C”揭示的是词间相关关系, 可帮助用户获得当前检索主题的相关信息。 1.3 传统叙词表存在的不足 叙词表和主题图相比而言, 存在一些不足之处。叙词表中的术语均是规范的科学语言; 而主题图中的主题能够用自然语言和半自然语言来表示。在组织结构上, 叙词表中知识点的分布是线性的、 一维的; 而主题图中的知识点分布是网状的, 它不单纯是一张平面的网格, 而是一个在四维空间中伸缩的网状结构。叙词表相对稳定, 结构保守而单一, 不可能经常修订; 而主题图是一个开放体系, 其底层知识库与主题集合能够随着学科领域的更新和发展随时进行修正和更新。叙词表中只包含”用、 代、 属、 分、 参、 族”这样简单的语义关系; 而主题图中主题之间的关系, 能够被描述得更广泛、 深入、 细致和全面。 2 Topic Maps概述 2.1 Topic Maps的定义 概括地说, 主题图是一种用于描述信息资源的知识结构的数据格式, 定位某一知识概念所在的资源位置, 也能够表示知识概念间的相互联系。 主题图实际上在信息资源的上层构建了一个结构化的语义网, 它独立于技术平台, 描述主题之间的关系及主题与具体资源的联系, 经过揭示概念之间的关系, 将用户指引到相关的资源。建构主题图, 其目的在于建立一个个人化的知识导航界面, 并给使用者一个能快速掌握轻松学习知识的操作界面。主题图被誉为信息管理和知识管理之间的桥梁, 是信息世界中的GPS定位仪, 它能够提供信息资源的直观的导航。 2.2 Topic Maps的发展历程 主题图的概念最初是由W3C提出的, 并由国际标准化组织SGML委员会第三工作小组的研究人员开发, 用来实现索引和辞典构建过程的形式化。这些早期努力演变的结果就是ISO/IEC13250: , 这项国际标准定义出了Topic Maps的完整模型, 它采用ISO10744: 1997HyTime的标准来定义主题图的语法, 因此又被称为HyTM。主题图虽然早于XML出现, 可是XML与Web的迅速发展导致出现了XML Topic Maps, 即XTM。XTM是由Topic Maps 组织负责订立, 它的基础是ISO/IEC13250模型, 可是定义的是一种XML语法, 并限制它只能经过URI实现。 经过修订的第二版(ISO/IEC13250 : )同时包含HyTM和XTM两种语法。 2.3 Topic Maps的优点 主题图吸收了叙词表在词汇控制方面的思想, 能够用两种机制(基本名base name和别名variant name)来定义叙词表中的用代关系, 实现词汇控制, 并在传统叙词表的用、 代、 属、 分、 族、 参的简单关系基础上, 具有灵活定义概念间关系的类型的功能, 使用者能够根据领域概念的特点灵活地定义概念之间的关系。在主题图中所表示的概念之间的关系比叙词表更为具体和确切。 Topic Maps体系模型如图1所示: 它的基本思想实际上是我们非常熟悉的, 理解它最一般的起点就是传统的书后索引。索引是一本好书中主要论题、 领域的浓缩, 主题地图的基本概念与之相似, 有”主题Topic”(论题或名词的名称); 有”主题关联Association”( 参看, 参考) ; 以及”主题资源Occurrence”(页码、 或者位置描述)。 与书后索引相比, 主题图更加一般化, 以此满足更加广阔的数字信息领域的需要, 它定义了一个数据模型, 并基于该模型描述底层信息内在的知识结构, 用”语境范畴Scope”来确定描述的领域, 为用户绘制了一副相关论题简明而富有指导价值的整体蓝图, 并以知识的方式组织和管理相关的Web信息资源。换句话说, 主题图提供了一个可自定义的信息路由策略, 来帮助用户有效地操纵数字资源, 而信息路由策略则体现了内涵于信息之中的知识。 图1 Topic Maps 模型组成 与此同时, 主题图并不包含在所描述的信息当中, 它是与信息无关的独立导航层, 对于相同的底层资源, 我们能够应用不同的主题图来动态地改变信息路由策略, 也就是说用不同的知识看待相同的问题, 这恰恰反映了不同知识结构的人看待相同的资源所表现出来的不同视角。 3研究范围界定 本研究选取《管理科学主题词表》( 1996年2月第1版) 作为研究样本, 以主题词”情报学”为中心, 选取与之相关的词汇作为研究对象。为了避免词汇数量和词间关系永无止境, 我们只选取其中18个与”情报学”相关的主题词, 我们对这18个主题词及其替代词进行关联性分析后, 归纳出其词间关系, 并制表如下: 主题词 代( D) 参( C) 属( S) 分( F) 用( U) 情报 信息 科技情报、 经济情报、 战略情报、 战术情报、 商业情报、 军事情报、 飞行情报 信息 情报 档案信息、 科技信息、 固定信息、 环境信息、 经济信息、 决策信息、 动态信息、 外部信息、 直接信息、 管理信息、 质量信息 情报产业 咨询业 信息产业 管理信息系统 管理情报系统 信息系统 质量管理信息系统、 成本管理信息系统 信息经济学 情报经济学 信息渠道 情报源 情报分析 情报研究 经济信息 经济情报 信息 竞争信息、 市场信息 经济信息系统 信息系统 市场信息 物价信息、 商情 经济信息 情报机构 信息机构 情报技术 信息技术 情报检索 信息检索 检索 手工检索、 自动化检索、 追溯检索 情报搜集 信息搜集 情报研究 情报分析 科技情报研究 科技情报 技术情报 科技信息 情报 专利技术情报 科技信息 技术信息 科技情报 信息 企业科技信息 自动化检索 情报检索 光电检索、 计算机检索 表2 本研究所采用的18个主题词及词间关系 4对叙词间的语义关系建模 确定所采用的词汇及其关联性后, 便可开始着手构建语义网络。语义网络是AI研究领域中的一种表现形式, 包含节点( Nodes) 与连接( Links) , 节点一般代表客体、 概念或某特殊领域的情境, 连接则代表节点间的语义关联。 主题词 subject 上位词 Broader Term 同义词 Synonym Term 相关词 Related Term 下位词 Narrow Term 属分关系 同义关系 相关关系 属分关系 图2 叙词表词间关系之语义关系模型 根据表2所列出的叙词之间的关系, 可提出以下的语义模型: 以”主题词”为中心, 其同义关系为”同义词”; 属分关系为”上位词”、 ”下位词”; 相关关系为”相关词”。此模型如图2所示。 举例来说, 如以表2中的主题词”科技情报”为例, 将其语义关系按图2的方法展开, 结果如下: 科技情报 技术情报 科技信息 情 报 专利技术情报 上位词( BT) 同义词( UF) 相关词( RT) 下位词( NT) 图3 以”科技情报”为例之语义关系图 5构建主题图 5.1 用Ontopoly构建主题图 Ontopoly是挪威的Ontopia公司提供的, 由本体驱动的、 基于Web的Topic Maps构建和管理工具, Ontopia公司是世界上领先的专注于Topic Maps技术的研究和应用的公司。一个主题图是由本体和该本体的实例组成的, 你可应用Ontopoly对它们进行编辑。 Ontopoly的强大功能和灵活性的关键在于它是建立在主题图的ISO国际标准之上的。这就使得Ontopoly能够支持各种知识结构, 范围包括简单的索引和分类法, 从叙词表到术语表, 以及风头正健的本体。 本实验选用”主题词”作为主题类型( Topic Types) ; 选用Ontopoly中自带的”Description”作为主题资源类型( Occurrence Types) ; 根据表1所列出的三种叙词间关系作为关联类型( Association Types) ; 用”叙词”和”非叙词”作为”同义关系”这种关联类型的角色类型( Role Types) ,用”上位叙词”和”下位叙词”作为”属分关系”这种关联类型的的角色类型,由于”相关关系”是一种对称关系( symmetric relation) , 因此只需一个词来作为”相关关系”这种关联类型的角色类型, 在此用”相关词”来担当此任。最后, 根据以上原则构建出主题图, 代码片段如下: <topic id="id321"> <instanceOf> <topicRef xlink:href="#id174"></topicRef> </instanceOf> <baseName> <baseNameString>科技情报</baseNameString> </baseName> <occurrence> <instanceOf> <topicRef xlink:href="#id139"></topicRef> </instanceOf> <resourceData>科技情报是有关最近期间在各种重要的科学技术领域内, 反映国内外的成就和动向, 为经济建设和为决策服务的重要信息。</resourceData> </occurrence> </topic> 5.2 用Omnigator浏览主题图 Omnigator也是由Ontopia公司提供的一个免费浏览器, 使用Omnigator能够让你经过一个标准的Web 浏览器运行并浏览任何主题图, 支持LTM、 HYTM、 XTM、 RDF多种格式。该浏览器简易而友好的用户界面为用户快速、 轻易而直观地获得所需信息提供了可能。Omnigator使用简单的基于HTTP协议的客户机/服务器模式, 需要Tomcat作为Web服务器。使用Omnigator不但仅能够对主题图进行浏览, 还能够管理、 合并主题图, 以及对插件、 全文索引进行管理, 用主题图查询语言Tolog对主题图进行查询, 验证主题图的有效性, 更换Omnigator的显示模式、 视图、 皮肤( Model、 View、 Skin, 简称MVC) 等等功能。如图4是本文设计的主题图在Omnigator中的浏览结果的一个截屏。 图4 用Omnigator浏览主题图 5.3 用Vizigator可视化主题图 Vizigator是Ontopia公司提供的一个免费的主题图可视化工具。主题图模型描述了蕴涵于信息中的知识结构, 这种模型反映了人类思考方式的典型关联模式。一般图形图象比烦琐的文字描述让人更容易抓住知识要点, Vizigator使用一个图形化接口提供了一个额外的主题图导航方式。它以不同颜色、 不同形状来区分主题图的各个部分, 节点代表主题, 节点与节点之间的连线代表主题之间的联系。尽管Vizigator可独立作为可视化工具使用, 也可很方便地作为基于文本的浏览方式的一个补充。如图5是本文设计的主题图在Vizigator中的可视化呈现结果。 图5 用Vizigator可视化浏览主题图 6 结语 本文成功地提出了一个以主题图构建叙词表的语义网络模型、 方法与步骤, 并从现有叙词表中选择18个主题词及其替代词作为研究样本, 归纳出其词间关系并构建语义关系图, 再以挪威Ontopia公司提供的免费工具Ontopoly建立主题图, 最后以Ontopia提供的免费浏览器Omnigator浏览主题图, 以Ontopia公司提供的免费可视化工具Vizigator对主题图进行可视化呈现, 顺利的完成了一个实验性质的叙词表主题图。 展望未来, 主题地图是一项结合了知识工程和知识组织的新技术, 更是一种分布式的知识表示法, 若能有效的加以运用能够整合众多分散于网络上的知识库, 从而建构出一个强大的知识管理系统。不过, 主题图亦将如同其它新兴的标准和技术一样, 一方面在各个领域展示出巨大潜力, 另一方面则将遭遇各种问题的严厉挑战, 是否真能成为知识组织的利器, 或是成为知识管理的有效解决方案, 依然是一个颇值得探讨的议题, 亦是我们未来的研究重点之一。 [参考文献] [1]秦铁辉. 信息时代的”全球定位系统”——主题地图. 江西图书馆学刊, , 35( 1) [2]马建霞. 主题图技术在数字化知识组织中的应用. 现代图书情报技术, ( 7) [3] 张佩云, 吴江, 贾晖. 主题地图标准及其应用研究. 安徽大学学报( 自然科学版) , , 28( 3) [4]何建新. 主题图及其应用. 中国索引. , 3(1) [5]韩泽春. 主题地图—— 一种有效的知识组织与揭示方法. 忻州师范学院学报, , 21( 4) [6] Lars Marius Garshol. Metadata? Thesauri? Taxonomies? Topic Maps!. (Accessed March,22, ) [7] Dagobert Soergel. Building a More Meaningful Web: From Traditional Knowledge Organization Systems to New Semantic Tools. (Accessed March,23, ) [8] Steve Pepper. The TAO of Topic Maps. (Accessed March,23, ) [9] Steve Pepper,Graham Moore.XML Topic Maps(XTM)1.0. (Accessed March,24, ) [10] 张琪玉.情报语言学基础(增订第二版本).武汉大学出版社, 1997 [11] 魏铁进.管理科学主题词表.机械工业出版社, 1996 [12] Ontopia.Ontopoly:The Topic Map Editor User’s Guide.((Accessed March,25, ) [13] Ontopia.Omnigator:The Topic Map Browser User’s Guide. ((Accessed March,26, ) [14] Ontopia.Omnigator:The Ontopia Vizigator User’s Guide. ((Accessed March,27, ) ( 来稿时间: -04-06 责编: 冉文格) [作者简介] 朱良兵, 男, 1977年生, 四川大学情报学在读硕士研究生, 主要从事信息系统理论与技术的学习研究。 纪希禹, 男, 副教授, 硕士导师, 主要从事信息管理与信息系统的研究, 发表专著两部。
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 学术论文 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服