1、主题检索语言的特点精品文档主题检索语言的特点(叙词法的特点):直接性:即直接用自然语言名词术语作为标识符号,最直观、最方便,一目了然。专指性:是指解释和查找文献主题的深度而言。集中性:主题检索语言对反映同一主题的各个方面的文献可以达到高度集中的效果。多元性:是指对文献主题内容采用多个主题词进行组配标引和检索,揭示与查找该文献的途径多,从而提高对文献的揭示能力和利用率。适应性:通过增补新的主题词或通过组配,主题检索语言在表达新概念的文献和新的研究课题的资料时具有很强的适应能力。标引就是对文献主题分析的结果赋予检索标识的过程。主题标引:是一种将文献主题的自然语言形态,转换为主题法语言形态(叙词、标
2、题词、关键词、单元词)的标引,这是建立主题检索系统的依据。分类标引:是一种将文献主题的自然语言形态,转换为分类语言形态的标引,即转换成分类号码的一种标引,这是建立分类检索系统的依据。浅标引:是一种标引深度较浅的主题标引,主要用于手工检索系统,即把文献中最重要的概念作为主题标识的标引。深标引:是一种标引深度较深的主题标引,主要用于计算机检索系统,它反应文献中主要的和次要的概念。标引深度是指对一片文献所赋予的全部检索标识的数量。就主题标引而言,则指标引一篇文献平均所给予的主题词的数量。标引等级是指将文献中的概念根据主次按等级划分,分为三个等级,一级概念标引1. 一级概念标引,也称主要标引。仅仅揭示
3、文献的主要论点。2.二级概念标引,也称次要标引。3.三级概念标引,也称不要标引。2. 加权标引:是指一种采用打星号的方式区分主要、次要标引的方法。既为所标引主题词确定IM和NIM词的过程。加权标引的目的是突出文献重点,划分标引等级。 主题分析概念:是指根据文献存储与检索的要求,对文献内容进行分析,从中提炼主题概念,确定主题类型、剖析主题结构和确定概念间关系的过程主题分析的意义在于使标引者尽可能的掌握一定的分析方法,遵循共同的分析步骤,客服因分析不一致造成的标引不一致,保证标引的初始环节达到较高的一致性主题标引的原则 一、基本原则(一)真实性 (二)客观性(三)全面性(四)准确性(五)专指性(六
4、)一致性 二、选词原则(一)首选专指词(二)次选组配词(三)选择上位词或靠近义词(四)标引自由词 三、选词注意事项(一)随时注意主题词的增删,尽量使用新词表。(二)熟悉词表的排列规律。(三)掌握正确的汉语拼音。(四)自行转换主题概念。(五)通常英文查找规范的中文主题词。主题标引的方法(一)主题分析1.分析文献内容:通过浏览全文了解文章整体内容。2.提炼主题概念:选出反映主要内容的信息。3.确定主题类型:确定单主题或多主题。4.剖析主体结构:确定主体面、通用面及其他相关的面。5.分析概念间关系:确定概念间关系,方便标引时配对选词。(二)转换主题概念:利用MeSH词表,将所选概念逐一查表,同时严格
5、遵守选此原则。其顺序是:先组词组配词上位词或近义词自由词。(三)加权标引(四)将选定的主题词,根据标引深度和标引等级,进行重点和次重点的确定,即通过加权符号标识IM和NIM词。(五)填写标引工作单(六)标引审核叙词叙词 也称主题词,是一些以概念为基础的,经过规范化和优选处理的,具有组配功能,并能显示词间语义关系和动态性的词和词组。是用来揭示文献主题内容,标引和检索文献的一种情报检索语言词汇。标引在信息检索中的作用(一)对标引而言,标引质量决定检索系统质量(二)对检索着而言,学会标引方法,可以提高检索效率分析概念间关系(一) 并列关系:是指在概念关系上处于同等并列地位的两个或多个单主题。(二)交
6、叉关系:指某一主题概念是又处于同等地位的两个或多个单元主题交叉后产生的。(三)限定关系:指处于不同地位的主题概念之间,其中一个概念被另一个或另几个概念从不同角度进行限定。(四)因果关系:指主题概念之间存在着原因和结果的关系。(五)影响关系:指主题概念之间存在着影响和被影响的关系。(六)应用关系:指主题概念之间存在着应用和被应用的关系。的局限(一)有关中医中药的主题词极少。(二)尽管词表收录了极其丰富的医学及生命科学主题词,但仍有一些概念不能通过词表反映出来。(三)对某些综合征没有适当的主题词标引,有关反映新技术、新概念的词汇出现仍嫌较晚。(四)地理主题词:美国的地理名词较详,美国以外的国际爱只
7、有国家名及部分大城市名。特征词作用特征词的作用在于进行计算机检索是对含有特征词概念成分的文献,进行成族的限定、集合与排除。概念相交是指两个表达相同性质概念的主题词之间的逻辑组配概念限定也称方面组配,是指两个不同性质概念主题词之间的组配副主题词也称限定词,是指明主题词所论述的重点课题的自然范畴或通常发生的某一方面,对主题概念起限定作用的一类词汇。标引深度与“三原则”:原则上三种以上的同类因素可以一一标引,而四种以上的则不一一标引,而是采用上位概念主题词标引问词,并选择同类因素中最重要的种作为此加以标引,这就是所谓的“三原则”。与的判别:反映文章的主要论点或作者研究的目的的作词,作者的次要论点和级概念作为词(判别和的金标准). 作者认为最重要的概念做此,这往往可以从题名和摘要中得以确定。. 特征词常用作词,除非它是文章的主要概念。. 用以限定主题的概念,强调文章倾向的概念,即组配词作词。组配:在主题标引过程中,将两个或两个以上的主题词按照一定的逻辑关系加以组织以表达文献主题的,叫做组配概念组配:是指用能够确切表达复合概念词构成成份的各个主题词的组配,来表达复合概念含义的一种方法,它不着重于字面上是否与自然语言的复合词性相符收集于网络,如有侵权请联系管理员删除