资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,3,章,医学、生物学情报检索,广义的情报检索是指情报的加工、存贮过程和查出用户所需文献的过程,即包括文献的“放入”和“取出”两个环节。,文献在放入时应该考虑到这篇文献能够正确地检索出来,为此需要对拟放入数据库或手工检索工具的文献进行标引。,一、基本概念,医学、生物学情报属于科技情报的范畴,其研究的主要对象是医学、生物学文献,因此医学、生物学情报检索涉及到一些情报学基本术语和概念。,(,一,),信息,信息是事物存在和运动状态的反映,可分为自然信息、社会信息和生物信息等。,自然信息,是指自然界万物所具有的一切特征,如物体的大小、颜色、坚硬度、光泽等。,社会信息,是指用语言、文字等来表达物质特征的信息,如文献等。,生物信息,是指生物体所具有的信息汇集,如心电、呼吸、循环活动等。,狭义信息的概念,单指社会信息。,科技信息是指在科学技术领域用于交流的知识总和。,医学信息范围较宽,包括了生物信息、社会信息和自然信息,因为医学研究的对象是人体的科学,而且人具有社会性,医学经验需要用语言文字表达,同时还需要对医学仪器设备进行研究等。,(,二,),情报,情报,(,Information),属于知识的范畴,是有使用价值的知识,而且通过传递达到使用的目的。所以,可以将情报定义为有用知识的传递。,情报的知识性、效用性和传递性这三个基本属性得到了公认。,(2),高度的针对性和选择性。,科技人员之间的口头交流具有高度选择性和针对性的特点,如在讨论中,通过一问一答的形式,科技人员可以在短时间内得到大量浓缩的情报,而对无关的信息可以很快地省略过去。,(3),短暂性和非检索性。,由于零次情报是在科技人员口头交谈中进行的,一般无文字记载,所以保存时间短暂;而对于某些“只可意会,不可言传”的技术诀窍,(,Know how),则更是必须在当面“教诲”中方能得益,因此,具有不可检索性,即无法整理排序,形成文献。,(4),传播范围小。,由于零次情报是在科技人员之间小范围内进行,每次谈话内容只有当时参与者知道,不能像文献一样在大范围内传播。,2,实物情报,实物情报包括产品的样品等,是科技人员智慧的结晶,浓缩了人类知识,且有直观、可操作性强等特点。但由于没有文字记载,二次开发较为困难。,3,文献型情报,文献是记录着人类知识的物质载体。,医学文献是对医学成就的有效记录,医学科技人员应该积极保证在医学文献中高标准地报道医学实践和发现,努力保证著作的质量和学术水平。医学文献也是对科学知识的一种“公开”的记录,这种交流渠道便于任何人加以利用。,(,三,),文献,1,文献的发展趋势,(1),数量大、增长快。,全世界每年发表科技论文约,300400,万篇,年增长率为,7,8,。,(2),分散、集中、交叉、重复。,由于学科交叉渗透现象严重;许多同一文献会以不同形式多次发表。,(3),老化加速,质量下降。,由于科技水平的高速发展和文献数量的急剧增长,许多文献没有得到充分的使用即失效了。加上商业性期刊的增多,致使文献质量下降。,(4),语种增加,翻译文献增多。,(5),时滞严重,发表时间延长。,(6),载体多样化,类型繁杂。,2,文献分类,(1),一次文献,(,Primary document),主要指原始论著、期刊上刊登的论文、研究报告及专利说明书等。凡记载科研人员自己研究成果、亲身经验和观察体会方面的文献,都属于一次文献。一次文献是情报的基础。,(2),二次文献,(,Secondary document),是对一次文献进行压缩,将分散的、无组织的一次文献进行组织、加工、整理而成的文献。二次文献是情报工作的对象和主体,包括日录、索引、文摘等。,(3),三次文献,(,Tertiary document),在广泛利用二次文献的基础上,对一次文献作出整理、概括、分析与综合而成。如综述、述评和某些图书等。,二、文献检索基本原理,(,一,),检索语言,标引是对文献进行主题分析,从自然语言转换成规范化的检索语言的过程。其中,给予文献分类号标识的过程,称为,分类标引,;给予主题词或关键词标识的过程,称为,主题标引,。所以,标引的实质是给予文献主题词或分类号的过程。,1,分类号标引,国内目前使用的主要是中国图书资料分类法。国际较常用的是美国国会图书馆图书分类法和国际十进分类法等。,分类法可满足族系检索是其优点,但所采用的标识符是以字母数码为基础,编表者人为规定,直观性差,不利于不熟悉词表者查找。,2,主题词标引,主题词是以自然语言为基础,以表达概念的规范化的词或词组来揭示文献内容的一种方法。其标识符是经过人为加工的一种文字标识,直观性强。主题词又可分为:,(1),标题法:,其特点是将研究对象的概念用规范化的词表示,并按字顺排列,词与词之间的关系是预先固定好的,如同一篇文章中的大小标题一样,大标题套小标题,小标题下有副标题,各自次序不乱,但由于其组配能力差,所以词量大,使用时不够灵活。医学索引和工程索引早期均使用标题词。,(2),元词法:,是以从概念上不能再分的词作为文献标识,对于复杂的概念,用数个元词组配而成。如“心脏”、“疾病”和“分类”构成了“心脏疾病分类”的概念。由于标识符是概念上不能再分的词,所以词与词之间组配灵活。但由于过分灵活,往往出现许多误组配,影响了查全率与查准率,所以手工检索渐渐地不再使用了。但在计算机检索时,由于元词组配的灵活性,与计算机组配方便的特点,元词检索又成为计算机检索中的一个辅助手段。,(3),叙词法:,叙词是从大量文献中抽出能够概括和表达文献内容与基本概念的名词与术语,经过反复筛选,将选中的词予以标准化、规范化的人工语言。一般都有一个完善的叙词表,如国内的汉语主题词表,美国国立医学图书馆的医学主题词表,(,MESH),。,叙词的优点是规范化,组配较灵活,词表中通过参照系统将近义词、同义词和上下位类词联系在一起,通过参照系统,可以进行扩展检索。,3,关键词标引,关键词是文献作者本人写作时所使用的词,不进行任何加工,在文献入库时,计算机自动将文献中的词进行处理,除去少数无检索意义的禁用词,如西文中的虚词,其余大部分均作为检索标识建立倒排档,检索时可直接检索,或通过位置算符对各关键词进行位置相关检索。其优点是查准率高,新出现的词可以直接命中,标引容易,许多文种已经实现自动标引。缺点是漏检率高无法实现族系检索。,(,二,),检索工具,检索工具是指人们用来报道、储存和查找情报,(,线索,),的工具。人们通过检索工具即可得到有关研究领域的发表文献、科研进展等的线索。一般可分为检索词典、手工检索工具和计算机检索数据库三种形式。,本章作业:,1.列出你所知道的检索工具书(中文、外文)、检索体系、文献型数据库的名称,2.列出其中我校图书馆所有的检索工具书、检索体系、文献型数据库的名称,(,三,),检索策略的制定,检索策略是指根据被检索课题的内容和要求,选择适当的手工检索工具和机检数据库,并以该手工检索工具和机检数据库的检索手段与相应词表为依据,将课题分解成若干在该检索系统中可以实现的基本概念,确定以哪种检索方法为主进行检索。,如选择主题词或分类法入口,就通过主题词表或分类词表将概念转换成相应的主题词或分类号。如确定使用关键词为入口,则需要考虑该概念的同义词与近义词,并通过位置算符确定各关键词之间的关系,再使用逻辑运算符确定各概念之间的关系,从而合理地安排检索过程。,检索策略的好坏直接影响检索效果,也影响检索费用和时间,所以与用户利益相关。,在手检时,用户可以通过手翻、眼看、脑想,对整个检索工具有一个整体的了解,可以随时修改检索方法,即使对该检索工具不太熟悉或完全不会使用,也容易学会并查找到所需文献。但一般只能一个途径一个途径地进行,不能几个途径同步进行。检索时间较长,但检索策略较为简单。,机检则不同,数据库的容量较单本的手工检索工具大得多,机检的费用与时间直接相关,而且检索方法较多,不易在短时间内摸清楚。用户也不可能逐篇浏览,如不事先熟悉该系统的检索方法,事先拟定好检索策略,仓促检索,检索效果往往不理想。,制定检索策略大致有以下几步:,1,主题分析,主题是指课题所研究的具体对象或问题,即课题的中心概念。主题分析是对课题的内容进行剖析,确定其结构和类型,选出中心概念的过程,也就是对检索课题进行概念分解与合成的过程,。,以,MEDLINE,数据库为例,概念分解应以,MESH,词表为依据。该表是供标引人员、编目人员和联机检索人员使用的,表中每一主题词、副主题词的使用均有详细的注释,明确地规定了该词的使用方法和范围。,2,检索词的选择,在概念分解完成并明确各概念相互之间的关系后,就需选择合适的词来表示每一个概念。机检的手段远比手工检索工具多,一个数据库可以同时具备叙词入口、关键词入口、分类号入口和单元词入口等手段,所以可以将数个概念用逻辑组配的方法进行组合,很快得到所需的综合概念。,在选择检索词时,应尽量遵循这样一些原则:,(1),有主题词时尽量选用主题词。,(2),通过关键词辅助检索。,(3),通过词素检索扩大检索入口。词素检索是新出现的检索手段,是对关键词检索的补充。医学名词往往由数个词素构成,每个词素均有一定的含义。词素检索可以扩大检索范围,提高查全率。,三、计算机情报检索,电子计算机医学情报检索,(,机检,),是指利用电子计算机对医学文献,(,如题录、文摘、全文等,),,数据,(,如化验正常值等,),、事实,(,如治疗方案、医疗和医学科研机构的构成,),、图像,(,如,x,光片、,CT,片、组织切片等,),以及其它医学信息进行存贮与检索的过程。,2,机检的历史与发展,(1),脱机检索阶段,(1954,1964,年,),;,(2),单机多终端联机检索阶段,(,1965,1970,年,),;,(3),计算机网络检索阶段,(1971,年,),;,(4),光盘检索阶段,(1985,年,),;,(5),多媒体综合情报检索阶段,(1990,年,),3,机检的特点,(1),高速准确。计算机检索可在数分钟内完成传统手工检索需数周或数月才能完成的工作,只要检索策略合理,其查全率与查准率均高于手工检索。,(2),多途径综合检索。,(3),一次输入,多次输出。一般数据库检索系统除完成机检工作外,还具有编排打印印刷型检索工具和文献统计等功能。,(4),远距离信息传递,全球信息资源共享。,(5),检索技术难度增大。,
展开阅读全文