资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,数字图书馆的概念,数字图书馆,Digital Library,Electronic Library(,电子图书馆,),CD Library(,光盘图书馆,),Virtual Library(,虚拟图书馆,),Nowall Library(,全球图书馆,),数字图书馆:,是一个收集、组织、管理,并提供数字化信息服务的大系统。,数字图书馆的特点:,数字化资源、网络空间、多媒体、多语言、智能检索、全文检索。,The concept of a digital library is not merely equivalent to a digitized collection with information management tools.It is rather an environment to bring together collections,services,and people in support of the full life cycle of creation,dissemination,use,and preservation of data,information,and knowledge.,(,www.si.umich.edu/SantaFe/Introduction.html,),数字图书馆的概念不仅仅是数字化馆藏及其信息管理工具的等价词,而是一种环境。它将馆藏、服务和人整合成一个环境,以支持数据、信息乃至知识的创造、传播、使用和保存。,数字图书馆的本质,数字图书馆既是一种环境,数字图书馆又是一种服务,数字图书馆也是一个过程,数字图书馆是要使任何人,在任何时间,从任何地点,获取其所需的任何知识(,5A,:,All the citizens anywhere anytime can use any Internet-connected digital device to search all of human knowledgePITAC,2001,.,)。,既然数字图书馆是一种服务,所以在进行数字图书馆建设时,一定要以用户服务为导向,以用户需求为驱动,以用户满意度为指标。,书目数据库,(,bibliographic database,),是指存储某个领域的二次文献(如文摘、题录、目录等)书目数据的一类数据库,属于,参考数据库,中的一种。其数据主要来源于期刊论文、会议论文、研究报告、学位论文、专利文献、报纸等各种不同的一次文献信息源。,(,1,)书目数据库,图书馆馆藏目录的,OPAC,系统,CALIS,的系列书目数据库系统,ZADL,联合目录,中文社会科学引文索引(,CSSCI,),中国科学引文数据库(,CSCD,),典型中文书目检索服务系统,引文索引思想最早在,1955,年由美国学者加菲尔德提出。,引文索引是从文献之间的引证关系着手,去揭示科学文,献之间,(,包括学科之间,),的内在联系。,撰写论文称为“来源文献”,或“引证文献”,其文后的“参考文献”则为“引文”或“被引文献”,(Citation),。,文献的引证关系,比较深刻地反映了科学文献之间的内在联系。,可以找到一系列内容相关的文献以及某一学术观点的发展脉络。这样不但可以看出某一学科的研究动态、研究情况,而且可以看出这一学科的核心作者群,还可以根据某一名词、某一方法、某一概念、某一理论的出现时间、出现频次、衰减情况等,分析出学科研究的走向和规律。,引文索引概念,中文社会科学引文索引英文全称为,“,Chinese Social Sciences Citation Index”,,,缩写为,CSSCI,。,是由南京大学中国社会科学研究评价中心开发研制的数据库,用来检索中文社会科学领域的论文收录和文献被引用情况。,中国科学引文数据库英文全称,Chinese Science Citation Database,,简称,CSCD,。,1996,年由中国科学院文献情报中心首次在国内推出基于引文索引理论和方法建立的引文数据库。它收录了国内出版的中英文科技核心期刊,582,种,,1997,年采用来源文献近,6.6,万篇。,CSCD,的研制成功,为我国的科学研究工作增添了一个极为重要的工具。,引文数据库,全文数据库是一种,源数据库,(,source database,),通常存储有文献的全文或其中的主要部分。,全文数据库最早出现于法律领域。,自,1970s,末期以来,尤其,1980s,中期,CD-ROM,商用化以后,全文数据库大量涌现。继法律领域之后,经济、新闻、文学、医学、化学及专利等领域先后推出了各种全文数据库。,(,2,)全文数据库,中国知网(,CNKI,),清华同方公司的全文数据库产品,重庆维普公司的全文数据库产品,中文科技期刊全文数据,万方数据公司的全文数据库产品,数字化期刊群,E,读学术搜索引擎,超 星电子图书,书生之家数字图书馆,著名中文全文数据库产品,2.,维普中文科技期刊数据库,是由重庆维普咨讯有限公司开发的期刊全文数据库。收入我国,1989,年至今出版的,9000,余种科技期刊的全部原文,按照,中国图书馆分类法,进行分类,所有文献被分为,8,个专辑,:,社会科学,自然科学,工程技术,农业科学,医药卫生,经济管理,教育科学和图书情报,.8,大专辑又细分为,35,个专题。,访问方式,:镜像、官网,浏览器,:,VIP,浏览器和,Adobe Reader,浏览器,3.,万方数据资源系统,万方数据资源系统是由中国科技信息研究所和万方数据股份有限公司于,1997,年,8,月联合研制开发的以科技信息为主,集经济、金融、社会、人文信息为一体的网络化信息服务系统。,汇聚,9,大类,110,多个数据库,内容涉及自然科学、社会科学、商务信息等各个领域,收录范围包括期刊、会议论文、学位论文、研究报告、技术标准、专利、企业产品、法律法规、工具书等。,4.,读秀,期刊导航,全省纸本刊、电子刊分类导航,-,整合导航期刊,56701,种,-,中文期刊,17428,种,-,外文期刊,39273,种,门户资源,:,浙江高校联合目录,整合资源规模:,ZADL,项目实施内容,17,服务平台,应用体系,文献传递与馆际互借服务,虚拟参考咨询服务,人才队伍,工作体系,门户网站,基础技术平台,管理制度,考核激励机制,数据库集团采购,自建特色数据库,资源,服务,机房、网络基础环境,技术支撑,统一检索资源获取,资源揭示,ZADL,资源建设进展,ZADL,项目资源建设路线(三大块资源内容),以集团采购方式购买国内外重要学术资源库,自建特色资源库,整合各成员馆自有资源,资源建设进展,ZADL,联合采购资源库:,已完成,33,个,数据库,联合采购,自建特色数据库:,33,个,自建库,(涵盖中医、机械、纺织、历史人文、烹饪、音乐、文学、旅游、商业、民俗等专题)已完成整体发布,建成浙江高校联合目录,整合资源范围:各高校馆,OPAC,系统、各类电子数据库、自建库,已建成资源库,规模,(ZADL,建设方案指标,),以团购方式建成的资源库规模,中外文电子期刊约,2,万多种,(,16000,),。其中,中文,12000,多,种,外文,12000,多,种),外文电子书,21949,种,(2,万册,),,中文电子图书,165,万,种,(100,万册,),外文学位论文,94708,篇,中文学位论文,30,万,篇,(,30,万,篇,),中外文二次文献数据和事实型数据库等数字资源:,外文文摘,4400,万余,条,来源于,35000,多种期刊和会议录,外文报纸,1500,余份,各类视频,2000,小时容量:超过,200TB,(50TB),19,专门提供以数值方式表示的数据(或包括其统计处理表示法)的一种源数据库。例如,各种统计数据库,财务数据库,科学技术数据库等。,与文献数据库相比,数值数据库是人们对信息进行深度加工的产物,它可以直接提供解决问题时所需要的数据,是进行各种统计分析、定量研究、管理决策等的重要工具。,(,3,)数值数据库,图书联合目录,统一检索,期刊联合目录,数据库联合目录,中国高等教育文献保障系统(,China Academic Library&Information System,简称,CALIS,),是经国务院批准的我国高等教育“,211,工程”“九五”“十五”总体规划中三个公共服务体系之一。,CALIS,的宗旨是,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来,建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,以发挥最大的社会效益和经济效益,为中国的高等教育服务。,6 E,读学术搜索引擎,e,读是,CALIS,三期重点打造的,CALIS,学术搜索引擎,其建设目标是整合全国高校纸本资源和电子资源,揭示资源收藏与服务情况,作为国内最大的高校学术搜索引擎,通过提供分面检索,帮助读者更迅速地定位资源。同时链接到,CALIS,全文获取服务,践行,CALIS,三期倡导的“一个账号,全国获取”、“可查可得、一查即得”的服务理念。,e读有什么?600多家图书馆的丰富馆藏;200多万种图书;3600多万篇外文期刊论文;70万篇中外文学位论文;下一步:古籍、拓片等特色资源。在尊重知识产权的基础上,为高校师生提供全文学术资源。e读的资源每天都在增加。e读能做什么?e读嵌入图书馆公共查询系统(OPAC),作为检索入口;可从图书馆OPAC回链到e读,揭示更丰富的资源。,指南型数据库,(,Directory Database,),,存储能够提供用户参考、给予用户指南的各类信息,如商业、企业等机构的名称、联系地址、项目内容、人物等简要描述的一类数据库,也称指示性数据库。例如:公司名录数据库、人物传记数据库、技术标准数据库、产品目录数据库等都属于这一类数据库。,数值数据库类型,统计数据库、市场行情、调查分析数据库等,这类数据库的出现,已成为科学研究、工程设计、管理决策、定量分析等的重要工具。,术语数据库,(,Terminological Database,)指专门存储名词术语、词语信息的一种源数据库,如各类电子字词典。,图像数据库,(,Graphics Database,)指用来存储各种图像或图形信息及有关文字说明资料的一种源数据库,例如:主要用于建筑、广告设计、装潢、产品目录等方面的图像数据库。,数值型数据库,(Numerical Database),其存储的信息为数据,专门提供数值方式表示的一类数据库。如各种,数值数据库类型,计算机检索系统中数据库主要有,文档,、,记录,、,字段,三个层次构成。,(,1,),文档,(,File,),若干个逻辑记录构成的信息集合称为文档(或称文献数据库),它是组成文献检索系统的基本单元。,有些文档因规模庞大,被分成若干个文档。如在,DIALOG,系统中,,CA SEARCH,数据库被分为:,308,号,(19671971),、,309,号,(19721976),310,号,(19771981),、,311,号,(19821986),312,号,(19871991),、,313,号,(19921996),314,号,(1997,),等,7,个文档。,用户可以根据自己的需要,选择一个或多个文档(或数据库)进行检索。,二、数据库的构成,一个数据库至少包含一个顺排文档和多个倒排文档。,顺排文档,是将数据库的全部记录按照记录号的大小排列而成的,它是数据库的主体内容,类似印刷型的正文部分。,倒排文档,是将记录中一切可检索字段(如著者、主题词、叙词等)抽取出来,按其在文档中的位置和所在文档的序号重新加以组织,这样可以按不同字段组成不同的倒排文档(如著者倒排文档、主题词倒排文档等),也可以组成一个不同字段的混合倒排文档,加快检索速度。相当于印刷型检索工具的索引部分。,(,1,)文档(,File,),记录是文档的基本单元,一个记录相当于一篇文献,在全文数据库中,是一篇完整的文章,而在文献型数据库中,则是一条文摘或题录。,(,2,)记录(,Record,),字段是记录的基本单元,每条记录由若干字段组成,字段一般对应信息的著录项,可分为基本字段和辅助字段两种。,基本字段,是用来表达文献内容特征的字段,如题名字段、文摘字段、叙词字段等;,辅助字段,用来表达文献外表特征的字段,如作者字段、出版年份字段等。,(,3,)字段(,Field,),数据库中常见字段和缩写,基本字段,辅助字段,字段名称,英文全称,缩写,字段名称,英文全称,缩写,题目,Title,TI,记录号,Document Number,DN,文摘,Abstract,AB,作者,Author,AU,叙词,Descriptor,DE,作者单位,Corporate Source,CS,标题词,Identifier,ID,期刊名称,Journal,JN,出版年份,Publishing Year,PY,出版国,Country,CO,文献类型,Document Type,DT,文献性质,Treatment Code,TR,语种,Language,LA,字段说明,1,All fields:,全部著录项目,默认字段。,Subject/Title/Abstract:,主题词、文摘、标题,Author:,作者或编者,该字段检索输入时姓在前名在后,需要输入作者名的所有可能形式:如:,ma,jingdi or ma,jing-di or jingdi,ma or jingdi m or ma,j.d.,作者名后可以使用截词符。如:,ma,j*or jingdi,m*,用作者字段检索时可参考索引表。,Author affiliation:,作者机构。,70,年代以前机构名称用全称表示,,80,年代使用缩写加全称,,90,年代用缩写。,Publisher,:,出版者,Serial title:,期刊、专著、会议录、会议文集的名称,Title:,文章的标题,Ei controlled term:,Ei,受控词。来自,Ei,叙词表,它从专业的角度将同一概念的主题进行归类,因此使用受控词检索比较准确。,三、数据库系统的主要功能:,1,)布尔逻辑检索功能,单独的检索词不能满足课题的语法要求,因此需用逻辑算符加以组配。布尔逻辑是由,19,世纪英国数学家乔治布尔提出来的,其逻辑算符有,OR,(或)、,AND,(与)、,NOT,(非)三种。,1),逻辑,“,与,”,AND,(,*,),表示两个概念的交叉,用来组配不同的检索概念,其含义是检出的记录必须同时含有所有的检索词。,(,2,)逻辑“或”,OR,(,+,),,表示几个概念相加,用来组配具有同义词、相关词等,在实际检索中,同一组面中含义相同的词,相互之间都使用,OR,运算符,用于扩大检索范围,提高查全率。,(,3,),逻辑“非”,NOT,(),,表示概念的排除,即检出的记录中只能含有,NOT,算符前的检索词,但不能同时含有其后的检索词。,A,B,A,B,A,B,例,Solar*Energy,例,www+internet+network,例,Energy,Nuclear,除核能以外的有关能源方面的文献才被命中。,逻辑提问式:,用逻辑符号将提问特征(主题词、分类号、作者等等)连接起来的式子叫逻辑提问式。例:,A and B(A*B),:表示同时包含,A,和,B A or B(A+B),:表示包含,A,、,B,中的任何一个即可,A not B(A-B),:表示包含,A,但不包含,B,。,II.,编写逻辑提问式应注意:,a:,全面准确选词以反映提问的实际内容,b:,当用户提问中的主题找不到准确的主题词时,可以 先用自由词检索,必要时用上位主题词和相关词检索。,C:,提问式尽量简化,如,(1)*(2)+(1)*(3),应为,(1)*(2)+(3),2,)截词检索功能:,截词是检索相同词干的所有单词的一种联机检索方法。使用截词算符,可减少检索词的输入,扩大检索范围,提高检索效率。,一般检索系统用,“,?,”,和,“,*,”,表示截词符。,分类:,根据截词位置可以分为,后方截词、前方截词和中间截词三大类。,按截词字符数又可分为有限截词和无限截词。,前方截词:,将截词符放在词根的前边,后方一致,表示在词根前方有无限个或有限个字符变化。例如:,Software,(软件),Hardware,(硬件),可用“,?ware,”,代替。,?Computer,那么,microcomputer,及,minicomputer,就不会漏掉了。,后方截词:,将截词符放在词根后面,前方一致。例如:,comput,?可检索出,compute,、,computer,、,computerized,、,computerization,等。,data?,则,database,data system,data handling,都会检出。,中间截词:,将截词符号置于检索词的中间,而词的前、后方一致。,例如:,colo?r,包含,colour,(英)和,color,(美)两种拼写方法。,非限制性截词:“?”加在词干或不完整的词上,对词的完整意义进行检索。例:,computer?,代表,Computer,computers,computerized,等,限制性截词:,analy?er,命中记录中将出现,analyzer,和,analyser,;,work?,命中记录中将出现,,work,works,worker,workers,working,布尔算符中的逻辑“与”只要求两个检索词必须同时出现在同一篇文献中,而没有限定算符两侧检索词之间的位置关系,有时难免造成误检。,3,)常用算符位置算符,例如,,查找“细菌对染料破坏”方面的文献,,检索词:细菌、破坏、染料,逻辑“与”组配,检索结果:命中同时用这三个词标引的文献,有“细菌对染料的破坏”方面的文献,,也会有“染料对细菌的破坏”方面的文献,,(要排除后一部分的文献,就需用位置算符限定词与词之间的位置关系。),3,)常用算符位置算符,3,)常用算符位置算符,在,DIALOG,检索系统中使用的位置算符主要有:,(,With,)算符,:,(W),或,(,nW,),词序不许颠倒,两词必须紧挨在一起,词之间不许插词,只许空格或连字符号,A,(,W,),B,例,:,CD(W)ROM,将命中,CD ROM,或,CD-ROM,solar()energy,检出,solar energy,A,(,nW,),B,表示,A,、,B,之间最多可插入,n,个单词(,n,为整数),词序不变。,(nW),算符:“,n words”,的缩写,(nW),是从,(W),算符引伸出来,检索词之间允许插入,0,n,个词,词序不许颠倒,例,anticorrosion(1W)paint,可检出,anticorrosion paint,和,anticorrosion of paint,例 检索“材料磨损”(,WEAR OF MATERIALS,)方面的文献,,检索式:,WEAR(1W)MATERIALS,3,)常用算符位置算符,(N),算符:“,Near”,的缩写,A,(,N,),B,词序可以颠倒,两词之间不许插词,例,cross(N)section,可检出,cross section,和,section cross,N,(,Near,),3,)常用算符位置算符,(nN),算符:,A,(,nN,),B,(nN),是从,(N),算符引伸出来,检索词之间允许插入,0,n,个词,词序可以颠倒,(F),算符:“,Field”,的缩写,A,(,F,),B,算符两侧的检索词必须在同一字段内,词序及两词间插入的词数不限,但使用此算符时必须指定所要找的字段。,例:,digital(F)computer/TI,AB,注意!,在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。,3,)常用算符位置算符,(S),算符:“,Sentence”,和“,Sub-field”,的缩写,算符两侧的检索词必须在同一句子,词序及两词间插入的词数不限,3,)常用算符位置算符,上述位置算符可以混合用于同一检索式中,由于检索系统是按从左到右的顺序处理检索式,因此,应将限制最严的算符放在最左边。,四、数据库系统检索的原理和方法,1,、文献在计算机内的存在形式:,有,2,种,1,)顺排文档:,是将文献的各种特征(如顺序号、著者、出处、分类号、主题词等)按一定的格式、一定的规则输入计算机排列起来的文献库。可供顺序查找。顺序号:是每篇文献在数据库中位置的代号,有时按照它们进入计算机数据的顺序编号,有时也叫文摘号。,2,)倒排文档:,是以文献中具有检索意义的字段为依据建立起来的文档,可与印刷型检索工具串的,“,索引,”,相对应。如有:,主题倒排文档 关键词倒排文档 著者倒排文档 分子式倒排文档 专利号倒排文档,2,、,文献数据库检索步骤,分析课题,确定检索要求和目标,拟定检索词,检索式,选择数据库,确定检索途径,实施检索并显示检索结果,用,检索技术,优化检索结果,选择输出(打印、拷贝或发送至电子邮箱),1,)审清主题,2,)确认检索方向,3,)选择合适的信息源,4,)用好检索策略,5,)评价检索结果,6,)调整检索策略,2,、,文献数据库检索步骤,分析课题是实施检索最重要的一步,是检索效率高低或成败的关键。,面对一个课题需要找出它的研究范围,国内外研究现状以及将要达到的目的。找出 课题所涉及的主要内容和相关内容,形成主要概念和次要概念,选取主题词。,将课题需求概念转换成检索概念。,查阅书刊,寻找综述性文章。,1,)审清主题,主题分析要充分,使课题主要特点不遗漏,析出的主题与课题实际内容要一致,如表示的概念过大,必然造成误检;表达的概念过小,则会发生大量漏检,简化逻辑关系,减少概念数。有些用户却误认为选取的概念越多、逻辑组配越细致,检索出来的结果针对性越强。其实不然,过多过严的概念逻辑组配,很可能导致大量的漏检,甚至结果为零,忌望词生义,审题要求,突出重点,去掉次要,隐性主题显性化,抽象概念具体化,排除非关键概念和重复概念,主题概念提取方法,不要将课题中无关重要的内容分析为主题,使信息发现出现偏差,造成误检,化合物,A,化合物,B,分离 干燥 包装,突出重点,去掉次要,经过对课题的详细分析,比较完整、准确地了解了检索课题的主题内容后,,利用前面介绍的布尔逻辑运算符、位置运算符、截词符和字段符,,对各检索词进行逻辑和位置组合,列出检索式。,当检索式输入检索系统后,有时检索结果不一定能满足课题的要求,例如:,(,1,)输出的篇数过多,而且不相关的文献很多(调整方法:核对主题词、截词不易过短、用逻辑与限制概念等);,(,2,)输出的文献太少(调整方法:核对主题词、考虑同义词、选取上位概念、位置算符不易用得过严等)。,编制检索提问式,例:“利用稻米皮糠提取天然食品色素”,-,粗看有,7,个概念,即利用、稻米、皮糠、提取、天然、食品、色素,若都作为逻辑“与”的概念组配,检索结果可能为零。,-,实际上,只要取两个关键概念:,稻米与色素,。因为稻米包括了皮糠,只要把“稻米”与“色素”这两个概念组合进行组配,有关提取、制造、利用等方面的文献都会带出来,而从稻米中提取的色素一定是天然的,而不会是人工合成的。,例:“化妆品辐射灭菌”,-,粗看有三个概念,即:化妆品、辐射、灭菌;,-,仔细一分析,对化妆品进行辐射就是为了杀菌,一篇文献只要谈到化妆品的辐射,一般就是讲灭菌的了。因此,应将灭菌这一概念排除掉。,排除非关键概念和重复概念,所谓隐性主题,就是在题目中没有文字表达,经分析、推理得到的有检索价值的概念,如,课题“高温下使用的不锈钢”,其显性主题为“不锈钢”,而隐性主题概念为“耐热钢”,如,课题“丙酮丁醇制造中的纤维酶的应用”,“发酵”这个概念就为隐性概念,如,课题“酸洗废液的处理”,“处理”一词就隐含着“回收”和“再生”等概念,隐性主题显性化,课题中往往只列出了表达抽象概念的词,而忽略了那些表达具体概念的词。例如,查找“煤灰利用”方面的文献,以为只要提出“煤灰”和“利用”这两个概念词,就能把所有“煤灰利用”方面的文献检索出来。,实际上,根据标引规则,那些论述煤灰的具体利用的文献,如利用煤灰制造“砖”、“水泥”、“鱼礁”、“肥料”、“骨料”、道路的“路基”以及回收“金属”等等,都是具体的概念进行标引的。,抽象概念具体化,“,代理母亲”(,surrogate mothers,)一词,就误以为是指“保姆、养母、奶妈或继母”等,而实际上用户要查找的是“以替其他妇女怀孩子为职业的妇女”的有关社会道德与法律问题;,见到“麦饭石”(,bakubanseki,)就误以为是“麦饭”,+“,石头”(麦饭石是一种中药材);,见到“热管”(,heat pipe,)就误以为是“热水”,+“,管道”(热管是一种新型的节能技术),忌望词生义,主题分析后提取重点,标题(,直接涉及项目中心思想),领域,(直接所属或直接应用领域),目的,(要解决的技术问题),技术方案,(实现目的的手段,创新性)、,效果,(技术指标),2,)确认检索方向,目的技术方案,如:,汽车用镀锌钢板:汽车钢板,锌,技术方案,如:,含配方,检索;没有,检索、;没有,分别检索、,目的领域,如:,采用变频技术的节能空调:节能空调,目的,部分技术方案,“开发出一种医治胃溃疡的中药配方,含有、成份,经临床,250,人使用统计,显效率达,80%”,分析:,标题:“高效医治胃溃疡中药”,领域:中药,目的:治好胃溃疡,技术方案:、配方,效果:显效率达,80%,例:“高效医治胃溃疡中药”,检索策略,、技术方案目的,胃,、技术方案,、目的领域,胃溃疡中药,、部分技术方案目的,()胃,检索结果:,策略出现两种情况,检索到文献,结论:,国内已有含有,A,、,B,、,C,配方的用于治疗胃溃疡的中药。,未检索到文献,结论:,国内未发现含有,A,、,B,、,C,配方的用于治疗胃溃疡的中药。,策略,2,出现两种情况,检索到文献,进一步查看原文,发现其用于肝病治疗。结论:,国内已有含有,A,、,B,、,C,配方的中药,用于肝病治疗,但未见用于胃溃疡的治疗。,未检索到文献,结论:,国内未发现含有,A,、,B,、,C,配方的中药。,策略,3,出现两种情况,检索到文献,结论:,国内已有,X,配方和,Y,配方的中药,可用于治疗胃溃疡,显效率分别为,50%,和,60%,,而该课题采用,A,、,B,、,C,配方有显著创新,未检索到文献,结论:,国内未发现含有,A,、,B,、,C,配方的用于治疗胃溃疡的中药。,策略,4,出现两种情况,检索到文献,结论:,用于胃病治疗的中药,有含,A,、,B,或,B,、,C,配方的,但未见含有,A,、,B,、,C,配方的,未检索到文献结论:,国内未发现含有,A,、,B,、,C,配方的用于治疗胃溃疡的中药。,当然理想的检索策略是同时包含上述种,最终结论:,国内已有含有,A,、,B,、,C,配方的中药,只是用于肝病治疗;用于胃病治疗的中药,有含,A,、,B,或,B,、,C,配方的,显效率分别为,50%,和,60%,;而该课题采用,A,、,B,、,C,配方制成用于治疗胃溃疡的中药,有显著创新,显效率达,80%,,达到国内领先水平。,丰富的数据库及国内外文献资源支持,是检索文献资料的基础,对各种文献数据库的存贮信息的内容及范围必须充分了解,灵活应用。确定检索数据库的依据和原则,主要是根据所查课题的内容,使课题相关的信息都包括在被选用的数据库中,以重点专业数据库为主,一般数据库为辅,检索范围要求,全面性、系统性和连续性(资源有效性),3,)选择合适的信息源,选择与检索课题密切相关的专业类数据库,选择专利类数据库,了解前沿信息,选择大型、知名的综合类数据库,选择检索途径丰富的数据库,选择全文数据库,选择适合自己语言的数据库,数据库的选择要点,(,A,)选对检索词,(,B,)用好运算符,(,C,)构好检索式,(,D,)选择检索途径,4,)用好检索策略,全面了解课题内容,从中找到合理的检索词。要分析、对比找到正确的主题,删除不合适的检索词。,明确研究对象涉及到的内涵和外延以外,应了解采用的方法、路线,深刻领会课题实质内容,将其转化成检索概念,并查找主题词表,树状结构表,确定主题词。,不要整个课题输入作为检索词。,(,A,)选对检索词,题目大、内容窄(针对窄),-,例,1,:汽车用钢板的开发与应用研究,实际汽车镀锌钢板,-,例,2,:现代大型温室标准化栽培技术体系研究与产业化示范,实际现代温室黄瓜和番茄标准化栽培,题目小、内容宽(拆),题目与内容交盖(取交盖部分),选择检索词(从题目和内容),课题主要内容及检索要求:“经过实验研究表明:,活血化瘀药,一定要在降压治疗的基础上用,用得越早、越长时间就越能遏制血管壁重建(通过抑制血管平滑肌的增殖及抑制,MMP2,、,ET1,等的表达)”。,“活血化瘀药”这个检索词要求的范围就比较广泛,按照要求查出了许多与该内容相关的文献。,通过分析课题发现:该课题实际研究对象是复方丹参滴丸而非其上位的广泛概念词活血化瘀药。,例:活血化瘀法对自发性高血压大鼠血管壁重建的干预及可能机制,(,1,)选择专用词(低频词),不用“研究”、“开发”等泛词,越专越好;,(,2,)考虑同义词、学名、别名、俗名、商品名等,如“电脑”的同义词“微机”、“计算机”;,(,3,)考虑近义词,如“制备”、“制造”、“合成”、“生产”等,每一个关键词下均能找到文献,但若采用其中一个关键词去检索,往往只能找到其中的一部分文献;,(,4,)缩略语、元素符号;,(,5,)上、下位词的互代,如“果树病虫害的防治”中的“果树”是概念过大的词,不一定能代替“苹果树”、“梨树”等下位词;又如“草菇的工厂化栽培”中的“草菇”概念过小,不能代替“食用菌”这一上位词;,(,6,)相似性质词的借代:如“上海综合防灾体系的研究”,“上海”可以考虑“城市”、“北京”、“东京”、“纽约”等,检索词要求,(,1,)学名与俗名。如大豆与黄豆、马铃薯与土豆、乙酰水扬酸与阿斯匹林或阿斯匹灵、氢氧化铵与氨水。,(,2,)意译与音译。如电动机与马达、激光器与莱塞、镭射。,(,3,)新称与旧称。如狗与犬、杜鹃与子规和杜宇、索引与通检、硅与矽。,(,4,)异地称。如撰稿与方案、助产妇与稳婆、小偷与三只手。,(,5,)不同领域或行业的异称。如智囊在政界多称幕僚、军界则称参谋。,(,6,)小时称与大时称。如小马称驹、小牛称犊、小人称孩。,异称词的选取,检索词确定后,根据课题内容,组配检索词,确定各个检索词之间的合理的逻辑关系,构成正确的检索式,要注意检索的逻辑组配关系,要考虑检索式与检索词之间以及检索式之间的可能组配,扩展与限制检索,把握概念的网罗度与专指度的关系,因数据库而异,(,B,)构好检索式,一般来说,每个数据库都有多个检索途径,常用的有:篇名、作者、关键词、摘要、全文、出处、分类等。,检索前用户要告诉计算机,以什么检索途径来进行检索。如果要查找篇名中含有某个词的文献,则检索途径选择“篇名”;如果要按文献的分类来检索,则检索途径选择“分类”。,(,C,)选择检索途径,文献量适中,文献量太多,文献量太少(甚至,0,),造成检索结果为“,0”,的原因,可能是在检索过程中,由于检索词选择不当或组配不正确,检索工具确定不恰当和检索途径单一等,而导致检索结果的错误,(,5,)评价检索结果,检索途径限制 掌握各种方法,标引深度限制 减少检索词,文献种类限制 选用合适信息源,检索系统限制,1,)选词不当,2,)组配不当,3,)逻辑算符选用不当,4,)系统选用不当,5,)时段估计不当,漏检和误检的原因分析,在检索时为了防止漏检,应采用广种薄收的方法,一检索多达,815,个数据库,在检索时应先选择专业库,综合库,在“维普”中查找“变频空调”,检索策略,命中篇数,变频,AND,空调,968,变频,OR,空调,32861,变频,/ti AND,空调,762,变频空调,394,变频空调,/ti,265,扩检,(提高查全率),降低检索词的专指度,用上位词或相关词放宽检索,使用关键词索引时,可通过增加同义词、近义词等增加命 中文献数,也可通过截断符减少由于拼法不同或词尾不同 而造成的漏检,增加待检的检索工具与数据库,多种索引配合使用,缩检,(提高查准率),提高检索词的专指度,用逻辑乘连结一些进一步限定主题概念的相关检索项,用逻辑非排除一些无关的检索项,利用文献的外表特征(文献的类型、语种、出版年代等)限制输出的检索结果,限制检索词出现的可检索字段,并指定邻接和优先关系,(,6,)调整检索策略,审题把握重点,查综述性文章把握宏观和理解内容,检索词和数据库宜专,检索式先紧密后松散,主题放在标题中,检索词不要太多,特别是可能在原文中出现的检索词,找出一篇最相关的文献,进一步斟酌检索策略,检索技巧总结,检索系统进行检索时产生的有效结果,它直接反映了检索系统性能的好坏。,衡量检索效果的指标,查全率,(recall ratio),查准率,(precision ratio),3,、检索效率,检索出的相关文献量,数据库中的全部相关文献,查全率,R=,x100%,检索出的相关文献量,检出的文献总量,查准率,P=,x100%,最理想的检索结果是查全率和查准率都达到,100,。,R,100,表示数据库中收录的全部相关文献都被检索出来,P,100,表示检索出来的文献全部都是相关文献,但事实上,检索中有许多因素使这个指标很难达到,。,R,0,P,查全率,R,与查准率,P,的关系曲线,C,A,D,B,C.W.Cleverdon(,英,),进行,Granfield,试验,得出,查全率,R,与查准率,P,曲线。,R,P,之间存在着互逆关系,A,点,检索词数量多,泛指性强,,查全率较高但查准率却非常低,B,点,检索词专指性较强,查准率就高,查全率因此降低,C,D,两点,两种极端的折衷。,查全率一般在,60,70,查准率一般在,40,50,无论怎样调整检索策略和改进系,统效率,都无法使,P,和,R,同时接近,100,。,找出满足需要的文献,核心,查准,兼顾,查全,正确把握查全率和查准率的关系。在准的基础上尽量求全,以便比较、借鉴和参考,3,、检索效率,1,、农业机器人课题,Robot*and(agricultural or fruit or orange or tomato or grape or strawberry or harvesting),农业,agricultural,,机器人,robot,,水果,fruit,,蔬菜,vegetable,,西红柿,tomato,,柑橘,orange,,黄瓜,cucumber,,葡萄,grape,,西瓜,watermelon,,园艺,horticulture,,蘑菇,mushroo
展开阅读全文