资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2020/3/1,#,第,1,节 文献信息检索的基本概念,一、文献、信息、信息源,1.,定义,文献:,用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。,信息:,广义地说,信息就是消息。,指对接收者来说预先不知道的报道。(辞海),是用来通信的事实,在观察中得到的数据、新闻和知识。(韦氏字典),是一切思想、事实和富有想象力的作品,它们以各种方式进行记录和传播。(信息专家),第,1,节 文献信息检索的基本概念,信息源:,是指人们为满足某种需求而借以获得信息的一切来源。凡是能产生、存储、加工、传递信息的社会活动场所、机构、人物、产品和自然物质都是信息源。信息源可分为非文献信息源和文献信息源。,2.,文献信息源的类型,文献信息源:,是指用一定的记录手段将系统化的信息内容储存在纸张、胶片、磁带和光盘等物质载体上而形成的一类信息源,。,第,1,节 文献信息检索的基本概念,按文献的载体介质划分为,印刷型,Printed form,:以手写和印刷技术为手段,以纸张记录信息的载体形式存在。,缩微型,Microform,:以感光材料记录文字及其相关信息的载体。,声像型(视听型),Audio-Visual form,:记录声音、图像信号的信息载体。,机读型(电子型),Machine Readable form,:以电子版本形式存在。电子版本包括:,floppy,Magnetic tape,CD-ROM,online,network,多媒体,multi-media,:计算机对数字化视听信息交互存取。,第,1,节 文献信息检索的基本概念,按文献的出版类型划分,图书(阅读类、工具类),期刊(一次文献、二次文献),特种文献(专利、科技报告、会议录、政府出版物、学位论文、标准、技术档案、产品目录等),第,1,节 文献信息检索的基本概念,可具体分为,科技图书,Sci-Tech book,,,Monograph,Anthology,Textbook,,,Reference book,科技期刊,Sci-Tech Journal(magazine*,serial,periodical),科技报告,Sci-Tech Report,专利文献,Patent Document,,,Patent specification/bulletin,会议文献,Conference paper,,,Proceedings,compilation,collected paper,records,,,meeting,,,seminar,colloquium,symposium,conference,学位论文,Dissertation,Thesis,标准文献,产品资料,技术档案,政府文献,第,1,节 文献信息检索的基本概念,科技图书(,Book,):,对已有的研究成果或生产经验所作的概括论述。,特点:带有总结性、成熟定型;出版周期长,信息传递慢;传授知识,而不是报道最新情报。,图书一般分为两类:,阅读型:教科书、专著等,工具型:字典、百科全书、年鉴、手册,科技期刊(,journal,periodic,),特点:名称固定、有连续的卷、年月顺序号、出版周期短,报道速度快、数量大,内容丰富。,据估计,从期刊获取的科技情报占整个情报来源的,60%-70%,。,第,1,节 文献信息检索的基本概念,会议文献(,conference paper,):,是指在各种学术会议上发表的论文。特点:传递信息及时、针对性强、内容新颖。一部分科研成果就是通过学术会议首次发表。,表示会议的相关词:,Proceedings,compilation,collected paper,records,,,Meeting,,,seminar,colloquium,symposium,conference,第,1,节 文献信息检索的基本概念,科技报告(,technical report,):,指学术团体、科研机构、大学研究所的研究报告及研究过程的记录。,目的:向上级主管部门汇报,特点:每份单独成册,有专门的编号;内容具体,有科研项目的研究方案,实验记录,实验数据,图表等;理论性强,是了解某一领域科研进展状况、发展动态的重要信息源;报道比期刊早;保密或控制发行。,第,1,节 文献信息检索的基本概念,世界上著名的科技报告有美国四大报告:,PB,美国商业部,AD,美国军事国防部,NASA,美国宇航局,DOE,美国能源部,这四大报告每年公开和解密部分约,6,万件。,科技人员对科技报告的需要量约占其全部文献量的,10%-20%,,特别在是发展迅速、竞争激烈的高科技领域。,第,1,节 文献信息检索的基本概念,专利文献(,patent document,),专利文献是一切与专利制度有关的专利文件的统称,如专利申请书和专利说明书、专利公报。,专利说明书是公开的文献,但只能由各国专利局发行,它反映了当前最新的技术成果。,学位论文(,dissertation,thesis,),是作者为获得某种学位而撰写的科学论文。博士论文具有较高的参考价值:,一般偏重于理论,附有大量的参考文献,借此可以看出有关专题的发展过程和方向。,学位论文一般不出版发行,而是保存在授予学位单位的图书馆里。,第,1,节 文献信息检索的基本概念,标准文献(,standard,),主要指技术规范、技术标准、操作规程、建议、准则、术语、专门名词等在内的各种技术文件。,技术标准是得到管理机构认可,适用于一定专业领域的技术规范,具有法定性;技术标准主要包括尺寸标准、材料标准、性能标准、方法标准、操作规程、术语和图形符号标准、文献标准等。,政府出版物(,government document,),是各国政府部门及其所属机构颁布和出版的文件资料,内容主要分为:行政性文件(如法令、统计等)、科技文件两大类。,对了解一个国家的科技和经济政策及其演变情况有一定的参考价值。,第,1,节 文献信息检索的基本概念,产品资料,提供产品技术规格的文献。是产品制造商为推销产品而印发的介绍产品情况的各种商业宣传品,如公司介绍、产品目录、产品样本、产品说明书等。介绍的一般是已投产和行销的产品。,具有技术成熟可靠、产品和技术信息较完整、及时性、图文并茂等特点。,技术档案,指在科技生产活动中形成的一系列以工程技术图纸、任务书、协议、合同、设计方案以及与此有关的调查统计数据等材料组成的文件。,技术档案具有技术性、适用性、保密性等特征。,第,1,节 文献信息检索的基本概念,特种文献收藏馆,专利文献:专利局文献馆,科技报告:中国科技信息研究所(中信所)、北京文献服务处(国防科技信息中心)。会议文献:国家图书馆、大学,/,研究型图书馆、中科院图书馆、邮电大学图书馆(,IEEE,),学位论文:国图、中信所、授予机构,/,院校,第,1,节 文献信息检索的基本概念,文献的级别,一次文献,/,信息,primary Literature/info,二次文献,/,信息,secondary literature/info,三次文献,/,信息,Tertiary literature/info,(,1,)一次文献,/,信息,primary Literature/info,概念:第一次书写的、第一次报道的或第一次出版的文献;以作者自己的研究成果、工作经验和实践体会为原始依据,信息内容具体、丰富。,特点:新颍性、创造性、系统性,如:,Journal literature,(期刊论文)、,Sci-Tech report,(科技报告)、,Proceedings,(会议录)、,Paper,(会议论文)、,Thesis,、,Dissertation,(学位论文),第,1,节 文献信息检索的基本概念,(,2,)二次文献,/,信息,secondary literature/info,概念:对一次文献的加工、提炼和浓缩,特点:浓缩性、汇集性、有序性,文摘,Abstract,索引,Index,目录,Catalog,题录,Bibliography,(,3,)三次文献,/,信息,Tertiary literature/info,概念:对一次文献和二次文献进行汇集、综合、分析、详述等深度加工而形成的产物。,Reference book,如:词典、百科全书、年鉴、名录、综述、述评、二次书目、指南,第,1,节 文献信息检索的基本概念,一、二、三次文献的区别,对象不同:,二次文献以“篇”或“本”为单位进行加工;,三次文献则归纳了较多的一次文献内容。,用途不同:,二次文献为检索一次文献的工具;,三次文献能直接提供检索答案。,学习文献检索课的目的:,如何通过二次文献去检索一次文献,第,1,节 文献信息检索的基本概念,文献信息检索基本概念,检索的手段,手检:书本型工具(刊)机检:数据库系统,检索点(途径)(,Access Point,),:,用文献各种内外特征,作为检索出发点,从不同角度来检索文献信息。,分类(,Classified,):所属学科性质,类别,分类体系现期检索,主题(,Subject,):所属主题内容,主题词,回溯检索,著者(,Author,);团体著者(,Corporate Author/Authors Affiliation,),名称(,Title,),代码(,Code/Coden,),第,1,节 文献信息检索的基本概念,检索的类型,事实型:,事实、数据(直接,确定)、参考工具书、,Numeric Database,、,Property Database,、,Textual-numeric Database,全文型:,Full-text Database,目录型:,馆藏目录、联合目录(,Union Catalog,),OPAC,:,Online Public Access Catalog OCLC,:,Online Computer Library Center,第,1,节 文献信息检索的基本概念,中国图书分类法,1.,中国图书分类法(中图法),用字母数字混合制标记,一个或两个英文字母和一串阿拉伯数字来代表一个具体的类目。,2.,中国科学院图书馆图书分类法,(科图法),中科院图书馆编制,主要用户为中科院系统,用户数居全国第二,类号标记采用纯数字。,3.,中国人民大学图书馆图书分类法,(人大法),中国人民大学图书馆编制,适合人大图书馆所藏书目,类号采用纯数字。,第,1,节 文献信息检索的基本概念,国外图书分类法,1,Dewey Decimal Classification System,杜威十进分类法,2,Library of Congress Classification,美国国会图书馆图书分类法,3,Universal Decimal Classification,国际十进分类法,索书号,排架号,构成:,分类号,+,文献次序号、分类号,+,著者号,第,1,节 文献信息检索的基本概念,国际标准书号(,ISBN,),国际标准书号(,International Standard Book Number,)简称,ISBN,,是国际通用的图书或独立的出版物(除定期出版的期刊)代码。出版社可以通过国际标准书号清晰地辨认所有非期刊书籍。一个国际标准书号只有一个或一份相应的出版物与之对应。,2007,年,1,月,1,日,-,国际标准书号的格式由,10,位修订为,13,位。国际标准书号由,13,位数字组成。前三位数字代表图书,中间的,9,个数字分为三组,分别表示组号、出版社号和书序号,最后一个数字是校验码。,例如:,2007,年前,7-109-04069-0,2007,年后,978-7-5043-6399-2,第,1,节 文献信息检索的基本概念,国际标准刊号(,ISSN,),国际标准连续出版物编号(,International Standard Serial Number,)简称,ISSN,,是根据国际标准,ISO3297,制定的连续出版物国际标准编码,其目的是使世界上每一种不同题名、不同版本的连续出版物都有一个国际性的唯一代码标识。,该编号是以,ISSN,为前缀,由,8,位数字组成。,8,位数字分为前后两段各,4,位,中间用连接号相连,前,7,位数字为顺序号,最后一位是校验位。,国内正式期刊的刊号是由国际标准刊号(,ISSN,)和国内统一刊号(,CN,)两部分组成,“,CN”,是中国国别代码。,例如:,ISSN 1002-6819,国内统一刊号,CN11-2047/S,第,1,节 文献信息检索的基本概念,馆际互借(,Interlibrary Loan,)简称:,ILL,对于本馆没有的文献,在本馆读者需要时,根据馆际互借制度、协议、办法和收费标准,向外馆借入;反之,在外馆向本馆提出馆际互借请求时,借出本馆所拥有的文献。适用于返还式文献。,文献传递(,Document Delivery,)简称:,DD,将用户所需的文献复制品以有效的方式和合理的费用,直接或间接传递给用户的一种非返还式的文献提供服务,它具有快速、高效、简便的特点。传递方式有,Mail,Fax,E-mail,等。,第,2,节 数据库及检索方法,一、基本概念,1.,数据库,至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。或者说:数据库是在计算机存储设备上按一定方式存储的相互关联的数据集合。,2.,数据库分类,数据库分为:,文献型数据库、非文献型数据库,文献型数据库分为,目录型数据库、题录文摘型数据库、全文数据库。,第,2,节 数据库及检索方法,目录型数据库:,主要是指各图书馆的馆藏图书、期刊目录亦称联机目录。这种数据库的信息以图书或者期刊为单位,其数据库内容详细,除描述标题、作者、出版项等书目信息外,还可以提供相关的分类号、索取号、馆藏等信息。,题录文摘型数据库:,收录的内容与题录文摘型工具书基本一致,是以文献为基本单元。数据库的著录项目包括了文献号、文献题目、作者以及工作单位、文献来源(如期刊名称、出版年、卷、期、页码等)、文摘、主题词、文中所附图表数和参考文献数。特点是收藏文献种类数量多、检索速度快。,第,2,节 数据库及检索方法,全文数据库:,是指存储全文信息或主要部分的数据库,数据库的存储内容还可以细分为期刊全文数据库、专利全文数据库、百科全书全文数据库等类型。,非文献型数据库包括,数据型数据库:如实验数据、化学分子式、价格,事实型数据库:百科全书、人名录、公司名录,概念型数据库:各种名词术语或语言资料,来源于词典。,图像数据库:卫星图片、云图、工程设计图,第,2,节 数据库及检索方法,3.,数据库结构特点,(,1,)字段:是数据库中最基本的单元,是文献的著录项目。可分为,3,种基本字段:检索系统的存取号字段、基本索引字段、辅助索引字段。,(,2,)记录:几个不同字段的集合构成记录,记录是数据库的基本数据单位。每条记录相当于题录文摘型检索刊物的一条著录款目。在同一个数据库中的记录往往含有相同的字段。,(,3,)文档:文档是按照一定结构组织的相关记录的集合。文档是文献型数据库组织的基本形式。文档的组织方式与检索系统的硬件和软件功能密切相关。,第,2,节 数据库及检索方法,基本索引字段,:,又称主题字段,用来表达文献内容特征的字段,如:,篇名字段(,Title Field/,TI,),文摘字段(,Abstract Field/AB,),叙词字段(,Descriptor Field/DE,),辅助索引字段(,Additional Index Fields,):,用来表达文献外部特征的字段,如,著者字段(,Author Field/,AU,),出版年字段(,Publication Year,Field/,PY,),刊名字段(,Journal,Field,/SO,或,JN,),语种字段(,Language,Field,/LA,),文献类型字段(,Document Type,Field,/DT,),辅助字段种类很多,且随数据库的不同而各有差异。,第,2,节 数据库及检索方法,检索词,检索词是用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录。,检索词分类及其特点,受控词:,受控词是事先规范化的检索语言,取自主题词表、叙词表、分类表等。如果数据库对数据采用了受控标引,并有机读式或印刷版主题词表时,应优先选用其中的受控词。,叙词:,指来自文献和用户并经过严格的多方面控制、用以表达文献主题或信息需求的单义词或代码。,主题词:,以规范化的词汇来表达文献内容的主题,。,第,2,节 数据库及检索方法,受控词特点,两类检索词中,受控词的检索效率高,一旦选定适当的概念,系统就能检出这一概念的全部内容,而且,由于标引人员已事先解决了自然语言中的同义、近义关系,使检索相对容易。,但由于其先组性质,受控词不能及时反映新事物的发展,而且概念数量有限、结构复杂,不能适应数量众多、要求各异的信息用户,也不易为非专业人员掌握。,第,2,节 数据库及检索方法,非受控词,非受控词是指非规范化的自然语言词汇,又称,自由词,。,特点:,非受控词可以在一定程度上弥补受控词的不足,非受控词可以是任意选词,其专指性强,而且不需要熟悉词表,新产生的名词术语可以及时检索与新概念有关的文献。但非受控词一般不能提供概念的等级结构,不能检索宽泛概念,不能解决同义词、近义词、相关词的结合或连接问题。,受控词和非受控词的作用是互补的,数据库的词表与要查询的主题概念并非存在一一对应的关系,很多概念得不到反映,所以,当检索结果不满意时,要分析检索词,根据具体情况决定增减或替换检索词。,第,2,节 数据库及检索方法,4.,检索语言,(retrieval language),检索语言是信息检索系统和检索时所使用的共同语言。即在文献存储时文献的内容特征(如分类、主题)和外表特征(如书名、刊名、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来表达。,检索语言分为:自然语言和受控语言,自然语言(非规范):,是采用直接来自于文献或用户提问的检索语言,自然语言用的检索词一般是从文献篇名、正文或文摘中抽取有实际检索意义的词语,亦称关键词或自由词。,关键词或自由词均属于非受控词或非规范词,特点是不受专业词控制。,第,2,节 数据库及检索方法,受控语言(规范):,是指受到信息检索系统控制的一类索引语言的总称(又称“人工语言”或“规范化语言”)。,在一个检索系统中,所有规范词集合在一起构成了词表包括:主题词表、叙词表、标题词表。构成了标题词语言、单元词语言、叙词语言、分类语言。,在文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、刊名、著者等)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达。,第,2,节 数据库及检索方法,二、网络相关概念,1.IP,地址:,为了保证因特网上的计算机(主机)在通信时能相互识别,就要使网上的每一台计算机都有一个独一无二的地址,这个地址就是,IP,地址。,IP,地址由,4,组数字组成,每组数字中间用点间隔,如,202.112.175.7,是中国农业大学图书馆的主机在,Internet,上的,IP,地址。,2.,域名系统:,入网的每一台主机都具有这样的域名:主机名,.,机构名,.,网络名,.,顶级域名。,中国农业大学图书馆的域名为,:,Lib,为主机名、,cau,为机构名、,edu,为网络名、,cn,为顶级域名。,3.,万维网,(World Wide Web,,,WWW,):,是一种基于超文本方式的信息查询工具。,第,2,节 数据库及检索方法,域名的规定,全球互联网络信息中心,(InterNIC),和,Internet,国际特别委员会规定了三类顶级域名,通用的顶级域名有:,com(commercial),商业性团体、机构;,edu(education),教育及研究团体、机构;,gov(government),政府机构;,mil(military),军事机构;,net(network),网络服务机构;,org(organization),专业团体、组织。,国家级顶级域名是指每个国家被赋予一个唯一的顶级域名,如,cn(China),uk(United kingdom),de(German),au(Australia),jp(Japan),分别为中国、英国、德国、澳大利亚、日本的顶级域名。,第,2,节 数据库及检索方法,4.,统一资源定位符,(,Uniform Resource Locator,URL),:,是因特网上“文件”的地址。它可以指向一个文件、一个讨论组或其他工具所在的位置。当使用浏览器浏览网页时,要在浏览器的地址栏中输入统一资源定位符(网址)才能浏览网页信息。基本写法为:协议:,/,域名,/,路径,/,文件名。,如:,Navigator,和,Microsoft Internet Explorer,(简称,IE,)。浏览器由菜单栏、工具栏、地址栏和显示区几部分组成。,IE,浏览器是目前应用最普遍的浏览器。,第,2,节 数据库及检索方法,三、计算机检索技术,1,布尔逻辑检索,布尔检索有,3,种:逻辑与、逻辑或、逻辑非。,逻辑与(逻辑乘):,用“,and”,或“*”表示,检索式写作,A and B,(即,A*B,),表明数据库中同时有检索词,A,和,B,的记录才为命中记录。如下图所示:,A,B,第,2,节 数据库及检索方法,逻辑或(逻辑和):,用“,or”,或“,+”,表示,检索式写作,A or B,(即,A+B,),表明数据库中凡有检索词,A,或者,B,,或同时有,A,和,B,的记录均为命中记录。如下图所示:,A,B,第,2,节 数据库及检索方法,逻辑非(逻辑差):,用“,not”,或“,-”,表示,检索式写作,A not B,(即,A-B,),表明数据库中凡有检索词,A,而不含检索词,B,的记录才为命中记录。如下图所示:,A,B,第,2,节 数据库及检索方法,2,截词检索,在检索中,常会遇到一些词干相同、词义相近的检索词或有英、美英语不同拼写的词,为了减少检索词的频繁输入,扩大检索范围,可使用截词符(通配符),以提高检索效率。又称词干检索、模糊检索,该方法能很好地避免漏检现象。,所谓截词,是指在检索词的某个局部截断,利用某些检索词的词干或不完整词形加上截词符进行检索,其目的是查找某一词干的不同变化形式,做到一“词”多用,防止漏检,从而达到较高的查全率。,截词方式有前截断、后截断、前后截断和中间截断,4,种。,系统不同,截词符也不同,一般用“,#”“,?”“*”等。,第,2,节 数据库及检索方法,前截词:,将截词符放在词根的前面,后方一致,表示在词根的前方有无限个或有限个字符变化。多用于复合词较多的文献检索,或一个学科的不同应用领域的检索,但有此功能的系统不多。,例如,,computer,(计算机),在该词根前加“?”,即为“?,Computer”,,可检出,Microcomputer,、,Minicomputer,等。,后截词:,将截词符放在词根后面,前方一致。是最常用的截词方法,主要用在词的单、复数、年代、作者、查同词根等。,例如,,computer,(计算机),在该词根后加“?”,即为“,Computer,?”,可检出,computers,、,computerised,、,computerization,等。,第,2,节 数据库及检索方法,前后截词:,将截词符放在词根的前面和后面,中间一致。,例如,,computer,(计算机),在词根前后都加“?”,即为“?,computer,?”,可检出,microcomputer,、,minicomputer,、,computer,、,computers,、,computerised,、,computerization,等。,中间截词:,中间截词又称为“通用字符法”或“内嵌字符截断”,它是将截词符置于检索词的中间,而词的前后方一致,主要用于拼写不同的词或有些词在某个元音位置上出现的单复数的不同拼写。,例如,,colo,?,r,可检出,colour,(英音)、,color,(美音),第,2,节 数据库及检索方法,根据截词的多少,可把截词符分成有限截词符和无限截词符两种。,有限截词符:,是在检索词后截去有限的字母,,smok,?其后只允许加一个字符,可检出:,smoke,smoky,等,如:,ioni?ation,可检出:,ionization,、,ionisation,如:,fib?board,可检出:,fiberboard,、,fibreboard,如:,stud?,,表示截三个字母,可检索出带有,study,studies,studied,和,studing,等的文献。,第,2,节 数据库及检索方法,无限截词符:,无限截词是在检索词根后加一个“?”或“*”,表示该词后带任意字母的词都可检出,如输入,comput?,则可检出含有,computers,computing,computered,等文献。,非限定性截词,?,smok?,其后可加字符数不限,controlled Length truncation,smok?,其后最多加三个字符,可检出:,smoke,smoky,smoker,smokers,smokes,smoking,等,第,2,节 数据库及检索方法,3.,限制检索,运用布尔逻辑算符检索时,只对检索词进行逻辑组配,未限定检索词之间的位置关系及检索词在记录中的位置。在有些情况下,若不限制检索词之间的位置关系会影响查准率,所以在检索系统中设置了位置限定运算符。,位置限制检索,位置算符,(proximation operator),用位置算符检索的词之间,位置不能改变,(W),及,(nW),与,,with,第,2,节 数据库及检索方法,如:,building(W)construction,可检出:,building construction,building-construction,等,如:,building(1W)construction,可检出,:,building and construction,building under construction,等,邻近算符:,(N),及,(nN),邻近,,near,如:,information(1N)retrieval,可检出,:information retrieval,retrieval of information,等,第,2,节 数据库及检索方法,字段限制检索,对检索词在记录中出现的字段进行限制:,字段检索是限定检索的一种,即指定检索词在记录中出现的字段。位置算符只能限定词与词间的相对位置,但不能确定检索词在文献记录中的位置,在检索过程中用字段名来限制查找的字段范围,可以提高检索效率。字段检索有两种方式:后缀方式和前缀方式。,常用的检索符号有:,in,、,/,、,=,、,=,、,、,=1996,等。,即将检索词放在前缀字段代码之后。可用此方式的是文档中的辅助索引字段(又称非主题字段),如作者字段(,AU,)、刊名字段(,JN,)、出版年字段(,PY,)、国际标准书号字段(,BN,)等。,第,2,节 数据库及检索方法,在网络资源检索中字段包括:,标题字段 代码:,title,URL,字段 代码:,URL,域名字段 代码:,domain,site,链接字段 代码:,link,出版物字段 代码:,pub,第,2,节 数据库及检索方法,在数据库检索中字段包括:,tititle,,题名,auauthor,,作者,adaddress,,作者单位,sosource,,文献来源,ababstract,,文摘,susubject,,主题词,kwkeyword,,关键词,第,2,节 数据库及检索方法,常见的字段代码,BN=ISBN,(国际标准书号),CC=CAL Classification Code,(分类号),CC=CAL Classification Heading,(分类类目),CD=conference Date,(会期),CL=Conference location,(会址),CS=corporate Source,(机构),CT=Conference Title,(会名),CY=Conference year,DT=Document Type,(文献类型),JN=Journal Name,(刊名),LA=Language,PY=Publication Year SP=conference Sponsor,第,2,节 数据库及检索方法,4.,词表助检,有些数据库有自已的主题词表,词表不仅用于标引文献,也可用于助检。,检索者在选用检索词时,可查阅词表。有些联机检索系统,将词表存入计算机,帮助用户进行检索。它能将用户输入的非标准检索词,自动地转换为规范词,还可以自动扩检索,如使用同义词检索。,第,2,节 数据库及检索方法,5.,检索式表达,检索式也称检索提问表达式,是要求系统执行的检索语句。简单的检索式由一个检索词和一个字段名构成,复杂的检索式则由多个检索词和字段名通过关系算符(包括逻辑算符与位置算符等)连接而成。总之,检索式由检索词和连接算符组成。,例:,apple in ti,(corn or maize)and harvest,第,2,节 数据库及检索方法,检索式编制实例,题目:高层建筑的抗震结构设计,检索词:,高层建筑,:tall buildings,、,high-rise buildings,抗震,:earthquake resistance,结构设计,:structural design,制定检索式,:,1.tall,2.high(w)rise,3.buildings,4.earthquake resistance,5.structural design,检索式,:(1+2)*3*4*5,第,2,节 数据库及检索方法,6.,检索方案制订,(,1,)分析课题,详细了解欲检索课题内容及要求;,(,2,)根据内容选择适当的数据库;,(,3,)确定检索入口(作者、主题、关键词、机构名等);,(,4,)制订检索词及检索式;,(,5,)实施检索;,(,6,)索取原文。,第,2,节 数据库及检索方法,检索词的确定,自由语言与标引语言要对等,例:海绵的制造工艺,检索词“海绵”与“泡沫塑料”、“泡沫橡胶”类物质等同。,实际是:海洋中的多孔类动物。,例:“维生素,C”,即“抗坏血酸”,第,2,节 数据库及检索方法,少用或不用对课题检索意义不大的词,1,词义泛指度过大的词,如:,“展望”,趋势、现状、近况、动态等,“应用”,作用、利用、用途、用法等,还有如“开放”、“研究”、“方法”、“影响”、“效率”等,2,词义伸展过多的词,如:,“制造”,制备、生产、加工、工艺等,“提炼”,精炼、提取、萃取、回收、利用等,
展开阅读全文