1、第三讲文献检索技术一、信息检索概念信息检索:是从任何信息集合中识别和获取所需信息的过程及其所采取的一系列方法和策略。包括存储与检索两个方面。文献检索:用户利用文献信息检索语言在文献信息检索系统(工具书、印本文摘、数据库、网站、搜索引擎等)中,通过检索途径:如题名、著者、分类号、主题词、关键词、ISSN、ISBN等,进行所需文献、信息的查找。信息处理人员原始信息信息分析、著录和标引检索工具/检索系统检索结果用户检索课题课题分析检索语言(主题词/分类号)存存储储过过程程检检索索过过程程存入检索信息检索原理示意图二、文献信息检索的类型和手段l以检索内容区分:以检索内容区分:文献检索:线索检索与原文检
2、索文献检索:线索检索与原文检索事实检索:通过百科全书、年鉴、手册、字词事实检索:通过百科全书、年鉴、手册、字词典等查询名词术语、概念、定义、事件、事实、机典等查询名词术语、概念、定义、事件、事实、机构、人物、图谱等构、人物、图谱等数据检索:统计年鉴、统计资料汇编、数值型数据检索:统计年鉴、统计资料汇编、数值型数据库数据库l以检索方式区分:以检索方式区分:手工检索:利用印刷型工具书查找手工检索:利用印刷型工具书查找计算机检索:通过计算机及网络设备,利用光计算机检索:通过计算机及网络设备,利用光磁等媒介存贮、检索文献信息的过程磁等媒介存贮、检索文献信息的过程三、信息检索工具/系统l1、手工检索工具
3、印刷版的各种检索工具,即传统的二次文献。l类型:目录、题录、文摘、索引、各种书目数据库等。l(1)目录或书目:以整本图书、整刊、资料为著录对象,它是历史上最早出现的一种检索工具。是对出版物的外表特征加以揭示与报道并按照一定顺序编排而成的工具,一般只记录文献的外部特征(如图书书名、著者、出版者、出版地、出版时间、版次、页数、开本装帧、定价等等)。用于提供书刊的出版信息、收藏信息等。l包括国家书目、联合目录、馆藏目录、出版社目录等。l(2)题录是所有的检索系统都应具备的基本内容,它包括文献标题、作者、作者工作单位、发表时间、文献来源(期刊、会议、专利等)。有了题录,读者就可以方便地获得原始文献。
4、l(3)文摘abstractInformation/indication/review:反映文献的内、外部特征,是系统著录、报道、积累和揭示文献外部特征和内容特征的检索工具,是二次文献的核心。美国化学文摘CA英国科学文摘l41207Anadvancednuclear-reactorcontrolandprotectionsystem.M.Okano,M.Hirayama,Y.Matrumoto,A.Baba.lMitsubishiDenklGiho(Japan),vol,56,no.10,P.1-4(1982).InJapanese.lMitsubishiHeavyIndustries,Mit
5、subishiAtomicPowerIndustriesandMitsubishiElectrichavejointlydevelopedanimprovednuclear-reactorprotectionsystemnamedANCAP80thatprovidesenhancedavailabilityandextended,automatictestingfunctionfornuclear-powerstations.Thisnovelprotectionsystemisprovidedwithsystemisalsoprovidedwithsophisticatedhardwares
6、uchasanopticaltrarsmissionsystemforbypasscontrolandautomatictestingequipmentusingamicrocomputer.(norefs.)l(4)索引index:信息及其物理位置的指示物,提供指示系统,使用户准确找出信息集合中的特定信息。l检索系统中的索引是将信息的内外特征中具有检索价值的知识单元提取出来,按子顺、分类或其他逻辑次序排列,并注明与之对应的所在文献的页码与文摘号,这样的检索工具叫索引。l如:按寻找文献内容特征的编制方法来分:有分类索引、主题索引、关键词索引、引文索引;按取材来源来分,可分为图书索引、期刊索引、
7、报纸索引及其他文献索引等。2、计算机数据库检索工具l(1)参考型数据库:指包含各种数据、信息或知识的原始来源和属性的数据库。数据库中的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。l主要包括:书目数据库、文摘数据库、索引数据库。l如“全国报刊索引”、“化学文摘”、“工程索引”、“生物学文摘”、“中国人民大学书报资料中心复印报刊资料索引总汇”等数据库。l(2)全文型:即收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。l如Proquest数据库、“学术期刊全文库及“中国人民大学书报资料中心复印报刊资料全文
8、数据库”等。l(3)事实型:指包含大量数据、事实,直接提供原始资料的数据库,又分为数值数据库、指南数据库、术语数据库等,相当于印刷型文献中的字典、辞典、手册、年鉴、百科全书、组织机构指南、人名录、公式与数表、图册(集)等。l数值数据库,指专门以数值方式表示数据,如统计数据库、化学反应数据库等;l指南数据库,如公司名录、产品目录等;l术语数据库,即专门存储名词术语信息、词语信息等的数据库,如电子版百科全书、网络词典等。l(4)其它可检索的电子资源l电子图书l电子期刊与报纸l搜索引擎/分类指南l网络学术资源学科导航各类型检索系统的用途各类型检索系统的用途 查找的问题查找的问题检索系统类型检索系统类
9、型字/词的形、音、义及用法;专业术语的解释词典、百科全书、手册或网络概念的定义、背景资料;事物的起源与发展百科全书、年鉴、专业手册或网络各种统计资料/统计数字等百科全书、年鉴、统计汇编或网络奇特事物百科全书、综合性手册或网络重大事件的情况百科全书、年鉴、年表或网络各类型检索系统的用途各类型检索系统的用途查找的问题查找的问题检索系统类型检索系统类型人物传记资料传记工具、综合性词典、百科全书、年鉴、机构名录或相应的网络数据库地名/地理资料 地名工具、综合性词典、百科全书、年鉴或相应的网络数据库组织机构资料机构名录、百科全书、年鉴或网络政策法规、法律条文百科全书、法律法规汇编或相应的网络数据库各类型
10、检索系统的用途各类型检索系统的用途查找的问题查找的问题检索系统类型检索系统类型某一课题的相关资料专题目录、题录、文摘或全文数据库书、刊等出版物的收藏地点馆藏目录、联合目录或联机公共目录(OPAC)不同历法间的日期转换年表、历表或网络四、文献检索的方法l1.直检法:专业核心期刊跟踪l2.常规法:常用法又称为工具法或直接法,是直接利用l文献检索工具来查找文献的方法。常用法根据时间的l范围可分为顺查法、倒查法、抽查法。l3.追溯法:主要通过参考文献,引用目录。追溯法又叫做l引文法,是利用已有的文献后面的参考文献由近及远l进行追溯查找的方法。l4.综合法:综合法又称为循环法、分段法或交替法,是l常用法
11、和追溯法两种方法的综合。l5.交流法:专家技术人员之间工作交流、学术会议中交l流、信函往来探讨交流。各种检索办法的优缺点交流法:获得最新信息,具有明显的不确定因素,即零次信息;追溯法:获得直接相关的前人成果,但实效性差;很难找到相关专题目录及索引常用法:可获得全世界当前最新动态、进展、发展过程的各项成果,但难以判断这些信息的可靠性、实际水平,对检索者的检索技能要求较高,对信息认知和判断能力要求较严格。五、文献信息检索语言l概念:检索语言是信息检索系统存储和检索所使用的共同语言,即在文献存储时,文献的内容特征(如分类、主题)和外表特征(如书名、刊名、著者)按照一定的语言来描述,检索文献时的提问也
12、按照一定的语言来加以表达,这种在文献存储和检索过程中,共同使用、共同遵守的语言就是检索语言。l作用:是标引文献内容、沟通标引人员和检索人员之间共同遵循的标形语言;它保证了文献存储的集中化和系统化,使有规律的检索成为可能。常用检索语言l分类语言分类语言分类法分类法l主题语言主题语言主题法主题法l分类主题一体化检索语言分类主题一体化检索语言l自然语言自然语言关键词语言关键词语言(一)分类法(一)分类法l图书分类法以科学分类为基础,结合文献内容性质及其特征(如地区、时代、形式、体裁等),按照一定的逻辑体系,区分、组织和检索文献的一种方法。l作用:l便于浏览检索l体现学科的系统性l便于随时放宽或缩小检
13、索范围l分类检索语言具有通用性常用分类法世界三大图书分类法世界三大图书分类法杜威十进分类法杜威十进分类法(DDC)(DDC)(Dewey decimal Dewey decimal Classification Classification)国际十进分类法国际十进分类法(UDC)(UDC)(Universal Decimal Universal Decimal Classification)Classification)国会图书馆图书分类法国会图书馆图书分类法(LCC)(LCC)(Library congress Library congress classification)classifi
14、cation)中国图书分类法中国图书分类法 中国图书馆分类法中国图书馆分类法(中图法)(中图法)中国科学院图书馆分类法中国科学院图书馆分类法(科图法)(科图法)中国人民大学图书馆分类法中国人民大学图书馆分类法(人大法)(人大法)杜威十进分类法简表http:/www-http:/www-lib.nearnorth.edu.on.ca/dewey/ddc.htmlib.nearnorth.edu.on.ca/dewey/ddc.html500Naturalsciences&mathematicsl510Mathematics520Astronomy&alliedsciences530Physics
15、540Chemistry&alliedsciences550Earthsciences560Paleontology,paleozoology570Lifesciences580Botanicalsciences590Zoologicalsciences美国国会图书馆图书分类法 Cl总类:著作集l哲学、宗教l历史:辅助科学l历史:世界史l历史:美洲史l地理、人类学l社会科学l政治l法律l教育l音乐l美术l语言、文学l科学l医学l农业及其它l工业技术l军事科学l海军兵学l书目及图书馆科学l社会科学l经济史:农业和工业l1012200 土地与农业l1011130 一般问题l11411399土地l1
16、4052200 农业l23219999工业美国国会图书馆图书分类法 Cl0总类l1哲学l2宗教、神学l3社会科学、法律、行政l4(语言学)l5数学、自然科学l6应用科学、医学、工业、农业l7艺术l8(语言学)文学l9地理、传记、历 史国际十进分类法 UDCUDC类表结构类表结构lUDC的主表也是一个层层展开的等级体系。例如:6应用科学、医学、工业、农业62工业、工业技术总类621一般机械工程、原子能、电气工程、机械工程总表621.3 电气工程621.39电讯工程621.396 无线电通讯工程621.396.9 无线电通讯的应用、雷达621.396.96 雷达621.396.969 雷达的应用国
17、际十进分类法 UDCUDC类表结构类表结构中图法l应用较多:应用较多:l全国报刊索引数据库全国报刊索引数据库l中国学术期刊全文数据库中国学术期刊全文数据库l“超星超星”数字图书馆数字图书馆l方正电子图书等方正电子图书等l体系结构:大纲、基本类表、正表、辅助复分体系结构:大纲、基本类表、正表、辅助复分表(表(在分类表后附有六个供全表使用的辅助复在分类表后附有六个供全表使用的辅助复分表:总论复分表、世界地区表、中国地区表、分表:总论复分表、世界地区表、中国地区表、中国时代表、国际时代表和中中国时代表、国际时代表和中国民族表)国民族表)l l由字母和数字组成l l采用等级列举表达从属关系 上位类目与
18、下位类目的关系:上位类目与下位类目的关系:上位类目一定包含各个下位类目,上位类目一定包含各个下位类目,下位类目一定带有上位类目的属性。下位类目一定带有上位类目的属性。分类号越长,表示的学科范围越窄。分类号越长,表示的学科范围越窄。为了清楚醒目为了清楚醒目,通常分类号的第三位数字后,通常分类号的第三位数字后,隔以隔以.,如:,如:O413.1O413.1中图法基本大类C社会科学总论D政治、法律E军事F经济G文教、科学、体育H语言J艺术I文学K历史、地理 自然科学总论NRS TO数理化P天文学、地球科学Q生物科学医药、卫生农业科学工业技术U交通运输V航空、航天X环境科学Z综合性图书社会科学自然科学
19、机械、仪表建筑科学 马列主义、毛泽东思想A马列B哲学哲学综合TBTDTE TF TG THTJTLTKTMTNTPTQ QTS TUTV一般工业技术 矿业工程石油冶金工业无线电、电子学、电讯技术自动化计算化学工业轻工业、手工业金属学武器工业动力工程原子能技术电工技术水利工程O数理化 一级类目O1数学二级类目O3力学二级类目O31理论力学三级类目O311运动学四级类目.1质点运动五级类目O4物理学二级类目中图法的类目含义l类目(包括通用复分表的子目):是构成分类法的最基本的要素,一个类目由类号、类名、类级、注释和参照组成。l例:l.生物力学(生物流体力学、l 骨、软组织力学以及生物力 学在生物医
20、学工程中的应用 等入此。参见)类号类名注释参照索书号(call number)又称为排架号ln n反映了某种图书在整个图书组织中的排列次序和在书库中的具体位置(架位)n n组成:分类号书次号 分类号:按学科分类图书 书次号:同类书的排列 O13/245,O175/25,O189.1/2 图书馆书目检索示例l查找有关“信息安全”方面的书启示:对课题启示:对课题/专业进行分类,专业进行分类,以实现某些用关键词难以达到的检索需求以实现某些用关键词难以达到的检索需求查询分类号的方法l1.查印刷版分类表或网络分类表l2.用维普“分类检索”查中图法分类表:l3.用关键词查询相关检索系统:(二)主题法:l主
21、题是一组具有共性的事物的总称,用以表主题是一组具有共性的事物的总称,用以表达文献所论述和研究的具体对象和问题,即达文献所论述和研究的具体对象和问题,即文献的文献的“中心内容中心内容”。表达主题概念的词汇。表达主题概念的词汇就是主题词。就是主题词。l(1 1)同义词的规范:对)同义词的规范:对完全等同完全等同的同义词的的同义词的规范;对规范;对近义词近义词的规范;对的规范;对学名和俗名学名和俗名的规的规范;对范;对不同译名、简称与全称不同译名、简称与全称的规范的规范l(2(2)多义词的规范:限定多义的主题词含义)多义词的规范:限定多义的主题词含义或在特定检索工具规定只有一个特定意义,或在特定检索
22、工具规定只有一个特定意义,排除歧义排除歧义l主题语言:一般指以表达文献主题内容主题语言:一般指以表达文献主题内容的词语作标引对象,按主题词的字顺序的词语作标引对象,按主题词的字顺序列组织文献,并用参照系统显示概念之列组织文献,并用参照系统显示概念之间相互关系的文献信息组织与揭示的方间相互关系的文献信息组织与揭示的方法法l主题词表对主题词的规范:主题词表对主题词的规范:l对文献检索用语的概念加以人工控制和对文献检索用语的概念加以人工控制和规范,对同义词、多义词、近义词等进规范,对同义词、多义词、近义词等进行规范化处理,用一个词来表达一个概行规范化处理,用一个词来表达一个概念,避免多词一义、一词多
23、义、词意含念,避免多词一义、一词多义、词意含糊糊1、主题词的规范l使检索提问标识与文献特征标识一致,获得最佳的检索效率,应优先选用规范词汇。l分:l同义词(近义词)l多义词(一词多义)l相关关系词(1)同义词的规范l1)对完全等同的同义词的规范;l例:“煤炭”和“煤”“煤”l2)对近义词的规范;l例:“天然资源”和“自然资源”“自然资源”l3)对学名和俗名的规范;l例:“计算机”和“电脑”“计算机”l例:“发动机”和“马达”“发动机”l4)对不同译名、简称与全称的规范:只能选择正式的一个词。l例:“世界贸易组织”与“世贸组织”和“WTO”“世界贸易组织”,WTO还是WorldTourismOr
24、ganization的缩写。l例:“X射线”与“爱克斯射线”“X射线”(2)多义词的规范l完善的检索工具通常会限定多义的主题词含义或再特定检索工具规定只有一个特定意义,排除歧义。l例:cell细胞;电池。某些生物学检索词表就规定Cell表示“细胞”,battery表示“电池”。l例:杜鹃鸟;花,必须说明杜鹃(动物),杜鹃(植物)。2、如何提取主题词l检索词词意应具体,如研究农产品有关问题,检索词:“鸡蛋”、“牛奶”、“棉花”等,不能用“农产品”检索。l意义广泛的词,如“影响”、“发展”等不能做检索词。l技术类的课题,可直接选课题名称中具有检索意义的概念或代码。l注意同一概念,不要漏检。l例:检
25、索“经济体制改革有关资料”l主题词:国企改革、所有制改革、国有资产管理与制度改革、国有经济战略性调整、金融改革、社会保障改革、劳动就业改革。l例:检索“染料的电化学性能研究”。其实是研究染料的电化学性能为基础,采用电混凝法处理印染废水。检索词:印染、废水处理、染料、电混凝、电化学。3、主题途径的优缺点l1)适合特性检索,查准率高。l如:“C语言程序设计”比TP312准。l2)通常不适合族性检索。l例:计算机类词典,不如用TP361检索好。“-61”表示词典,TP3表示计算机类。l3)由于用规范词,非专业人士难掌握。l例:检索大学教材,“大学”不是主题词,该用“高等学校”。获取主题词技巧l在图书
26、的版权页可以找到在版编目里面的主题词和分类号码,或在图书馆的馆藏数据里找到主题词。l查:汉语主题词表l例:书:C+Builder5程序设计/基础教学篇一书的版权页能找到主题词:“C语言程序设计”。汉语主题词表l汉语主题词表汉语主题词表是我国第一部大型综是我国第一部大型综合性主题词表。合性主题词表。19791979年出版,自然科学年出版,自然科学部分部分19911991年修订。其收录正式主题词年修订。其收录正式主题词9115891158条,非正式主题词条,非正式主题词1741017410条。条。l全表共分全表共分3 3卷卷1010分册,由主表、词族索引、分册,由主表、词族索引、范畴索引(可以用于
27、从学科的角度确定范畴索引(可以用于从学科的角度确定主题词)主题词)、英汉对照索引等组成。、英汉对照索引等组成。l是我国应用最广的一部主题标引和检索是我国应用最广的一部主题标引和检索的工具的工具汉语主题词表主表的示例:l Dian shi Dian shi xianxian xiangxiang guanguan电视显像管电视显像管Y Y 显像管显像管Xian Xiang GuanXian Xiang Guan显像管显像管 56CE56CE KinescopeKinescope Picture tubePicture tube 电视显像管电视显像管 彩色显像管彩色显像管 黑白显像管黑白显像管 电
28、子束管电子束管 电子管电子管 显示管显示管 l主题词汉语拼音主题词汉语拼音l主题词主题词 l范畴号范畴号 l英文译名英文译名 l代项代项(其后为被代替的同义其后为被代替的同义词词)l分项分项(下位词下位词)l属项属项(上位词上位词)l族首词族首词 l参项符号参项符号(相关词相关词)l用项用项(其后为正式主题词其后为正式主题词)用项用项 Y 正式主题词正式主题词 等同关系等同关系 代项代项 D 非正式主题词非正式主题词 分项分项 F 下位类主题词下位类主题词 分属关系分属关系 属项属项 S 上位类主题词上位类主题词 族项族项 Z 族首词族首词 相关关系相关关系 参项参项 C 相关词相关词主题语言
29、的特点和优势l特点:按文献主题集中文献;以规范化特点:按文献主题集中文献;以规范化的词语作为文献主题概念的标识;用参的词语作为文献主题概念的标识;用参照系统显示主题概念之间的关系;按主照系统显示主题概念之间的关系;按主题词的字顺序列排列题词的字顺序列排列l优势:直接性、专指性、集中性、(增优势:直接性、专指性、集中性、(增删)灵活性,满足删)灵活性,满足特性检索特性检索需求,查准需求,查准率高率高l非专业人士难以掌握非专业人士难以掌握l词表在网络检索工具中的应用主要体现词表在网络检索工具中的应用主要体现在辅助选词以及检索式的扩展在辅助选词以及检索式的扩展l获取主题词与分类号的技巧:在图书的获取
30、主题词与分类号的技巧:在图书的版权页在版编目中寻找;在图书馆的馆版权页在版编目中寻找;在图书馆的馆藏数据找到;藏数据找到;CNKICNKI的的“扩展功能扩展功能”;维;维普数据库的普数据库的“分类导航分类导航”;查词表,如;查词表,如中图法中图法、社会科学检索词表社会科学检索词表(超星)等(超星)等(三)分类主题一体化检索语言l兼具兼具分类与主题两种标引和查找功能分类与主题两种标引和查找功能l中国分类主题词表中国分类主题词表是我国第一部分类与主是我国第一部分类与主题兼容的综合性分类、主题标引与检索工具。题兼容的综合性分类、主题标引与检索工具。它以它以中国图书馆图书分类法中国图书馆图书分类法和和
31、汉语主题汉语主题词表词表为基础编制而成。共分二卷为基础编制而成。共分二卷6 6个分册。个分册。第一卷为第一卷为分类号主题词对应表分类号主题词对应表,第二卷,第二卷为为主题词分类号对应表主题词分类号对应表,通过这两个对,通过这两个对应表,将应表,将中图法中图法的类号与的类号与汉语主题词表汉语主题词表的主题词有机地联系起来,便于用户灵活使的主题词有机地联系起来,便于用户灵活使用用l馆藏:馆藏:G254.2/10-2G254.2/10-2,20052005年版,基藏室年版,基藏室 (四)自然语言关键词语言l自然语言自然语言(非规范语言非规范语言)是指信息检索系统中使是指信息检索系统中使用的标引词直接
32、来自文献和用户提问而不加控用的标引词直接来自文献和用户提问而不加控制的一类检索语言,主要有关键词语言制的一类检索语言,主要有关键词语言l自然语言的应用以计算机为前提,采用后控制自然语言的应用以计算机为前提,采用后控制技术:对表达主题内容具有实质意义的词语,技术:对表达主题内容具有实质意义的词语,由计算机通过剔除禁用词(后控词表、禁用词由计算机通过剔除禁用词(后控词表、禁用词表:冠词、介词、连词、代词、某些动词、高表:冠词、介词、连词、代词、某些动词、高频词等)自动产生关键词频词等)自动产生关键词l特征:标引灵活,速度快;能客观表达特征:标引灵活,速度快;能客观表达文献内容;更新及时,通用性好;
33、专指文献内容;更新及时,通用性好;专指度高度高l在常用的检索途径中,用户最容易掌握在常用的检索途径中,用户最容易掌握l可以随时通过篇名、摘要甚至全文进行可以随时通过篇名、摘要甚至全文进行扩检,或可采用二次缩检扩检,或可采用二次缩检l当用户只知道某一主题的情况下,关键当用户只知道某一主题的情况下,关键词可以作为首选的检索途径词可以作为首选的检索途径自由词l检索网络信息时就用自由词。l例:“土豆烧牛肉”“土豆”,不必用“马铃薯”主题词法与分类法的比较 主题词法 分类法 检索功能 侧重于特性检索 侧重于族性检索 检索标识 主题词文字符号 分类号数码符号 排列方式 字顺排列 等级排列 六、检索途径(检
34、索点)l检索途径又称检索点、检索入口或检索标识,进行信息检索的出发点和依据。l检索途径就是利用信息的某一特征作为检索标识通过检索工具查到所需的信息l信息类型的著录格式本身就是检索途径:即限制检索词在数据库记录中的某一字段范围内出现,以缩小和限定检索范围,也称限制检索、字段检索l从文献信息的外部特征和内部特征分类。检索途经内部特征外部特征分类途经主题途经分类主题途经题目途经著者途经机构途经代码途经其他途经作者(文章的责任者)作者(文章的责任者)篇名(或题名)篇名(或题名)机构(如云南大学)机构(如云南大学)关键词(如污水处理、微分方程)关键词(如污水处理、微分方程)主题词(规范化的主题概念,如用
35、激光不用雷射)主题词(规范化的主题概念,如用激光不用雷射)文摘(论文或图书的摘要或内容提要)文摘(论文或图书的摘要或内容提要)引文(即参考文献)引文(即参考文献)基金(如国家自然科学基金项目)基金(如国家自然科学基金项目)刊名(期刊的名称)刊名(期刊的名称)全文(或者全记录)全文(或者全记录)1、以文献的外部特征为检索途径题名途径(Title)l是根据文献题名来检索文献的途径。一般较多用于查找图书、期刊、单篇文献。检索工具中的书名索引、会议名称索引、书目索引、刊名索引等均提供了由题名检索文献的途径。数据库中都有题名字段。l具有具有查找特定文献查找特定文献的便捷功能的便捷功能l还可以在搜集某一专
36、题资料的时候,提高检索资料的还可以在搜集某一专题资料的时候,提高检索资料的相关性和精确性相关性和精确性,这是因为文章的标题往往反映文章,这是因为文章的标题往往反映文章中心内容的焦点,符合人们的思维习惯中心内容的焦点,符合人们的思维习惯l但要注意部分文献的篇名并不能充分揭示文献内容,但要注意部分文献的篇名并不能充分揭示文献内容,容易造成漏检容易造成漏检著者途径(Author)l利用著者目录和著者索引进行检索。利用著者目录和著者索引进行检索。作者包括个人作者和团体作者,还包括专利发明者、专利权所有者等。手工检索工具中作者索引按字顺编排,使用于各种类型的文献,几乎所有的检索工具都配有作者索引。从作者
37、途径检索必须事先已知作者姓名,所以作者途径只能作为辅助途径。数据库中都有著者字段。l著者途径的利用:由于同一著者的文章往往具有一定著者途径的利用:由于同一著者的文章往往具有一定的逻辑联系,以著者为线索可以的逻辑联系,以著者为线索可以系统、连续地掌握他系统、连续地掌握他们的研究水平和研究方向们的研究水平和研究方向,因此著者途径能满足一定,因此著者途径能满足一定族性检索功能要求族性检索功能要求英文版著者索引中人名规则l按姓、名次序排列。按姓、名次序排列。l同姓著者,先按名字的首字母顺序排列,同姓著者,先按名字的首字母顺序排列,不全者排在全者之前,单名排在双名之不全者排在全者之前,单名排在双名之前,
38、简名排在全名之前。前,简名排在全名之前。l复姓作者,将复姓作整体看待复姓作者,将复姓作整体看待 l团体著者也同个人著者一样,按团体单团体著者也同个人著者一样,按团体单位名称的字顺排列位名称的字顺排列l翻译为英文的中国著者姓名翻译为英文的中国著者姓名 中国著者姓名翻译为英文如何处理A A、团体著者:音译、团体著者:音译+意译意译+缩写缩写【实例实例】原西南师范大学在欧洲专利数据库有三种写原西南师范大学在欧洲专利数据库有三种写法:法:Southwest China Normal University/Southwest China Normal University/Southwest Norma
39、l University/Southwest Normal University/XinanXinan Teachers,Teachers,UniversityUniversity工程索引工程索引中西南农业大学缩写成中西南农业大学缩写成“swsw agriagri univeruniver”。B B、个人著者:音译、个人著者:音译+缩写缩写+连接符连接符【例题例题】在英文数据库检索作者在英文数据库检索作者“金长青金长青”的论文,的论文,作者名除了作者名除了“Jin,Jin,ChangQingChangQing”还有其他拼写形式还有其他拼写形式?【题解题解】Jin,Chang-Qing/Jin,
40、CQ/Jin,C.Q/Jin,Jin,Chang-Qing/Jin,CQ/Jin,C.Q/Jin,C.Q./Jin,C.-QC.Q./Jin,C.-Q号码途径l即根据文献的序号特征,利用其序号索即根据文献的序号特征,利用其序号索引进行检索引进行检索l许多文献具有惟一的序号,如专利号、许多文献具有惟一的序号,如专利号、标准号、报告号、合同号、国际标准刊标准号、报告号、合同号、国际标准刊号(号(ISSNISSN)、国际标准书号()、国际标准书号(ISBNISBN)等)等l在已知序号的前提下,利用序号索引途在已知序号的前提下,利用序号索引途径能方便地查到所需文献径能方便地查到所需文献l序号途径在事实
41、数据检索中作用较大,序号途径在事实数据检索中作用较大,在文献检索中一般作为一种辅助性的检在文献检索中一般作为一种辅助性的检索途径索途径引文途径l将属于不同领域的文献有机的联系起来,将属于不同领域的文献有机的联系起来,读者可通过引文来扩大检索,读者可通过引文来扩大检索,了解某学了解某学术研究中的继承和借鉴术研究中的继承和借鉴l查全率高,有利于检索交叉学科、相关查全率高,有利于检索交叉学科、相关学科的文献互引信息学科的文献互引信息l学术评价学术评价l外部特征途径优点:排列与检索方法以字顺或数字为准,较机械、单纯,不易错检或漏检。适合查已知题名、作者或序号的文献。2、以文献的内容特征为检索途径l文献
42、的内容特征是从文献所载的知识信息中隐含的、潜质的特征,如分类、主题等。适合查未知线索的文献。a:分类途径(Classified):以学科性质和内容的相应类目、类号为特征标识的检索方法。它适于族性检索,即从学科体系的角度获得较系统文献。检出的文献较全面。用户检索需求较宽或较复杂时,用此途经。例如:查找“铁氧体移相器”:T(工业技术)TN(无线电电子学,电信技术)TN6(电子元件、组件TN623(移相器,铁氧体移相器,拉线器如此)b:主题途径(Subject):是一种按照文献信息的主题内容进行检索的途径。利用从文献信息中抽出来能代表文献内容实质的主题词、关键词、叙词。包括:关键词索引、叙词索引、轮
43、排主题索引等。主题途径检出的文献比较准确,但在全面性上较为逊色。c:分类主题途径几种信息类型的数据库检索途径对照:发挥不同字段的协同作用!检索课题:检索课题:“纳米技术纳米技术在除螨功能纺织品在除螨功能纺织品中的应用中的应用”(分类号分类号TB383)TB383)A A、在维普数据库中检索时,无论选择任何、在维普数据库中检索时,无论选择任何字段,输入:纳米字段,输入:纳米 and and 螨虫螨虫 and and 纺织纺织品,检索结果都是零品,检索结果都是零B B、扩大检索范围:选择、扩大检索范围:选择“任意字段任意字段”输入输入“纳米纳米”、“螨螨”,选择,选择“分类检索分类检索”字段输入中
44、图分类号字段输入中图分类号“纺织工业、染整纺织工业、染整工业工业”的分类号的分类号“TS1TS1”,检索结果是,检索结果是6 6篇篇七、计算机检索技术计算机检索相关概念l字段(字段(field):如在数据库中题名、作者、作者单位、期刊名、摘要、全文等等均是字段;一条记录由多个字段值组成;对计算机检索来说字段相当于检索入口。l记录记录(Record):由若干字段组成的文献单元,在全文数据库中,一条记录相当于一篇完整的文献,在数目数据库中,一条记录相当于一条文摘或题录。l文档文档(File):由若干个逻辑记录构成的信息集合,是数据库的基本内容,分为顺排文档和倒排文档。顺排文挡是数据库的主体内容,倒
45、排文档是将记录中的一切可检字段或属性值提取出来,按某种顺序重新加以组织所得到的文档。l顺排文档(记录)顺排文档(记录)顺排文档(记录)顺排文档(记录)l l倒排文档(索引)倒排文档(索引)倒排文档(索引)倒排文档(索引)l l数据库数据库数据库数据库(database(database)由计算机进行处理的一定数量同类信息的有序集合,由计算机进行处理的一定数量同类信息的有序集合,是用来存储和查找文献信息的电子化检索工具。是用来存储和查找文献信息的电子化检索工具。字段举例l lTI:TI:NewantibioticsNewantibioticsmiyakamidesmiyakamidesprodu
46、cedproducedl lbyafungus.byafungus.l lAU:AU:ShiomiShiomi,-K;,-K;HataeHatae,-K;Yamaguchi,-Y;,-K;Yamaguchi,-Y;l lSO:SO:J-J-AntibiotAntibiot-(Tokyo).2002Nov;55(11):952-(Tokyo).2002Nov;55(11):952-6161l lISSN:ISSN:0021-88200021-8820l lPY:PY:20022002l lLA:LA:EnglishEnglishl lAB:AB:NewantibioticsNewantibiot
47、ics l lPT:PT:Journal-ArticleJournal-Article计算机检索技术l计算机检索过程中,为保证检索结果准确全面、经济高效,各计算机检索系统均为用户提供了多种不同的检索功能。l信息检索技术主要使用布尔逻辑算符、位置算符、截词算符、限制符等,将检索词组配,确定检索词之间的概念关系或位置关系,准确地表达课题需求的内容,以保证和提高检索的查全率和查准率。其中使用最普遍的就是布尔逻辑检索、截词检索和位置检索。l注意:由于不同的机检系统使用不同的检索软件,所支持的检索技术不同、采用的检索算符也不同,因此实际检索时,应注意查看所用检索系统的说明1、布尔逻辑检索技术 所谓布尔逻
48、辑检索(BooleanLogical)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。它是机检系统中最常用的一种检索方法。l逻辑算符主要有:And/与、Or/或、Not/非(1)逻辑)逻辑“与与”运算符:And或*l含义:检索词A和检索词B用“与”组配,表示检出同时含有A、B两个检索词的记录。l检索式为:AAndB或者A*Bl作用:能增强检索的专指性,使检索范围缩小,此算符适于连接有限定关系或交叉关系的词。(2)(2)逻辑逻辑“或或”l运算符为Or或+l含义:检索词A和检索词B用“或”组配,它表示检出所有含
49、有A词或者B词的记录。l检索式:AOrB或者ABl作用:逻辑“或”检索扩大了检索范围,可用其组配表达相同概念的检索词,如同义词、相关词等。(3)逻辑“非”l运算符:Not或l含义:检索词A和检索词B用“非”组配,它表示检出含有A词,但同时不含B词的记录。l检索式:ANotB或者A-Bl作用:和逻辑“与”运算的作用类似,可以缩小检索范围,增强检索的准确性。此运算适于排除那些含有某个指定检索词的记录。但如果使用不当,将会排除有用文献,从而导致漏检。布尔逻辑算符检索优先级一般为布尔逻辑算符检索优先级一般为not,and,or运算优先级顺序各个数据库不同运算优先级顺序各个数据库不同,看使用说明。看使用
50、说明。不过可以用括号不过可以用括号“()()”改变它们的运算顺序,改变它们的运算顺序,优先处理括号内的运算。优先处理括号内的运算。对于一个复杂的逻辑检索式,检索系统的处理是对于一个复杂的逻辑检索式,检索系统的处理是从左向右进行的。在有括号的情况下,先执行括从左向右进行的。在有括号的情况下,先执行括号内的运算;有多层括号时,先执行最内层括号号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行。中的运算,逐层向外进行。2、位置检索技术l位置算符即邻近算符AdjacentOperators,是表是表示词与词之间位置关系的符号,示词与词之间位置关系的符号,在检索中词与词之间使用位置算符来规






