1、1文献检索课程性质、任务教高司【1992】44号文件:文献检索课是培养学生的情报意识,掌握用手工方式和计算机方式从文献中获取知识和情报的一门科学方法课。本课程的任务,是使学生了解各自专业及相关专业文献的基本知识,学会常用检索工具与参考工具书的使用方法,懂得如何获得与利用文献情报,增强自学能力和研究能力。2.信息包括了知识和情报,二者有相交部分但不重合。信息是情报和知识的载体,情报是特指的专业信息,知识是信息的内核,知识依存于信息,信息经过提炼和加工可成为知识,知识是信息中的精华部分;信息的价值取决于其精华部分的价值,如果说信息是食物,那么知识则是食物中的营养成分。知识组织最终要通过信息组织方式
2、来实现。 3.文献发展史 *文献是历史的产物,经历了甲骨、金石、简策、纸张书写和印刷品、视听资料、电子计算机阅读资料等几个发展阶段。*在我国,“文献”一词原指典籍与前代熟悉礼制的贤士大夫,即,典籍与宿贤。此后又专指前人遗留下来的有价值的文章、图书。*随着人类对自然界和社会的认识不断深入,单一类型的图书已不适应于经济文化发展和科技交流的需求,于是从十七世纪起,期刊、会议录、学位论文、科技报告、技术标准、专利说明书等类型的文献便渐次应运而生。十九世纪以后,我国陆续出现了图书以外的各类文献。现代科技的发展,使知识与其他信息的记载形式突破了文字和简单图形的界限;物质载体则越出了纸张的范畴:除了印刷型文
3、献外,又出现了缩微型、声像型和电子计算机阅读型文献。*文献作为人类脑力劳动成果的一种表现形式,在人类历史发展过程中起着记录、存贮和传播知识与其他信息的作用,是全人类共同的财富。4.文献类型*文献类型通常有两种划分方法:*记载形式和物质载体:手写与印刷型文献、缩微型文献、声像型文献和机读型文献*所载知识及信息内容:图书、连续出版物和特种文献国家标准文献类型与文献载体代码GB/T3469-1983根据实用标准,将文献分成26个类型:即专著、报纸、期刊、会议录、汇编、学位论文、科技报告、技术标准、专利文献、产品样本、中译本、手稿、参考工具、检索工具、档案、图表、古籍、乐谱、缩微胶卷、缩微平片、录音带
4、、唱片、录像带、电影片、幻灯片、其他(盲文等)。5.信息资源分类按存在状态分类*潜在的信息资源个人在学习、认知和实践过程中储存在大脑中的信息资源,其特点是只能供个人所用。*现实的信息资源潜在信息资源经过个人表述之后能够为他人所利用的信息资源,包括口语信息资源、体语信息资源、实物信息资源、网络信息资源和文献信息资源。它们最主要的特征是具有社会性,通过特定的符号表述和传递,可以在特定的社会条件下广泛地连续往复地为人类所利用,是一种无限再生的信息资源。按载体形式分类*印刷型信息Printed Form*缩微型信息Micro Form*声像型信息Audio-visual Form*电子型信息Elect
5、ronic Form按出版形式分类按出版形式划分,一般可分为10类:*图书、期刊、报纸、专利文献、标准文献、会议文献、学文论文、报告、档案文献、产品资料等。按加工深度分类*零次信息 一次信息 二次信息 三次信息7.信息检索定义信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据用户的特定需要找出所需信息的过程,即“信息存储与检索”(Information Storage and Retrieval). 即,存储+检索.9.检索类型*根据检索对象分类 文献检索 事实检索 数据检索*根据检索手段分类 手工检索 计算机检索10.文献检索Document/
6、Literature Retrieval以文献线索为检索对象的信息检索。用户通过检索获得的是有关某一问题的一系列相关文献线索,然后再根据检出的文献线索去获取原文。它通常通过目录、索引、文摘等二次文献,以原始文献的出处为检索目的,可以向用户提供有关原文文献的信息。它可以回答的问题诸如:“2000年以来国内出版的文献信息检索方面的图书有哪些?”“2000年以来关于大学生自主创业方面的研究文献有哪些?”11.事实检索Fact Retrieval以特定的事项为检索对象的信息检索。检索系统中存贮的是从原始文献中抽取的各种事实,用户通过检索所得到的是有关某一事物的具体答案。它既包括数值数据的检索、运算、推
7、导,也包括事实、概念等的检索、比较、逻辑判断。可以利用各种百科全书、年鉴、名录等进行检索。它可以回答的问题诸如:查找某产品的生产企业、性能,某机构的概况等。中国第一个奥运会冠军是谁?12.数据检索Data Retrieval以数据为检索对象的信息检索。直接查找的是数值型数据。这些数值型数据包括物理性能常数、统计数据、人口数据、国民生产总值、外汇收支等。检索的结果是经过评测、评价过的各种数据,可直接用于比较分析和定量分析。可以利用各种百科全书、手册、年鉴和图谱等进行检索。它可以回答的问题诸如:“2008年在北京举办的奥运会是第几届?”“2007年央行存贷款利率是多少?”13.手工检索Manual
8、 Retrieval优点:可以边检索边思考,随时获得反馈信息,及时调整检索策略,避免可能出现的漏检和误检。缺点:检索速度慢、检索效率低,尤其是在查找较复杂、较大课题的资料信息时,费时费力,效率不高,有时甚至无从查找。计算机检索优点:检索速度快、检索效率高、查全率较高;缺点:成本高、费用大。16.数据库Database*概念长期储存在计算机内,有组织的、可共享的数据集合数据库类型*按信息处理层次划分:书目数据库、文摘数据库、全文数据库。*按照收录的文献类型划分:期刊论文数据、书目及图书全文数据库、专利数据库、学位论文数据库和产品数据库等。*按媒体信息划分:文本数据库、数值数据库、声音数据库、图像
9、数据库、视频数据库和多媒体数据库。*按服务模式划分:单机数据库、联机数据库、网络数据库。17.检索语言类型*按检索词的规范化程度划分:受控语言:也称为人工语言或规范化语言。主要包括分类语言、主题语言(如标题词语言、单元词语言、叙词语言)和代码语言。非受控语言:也称为自然语言,主要是关键词语言。*按信息描述的特征划分:*描述信息内容特征的语言分类语言主题语言代码语言*描述信息外表特征的语言18.分类语言*定义分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。*举例美
10、国杜威十进分类法、比利时国际十进分类法、中国中国图书馆分类法、中国科学院图书分类法、中国人民大学图书馆分类法等。分类语言的优缺点(1)优点:(1)分类法是一种体现知识分类等级概念的标识系统,具有按学科或专业集中地、系统地解释文献信息内容的功能,便于收集某门学科或专业全面、系统的所有文献,用分类方法检索文献具有较高的查全率。(2)分类法将概念逐级划分,具有等级结构,便于扩大和缩小检索范围。(3)用分类号检索,可不受语种的限制。缺点:(1)间接性。分类法用分类号作为检索标识,不能直接表达概念。检索时需要先将检索的主题概念转换为分类号,若不熟悉分类法,就可能发生误差。(2)分类法不能经常修订,因而不
11、能及时反映新的科学技术主题,对属于新兴学科的文献,会找不到十分切题的类目和分类号。(3)分类法的类目不可能详尽无余地列举一切事物概念,遇到检索主题狭窄的文献,可能难以找到相应的类目和分类号,检索结果查准率不高。分类语言的使用(1)分析信息需求的主题内容,确定其所属学科和基本大类的类别(类号)。(2)在简表中按类号查到基本大类及其下属的二、三级类目。(3)按所知的二、三级类目号,查详表中的相应类目。(4)按所得确切分类号在分类检索系统查找,这会获得该类主题内容的大量相关信息,供进一步的筛选。(5)举例(我馆OPAC查询)CNKI查询(I712)2000年至今出版的中外小说*确定分类号*小说文学I
12、*小说世界文学I1 或 小说中国文学I2*小说=I14小说集 或 小说=I24 *检索 19.主题语言*定义也称主题法,指以自然语言的字符为字符,以规范化或未经规范化的名词术语为基本词汇,以概念之间的形式逻辑作为语法和构词法,用一组词语作为信息检索标识而构成的一种检索语言。*类型标题词语言 单元词语言 关键词语言 叙词语言 主题语言的优缺点*优点*不必知道这些文献属于哪门学科,只需用来自文献信息本身的关键性词汇进行标引。*直观性强。主题语言简单、直接,不像分类语言需要转换为分类号,不存在由于语言的转换而可能发生的误差。*专指性强。能形成专指度高的检索标识,从而能进行特性检索,提高查准率。*灵活
13、性强。规范化主题语言有一套较完整的参照系统,能显示词与词之间的相互关系,可供扩检和缩检用。利用词族表和范畴索引,还可以从学科分类角度检索文献。*缺点*分散文献学科体系,查全率低。*词表收词有限,有很多概念在数据库词表中没有反映。词表更新速度较慢,不能及时反映最新学科专业名词术语。20.检索途径*分类途径 主题途径 题名途径 责任者途径 机构名称途径 代码途径 其他途径检索方法*两种检索方法*手工检索方法工具法、引文法、循环法*计算机检索方法*检索方法的选择检索文献信息采用何种方法,需要考虑的因素很多,这主要包括检索课题的目的、性质、所要求的文献信息类型、检索工具和系统的现状、用户的具体要求等。
14、22. 布尔逻辑算符(1)*概念布尔逻辑算符指规定检索词之间相互关系的运算符号,在检索表达式中起着逻辑组配的作用,它们能把一些具有简单概念的检索词组配成一个具有逻辑“与”*运算符为AND或*。*用于交叉概念或限定关系的组配,实现检索词概念范围的交集。*可以缩小检索范围,提高查准率。*例如检索式A AND B或者A*B,表示检出同时含有检索词A和检索词B的记录。检索“人口控制”或者“控制人口”方面的文献信息,可用检索式:人口AND控制*凡是使用AND的检索式检索,AND两侧的检索词必须同时出现在检索字段中。逻辑“或”*运算符为OR或+。*用于检索词并列关系(同义词、近义词)的组配,实现检索词概念
15、范围的并集*它可以扩大检索范围,防止漏检,有利于提高查全率。*例如检索式为:A OR B,表示检出所有含有检索词A或检索词B的记录。检索有关“计算机”的文献资料,因为“计算机”也叫“电脑”,可用检索式:计算机OR电脑*在一篇文献记录中只要含有检索词A和检索词B中的任何一个即算命中。逻辑“非”*运算符为NOT或-。*它是一种排斥关系的组配,用来从原来的检索范围中排除不需要的概念。*它可以缩小检索范围,增强检索的准确性。此运算适用于排除那些含有某个指定检索词的记录。但如果使用不当,将会排除有用文献信息,从而导致漏检。*例如检索式为:A NOT B,表示检出含有检索词A,但同时不含有检索词B的记录。
16、检索有关能源方面的文献信息,但不包括核能,可用检索式:energy NOT nuclear复杂概念的检索式,用以表达用户的检索需求*三种布尔逻辑算符在检索时有时会同时用上,计算机检索时会按优先顺序自动完成算符运算,其中NOT优先级最高,AND次之,OR最低。如果要改变优先级可在检索式中添加优先算符括号()。24.计算机检索方法*常用检索技术截词检索 限制检索 加权检索 短语或词组检索 精确与模糊检索25. 确定检索方法引文法:如果检索工具不齐备,研究课题的主题概念不太复杂,涉及面不广,不要求查全的情况下,可用引文法。顺查法:如果研究课题要求的信息要“全”和“准”,例如课题立项审查和科研成果鉴定
17、类项目查新,可用顺查法。倒查法:如果研究课题属于边缘学科或新兴学科及老课题补充新资料,要求的信息“快”和“准”,可用倒查法。抽查法:如果某一学科研究高潮很明显的、某一专业的发展阶段很清晰的、某一事物出现频率在某一阶段很突出的课题,可用抽查法。循环法:在研究课题涉及范围广、主题概念复杂、持续时间长的情况下,可采用循环法。26. 检索步骤分析检索课题 提取检索词 选择检索工具 确定检索方法 构建检索提问式 输出结果27.分析检索课题(1)*分析课题是检索的准备阶段,是为了确立查询需求,是整个查询过程的出发点,包括对课题类型、背景知识、概念及知识体系的分析,并提出拟解决的问题,要求分析仔细、全面。(
18、1)要确定资料的全面性与专深性,明确课题要求是全面收集某一主题的文献资料,还是关于某一主题的某一特定方面的文献资料;是查找特定文献,根据某一篇文献的线索查找原文;分析检索课题(2)*或是已知某一作者,查询其所有发表的文章;是对某一领域的最新研究动向或研究成果的收集,或是对某一问题做大致的了解,并就问题的一个方面,表示自己的观点撰写小型论文;是对某一课题做全面调查研究,了解该课题的整个发展过程,或是全面而细致的了解国内外有关的所有出版的情况,年代范围较广,撰写综述或研究报告。检索的侧重点是在资料的全面性上还是资料的准确性或专深性上。分析检索课题(3)(2)要求收集的资料是数据、事实还是相关文献,
19、是寻找针对具体问题的准确答案、数据,或解决问题,或作为论据和引证的证据。(3)确定信息收集的时间范围,是近年、过去的一个时期,还是对未来的预测,或者两者都要。(4)所需求的信息被加工深度是多少,只是获取原文,还是只需要相关线索,或者是需求综述性、评论性的资料。(5)所需求资料的文献类型是哪些,图书、期刊、报纸、学位论文、专利、会议、标准、科技报告、网络信息或是几种类型的综合?28. 根据词间关系,1个检索词有4种变化,即等同词、近义词、上位词、下位词。词间关系分析法(2)(2)上位词指概念上外延更广的主题词,如“植物”是“花”的上位词,“花”是“鲜花”的上位词。(3)下位词指概念上内涵更窄的主
20、题词,如“鲜花”是“花”的下位词,“花”是“植物”的下位词。(4)同类词指与主题词具有某种相同属性的词。故与主题词有同一个上位词的,都是同类词。如菊花、荷花、茶花为同类词,均有同一个上位29.选择检索工具(1)*分析了信息需求后,可根据课题的学科内容、检索的语种、地域、时间以及信息类型等已知的条件来选择合适的检索工具。选择检索工具要根据检索课题的要求、检索系统的特点和检索者的外语水平,选择适宜的检索系统,数据库的选择具体可以考察:选择检索工具(2)1)其类型能否满足检索需要;2)其学科专业范围能否与检索课题的学科专业相吻合;3)收录的信息量、信息类型、收录的时间范围、更新周期是否符合检索需求;4)数据库的基本索引及辅助索引、标引深度、提供的功能、检索途径和检索入口有何特点;5)检索费用。选择检索工具(3)*可以利用馆藏数据库目录、检索工具指南、联机数据库目录、光盘数据库目录和数据库指南等来选择数据库。联机检索也可以利用系统提供的数据库总索引文档来选择检索文档。目前,随着因特网的快速发展,网上信息剧增,用户可以利用网上各种信息查询工具,对网上的大量免费数据库和信息库进行检索和下载。30.提高检索效果的措施*提高用户信息素质*选择好的检索工具和系统*优选检索词*合理调整检索式