资源描述
检索概论检索概论 1.1.信息检索概述信息检索概述 2.2.信息检索原理信息检索原理 3.3.信息检索方法信息检索方法 4.4.信息检索技术信息检索技术返回课表16 15 8 14 13 122.1 2.1 检索概述检索概述 2.1.1 信息检索的含义信息检索的含义 2.1.2 信息检索的实质信息检索的实质 2.1.3 信息检索的作用信息检索的作用 2.1.4 信息检索的类型和特点信息检索的类型和特点2.1.1 信息检索的含义信息检索的含义 信息检索通常是指从任何方式组成的信息信息检索通常是指从任何方式组成的信息集合集合中,查找特定用户在特定时间和条件下所中,查找特定用户在特定时间和条件下所需信息的方法与过程,此外还应包括信息的存需信息的方法与过程,此外还应包括信息的存储。即信息检索包括两个方面:储。即信息检索包括两个方面:、信息标引和存储过程、信息标引和存储过程 、信息的检索过程、信息的检索过程5信息标引和存储过程信息标引和存储过程 对大量无序的信息资源对大量无序的信息资源进行标引处理,使之有序化,进行标引处理,使之有序化,并按科学的方法存储,组成并按科学的方法存储,组成检索工具的过程称为标引存检索工具的过程称为标引存储过程。储过程。信息的检索过程信息的检索过程 分析用户的信息需求,利用分析用户的信息需求,利用已组织好的检索工具,按照检索已组织好的检索工具,按照检索工具提供的方法与途径,检索需工具提供的方法与途径,检索需求的信息。求的信息。2.1.2 信息检索的实质信息检索的实质 将描述特定用户所需信息的提问特将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本比较,从中找出与提问特征一致或基本一致的信息。这里说的提问特征是指从一致的信息。这里说的提问特征是指从欲检索课题中选择出能代表信息需求的欲检索课题中选择出能代表信息需求的主题词、关键词或分类号等。主题词、关键词或分类号等。22.1.3 信息检索的作用信息检索的作用 1、充分利用信息资源,避、充分利用信息资源,避免重复劳动。免重复劳动。2 2、为人们更新知识,提供、为人们更新知识,提供终生学习的方法。终生学习的方法。22.1.4 信息检索的类型和特点信息检索的类型和特点 、书目信息检索书目信息检索 、全文信息检索全文信息检索 、数据信息检索数据信息检索 、事实信息检索事实信息检索文献检索文献检索6书目信息检索书目信息检索 以标题、作者、原文来源、摘要及收藏地点为检索对象以标题、作者、原文来源、摘要及收藏地点为检索对象的一类检索称之为书目信息检索。特点:检索结果不直接解的一类检索称之为书目信息检索。特点:检索结果不直接解答用户提出的技术问题,只提供有关线索。答用户提出的技术问题,只提供有关线索。例如:查找混凝土裂缝的原因、修补及防治措施的文献信息。例如:查找混凝土裂缝的原因、修补及防治措施的文献信息。陈荣志陈荣志.浅谈混凝土裂缝原因及防治对策浅谈混凝土裂缝原因及防治对策JJ,建材与装饰,建材与装饰 2007(09X)2007(09X):118-119118-119 随着现代建筑技术的不断发展,大体积混凝土的应用越随着现代建筑技术的不断发展,大体积混凝土的应用越来越广泛。顾名思义,大体积混凝土的特点就是施工体积厚来越广泛。顾名思义,大体积混凝土的特点就是施工体积厚大。通过对大体积混凝土产生裂缝的原因进行分析,并提出大。通过对大体积混凝土产生裂缝的原因进行分析,并提出相应的解决办法,并列举实际工程应用。相应的解决办法,并列举实际工程应用。收藏地点:维普数据库收藏地点:维普数据库全文信息检索全文信息检索 以论文或专利说明书的全文为检索对象的以论文或专利说明书的全文为检索对象的一类检索叫做全文信息检索。特点:检索结果一类检索叫做全文信息检索。特点:检索结果是与课题相关的论文或专利说明书的全文,是是与课题相关的论文或专利说明书的全文,是在书目信息检索基础上更深层次的内容检索。在书目信息检索基础上更深层次的内容检索。例如检索例如检索“浅谈混凝土裂缝原因及防治对策浅谈混凝土裂缝原因及防治对策”的全文的全文。数据信息检索数据信息检索 以具有数量性质并以数值形式表示的数据以具有数量性质并以数值形式表示的数据为检索对象的一类检索。检索的结果是经过测为检索对象的一类检索。检索的结果是经过测试和评价过的各种数据,如统计数据、市场行试和评价过的各种数据,如统计数据、市场行情等,可用于比较分析和定量分析。它是一种情等,可用于比较分析和定量分析。它是一种确定性检索。完成数据型信息检索主要借助于确定性检索。完成数据型信息检索主要借助于参考工具书参考工具书及数据型数据库(中国年鉴全文数及数据型数据库(中国年鉴全文数据库、中国资讯行等)。据库、中国资讯行等)。事实信息检索事实信息检索 事实检索是查找某一问题的具体答事实检索是查找某一问题的具体答案,如词语的解释、人物生平、历史事案,如词语的解释、人物生平、历史事件、机构概况等,完成事实检索主要借件、机构概况等,完成事实检索主要借助于助于参考工具书参考工具书及事实型数据库(百度、及事实型数据库(百度、谷歌等)。谷歌等)。2.2 检索原理检索原理 2.2.1 信息检索效率信息检索效率 2.2.2 信息检索系统信息检索系统 2.2.3 信息检索语言信息检索语言2.2.1 信息检索效率信息检索效率 信息检索效率是评价一个检索信息检索效率是评价一个检索系统性能优劣的质量标准,它贯穿系统性能优劣的质量标准,它贯穿于信息的存储和检索的全过程。其于信息的存储和检索的全过程。其评价指标是评价指标是 查全率查全率 查准率查准率查全率查全率 利用数据库进行某一课题检索,检利用数据库进行某一课题检索,检出的相关信息量出的相关信息量 (w w)与数据库中存储)与数据库中存储的相关信息量的相关信息量 (X X)的比率称为查全率)的比率称为查全率(R R),用公式表示如下:),用公式表示如下:R=(W/X)100%R=(W/X)100%注:由于注:由于“X X”是未知数,所以该指是未知数,所以该指标只是定性指标。标只是定性指标。查准率查准率利用数据库进行某一课题检索,利用数据库进行某一课题检索,检出的相关信息量(检出的相关信息量(w w)与检出信息)与检出信息总量(总量(M M)的比率称为查准率()的比率称为查准率(P P),),用公式表示如下:用公式表示如下:P=(W/M P=(W/M)100%)100%举例举例 如果一个检索系统中与某一课题有关的如果一个检索系统中与某一课题有关的信息共信息共 250 250 条(条(X X,假定,恒定),实际,假定,恒定),实际检出检出 400 400 条(条(M M,可变),其中相关信息,可变),其中相关信息为为 200200条(条(W W,可变),此次检索效率可计,可变),此次检索效率可计算为:算为:R=200/250 100%=80%R=200/250 100%=80%(假定)(假定)P=200/400 100%=50P=200/400 100%=50(实际)(实际)2.2.2 信息检索系统信息检索系统 信息检索系统是拥有一定的存信息检索系统是拥有一定的存储、检索技术装备、存储有各种信储、检索技术装备、存储有各种信息,并能为用户检索所需信息的服息,并能为用户检索所需信息的服务工作系统。可分为务工作系统。可分为手工检索系统手工检索系统和和计算机检索系统计算机检索系统。手工检索系统手工检索系统 手工检索系统是一种用人力手段查找信息手工检索系统是一种用人力手段查找信息的检索系统。类型有各种书本式的题录、索引、的检索系统。类型有各种书本式的题录、索引、文摘、目录。特点:符合人们的传统习惯,但文摘、目录。特点:符合人们的传统习惯,但检索速度慢。本课程介绍我国的检索速度慢。本课程介绍我国的全国报刊索全国报刊索引引和和中国学术期刊文摘中国学术期刊文摘;美国的;美国的化学化学文摘文摘和英国的和英国的世界专利索引世界专利索引等。等。计算机检索系统计算机检索系统 计算机检索系统是用计算机技术、计算机检索系统是用计算机技术、电子技术、远程通信技术、光盘技术、电子技术、远程通信技术、光盘技术、网络技术构成的存储和检索信息的服务网络技术构成的存储和检索信息的服务工作系统。特点:检索速度快,检索效工作系统。特点:检索速度快,检索效率高;能采用灵活的逻辑运算;提供远率高;能采用灵活的逻辑运算;提供远程检索程检索。计算机检索主要过程计算机检索主要过程 存储时,将大量的信息以一定的格存储时,将大量的信息以一定的格式输入到系统中,加工处理成可供检索式输入到系统中,加工处理成可供检索的数据库;检索时,将符合检索需求的的数据库;检索时,将符合检索需求的提问式输入计算机,在选定的数据库中提问式输入计算机,在选定的数据库中进行匹配运算,然后将符合提问式的检进行匹配运算,然后将符合提问式的检索结果按要求的格式输出。索结果按要求的格式输出。2.2.3 2.2.3 信息检索语言信息检索语言 检索语言又称标引语言,是系检索语言又称标引语言,是系统存储和检索时共同使用的一种约统存储和检索时共同使用的一种约定语言,以达到信息存储和检索的定语言,以达到信息存储和检索的一致性,提高检索效率。一致性,提高检索效率。特点功能类型特点功能类型检索语言的特点检索语言的特点 1 1、其语法规则能准确表达任何学科中、其语法规则能准确表达任何学科中的标引和提问的主题;的标引和提问的主题;2 2、具有表达概念的惟一性;、具有表达概念的惟一性;3 3、具有检索标识和提问特征进行比较、具有检索标识和提问特征进行比较和识别的方便性。和识别的方便性。检索语言的功能检索语言的功能 能沟通信息的存储和检索的全能沟通信息的存储和检索的全过程,是信息标引存储人员与检索过程,是信息标引存储人员与检索人员之间进行交流的媒介,以保证人员之间进行交流的媒介,以保证信息检索过程的顺利完成。信息检索过程的顺利完成。检索语言的类型检索语言的类型 体系分类语言体系分类语言 分类语言分类语言 组配分类语言组配分类语言 混合分类语言混合分类语言 标题词语言标题词语言 主主 题题 关键词语言关键词语言 语语 言言 叙词语言叙词语言 单元词语言单元词语言体系分类语言体系分类语言 体系分类语言是按学科逻辑分类的原理,体系分类语言是按学科逻辑分类的原理,运用概念划分的方法,按知识门类从总到分,运用概念划分的方法,按知识门类从总到分,从上到下,层层划分,逐级展开组成分类表,从上到下,层层划分,逐级展开组成分类表,并以分类表来标引、存储信息和检索信息。特并以分类表来标引、存储信息和检索信息。特点是体现学科的系统性,反映事物的平行、隶点是体现学科的系统性,反映事物的平行、隶属和派生关系,有利于从学科的角度进行族性属和派生关系,有利于从学科的角度进行族性检索,达到较高的查全率。检索,达到较高的查全率。中图法中图法基本部类和大类表基本部类和大类表基本部类基本部类基本大类基本大类1.马列、毛泽东思想马列、毛泽东思想A.马列主义毛泽东思想邓小平理论马列主义毛泽东思想邓小平理论2.哲学哲学B.哲学、宗教哲学、宗教3.社会科学社会科学C.社会科学总论社会科学总论 D.政法政法 E.军事军事 F.经济经济 H.语言语言 I.文学文学 J.艺术艺术 K.历史地理历史地理4.自然科学自然科学N.自然自然 O.数理化数理化 P.天文地球天文地球 Q.生物科学生物科学 R.医药医药 S.农业农业 T.工业技术工业技术 U.交通交通V.航空航天航空航天 X.环境科学安全科学环境科学安全科学5.综合性图书综合性图书Z.综合性图书综合性图书 T大类二级类目表大类二级类目表 TB 一般工业技术一般工业技术 TL 原子能技术原子能技术 TD 矿业工程矿业工程 TM 电工技术电工技术 TE 石油、天然气工业石油、天然气工业 TN 无线电电子与电信无线电电子与电信 TF 冶金工业冶金工业 TP 自动化与计算机技自动化与计算机技 TG 金属学与金属工艺金属学与金属工艺 TQ 化学工业化学工业 TH 机械、仪表工业机械、仪表工业 TS 轻工业、手工业轻工业、手工业 TJ 武器工业武器工业 TU 建筑科学建筑科学 TK 能源与动力工程能源与动力工程 TV 水利工程水利工程“网络游览器网络游览器”类号、类目展开示例类号、类目展开示例TP3 计算技术、计算机技术计算技术、计算机技术TP39 计算机应用计算机应用TP393 计算机网络计算机网络TP393.0 一般性问题一般性问题TP393.09 计算机网络应用程序计算机网络应用程序TP393.092 网络游览器网络游览器 网址资源、网址资源、Netscape、Netscape、主页制作等入此、主页制作等入此。关键词语言关键词语言 关键词语言是一种主题语言(采用关键词语言是一种主题语言(采用表达某一事物或概念的名词术语标引、表达某一事物或概念的名词术语标引、存储和检索的一种语言)。它是直接从存储和检索的一种语言)。它是直接从原文的标题、摘要或全文中抽选出来的原文的标题、摘要或全文中抽选出来的具有实质意义的、未经规范化处理的自具有实质意义的、未经规范化处理的自然语言词汇作为存储和检索依据的一种然语言词汇作为存储和检索依据的一种检索语言。检索语言。关键词语言的特点关键词语言的特点 关键词表达事物、概念直接、准确,关键词表达事物、概念直接、准确,能及时反映新事物新概念。目前,关键词能及时反映新事物新概念。目前,关键词语言广泛用于手工检索和计算机检索(光语言广泛用于手工检索和计算机检索(光盘检索和网络检索)。但由于关键词检索盘检索和网络检索)。但由于关键词检索系统不显示词间关系,不能进行缩检和扩系统不显示词间关系,不能进行缩检和扩检。检。叙词语言叙词语言 叙词语言是以自然语言为基础,概念组配叙词语言是以自然语言为基础,概念组配为原理,经过规范化处理的最小概念单元为信为原理,经过规范化处理的最小概念单元为信息存储和检索依据的一种检索语言。它吸收了息存储和检索依据的一种检索语言。它吸收了其它检索语言的优点,如:体系分类语言的等其它检索语言的优点,如:体系分类语言的等级关系,编制了词族表;标题词语言的规范化级关系,编制了词族表;标题词语言的规范化处理方法和参见系统,编制了叙词表;关键词处理方法和参见系统,编制了叙词表;关键词语言的轮排方法和单元词语言的组配原理。语言的轮排方法和单元词语言的组配原理。组配性规范性语义性组配性规范性语义性叙词语言的组配性叙词语言的组配性 1 1、相交组配:汽车部件、相交组配:汽车部件*发动机发动机=汽车发动机汽车发动机(产生新概念)(产生新概念)2 2、限定组配:电视机、限定组配:电视机*数字化数字化=数字电视机数字电视机(产生新概念)(产生新概念)3 3、并列组配:环境污染、并列组配:环境污染+环境保护环境保护=环境污染环境污染和环境保护(概念扩大)和环境保护(概念扩大)4 4、删除组配:计算机、删除组配:计算机-模拟计算机模拟计算机=数字计算数字计算机(概念缩小)机(概念缩小)4叙词的词义规范性叙词的词义规范性 1 1、词义规范:对同义词(计算机和电脑)近、词义规范:对同义词(计算机和电脑)近义词(实验和试验)、学名和俗名(发动机和义词(实验和试验)、学名和俗名(发动机和马达)、不同译名(激光和莱塞)、简称和全马达)、不同译名(激光和莱塞)、简称和全称等进行规范。称等进行规范。2 2、词类规范:用作叙词的词类应是具有实、词类规范:用作叙词的词类应是具有实质意义的名词和动名词。质意义的名词和动名词。3 3、词形规范:对词的简繁、词序做出规定。、词形规范:对词的简繁、词序做出规定。叙词的语义性叙词的语义性 叙词与叙词之间存在一定的语叙词与叙词之间存在一定的语义关系。叙词之间的语义关系有:义关系。叙词之间的语义关系有:同义关系、属分关系和相关关系。同义关系、属分关系和相关关系。这些关系是通过各种语义参照符号这些关系是通过各种语义参照符号来揭示的。来揭示的。叙词的语义参照系统叙词的语义参照系统参照参照关系关系参照项参照项中文中文符号符号英文英文符号符号作用作用同义同义用用YUSE非非 叙叙代代DUF叙叙 非非属属SBT下下 上上属分属分分分FNT上上 下下族族ZTT下下 高高相关相关参参CRT叙叙 相关相关汉语主题词表基本结构汉语主题词表基本结构电视显像管电视显像管 Y 显像管显像管显像管显像管 D 电视显像管电视显像管 F 彩色显像管彩色显像管 黑白显像管黑白显像管 S 电子束管电子束管 Z 电子管电子管 C 显示管显示管检索方法检索方法 检索方法也就是检索的具体操作方法或检索方法也就是检索的具体操作方法或手段。分直接检索和间接检索两种,直手段。分直接检索和间接检索两种,直接检索是通过浏览各种出版物上的论文接检索是通过浏览各种出版物上的论文或专利说明书,以了解有关学科或专题或专利说明书,以了解有关学科或专题发展动态的一种检索方法。针对性强但发展动态的一种检索方法。针对性强但查全率低。本课程介绍的是查全率低。本课程介绍的是间接检索间接检索。2.3 2.3 检索方法检索方法 2.3.1 信息需求分析信息需求分析 2.3.2 制定检索策略制定检索策略 2.3.3 实施检索策略实施检索策略间接检索间接检索 间接检索是借助于各种检索工具,从大间接检索是借助于各种检索工具,从大量的信息中,迅速、准确地查找课题所需信量的信息中,迅速、准确地查找课题所需信息的一种方法。特点是所获得信息的全面性息的一种方法。特点是所获得信息的全面性和准确性都较高。其检索步骤有如下四步:和准确性都较高。其检索步骤有如下四步:信息需求分析、制定检索策略、实施检索策信息需求分析、制定检索策略、实施检索策略和评价检索效果。略和评价检索效果。2.3.1 信息需求分析信息需求分析 信息需求是人们在客观或主观上就信息需求是人们在客观或主观上就课题所需信息的要求,是人们检索信息课题所需信息的要求,是人们检索信息的基本出发点,也是评价检索效果的依的基本出发点,也是评价检索效果的依据。它包括两个方面:据。它包括两个方面:1 1、明确检索的目的和要求、明确检索的目的和要求 2 2、对主题进行分析、对主题进行分析2.3.2 2.3.2 制定检索策略制定检索策略 检索策略是为了达到检索目标检索策略是为了达到检索目标而制定的具体检索方案。包括选择而制定的具体检索方案。包括选择检索系统、确定检索词和检索入口、检索系统、确定检索词和检索入口、拟定检索程序。按检索手段分可为拟定检索程序。按检索手段分可为手工检索策略手工检索策略和和上机检索策略上机检索策略。手工检索策略手工检索策略 (1 1)选择检索系统:主要从学科和文献类型)选择检索系统:主要从学科和文献类型方面考虑。方面考虑。(2 2)确定检索途径:检索系统一旦确定,检)确定检索途径:检索系统一旦确定,检索途径也就确定。从中再选择最佳途径,分类索途径也就确定。从中再选择最佳途径,分类和主题途径是最常用的检索途径。分类途径查和主题途径是最常用的检索途径。分类途径查全率高;主题途径查准率高。全率高;主题途径查准率高。(3 3)拟定检索程序:不需书面表达式。)拟定检索程序:不需书面表达式。上机检索策略上机检索策略()选择检索系统:即选择()选择检索系统:即选择数据库数据库。()确定检索词:根据课题要求选择关()确定检索词:根据课题要求选择关键词、作者姓名等等。键词、作者姓名等等。()拟定检索程序:运用检索技术构造()拟定检索程序:运用检索技术构造一个既能表达一个既能表达检索要求检索要求又能又能为计算机识为计算机识别别的检索提问式。的检索提问式。2.3.3 实施检索策略实施检索策略 分为获取信息线索和分为获取信息线索和索取原始信息索取原始信息两步。两步。获取信息线索是将主题词、分类号、作者名等获取信息线索是将主题词、分类号、作者名等提问特征与检索系统中提供的检索标识进行比提问特征与检索系统中提供的检索标识进行比较,选出与信息需求一致或基本一致的结果。较,选出与信息需求一致或基本一致的结果。其中重要一步是准确区别文献类型。这里给出其中重要一步是准确区别文献类型。这里给出著作、论文、专利说明书、科技报告和技术标著作、论文、专利说明书、科技报告和技术标准的准的区分标志区分标志。如何区别文献的类型如何区别文献的类型(1)著作:以图书形式出版。给出书名、出版)著作:以图书形式出版。给出书名、出版社、版次和国际标准书号等。社、版次和国际标准书号等。(2)论文:一般以期刊形式发表。给出刊名、)论文:一般以期刊形式发表。给出刊名、卷、期、年代、国际标准刊号和语种。若是会议卷、期、年代、国际标准刊号和语种。若是会议论文,给出会议或会议录名称、主办单位、会议论文,给出会议或会议录名称、主办单位、会议召开地点和时间等。可用下列单词区别:召开地点和时间等。可用下列单词区别:Proceedings、Conference、Meeting、Symposium、Convention。(3)专利说明书:给出专利国别、专利号)专利说明书:给出专利国别、专利号等和批准日期等。如等和批准日期等。如EP761743 12 May(4)科技报告:给出报告字样、报告机构)科技报告:给出报告字样、报告机构代号和报告号等。如代号和报告号等。如Report AD-A2649(5)技术标准:给出)技术标准:给出Standard、Specification字样及标准机构代号,如字样及标准机构代号,如ISO、IEC、GB等。等。索取原始信息索取原始信息将所得的检索结果进行归类剔重后,将所得的检索结果进行归类剔重后,按由近及远的原则索取原文。按由近及远的原则索取原文。(1)查找电子全文。)查找电子全文。(2)查馆藏目录,由索取号借阅复制。)查馆藏目录,由索取号借阅复制。(3)查联合目录,发函索取。)查联合目录,发函索取。(4)其他方法获取全文。)其他方法获取全文。文献检索文献检索以文献信息为检索对象,其检索结果可以是文献线索(篇名、作者、机构、原文出处等),或是具体的文献(文章的全文)。一条文献记录粉末冶金工业起止页码:10-13国际标准刊号:ISSN 1006-6543国内统一刊号:CN 11-3371/TF超细活性超细活性锌粉锌粉的制备与表征的制备与表征侯新刚侯新刚 王胜王胜 王玉棉王玉棉 PDF全文下载(187K)兰州理工大学有色金属新材料重点实验室,甘肃兰州,兰州理工大学有色金属新材料重点实验室,甘肃兰州,730050摘要摘要:本文介绍了电解法制备超细活性锌粉的工艺方法。结合实验结果讨论了溶液锌离子浓度、电流密度、电解液温度、表面活性剂等条件对粉末粒度的影响。对制得的粉末用扫描电镜(SEM)、X射线衍射(XRD)、表面活性测定仪(BET)进行了粒度的测定和结构分析。关键词关键词:锌粉 电解法 表面活性剂 制备 表征 粉末冶金分类号分类号:TF123.72机标书目信息检索【题名】超细活性锌粉的制备与表征【作者】侯新刚 王胜 王玉棉【原文出处】粉末冶金工业.2004,14(1).-10-13【文摘】本文介绍了电解法制备超细活性锌粉的工艺方法。结合实验结果讨论了溶液锌离子浓度、电流密度、电解液温度、表面活性剂等条件对粉末粒度的影响。对制得的粉末用扫描电镜(SEM)、X射线衍射(XRD)、表面活性测定仪(BET)进行了粒度的测定和结构分析。【原文收藏】该数据库提供了原文。信息检索的实质
展开阅读全文