资源描述
,网络信息资源检索与利用,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第二讲 计算机信息检索基础知识,1,主要内容,计算机检索的概念,数据库及其类型,数据库的结构,计算机检索技术,计算机检索的步骤、方法、途径,2,指利用计算机存储和检索信息。,具体地说,就是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息的过程。,一 计算机信息检索的定义,3,计算机信息检索包含两个内涵:,存储过程,:大量的数据按一定的格式输入到计算机中,经过计算机的加工处理,以一定的结构有序地存储在计算机的存储介质上。,查找过程,:用户的需求输入到计算机中,由计算机对其进行处理,并与已存储在计算机中的信息进行查询与匹配,最后按要求的格式输出检索结果,4,信息检索原理,5,举例,:,【,题名,】,信息检索技术在网络数据库中的应用研究,【,作者,】,邹小筑,1,缪红梅,2,【,机构,】1,南京大学信息管理系,南京,210093 2,南京航空航天大学,南京,210016,【,刊名,】,图书情报工作,.2007,51(2).-104-106,131,【ISSN,号,】0252-3116,【,关键词,】,信息检索技术 网络数据库 检索平台,【,文摘,】,以信息检索技术为脉络,结合,Ei Village2,、,ISI Web of Knowledge,、,CSAIDS,、,EBSCOHost,、,ProQuestordjne,等多个著名检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙词表构建技术在网络数据库的应用,研究表明信息检索技术已深深植入网络信息资源管理之中,深入剖析信息检索技术,可以清晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方法,为网络信息资源评价和建设提供依据。,6,输入,:“,信息检索技术”,(,题名字段,)-,命中该信息,输入,:“,光盘数据库”,(,题名字段,)-,不会命中该信息,7,输入“信息检索技术”,检索结果,8,计算机信息检索特点,检索速度快,效益高;,检索功能强,数量大;,检索途径多,手段灵活;,检索范围广,服务方式多。,9,二 数据库及其类型,概念,数据库是在计算机存贮设备上按一定方式存储的相互关联的数据集合。,10,数据库类型,按内容和功能划分,参考型数据库,以文档的形式组织起来,提供文献的题录、文摘等书目信息,全文型数据库,存储文献全文或其中的主要部分的源数据库,事实型数据库,供查询某一客体的基本事实或简况,包括名录、传记等数据库,数值型数据库,提供各类数值型数据,图象数据库,以图形、图象为记录单位,11,返回,12,返回,13,返回,14,返回,15,返回,16,数据库类型,按收录专业范围划分,综合性数据库,收录多个学科或专业的信息资料。如中国期刊网,专业性数据库,收录单一学科或专业的信息资料。,专题性数据库,收录某一特定专题的信息资料,17,综合型数据库,返回,18,专业数据库,:,返回,19,专题数据库,20,三 数据库的结构,字段、记录和文档,字段,:,文献著录的基本单元,反映文献外部特征和内容特征的每一项目,在数据库中就称为字段。,如:关键词,KW,、题名,TI,、文摘,AB,、作者,AU,、刊名,JN,、出版时间,PY,、语种,LA,等,21,记录,由若干不同字段组成的文献单元,一条记录在数据库中代表一篇文献。,数据库(文档),由若干数量的记录构成的数据的集合。大型的数据库检索系统中称为文档。,22,中国期刊网字段示例,可检索字段,23,24,详细记录,命中记录列表,25,四 计算机检索技术,1,布尔逻辑运算符,2,截词算符,3,字段限制,4,范围限制,5.,短语检索,6.,括号检索,26,1,、布尔逻辑运算符,逻辑,与,:,“,*,”,或,“,and,”,逻辑,或,:,“,+,”,或,“,or,”,逻辑,非,:,“,-,”,或,“,not,”,27,“,与”算符,and AND *,“,与”算符用于描述概念间的交叉关系和限定关系。,含义:,检出文献中必须同时包含被其连接的所有词或词组。,作用:,缩小检索范围,提高查准率。,例如:儿童*心理学,computer AND virus,28,A,B,A and B,计算机*病毒,作用:,缩小检索范围,提高检准率,与运算示意图,computer,virus,29,“,或,”,算符,or OR +,“,或”算符可描述概念间的并列关系和相关关系,用来组配同义词或相关词等。,含义:,检出文献中包含有被其连接的任意一个词或词组。,作用:,扩大检索范围,提高查全率。,例如:自行车,+,脚踏车,CAD or computer aided design,30,B,A,A or B,作用:,扩大检索范围,提高检全率,或运算示意图,pipe,tube,31,“,非,”,算符,not NOT -,“,非”算符用于描述概念间的排斥关系和特殊限定关系。,含义:,检出文献中必须包含这个算符前的词,必须不含这个算符后的词。,作用:,缩小检索范围,提高查准率。,例如:水果,香蕉,Patent not German,32,B,A,A not B,专利,德国,作用:,缩小检索范围,排除某一集合概念,非运算示意图,German,Patent,33,2,、截词,(?,或*),将截词符加在检索词的前后或中间,以检索一组概念相关或同一词根的词。,作用:,扩大检索范围,提高文献的查全率。,如:,comput?,computer computers computing,dam*,dam dams,wom?n,woman women,34,3,、字段限制,指将检索词限定在特定的字段中进行。,同样的检索词,选择在不同字段中进行检索,得到的结果是不同的。,检索系统通常都会设置默认的检索字段,如“所有字段”。如果想指定在特定的字段中查找检索词,就需要调整检索字段,进行字段限制。,35,缺省字段为“篇名”,36,缺省字段为“关键词”,37,缺省字段为“,All fields”,38,如果从文献的内容特征出发查找文献,可选的检索字段有“,篇(题)名,title,”,、“,关键词,keyword,”,、“,文摘,abstract,”,以及“,全文,fulltext,”,。,39,一般,如果使用相同的检索词分别在这几个字段中检索,那么检到的文献数会依次递增,而命中的准确率则依次递减。,题名,关键词(,文摘,),全文,检 全 率 递 增,检 准 率 递 增,40,命中,31,篇,命中,80,篇,41,命中,44,篇,命中,410,篇,42,4,范围限制,指对检索词的范围(如时间、国别、语种、信息类型等)进行约束或压缩的方法,它大多通过检索系统的限制指令或菜单选择来实现。,43,工程索引检索界面,44,5.,短语检索,用“”表示,检索出与“”内容完全相同的短语,提高检索的精度和准确度。,“,international space station”,45,6.,括号检索,用于改变运算的先后顺序,括号内的运算优先进行。,(,university or college)and education,46,五,计算机检索步骤,、,方法,、,途径,大体可分为五个步骤:,1.,分析课题的内容;,2.,选择信息资源;,3.,构造检索式,选择检索途径;,4.,上机检索;,5.,分析检索结果,调整检索策略。,47,1.,分析课题的内容,明确检索目的,需要关于某一课题的系统详尽的信息,需要关于某一课题的最新信息,了解一些片断信息,解决一些具体问题,48,明确课题的主题或主要内容,要形成若干个既代表信息需求又有检索意义的主题概念,包括所涉及的主题概念有几个,哪些是主要的,哪些是次要的,概念之间关系如何等,49,课题涉及的学科范围:搞清楚课题所涉及的学科领域、是否跨学科研究,所需信息的数量、语种、年代范围、类型等具体化指标,50,例:,检索课题,-,不锈钢焊接,检索目的,查找范围,了解最新的技术动态,利用期刊、会议录类的数据库查找,了解焊缝强度的测试方法和有关规格,利用技术标准类的数据库查找,申请专利,利用专利类数据库查找,51,2.,选择信息资源,是否与检索课题相关的资源都要检索,选择哪些学科的信息资源,选择哪些语种的信息资源,信息资源覆盖的年限是否符合需求,信息资源的特点及其针对性如何,52,3,、构造检索式 选择检索点,检索式,是表达用户检索提问的逻辑表达式,由基于检索概念产生的检索词和各种组配算符构成。,检索点,即检索途径或检索入口、检索字段。检索点正确与否,决定着检索结果的数量与质量。,53,确定检索词,如:“吸烟与心脏病的关系”可以表达为,connection between somking and heart disease,通过分析发现,其中,只有,somking,和,heart disease,两个概念词,而“,connection between”,则不属于概念词。,概念,1,:,somking,概念,2,:,heart disease,54,针对每一个概念,选择与之相关的同义词或相关词,与,somking,相关的词有:,smoker,smokers,tobacco,等;,heart disease,的同义词有,cardiopathy,heart trouble,heart attack.,将这些相关词记录下来,用于构造检索式:概念,1,:,somking,smokers,tobacco,概念,2,:,cardiopathy,heart disease,,,heart trouble,heart attack,55,选,定,检索词的方法,同,义词,、,近义词、相关词,查,阅,工具如,专业词表词,典,字典,分,类,表,等,根据词表或数据库中的索引选词,从专业词典、百科全书等参考工具中选词,利用中文全文数据库选择英文检索词,56,编制检索式,使用,逻辑,算符(,AND,OR,NOT)、,截词、位置算符,,限制,检索条件,至作者,刊物或年代,.,调整其他设定,选定检索结果的显示方式,日期,相关度等排序,57,例,(,smok*,OR,tobacco,),AND,(,cardiopathy,OR,heart disease,OR,heart trouble,OR,heart attack,),“,吸烟与心脏病的关系”,58,4,进行检索,可利用数据库提供的不同级别 的检索界面进行检索,-,初级检索,-,高级检索,59,5,分析检索结果 调整检索策略,不满意,满意,60,不滿意,非目,标,的,结,果,检,查,检,索名,词,的,拼写,增加,检,索名詞的,准确,性,查阅,工具如,词,表,字典,分,类,表及字,汇,表,刪除,错误,的名,词,审,查被,检,索的,数据库,查阅数据库的说明,及期刊列表以,确,定是否覆,盖,你所要的主,题,重新,检,索,61,不滿意,结,果太多,增设,限制,条,件至特定,栏,位及年代,增加,检,索名,词,的,准确,性,-,查,阅,工具如,词,表,字典,分,类,表及字,汇,表,增加,检,索策略的,准确,性,增加使用,AND;,减,少使用,OR,重新,检,索,62,不滿意,结,果太少,检,查,检,索名,词,的,拼写,增加,检,索名,词,的普遍性,-,查,阅,工具如,词,表,字典,分,类,表及字,汇,表,扩大检,索策略,减,少使用,AND;,使用,Or,连接,同,义词,及,相关词,增加被,检,索的,数据库,确,定其他,数据库,是否覆,盖,你所要的主,题,重新,检,索,63,满,意,是否已全,部获取,所需?,打印、,电邮,或,存档,需否,获取与题录,相,关,的全文?,查找图书馆馆馆藏书目系统(,OPAC,),确定是否有纸本馆藏,查找图书馆订购的全文数据库,通过搜索引擎查找互联网开放获取(,Open Access),的免费全文信息,通过馆际互借,/,文献传递从其他图书馆获取文献原文,64,课堂练习:,例,1,:课题名称:汽车导航系统的研究,例,2.,课题名称:手持式心电图机,例,3.,课题名称,:,酸奶机,给出以上课题的检索词和检索式,65,例,1,:课题名称:汽车导航系统的研究,关键词,1.,汽车,机动车,关键词,2.,导航系统,全球定位系统,GPS,关键词,3.,研究,设计,调查,检索式的构造:,(汽车,+,机动车),*,(导航系统,+,全球定位系统,+GPS,),*(,研究,+,调查,+,设计,),66,例,2.,课题名称:手持式心电图机,关键词,1,:手持 便携 微型 小型 袖珍 迷你,关键词,2,:心电图机,检索式,(,手持,+,便携,+,微型,+,小型,+,袖珍,+,迷你,)*,心电图机,67,例,3.,课题名称,:,酸奶机,关键词,1:,酸奶 酸乳 发酵乳,关键词,2,:机 罐 装置 设备,检索式,(,酸奶,+,酸乳,+,发酵乳,)*(,机,+,罐,+,装置,+,设备,),68,
展开阅读全文