ImageVerifierCode 换一换
格式:PPT , 页数:277 ,大小:7.81MB ,
资源ID:7494516      下载积分:20 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/7494516.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(信息存储与检索教材全套课件教学教程整本书电子教案全书教案课件.ppt)为本站上传会员【精****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

信息存储与检索教材全套课件教学教程整本书电子教案全书教案课件.ppt

1、单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级

2、第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,信息存储与检索,基础理论部分,第,1,章,信息资源概论,第,2,章,信息存储与检索基础,第,3,章,信息存取技术与信息检索方法,第,4,章,计算机信息存取系统,应用部分,第,5,章,联机存取系统,第,6,章,Internet,存取

3、系统,第,7,章,文本信息存取,第,8,章,多媒体信息存取系统,第,9,章,事实和数据信息存取,第,10,章,国外著名信息存取系统,第,11,章,中国著名信息存取系统,第,1,章 信息资源概论,信息资源,电子信息资源,纸质文献资源,1.1,信息资源,1.1.1,信息资源的基本概念,信息的涵义:,信息是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。,资源的涵义:,资源是一切可被人类开发和利用的客观存在。,信息资源的涵义:,信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像,、,数据。,1.1.2,信息资源的基

4、本特征,共享性,时效性,智能性,无限性与有限性并存,增值性,1.,1.3,信息资源的类型,纸质文献型信息资源,电子型信息资源(包括电子出版物和网络信息资源),下一节,1.2.1,电子信息资源的含义、特点及不足:,含义:,电子信息资源书是以数字化 形式(即二进制代码,0,、,1,),把文字、图像、声音动画等多种形式的信息存储在光、磁等非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。,1.2,电子信息资源,特点,存储形式多样化:文本、超文 本、多媒 体、超媒体等,资源数字化:以二进制代码形式存在,可交流程度高:信息交流范围扩大、信息交流能动性增强、信

5、息交流对象增多,方便利用:易获取、易检索、易保存,内容丰富:集图、文、声像、动画于一体,载体容量大:存储载体信息密度高、容量大,电子信息资源的不足:,对阅读设备的依赖性,阅读舒适度差,需具备计算机基础知识,1.2.2,电子信息资源的类型,按网络传输协议的不同分,:,Web,信息资源:通过,HTTP,在网上传输。,Telnet,信息资源:基于网络通讯协议。,FTP,信息资源:通过,FTP,协议可完成完整的文件拷贝。,用户服务组信息资源:由一组对某一特定主题有共同兴趣的网络用户组成的电子论坛。,Gopher,信息资源:,Gopher,是一种基于菜单的网络服务,允许用户以一种简单的、一致的方式快速找

6、到并访问所需的网络资源。,按存取方式不同分:,邮件型信息资源,电话型信息资源,揭示版型信息资源,广播型信息资源,图书馆型信息资源,书目型信息资源,交互型信息资源,按信息传播于交流过程分:,稳定的电子信息资源,不稳定的电子信息资源,按目前常用的网络搜索引擎分(以,yahoo,为例),如图:,可分为艺术与人文、商业与经济、教育、娱乐、政府、新闻与媒体等,14,类。,请点击,yahoo,分类的不足:知识体系不完整、等级关 系不清;知识体系不严密;无类目标记号;层次设置深浅不等。,按正式出版物类型的不同分:,电子图书,电子期刊,电子报纸,下一节,1.3,纸质文献资源,1.3.1,纸质文献资源的性质、特

7、点及来源:,性质:,纸质文献是知识的存在形式,传递信息知识,纸质文献资源可以多次重复使用,纸质文献所载的是相对固化的信息,特点:,携带、书写、保存方便,直观性,以纸质为载体的艺术作品的不可替代性,纸质文献作为收藏怕的不可替代性,来源,个人,出版社,教育科研机构,公司企业,学术团体,政府部门及各类社会组织,文献信息部门,1.3.2,纸质文献资源的类型与情报价值,按文献编撰方法和出版特点分:,图书及其情报价值,期刊及其情报价值,报纸及其情报价值,会议文献及其情报价值,科技报告及其情报价值,标准文献及其情报价值,专利文献及其情报价值,学位论文及其情报价值,产品说明书及其情报价值,按文献加工深度分:,

8、一次文献及其情报价值:作者最初发表的原始文献,如专著、论文、译文等。,二次文献及其情报价值:对一次文献加工整理后的产物,如书目、文摘、索引等。,三次文献及其情报价值:在一、二次文献基础上加工出来的文献,如综述、述评等。,零次文献及其情报价值:尚未系统整理的零散资料,如草稿、记录、谈话等。,本章结束,返回,第,2,章 信息存储与检索基础,信息存储与检索原理,信息存取发展与类型,索引的结构与类型,2.1,信息存储与检索原理,2.1.1,社会发展与信息需求,从学术研究到社会生活全方位信息需求,从文字资料到声音与活动画面的信息需求,从完备信息趋向对即时信息的需求,从注重信息载体物理性质到注重信息本身,

9、从馆藏需求到国际互联网络共享,从传统的手工信息检索到,Internet,引擎,查检,2.1.2,信息存储与检索原理,信息存储与检索(,Information Storage and Retrieval),是信息,检索的全称形式或广义的信息检索,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与过程。,信息存储与检索的基本原理,就是,查询语言(检索提问),和系统标识语言所进行的“相符性比较”与“匹配运算”。,信息存储与检索走过了文献检索、情报检索的过程,正向知识检索的领域迈进。,信息检索通常包括,4,种类型

10、一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数值或数据的情报检索;四是关于图象信息的信息检索。,信息存储与信息检索关系图,系,统,标,识,语,言,形,式,概,念,检,索,提,问,M,形,式,概,念,信,息,资,源,M,信息集合,M,ABC,DM,检索,系统,答复,M,信息存储,信息检索,主题,分析,转换成,索引标识,转换成,系统标识,课题,分析,2.1.3,信息检索相关学科,作为一门学科的信息检索,现代信息检索是以计算机科学与技术、网络技术、光盘技术、通信技术等现代信息技术在信息存储与检索中的应用为基础,全面探讨适应现代信息处理的信息描述、信息存储、信息检索和信息提供之理论

11、技术与方法的应用性学科。,信息检索的相关学科,信息检索是一门交叉学科,其相关学科涉及到信息管理科学、计算机科学、数学、系统论和语言学等多个学科领域。,2.1.4,信息检索研究,信息检索是一门发展中的学科,目前国内外正从不同的角度展开全面的研究:,信息检索理论与技术研究,信息存取系统研究,数据库标准与建设,研究,信息存取的语言处理,现代信息检索工具比较研究,检索策略研究,2.2,信息存取发展与类型,信息检索存取发展,早期书目检索工具的编制,科技检索刊物体系的形成,计算机检索的发展,计算机信息检索的,4,个发展阶段:,单机批处理时期,联机检索试用阶段,联机服务市场化与光盘检索的兴起,全球信息检索

12、多媒体联网时期,我国计算机信息检索的发展过程:,引进开发国外磁带、开展定题服务(,SDI,),开发国际联机检索终端,自建数据库,微型计算机和国际联机网信息存取的发展,2.2.2,信息存储与检索类型,广义的信息检索包括信息存储与查检两个部分。狭义的信息检索有许多类型,从不同角度可划分为:,按检索活动的执行主体划分,手工检索(,Manual Retrieval),计算机检索,(Computer Retrieval),按查询信息的特征划分,书目检索(,Bibliographic Retrieval),数据检索,(Data Retrieval),事实检索,(Fact Retrieval),全文检索,(

13、Full Text Retrieval),图象检索,(Image Retrieval),多媒体信息检索,(Multimedia Data Retrieval),2.2.2,信息存储与检索类型,按检索系统的工作方式划分,脱机检索(,Off-line Retrieval),联机检索(,On-line Retrieval),光盘检索(,CD-ROM Retrieval),国际互联网络检索(,Internet Retrieval,),按检索策略划分,布尔逻辑检索(,Logical Retrieval),截词检索(,Truncation Retrieval),位置逻辑检索(,Proximate Oper

14、ator Retrieval),限定检索(,Range Retrieval),加权检索(,Weighting Retrieval),2.2.2,信息存储与检索类型,按系统载体划分,印刷型文本系统检索(,Printed Text Retrieval),缩微磁带检索(,Microfilm Retrieval),光盘系统检索(,CD-ROM Retrieval),计算机存取系统查询(,Computer-based Retrieval),按检索工具类型划分,目录与题录检索(,Catalog and Title Searching),文摘检索(,Abstract Searching),索引检索(,Ind

15、ex Searching),字典型检索(,Dictionary Searching),交互式检索(,Alternately Searching),2.3,索引的结构与类型,索引,(,Index),就是将信息集合中具有检索意义的事物名称及特征(如篇名、人名、书名、刊名、网页、网站、地名、分类号、主题词、分子式、专利号、报告号、名词术语等)抽取出来,著明其地址,按照字顺或逻辑分类等次序组织款目,从而为用户提供查询线索的检索工具。,索引的款目结构:,索引标题词,索引标题词亦称标目、索引键、索引标题等。它一般处于索引款目最醒目的位置,是索引款目的核心,它决定着一条索引款目在整个索引中的排列位置,是索引

16、款目的检索入口。索引标题词可以为单一标题词,也可以为带有副标题的多级标题词。,2.3.1,索引的款目结构,说明语,也称为上下文或修饰语,通常位于索引标题词的右边或下面,用来说明、解释、限定索引标题词含义的辅助项目。,地址参考项,地址参考项位于索引标题词和说明语之后,索引地址所指明的是索引标题词所在的页码或在检索系统中的文献顺序号、分类号或文献号等,即索引标题词的出处。索引参考项有时用于引导用户使用正式索引标题词。,例,1,:,Methane,use in methanol manufacture,3241,甲烷,,用于甲烷制备,,3241,说明:索引标题词,说明语,文献号(地址参考项),2.3

17、2,主要索引类型,索引系统,从形式上讲是成千上万件索引款目的集合,从内容上看是信息单元的指南。索引系统的排序是按照索引标题的顺序组织而成,不同性质的索引标题词构成了不同类型的索引。,依据索引标题词的性质划分:,有揭示信息资源内容特征的主题索引、分类索引、关键词索引、分子式索引、结构式索引;有揭示信息资源形式特征的题名索引、人名索引、物名索引、代码索引、引文索引。,依据索引标题词的排序方式划分:,有按照标题词字顺组织的主题索引、题名索引、人名索引、关键词索引、语词索引等;有按照文献代码组织的报告号索引、合同号索引、标准号索引等;有按其它排序方式组织的网络信息自动索引、重量索引、速度索引、专用索

18、引等。,按照检索方式划分:,有先组式索引和后组式索引。,按照索引所包括的对象划分:,有综合索引和专门索引。,2.3.2,主要索引类型,以下简述几种常用索引的特点:,题名索引,(Title Index),题名索引,是将信息资源的题名特征(书名、刊名、篇名)选作为索引标题词所编制的索引系统。题名索引常采用字顺排序法组织款目。,例如:,未来的地球人,/,王佃亮,31,解构爱因斯坦,/,一茗,32,一流大学校长必须是教育家等,6,则,/,睦依凡,36,宇宙是什么颜色等,6,则,/,本刊资料室,42,说明:索引标题词(题名)文献作者地址参照项(所在页码或文献号),2.3.2,主要索引类型,人名索引(,P

19、eople Name Index),人名索引,是以文献上署名的著者、译者、编撰者、注释者以及文献中所论述的人物名称作为索引标题词所编制的一种索引。此类索引一般按照人物名称的字顺组织。英、德、法、西班牙等语种的著者索引姓在前、名在后,与其在文献中出现的姓名形式不同,用户检索时应注意掌握其排列规则。,例一:,Sadykov,,,A.A.,Chemical Study of Persica 91:135089k,例二:,Harris,,,A.E.001536,例三:,伽利略(,Galilei,,,Galilei)B503.922,例四:,梁启超(,1873-1929,),B259.1,说明索引标题词

20、说明语(原文名,生卒年)地址参照项(文摘号、分类号),2.3.2,主要索引类型,文献序号索引,(Document Number Index),文献序号索引,是根据信息资源的外表特征文献序号所编制的索引。在一些特定类型的文献资源中,每一份文献都有一个特定的专门排序号。如科技报告号、合同号、技术标准的标准号、专利说明书的专利号,图书的国际标准书号(,ISBN,)等;,例一:合同,/,基金号索引(,CONTRACT/GRANT NUMBER INDE,),MIPR-FY 7616-02-00394,Cold Regions Research and Engineering.Hanover.NH,AD

21、A121 330/5 933,MIPR-82-504,Vaval Research Lab.Washington,DC,AD-A121 087/1,714,说明:合同基金号 执行机构 报告号 索引地址号,2.3.2,主要索引类型,引文索引,(Citation Index),引文索引是从被引论文检索引用论文的索引工具。即以某较早公发发表的论文为起点,逐一查询那些引用过该论文的文献,随后还可以利用检索到的引用文献为被引文献进行循环检索,逐步扩大检索范围,以了解和掌握一大批具有相关关系的科学文献。引文索引的组织方式是,按照被引论文的作者排列,在被引论文之下,在按年代列举引用过该文献的全部论文。,分

22、类索引,(Classification Index),分类索引是以文献内容的学科范围的分类标识(又称分类号)为依据编制而成的引文系统。本索引可提供按学科专业系统检索文献的途径。,分类索引的编制原理是概念的划分与概括。在概念划分与概括的原理基础上建立起来的等级体系分类系统是一种先组式的索引语言。,2.3.2,主要索引类型,主题索引,(Subject Index),主题索引,是将表征文献主题内容的主题词作为索引标题词,其后注明地址(或页码)编制而成的索引系统。此处所指的主题词是经过规范,有词表控制的标题词(,Subject heading),以及词组和短语。这是一种先组式的索引语言。,例,1,Sw

23、ord,Manufacture,review on.6385.4246.5367,(,赤刀)(制照)(有关评论),Parallel-access computer,in self-organizing 1234.6533.4211,(,并行存取计算机)(自组织系统中的),例,2,例,3,反义词,汉语,现代,H136.2,说明:索引标题词 说明语(修饰语)地址参照,2.3.2,主要索引类型,关键词索引,(Keyword Index),又称键词索引,属于广义的主题索引。这是从文献题名、文摘、原文或网站、网页、网址甚至网页正文中抽取对于表述信息资源的主题内容具有关键意义的名词或名词性词组,作为索引标

24、题词,其后标明出处所组成的索引。关键词是信息资源的责任者(包括著者、编者、译者、专利权拥有者等)所直接使用的词语,是一种未经规范的自然语言。,关键词索引的类型:,题内关键词索引(,Keyword in Context Index),题外关键词索引(,Keyword out of Context Index),双重关键词索引(,Double KWIC Index),轮排关键词索引(,Permuted Keyword Index),单纯关键词索引(,Keyword Index),挂接主题词索引(,Articulated Subject Index),2.3.2,主要索引类型,组配索引,(Coord

25、inate Index),组配索引是根据叙词(,Descriptor),及单元词(,Uniterm),的后组式原理建立起来的索引系统。其基本原理是任何一个复杂的概念都可以划分出若干个单义概念,而若干个单义概念又可构成一个复杂概念。组配索引的基本特点是,在建立索引系统时,首先有将文献的主题分解成一些单独的概念单元进行分别记录与标识,而在检索时,根据检索课题的需要,将若干有关概念单元综合组配成各种检索提问实施检索。例如“化学纤维工业”这个复杂概念可以分解为“化学”、“纤维”“工业”三个概念单元,其三者的逻辑关系如下图:,化学,纤维,工业,A,B,C,ab,ac,bc,abc,2.3.2,主要索引类

26、型,PRECIS,索引,(Preserved Context Index),又称保留上下文关系索引系统、保留正文索引系统、保留愿意索引、上下文前后关联索引。,PRECIS,为了明确无误地描述文献主题,力求每条索引款目都按照“上下文从属”的原则排定词语的次序。,其索引的方式为:,导词(,LEAD,),限定词(,QUALIFIER,),展示词(,DISPLAY,),地址(,ADDRESS,),2.3.2,主要索引类型,网络信息自动索引,(Web source auto-Index),目前,,Internet,上的搜索索引(又称搜索引擎,search engine),就是一种网络资源自动索引的检索工

27、具。其特点是使用自动索引软件来发现、收集和标引网页建立查询数据库,并以,Web,形式给用户提供检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找与提问相匹配的记录,并按相关度排序输出检索结果。目前,比较有影响的中英文搜索引擎有,Alta Vista,、,Excite,、,Lycos,、,Hotbot,、,Sohu,、,Yahoo,、,etang,、,Sina,等。,第,3,章 信息存取技术与信息检索方法,信息存取技术的进步,信息,检索方法与策略,信息存储与检索相关学科及发展,3.1,信息存取技术的进步,光盘存储与检索技术,联机存取技术,全文存取技术,多媒体存取技术,超文

28、本与超媒体存取技术,网络存取技术,视频存取技术,智能检索技术,3.2,信息检索方法与策略,提问检索式构造,检索词、提问检索式与关系算符,检索式构造规则,布尔逻辑算符,逻辑“与”,AND,或*,主要用于交叉概念或限定关系概念之间的组配。,逻辑“或”,OR,或,+,主要用于并列关系的概念组配。,逻辑“非”,NOT,或,-,主要用于排斥与选择关系的组配。,布尔逻辑算符执行的优先顺序为,NOT,、,AND,、,OR,。,3.2.1,检索提问式构造,位置逻辑算符,(W),或,()With,(wn),(N)Near,(nN),(F)Field,(S)Sub field,(L)Link,(C)Citatio

29、n,(X),和,(nX),在位置算符的前面加上,NOT,即可构成位置算符的逻辑,(,非,),3.2.1,检索提问式构造,检索字段限定符,基本索引字段的限定检索。为了指定在基本索引的哪个或哪几个字段中检索,可在检索词或检索式后面加上一斜杠“,/”,,再加上所需限定字段标识。一般将加有“,/”,线的字段标识称为后缀代码(简称后缀)。,表,3.1,常见后缀代码及其限定查找的字段范围,后缀代码 限定查找的字段范围,/TI,题名,/AB,文摘,/DE,叙词,/ID,自由标引词,/NT,注释,/SH,类目标题,3.2.1,检索提问式构造,辅助索引字段的限定检索。为了指定在辅助索引字段中进行限定检索,可在该

30、检索项(词)的前面加上字段标识与一个等到号“,=”,,通常将这种字段标识符称为前缀代码(简称前缀)。,表,3.2,常见前缀代码及其所限定的字段名称,AU =author(,著者,),CS =corporate source(,著者所属机构,),DT =Document Type(,文献类型,),JN =Journal Name(,期刊名称,),CO =Company(,公司,),CC =Classification Code(,分类号,),SO =Source publication(,来源出版物,),LA =Language(,语种,),PY =Publication year(,出版年份,

31、),UD =Update(,更新日期,),SP =Conference sponsor(,主持单位,),3.2.1,检索提问式构造,截词检索算符,所谓截词检索算符,是指在检索词的某个局部截断,利用检索词的词干或不完整的词形加上截词符号所进行的检索。,后截词,前方一致检索,前截词,后方一致检索,中截断,前后方一致检索,前后截断,中间一致检索,有限截词,无限截词,3.2.1,检索提问式构造,检索提问式的构造,句子切分,词汇剔除,概念替换,概念限定与补充,组合式检索式,3.2.2,信息检索一般方法,工具法,又称一般查找法,即利用各类检索系统(工具),包括书本式与电子文本方式,直接检索信息的方法。工具

32、法又分为,3,种情况:,顺查法,逆查法,抽查法,追溯法,这是一种传统的文献检索方法,即利用文献后面所附参考文献,逐一追查被引用文献,然后,再从被引用文献所附参考文献目录逐一扩大检索范围的方法。,综合法,亦称循环法或分段法,它指分期分段交替使用上述各种检索方法以达到优势互补,获得理想结果的一种检索方法。,3.2.3,计算机检索常用法,计算机检索方法:,菜单检索,(Easy Menu search),指令检索,(Command Search),浏览式检索,(Browsing Search),提问,问答式检索,(Quiz&Answer Search),根据存取系统的性能与支持的检索功能,可将提问,问

33、答式检索区分为以下方式,:,基本检索,(Basic Search or Simple Search or Quick Search),二次检索,(Second Search),词组检索,(Word Combination Search),索引词典检索,(Catalog Search),高级检索,(Advanced Search),综合检索,(Synthesis Search),3.2.4,信息检索步骤,分析检索课题,明确检索需求。,检索目的与意图。,学科范围与主题概念。,文献性质、类型与数量。,制定检索策略。,选择检索系统与数据库。,确定检索词和检索途径,编制逻辑检索式。,检索策略的调整,.,

34、3.3,信息存储与检索相关学科及发展,作为一门学科的信息存储与检索,信息存储与检索相关学科,信息管理科学,计算机科学,数学,系统论,语言学,3.3,信息存储与检索相关学科及发展,信息存取的发展,早期书目检索工具的编制,科技检索刊物体系的形成,计算机检索的发展,第,4,章 计算机存取系统,信息存取系统基本结构,计算机存取系统工作流程与功能,计算机信息存取系统类型,计算机存取系统检索机制与系统评价,4.1,信息存取系统基本结构,计算机存取系统是利用计算机对一定范围内的信息集合进行选择、记录、存储与排序,以便用户采用科学手段与技术从中获取必要和充分信息资源的计算机信息系统。,计算机存取系统包括硬件、

35、软件和数据库三部分内容。,计算机存取系统硬件设备,主机,外部设备,中央处理器(运算器、,控制器,),内部存储器,ROM,(只读存储器),RAM,(随机存储器),外部存储器,(软盘、,硬盘、光盘等),输入设备,(鼠标、键,盘等,输出设备,(显示器、,打印机等,通信,设备,4.1.1,计算机存取系统硬件组成,计算机存取系统软件,系统软件,应用软件,控制程序,处理程序,自动标引软件,词表管理,各种匹配程序,数据库管理,其他,监控程序,诊断程序,调试程序,汉字处理,报表生成,服务程序,其他,其他,4.1.2,计算机存取软件系统,4.1.3,机读数据库类型,以数据的存取方式划分为关系数据库、层次数据库、

36、网络型数据库,p94,。,以数据存储介质划分为磁带数据库、磁盘数据库、光盘数据库。,以数据类型划分为文献数据库、数据型数据库、事实型数据库、多媒体数据库和超媒体数据库,p95,。,信息源,4.2,计算机存取系统工作流程与功能,信息存取系统的功能与,6,个子系统相对应可以总括为,6,个方面即输入功能、处理功能、存储功能、传输功能、输出和控制功能。,输入子系统,处理子系统,存储子系统,传输子系统,输出子系统,控制子系统,计算机存取系统结构,用户,4.3,存取计算机信息系统类型,4.3.1,按信息特征划分的系统类型,文献存取系统,(Document Access System),事实型存取系统,(F

37、act Access System),数值型存取系统,(Numerical Access System),图像存取系统,(Image Access System,),下一节,文献存取系统,文献存取系统包括书目(目录、题录、文摘)、全文和超文本三种类型的存取系统。,此类系统是以文献的内容特征与外在特征为存取点,将文献标题、作者、分类号、主题词或关键词、文献出处或者文献全文经过数字化处理后存储在计算机磁带、磁盘、或光盘上,并组成一定结构的数据库。,文献存取系统的主要特点是对书目数据库和全文数据库进行管理和维护,提供查询文献线索或全文的检索途径。目前,文献存取系统多以书目数据库、文摘数据库、索引数据

38、库和图书馆馆藏目录数据库、联机数据库、光盘数据库或配有相应检索软件的专门数据库的形式存在。,返 回,事实型存取系统,事实型存取系统,是一种直接面对各类事实和事项提问的信息存取系统。也有人称之为事实或事项存取系统。,事实存取系统多用于人事档案管理、科研项目管理、企业决策、城建管理系统等。从本质上看,各类电子文本式的年鉴、手册及百科全书等也属于事实型存取系统。,返 回,数值型存取系统,支持此类存取系统的数据库是数值型数据库如:人口数据库、商品价格数据库、气象数据库、化学分子结构等数据库等。,例:,ESA/IRS,系统中,,PRICE DATA,数据库就是典型的数值型存取系统库。该系统收录了自,19

39、72,年以来世界上的,60,多种主要商品的价格行情,以及十几种货币的汇兑等数据,。,返 回,图像存取系统,图像存取系统是一种存取图像、图形及其说明文字等信息的计算机系统,这类系统为用户提供各种图像或图形信息存取功能。,现今,已经出现了以颜色、形状和纹理结构等特征为存取内容的图像存取系统。随着多媒体技术的发展,图像信息加工、处理和检索标准的出台,图像搜索引擎功能也日趋完善。,返 回,4.3.2,按工作方式和存取介质划分的系统类型,单机存取系统,(Off-Line Access System),联机存取系统,(On-line Access System),光盘存取系统,(CD-Disc Acces

40、s System p104),Internet,网络信息存取系统,(Internet Resource Access System p106),4.3.3,按检索词的性质划分的系统类型,规范词存取系统,以受控词,(,叙词、标题词、单元词)为存取标识所建立的信息存取系统。,非控词存取系统,p107,非控词即指自然语言。其缺点是检准率较低。,4.3.4,按文档组织方式划分的系统类型,顺排文档存取系统(,Sequential File,),即指文档的全部纪录按照存取号从小到大依次存取信息的系统。,倒排文档存取系统(,Inverted File),将文档纪录中的可检字段及其属性值,(,如题名、著者、叙

41、词、自由词等)抽取出来,按照字段属性的某种顺序进行排序与存储,使其成为可以用作索引的文档。,4.3.5,按照信息存取方式划分的系统类型,文件存取系统,p108,数据库存取系统,主题树存取系统,p110,超媒体存取系统,数字图书馆和虚拟图书馆存取系统,p110,4.4,计算机存取系统检索机制与系统评价,4.4.1,计算机存取系统检索机制,单一整词检索机制,截词检索机制,词组,(,多元词,),检索机制,布尔逻辑检索机制,相邻度检索机制,加权运算机制,自由文本检索机制,浏览检索机制,4.4.2,计算机信息存取系统评价,计算机信息存取系统评价,系统研制目标性指标,数据范围、更新频率与数据来源指标,系统

42、的技术水平和运行质量指标,数据组织形式与用户界面指标,检索方式和检索策略指标,检索效果与辅助索引指标,系统响应速度及费用指标,输出格式,计算机信息存取系统评价项目一览表,评价项目,评价内容,研制目标,适用对象、针对性、检全率、测试效果、软硬件配置,数据来源与更新,学科范围、全面性、准确性、更新频率、数据来源、数据量等。,技术水平与运行质量,可靠性、兼容性、可扩展性、技术先进性、运行质量、维护能力等。,数据组织形式与用户界面,数据格式、可检字段、显示字段、可检程度、检索灵活性、用户界面、易用性、易学性。,检索方式与检索策略,检索方式灵活性、多样性、易用性、规范性、检索策略保存方便性。,检索效果与

43、辅助索引,查全率、查准率、查新率、检索途径、存取点、专业性检索点、限定检索设置等。,响应速度与费用,响应时间、网络传输速度、开发费用、运行费用、管理费用、维护费用、系统效益等。,输出格式,输出格式、输出字段的设置、检索结果处理、查看输出效果的许可权。,第五章 联机存取系统,联机存取系统,联机存取国内外概况,DIALOG,和,OCLC FirstSearch,简介,联机存取系统检索,Internet,环境下联机存取系统检索,5.1,联机存取系统概述,联机存取是在脱机批处理基础上发展起来的一种信息存取技术,用户使用终端设备运用一些规定的指令输入检索词和检索策略,通过通信网络与相联系的信息存取系统联

44、机,进行人机对话,同时通过检索软件的运行从信息存取系统预先存储文献的数据库中查找所需信息的过程。世界著名的联机存取系统,除早期发展起来的,DIALOG,、,STN,等外,还出现了一批后起之秀如,FirstSearch,、万方数据资源系统等。联机存取系统现已形成一定规划的产业和一种十分可靠的计算机存取方式,并且随着网络的普及,不再限于其发展初期的形式,提供基于,Internet,的联机存取和光盘存取服务。,5.1.1,联机存取原理,联机存取中心,联机存取中心是联机存取系统的核心部分,由中央计算机、数据库、数据库检索和管理软件以及相应的检索服务体制组成。,中央计算机(服务器)及其外部设备,数据库检

45、索与管理软件,联机数据库,通信网络,用,户检索终端及用户接口软件,5.1.2,联机存取系统服务方式,传统服务,追溯检索,定题服务,联机订购原文,电子邮件,数据库光盘,特色服务,如,FirstSearch,的一体化服务、,DIALOG,公司的跨文档检索和分级别检索以及万方数据公司的数字化期刊、咨询服务等。,5.2,联机存取系统国内外概况,国外联机存取系统,DIALOG,系统,STN,系统,OCLC FirstSearch,国内联机存取系统,万方数据资源系统,(,),CNKI,数据资源系统(,),维普数据资讯系统(,DIALOG,和,OCLC FirstSearch,简介,5.3.1 DIALOG

46、系统,DIALOG,系统的联入方式,以,Telnet,方式联入,以,WWW,方式联入,www.DIALOGW,www.DIALOGC,www.DIALOGS,library.DIALOG.com/bluesheets,DIALOG,系统数据库简介,DIALOG,系统常用数据库,工程索引(,EI),科学文摘,(INSPEC),世界专利索引,(WPI),化学文摘,(CA Search),科学引文索引(,SciSearch),经济商业文摘,(ABI/INFORM),学位论文文摘,(Dissertation Abstracts Online),美国政府报告,(NTIS),美国专利,(U.S.Pate

47、nts),欧洲专利,(European Patents),生物文摘,(BIOSIS Previews),金属文摘,(METADEX),物理文摘,(SPIN),能源科学与技术,(Energy Science and Technology),污染文摘,(PollutionAbstracts),宇航数据库,(Aerospace Database),日本专利,(JAPIO),医学索引,(MEDLINE),地质数据库,(GeoRef),分析文摘,(Analytical Abstracts),数学文摘,(MathSci),环境文摘,(Envionmental Bibliography),会议论文索引,(C

48、onference Papers Index),流体工程文摘,(Fluid Engineering Abstracts),教育资源中心,(ERIC),工程材料文摘,(Engineered Materials Abstracts),机械工程文摘,(ISMEC Abstracts),陶瓷文摘,(Ceramic Abstracts),DIALOG,系统检索式构造,用索引字段构造检索式,DIALOG,系统基本检索字段的后缀和检索示例,DIALOG,系统常见辅助字段的前缀和检索示例,字段名,后缀代码,示例,功能说明,题名,/TI,Computer/TI,查找题名字段中含有检索词,computer,的记录

49、叙词,/DE,Economics/DE,查找叙词字段中含有检索词,economics,的所有记录,字段名,前缀代码,示例,功能说明,作者,AU=,Au=johnson,查找在作者字段中含有检索词,johnson,的所有记录,公司名称,CO=,Co=ford motor,查找公司名称字段为,Ford motor,的所有记录,用逻辑算符,(and,等,),和位置算符构造检索式(如下示例),用截词符构造检索式(如下示例),位置算符,示例,功能说明,(w),Electronic(w)business,查找含有检索词,electronic business,的记录且两词次序不能颠倒,之间不可有任何词,

50、nw),Electronic(3w)business,查找含有检索词,electronic business,的记录且两词次序不能颠倒,但两词之间还可以有,3,个其他词,截词方式,示例,功能说明,无限截词,Effect?,查找含有以,effect,为词干的词的索引记录。,有限截词,Effect?,查找含有以,effect,为词干的,其后有,3,个字符的词所有记录。,词间截词,Wom?n,查找含有,women,、,womon,等词的所有记录。,DIALOG,系统的检索指令(示例如下),DIALOG,系统付费方式,DIALOG,系统工作时间,仅在北京时间星期天下午,6,时至星期一凌晨,2,时停止

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服