ImageVerifierCode 换一换
格式:PPT , 页数:67 ,大小:782KB ,
资源ID:10966289      下载积分:16 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10966289.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(本科信息检索02.ppt)为本站上传会员【天****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

本科信息检索02.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第二章,信息检索系统,主讲:靳小青,信息检索,XIN XI JIAN SUO,第二章,信息检索系统,【,本章主要介绍,】,讲解,信息源与信息媒体、信息检索原理。,讲解,检索语言、信息检索方法、途径和步骤。,讲解,信息检索系统与检索工具。,讲解,数字图书馆。,讲解,结构化信息与非结构化信息。,第二章,信息检索系统,2.1,信息源与信息媒体,2.2,信息检索原理,2.3,检索语言,2.4,信息检索方法、途径和步骤,2.5,信息检索系统与检索工具,小结,2.7,结构化信息与非结构化信息,2.6,数字图书馆,2.1,信

2、息源与信息媒体,2.1.1,信息源的概念,2.1.2,信息媒体,2.1.1,信息源的概念,2.1,信息源与信息媒体,信息源就是获取信息的来源。联合国教科文组织(,UNESCO,)出版的,文献术语,对其定义为:组织或个人为满足其信息需要而获得信息的来源,称为“信息源”。从绝对意义上看,只有信息产生的“源头”,才能称为信息源。,2.1.1,信息源的概念,2.1,信息源与信息媒体,但信息源是一个相对的概念,凡能产生、拥有和传递信息的所有物质皆谓信息源。由此看来信息源内涵丰富,它不仅包括各种信息载体,也包括各种信息储存、传递、生产机构。,2.1.1,信息源的概念,2.1,信息源与信息媒体,但在图书情报

3、界则认为:人们在科研活动、生产经营活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果和原始记录加工整理得到的产品都可称为信息源。因此又有口头型信息源、实物型信息源和文献型信息源之说。,2.1.2,信息媒体,2.1,信息源与信息媒体,信息媒体是指信息传播的介质、信息表示的载体,也称为信息媒介或信息载体。这些信息媒体可以是文字、图形、图像、动画、声音、视频等信息表示形式,也可以是扬声器、磁盘阵列服务器、电视机等信息的展示设备,还可以是传递信息的光纤、电缆、电磁波等中介媒质,以及存储信息的缩微胶卷、磁盘、光盘、磁带等存储实体。而在图书情报界则从文献型信息源的研究视角出发,将信息媒体大致划

4、分为传统文献信息媒体和电子文献信息媒体两大类。,2.1.2,信息媒体,2.1,信息源与信息媒体,1.,传统文献信息媒体,传统文献信息媒体主要是指传统图书馆收录的各种文献信息媒体总汇。若把传统文献信息媒体再进行细分,又可分为多种类型。,2.1.2,信息媒体,2.1,信息源与信息媒体,传统文献信息媒体,(,1,)按文献信息载体形式划分,印刷型。,缩微型。,机读型。,声像型。,2.1.2,信息媒体,2.1,信息源与信息媒体,传统文献信息媒体,(,2,)按文献信息媒体内容特征或加工程度分,零次文献。,一次文献。,二次文献,。,三次文献。,2.1.2,信息媒体,2.1,信息源与信息媒体,传统文献信息媒体

5、3,)按文献信息媒体的内容形式划分,图书。,连续出版物。,会议文献。,专利文献。,科研报告。,标准文献。,学位论文。,政府出版物。,产品目录与样品。,技术档案。,2.1.2,信息媒体,2.1,信息源与信息媒体,2.,电子文献信息媒体,(,1,)根据载体的存储形态划分,光盘文献信息媒体。,联机文献信息媒体。,网络文献信息媒体。,2.1.2,信息媒体,2.1,信息源与信息媒体,2.,电子文献信息媒体,(,2,)根据数据库的检索对象进行划分,参考数据库。,源数据库。,2.1.2,信息媒体,2.1,信息源与信息媒体,2.,电子文献信息媒体,(,3,)根据网络传输协议进行划分,WWW,信息媒体。,

6、FTP,信息媒体。,Telnet,信息媒体。,Gopher,信息媒体。,2.2,信息检索原理,信息检索原理可从信息检索过程得到很好的诠释,如图,2-1,所示,用户在检索时,检索系统一方面接受用户的检索提问,另一方面从数据库(检索工具)中接受文献记录,然后在两者之间进行匹配运算,即将检索提问与数据库(检索工具)中文献记录标识进行比较,如果比较结果一致或数据库(检索工具)中的文献记录标识包含了检索提问标识,那么具有该标识的信息可能就是用户所要的命中文献;如果比较结果不一致,则要重新提交检索提问。,2.2,信息检索原理,图,2-1,信息检索原理示意图,2.3,检索语言,2.3.1,检索语言分类,2.

7、3.2,分类语言,2.3.3,主题语言,2.3.1,检索语言分类,2.3,检索语言,检索语言是根据文献标引与检索的需要,在自然语言的基础上规范化了的人工语言,它贯穿于文献存储与检索的全过程,是沟通标引人员和检索人员双方思想的约定语言,也有人称为“标定符号”或“标识系统”。,检索语言的种类颇多,其中按描述文献信息的特征进行划分是目前最常见的一种,如表,2-1,所示,。,2.3.1,检索语言分类,2.3,检索语言,表,2-1,检索语言分类,2.3.2,分类语言,2.3,检索语言,分类语言是将文献信息按学科、事物性质的等级体系加以排列,用分类号来表达文献主题概念的检索语言。分类语言的具体表现形式就是

8、分类表(法)。分类法(表)是类分和组织文献信息以及用户检索文献的共同依据。,2.3.2,分类语言,2.3,检索语言,分类语言有,3,种,最常用的是体系分类语言。体系分类语言以文献内容的科学性质为对象,从学科分类观点出发,运用概念划分的方法,将知识分门别类地按逻辑次序,从总到分、从一般到具体、从低到高、从简到繁进行层层划分、层层隶属,逐级展开一个层类制的等级结构体系。,2.3.2,分类语言,2.3,检索语言,在此以,中图图书馆分类法,(简称,中图法,),为例说明体系分类语言的构成。,中图法,将全部知识分为,5,个基本部类,即马列主义、毛泽东思想、邓小平理论,哲学,社会科学,自然科学和综合性图书。

9、在,5,大部类下又展开为,22,个基本大类(一级类目),如表,2-2,所示。,2.3.2,分类语言,2.3,检索语言,表,2-2,中图法,基本大类,2.3.2,分类语言,2.3,检索语言,中图法,的标记符号采用汉语拼音字母、阿拉伯数字和圆点相结合的混合制号码作为分类号,用字母表示基本大类(一级类目),在字母后用数字表示基本大类下类目的划分,唯独工业技术大类下用两位字母表示二级类目。,中图法,的分类号越长,代表的内容越具体,检索出的文献越精准,如图,2-2,所示。,2.3.2,分类语言,2.3,检索语言,图,2-2,中图法,2-5,级类目图,2.3.3,主题语言,2.3,检索语言,主题语言是直接

10、用自然语词作主题概念标识,并用字顺排列标识和参照系统等方法来间接表达各种概念之间的相互关系的一种检索语言。主题语言的具体表现形式是主题词表,主题词表也像分类表一样是文献标引人员与用户检索文献的共同依据。,2.3.3,主题语言,2.3,检索语言,主题语言根据构成原则与编制方法不同,可分为以下,4,种。,(,1,)标题词语言(标题词法),(,2,)单元词语言(单元词法),(,3,)叙词语言(叙词法),(,4,)键词语言(关键词法),2.3.3,主题语言,2.3,检索语言,这,4,种语言可统称为主题法系统。其中标题词法、单元词法、叙词法是用规范化名词标引和检索文献的主题概念语言,按这些规范化名词的字

11、顺编排为词表分别称为标题词表、单元词表和叙词表;关键词法是指直接选自文献标题或内容中具有实质意义的自然语言作为标引和检索文献的语言。因此,关键词法是未经规范化处理的自然语言,无受控词表。,2.4,信息检索方法、途径和步骤,2.4.1,信息检索方法,2.4.2,信息检索途径,2.4.3,信息检索步骤,2.4.1,信息检索方法,2.4,信息检索方法、途径和步骤,信息检索方法应据课题的目的、性质和检索工具的现状灵活选定。一般来说,可以从手工检索和计算机检索两方面分别叙述。,2.4.1,信息检索方法,2.4,信息检索方法、途径和步骤,手检方法,(,1,)常用法 常用法是信息检索中最常用的一种方法,因为

12、是利用检索工具来查找,故又称为工具法。其按查找时间的顺序不同又可分为顺查法、倒查法和抽查法,3,种。,2.4.1,信息检索方法,2.4,信息检索方法、途径和步骤,手检方法(,2,)追溯法,追溯法又叫回溯法,是以某一篇论文末尾所附的参考文献为依据,逐一追踪地检索方法。该法的连锁反应,可查到有关某一专题的大量参考资料。该法直观、方便,在不备检索工具的情况下,是一种扩大情报源的最好办法,但检索效率低、漏检率高。如果能使用有关的引文检索工具(见,3.3,节,“,美国,科学引文索引,”,和,4.5,节,“,中国社会科学引文数据库,”,),则可获得较好的效果,。,2.4.1,信息检索方法,2.4,信息检索

13、方法、途径和步骤,手检方法,(,3,)分段法 分段法是交替使用以上所提的两种方法,因而又叫循环法。具体来说,就是先使用检索工具查找某课题几年内的资料,再利用该资料末尾所附参考文献追溯查找。一般,5,年之内的文献被引用参考的较多,因此可以只追溯,5,年左右的时间,然后再用检索工具查出一批文献进行追溯,这样分批分段地交替进行,如此循环,直至认为够用为止。,2.4.1,信息检索方法,2.4,信息检索方法、途径和步骤,手检方法,(,1,)常用法,顺查法。,倒查法。,抽查法。,2.4.1,信息检索方法,2.4,信息检索方法、途径和步骤,2.,机检方法,随着信息技术的发展,计算机检索将逐步占有主导地位。计

14、算机检索方法也称检索方式或检索界面,目前参差不齐。一般计算机检索方法没有固定模式,主要可归纳为以下几种。,(,1,)基本检索。,(,2,)高级检索。,(,3,)专业检索。(,4,)分类检索。,(,5,)二次检索。,2.4.2,信息检索途径,2.4,信息检索方法、途径和步骤,检索途径通俗地讲就是查找文献信息的入口,在手检中,检索入口取决于检索工具提供的索引的多少,在机检中,检索入口取决于数据库提供的检索字段(手检中文献的著录项目)。但是检索工具提供的索引有限,而数据库提供的可检索字段几乎覆盖了组成文献的全部著录项目。因此,机检比手检的检索入口宽泛了许多。本书仅介绍以下几种主要的检索途径。,2.4

15、2,信息检索途径,2.4,信息检索方法、途径和步骤,1.,文献名称途径,文献名称途径是根据书刊篇名名称途径进行查找的一条途径。如各种题名字段、书名目录、篇名索引、刊名一览表等检索工具皆是用此途径检索。它是把文献名称按照字顺编排起来的检索系统。使用时,与查字典相似。,2.4.2,信息检索途径,2.4,信息检索方法、途径和步骤,2.,著者途径,著者途径是以著者姓名为线索的检索途径。这里的,“,著者,”,包括个人著者、团体著者、专利发明人、专利权人、合同用户、学术会议召集单位等。著者姓名途径主要是利用著者字段、著者目录、著者目录(索引)、团体著者目录(索引)、专利权人索引、机构字段、机构索引等。这

16、些字段、目录(索引)都是按其姓名字顺编排,在已知著者的前提下,很快就可查到所需文献。但要注意外国与中国著者书写上的区别。,2.4.2,信息检索途径,2.4,信息检索方法、途径和步骤,3.,号码途径,号码途径是利用文献信息自身的编号检索文献的一条途径。许多文献有固定的注册编号,如报告号、标准号、专利号、合同号、馆藏号、索书号等,一般都是按字母和数字顺序排列。,2.4.2,信息检索途径,2.4,信息检索方法、途径和步骤,4.,分类途径,分类途径是按照文献信息的知识内容及所属学科性质而类分和检索文献的途径。常用的工具有分类字段、分类目录和分类索引等。分类途径的检索依据是分类法或称分类表也称分类语言(

17、见,2.3.2,小节,“,分类语言,”,),使用这种检索途径的关键是熟悉和掌握分类表。对于文献信息的学科分类,世界各国都有自己的分类法,此外对于不同的文献,可能要采用不同的分类法。如专利文献要使用专利分类法,标准文献要采用标准分类法等。,2.4.2,信息检索途径,2.4,信息检索方法、途径和步骤,5.,主题途径,主题途径是通过代表文献信息内容的主题词来检索文献的一条途径。常用的工具有主题字段、关键词字段、主题索引、叙词索引、关键词索引等。主题途径的检索依据是主题语言(见,2.3.3,小节,“,主题语言,”,),使用这种检索途径的关键是熟悉和掌握主题词表。,2.4.3,信息检索步骤,2.4,信息

18、检索方法、途径和步骤,1.,分析研究课题,2.,选择检索工具或数据库,3.,确定检索途径(检索字段)及检索方法(检索方 式),形成检索标目(构造检索提问式),4.,实施检索,5.,索取原始文献。,2.5,信息检索系统与检索工具,2.5.1,信息检索系统,2.5.2,信息工具,2.5.1,信息检索系统,2.5,信息检索系统与检索工具,信息检索系统是集信息收集、加工、存储、检索和管理于一体的信息服务系统。一般来说,组成信息检索系统的基本要素有:文献信息、检索设备、检索语言、信息存储方法与检索方法、系统管理维护人员和用户。这几大要素的运行情况直接反映着信息检索系统的服务效果。信息检索系统按其检索方式

19、可分为手工检索系统和计算机检索系统。,2.5.1,信息检索系统,2.5,信息检索系统与检索工具,1.,手工检索系统,手工检索系统由手工检索设备(目录、题录、文摘、索引、卡片等)、检索语言及文献库等组成。该检索系统检准率高、成本低,但检索速度慢、效率低。,2.5.1,信息检索系统,2.5,信息检索系统与检索工具,2.,计算机检索系统,计算机检索系统由计算机检索设备(光盘检索设备、联机检索设备、网络检索设备等)、检索语言及数据库等组成。该检索系统检索效率高、检索范围广、内容全,但检索费用高、灵活性差。,2.5.2,检索工具,2.5,信息检索系统与检索工具,检索工具是按照一定的学科或主题范围、将所收

20、录文献的条目和检索标识依据一定的规则(检索语言)编排组织在一起的二次文献。其中文献条目指描述文献外部特征(题目、著者、出处)和内容特征(主题词、分类号)的记录单元。被标引了的文献特征叫检索标目(检索标识),它是存储和检索文献的入口词。只是在机检中文献条目称字段,且所有字段都可作为检索入口词。,2.5.2,检索工具,2.5,信息检索系统与检索工具,其实广义的检索工具与检索系统是一致的,只是在手检中习惯称检索工具,在机检中多数称为检索系统或数据库。检索工具的类型众多,本书仅按检索手段划分,将其分为手工检索工具和计算机检索工具两大类。,2.5.2,检索工具,2.5,信息检索系统与检索工具,1.,手工

21、检索工具,手工检索工具是指无须借助任何辅助设施即可处理和查询的检索工具,多指那些传统的印刷型检索工具。手工检索工具主要通过,“,手翻、眼看、大脑判断,”,方式进行浏览、检索,因此,检准率高,但检索速度慢、效率低。若按其著录内容细分,可划分为以下,3,种。,2.5.2,检索工具,2.5,信息检索系统与检索工具,1.,手工检索工具,(,1,)目录(题录),目录是描述文献外部特征的文献条目,并按一定的次序编排起来的集合体。文献的外部特征包括题名、著者、出处、文种等,其特点是报道及时且量大,但揭示文献深度不够。,目录的著录对象可以是整本文献,也可以是单篇文献(题录)。,2.5.2,检索工具,2.5,信

22、息检索系统与检索工具,1.,手工检索工具,(,2,)文摘,文摘是除题录外还对文献内容做实质性描述的文献条目,即比目录(题录)式检索工具多一项内容摘要条目。因此文摘性检索工具在揭示报道文献的深度及实用性等方面都优于题录,有时甚至能代替原文,从而可大大节省查阅时间、起到事半功倍之效。文摘是检索工具的主体。,文摘有报道性文摘、指示性文摘和评论性文摘,3,种。,2.5.2,检索工具,2.5,信息检索系统与检索工具,1.,手工检索工具,(,3,)索引,索引是将事物标识(著者、关键词、主题、分类等)及其有关指引线索,按照一定的顺序加以排列,并注明其所在文献中的位置(页码或文摘号等),以便检索相应文献的检索

23、工具。它的特点是用户利用简单、方便,但也和目录一样未能反映文献内容。,2.5.2,检索工具,2.5,信息检索系统与检索工具,2.,计算机检索工具,(,1,)光盘检索,即采用计算机作为手段、以光盘作为信息存储载体和检索对象进行的信息检索系统。,2.5.2,检索工具,2.5,信息检索系统与检索工具,2.,计算机检索工具,(,2,)联机检索,联机检索是一台主机带多个终端的计算机信息检索系统,它具有分时操作能力,能使许多相互独立的终端同时进行检索。这种检索是用户使用计算机终端设备通过通信线路,直接与主机对话,用户可输入提问表达式并马上得到答案。联机检索系统一般都设有数百个数据库,而每个数据库又包括几十

24、万、几百万条数据信息。,2.5.2,检索工具,2.5,信息检索系统与检索工具,2.,计算机检索工具,(,3,)网络检索,该系统同联机检索系统的主机和用户终端的主从关系不同,网络检索是基于客户机,/,服务器的网络支撑环境的,客户机和服务器是同等关系,只要遵守共同协议,一个服务器可被多个客户访问,一个客户也可以访问多个服务器。,Internet,便是该系统的典型。网络信息检索是基于,Internet,的分布式特点开发和应用的,用户只要通过网络接口软件,即可在任一终端机上查询世界各地上网的信息资源。随着信息技术的发展,网络将成为信息源传递的主要渠道。,2.6,数字图书馆,2.6.1,数字图书馆由来,

25、2.6.2,数字图书馆定义,2.6.1,数字图书馆由来,2.6,数字图书馆,数字图书馆是相对传统图书馆而言的。传统图书馆是一个人们看得见、摸得着、拥有一定数量馆藏和管理人员的一个物理建筑,是一个集收集、整理、保存、传递文献信息于一体的社会文化教育机构。在传统图书馆中,可通过以手工操作为主的工作人员,利用馆内的各种文献信息,为一定范围的读者提供服务。随着信息技术的发展,图书馆所收集信息的载体也发生了变化,由单一的印刷型发展成缩微型、机读型、声像型等几种形式并存,因此有人称其为电子图书馆。而网络技术的发展又使得图书馆打破了地域和时间的限制,使人们无论何时、何地都可以访问图书馆的信息,因而又有人称其

26、为没有围墙的图书馆。鉴于这种图书馆是在网上访问的,而非现实当中存在的真实物理建筑实体,于是又有人称其为虚拟图书馆,由于其信息都是以计算机能识别的二进制的形式存储,因而又出现了数字图书馆的概念。,2.6.2,数字图书馆定义,2.6,数字图书馆,1.,美国数字图书馆联盟(,DLF,)定义(,1998,)。,2.William Y.Arms,定义。,3.,孙坦定义。,4.,国家图书馆定义。,5.,大英图书馆定义。,6.,百度百科对数字图书馆定义的概括。,2.6.2,数字图书馆定义,2.6,数字图书馆,1.,美国数字图书馆联盟(,DLF,)定义(,1998,)数字图书馆是一个拥有专业人员等相关资源的组

27、织,该组织对数字式资源进行挑选、组织、提供智能化存取、翻译、传播、保持其完整性和永存性等工作,从而使得这些数字式资源能够快速且经济地被特定的用户或群体所利用。,2.6.2,数字图书馆定义,2.6,数字图书馆,6.,百度百科对数字图书馆定义的概括 通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。数字图书馆既是完整的知识定位系统,又是面向未来,Internet,发展的信息管理模式,可以广泛地应用于社会文化、终身教育、大众媒介、商业咨询、电子政务等一切社会组

28、织的公众信息传播。,2.7,结构化信息与非结构化信息,2.7.1,结构化信息,2.7.2,非结构化信息,2.7.1,结构化信息,2.7,结构化信息与非结构化信息,数据分为结构化数据、半结构化数据和非结构化数据。,结构化信息是结构化数据的产物,是指经过严格的标引后的数据,一般以二维表的形式存在。也就是通常所说的可以数字化的数据信息,这些数据信息可以方便地通过计算机和数据库技术进行管理。如电子商务信息,多数出版商发行的各种文摘、数值、全文数据库皆属于此。也有人从信息的表现形式上称为显性信息,信息的性质和量值的出现的位置是固定的,有规律可循。本书所介绍的信息检索,主要是针对结构化信息而言。,2.7.

29、2,非结构化信息,2.7,结构化信息与非结构化信息,非结构化信息是非结构化数据的产物,是指各种看似相关性比较弱、无法用关系型数据库等结构化的方式来获取和处理的信息。通俗地说是没有经过人为处理的不规整的信息即无法完全数字化的信息,如文档文件、多媒体信息、企业内外部的新闻邮件、合约、票据、文书处理、电子表格、采购记录、,Internet,上的消息、,BBS,等。也有人从信息的表现形式上称非结构化信息为隐性信息。这些信息中隐性包含了掌握企业命运的关键信息,隐含着诸多提高企业效益的机会。,2.7.2,非结构化信息,2.7,结构化信息与非结构化信息,非结构化信息有其自己的一些特点,其所有内容都是不可预知

30、的,格式多样化,无统一标准,不像结构化数据一目了然。特别是多媒体数据中蕴涵着大量的非结构化信息。所以对非结构化信息的整合、存储、检索、发布等都带来了一系列的挑战。,2.7.2,非结构化信息,2.7,结构化信息与非结构化信息,据媒体和研究报告报道,85,以上的信息都在“结构化”世界之外。它们在证券、银行、保险、工商、地税、图书馆等行业中得到广泛应用,因此如何有效的开发非结构数据,对其进行管理,提取当中的隐含信息,对决策进行支持成为当今亟待解决的主要问题。,本章主要介绍了与信息检索有关的一些基本概念,如信息源与信息媒体、信息检索原理、信息检索系统与检索工具、数字图书馆、结构化信息与非结构化信息,重点讲述了检索语言、信息检索方法、途径和步骤。,小结,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服