ImageVerifierCode 换一换
格式:PPT , 页数:43 ,大小:1.16MB ,
资源ID:10228389      下载积分:12 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10228389.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请。


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(信息资源组织基础PPT.ppt)为本站上传会员【w****g】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

信息资源组织基础PPT.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第一讲 信息资源组织基础,刘炜,wliu,元数据与信息资源组织,1,啤酒与尿布的故事,美国沃尔玛超市建立数据仓库,按周期统计产品的销售信息,经过科学建模后提炼决策层数据。结果,他们发现:每逢周末,位于某地区的沃尔玛超市连锁店的啤酒和尿布的销售量很大,而且单张发票中同时购买尿布和啤酒的记录非常普遍。分析人员经过深入分析得知,通常周末购买尿布的是男士,他们在完成了太太交给的任务后,经常会顺便买一些啤酒。得出这样的结果后,沃尔玛超市的工作人员尝试着将啤酒和尿布摆放在一起销售,结果,尿布与啤酒的销售额双双增长。,2

2、生活中的信息组织,你怎么组织你的,书籍或资料,衣物或任何其他生活杂物,电脑文件,大脑中的信息,3,你怎么组织,藏书,按用途:兴趣爱好的(小说、旅游、烹调),学习类的,收藏类,工具书类,按载体:刊物、报纸、图书、画册,按学科或专题:(藏书家),4,你怎么整理,CD/DVD,按类型:古典、流行、爵士、蓝调,.,或故事片、文艺片、,MTV,、动画片、纪录片;,按人物:贝多芬、柴可夫斯基,或布鲁斯威利斯、李连杰、,007,综合方法,5,你怎么整理,衣物,类型;,季节;,面料;,喜欢程度;,上述综合,6,你怎么整理,计算机文件?,你头脑中的信息?,7,总结,分类方法是人类最本能认识世界的方法,因而也应

3、用于任何资源的组织;,按使用方便(多数是内容)分类而不是按物理顺序(或字顺等)排列;,用于类分事物的性质叫做“属性”,试行分内部属性和外部属性;,不作索引或简单的书本式索引;,凭记忆查找,因而强调助记性。,8,总结:信息资源组织常用方法,分类法,主题法,字顺法,号码法(赋予号码后的字顺法),时空法(例如大事记,年鉴等),序列法(大小,/,多少,/,好坏,/,贵贱,),超文本法(链接法),9,相关因素,信息资源组织与下列因素有关:,信息资源组织的对象是什么?,信息资源组织的目的是什么?,信息资源组织对象有什么显著特性?,如何更方便的使用(达到目的),10,第二章信息资源组织的基本问题,11,基本

4、问题,什么是信息?,什么是信息资源?,什么是信息资源组织?,信息资源组织的对象是什么?(数据、信息、知识、智慧及其他相关概念的关系是什么?),信息资源组织的目的是什么?,信息资源组织的相关应用领域,传统图书馆,(,博物馆,/,档案馆,),的信息资源组织,现代信息资源组织面临的问题与挑战,12,数据,:离散、互不关联的客观事实,孤立的文字、数据和符号,缺乏关联和目的性,信息,:人们对数据进行系统组织、整理和分析,使其产生相关性,但没有与特定用户行动相关联,知识,:与行动和决策密切相关,人们做决策的行动能力,知识创造与环境相关,智慧,:对事务发展的前瞻性看法,智慧得益于人的内在价值观和信仰,什么是

5、数据、信息、知识、智慧,13,什么是数据、信息、知识、智慧,Data,:数据,=,没有加工的事实数据,对应于人、物理对象、事件或其它实体的原始事实。,单独的数据没有意义,计算机中表示为数字或其它符号形式(不仅是数字形式。,Number,强调数字的内容,,Digital,强调数的形式),例如,10000,Information,:信息,=,数据,+,语境,将数据放到一个语境(,context),中,从而给予它一定的含义,它就成为信息,经过处理的有用的数据,用来回答,Who/What/Where/When,的问题,信息是经人组织的数据组成,例如¥,10000,Knowledge,:知识,=,信息,

6、判断,是一种由人创造的,并且反映他们是如何来进行判断、选择并且采取行动的,know-how,,知识一般与人们所受的教育、经验、思考方法、决策及其他能力相关。,信息被阅读、告知或可视与理解等等,例如¥,10000,是上海外环线附近,2005,年房产的单价,Wisdom,:智慧,=,知识,+,整合,对知识进行组合、创造以及理解知识要义的能力,Wisdom is not a product of schooling but of the lifelong attempt to acquire it.(Albert Einstein),例如”以¥,10000,的单价购买外环线的房子肯定亏本”,文献

7、Document,:记录有知识的一切载体。信息资源的一种形式;,14,其他有关,信息,的定义,信息如同反馈,指机器利用其行为造成的结果作为自适应信息以调整自身,作为正在进行的过程的一个部分,维纳,控制论,1949,年,Information as feedback-the ability of a machine to use the results of its own performance as self-regulating information and adjust itself as part of its ongoing process-Norbert Weiner,Cybe

8、rnetics,1949,信息是能够被编码而通过连接信源和信宿的通道进行传输的东西,申农,1949,年,Information is whatever can be coded for transmission through a mechanical channel connecting a source with a receiver-Shannon,1949,“,Information is commonly used to denote some population of objects to which some significant probability of being u

9、sefully informative in the future has been attributed.,”,-Buckland,1991.,Unlike,knowledge,or,belief,“,the concept of information has connotations of neutrality-it is homogeneous and noncontroversial.The reality,of course,is more complicated,”,-Agre,1995,信息是负熵(申农,信息论,),15,什么是知识?,知识是能够指导思考、行为和交流的正确和真实

10、的观察、经验和过程的总结。知识包含真理和信念,观点和概念,判断和预期,方法和诀窍等内容,也可以理解为用于解决问题的结构化信息。,16,Worlds of Knowledge,(from Popper,s,Objective Knowledge,),World 1 is the physical world,World 2 is subjective knowledge or experience-mental states and processes.,World 3 is objective knowledge-recorded knowledge,public knowledge-crea

11、ted by people.,17,Knowledge Hierarchy,Source:Karl Sveiby,Tacit Knowledge in KM Yearbook 1999-2000,3 Levels,Expertise,Know-How,Skills,Knowledge,Information,Data,18,智慧,wisdom,知识,knowledge,情报,Intelligent,信息,information,数据,data,隐性知识,显性知识,分散孤立,与行动相关,前瞻性,具有相关性,对抗性,数据、信息、知识、智慧之间的关系,19,知识的类型,事实知识,(,Know-wha

12、t,),原理知识,(,Know-why,),技能知识,(,Know-how,),人力知识,(,know-who,),检索知识,(,know-where,),20,再举一例,“8,000,和,10,000-,数据,10,000,米的高山与,8,000,米的飞机飞行最大高度 是信息,“飞机无法飞越这座高山”是知识,必须飞得比地形高 是智慧,21,什么是信息资源,信息资源即“作为资源的信息”,可以理解为有价值的信息。然而信息的价值是体现在使用中的,对于不同的使用者,信息可以有不同的价值,而且信息的不同组合、不同的关联也能使信息具有不同的价值。这反映了信息的特性:信息是具有语境(,context,,也

13、译成“上下文”)的数据。,从计算机操作的角度来看,“信息资源是具有标识的任何东西”。其价值由用户去判断。信息资源组织的目的就是以灵活的方式揭示信息之间的关联(包括结构关联和语义关联),满足不同用户的需要,使其成为“资源”。,世间万物,只要人能够识别出来的东西,给它一个标识(最常用的标识就是名称),它就成了“资源”,作为元数据描述的对象,,DCMI,和,W3C,强调,其“资源”只是在互联网上,由命名域给出,URI,标识的实体。,22,什么是信息资源组织?,即信息资源的有序化的活动:对于信息资源有序化的规律的认识,以及应用认识得来的规律从事有序化工作,知识组织,=,信息资源组织,利用一定科学规则和

14、方法,通过对信息外在特征和内容特征的描述和序化,实现无需信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。,信息的外在特征:信息的(物质)载体所直接反应的特征;,信息的内容特征:信息所包含和承载的具体内容,即通过信息载体所传递和交流的具体内容。,23,信息资源组织的目的,查找,Find,标识,Identify,选择,Select,获取,Obtain,24,信息资源组织体系,根据对象区分信息组织的不同领域:,哲学认识论以知识的抽象本质组织知识;,图书情报机构传统上结合实物载体组织信息资源;,数字图书馆以数字化的信息形式组织资源;,情报检索系统可以看成是,DL,中

15、的一个部分,通过数字化信息内容的各种结构组织资源,,人为标注的结构;,本身的结构被人发现而利用;,企业知识管理围绕企业管理中信息的利用组织资源;,搜索引擎的信息组织;,语义万维网中的信息组织;,其他各种领域知识根据领域的特点组织知识,25,图书馆的信息资源组织,图书馆学的目的宗旨:信息资源整序,图书馆工作的组成(采分编典流)的目的,主要方法:,目录学(关于传统图书馆信息组织的科学),分类法,主题法,文摘与索引,图书编目,无数的经验,26,图书馆如何组织,/,整理图书?,由于数量和体积庞大,引入图书代用品:目录卡片;(书、卡的分离图书馆管理上的一大进步。博物馆、档案馆等任何涉及载体管理的机构莫不

16、如此),泥版、羊皮卷、纸莎草、竹简乃至半导体零件、各类仓储物资,在计算机发明之前,卡片目录是最先进管理方式。其意义甚至不亚于结绳记事、文字发明、书籍产生,目录是馆藏的缩影和“代用品”;为了达到方便存取的目的,多套目录卡片提供多种查询途径;,图书采取唯一方式排架,目录卡片指引到唯一的图书排架号;,每种途径反映了图书的某一属性,例如先按载体类型或语种分,再按学科分类,或其他属性分,如著者目录;,卡片目录,/,图书典藏的排列是分类与字顺等多种方式的结合;,目录卡片的种类有限,不可能穷尽用户认识的角度和使用需求与习惯;,图书是知识的载体,部分目录反映馆藏知识体系,图书馆通过管理知识载体,间接地整理知识

17、27,图书馆的信息资源组织(续),连续出版物有一点不同,二次文献(情报)服务有很大不同,电子资源使传统图书馆的信息组织方寸大乱,28,信息资源组织面临的数字环境,传统情报检索的挑战,处理单元变为“情报载体”:期刊论文、科研报告、报纸文章、专利文献,;,解决方案:文献数据库,+,原文提供;,数字化浪潮的挑战,处理单元复杂化,包含书本、期刊、论文、报告、以及“事实”、“数据”,(,传统的事实数据以工具书形式存在,),并且需要整合利用,需要研究信息,/,知识整个生命周期的完整过程,甚至包括部分认知过程,需要从数据、信息层面上升到“知识”层面,这个过程是正在进行时,随着技术的发展正在变化。,29,

18、Collections grid,信息资源类型,high,low,low,high,Stewardship,权威性,Uniqueness,稀缺性,Books,Journals,Newspapers,Gov.docs,CD,DVD,Maps,Scores,Special collectionsArchives,Rare books,Local history materials,Archives&Manuscripts,Theses&dissertations,Freely-accessible web resources,Research and learning materials,ePri

19、nts/tech reports,Learning objects,Courseware,E-portfolios,Research data,Untransferred records,From:Lorcan Dempsey,30,Web,上的信息,Google,当前索引,80,多亿网页,每天平均收到,2000,万个查询。,中国的公开网页在,3-4,亿,百度每天大概收到,500,万个查询,每篇网页的平均大小在,12KB,左右,于是总共约,40TB,容量(,10,年),人类的,1,亿种书,每本算,10,万字,,200KB,,总共约,20TB,容量。(,5000,年),31,搜索引擎,搜索引擎(

20、Search Engines,)是对互联网上的信息资源(主要是网页)进行搜集整理,然后提供查询服务的系统,通常包括信息搜集、信息整理和用户查询三部分,但提供给用户的往往只是一个查询界面。,两类搜索服务,Google,Yahoo,32,网络信息资源的挑战,数量巨大,没有一个搜索引擎能够覆盖万维网的,16%,网站;,所有搜索引擎加起来覆盖了万维网的,42%,极端异质,信息值不同,长度不同,语法或输入错误,内容错误、过时或不可靠,多种格式,多语种,速度问题,每分钟需要接受,15,000 20,000,次查询请求,33,数字化信息量举例,音乐作品,(,莫扎特,),:约,100MB,报纸,(,华尔街杂

21、志,),:,100MB/,年,(,文本,),卡片目录,(,美国国会图书馆,),:,17GB,广播,(WABC),:,270GB/,年,(,未经压缩,),网络论坛,(Netnews),:,300GB/,年,地区图书馆,(,加州大学图书馆,),:,1.4TB(,图书扫描版,),Internet,出版,(WWW),:,1997,年约,4TB,电视,(CNN,新闻,),:,1GB/1,小时,6TB/,年,(,经压缩,),录像带出租,(Blockbuster Video),:,9TB,科研图书馆,(,美国会图书馆,),:全部图书馆数字化,20TB,来源:美国伯克利加州大学教授,Peter Lyman,和

22、Alex Internet,公司总裁,Brewster Kahle,所著,文化制品数字化存档行动纲要,。,34,信息检索的问题,查找非结构信息有困难,多数数据库在结构化字段上工作,多数商业信息是非结构化的,.,报告、电子邮件、来往公函,.,美国商业每年产生,4500,亿份文件,波音,747,文件比飞机重量还重,索引是主观的,索引者之间不一致,经验统计表明索引者之间仅,20%,相同,.,作者与索引者之间、检索者与用户之间不一致,.,信息超载,信息太多,需要过滤,检索结果垃圾太多,有害信息太多,35,拖曳网,搜索引擎仅在信息海洋表面上拖曳,来源:曾民族先生的有关报告,36,深海网,来源:曾民族先

23、生的有关报告,37,深海网,深海网比浅海网大,500,倍,95%,深海网是公开的和可免费获取的,深海网内容质量高,1000+,倍,7,500 TB,信息量,目前有,45,000,浅海网搜索引擎,38,信息资源组织成为全球性难题,信息发布具有自由性和任意性,难于控制和管理,分布、分散、无序、无政府、,经常变动、,无限数量、包罗万象、,真伪并存,资源信息和非资源信息难于驾御,非规范、非结构,检索查全和查准提出新的挑战,多媒体、多语种、多类型信息的整合提出新的挑战,跨国界数据传递和流动,带来政治、外交、文化新问题,集成多种,(,正式和非正式等,),交流方式,39,目前对付挑战的能力有限,以文本信息、

24、显性知识为主,以非结构信息为主,以系统为中心,以信息提供为目的,以相对简单的信息技术开发,以正面效益为衡量标准,40,第三章课程的内容框架结构:信息资源组织模型,41,信息资源组织系统抽象模型(课程框架),知识单元,特征提取,特征建库,(,索引,),资源库,提问单元,提问处理,语义特征,:,分类,/,主题,/,自由词,/,元数据,语用特征,载体类型,学科内容,应用领域,狭义,/,传统知识组织(内容管理),广义,/,现代知识组织,利用方法,读者,图书馆员,结果处理,读者特征,数字化,数字图书馆,42,课程内容,信息资源组织的方法,分类法,主题法,元数据方法,知识本体方法,信息资源组织的应用,情报检索,数字图书馆(内容管理),(企业)知识管理,43,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服