资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,二级,三级,四级,五级,*,第十章网络信息组织,10.1,网络信息组织概述,随着因特网的发展,网上信息资源的组织问题已经日益突出。网络信息在社会信息量中所占的比重呈日渐上升的趋势。今天我们从事的信息工作很重要的一部分便是将传统信息组织上网,或将网上信息下载供人们使用,而其中的关键是网络信息组织。,10.1.1,网络信息的特点,网上信息具有一些新的特点,主要表现为:,1),数量庞大、增长迅速。,2),内容丰富、形式多样。,3),变化频繁、价值不一。,4),结构复杂、分布广泛。,5),因特网对网上信息资源的组织却没有统一的要求。网上信息存储在世界各地的服务器,10.1.2,网络信息的类型,1,网上一次信息,(1),主页方式,(Home page),(2),电子邮件,(3)BBS,网络新闻一般也属于一次信息源,它的新颖性很高,有些网站的新闻甚至比传统的媒体,(4)Usenet,、,Newsgroups,10.1.2,网络信息的类型,(,续,),2,网上二次信息,目前网上二次信息的组织主要有下列形式:,(1),搜索引擎,(Search engine),形式,(2),菜单索引方式,(Menu type),10.1.3,网络信息组织的内涵,网络信息组织是指人们根据网络信息本身的特点,(,或属性,),、运用各种工具和方法,对网络信息进行加工、整理、排列、组合,使之有序化、系统化、规律化,从而有利于网络信息的存储、传播、检索、利用,以满足人们的网络信息需求的活动过程。因此网络信息组织的对象是网络信息,如网页,(WWW),、,Email,、,Ftp,、,Gopher,、,BBS,、,Usenet,等,其中以网页为主要存在形式。,10.1.3,网络信息组织的内涵,(,续,),网络信息组织同其他信息组织一样,即经过序化阶段和优化阶段两个过程对信息进行整序。,分类法和主题法是信息组织最为重要的两种方法。,进行网络信息分类的原则有:直接性原则、实用性性原则、自然性原则、快捷性原则等,根本上要使分类具有简明性、实用性、科学性和开放性。,10.2,网络信息组织方式与方法,10.2.1,网络信息组织面临的新挑战,(1),网上信息组织需要实现自动化。,(2),网上信息组织要从纯文本向多媒体方向发展。,(3),网上信息组织要求从数据结构转向知识表示。,10.2.2,网络信息组织方式,目前网上信息组织的主要方式大致有四种:文件方式、数据库方式、主题树方式和超媒体方式。,1,文件方式,2,数据库方式,3,超级链接方式,4,主题树方式,5,搜索引擎方式,10.2.3,网络信息组织方法体系,网络信息组织方法,10.2.3,网络信息组织方法体系,(,续,),数据库与超媒体技术的结合将是网上信息组织方法发展的新方向。目前,人们提出了三种结合途径。,1,通过超级链接联结数据库,CGI(common gateway interfere),。,API,技术,(application program interfere),。,Active X,技术。,ODBC,技术,(Open database connectivity),JDBC,技术,(Java database connectivity),。,10.2.3,网络信息组织方法体系,(,续,),2,在数据库上附加链服务,3,建立超媒体结构的数据库系统,10.3,网络信息的分类组织,10.3.1,网络信息分类法的意义,体现了知识分类的概念标识系统,10.3,网络信息的分类组织,10.3.2,网络信息分类体系,网络的出现及网上信息的急剧增涨,给分类法的发展提供了新的契机。分类法在网络信息组织中的应用有两条途径:,1,将传统分类法面向网络进行改造,传统的分类法是网络信息分类的基础。采用文献分类法对信息进行组织的网络分类体系大致分以下一些类型:,10.3.2,网络信息分类体系,(1),依据综合性分类表建立综合性网络信息系统。,表,10 1,典型的综合性分类信息系统,分类网络信息系统名称,编制机构,分类工具,Net First,OCLC,DDC Canadian Information by Subject,NISS Information Gateway,英国联合信息系统,UDC,BUBL LINK,英国联合信息系统,DDC,电子信息委员会,网络数据库,(Cyberstacks),美国阿衣华州立大学,LCC,荷兰电子主题服务系统,荷兰国家图书馆等,DBC(Dutch ESS),中国教育科研网,中国教育系统,中图法,10.3.2,网络信息分类体系,(,续,),(2),依据专业分类表建立专业性的网络信息系统。,(3),依据综合性类表的某一专类建立专业性网络信息系统。,10.3.2,网络信息分类体系,(,续,),2,创建新的网络信息资源分类体系,创建的网络信息分类体系的特点是:,体系结构简明,便于网民操作;,主题聚类为主、学科分散,便于网民理解;,突出强化生活性类目,淡化学科性类目,贴近网民生活;,多角度重复列类,增加检索途径;,10.3.2,网络信息分类体系,(,续,),2,创建新的网络信息资源分类体系,充分揭示事物的多重属性,通过多重列类,利用链接技术,有选择地同时建立多个引用次序的类目体系;,采用多元划分,减少点击次数;,类名措词时尚,具有吸引力;,建立主从分类体系,提供多种选择;,采用超文本链接技术,实现任意跳转;,10.3.2,网络信息分类体系,(,续,),2,创建新的网络信息资源分类体系,系统及时得到维护,随时增、删、改;实现了分类体系的动态组织;,实现界面友好,检索方便快捷。直观地显示类目体系,直接显示类名,使整个类目体系直观明了;,多数类目按用户使用频率高低排序在同一个划分等级中,10.3.2,网络信息分类体系,(,续,),3,建立统一的网络信息资源分类体系迫在眉睫,10.3.2,网络信息分类体系,(,续,),3,建立统一的网络信息资源分类体系迫在眉睫,10.3.2,网络信息分类体系,(,续,),网络信息分类法是以主题立类为主,突出反映生活性类目,以类目的使用频率、重要性和字顺来排列类目,在同一个划分等级上采用了多种标准,采取重复列类和多重列类法来显示类目之间的关系,很少使用说明和注释,类名措词多使用自然语言,设置多个分类体系和类目,检索途径多,效率高,多数能做到及时维护,得到广大用户的青睐,满意度高;,10.3.2,网络信息分类体系,(,续,),而传统的文献分类法则是以学科立类为主,突出反映学科性类目,以类目之间的逻辑关系为序类原则,在同一个划分等级上基本上只采用一种标准,采用“参见”和“宜入”的方式来显示类目之间的关系,使用说明和注释较多,类名措词多使用人工语言,只有一种分类体系并且为单线排列。,10.4,网络信息的主题组织,10.4.1,主题法在网络信息组织中应用的研究,(1),关键词法的应用。,(2),主题词表的应用。,(3),标题词表的应用。,10.4.2,主题法在网络信息组织中应用实践,(1),利用传统主题表组织网上信息资源。,(2),建立主题范畴系统组织信息,同时又通过标注分类号,使按主题法组织的信息保持与分类体系的联系。,(3),同时使用主题代码系统和分类表组织信息。,10.4.2,主题法在网络信息组织中应用实践,总结起来,主题语言在网络信息资源组织中表现为两个方面,,一是利用传统主题表组织网上信息资源,传统的主题法仍被用于网上信息组织。现有词表通常都是控制词表,其基本功能就是通过同义词控制和词语之间的关系促进更好的检索结果反馈和通过同形异意词控制来达到更高的精确度,如一些网络信息检索系统采用了,美国国会图书馆主题表,、,医学主题表,等,但这种情况并不多;,10.4.2,主题法在网络信息组织中应用实践,另一方面主要表现为关键词语言在网络搜索引擎的广泛使用。网站、网页的题名、地址、摘要及正文中的自然语词都可被选作关键词来建立索引数据库,用户通过检索系统的关键词检索功能获取指向相关网络信息的超链接,搜索引擎就是利用关键词语言组织网络信息资源。,10.4.3,主题法在网络信息组织中应用的方式,主题法在网络信息组织中的应用方式有:,(1),使用关键词法组织网络信息。,(2),使用叙词法组织网络信息。,10.5,学科门户网站,10.5.1,学科门户定义和特征,1,学科门户的定义,学科门户网站,也叫主题门户,或学科信息门户,(Subject Based Information Gateways),、主题网关,(subject information gateway,,缩写为,SIG),。学科门户网站的定义最早是由,T.Koch,提出的,它认为学科门户网站,是指提供可检索和可浏览的因特网资源目录的联机服务系统,一般集中于某一相关的学术领域,提供对经图书馆工作人员遴选和按学科组织的因特网资源的利用,而且其利用是免费的。,10.5.1,学科门户定义和特征,10.5.1,学科门户定义和特征,2,学科门户的特征,随着学科门户网站的发展,以及人们对学科门户网站研究的不断深入,可以发现学科门户网站有一些共同的特征:,(1),提供网上大量网站或文献链接的在线服务。,(2),根据特定的质量和范围标准,运用人的智力劳动过程选择资源。,(3),依靠人的智力完成内容描述。内容描述可以采用给定的关键词或受控术语,这是个很好的方法,但并非必不可少。,(4),依靠人的智力构建浏览,/,分类结构,(,不包括完全无组织的链接表,),。,(5),至少部分是人工为每个资源创建,(,书目,),元数据。,10.5.1,学科门户定义和特征(续),黄如花将学科门户特点全面总结为:尽可能全面地收录本学科资源、严格选择资源、对资源进行高质量的元数据描述、构建合理的分类体系和尽量运用受控词表、定期更新和维护、重视互操作性、运用相关技术、提供个性化和人性化服务。,10.5.2,学科门户网站的分类和主题组织,1,学科门户网站的信息分类,许多学科门户网站能够提供一系列专家制作的内涵较宽泛的分类目录,以支持浏览和全文检索,有些学科门户网站还提供受控词表,有些词表是由学科门户网站的专家自己制作的,有些是标准化的信息工具,如分类表、主题词表。,10.5.2,学科门户网站的分类和主题组织,2,学科门户网站的主题目录,学科门户网站一般还提供按字顺排列的主题表,把每条信息资源描述的主题词,按照字顺排列起来,组成一个可以浏览的字顺表,供用户通过字顺途径查找某个特定主题的信息资源。这种主题表具有与主题目录相类似的作用。,10.5.2,学科门户网站的分类和主题组织,3,学科门户网站的词表,学科门户网站有时还提供叙词表,以受控方式对其信息资源进行组织,即对网络信息资源进行主题标引。,10.5.3,学科门户网站的元数据和信息描述,3,学科门户网站的词表,学科门户网站有时还提供叙词表,以受控方式对其信息资源进行组织,即对网络信息资源进行主题标引。,10.5.3,学科门户网站的元数据和信息描述,3,学科门户网站的词表,元数据,(metadata),是关于数据的数据,它用来描述互联网上的信息资源的属性,能帮助信息的识别、定位、发现、描述和选择等。,学科门户网站的元数据不宜过多,否则建设费用过高,用户的使用负担也会加重,但可以考虑采用详细著录级次和简要著录级次两种方式建立学科门户网站。简要著录级次由详细级次自动生成,显示时用户可以根据使用需求进行选择,以判定检索到的信息资源是否需要进一步检索。,10.5.4,学科门户网站的未来,3,学科门户网站的词表,未来学科门户网站数量将会不断增加,功能越来越多,集成度越来越高,专业性越来越强。学科门户网站就像是网上的图书馆一样,有综合性的,有专业性的,已有的学科门户网站会不断完善,新的学科门户网站会不断产生、发展和成熟。,10.6,网站信息组织的评估,10.6.1,网站信息内容评估,1,影响力,访问人次数:,访问时间:,引用比率:,所属机构权威性:,10.6.1,网站信息内容评估,2,具体内容,3,表现形式,美观性:,条理性:,科学性:,10.6.2,网站技术内容评估内容,1,性能,硬件:,软件:,2,维护,10.6.3,网站评估实例,INTERNET GUIDE 2007,中国互联网调查报告,表,10 2INTERNET GUIDE 2007,中国互联网调查报告,涉及的,50,个细分领域,10.6.2,网站技术内容评估内容,(,续,),领,域,领,域,领,域,领,域,领,域,1,综合门户,11,视频点播,/,直播,21,B2C,电子商务,31,人才招聘,41,分类信息,2,搜索引擎,12,视频搜索,22,C2C,电子商务,32,信息科技,42,网上黄页,3,即时通讯,13,数字杂志,23,电子支付,33,网络安全,43,网络广告,4,新闻,14,图片,/,摄影,/,相册,24,网上银行,34,女性,44,电子邮件,5,博客,15,动漫卡通,25,财经,35,娱乐,45,IP,电话服务,6,个人门户,/,空间,16,网络游戏,26,汽车,36,体育运动,46,网址导航,7,社区,/BBS,17,游戏资讯,27,房地产,37,文学,47,网络接入,8,威客,18,音乐,28,旅行预订,38,地图服务,48,域名主机服务,9,交友,19,音频,/,音乐搜索,29,健康,39,生活服务,49,软件下载,10,播客,/,视频分享,20,B2B,综合电子商务,30,教育培训,40,本地门户,50,下载工具,10.6.2,网站技术内容评估内容,(,续,),通过以上的数据采集和分析,中国互联网协会发布的,INTERNET GUIDE 2007,中国互联网调查报告,评出十大个热点领域的用户年达到率排名:,门户:新浪:,55.53%,网易:,51.31%,腾讯:,48.02%,博客:新浪:,32.86%Qzone,:,19.28%MSN,:,15.8%,独立博客:博客网:,11.66%,中国博客网:,11.65%,博易:,3.32%,即时通讯:,QQ,:,78.73%MSN,:,34.37%,新浪,UC,:,11.38%,搜索:百度:,80.79%Google,:,36.38%,雅虎:,25.99%,汽车网站:新浪汽车:,16.76%,搜狐汽车:,11.65%,太平洋汽车:,10.67%,独立汽车网站:中国汽车网:,8.89%,汽车之家:,7.94%,太平洋汽车网:,10.67%,10.6.2,网站技术内容评估内容,(,续,),网络游戏运营商:,QQ,:,36.89%,联众:,20%,盛大:,19.86%,独立网络游戏运营商:联众:,20%,盛大:,19.86%,世纪天成:,10.3%,播客,/,视频分享:土豆网:,9.86%,优酷:,8.91%Mofile,:,8.7%,C2C,电子商务:淘宝网:,55.29%eBay,易趣:,36.51%,拍拍网:,20.48%,不同媒介网络广告:电子邮件广告:,14.84%,门户广告:,14.39%,新闻网站广告:,13.99%,地图服务:百度:,32.55%,中国电子地图网:,18.95%,图行天下:,10.76%,独立地图服务商:中国电子地图网:,18.95%,图行天下:,10.76%,中华地图网:,10.1%,10.7,网络信息组织的新模式,Web2.0,Web2.0,是相对,Web1.0,的新一代互联网应用的统称,是由,OReilly,媒体公司的总裁兼,CEO,提姆奥莱理首先提出的。人们熟知的博客、,RSS,和网摘都是其最好的表现形式。,Web2.0,使用户能够主导信息的生产和传播,打破了原来门户网站所惯有的单向传输模式。,10.7.1Web2.0,的特征,(1),面向服务:,(2),用户参与:,Web2.0,将服务质量的提高依赖于用户的参与。,Web2.0,的代表网站,(3),集体智慧:,Web2.0,的一个核心特征是驾驭集体智慧,(Harnessing Collective,(4),内容聚合:,(5),信息产生的多样化:,10.7.1Web2.0,的特征,(,续,),表,10 3 Web1.0,与,Web2.0,之间的差异,10.7.1Web2.0,的特征,(,续,),鉴于上述特征,,Web2.0,环境下的信息组织应注意以下几点:,(1),应该能够处理多种类型的信息资源,符合信源分布分散的实际情况。不同类型的资源需要按不同的方式予以组织。,(2),应该符合用户的需要,为用户输出有序的信息流。,(3),应该注意与新技术的结合,特别应该重视,RSS,、超媒体技术对信息组织的影响。在,Web2.0,中得到广泛使用的,RSS,技术,采用了向用户”推”的原理实现信息组织。信息不仅可以拉,(,从信息用户的角度,),,而且可以推,(,从信息发布者的角度,),。,10.7.1Web2.0,的特征,(,续,),(4),应该实现信息的深层挖掘。,Web2.0,的内容稂莠不齐,有价值的专业分析讨论与各种杂谈闲聊掺杂在一起,信息组织不光要把信息整理得有序化,还应该对信息进行提炼、过滤、重组等优化策略,提高信息利用价值。,10.7.2Web2.0,的主要形式,(1),博客:博客是一种日记形式的个人网页。如今的博客已经成为“民治、民享的媒体”,而不是只由传统媒体或者门户网站掌控的一种工具。博客的一大特点就是“超链接”的写作方式,因此尽管是一篇寥寥数字的文章,但通过超链接却能够极大地扩展信息面和丰富信息量。,10.7.2Web2.0,的主要形式,(,续,),(2),播客:个人自选数字广播,(personal optional digital casting,,,Podcasting),,即将网络信息和自制的节目录到播客网上,播客再收听的整个过程。播客和在线音频、视频的本质区别是多了“,Pod”,,它是可点播可订阅可携带的。播客不会替代文字博客,它是一种新的“传播媒介”。,10.7.2Web2.0,的主要形式,(,续,),(3),维基,(Wiki),:维基是一种超文本系统,也可以把维基理解为网上的百科全书。与其它超文本系统相比,,Wiki,有使用方便及开放的特点,所以,Wiki,系统可以帮助我们在一个社群内共享某领域的知识。它支持面向社群的协作式写作,所有用户均可以在维基上增加和修改条目,同时也包括一组支持这种写作的辅助工具。维基与博客使用了相同的语法,都为用户提供了在线的写作。不过,维基是面向社群的,而博客是面向个人的。,10.7.2Web2.0,的主要形式,(,续,),(4)RSS,:,RSS(really simple syndication,,简易信息聚合,),是某一站点用来和其它站点之间共享内容的一种简易方式,是目前使用最广泛的,XML,应用。从个人博客栏目、企业站点到世界级的门户都可以提供基于,RSS,的服务。,10.7.2Web2.0,的主要形式,(,续,),(4)RSS,:发布一个,RSS,文件,(,一般称为,RSS Feed),后,这个,RSS Feed,中包含的信息就能直接被其它站点调用,而且由于这些数据都是标准的,XML,格式,所以也能在其它的终端和服务中使用,如,PDA,、手机、邮件列表等。,RSS,会收集和组织定制的新闻,按照用户希望的格式、地点、时间,直接传送到用户的计算机上。,10.7.2Web2.0,的主要形式,(,续,),(4)RSS,:随着支持,RSS,输出的网站越来越多,企业用户可以在客户端借助于支持,RSS,的新闻聚合工具软件,在不打开网站内容页面的情况下阅读内容。与一些专业竞争情报信息服务商提供的服务一样,,RSS,可以让企业用户及时发现诸多网站的最新内容。,10.7.2Web2.0,的主要形式,(,续,),(4)RSS,:,订阅,BLOG(,你可以订阅你工作中所需的技术文章;也可以订阅与你有共同爱好的作者的,Blog,,总之,你对什么感兴趣你就可以订什么,),.,订阅新闻,(,无论是奇闻怪事、明星消息、体坛风云,只要你想知道的,都可以订阅,),软件工具的方法从网络上搜集各种,RSS Feed,并在一个界面中提供给读者进行阅读,10.7.3Web2.0,的主要实现技术,(1)SNS,:,SNS,是一个采用,P2P,技术,构建的下一代基于个人的网络基础软件。其通过分布式软件编程,将现在分散在每个人的设备上的,CPU,、硬盘、带宽进行统筹安排,并赋予这些相对服务器来说很渺小的设备更强大的能力。这些能力包括:计算速度、通信速度和存储空间。一台预装,SNS,的计算机,可以创建自己的网站、自己的网络电台、自己的网络电视频道、自己的商店、自己的工作流、自己的社会网络以及,SNS,模式的电子邮件等,尤其重要的是,这些都是可控的,一般只限定在自己的社会网络内,例如,我只让经过我允许的人收看我的网络电台的节目,只收我认识的人发来的邮件等。,10.7.3Web2.0,的主要实现技术,(,续,),(2)TAG,:,TAG,是由用户自由选择的对网站的内容分类和标识的关键词。,TAG,直接反映了用户的词汇,这些词汇不是来自专业人士和内容创造者,而是来自拥有信息的内容消费者,普通用户。通过,TAG,进行搜索,结果会更加自然。,TAG,的商业价值也是不可估量的,当用户通过不同的角度获取,TAG,的信息页面时,与这些主题紧密相关的广告价值将得到体现,这比,Google,的上下文广告更有精确度。,TAG,的意义就是:“你的知识能让更多的人受益,而你也能从更多的地方获取知识,这远非企业内部的知识共享所可比的。”,10.7.3Web2.0,的主要实现技术,(,续,),(3)Ajax,:,Ajax,是,Asynchronous,、,JavaScript,和,XML,的简称,异步交互、基于,JavaScript,脚本和,XML,封装数据,是,Ajax,的,3,大特征。它使得用户可以任意修改网页上的个人信息,且无需向服务器重新发送请求和刷新页面。这样,不仅大大提高了用户体验,而且还在很大程度上缓解了服务器的数据处理压力。,10.7.3Web2.0,的主要实现技术,(,续,),Web2.0,技术在企业中的应用目前还无法操之过急。,Web2.0,新技术在企业应用时,不在于技术是如何的新,而在于企业管理模式是否已经与该企业实体现实匹配,从而形成一个完善的内部模式和流程。,10.7.3Web2.0,的主要实现技术,(,续,),从国内的具体应用现状来看,目前几乎很难看到,Web2.0,在企业中有很好的直接应用。一位对,Web2.0,有著浓厚兴趣的,CIO,表示,要改变这种状况,需要让更多的人接受,Web2.0,技术,并让企业看到一些成功的应用案例。或许这正是当前推动,Web2.0,企业应用的重点,因为对于企业来说,技术仅仅是一种为管理服务的工具,先进性并不是最重要的。,【,本章习题,】,1.,网络信息有什么特点和哪些类型?,2.,什么是网络信息组织?它有哪些方式和方法?,3.,请写出网络信息组织方法的体系。,4.,分类法在网络信息组织中的应用有哪两条途径,?,请访问几个著名的网站,比较其大类有什么异同?,5.,主题法在网络信息组织中的应用取得了哪些成就?,6.,主题法在网络信息组织中的应用方式有哪些?,【,本章习题,】,8.,分类法和主题法在学科门户网站信息组织中有哪些应用?,9.,如何评价网站的信息组织情况?对课本的评估指标,你有哪些改进意见?成立一个专门的评估网站,你认为可行吗?为什么?,10.,什么是,Web2.0,?它有哪些特征?,11.Web2.0,有哪些形式?,12.Web2.0,对网络信息组织产生什么样的影响?有人认为,,Web2.0,的商业模式还有待探索,也有人说,,Web2.0,不适合中国企业,对此你怎么认为?,【,本章习题,】,8.,分类法和主题法在学科门户网站信息组织中有哪些应用?,9.,如何评价网站的信息组织情况?对课本的评估指标,你有哪些改进意见?成立一个专门的评估网站,你认为可行吗?为什么?,10.,什么是,Web2.0,?它有哪些特征?,11.Web2.0,有哪些形式?,12.Web2.0,对网络信息组织产生什么样的影响?有人认为,,Web2.0,的商业模式还有待探索,也有人说,,Web2.0,不适合中国企业,对此你怎么认为?,此课件下载可自行编辑修改,供参考!,感谢您的支持,我们努力做得更好!,
展开阅读全文