1、第三章第三章 网络信息资源检索网络信息资源检索1可编辑版网络社会网络社会 在现在的网络信息环境下,网络信息资源是我们学习、在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资工作、生活中利用率最高的信息资源之一。对网络信息资源的利用是源的利用是终身学习终身学习终身学习终身学习的需要,也是个人信息素养中的重要的需要,也是个人信息素养中的重要内容。相对与本馆纸质文献信息资源和数字资源的检索利内容。相对与本馆纸质文献信息资源和数字资源的检索利用,其用,其对人的影响更为深远对人的影响更为深远对人的影响更为深远对人的影响更为深远。所以在章中不仅仅介绍网络信息
2、资源及其利用,还对所以在章中不仅仅介绍网络信息资源及其利用,还对网络融入生活、网络融入学习等方面的内容做了介绍。网络融入生活、网络融入学习等方面的内容做了介绍。2可编辑版本本章章内内容容3.1 网络信息资源概述网络信息资源概述3.2 搜索引擎搜索引擎3.3 网络开放存取资源网络开放存取资源3可编辑版3.1 网络信息资源概述3.1.1 3.1.1 网络信息资源的特点网络信息资源的特点3.1.2 3.1.2 网络信息资源的类型网络信息资源的类型3.1.3 3.1.3 网络信息检索的一般方法网络信息检索的一般方法4可编辑版3.1.1 3.1.1 网络信息资源的特点网络信息资源的特点1.1.概念:概念
3、:网络信息资源网络信息资源网络信息资源网络信息资源是指信息资源以电子数据的形式是指信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的总和在计算机等终端上再现的信息的总和。5可编辑版3.1.1 3.1.1 网络信息资源的特点网络信息资源的特点 2.2.特点:特点:(1 1)内容角度:数据海量)内容角度:数据海量 类型多样类型多样 更新高频化更新高频化 (2 2)形式角度:数字化存储、传递)形式角度:数字化存储、传递 动态性动态性 开放性开放性 (3 3)效用角度:共享性)效用角度:共享性 时效性时效性 交互
4、性交互性6可编辑版3.1.2 3.1.2 网络信息资源的类型网络信息资源的类型(1 1)按照信息交流的方式划分:)按照信息交流的方式划分:正式出版正式出版 半正式出版半正式出版 非正式出版非正式出版(2 2)按照信息格式划分:)按照信息格式划分:网络文献格式有网络文献格式有HTMLHTML、TXTTXT、DOCDOC、PDFPDF、RMRM、MP3MP3等等。等等。7可编辑版(3 3)按)按信息内容的表现形式和内容划分信息内容的表现形式和内容划分可分为可分为全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的
5、各类教材,政府出版物,标准全文型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等;等;事实型信息:天气预报,节目预告,火车车次,飞机航班,城市事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、或景点介绍,工程实况、IPIP地址等;地址等;实时型信息资源:各类投资行情和分析、娱乐、聊天、网络新闻实时型信息资源:各类投资行情和分析、娱乐、聊天、网络新闻组讨论、组讨论、BBSBBS、网上购物等。、网上购物等。数值型信息:主要是指各种统计数据;数值型信息:主要是指各种统计数据;其它型信息资源是指图片、动画、音乐、影视、广告等。其它型信息资源是指图片、动画、音乐、影视
6、、广告等。3.1.2 网络信息资源的类型网络信息资源的类型8可编辑版(4 4)按所采用的网络传输协议可分为按所采用的网络传输协议可分为WWWWWW网络资源:因特网信息资源的主流,它使用网络资源:因特网信息资源的主流,它使用httphttp协议,使协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。处的文字、图象、声音和多媒体超文本信息。FTPFTP信息资源:它使用信息资源:它使用ftpftp协议,该协议主要用于连网计算机之协议,该协议主要用于连网计算机之间传输文件。间传输文件。FTPFTP相当于
7、在网络上两个主机之间复制文件。目相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。前仍是发布、传递软件和长文件的主要方法。TELNETTELNET信息资源:信息资源:telnettelnet是远程登陆协议。是远程登陆协议。telnettelnet信息资源包信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。统等。用户服务组资源:包括新闻组,电子邮件组等。这些电子通信用户服务组资源:包括新闻组,电子
8、邮件组等。这些电子通信组形式所传递和交流的信息资源是网络上最自由、最具有开组形式所传递和交流的信息资源是网络上最自由、最具有开放性的资源。放性的资源。4.1.2 网络信息资源的类型网络信息资源的类型9可编辑版建院FTP10可编辑版11可编辑版http:/ 3.1.3 网络信息检索的一般方法网络信息检索的一般方法1.1.漫游法(浏览式检索)漫游法(浏览式检索)所见即所得,通过网页链接,顺着链接浏览。包括所见即所得,通过网页链接,顺着链接浏览。包括偶然发现、顺偶然发现、顺“链链”而行、网址查询。而行、网址查询。2.2.网络资源指南法网络资源指南法 指通过网络资源指南来查找信息网络资源目录式搜指通过
9、网络资源指南来查找信息网络资源目录式搜索引擎,或网络资源目录。索引擎,或网络资源目录。3.3.搜索引擎法搜索引擎法 通过搜索引擎进行文献查询,是最常用的信息查询通过搜索引擎进行文献查询,是最常用的信息查询的方法,通过输入一定的关键词进行关联检索。的方法,通过输入一定的关键词进行关联检索。18可编辑版浏览式检索浏览式检索19可编辑版网络地址法网络地址法此处输入网址此处输入网址如:如:20可编辑版搜索引擎法搜索引擎法21可编辑版3.2 3.2 搜索引擎搜索引擎3.2.1 3.2.1 搜索引擎概述搜索引擎概述3.2.2 3.2.2 搜索引擎的使用技巧搜索引擎的使用技巧3.2.3 3.2.3 综合性搜
10、索引擎综合性搜索引擎3.2.4 3.2.4 专业性搜索引擎专业性搜索引擎22可编辑版1.搜索引擎的发展搜索引擎的发展搜索引擎搜索引擎 是指根据一定的策略、运用特定的计算是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。和处理后,为用户提供检索服务的系统。从使用者的角度看,搜索引擎提供一个包含搜索从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的给搜索引擎后,搜索引擎就会返回跟
11、用户输入的内容相关的信息列表。内容相关的信息列表。3.2.1 3.2.1 搜索引擎概述搜索引擎概述23可编辑版【搜索引擎的起源】19901990年,加拿大麦吉尔大学计算机学院的师生开发出年,加拿大麦吉尔大学计算机学院的师生开发出ArchieArchie。当时,万维网还没有出现,人们通过。当时,万维网还没有出现,人们通过FTPFTP来共享来共享交流资源。交流资源。ArchieArchie能定期搜集并分析能定期搜集并分析FTPFTP服务器上的文件服务器上的文件名信息,提供查找分别在各个名信息,提供查找分别在各个FTPFTP主机中的文件。用户必主机中的文件。用户必须输入精确的文件名进行搜索,须输入精
12、确的文件名进行搜索,ArchieArchie告诉用户哪个告诉用户哪个FTPFTP服务器能下载该文件。虽然服务器能下载该文件。虽然ArchieArchie搜集的信息资源不是网搜集的信息资源不是网页(页(HTMLHTML文件),但和搜索引擎的基本工作方式是一样文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,的:自动搜集信息资源、建立索引、提供检索服务。所以,ArchieArchie被公认为现代搜索引擎的鼻祖。被公认为现代搜索引擎的鼻祖。24可编辑版2.2.搜索引擎的分类搜索引擎的分类按信息搜集方法和服务提供方式按信息搜集方法和服务提供方式目录搜索引擎(如
13、雅虎、搜狐)目录搜索引擎(如雅虎、搜狐)全文搜索引擎(如全文搜索引擎(如GoogleGoogle、百度)、百度)元搜索引擎(如搜魅网)元搜索引擎(如搜魅网)25可编辑版(1 1)目录索引引擎)目录索引引擎以人工方式或半自动方式搜索信息,由编辑员查看信息后,以人工方式或半自动方式搜索信息,由编辑员查看信息后,人工形成信息摘要,并将信息置于事先确定的分类框架中,人工形成信息摘要,并将信息置于事先确定的分类框架中,提供按目录分类的网站链接列表。提供按目录分类的网站链接列表。优点:信息准确、导航质量高。优点:信息准确、导航质量高。缺点:人工介入、维护量大、信息更新不及时。缺点:人工介入、维护量大、信息
14、更新不及时。目录索引虽然有搜索功能,但严格意义目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,可以按照分类目录找到所需要的信息,不依靠关键词(不依靠关键词(KeywordsKeywords)进行查询。)进行查询。目录索引中最具代表性的莫过于大名鼎目录索引中最具代表性的莫过于大名鼎鼎的鼎的YahooYahoo、新浪分类目录搜索。、新浪分类目录搜索。26可编辑版雅虎的分类目录雅虎的分类目录27可编辑版新浪分类目录28可编辑版 (2 2)全文搜索
15、引擎)全文搜索引擎通过从互联网上提取各个网站的信息,建立数据库,从中通过从互联网上提取各个网站的信息,建立数据库,从中检索与用户查询条件匹配的相关记录,然后按一定的排列检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。顺序将结果返回给用户。优点:信息量大、更新及时。优点:信息量大、更新及时。缺点:返回信息过多,有很多无关信息,必须从结果中进缺点:返回信息过多,有很多无关信息,必须从结果中进行筛选行筛选。29可编辑版 全文搜索引擎是名副其实的搜索引擎,国外代表有全文搜索引擎是名副其实的搜索引擎,国外代表有GoogleGoogle,国内则有著名的百度。它们从互联网提取各,国内
16、则有著名的百度。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。列顺序返回结果。根据搜索结果来源的不同,全文搜索引擎可分为根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序,俗称两类,一类拥有自己的检索程序,俗称“蜘蛛蜘蛛”程序程序或或“机器人机器人”程序,能自建网页数据库,搜索结果直程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的接从自身的数据库中调用,上面提到的GoogleGoogl
17、e和百度和百度就属于此类;另一类则是租用其他搜索引擎的数据库,就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如并按自定的格式排列搜索结果,如LycosLycos搜索引擎。搜索引擎。30可编辑版(3 3)元搜索引擎)元搜索引擎元搜索引擎(元搜索引擎(matesearchmatesearch)又称集合型搜索引擎,将多个单)又称集合型搜索引擎,将多个单一搜索引擎集成在一起,提供统一的检索界面,将用户的检一搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问一次搜索多个搜索引擎,并将结果返回给用户。有的索提问一次搜索多个搜索引擎,并将结果返回给用户。有的直接按来源引擎
18、排列搜索结果,如直接按来源引擎排列搜索结果,如DogpileDogpile,有的则按自定,有的则按自定的规则将结果重新排列组合。的规则将结果重新排列组合。优点:能同时搜索多个搜索引擎,能在一定程度上提高查询优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。的广度。缺点:因为有时候并不能对一个搜索引擎全部查完,有时后缺点:因为有时候并不能对一个搜索引擎全部查完,有时后也会漏掉一些重要信息。也会漏掉一些重要信息。31可编辑版搜魅网搜魅网http:/ 最早的山寨搜索引擎,曾经名噪一时。最早确定了山寨最早的山寨搜索引擎,曾经名噪一时。最早确定了山寨搜索引擎的模式,而且访问量很高,但功能简单,
19、而且让搜索引擎的模式,而且访问量很高,但功能简单,而且让用户需要不停的两边拖拉才能看到完整的结果。用户需要不停的两边拖拉才能看到完整的结果。“百谷虎百谷虎”-”-由于某家新闻媒体的报道,最近声名大振,高举着由于某家新闻媒体的报道,最近声名大振,高举着“山寨山寨”大旗,让国人开始了解什么是山寨搜索引擎,名字极富大旗,让国人开始了解什么是山寨搜索引擎,名字极富创意。可惜由于搜索结果被并排挤在一起,似乎没有什么创意。可惜由于搜索结果被并排挤在一起,似乎没有什么实际使用价值。实际使用价值。36可编辑版37可编辑版搜索引擎为什么没有收录我的网站?搜索引擎为什么没有收录我的网站?网站没有被收录主要有几方面
20、的原因:网站没有被收录主要有几方面的原因:1 1、网站的设计上存在问题;、网站的设计上存在问题;2 2、上线时间较短,搜索引擎还没有来的及收录;、上线时间较短,搜索引擎还没有来的及收录;3 3、网站因某种原因被搜索引擎惩罚。、网站因某种原因被搜索引擎惩罚。38可编辑版3.2.23.2.2搜索引擎的使用技巧搜索引擎的使用技巧1.选择合适的搜索引擎选择合适的搜索引擎2.选用准确的关键词选用准确的关键词3.使用高级搜索使用高级搜索4.检索结果的处理检索结果的处理 (只阅读搜索结果的前几条信息、缩小搜索范围、搜只阅读搜索结果的前几条信息、缩小搜索范围、搜索不到网页时要检查拼,查看关键词是否矛盾等、仍索
21、不到网页时要检查拼,查看关键词是否矛盾等、仍找不到可以链接相近的网页。找不到可以链接相近的网页。)39可编辑版搜索引擎高级检索功能搜索引擎高级检索功能高级检索命令:高级检索命令:(1 1)将搜索范围限定在网页标题中)将搜索范围限定在网页标题中 intitle:intitle:(2 2)将搜索范围限定在特定站点中)将搜索范围限定在特定站点中 site:site:(3 3)将搜索范围限定在)将搜索范围限定在URLURL链接中链接中 inurl:inurl:(4 4)将搜索范围限定在网页部分中)将搜索范围限定在网页部分中 intext:intext:(5 5)限定搜索的文献类型)限定搜索的文献类型
22、filetype:filetype:40可编辑版intitle:intitle:举例举例相关结果约相关结果约5,550,000 相关结果约相关结果约152,000个个 41可编辑版site:site:举例举例仅一条仅一条相关结果约相关结果约2,500,000个个 相关结果约相关结果约23,500,000 42可编辑版Inurl:Inurl:举例举例URLURL统一资源定位符统一资源定位符也被称为网页地址。也被称为网页地址。URLURL由三部分组成:协议由三部分组成:协议类型,主机名和路径及类型,主机名和路径及文件名。文件名。43可编辑版filetype:filetype:举例举例44可编辑版3
23、.2.3 3.2.3 综合性搜索引擎综合性搜索引擎 http:/ Google46可编辑版谷歌谷歌 Google GoogleGoogle成立的第一步始于成立的第一步始于 Google 创始人创始人 Larry Page 和和 Sergey Brin 在斯坦福大学的学生宿舍内共在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。的信息搜索者。Google 目前被公认为全球规模最大的目前被公认为全球规模最大的搜索引擎,它提供了简单易用的免费服务,用户可以搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间得到相关的搜
24、索结果。在瞬间得到相关的搜索结果。47可编辑版谷歌谷歌 GoogleGoogleGoogle公司选用公司选用“Google”“Google”一词用来代表在互联网上可以获一词用来代表在互联网上可以获得的海量的资源。得的海量的资源。“Google”“Google”一词源于单词一词源于单词“Googol”“Googol”,据说是因拼错而产生的。据说是因拼错而产生的。“Googol“Googol 指的是指的是1010的的100100次幂,次幂,写出的形式为数字写出的形式为数字1 1后跟后跟100100个零。个零。GoogleGoogle公司采用这个词显公司采用这个词显示了公司想征服网上无穷无尽资料的雄
25、心。示了公司想征服网上无穷无尽资料的雄心。GoogleGoogle公司没有公司没有采用采用GoogolGoogol可能是因为版权的问题,而且当他们注册可能是因为版权的问题,而且当他们注册GG的时候,的时候,GG已经被注册。已经被注册。Google Google词义词义的另一种解释:的另一种解释:G G意义为手,意义为手,OOOO为多个范围,为多个范围,L L意为长,意为长,E E意意为出,把它们合一起,意义为:我们为出,把它们合一起,意义为:我们GOOGLEGOOGLE无论在哪里都能无论在哪里都能为您找出很长的一大堆您想要的。为您找出很长的一大堆您想要的。48可编辑版谷歌谷歌 Google(高
26、级搜索)(高级搜索)49可编辑版谷歌谷歌 Google(搜索帮助)(搜索帮助)50可编辑版谷歌谷歌 Google(搜索帮助)(搜索帮助)51可编辑版谷歌谷歌 Google(产品大全)(产品大全)52可编辑版Google地图地图53可编辑版Google地图地图54可编辑版百度百度 baidu55可编辑版百度百度 baidu其网址为其网址为http:/http:/,每天处理来自超过,每天处理来自超过138138个国家超过数亿次的搜索请求。是全球最大的中文搜索个国家超过数亿次的搜索请求。是全球最大的中文搜索引擎,百度公司于引擎,百度公司于19991999年底成立于美国硅谷,它的创建年底成立于美国硅谷
27、,它的创建者是在美国硅谷有多年成功经验的李彦宏及徐勇。者是在美国硅谷有多年成功经验的李彦宏及徐勇。20002000年年1 1月,百度公司在中国成立了它的全资子公司百度网月,百度公司在中国成立了它的全资子公司百度网络技术(北京)有限公司致力于向人们提供络技术(北京)有限公司致力于向人们提供“简单,可简单,可依赖依赖”的信息获取方式。的信息获取方式。“百度百度”二字源于中国宋朝词二字源于中国宋朝词人辛弃疾的青玉案诗句:人辛弃疾的青玉案诗句:“众里寻他千百度众里寻他千百度”,象,象征着百度对中文信息检索技术的执著追求。征着百度对中文信息检索技术的执著追求。56可编辑版百度百度 baidu高级搜索高级
28、搜索57可编辑版百度百度 baidu(高级搜索)(高级搜索)58可编辑版59可编辑版60可编辑版百度快照百度快照61可编辑版雅虎雅虎 Yahoo!Yahoo!雅虎(雅虎(Yahoo!Yahoo!)是美国著名的互联网门户网站,)是美国著名的互联网门户网站,2020世纪末世纪末互联网奇迹的创造者之一。互联网奇迹的创造者之一。雅虎在全球共有雅虎在全球共有2424个网站,个网站,1212种语言版本,其服务包括搜种语言版本,其服务包括搜索引擎、电邮、新闻等,业务遍及索引擎、电邮、新闻等,业务遍及2424个国家和地区,为全个国家和地区,为全球超过球超过5 5亿的独立用户提供多元化的网络服务。同时也是是亿的
29、独立用户提供多元化的网络服务。同时也是是一家全球性的因特网通讯、商贸及媒体公司。其中雅虎中一家全球性的因特网通讯、商贸及媒体公司。其中雅虎中国网站国网站()()于于19991999年年9 9月正式开通,它是雅月正式开通,它是雅虎在全球的第虎在全球的第2020个网站。个网站。雅虎中国网站雅虎中国网站()()为用户提供了强大的搜为用户提供了强大的搜索功能,通过其索功能,通过其1414类简单易用、手工分类的简体中文网站类简单易用、手工分类的简体中文网站目录及强大的搜索引擎,用户可以轻松搜索到政治、经济、目录及强大的搜索引擎,用户可以轻松搜索到政治、经济、文化、科技、房地产、教育、艺术、娱乐、体育等各
30、方面文化、科技、房地产、教育、艺术、娱乐、体育等各方面的信息。的信息。62可编辑版雅虎雅虎 Yahoo!Yahoo!63可编辑版AllTheWeb64可编辑版AllTheWeb新浪科技讯新浪科技讯 北京时间北京时间20112011年年3 3月月1919日早间消息,雅虎今日宣布,将于日早间消息,雅虎今日宣布,将于4 4月月4 4日关日关闭旗下搜索引擎闭旗下搜索引擎AllTheWebAllTheWeb。AllTheWebAllTheWeb是雅虎是雅虎20032003年从年从OvertureOverture收购的。这是去年收购的。这是去年1212月以来第二个遭月以来第二个遭此命运的雅虎旗下网站。上个
31、月,雅虎宣布将于此命运的雅虎旗下网站。上个月,雅虎宣布将于5 5月月2424日关闭博客社交网站日关闭博客社交网站MyBlogLogMyBlogLog。社交书签网站。社交书签网站DeliciousDelicious也在关闭名单之列,周四有消息人士透也在关闭名单之列,周四有消息人士透露,雅虎计划以露,雅虎计划以100100万至万至200200万美元的价格将其出售。万美元的价格将其出售。雅虎还从雅虎还从OvertureOverture交易中获得了搜索引擎交易中获得了搜索引擎AltaVistaAltaVista,该网站在去年,该网站在去年1212月月登上了关闭名单,但雅虎尚未公布关闭这项服务的具体日期
32、。登上了关闭名单,但雅虎尚未公布关闭这项服务的具体日期。65可编辑版AltaVista AltavistaAltavista是全球最知名的网上搜寻引擎公司之一,同时提供搜寻引擎是全球最知名的网上搜寻引擎公司之一,同时提供搜寻引擎后台技术支持等相关产品。后台技术支持等相关产品。“AltaVista”“AltaVista”这名称代表这名称代表“从高处望下从高处望下”,它于,它于19951995年由迪吉多公年由迪吉多公司(司(Digital Equipment CorporationDigital Equipment Corporation)创立。)创立。AltaVistaAltaVista是功能全
33、面的是功能全面的搜索引擎,曾经名噪一时,但现在其地位已被搜索引擎,曾经名噪一时,但现在其地位已被GoogleGoogle取代。即便如此,取代。即便如此,它仍被认为是功能最完善,搜索精度较高的全文搜索引擎之一。它仍被认为是功能最完善,搜索精度较高的全文搜索引擎之一。AltaVistaAltaVista提供常规搜索、高级搜索和主题搜索,主题包括图象提供常规搜索、高级搜索和主题搜索,主题包括图象(ImagesImages)、)、MP3/Audio&VideoMP3/Audio&Video等。等。主页显示主页显示LookSmart LookSmart 的索引目录并提供的索引目录并提供LookSmart
34、LookSmart注册。高级搜索提供注册。高级搜索提供用户以日期、语种、布尔逻辑和近似条件搜索。常规及高级搜索均允许用户以日期、语种、布尔逻辑和近似条件搜索。常规及高级搜索均允许针对针对TitleTitle、URLURL或特定的域名进行检索。或特定的域名进行检索。用户还可以在定制的搜索条件(包括用户还可以在定制的搜索条件(包括TitleTitle、URL URL、HostHost、LinksLinks(如(如anchoranchor、appletapplet、imageimage和和texttext)等)输入框中填入文字,以此为条件)等)输入框中填入文字,以此为条件进行搜索。进行搜索。允许以允
35、许以2525种不同的语言进行搜索,并提供英、法、德、意、种不同的语言进行搜索,并提供英、法、德、意、葡萄牙、西班牙语双向翻译。其他特色服务包括重大新闻(发生于葡萄牙、西班牙语双向翻译。其他特色服务包括重大新闻(发生于6 6小小时至时至1414天之间),新闻组及购物查询。天之间),新闻组及购物查询。66可编辑版67可编辑版Lycos LycosLycos是搜索引擎中的元老,是最早提供信息搜索服务的网站之一,是搜索引擎中的元老,是最早提供信息搜索服务的网站之一,20002000年被西班牙网络集团年被西班牙网络集团Terra Lycos NetworkTerra Lycos Network以以125
36、125亿美元收归旗亿美元收归旗下。下。LycosLycos整合了搜索数据库、在线服务和其他互联网工具,提供网整合了搜索数据库、在线服务和其他互联网工具,提供网站评论、图象及包括站评论、图象及包括MP3MP3在内的压缩音频文件下载链接等等。在内的压缩音频文件下载链接等等。LycosLycos是目前最大的西班牙语门户网络。是目前最大的西班牙语门户网络。提供常规及高级搜索。高级搜索提供常规及高级搜索。高级搜索提供多种选择定制搜索条件,并允许针对网页标题、地址进行检索。提供多种选择定制搜索条件,并允许针对网页标题、地址进行检索。具有多语言搜索功能,共有具有多语言搜索功能,共有2525种语言供选择。首页
37、下部显示部分种语言供选择。首页下部显示部分Open DirectoryOpen Directory的目录索引。的目录索引。和其他互联网工具,提供网站评论、和其他互联网工具,提供网站评论、图象及包括图象及包括MP3MP3在内的压缩音频文件下载链接等等。在内的压缩音频文件下载链接等等。LycosLycos是目前最是目前最大的西班牙语门户网络。大的西班牙语门户网络。68可编辑版69可编辑版3.2.4 专业性搜索引擎专业性搜索引擎专业搜索引擎也称为专业垂直搜索引擎,是指应专业搜索引擎也称为专业垂直搜索引擎,是指应用于搜索某一学科领域或某一类信息(如图像、用于搜索某一学科领域或某一类信息(如图像、影像)
38、的专业垂直搜索引擎,是搜索引擎的细分影像)的专业垂直搜索引擎,是搜索引擎的细分和延伸,是专为查询某一学科或主题的信息而产和延伸,是专为查询某一学科或主题的信息而产生的查询工具,是相对综合搜索引擎的信息量大生的查询工具,是相对综合搜索引擎的信息量大查询不准确、深度不够等提出来的新的搜索引擎查询不准确、深度不够等提出来的新的搜索引擎服务模式。服务模式。Scirus GoogleScholar70可编辑版ScirusScirusScirus(Http:/Http:/)ScirusScirus科学搜索引擎由爱思唯尔科学公司科学搜索引擎由爱思唯尔科学公司ElsevierScienceElsevierSc
39、ience)于)于20012001年年4 4月月1 1日推出。日推出。ScirusScirus是专为搜是专为搜索高度相关的科学信息而设计的搜索引擎。在起始阶段,索高度相关的科学信息而设计的搜索引擎。在起始阶段,ScirusScirus涵盖了涵盖了ElsevierElsevier公司自己的信息数据库如公司自己的信息数据库如“科学指科学指南南”(ScienceDirectScienceDirect)、)、“生物医疗网络生物医疗网络”(BioMedNetBioMedNet)和)和“化学网络化学网络”(ChemwebChemweb)等,以及网)等,以及网上免费提供的科学信息。随后,上免费提供的科学信息
40、。随后,ElsevierElsevier公司又与其它提公司又与其它提供科学信息的公司进行接触,邀请它们将其所有的数据库供科学信息的公司进行接触,邀请它们将其所有的数据库纳入纳入ScirusScirus可以搜索到的范围之内,从而使可以搜索到的范围之内,从而使ScirusScirus能够精能够精确地找到普通搜索引擎所找不到的免费或者访问受限的科确地找到普通搜索引擎所找不到的免费或者访问受限的科学信息资源。学信息资源。71可编辑版Scirus 72可编辑版73可编辑版Google ScholarGoogle ScholarGoogle Scholar(Http:/Http:/)2004 2004年年
41、1111月月1818日,日,GoogleGoogle公司宣布针对科学家和研究人员推公司宣布针对科学家和研究人员推出新的搜索服务出新的搜索服务Google ScholarGoogle Scholar。这是。这是GoogleGoogle和众多科学研究和众多科学研究机构合作的结果。比如机构合作的结果。比如ACMACM、IEEEIEEE以及联机计算机图书中心等以及联机计算机图书中心等机构。机构。Google ScholarGoogle Scholar的服务对象主要是科学家和各类从事学的服务对象主要是科学家和各类从事学术研究的人士。其搜索的范围涵盖几乎所有知识领域的高质量术研究的人士。其搜索的范围涵盖几
42、乎所有知识领域的高质量学术研究资料,包括论文、专业书籍以及技术报告等。一方面学术研究资料,包括论文、专业书籍以及技术报告等。一方面它过滤了普通网络搜索引擎中大量对学术人士无用的信息,另它过滤了普通网络搜索引擎中大量对学术人士无用的信息,另一方面一方面GoogleGoogle与众多学术文献出版商等合作,加入了许多普通与众多学术文献出版商等合作,加入了许多普通搜索引擎无法搜索到的加密内容,并要求合作者至少免费提供搜索引擎无法搜索到的加密内容,并要求合作者至少免费提供文献的文摘。文献的文摘。74可编辑版75可编辑版76可编辑版77可编辑版78可编辑版3.3 网络开放存取资源网络开放存取资源 3.3.
43、13.3.1开放存取概述开放存取概述3.3.23.3.2代表性网络开放存取资源简介代表性网络开放存取资源简介3.3.33.3.3网络开放资源的获取策略网络开放资源的获取策略 79可编辑版3.3.1开放存取概述1.开放存取概念开放存取概念目前,被广泛引用的是布达佩斯开放存取计划目前,被广泛引用的是布达佩斯开放存取计划(Budapest Open Access InitiativeBudapest Open Access Initiative,简称,简称BOAIBOAI)对开放存取给出的定义,开放存取是指某文献在对开放存取给出的定义,开放存取是指某文献在InternetInternet公共领域里可
44、以被免费获取,允许任何用户公共领域里可以被免费获取,允许任何用户阅读、下载、拷贝、传递、打印、检索、超级链接该阅读、下载、拷贝、传递、打印、检索、超级链接该文献,并为之建立索引,用作软件的输入数据或其他文献,并为之建立索引,用作软件的输入数据或其他任何合法用途。用户在使用该文献时不受财力、法律任何合法用途。用户在使用该文献时不受财力、法律或技术的限制,而只需在存取时保持文献的完整性。或技术的限制,而只需在存取时保持文献的完整性。80可编辑版2.开放存取的特征开放存取的特征(1 1)开放存取资源的多样性。)开放存取资源的多样性。(2 2)获取途径的开放性和多样化。)获取途径的开放性和多样化。(3
45、 3)资源使用的无限性。)资源使用的无限性。(4 4)学术交流的高效性。)学术交流的高效性。(5 5)资源利用的大众化。)资源利用的大众化。(6 6)存储空间小。)存储空间小。81可编辑版3.开放存取的资源类型(1 1)开放存取期刊)开放存取期刊(Open Access Journals)(Open Access Journals)。(2 2)机构资源库)机构资源库(Institutional Repositories)(Institutional Repositories)。(3 3)学科资源库)学科资源库(Disciplinary Repositories)(Disciplinary Re
46、positories)。(4 4)个人)个人WEBWEB站点站点(Personal Web Sites)(Personal Web Sites)。(5 5)博客)博客(Blog)(Blog)。(6 6)维基)维基(Wiki)(Wiki)。(7 7)邮件列表服务)邮件列表服务(List Servs)(List Servs)。82可编辑版3.3.2代表性网络开放存取资源简介代表性网络开放存取资源简介 1.公共领域资源公共领域资源版权保护期限之后的作品则进入版权保护期限之后的作品则进入“公共领域公共领域”。此时。此时的作品将注明的作品将注明inin(或(或underunder)public doma
47、inpublic domain,也就是,也就是表示作品的权利已经赋予全人类共同拥有,比如四大表示作品的权利已经赋予全人类共同拥有,比如四大名著、诗经、史记等。名著、诗经、史记等。目前,进入公共领域的开放存取资源主要有古登堡计目前,进入公共领域的开放存取资源主要有古登堡计划(划(Project GutenbergProject Gutenberg)、在线图书网页()、在线图书网页(The The Online Books PageOnline Books Page)、开放站点)、开放站点开放百科全书开放百科全书计划(计划(Open SiteThe Open Encyclopedia Open S
48、iteThe Open Encyclopedia ProjectProject)等。等。83可编辑版古登堡计划(古登堡计划(Project Gutenberg)(http:/www.gutenberg.org/)它是一个基于互联网的以自由和电子化的形式,大量它是一个基于互联网的以自由和电子化的形式,大量提供版权过期而进入公有领域书籍的一项协作计划。提供版权过期而进入公有领域书籍的一项协作计划。84可编辑版在线图书网页(在线图书网页(The Online Books Page)(http:/digital.library.upenn.edu/books/)它是由它是由John Mark Ocke
49、rbloomJohn Mark Ockerbloom创建于创建于19931993年的美国宾年的美国宾州大学数字图书馆,是目前全球最大的免费在线图书州大学数字图书馆,是目前全球最大的免费在线图书资源。资源。85可编辑版2.开放学术资源开放学术资源(1 1)开放存取图书。它包括出版商提供的开放图书、数字图书馆)开放存取图书。它包括出版商提供的开放图书、数字图书馆提供的开放图书、个人或团体网站提供的开放图书和内容开放百提供的开放图书、个人或团体网站提供的开放图书和内容开放百科全书等。科全书等。出版商出版商OreillyOreilly(http:/ the MediaWe the Media。一部分的
50、图书版权是基于创作共用协议(。一部分的图书版权是基于创作共用协议(Creative CommonsCreative Commons)的。)的。读书公园(读书公园(http:/ 7月开放,致月开放,致力于收集和整理互联网上的免费电子书信息。用户可以自由地使力于收集和整理互联网上的免费电子书信息。用户可以自由地使用它搜索、添加和发布电子书信息。用它搜索、添加和发布电子书信息。维基百科。它是一个国际性的内容开放百科全书协作计划。维基百科。它是一个国际性的内容开放百科全书协作计划。86可编辑版2.开放学术资源开放学术资源(2 2)开放存取期刊。包括学术出版社提供的开放存取期刊、)开放存取期刊。包括学术