1、环境污染调查与治理 系院: 美术学院 专业: 美术学 学号: 201212010513 姓名: 王海苹 前言 目前为中国自然科学核心期刊和中国科学技术期刊文摘数据库(CSTA)刊源。 本刊内容包括环境污染防治技术、环境监测和分析方法、资源综合利用、清洁生产、环境规划和预测、环保政策法规、环境管理、及企业污染治理等方面的学术研究、综述、专论
2、调查报告和经验介绍等。介绍最新的环境保护设备和仪器,报道国内外环境保护动态。 城市环境问题被提出并且受到公众广泛的关注,绝不是偶然的现象,有着深刻的时代背景。那就是全球生态危机日益严重:热带雨林的大量砍伐、生物物种消亡迅速、雨的大肆扩撒、臭氧层的不断扩大、温室效益的气体逐渐增加、海平面的日渐上升等。维护生态平衡成为当前最热门的话题。 本文主要是为读者获得同一专题研究资料指明途径,所以注重于检索工具的利用与比较,所以分析评价检索结果的能力,从中选取部分作为推荐工具,故检索结果只作简要显示。 目录 1.网络期刊学术论文……………
3、…………………………………(4) 1.1 中国知网………………………………………………………(4) 1.2全国报刊索引………………………………………………(7) 1.3万方数据……………………………………………………(8) 1.4维普资讯……………………………………………………(10) 2.网络书目…………………………………………………………(10) 2.1书目数据库……………………………………………………(11) 2.1.1中国国家图书馆………………………………………(11) 2.1.2北京大学图书馆………………………………………(11) 2.1.3临沂大学图书馆…
4、………………………………………(14) 2.1.4 中国科技园国家科学图书馆……………………………(17) 2.2数字图书馆……………………………………………………(19) 2.2.1超星数字图书馆…………………………………………(19) 2.2.2书生之家数字图书馆……………………………………(19) 2.2.3Apabi数字资源平台…………………………………(19) 2.2.4 外文数字图书馆……………………………………(20) 2.3网上书店………………………………………………………(20) 2.3.1京东网上书店…………………………………………..(20) 2
5、3.2当当网上书店……………………………………………(21) 2.3.3北图大厦 …………………………………………(22) 2.4网上出版社 ……………………………………………….(23) 2.4.1商务印书馆 ………………………………………(23) 2.4.2高等教育出版社 …………………………………….(23) 3.搜索引擎……………………………………………………………(24) 3.1目录式搜索引擎 ……………………………………………..(24) 3.1百度…………………………………………………………(24) 3.2搜狐........................
6、26) 3.2.3Google.................................................(28) 3.3元搜索引擎............................................. (29) 3.3.1 metaCrawler.................................................(29) 3.3.2MateFisher中文元搜索引擎..............................(29) 后记……………………………
7、…………………………………(32) 1. 网络期刊学术论文 1.1中文期刊全文数据库 《中文科技期刊数据库》源于重庆维普资讯有限公司1989年创建的《中文科技期刊篇名数据库》,其全文和题录文摘版一一对应,经过13年的推广使用和完善。全文版的推出受到国内广泛赞誉,同时成为国内各省市高校文献保障系统的重要组成部分。 《中文科技期刊数据库》涵盖自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等学科的8000余种中文期刊数据资源,包含了1989年至今的8000余种期刊刊载的1370余万篇文献,并以每年150万篇的速度递,且全面解决了文摘版收录量巨大但索取原文
8、繁琐的问题 该库是目前世界上最大的连续动态更新的中国期刊全文数据库,收录中国国内8200多种综合期刊与专业特色期刊的全文,以学术、技术、政策指导、高等科普及教育类为主,同时收录部分基础教育、大众科普、大众文化和文艺作品类刊物,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域,全文文献总量2200多万篇。分为十大专辑(如图示)十专辑下分为168个专题和近3600个子栏目。收录年限为1994年至今(部分刊物回溯至创刊),产品形式:WEB版(网上包库)、镜像站版、光盘版、流量计费。更新频率:CNKI中心网站及数据库交换服务中心每日更新5000~7000篇,各镜像站点通过互联网
9、或卫星传送数据可实现每日更新,专辑光盘每月更新,专题光盘年度更新。 在检索导航中,选择查询范围为教育与社会科学综合和经济与管理,在检索页面中的检索项中选择篇名(下拉菜单中有篇名、作者、关键词等字段可选),输入检索词企业竞争*竞争情报,从1980到2009年,范围为核心期刊,点击“模糊匹配”。 如图一 此检索有 高级检索 在高级检索中选择提名,输入“环境污染”并含“治理”,如图所示 打开一项看详情 从检索过程可以看出:1.本数据库有初级检索,高级检索,专业检索,期刊导航,专辑导航和检索导航,能满足不同用户的需要
10、就本题而言,其中专辑导航可以缩小范围,以便更精确的查找2.在检索结果中显示不同的文献链接及数量(如图),有参考文献(3篇),引证文献(7篇)等,可以帮助用户了解更多相关的信息3.从检索的结果及数量看,学术、高等科普为主,体现了本库的特点 1.2全国报刊索引 《全国报刊索引》月刊,前身是1951年4月由山东省图书馆编印的《全国主要资料索引》。1955年3月改由上海图书馆编辑出版,1956年更名为《全国主要报刊资料索引》并在内容上开始增加了报纸的部分。在1966年10月至1973年9月停刊,1973年10月复刊,并改为现名《全国报刊索引》。1980年分为“哲学社会科学版”(ISSN100
11、5-6696)与“自然科学技术版” (ISSN1005-670X)两种,分别按月出版。1981年起增收该馆收藏的内部刊物,使之成为检索公开发行及一部分内部发行刊物所载论文资料的重要检索工具。 《全国报刊索引》,由上海图书馆《全国报刊索引》编辑部负责编辑和研制,每年收录全国社科、科技期刊6,000多种,报纸200余种,基本覆盖全国邮发和非邮发的报刊。内容涉及哲学、社会科学、科学与技术方面的各个学科。条目收录采取核心期刊全收、非核心期刊选收的原则,现年更新量约50余万条,为目前国内特大型文献数据库之一。 收录全国包括港台地区的期刊8000种左右,月报道量在1.8万条以上,年报道量在44万条左右
12、书本式用户有3500多家,现又出版光盘数据库。反映了中国政治、经济、军事、科学、文化、文学艺术、历史地理、科技等方面的发展情况,提供了国内外最新学术进展信息。该索引是我国收录报刊种类最多,内容涉及范围最广,持续出版时间最长,与新文献保持同步发展的权威性检索刊物,也是查找建国以来报刊论文资料最重要的检索工具。 检索的文献资源丰富,高级检索和普通检索可以根据情况检索。 1.3万方数据 万方数据股份有限公司成立于2000年,是由中国科技信息研究所以万方数据(集团)公司为基础,联合山西漳泽电力股份有限公司、北京知金科技投资有限公司、四川省科技信息研究所和科技文献出版社发起组建的高新
13、技术股份有限公司。 万方数据股份有限公司是国内首批以信息服务为 核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。 万方数据对检索结果的归类情况做的比较好,按论文类型、年份、期刊类型分类,检索结果来源于《情报杂志》 《情报学报》 《情报理论与实践》 等期刊,这些都是图书情报界的知名期刊。摘取结果其中4篇如下 1.4 维普资讯 维普资讯是科学技术部西南信息中心下属的一家大型的专业化数据公司,是中文期刊数据库建设事业的奠基人,公司全称重庆维普资讯有限公司。目前已经成为中国最大的综合文献数据库。从1989
14、年开始,一直致力于对海量的报刊数据进行科学严谨的研究、分析,采集、加工等深层次开发和推广应用。 自1993年成立以来,公司的业务范围已涉及数据库出版发行、知识网络传播、期刊分销、电子期刊制作发行、网络广告、文献资料数字化工程以及基于电子信息资源的多种个性化服务。维普资讯始终坚持以数据加工技术为核心,以市场为导向,研制开发出近十种产品,广泛应用于信息相关领域,获得了用户的一致好评。其中多项产品和技术得到了国家有关部门的重大奖励。其研究开发的《中国科技期刊数据库》是国内最大的综合性文献数据库,赢得了国内图书情报界的高度赞誉,同时成为国内各省市高校文献保障系统的重要组成部分。 从
15、结果看,该库查准率和查全率都较高,响应时间也比较快 2. 网络书目 2.1书目数据库 2.1.1中国国家图书馆 馆藏丰富,包含了多个数据库,分为外文文献数据总库和中文及特藏数据库,前者涵盖了外文联合国资料库、外文工具书、西文图书库等5个库,后者涵盖了学位论文总库、中文报纸库、中文期刊库、海外中文图书库、缩微文献库等11个大库和其下多个子库。 选择中文数据库,检索项为题名,检索式:环境污让调查与治理,检索到23个结果(图略) 国家图书馆主持编制了《中国国家书目》、《民国时期总书目》和《中国古籍善本书目》等30余种书目,建立起全面反映国家图书馆馆藏的书本式目录体系。随着国家图书馆
16、自动化系统的建立,各种书目数据库和各类专题数据库正 在逐步兴建和完善。国家图书馆联合国内诸家图书馆完成的《中国国家书目回溯数据库(1949-1987)》,与国家图书馆编制发行的《中国国家图书数据库(1988年起)》构成一个规模最大、覆盖面最广的中国国家书目数据库。联合编目中心面向全国提供中文机读书目数据,参加成员馆已达806家(截止2003年6月底),形成了加工、制作、发行一体化的书目数据中心。 2.1.2北京大学图书馆 北京大学图书馆建立于1899年,最初名为京师大学堂藏书楼,是中国近代第一所国立大学北京大学图书馆形成了种类丰富、学科齐全、珍品荟萃的馆藏体系。到2011年底,总、
17、分馆文献资源累积量约1,100余万册(件)。其中纸质藏书800余万册,各类数据库、电子期刊、电子图书和多媒体资源约300余万册(件)。馆藏中以150万册中文古籍为世界瞩目,其中20万册为5至18世纪的珍贵书籍,是中华民族的文化瑰宝。此外,外文善本、金石拓片、1949年前出版物的收藏均名列国内图书馆前茅,为研究家所珍视。近年来大量引进的国内外数字资源,包括各类数据库、电子期刊、电子图书和学位论文在内已达到数十万种,深受读者欢迎 与国外500多个图书馆、学校、研究机构保持着固定的资料交换和馆际互借关系。OPAC查询系统可以检索图书馆馆藏书目,书目数据包括一九八五年以后的大部分及一九九零年以来的
18、全部馆藏图书、期刊数据和部分分馆的馆藏书目信息。OPAC检索主要供公共用户使用,具有用户界面友好、采用中文切分机制等特点。其另一特点是提供有关键词清单帮助,有二次检索功能。 高级检索如图 2.1.3清华大学图书馆 以自然科学和工程技术科学文献为主体,兼有人文、社会科学及管理科学文献的多种类型、多种载体的综合性馆藏体系。到2004年底,清华大学图书馆总馆馆藏书刊已超过300万册,连同分馆,馆藏总量已达340万册。除中外文图书外,馆藏资源还包括:线装古籍书近30万册;期刊合订本38万余册;本校博、硕士论文2万多篇;缩微资料7万余件;各类数据库二百多种等。该网站的查
19、阅检索帮助编制得十分专业详细。 检索项为关键字,检索式:环境污染and治理,全部馆藏,找到256条记录,排序依据为相关度排列,图略。 相关度次高的馆藏6—11条记录(略),相关馆藏12---12条记录(略),有一定相关度的馆藏13---25条记录(略)。相比而言,清华大学图书馆的相关度排序方法最好用,可以帮助用户查找到比较精确的信息,提高查准率。从北京大学和清华大学图书馆的检索情况看,清华大学图书馆比较好。 2.1.3临沂大学图书馆 临沂大学图书馆由分布在新校区、北校区的馆舍以及各系院资料室组成。 馆舍面积达到3.45万平方米,馆藏纸质图书375.71万册,中外文数据库18
20、个,电子图书265.25万册,现刊3500余种,数字存储容量达到42TB;地方文献7000余册。管理服务硬软件条件齐备,在新闻采访、编目、典藏、借书、阅览、检索、信息咨询、数据下载、统计等方面,全部实现了系统化管理。新校区图书馆总建筑面积6.5万平方米,可收藏纸质图书600万册,能够满足5万师生以及广大市民阅读、学习使用,是目前山东省高校最大的图书馆。 目前,现有计算机网络PC SEVER服务器22台,各类计算机613台件,交换机端口760个,数字存储容量25TB。宽带接入已经独享100兆带宽,馆内局域网使用国内最先进的《汇文图书馆信息管理系统》,构建了采访、编目、典藏、借还、阅览、委托借阅
21、期刊、统计、查询、流通管理、系统管理11个子系统。利用“校园卡”对多校区各个电子阅览室进行管理。使用《TPI信息资源建设与管理系统》,实现了对文本、图像、音频、视频等各种类型资源的统一管理。数字资源采集、加工、异构统一检索平台及智能化的数字参考咨询系统已成雏形 在简单检索界面中,输入检索词环境治理,文献类型为所有期刊,检索类型为题名,检索模式为任意匹配,馆藏地为全部,结果排序方式以:入藏日期(下拉菜单中有题名,责任者,索书号等)降序,但是没有相关度,即不能按相关度排序,这点不是很好。检索到13条结果,如下图所示。 查看一项更详细的内容 由于是本校的资源,可以方
22、便的借阅,故从图书馆借了《环境治理完全指南》和《环境治理应用战略》,个人认为可以先阅读前者,然后再看后者,这样有了一定的理论基础和对有关的专业术语有一定的了解,才能看懂并深刻理解《环境治理应用战略》中所提供的案例,也对竞争情报在世界知名企业的应用和所起到的重要作用有所认识;也可以两者结合着看,边了解专业的知识边结合后者的案例。从而达到对环境治理在全球经济一体化中对提升企业的竞争能力,和对企业生存和发展的作用更深层次的体会。 2.1.4 中国科学院国家科学图书馆 中国科学院国家科学图书馆是支撑我国科技自主创新、服务国家创新体系、促进科学文化传播的国家级科技文献情报机构,主要为自然科学、交
23、叉科学和高技术领域的科技自主创新提供文献信息保障、战略情报研究服务、公共信息服务平台支撑和科学交流与传播服务,同时通过国家科技文献平台和开展共建共享来支持国家创新体系其他领域的信息需求。 检索项为题名,检索式为 企业竞争情报,共搜索到4条记录,将检索式改为“环境污染调查 治理”,搜索到22条记录(图部分如下) 结果页面上有问图书馆员、图标说明、常见问题、错误报告等,可方便用户的使用,而且,本馆主要为自然学科,交叉学科等提供文献信息保障,而本题属于交叉学科,符合本题的检索使用。 2.2数字图书馆 2.2.1超星数字图书馆 超星数字图书馆成立于1993年,是国内专业的数字图书馆解
24、决方案提供商和数字图书资源供应商。超星数字图书馆,是国家“863”计划中国数字图书馆示范工程项目, 2000年1月,在互联网上正式开通。它由北京世纪超星信息技术发展有限责任公司投资兴建,目前拥有数字图书八十多万种。 丰富的电子图书资源提供阅读,其中包括文学、经济、计算机等五十余大类,数百万册电子图书,500 万篇论文,全文总量 10亿余页,数据总量1000000GB,大量免费电子图书,并且每天仍在不断的增加与更新。为目前世界最大的中文在线数字图书馆; 超星数字图书馆()成立于1993年,是国内专业的数字图书馆解决方案提供商和数字图书资源供应商。是国家“863”计划中国数字图书馆示范工程项目
25、2000年1月,在互联网上正式开通。它由北京世纪超星信息技术发展有限责任公司投资兴建,设文学、历史、法律、军事、经济、科学、医药、工程、建筑、交通、计算机和环保等几十个分馆,目前拥有数字图书十多万种。包括51个学科分类,涉及哲学、宗教、社科总论、经典理论、民族学、经济学、自然科学总论、计算机等各个学科门类。收录年限:1977年至今。 2.2.2书生之家数字图书馆 书生之家数字图书馆是建立在中国信息资源平台基础之上的综合性数字图书馆,由北京书生公司开发制作。电子图书设有四级目录导航,并提供强大全文检索功能。书生之家现有近30万种电子图书,每年以6、7万种的数量递增。“书生之家”
26、所收图书涉及社会科学、人文科学、自然科学和工程技术等所有类别。检索方法有图书全文检索.组合检索,高级全文检索和分类检索,以收录99年以后出版的图书为主。 2.2.3Apabi数字资源平台 方正Apabi数字图书系统由北大方正电子有限公司制作,收录了全国400多家出版社出版的最新中文图书,绝大部分为2000年以后出版的,并与纸质图书同步出版。方正电子图书为全文电子化的图书,可输入任意知识点或全文中的任意单词进行检索,支持词典功能;也可在页面上进行添加书签、划线等多种操作,内容涵盖广泛,检索、阅读方便快捷。涵盖了社会学、哲学、宗教、历史、经济管理、文学、艺术、数学、化学、地理、生物、航空、
27、军事等多个领域。本馆目前订购了10万册方正电子图书。 使用“快速检索”方法,在“方正Apabi数字图书”主页上的输入窗直接输入检索词“环境污染调查与治理”,检索项为书名,默认在所有文档检索,由于其中文图书绝大部分是2000年以后出版的,故只有1条结果,查看方式为图文(还可选为列表,缩略图),为2004年出版的,版次比较新 2.2.4 外文数字图书馆 首页上有热门图书,热门视频,热门外文,可帮用户了解最新的动态,输入检索词“”,没提供检索字段,查询到7个资源(显示在所有结果的后面,如果结果比较多的话,用户要一直看完后才能知道结果的数量,故不是很好),其中2个资源如下: 而且结果的显示
28、方式不是很好,总体来说,该数字图书馆的优点不是很多 2.3网上书店 2.3.1 京东网上书店 京东商城拥有遍及全国超过6000万注册用户,近万家供应商,在线销售家电、数码通讯、电脑、家居百货、服装服饰、母婴、图书、食品等12大类数万个品牌百万种优质商品,日订单处理量超过50万单,网站日均PV超过1亿。2010年,京东商城跃升为中国首家规模超过百亿的网络零售企业。 京东商城(iPhone版)是专为iPhone、iPod touch用户推出的一款移动购物软件,具有商品浏览、商品购买、在线支付、订单速查、手机晒单、产品评价等功能,为用户打造便利的移动购物体验。 2.3.2当当网
29、上书店 当当网是中国最大的在线图书零售商,已有十多年历史。一位投行消息人士称,当当网的估值高达10亿美元。而在2011年,该网站仅盈利500万美元。这意味着200倍的收益。 但是,该公司核心业务——图书销售的增长正在放缓,2011年增长率为60%。电子产品、亚麻制品、拖鞋、家居饰品、奶粉等新销售业务则增长迅速,2011年增长率超过230%。然而,这些新领域在整体业务中所占比重很小。此外,当当网仅擅长图书销售,在竞争激烈的其他领域未必具有优势 检索式为“环境污染调查and 治理”,点击“在图书中搜索”,搜到42条结果,显示有结果的分类数量,如管理(28),社会科学
30、4),计算机/网络(4)等,可以查看各个分类的图书情况,排列方式为“按销量”降序,这样可以让读者了解到畅销的书,相对来说,价值量也比较高,也符合网上书店的经营模式,摘取其中一个结果如下: 摘取一项结果 图书显示信息中,有顾客评分,可以看到顾客对此的评价和满意度,也能反映出此书的受欢迎程度。在显示结果的页面左下部有一个小栏目—小调查,如果对搜索结果不满意,可以选择在使用过程中遇到的问题,还可提出具体的建议。有助于该网站了解用户对网站的使用情况,以便于向更好的方向改进和更好的服务于读者,同时也有利于该网站的发展。 2.3.3北图大厦 北京图书大厦网上书店()于一九九九年三月九
31、日开通。她依托北京图书大厦实行国内版全品种和国外版图书经营的品种实力,云集了全国500多家出版单位出版的30多万种图书、音像制品和电子出版物,充分展示了我国出版发行风貌。并且拥有安全、快捷的网上支付方式。 检索字段为关键词,没有可供选择的其他的检索字段,输入检索词“企业竞争 竞争情报”,检索页面上有一个检索说明—递进搜索器,可以在检索过程中递进搜索,一直精确到满意为止,并提供了方法。检索结果为3条(略),从显示的结果看,与要找的有一定的相关度,没显示排序方式。 从上述检索过程中,当当网上书店比北图大厦在图书书目的数量,检索结果的显示,对客户的服务及网上购书方面好。 2.4网上
32、出版社 2.4.1商务印书馆 商务印书馆()主页的链接太多,而且网页两边都有链接会随着滚动条移动,给人的感觉太繁琐了,在导航栏里点击图书,然后输入检索词“竞争情报”,返回结果为0条。 2.4.2高等教育出版社 输入检索词“竞争情报”,返回结果为0条。 3. 搜索引擎 3.1目录式搜索引擎 以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站。提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高。缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。 搜索引擎是指
33、根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。百度和谷歌等是搜索引擎的代表。 3.1百度 百度是目前全球最优秀的中文信息检索与传递技术供应商,中国所有提供搜索引擎的门户网站中,超过80%以上都由百度提供搜索引擎技术支持,百度搜索引擎使用了高性能的“网络蜘蛛”程序自动的在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息,百度搜索引擎拥有
34、目前世界上最大的中文信息库,总量超过8亿页以上,并且还在以每天几十万页的速度快速增长。 百度(Nasdaq简称:BIDU)是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。 检索词要求准确,支持截词检索,支持布尔:与:只需用空格;非:“-”或:“/”,提供相关检索,支持搜索位置的限定:Site+空格+关键词,表示只搜索某个具体的网站或某域名内的网页;intitle:+关键词,限定只搜索网页标题中;In
35、url:+关键词,限定检索范围在url中。限制检索:限制时间、语言、地区、关键词位置等。 在百度上进行检索,检索词要求准确,支持截词检索,支持布尔检索:与,只需用空格;非有“—”,或用“/”,提供相关检索。 输入件检索词“环境污染”,找到相关网页约89000000篇 输入件检索词“环境污染与治理”,找到相关网页约9500000篇 3.2搜狐 搜狐(NASDAQ:SOHU)旗下子公司,由搜狐与阿里巴巴(HK:01688)合资成立,中国互联网土创新的典范,旗下拥有国内用户量最大的搜狗输入法等客户端产品,是国内仅有的兼具客户端和搜索核心研发能力的互联网公司。围绕输入法、
36、浏览器和搜索这三大互联网最基础的应用,搜狗凭借具有前瞻性的技术趋势把握和敏锐的市场嗅觉,已完成了初步整合,成为中文互联网领域最具发展潜力的公司之一。 搜狐是以提供分类目录为主的中文搜索引擎,它的信息抓取范围较其它中文搜索引擎要广,不仅有国内站点,还包括国外的中文站点,日访问率达上万人次。搜狐还提供了许多高质量的内容服务,如“新闻导读”、“娱乐天地”、“企业集锦”等服务项目,搜狐数据库中收录了200万个网页。 检索要有基本检索和高级检索,支持布尔逻辑,用逻辑符号“ADN”或“OR”连接起来,使用括号,指定括号内的表达式为一个整体单元。 输入检索词“环境污染治理”,找到2834278,部分
37、结果如下: 3.1.1中文雅虎 Yahoo中文搜索引擎收录了全球咨询网上数以万计的中文网址,以14个类别排列,针对中文的目前状况,分别设立了简体中文(GB)和繁体中文(BIG5)两种版本,Yahoo由人工索引的分类数据库也保持了库内数据质量较高、冗余信息较少的优点。Yahoo对收集到的信息要进行严格的审核和分类,提供按目录逐级搜索和输入关键词检索两种查检方式,支持简单和高级查询功能。 支持布尔:“AND”和“NOT”检索,使用引号保持检索词的完整性。检索词前面加“+”,结果一定出现检索词;检索词前面加“-”,结果一定不出现检索词;检索词前面加“t”,仅查询网站名称;检索词前面加“
38、u”,仅查询网址。 输入检索词“+环境污染调察”,找到相关网页约3,180,000条,用时0.007秒,图略。 查询结果显示格式按下列顺序排列:首先是满足条件的雅虎目录和子目录,接着是满足查询条件的网站,最后是网页。网页只显示题名、摘要和URL。查询结果排序根据分类类目、网站信息与关键字串的相关程度排列出相关的类目和网站。匹配关键词越多,相关性越高。检索词出现在题名中的文献给出一个优先的排序;出现在分类目录中的级别,按目录的级别从高到低排序。 优点是反映了人在选择和组织信息时的知识和智慧,收录网页经过筛选和系统组织,质量较高,条理性较强,检索结果接近用户的信息需求。缺点是采集信息的速
39、度远远比不上网络资源的增长,因此检索的数量有限。 3.2.2Google Google中文搜索引擎是收集亚洲网站最多的搜索引擎之一,信息采集方式是利用蜘蛛程序(Spider)以某种方法自动地在互联网中搜集和发现信息,并由索引器为搜集到的信息建立索引,从而为用户提供面向网页的全文检索服务,提供基本查询和高级搜索两种检索功能。 基本检索部分最本质的是布尔检索功能,高级检索功能包括:①可以将检索结果局限在一个网站上;②可以排除某个特定站点的网页;③可以对网页以及检索结果页面的语言类型进行限制;④可以检索链向某个网页的所有页面;⑤可以检索与某个网页相关的所有网页。检索结果显示格式包括标题、网页
40、站)简介、URL长度、附带的全新功能等相关信息,还会根据具体情况显示最新更新日期、类别等信息。检索结果按相关性从大到小排序。 输入检索式“环境污染调查与治理”,约有2,600,000项符合的查询结果,搜索用时0.32秒,图略。 检索结果显示格式包括标题、网页(站)简介、URL长度、附带的全新功能等相关信息,还会根据具体情况显示最新更新日期、类别等信息。检索结果按相关性从大到小排序。 Google中文搜索引擎技术专精,实力出众。界面很具人性化,首页设计简捷、鲜明、大方,完全突出了检索功能。操作简单易用,查询结果相关度很高。不足之处是其数据的更新速度无法进一步提高。由于数据量庞大,使G
41、oogle搜索引擎的数据更新无法早于30天,在一定程度上影响了用户对信息的时效需求。 3.3元搜索引擎 这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大。缺点是不能够充分使用原搜索引擎的功能,用户需要做更多的筛选。 3.3.1 metaCrawler 能对14个检索工具并行检索,支持布尔:与:AND/+非:NOT/-或:OR限制检索:限制时间、域名、语言等。 输入检索词“competitive intelligence”检索
42、结果如图所示: 3.3.2 MateFisher中文元搜索引擎 能并行检索5个检索工具,支持布尔:与:只需用空格,非:“-”,或:“/” 输入检索词“环境调查与治理”,metaFisher为你对3116000项检索结果进行处理,返回最匹配的46项记录,用了4秒,该搜索引擎对结果的处理比较好,帮助用户筛选出比较好的信息,排除冗余的信息,图略: 名称 检索范围 检索途径 检索方法与途径 检索结果显示 本题的检索结果 特色服务 中文雅虎 教育,娱乐,商业与经济等十四大类 分类检索 关键词检索 支持布尔:“AND”和“NOT”,加“+”,一定出现检索词;加
43、-”,一定不出现检索词;加“t”,仅查询网站名称; 检索词前面加“u”,仅查询网址 有结果数目及响应时间 找到相关网页约3,180,000条,用时0.007秒 My Yahoo! 雅虎周选 每日之星 雅虎财经等 搜狐 新闻、音乐、购物、分类网站、说吧等 分类检索 关键词检索 支持布尔:与:“&”或者用空格,非:“-”,或:“/” 使用括号,指定括号内的表达式为一个整体单元 有结果数目及响应时间 找到444,973个网页,用时0.046秒 搜狗帮助,搜狗指数 百度 新闻,网页,贴吧,mp3,图片 关键词检索 分类检索 空格默认“AND”,-(n
44、ot),|(or),网页标题:intitle,网站:site,网页url等 有结果数目及响应时间 找到相关网页约25,100篇,用时0.051秒 百度快照、自动纠错、百度搜霸 Google 网页,图片,新闻,论坛,网页目录等 关键词检索 分类检索 空格默认“AND”,-(not) 图标显示特定来源,缩进显示同一网站的不同网页。有结果数目及响应时间 约有2,600,000项符合的查询结果,搜索用时0.32秒 网页快照、相似网页、查询电话、查找PDF文件、股票报价、查找字典释意、查找地图、网页翻译、单词纠错、繁简转换 Meta- Crawler Web,Im
45、age,Video,News,Yellow Pages等 关键词检索 支持布尔:与:AND/+ 非:NOT/- 或:OR 限制检索:限制时间、域名、语言等。 有结果数,没响应时间 All Search Engines 57 MetaSpy,Get MetaCrawler—To go! Mate- Fisher中文元搜索引擎 网页 关键词检索 支持布尔:与:只需用空格,非:“-”或:“/” 有结果数目及响应时间 对3116000项检索结果进行处理,返回最匹配的46项记录,用了4秒 cooRank网页评级系统, cooWord2关键字自动分析归
46、纳法,cooSmile 搜索引擎的搜索结果不如上述数据库,数字图书馆等的相关度高,搜索引擎返回的结果比较多,其中一些为无关信息,但是搜索引擎只要上网就可以使用,而数据库和数字图书馆要购买,所以对一般用户而言,搜索引擎还是比较方便。 后记 环境污染有一半以上人类活动的结果,我们人类应该负起一定的责任。只有先保持环境,才可能走可持续发展道路,目前我国环境污染严重,形势相当严峻,我们必须认识到保护好环境是发展工业的前提,保护好环境也就是保护好我们赖以生存的地球,所以环保要从我做起,从小事做起。我们不可能说等到环境被破坏的无法治理的时候才来引起我们的注意。我们
47、要知道加强学生热爱人类家园的观念,保护大自然不受污染,是促进和推动环境保护工作的奠基性工程 这份报告对我来说是一个再学习再实践。本课题主要是查找环境污染和环境治理的,检索出来的难免或有些不和实际的,对于课题来说,属于相关度低的信息,甚至是无关和多余的信息。要从众多的检索结果中找出和本课题相关度高的文献不是一件容易的事情。 作为课程的初学者,虽然已经进行了反复修改,还是有些地方不尽如人意。在以后的学习中。一定会继续努力,争取做得更好。也希望借助本篇检索报告可以加强对公众对可持续发展和节能经济有一个更好更全面的认识。同时也能对此方面此方向有更多的了解,进而对可持续发展和节能经济有所认识。不管怎样,经过了自己的艰辛努力和劳动之后,面对这完整的最后“成品”还是稍微有些成就感的。 33






