1、1 文献信息检索的基础知识文献信息检索的基础知识2 Internet概论及网络资源检索概论及网络资源检索3 数据库及检索方法数据库及检索方法 中文数据库中文数据库 英文数据库英文数据库 中国期刊网全文数据库应用举例中国期刊网全文数据库应用举例 科技查新科技查新 概述概述 主要内容主要内容文献检索-“不仅仅提供资料信息,更重要的是提供研究的思路”检索分析发现创新“一流的科研需要一流的学术信息一流的科研需要一流的学术信息”“科学研究科学研究的过程同时也是科学信息积累与交流的过程的过程同时也是科学信息积累与交流的过程”信息检索、信息检索、分析。分析。SynthesisofAminoAcids1JAC
2、S19952JOC1987SynthesisofAminoAcids问题?创意?问题?创意?试验、计算。试验、计算。发表:口头报告、论文、发表:口头报告、论文、专利。专利。1JACS19952JOC1987SynthesisofAminoAcidsSynthesisofAminoAcids新的问题?发展、延伸。新的问题?发展、延伸。同行评价、引用、同行评价、引用、应用。应用。一、文献信息检索的基本概念一、文献信息检索的基本概念2 2、文献信息源的类型、文献信息源的类型l l按载体介质划分:按载体介质划分:印刷型、缩微型、声像型、机读型印刷型、缩微型、声像型、机读型l l按信息的加工深度和功能划
3、分:按信息的加工深度和功能划分:一次文献一次文献/信息信息 二次文献二次文献/信息信息 三次三次文献文献/信息信息l l按出版类型划分:按出版类型划分:图书(阅读类、工具类)图书(阅读类、工具类)期刊(一次文献、二次文献)期刊(一次文献、二次文献)特种文献(专利、科技报告、会议录、政特种文献(专利、科技报告、会议录、政府出版物、学位论文、标准、技术档案、府出版物、学位论文、标准、技术档案、产品目录等)产品目录等)一、文献信息检索的基本概念一、文献信息检索的基本概念1、按载体形式划分:、按载体形式划分:印刷型印刷型 Printed form以手写和印刷技术为手段以手写和印刷技术为手段,以纸张记录
4、信息的载体形式以纸张记录信息的载体形式.缩微型缩微型 Microform 以感光材料记录文字及其相关信息的载体以感光材料记录文字及其相关信息的载体.形式形式:缩微胶缩微胶卷、卷、缩微平片缩微平片 声像型声像型 (视听型视听型)Audio-Visual form记录声音、图像信号的信息载体记录声音、图像信号的信息载体.如:唱片、录音(像)如:唱片、录音(像)带、影视片、幻灯片及高密度视听光盘带、影视片、幻灯片及高密度视听光盘.机读型机读型 (电子型电子型)Machine Readable form 以电子版本形式存在:以电子版本形式存在:Magnetic tape,CD-ROM,online,n
5、etwork一、文献信息检索的基本概念一、文献信息检索的基本概念2、按文献加工深度划分、按文献加工深度划分一次文献一次文献/信息信息 primary Literature/info概念概念:第一次书写的、第一次报道的或第一第一次书写的、第一次报道的或第一 次出版的文献次出版的文献;以作者自己的研究成果、工作经验和实践体以作者自己的研究成果、工作经验和实践体 会为原始依据,会为原始依据,信息内容具体、丰富。信息内容具体、丰富。二次文献二次文献/信息信息 secondary literature/info 概念概念:对一次文献的加工、提炼和浓缩。对一次文献的加工、提炼和浓缩。特点特点:浓缩性、汇集
6、性、有序性浓缩性、汇集性、有序性三次文献三次文献/信息信息 Tertiary literature/info 概念概念:对一次文献和二次文献进行汇集、综合、分析、详述等对一次文献和二次文献进行汇集、综合、分析、详述等 深度加工而形成的产物。深度加工而形成的产物。一、文献信息检索的基本概念一、文献信息检索的基本概念3、按文献的出版类型划分按文献的出版类型划分科技图书科技图书Sci-Tech book阅读类图书:阅读类图书:教科书、专著、论文集教科书、专著、论文集 参考类图书:参考工具书参考类图书:参考工具书科技期刊科技期刊 Sci-Tech Journal(magazine*,serial,pe
7、riodical)科技报告科技报告 Sci-Tech Report专利文献专利文献 Patent Document:Patent specification/bulletin会议文献会议文献 Conference paper:Proceedings,Compilation,Collected paper,Records.学位论文学位论文 Dissertation,Thesis标准文献,产品资料,标准文献,产品资料,技术档案,政府文献技术档案,政府文献二、二、Internet概论及网络资源检索概论及网络资源检索计算机网络计算机网络是一个数据通信系统,是由相互独立的计算是一个数据通信系统,是由相互
8、独立的计算机相互连接在一起的计算机集合,它跨越了时空的限制,最机相互连接在一起的计算机集合,它跨越了时空的限制,最大限度地实现了信息资源的共享。计算机网络经过了由最简大限度地实现了信息资源的共享。计算机网络经过了由最简单的两台计算机通过诸如电缆连接而成,发展到今天的由全单的两台计算机通过诸如电缆连接而成,发展到今天的由全世界上亿台计算机通过电缆、光缆和无线等方式连通的全球世界上亿台计算机通过电缆、光缆和无线等方式连通的全球Internet。INTERNET中文译为因特网,它是由众多计算机网络互联中文译为因特网,它是由众多计算机网络互联而成的,也称网间网(而成的,也称网间网(Network of
9、 Networks),是覆盖全球),是覆盖全球的信息交流与共享网络。的信息交流与共享网络。Internet基础知识基础知识1 1计算机网络的分类计算机网络的分类:(按分布距离的长短)(按分布距离的长短)局域网(局域网(LANLAN):将有限范围内的各计算机、终端和外:将有限范围内的各计算机、终端和外部设备互联成网。可分为共享式和交换式两种。最大部设备互联成网。可分为共享式和交换式两种。最大距离不超过距离不超过10KM10KM。特点是容易管理与配置,拓扑结构。特点是容易管理与配置,拓扑结构简洁整齐,传输速率高、延迟短、成本低、应用广、简洁整齐,传输速率高、延迟短、成本低、应用广、级网方便、使用灵
10、活。例如图书馆网络。级网方便、使用灵活。例如图书馆网络。城域网(城域网(MANMAN):将现有的局域网互连起来的一种规模:将现有的局域网互连起来的一种规模较大的城市范围内的网络。范围为较大的城市范围内的网络。范围为几十公里几十公里。广域网(广域网(WANWAN):):一种跨城市、地区甚至国家的远程网一种跨城市、地区甚至国家的远程网络。采用分组交换技术,络。采用分组交换技术,点对点点对点通信技术。通信技术。互联网(互联网(InternetInternet):):将不同的物理网络技术按某种将不同的物理网络技术按某种协议协议统一起来的一种高层技术。统一起来的一种高层技术。Internet基础知识基础
11、知识2 Internet 在中国的发展在中国的发展1986年拨号到欧洲一些国家,年拨号到欧洲一些国家,1994年年4月正式接入月正式接入Internet网。网。四个骨干网:四个骨干网:中国公用计算机互联网(中国公用计算机互联网(Chinanet)中国教育与科研计算机网中国教育与科研计算机网(Cernet)中国科技计算机网中国科技计算机网(Cstnet)中国金桥互联网中国金桥互联网(ChinaGBN)Internet相关概念相关概念传输控制协议传输控制协议/网间协议网间协议(TCP/IP)传传输输控控制制协协议议/网网间间协协议议:(Transmission Transmission Contr
12、ol Control Protocol/Protocol/Internet Internet Protocol Protocol/TCP/IP/TCP/IP)是是InternetInternet的的基基础础协协议议。是是不不同同型型号号的的计计算算机机和和操操作作系系统统进进行行数数据据传传输输的的一一种种规规则则。TCP/IPTCP/IP协协议议好好比比因因特特网网上上一一种种公公共共语语言言,使使来来自自各各个个不不同同国国家家和和地地区区的的人人们们可可以以相相互互交交流流和和建立联系。建立联系。Internet相关概念相关概念IP 地址地址 为了保证Internet上的计算机(主机)在
13、通信时能相互识别,TCP/IP协议要求Internet 上任何一台计算机都有一个不允许重复的地址,这个地址就是IP地址(InternetProtocolAddress)。IP地址由四组数字组成,每组数字中间用点隔开,如:202.112.175.4是的主机在Internet上的IP地址。图书馆购买的数据库的使用权限绝大多数通过图书馆购买的数据库的使用权限绝大多数通过IPIP控制控制.Internet相关概念相关概念WWW WWW(World Wide Web),译为,译为万维网万维网。是一种。是一种基于超文本(基于超文本(Hypertext)方式的信息查询工具。方式的信息查询工具。WWW通过这种
14、超文本的方式,把世界各地服务器通过这种超文本的方式,把世界各地服务器上的信息连接在一起,图文并茂地显示在用户面前。上的信息连接在一起,图文并茂地显示在用户面前。WWW基于以下几个基本概念:基于以下几个基本概念:超文本标记语言(超文本标记语言(HTML)超文本传输协议(超文本传输协议(HTTP)统一资源定位符(统一资源定位符(URL)浏览器(浏览器(BROWSER)WEB服务器(服务器(WEB SERVER)Internet相关概念相关概念浏览器(浏览器(Browser)浏浏览览器器是是用用户户访访问问WWWWWW的的工工具具。与与其其它它浏浏览览器器不不同同的的是是WWWWWW浏浏览览器器不不
15、仅仅可可以以浏浏览览简简单单的的二二进进制制文文件件,还还可可以以浏浏览览超超文文本本标标记记语语言言中中所所能能描描述述的的图图形形、图图像像、声声音音、动动画画、表表格格以以及及进进一一步步的的连接信息。连接信息。目前流行的浏览器主要有:目前流行的浏览器主要有:Netscape Navigator Netscape Navigator 和和 Microsoft Internet Explorer Microsoft Internet Explorer(简称简称IEIE)。Internet相关概念相关概念浏览器(浏览器(Browser)IE IE浏览器是目前应用最普遍的浏览器。浏览器是目前应
16、用最普遍的浏览器。通常计算机通常计算机WINDOWSWINDOWS桌面上,可以找到上面的图桌面上,可以找到上面的图标,这就是标,这就是IEIE浏览器的标示。双击它可打开浏浏览器的标示。双击它可打开浏览器。览器。Internet相关概念相关概念浏览器(浏览器(Browser)收藏中常用的功能:收藏中常用的功能:-收藏夹收藏夹 将自己感兴趣的将自己感兴趣的 网站或网页收藏起来。网站或网页收藏起来。Internet相关概念相关概念InternetInternet的主要服务功能的主要服务功能 (1)电子邮件服务(电子邮件服务(E-mail)(2)文件传输服务文件传输服务(Ftp)(3)远程登录服务远程
17、登录服务 (4)万维网万维网 (5)电子论坛电子论坛(BBS、Blog)网络信息资源网络信息资源 网络信息资源网络信息资源 (Network Information Resource)指以电子数据的形式将文字、图像、声音、指以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷质动画等多种形式的信息存放在光磁等非印刷质的载体中,并通过网络通信、计算机或终端等的载体中,并通过网络通信、计算机或终端等方式再现出来的信息资源。随着因特网的迅速方式再现出来的信息资源。随着因特网的迅速发展和普及,网络信息资源主要指放置在因特发展和普及,网络信息资源主要指放置在因特网上的信息集合,但并
18、非包含所有因特网信息,网上的信息集合,但并非包含所有因特网信息,而只是指其中能满足人们信息需求的那一部分。而只是指其中能满足人们信息需求的那一部分。网络信息资源的类型网络信息资源的类型 依依据据信信息息源源的的信信息息内内容容则则可可将将网网络络信信息息源源分为以下类型:分为以下类型:网上数据库网上数据库 网上电子出版物网上电子出版物 参考信息源参考信息源 游戏、软件游戏、软件 新闻新闻(1 1)联机数据库)联机数据库 各各类类数数据据库库是是联联机机存存储储电电子子信信息息源源的的主主体体,据据统统计计,仅仅至至19911991年年中中期期,世世界界上上就就有有数数据据库库76007600个
19、个。目目前前,很很多多重重要要的的数数据据库库都都已已经经联联入入InternetInternet,仅仅DIALOG DIALOG 就就有有400400多多个个。这这些些数数据据库库包括各个学科,涉及各种文献的信息。包括各个学科,涉及各种文献的信息。(2 2)联机馆藏目录库)联机馆藏目录库 目目前前InternetInternet上上的的电电子子图图书书馆馆很很多多,国国内内外外的的许许多多图图书书馆馆都都已已经经在在网网上上提提供供服服务务。包包括括美美国国国国会会图图书书馆馆在在内内的的许许多多著著名名公公共共图图书书馆馆、大大学学图图书书馆馆及及学学术术机机构构的的图图书书馆馆的的馆馆藏
20、藏机机读读目目录录库库,通通过过网网络络对对外外开开放放,提提供供OPACOPAC(图图书书馆馆联联机机公公共共目目录查询系统)服务。录查询系统)服务。网络信息资源的类型网络信息资源的类型(3 3)网络图书网络图书 电电子子图图书书在在InternetInternet上上越越来来越越多多,电电子子图图书书涉涉及及的的领领域域特特别别广广泛泛,包包括括文文学学、艺艺术术、科科学学、人人文文等等各各个个领领域域。其其中中网网上上的的电电子子词词典典、百百科科全全书更是独树一帜。书更是独树一帜。(4 4)网络报刊网络报刊 在在InternetInternet上上,已已有有很很多多的的电电子子期期刊刊
21、对对用用户户提提供供服服务务。世世界界著著名名的的TimesTimes、ForbesForbes、ScienceScience、NatureNature等等都都有有网网络络电电子子版版。我我国国的的很很多多刊刊物物报报纸纸也也都都已已经经上上网网提提供供服服务务。如如:人民时报、经济日报人民时报、经济日报 网络信息资源的类型网络信息资源的类型(5 5)软件与娱乐游戏类软件与娱乐游戏类 网网上上的的这这类类资资源源也也很很多多,且且大大都都是是免免费费的的。如如InternetInternet上上有有搜搜索索引引擎擎的的介介绍绍、语语言言帮帮助助、幼幼儿儿教教育育之之类类的的培培训训信信息息。而
22、而且且随随着着远远程程教教育育的发展,这类信息的数量将大量增加。的发展,这类信息的数量将大量增加。(6 6)动态性信息动态性信息 在在InternetInternet上上有有许许多多动动态态性性信信息息,如如BBSBBS、广告、新闻时事等。广告、新闻时事等。网络信息资源的类型网络信息资源的类型文献信息网络检索工具文献信息网络检索工具 网网络络检检索索工工具具,是是指指在在因因特特网网上上提提供供信信息息检检索索服服务务的的计计算算机机系系统统,其其检检索索的的对对象象是是存存在在于于因因特特网网信信息息空空间间中中各各种种类类型型的的网网络络信信息资源。息资源。科科研研文文献献信信息息网网络络
23、检检索索主主要要分分为为两两种种方方式:式:q 网络资源检索网络资源检索 q 专业数据库检索专业数据库检索网络资源检索网络资源检索 网网络络资资源源检检索索和和数数据据库库检检索索有有相相同同之之处处,也也有有不不同同点点,总总的的来来讲讲,网网络络资资源源检检索索的的目目标标是是检检索索与与要要求求相相关关的的网网站站或或网网页页,通通过过这这些些网网站站或或网网页页所所提提供供的的信信息息来来决决定定检检索索的的最最终终选选择择。网络资源检索的方法主要有以下几种:网络资源检索的方法主要有以下几种:利用网络资源进行信息检索利用网络资源进行信息检索(1)布尔逻辑检索)布尔逻辑检索 大大多多数数
24、网网络络检检索索工工具具都都支支持持布布尔尔逻逻辑辑检检索索,即即:用用布布尔尔逻逻辑辑算算符符来来表表达达检检索索词词之之间间的的逻逻辑辑关关系系。逻逻辑辑与与(AND)、逻逻辑辑或或(OR)、逻逻辑非(辑非(NOT或或AND NOT)。)。如:如:education and distance learning 教育教育 与与 远程远程 网络资源检索网络资源检索利用网络资源进行信息检索利用网络资源进行信息检索(2)限制符检索)限制符检索 网网络络检检索索提提供供了了一一些些限限制制检检索索条条件件,用用“+”和和“-”表表示示。在在检检索索词词前前面面加加上上“+”号号,表表示示该该检检索索
25、词词必必须须出出现现在在检检索索结结果果中中;在在检检索索词词前前面面加加上上“-”号号,表表示示该该检检索索词词可可以以不不在在检检索索结结果果中中出出现现。例例:检检索索有有关关冬冬小小麦麦而而不不是是夏夏玉玉米米时时,检检索索式式为为:+冬冬小小麦麦 夏夏玉玉米米,这这个个检检索索式式表表明明只只有有“冬冬小小麦麦”这这个个词词可可以以在在检检索索结结果果中中出出现现,而而“夏夏玉玉米米”则则不不能能在在结结果果中出现。中出现。网络资源检索网络资源检索网络资源检索网络资源检索网络资源检索网络资源检索利用网络资源进行信息检索利用网络资源进行信息检索(3)通配符检索)通配符检索(截词检索截词
26、检索)有有些些检检索索词词的的词词尾尾可可能能有有多多种种形形式式,在在检检索索中中为为了了不不漏漏掉掉某某些些意意思思相相近近的的词词,可可采采用用截截词词的的方方法法。如如:“歌歌唱唱”一一词词在在同同一一词词根根后后可可有有多多种种变变化化,即即:singsing,singssings,singersinger,singingsinging等等,如如果果把把这这些些词词都都输输入入检检索索式式就就显显得得很很乱乱而而繁繁琐琐,这这时时可可用用通通配配符符(截截词词符符)来来代代替替,即即:可可写写成成 sing*sing*计计算算机机将将自自动动检检索索出出以以singsing开开头头的
27、的所所有词。有词。注注:并并不不是是所所有有检检索索工工具具都都能能使使用用通通配配符符检检索索,有有些检索工具可以自动截词,如:些检索工具可以自动截词,如:YahooYahoo。网络资源检索网络资源检索利用网络资源进行信息检索利用网络资源进行信息检索(4)词组检索)词组检索 词词组组检检索索是是网网络络信信息息检检索索最最常常用用的的方方法法,其其作作用用是是保保证证检检索索词词之之间间概概念念的的完完整整性性。在在网网络信息检索中络信息检索中,词组检索用双引号词组检索用双引号“”表示,表示,如如:要要检检索索“计计算算机机网网络络”方方面面的的网网站站或或网页,可输入网页,可输入“comp
28、uter network”。网络资源检索网络资源检索(5)字段检索)字段检索 如如:用用标标题题字字段段检检索索时时可可输输入入标标题题字字段段的的标标示示符符,通通常常是是英英文文词词“title”加加“:”构构成成。用用URL字字段段检检索索时时用用输输入入“url”加加“:”,冒冒号号后后面面跟跟上上检检索索式式。如如:检检索索标标题题为为运运动动与与健健康康方方面面的的网网页页,可可以以输输入入:title:sport and health,冒冒号号后后不不能能有有空空格格。并并不不是是所所有有检检索索工工具具的的标标题题字字段段检检索索都都使使用用titlt,如如:Yahoo的的标标
29、题题字字段段检检索索可可使使用用“title”也也可可使使用用“t”。因因此此,要要根根据据不不同同的的检检索索工工具具的的检检索索功功能能使使用用检检索索词词或或标标示示符符。除除常常用用的的标标题题字字段段以外,还有以外,还有域名字段域名字段、主机字段主机字段及及出版物字段出版物字段等。等。网络资源检索网络资源检索 一种非常实用的网络资源检索工具一种非常实用的网络资源检索工具 搜搜索索引引擎擎(Search Engine)是是INTERNET上上完完成成各各种种信信息息检检索索任任务务的的一一种种工工具具。广广义义上上是是指指一一种种基基于于INTERNET的的信信息息查查询询系系统统,包
30、包括括信信息息抓抓取取、信信息息管管理理和和信信息息检检索索;狭狭义义上上是是指指一一种种为为搜搜集集INTERNET上上的的网网页页信信息息而而设设计计的的检检索索软软件件。它它通通过过分分析析Web页页面面的的标标题题并并跟跟踪踪它它们们所所含含的的具具体体信信息息,整整理理成成含含有有站站点点及及Web页页的的URL、关关键键字字等等信信息息的的庞庞大大数数据据库库,并并根根据据用用户户的的检检索索请求,返回其需要的信息。请求,返回其需要的信息。网络资源检索网络资源检索 搜索引擎的主要功能包括:搜索引擎的主要功能包括:q 在在INTERNET上搜集信息;上搜集信息;q 对对搜搜集集到到的
31、的信信息息进进行行标标引引和和分分类类等等处处理理,并并以以此此来来建建 立立或更新数据库;或更新数据库;q 接接受受用用户户的的访访问问,提提供供实实时时的的检检索索服服务务。作作为为因因特特网网上上专专门门提提供供网网上上信信息息查查询询服服务务的的网网站站,搜搜索索引引擎擎可可以以在在浩浩如如烟烟海海的的网网站站中中迅迅速速查查找找有有效效信信息息,具具有有强强大大的的导导航航作作用,已经成为人们上网时必备的工具。用,已经成为人们上网时必备的工具。网络资源检索网络资源检索http:/中文雅虎http:/若比邻中文搜索引擎http:/天网http:/百度http:/搜索客1.AltaVis
32、ta(http:/)2.Excite(http:/)3.Webcrawler(http:/)4.Lycos(http:/)5.Opentext(http:/)6.Infoseek(http:/)7.Yahoo!(http:/)8.HotBot(http:/)9.Google(http:/10.Magellan(http:/)http:/http:/搜索引擎的主要检索方法搜索引擎的主要检索方法搜索引擎提供的搜索方式包括以下三种:搜索引擎提供的搜索方式包括以下三种:(1)简简单单搜搜索索(Simple Search,简简记记作作SS):指指输输入入一一个个单单词词(关关键键词词)或或两两个个单单词
33、词以以上上的的词词组组(短短语语),提提交交搜搜索索引引擎擎查查询询,这这是是最最基基本本的的搜搜索索方方式式。大大多多数数搜搜索索引引擎擎都都约约定定把把词词组组或或短语放在引号短语放在引号“”内。内。(2)高高级级搜搜索索(Advanced Search,简简记记作作AS):指指用用布布尔尔逻逻辑辑组组配配方方式式查查询询,也也叫叫定定制制搜搜索索。也也包包括括多多词词语语句句提提问问的的任任意意查查询询。不不同同搜搜索索引引擎擎对对语语句句中中词词与与词词之之间间的的关关系系的的处处理方式不同。理方式不同。(3)目目录录搜搜索索(Catalog Search,简简记记作作CS):指指按按
34、搜搜索索引引擎擎提提供供的的分分类类目目录录逐逐级级查查询询,用用户户一一般般不不需需要要输输入入查查询询词词,而而是是按按照照查查询询系系统统所所给给的的几几种种分分类类项项目目,选选择择类类别别进进行行搜搜索,因而也叫分类搜索索,因而也叫分类搜索(Classified Search)。以以 Yahoo!网站为例:网站为例:Yahoo!是是世世界界上上第第一一个个搜搜索索引引擎擎,也也是是Internet最著名的查询系统,提供免费查询服务。最著名的查询系统,提供免费查询服务。Yahoo!是是由由两两名名斯斯坦坦福福大大学学电电机机工工程程博博士士生生David Filo和和Jerry Yan
35、g(杨杨致致远远,华华人人)于于1994年开发的,并于年开发的,并于1995年成立年成立Yahoo!公司。公司。Yahoo!拥拥有有第第一一流流的的Web目目录录和和最最佳佳的的新新闻闻链链接接以以及及许许多多附附加加服服务务,因因而而Yahoo拥拥有有许许多多用用户户,每每天天约约有有400万万人人次次访访问问,在在短短短短的的几几年年里里,Yahoo就就成成为为网网上上最最热热门门的的搜搜索索工工具具,而而且且还还为为Internet增添了无穷魅力。增添了无穷魅力。搜索引擎的主要检索方法搜索引擎的主要检索方法Yahoo!(http:/)Yahoo!对对收收集集到到的的信信息息都都进进行行严
36、严格格的的审审核核和和分分类类,从从而而保保证证了了内内容容馈馈乏乏的的网网站站不不会会在在Yahoo!中找到。!中找到。如如果果用用户户的的检检索索要要求求没没有有满满足足,Yahoo会会自自动将用户的检索要求转到动将用户的检索要求转到Google进行查寻。进行查寻。在在浏浏览览器器地地址址框框键键入入即即进进入入Yahoo!世界。!世界。搜索引擎的主要检索方法搜索引擎的主要检索方法http:/Yahoo!(http:/)搜索功能搜索功能:Yahoo!提提供供一一些些操操作作符符用用以以对对检检索索项项的的限限定,主要包括以下几种:定,主要包括以下几种:+:表表示示结结果果中中必必须须包包含
37、含这这个个词词,如如:+market检检索索表表示示检检索索结结果果中中必必须须含含有有market一词。一词。(2):表表示示限限定定检检索索字字串串一一定定不不要要出出现现在在结结果果中中,如如:+market-survey表表示示检检索索结结果果中中一一定定不不包包含含有有survey一一词词。注注意意“”与与词词之之间间不能有空格。不能有空格。搜索引擎的主要检索方法搜索引擎的主要检索方法 搜索功能搜索功能:(3)词词组组检检索索:把把检检索索词词放放在在双双引引号号“”中中,则则此此检检索索词词作作为为短短语语检检索索,如如“American Marketing Association
38、”。若若没没有有双双引引号号则则表表示示各各单单词词为为“或或”的的关关系系,即即“+”功能。功能。(4)截截词词检检索索:通通配配符符号号用用“*”,但但词词干干部部分分必必须须有有3个个字母。字母。(5)字字段段检检索索:Yahoo允允许许两两种种类类型型的的字字段段检检索索,title和和url。t:表表示示只只查查网网站站名名称称,如如t:football,在在网网站站名名称称中中查查football。u:表示只查询网址(:表示只查询网址(url),u:football网址中含网址中含football。搜索引擎的主要检索方法搜索引擎的主要检索方法Yahoo!(http:/)搜索方式:搜
39、索方式:Yahoo!提供三种方式!提供三种方式:目录查询目录查询 普通搜索普通搜索 高级搜索高级搜索搜索引擎的主要检索方法搜索引擎的主要检索方法 搜索方式:目录查询搜索方式:目录查询 Yahoo的的真真正正优优势势在在于于其其分分类类目目录录的的内内容容组组织织,其其目目录录和和分分类类系系统统比比其其它它搜搜索索引引擎擎详详细细。Yahoo数数据据库库有有65,000篇篇HTML文文献献和和其其它它Internet资资源源,共共20多多万万个个条条目目,提提供供优优秀秀的的主主题题浏浏览览工工具具,对对网网站站信信息息按按主主题题建建立立分分类类索索引引,按按字字母母顺顺序序列列出出14个个
40、大大类类,每每个个大大类类所所包包含含的的子子类类有有精精炼炼的的描描述述,每每个个子子类类有有数数以以千千计计的相关的相关Internet网站信息。网站信息。搜索引擎的主要检索方法搜索引擎的主要检索方法 搜索方式:目录搜索搜索方式:目录搜索 Yahoo的目录查询使用很简单,只要进入的目录查询使用很简单,只要进入其主题分类界面,选定所查主题,逐级进入即其主题分类界面,选定所查主题,逐级进入即可。如查科学技术,链接科学技术选项即可。可。如查科学技术,链接科学技术选项即可。搜索引擎的主要检索方法搜索引擎的主要检索方法 搜索方式:普通搜索搜索方式:普通搜索 打打开开Yahoo!主主页页进进入入普普通
41、通搜搜索索界界面面,在在窗窗口口的的对对话话框框中中直直接接输输入入关关键键词词进进行行检检索索,此此时时将将在在 Categories(类类目目);Web Sites(网网站站);Web Pages(网网页页);News Stories(新新闻闻故故事事);Net Events(网网络络新新闻闻);ImagesImages(图图像像););ProductsProducts(产品)中(产品)中进行。进行。Yahoo!会会从从其其数数据据库库里里检检索索符符合合条条件件的的主主题题目目录录的的Web站站点点,其其结结果果依依次次为为站站点点(The Web),目目录录(Directory),新新
42、闻闻(News),ProductsProducts(产产品品),要想查看检索到的目录、站点和新闻,直接点击即可。要想查看检索到的目录、站点和新闻,直接点击即可。搜索引擎的主要检索方法搜索引擎的主要检索方法搜索方式:普通搜索搜索方式:普通搜索“水利部灌溉试验总站水利部灌溉试验总站”得到的得到的“The Web”结果结果Yahoo(http:/)搜索方式:高级搜索(搜索方式:高级搜索(Advanced Search):高高级级搜搜索索界界面面提提供供多多种种选选择择,包包括括搜搜索索方方式式、搜搜索索范范围围、时时间间范范围围以以及及显显示示结结果果数数等等,同同时,还提供了检索词的逻辑组配方式,
43、包括时,还提供了检索词的逻辑组配方式,包括v 逻辑与(逻辑与(include all of the words)v 词组检索(词组检索(include this exact phrase)v 逻辑或(逻辑或(include at least one of these words)v 逻辑非(逻辑非(exclude these words)搜索引擎的主要检索方法搜索引擎的主要检索方法搜索方式:高级搜索(搜索方式:高级搜索(Advanced Search):在普通搜索界面,点击在普通搜索界面,点击“Advanced Search”即可即可进入高级搜索界面。进入高级搜索界面。搜索方式:搜索结果:搜索
44、方式:搜索结果:Yahoo!搜搜寻寻引引擎擎会会根根据据分分类类类类目目网网站站信信息息与与关关键键字字的的相相关关程程度度来来排排列列出出相相关关的的Yahoo!类类目目和和网网站站。影影响响相相关关程程度度的的因素有:因素有:(1)与与关关键键词词相相同同的的词词的的多多少少,相相同同的的词词愈愈多多,表表示示相相关关程程度度愈高。愈高。(2)与与关关键键词词完完全全符符合合(Exact Match),相相关关程程度度高高于于部部分分符符合。合。(3)与与关关键键词词符符合合的的词词的的位位置置。网网站站名名称称(或或新新闻闻标标题题)符符合合关关键键词词的的相相关关程程度度高高于于网网址
45、址(或或新新闻闻内内文文)符符合合关关键键词词的的网网站。站。(4)对对新新闻闻检检索索而而言言,新新闻闻更更新新的的时时间间也也是是搜搜寻寻结结果果排排序序的的考考虑要素,最新更新的新闻将优先列出。虑要素,最新更新的新闻将优先列出。搜索引擎的主要检索方法搜索引擎的主要检索方法Google (http:/ Larry Page 和和 Sergey Brin 于于 1998 年年创创立立。Google Inc.于于1999 年创立。年创立。Google 通通过过自自己己的的公公共共站站点点 提提供供服服务务。Google收收录录的的网网站站内内容容丰丰富富,在在主主页页中中使使用用“Im fee
46、ling lucky”,“手手气气不不错错”按按钮钮,可可以以使使检检索索直直达达与与关关键键词词最最相相关关的的网网站站中中,这这是是该该搜搜索索引擎的一个特色。引擎的一个特色。Google包包含含20 多多亿亿网网页页,搜搜索索速速度度快快。现现在在,Google 每天提供每天提供 1.5 亿次查询服务。亿次查询服务。搜索引擎的主要检索方法搜索引擎的主要检索方法Google (http:/ (http:/ 会会忽忽略略最最常常用用的的词词和和字字符符,这这些些词词和和字字符符称称为为忽忽略略词词。Google 自自动动忽忽略略“http”,“.com”和和“的的”等等字字符符以以及及数数字
47、字和和单单字字,这这类类字字词词不不仅仅无无助助于于缩缩小小查查询询范范围围,而而且且会会大大大大降降低低搜搜索索速速度度。使使用用英英文文双双引引号号可可将将这这些些忽略词强加于搜索项。忽略词强加于搜索项。搜索引擎的主要检索方法搜索引擎的主要检索方法Google (http:/ 不不支支持持截截词词(通通配配符符*)搜搜索索,即即Google 只只搜搜索索与与输入的关键词完全一样的字词。输入的关键词完全一样的字词。忽忽略略大大小小写写:Google 搜搜索索不不区区分分英英文文字字母母大大小小写写,所所有有的的字字母母均均当当做做小小写写处处理理。例例如如:搜搜索索“google”、“GOO
48、GLE”或或“GoOgLe”,得得到到的结果都一样的结果都一样搜索引擎的主要检索方法搜索引擎的主要检索方法Google (http:/ 点点击击“网网页页目目录录”链链接接即即可可进进入入Google目目录录搜搜索索,按按照主题分为照主题分为14大类,其搜索方法与大类,其搜索方法与Yahoo!基本相似。基本相似。Google (http:/ 搜索搜索”按钮即可得到最相关的内容。按钮即可得到最相关的内容。Google (http:/ Search):):点点击击“高高级级搜搜索索”即即可可进进入入高高级级搜搜索索界界面面,高高级级搜搜索索界界面面提提供供多多种种选选择择,包包括括搜搜索索方方式式
49、、搜搜索索范范围围、时时间间范范围围以以及及显显示示结结果果数数等等,同同时时,还提供了检索词的逻辑组配方式包括:还提供了检索词的逻辑组配方式包括:v 逻辑与(包含以下全部的字词)逻辑与(包含以下全部的字词)v 词组检索(包含以下的完整字句)词组检索(包含以下的完整字句)v 逻辑或(包含以下任何一个字词)逻辑或(包含以下任何一个字词)v 逻辑非(不包括以下字词)逻辑非(不包括以下字词)搜索引擎的主要检索方法搜索引擎的主要检索方法Google (http:/ Search):):点击点击“高级搜索高级搜索”即可进入其高级搜索界面。即可进入其高级搜索界面。Google (http:/ 的特殊功能:
50、的特殊功能:查找查找 PDF 文件文件:除除一一般般网网页页外外,Google 现现在在还还可可以以查查找找文文档档格格式式为为PDF的的文文件件。如如果果某某个个搜搜索索结结果果是是 PDF 文文件件而而不不是是网网页页,它它的的标标题题前前面面会会出出现现以以蓝蓝色色字字体体标标明明的的 PDF。这这样样,用用户户就就知知道道需需要要启启动动 Acrobat Reader 程程序序才才能能浏浏览览该该文文件件。单单击击 PDF 右右侧侧的的标标题题链链接接就就可可以以访访问问这这个个 PDF 文文档档。如如果果您您只只想想查查找找一一般般网网页页,而而不不要要 PDF 文文件件,只只需需在