收藏 分销(赏)

Internet网络信息检索.pptx

上传人:人****来 文档编号:9983029 上传时间:2025-04-15 格式:PPTX 页数:109 大小:5.48MB
下载 相关 举报
Internet网络信息检索.pptx_第1页
第1页 / 共109页
Internet网络信息检索.pptx_第2页
第2页 / 共109页
点击查看更多>>
资源描述
,第五章,Internet,信息资源及其检索,第一节,Internet,网络信息资源概述,一、,Internet,概述,(一),Internet,的定义:,1.,从网络互联的角度来看,2.,从网络通信的角度来看,3.,从提供信息资源的角度来看,4.,从网络管理的角度来看,(二),Internet,的特点:,1.TCP/IP,协议是,Internet,的核心,TCP,:,Transmission Control Protocol,传输控制协议,TCP,是一种面向连接(连接导向)的、可靠的、基于字节流的运输层(,Transport layer,)通信协议。,TCP,协议提供的是可靠的、面向连接的传输控制协议;端到端的通信;全双工方式传输;采用字节流方式;紧急数据传送功能。,IP,协议,全称,Internet Protocol,(因特网协议),主要用于负责,IP,寻址、路由选择和,IP,数据包的分割和组装。目前,我们常用的,IP,协议是,IP,协议第四版本,即,IPv4,,是互联网中最基础的协议。,网络中的计算机都有一个惟一的因特网地址,又称,IP,地址。,IP,地址如同居民身份证编码具有惟一性。,IP,地址,:,166.111.4.100,域名,:,(三),Internet,的发展史,Internet,来源于,ARPAnet,网,现代计算机网络的许多概念和方法都来源于它。,2.Internet,实现了与公用电话交换网的互联,3.Internet,是一个用户自己的网络,2009,年,11,月,2,日举行的“,2009,中国互联网大会”上获悉,截至,9,月末,我国互联网用户到达,3.6,亿,普及率达到,27.1,,移动互联网用户已达,1.92,亿,境内网站达到,320,万个,宽带用户达,9933,万。互联网基础资源规模不断扩大,地址达到,1.23,亿个,为全球第二;域名注册量达,500,万,为全球第一。、制造业、软件与数字内容业产值超过,2000,亿元。我国互联网发展已处于关键时期。,(四)中国,Internet,的发展,1994,年我国全面开通了,Internet,服务,建立了四大网络体系。,中国科技网,CSTnet1994,年该网实现了与,Internet,网的联接。,CSTnet,主要是提供科学数据库服务、网络信息服务及超级计算服务等,其服务是非商业性的。,中国科技网网的网址是,:,,其主页如下图,:,中国教育科研网,CERNET,中国教育科研网的全称是,China Education and Research Network,,它是国家教委主持的国家重点工业性研究项目。于,1994,年启动,,1995,年,12,月正式开通运行,并实现与,Internet,的全方位连接。,CERNET,网分为主干网、地区网、和校园网三个层次。中国教育科研网的网址是:,,其主页如下图:,CERNET,当前的拓扑结构如下图:,中国公用计算机互联网,CHINANET,中国公用计算机互联网是我国第一个全国性商业网,它由中国信息产业部经营管理,于,1994,年开始启动。,CHINANET,为社会提供方便的网络服务,开办代理业务,发展网络用户,建立中文信息站点为网络用户提供多种信息服务,包括电子文件、商业信息、天气预报、娱乐休闲、旅游指南等。,中国公用计算机互联网的网址是:,中国金桥信息网,CHINAGBN,是三金工程,(,金桥工程、金关工程、金卡工程,),之一,也称中国经济网,于,1996,年开始建设,它是国家经济信息通信网,提供,Internet,网络商业服务。中国金桥信息网的网址是:,,其主页如下图:,二、,Internet,网络信息资源概述,(一)网络信息资源的概念,网络信息资源,由称电子信息资源、因特网信息资源、,WWW,信息资源,是将文字、图像、声音、动画等多种形式的信息,以数字化形式存储,并借助计算机与网络通信设备发布、收集、组织、存储、传递、检索和利用的信息资源。,(,1,)从内容方面看,网络信息资源信息类型丰富,信息量大,开放性强、增长快、更新快。,(,2,)从存放位置看,信息广泛分布在不同的服务器上,而服务器上的操作系统、数据结构、字符集、处理方式并不相同。,(,3,)从其利用方式看,网络信息资源不受时空限制,跨时空、跨行业传播。,(二)网络信息资源的特点,(,4,)从其组织方面看,网络信息资源分布离散化。,(,5,)从其质量方面看,信息发布有很大的自由度和随意性,缺乏必要的过滤、质量控制和管理机制。,(,6,)从时效性方面看,网络信息资源时效性强,在互联网上能得到最新的资料以及某个学科和某项科研的最新动态,能检索到最近的(甚至当日的)文献。随机变化大,更新消亡无法预测。,网络信息资源还具有开放性、交互性、通用性等特点。,三、,Internet,信息检索,(一),WWW,与信息检索,1.WWW,的概念,环球信息网,WWW(World Wide Wed),也称,Web,或万维网,它是一个基于超文本,(hypertext),方式的信息检索查询工具。,欧洲粒子物理实验室(,CERN,)的,Tim.Berners-lee,等人在,1989,年为了满足世界各地进行粒子物理研究的科学家能利用计算机网络交流研究成果,开发了,World Wide Web,,简称,WWW,。,2.,什么是超文本与超媒体,3.WWW,的构架,(,1,),HTML,是,Hyper Text Markup Language,的缩写。,(,2,)主页,(homepage),(,3,),HTTP,(,4,),URL,(Uniform Resource Locator,,统一资源定位器,),用来定义访问文件的名称、位置、访问的方式。,4.,WWW,浏览器,5.,www,采用的是客户机,/,服务器结构,第二节 搜索引擎,(一)搜索引擎(,Search engines,)的概念,(二)搜索引擎的发展历史,(三)搜索引擎工作原理,(,四,),搜索引擎的特点,一、搜索引擎概述,第二节 搜索引擎,一、搜索引擎(,Search engines,)的概念,二、搜索引擎的发展历史,三、搜索引擎工作原理,四、搜索引擎的特点,五、搜索引擎的检索结果,1.,标题:网页的标题。,2.URL,:该网页对应的“访问地址”。,3.,摘要:网页内容的摘要。,搜索引擎基本结构,六、搜索引擎的检索技术,1.,布尔逻辑检索,(,1,)逻辑“与”,(,2,)逻辑“或”,(,3,)逻辑“非”,逻辑与,逻辑或,逻辑非,在许多搜索引擎中用,空格、逗号、括号、,“”、“”、“,”,表示布尔逻辑符。空格、“”的作用与逻辑“与”(,and,)相同,比如,google,自动使用“,and”,进行查询。逗号(,)、“”的作用类似于逻辑“或”(,or,)。,2.,位置算符(,proximity search,),位置算符检索用诸如,“,w”,、“,n”,的符号表示词与词之间的位置关系,如,information n system,表示,system,出现在,information,之后,,information n system,表示与前后关系无关。,3.,截词检索(,truncation/wildcats,),截词方式主要有右截断、左截断、左右截断、中间截断(中间屏蔽)四种。搜索引擎中的截词符通常采用“*”和“?”。,4.,字段限制检索(,field limiting,),Title:,、,ubject:,、,Keyword:,、,Summary:,、,Image:,、,text:,、,Applet:,、,host:,、,anchor:,、,domain:,、,site:,、,url:,、,from:,等。,5.,精确检索(,exact search,),精确检索又称之为字符串检索、短语检索。几乎所有的搜索引擎读支持精确检索,并且都采用“”来表示。,6.,模糊检索(,fuzzy search,),7.,自然语言检索(,natural language search,),8.,区分大小写的检索(,case-sensitive,),又称为大小写敏感检索,这主要针对检索词中含有人名、地名等专有名词而言的。,9.,加权检索(,term weighting,)、,连接符有加号(,+,)和减号(,)。即在检索词前置加,/,减(,/,)号,作用相当于,AND/NOT,运算。,10.,多语言检索(,multilingual search,),11.,相关性排序,检索结果通常是根据相关程度按从大到小的顺序降序排列。几乎所有的搜索引擎都提供了“对检索结果按其相关性大小排序的功能。”,七、搜索引擎使用方法,1.,基本使用方法,(,1,)分类法,目录式搜索引擎最简单的搜索方法就是掌握它的目录分类原则,确定要查找的内容或网站应该在哪个分类,然后逐级单击寻找。,(,2,),关键词,这是搜索引擎必备的功能。直接在输入框输入关键词即可进行的检索。,2.,使用技巧,(1),选择合适的搜索工具,每种搜索引擎都有不同的特点,只有选择合适的搜索工具才能得到最佳的结果。,(2),使用正确的搜索词,就目前而言,多数搜索引擎不支持容错查询。所以,一定要注意不写错别字。,(3),正确使用布尔检索,正确使用布尔检索方式可以减少搜索结果的返回数。,八、搜索引擎的分类,1.,按搜索机制分类,(,1,)目录型搜索引擎,(,2,)关键词型搜索引擎,(,3,)混合型搜索引擎,2.,按搜索引擎提供的搜索内容来划分,(,1,)综合型搜索引擎,(,2,)专业型搜索引擎,(,3,)特殊型搜索引擎,3.,按搜索引擎在采集信息的方法及对外提供的服务方式划分,(,1,)机器人搜索引擎,(,2,)目录搜索引擎,(,3,)元搜索引擎,(一),Google,1.,概述,二、主要中文搜索引擎介绍,(,1,)网页标题,(,2,)网页快照,(,3,)手气不错,(,4,)类似网页,(,5,)中英文字典,(,1,)数量庞大,Google,目前发展为搜索,80,亿网页,;10,亿图片,;10,亿,Usenet,信息。,2.Google,的特点,(,2,),Google,支持多达,132,种语言,包括简体中文和繁体中文。,(,3,),Google,速度极快,它每秒钟能够回应几千次查询,而回应每项查询,,Google,都要走过,30,多亿个网页。,Google,原名,Googol,,意思是,10,的,100,次方,是个巨大的数字。,(,4,),Google,的专利网页级别技术,PageRank,能够提供准确率极高的搜索结果。,3.Google,搜索引擎的功能,(,1,)基本检索,(,2,)高级检索,4.Google Scholar,学术搜索引擎,2004,年,11,月,24,日,Googl,e,推出了世界上第一个针对学术期刊、论文、著作、摘要的免费学术搜索引擎一一,Google,Scholar,;,2006,年,1,月,11,日,,,Google,推出了面向中文用户的中文版,Google,学术搜索,。,(,1,),Google,Scholar,的,特点,学科覆盖广泛全面,学科专业性强,生物学、生命科学、环境科学,(Biology,,,Life Sciences,,,and Environmental Science);,商业、管理、金融与经济,(Business,,,Administration,,,Finance,,,and Economies);,化学与材料科学,(Chemistry and Materials Science);,工程、计算机科学和数学,(Engineering,,,computer Science,,,and Mathematics);,医学、药学和兽医学,(Medicine,,,Pharmacology,,,and Veterinary Science);,检索功能强大,搜索服务实行一站式,物理学、天文学、天体科学,(Physics,,,Astronomy,,,and,Planetary Science);,社会科学、艺术和人文科学,(Social Sciences,,,Arts,,,and Humanities),。,(,2,),Google Scholar,检索方法,基本检索,高级检索,高级检索界面,(,3,)检索结果,检索结果中每条信息内容都包含,:,文献的题名、著者、出版物、出版年月、摘要、被引用次数、网页搜索等。,学术搜索使用偏好,(二)百度,“百度”二字源于中国宋朝词人辛弃疾的,青玉案,诗句:“众里寻他千百度”。,1.,百度的基本功能,(,1,)百度快照,(,2,),MP3,搜索,(,3,)“超链分析”技术,(,4,)高级搜索,白度空间,更多,2.,百度的检索技术,百度支持“与”、“或”、“非”。在关键词之间插入“空格”、“,|”,、“,-”,可指定查询串中各关键词间“与”、“或”、“非”的关系。百度不支持,AND”,、“,+”,等符号的使用。,(三)雅虎(,http,:,/,),雅虎,(,),是全球第一门户搜索网站,业务遍及,24,个国家和地区,为全球超过,5,亿的独立用户提供多元化的网络服务。,1999,年,9,月,中国雅虎网站开通。,2005,年,8,月,中国雅虎由阿里巴巴集团全资收购。,中国雅虎,(,),将全球领先的互联网技术与中国本地运营相结合,成为中国互联网界位居前列的搜索引擎社区与资讯服务 提供商。为亿万中文用户带来最大价值的生活体验,成为中国互联网的“生活引擎”。,(,1,)分类目录检索,(,/,),双引号带来的精确结果,在查询词适当的位置加个空格,可以帮助您找到更精确的结果。,空格,+,减号,帮我们去掉无用信息。,在搜索结果页下方的搜索框中,重新输入一个查询词,然后点击“在结果中找”来缩小搜索范围。,不必担心英文的大小写,(四)搜狐(,http,:,/www.S,),1.,简介,搜狗是搜狐公司于,2004,年,8,月,3,日推出的全球首个第三代互动式中文搜索引擎,域名为,。,搜狗的产品线包括了网页应用和桌面应用两大部分。网页应用以网页搜索为核心,在音乐、图片、新闻、地图领域提供垂直搜索服务;桌面应用则旨在提升用户的使用体验:搜狗工具条、拼音输入法、,PXP,加速引擎。,直通车,高级检索,基本搜索,进一步的搜索,搜索不区分大小写,检索技术,使用双引号进行精确查找,使用多个词语搜索,减除无关资料,在指定网站内搜索:其格式:查询词,+,空格,+site:,网址,文档搜索:搜索语法:查询词,+,空格,+Filetype:,格式,2.,检索方法,(五)网易,(,或,www.iA),新浪搜索引擎“爱问”,(,www.iA,),于,2005,年,6,月,30,日正式推出。,新浪爱问搜索类型包括网页、新闻、博客、音乐、图片、视频、地图、知识人、资料、百事通。,(七)中国搜索,(,),高级检索,(八),MSN,中文搜索,(,),(九),TOM,搜索引擎,中文搜索引擎分布,三、主要英文搜索引擎介绍,(一),Altavista,搜索引擎,Altavista,是由前,DEC,公司于,1995,年开发的,是,Internet,上最大的搜索引擎,在它的搜索数据中包含了,2,,,200,万个主页、,3,,,000,万个,URL,和,13,,,000,个新闻组的全文信息。,Altavista,的搜索范围非常大,就连一些鲜为人知的偏僻站点也能找到,因此它的搜索结果十分丰富。所以,使用,Altavista,时,用户需要花更多的时间在搜索结果中寻找自己想要的信息。,网站地址:,,1,分类目录搜索,用户可以根据要查找内容在分类目录中选择相应的类目,点击后出现该类目所包含的子类,这样只要逐级点击相应的类目便可检索到所需的信息。例如,要检索有关,Intranet,技术的站点,可依次选择:,DirectoryComputer&InternetNetwork&CommunicationIntranetTechnology,,,最后一级目录中的,“,Technology,”,链接项,就会列出一系列有关,Intranet,技术的站点链接。,返回目录,2,简单搜索,使用简单检索方式,只需直接在检索文本框中键入检索词,检索词可以是单词、词组或短语,然后点击,“,Find,”,按钮或按回车键。,简单检索可以满足一般用户的需求,除检索网页外,还可检索图片、,MP3,、视频、新闻等。,输入检索词,返回目录,2,简单搜索,使用简单检索方式,用户可以对检索的内容加以限制:,限制检索某种语言网站,限制检索词中的大小写字母,限制检索词出现情况(,“,+,”,、,“,”,),限制与检索词相同词根单词出现情况(,“,*,”,),对搜索结果进一步细化,(,“,Require,”,、,“,Exclude,”,或,“,Refine Again,”,),返回目录,3,特殊搜索,Domain,:域名:指定域中搜索主页。,Host,:主机名:指定主机中搜索主页。,Image,:文件名:搜索包含指定图像文件名的主页。,Link,:,URL,:搜索包含指定链接的主页。,Text,:文章:搜索包含指定文本的主页。,Title,:文本:搜索标题中包含指定文本的主页。,url,:文本:搜索,URL,中包含指定文本的主页。,(二),Excite,搜索引擎,Excite,是,Internet,上的一个经典的搜索引擎,也是最受欢迎的搜索引擎之一。它收集了,5000,万个网页信息,其网页索引是一个全文数据库。,Excite,最大的特点是提供概念检索,即搜索引擎不仅查找包含关键词的主页,还查找包含与关键词有关的概念的主页。,网站地址:,返回目录,1,分类目录搜索,Excite,支持分类目录检索方式,在该主页中部列出了分类目录。用户可以根据查找内容的类别在分类目录中选择相应的类目,系统会显示该类目中包含的所有子类。经过多次选择后,就可以访问到包含查找内容的站点。,返回目录,输入检索词,2,关键词搜索,Excite,关键词搜索在检索文本框中键入关键词,然后点击,“,Search,”,按钮,,Excite,在数据库中查找与关键词相匹配的记录,然后进入搜索结果显示页。,Excite,与其他搜索引擎类似,可以使用,“,+,”,与,“,-,”,指定或排除某个单词,也可以使用布尔逻辑运算符,AND,,,OR,,,NOT,以及括号构成复杂的检索表达式。,Excite,不仅可以检索网页,还可检索图片、声频、视频、新闻等。,(三),Lycos,搜索引擎,Lycos,创立于,1995,年,是,Internet,上资格最老的搜索引擎之一。它的特点是功能强大,搜索范围广。,Lycos,几乎覆盖了,Internet,上,90%,的主页,可以进行包括,WWW,、,FTP,与,Gopher,等多种服务的搜索。由于,Lycos,的学术背景,它可以搜索到其他搜索引擎找不到的偏僻站点,比如一些面向教育或非赢利组织的站点。,网站地址:,www.L,返回目录,主题目录,1.TOP 50 Websites,主题目录,Lycos,提供了一种很有特色的服务,TOP 50 Websites,主题目录,它是,Internet,中最早而且最优秀的主题目录。,TOP 50 Websites,主题目录中所列的站点是由专家精心挑选的各类优秀站点,它是浏览和查询专业站点的最佳途径。,返回目录,输入关键词,2,关键词搜索,使用关键词检索的方法是,在,Lycos,主页上部的,“,Search for,”,检索文本框中键入关键词,然后点击该框右侧的,“,Go Get It,!,”,按钮。在检索结果显示页中,分别显示四类结果信息:,满足检索条件的分类目录(,Categories,);,满足检索条件的站点链接(,Web Sites,);,满足检索条件的新闻与媒体(,News&Media,);,满足检索条件的,Web,页面(,Web Pages,)。,四、其他英文搜索引擎简介,返回目录,InfoSeek,搜索引擎,AOL,搜索引擎,HotBot,搜索引擎,Netscape,搜索引擎,MSN,搜索引擎,Scirus,搜索引擎,新浪搜索分类目录,(,),
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服