资源描述
,单击此处编辑母版标题样式,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,因特网信息资源检索,因特网中的信息检索,信息检索工具的工作原理,1.3,因特网信息资源检索,1,本环节主要内容,主要学习各种搜索引擎及其发展趋势,并在此基础上进一步分析了搜索引擎的工作原理。,2,搜索引擎是什么,?,A.,网页,B.,网站,C.,一组程序,D.access,搜索引擎,是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航目的。,3,注意的问题,搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。,搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。,4,因特网信息资源检索,1.,目录索引类搜索引擎,2.,全文搜索引擎,3.,特色信息检索工具,4.,其它信息检索工具,5.,元搜索引擎,5,1.3,因特网信息资源检索,搜索引擎,指用于因特网信息查找的网络工具。,1.,目录索引类与全文搜索引擎,(1),目录索引类搜索引擎(,其搜索方式也称为分类搜索,),目录搜索引擎,将收取到的各个网站(网页)的信息按照目录分类,建,立索引数据库供人们分类查找。,代表网站:搜狐,(),新浪,(),网易,(),雅虎,(),搜网,(,),6,目录索引类搜索引擎的基本工作原理,目录索引类搜索引擎一般采用,人工方式,采集和存储网络信息,依靠手工为每个网站确定 一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。,1.3.2,信息检索工具的工作原理,特点:,在查询信息时,不用事先确定信息检索目标(即关键词),可以通过浏览主题了解某一主题的相关资源。,优点:,目录索引类搜索引擎的网页由人工精选,网页内容丰富,学术性较强。,缺点:,更新速度慢。,7,专题目录,链接,网站,总目录,1.3.2,信息检索工具的工作原理,搜索的例子:,8,选择题,1.,目录索引类搜索引擎一般采用什么方式采集和存储信息()。,A.,人工方式,B.,蜘蛛程序,C.,关键字检索,D.,检索工具,A,9,(,2,)全文搜索引擎,(其使用方法也称为关键词查询),全文搜索引擎,用代表所需信息主题的关键词进行信息查询。,谷歌,google,:(,),百度:(,),北大天网:,(,),特点:通过从因特网上提取的各个网站的信息(以网页文字为主)而建立的索引数据库。,1.3,因特网信息资源检索,10,1.3.2,信息检索工具的工作原理,组成部分,负责工作,搜索器,负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持续不断地抓取网页。,索引器,把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器的数据库中。,检索器,面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果反馈给用户。,搜索引擎的组成,全文搜索引擎的工作原理,购物,描述商品特征,取贷,交给顾客,查找信息,输入描述信息的关键词,在数据库中检索,结果呈现,11,全文搜索引擎的工作原理:,1.3.2,信息检索工具的工作原理,查询结果,用户查询,输入查询表达式,检索器,查询结果显示,查询信息排序,索引器,搜索器,筛选,信息采集,索引,排序,索引,数据库,采集结果,上半部,下半部,12,全文搜索引擎的工作过程是什么?课本,P72-73,搜索引擎的工作过程,从互联网上“抓取”网页,建立索引数据库,在索引数据库中搜索排序,用户接口:查询和响应,13,全文搜索引擎,输入关键字,查询信息排序,索引,数据库,用户查询,查询结果,检索,搜索,14,下列不属于搜索引擎中,“,搜索器,”,工作程序的是()。,A.,网络机器人,B.,蜘蛛,C.,爬虫,D.CuteFTP,D,15,2.,特色信息检索工具,1.3,因特网信息资源检索,我们经常使用的一般是综合信息检索工具,而当们我们要查找图片、地图等信息时,使用综合搜索引擎会找到很多无用的信息,而且搜索的效率和有效性都不高。这时就可以使用特色搜索引擎(有时是综合检索工具中的一个功能),16,一类以,FTP,、,Telnet,、,Usenet,(,Uses Network,的缩写,新闻讨论组,是全世界最大的电子布告栏系统),等资源为检索对象的检索工具,如北大天网、,Archie,等。,1.3,因特网信息资源检索,3.,其他信息检索工具,17,4.,其他信息检索工具,以,FTP,、,Telnet,、,Usenet,等资源为检索对象。,18,5,.,元搜索引擎,1.3,因特网信息资源检索,一般的网络检索工具局限在本引擎的数据库内进行搜索,由于不同的搜索引擎各自的信息收集方式和范围、检索算法和结果排序方法都各不相同,因此检索结果也不尽相同。为了获得较好的结果,,1995,年出现了元搜索引擎,,元搜索引擎能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。但是由于元搜索引擎出现的时间短,一些搜索引擎强大的检索功能还不能实现。,元搜索引擎,这是一种,搜索引擎之上的,(强调逻辑关系、逻辑结构),搜索引擎,,它可以同时检索多个成员搜索引擎的数据库。,19,常用元搜索引擎,1,、,Ithaki,(,支持包括中文在内的,14,种语言检索。,2,、,Ixquick,(,可搜索网站、,MP3,、新闻、图象等多种网络资源,3,、,qbSearch )。,A.,搜索时,用户必须多次提交搜索请求,B.,可同时搜索多个数据库,C.,一般支持,AND,、,OR,、,NOT,等操作,D.,一般只使用简单、直接的搜索策略,A,21,三、因特网资源检索策略,搜索内容,引擎选择,一般信息资源,综合性的(百度、,google,),图片、视频,特色的,也可以用综合搜索引擎的某个功能,专业性较强,专业搜索引擎,全面了解网上信息资源,元搜索引擎,22,四、网上信息检索技巧,1,、使用空格,输入更多的关键词,只要在关键词中间留空格,这相当于多个关键词之间的关系是逻辑“与”。,练习,1,查找“出门在外”的歌曲,2,、使用减号,.,要避免搜索某个词语,可以在这个词前面加上一个减号,(“-”,英文字符,).,但在减号之前必须留一空格,.,如要了解搜索引擎历史,可以这样输入关键字,:,搜索引擎宗教,-,佛教,-,基督教,23,3,、添加英文双引号,.,双引号中的词语在查询到的文档中将作为一个整体出现,.,这一方法在查找名言警句或专有名词时显得格外有用,.,练习,2,请你比较应用下面两组关键词的搜索结果有什么不同,1,理科的学习方法,2,“,理科的学习方法”,4,查找特定格式的文件,.,Google,可以直接搜索,13,种非,HTML,文件,.,其中包括,Flash,的,swf,文档,MicrosoftOffice,的,(doc,ppt,xls,rtf),pdf,和其它类型文档,.,格式是,:,关键词,filetype:,类型名,.(,梅花三弄 filetype:swf,),四、网上信息检索技巧,24,5,、标题搜索,.,当我们需要搜索一篇关于某个主题的文章时,可以 用以下的关键字,:“intitle:,关键字”,.,如“,intitle:,南瓜饼”对比 “,intitle:,南瓜饼”和“南瓜饼”的查找结果,6,、网页快照,.,Google,在访问网站时,会将看过的网页复制一份 网页快照,以备在找不到原来的网页时使用,.,四、网上信息检索技巧,25,五,.,因特网信息检索发展趋势,(,1,)多媒体信息检索,(,2,)专业垂直搜索引擎,1.3,因特网信息资源检索,26,课堂总结,这节课我们学习了两大知识点:一是信息检索的方法;二是搜索引擎特点及工作原理,这一部分是我们这节课的重点,也是难点,只有你真正理解了它们工作的原理,我们才会真正能够根据不同查询要求,综合并灵活使用各种检索工具,准确、高效地获取我们所需要的信息,这也是我们课标所要求的。,27,Thank you!,28,
展开阅读全文