收藏 分销(赏)

第四讲搜索引擎.ppt

上传人:xrp****65 文档编号:13092073 上传时间:2026-01-15 格式:PPT 页数:175 大小:18.94MB 下载积分:10 金币
下载 相关 举报
第四讲搜索引擎.ppt_第1页
第1页 / 共175页
第四讲搜索引擎.ppt_第2页
第2页 / 共175页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,信息检索与利用,第四讲 搜索引擎,回顾,数据库资源检索,电子资源检索基础,印刷型资源检索,电子图书,超星,书生之家,网络电子图书,电子期刊,CNKI,维普,万方,学位论文,南航博硕士论文库,中国学位论文,Ei Village,工程索引,ISI Web of Science,(,SCI,、,ISTP,),Elsevier,综合类学术期刊,下列对于核心期刊的描述错误的是:,A.,集中了高质量的论文,B,核心期刊目录是一成不变的,C,起源于布拉德福定律,D,能够反映学科水平,以下哪一项属于国外著名的三大检索工具之一:,A,SCI B,AIAA C,IEL D,PQDD,课题,“,对用后均法进行数据处理的讨论,”,提炼的检索词是:,A,后均法 进行 数据处理,B,后均法 数据处理,C,后均法 进行 数据处理 讨论,D,用 后均法 数据处理,检索图书,求医不如求己,的全文,应选择:,A,EI B,读秀学术搜索,C,万方学位论文数据库,D,中国期刊网期刊全文数据库,以下哪个数据库可以用于检索期刊论文:,A.,超星数字图书馆,B,PQDT C,万方数字化期刊,D,中国知网优秀博硕论文库,中国期刊网,的,“,主题,”,字段表示同时搜索文献的:,A,题名,/,摘要,B,题名,/,关键词,C,关键词,/,摘要,D,题名,/,摘要,/,关键词,以下哪个属于全文数据库:,A,、,EI Village 2 B,、,CSA C,、,Els,e,vier D,、,A&HCI,下列哪个数据库提供了美国四大报告的检索?,A,CSA B,WEB OF SCIENCE C,elsevier D,OCLC FIRST SEARCH,本讲主要内容,搜索引擎概述,搜索引擎类型,典型搜索引擎介绍,Google,、百度、,scirus,搜索引擎的检索方法和策略,2012,年中国网民搜索行为研究报告,购物搜索转化率高,手机购物搜索与线下购物行为联系更为紧密,购物搜索转化率极高,网上购买行为尤为突出。根据调查,网民在电脑上搜索完购物信息后,超过,90%,的用户会选择购买,其中线上购买情况较多的用户比例为,39.7%,,线上线下购买情况差不多的用户比例为,30.7%,。其中,商品价格、产品信息、用户点评是网民购物搜索时最关注的三类信息。调查发现,网民在手机端购物搜索后的转化率略低于电脑端,分析认为主要有两个原因:一方面,手机端由于支付不便等原因影响了商品查找后的购买;另一方面,手机使用偏碎片化时间,很多女性用户会使用手机查看衣服化妆品以满足对衣服饰品的兴趣或打发零散的时间,而不一定是出于真实的购买意愿。但值得注意的是,手机购物搜索后,线下购买情况较多的用户比例高于电脑端,说明手机购物搜索与网民线下购物行为联系更为紧密,原因在于手机由于其便携性可以使用户在线下购物过程中随时随地快速查找产品信息。,对网民搜索行为进行调查,2012,年中国网民搜索行为研究报告,综合搜索引擎使用最多,更偏向基础信息查询,网民在搜索信息时使用综合搜索引擎的用户比例最高,但信息相对基础。调查发现,网民在综合搜索引擎上查询信息更多偏向于新闻、小说、娱乐等综合类的基础信息,对于购物、旅行等商务类应用信息的查询偏少。而专业垂直搜索引擎在针对性以及一站式服务的优势提升了其在商务服务领域的优势。以旅游搜索为例,旅行网站站内搜索和垂直搜索引擎搜索用户虽然较少,但这部分用户是真正商务价值所在,是查询酒店、旅行社、机票等信息的核心人群。但不可否认,无论对于综合搜索、垂直搜索甚至站内搜索之间,彼此都存在很大竞争关系。,对网民搜索行为进行调查,2012,年中国网民搜索行为研究报告,微博成为网民搜索新入口,搜索将成为未来微博营销的核心增长点,微博聚集大量用户,且凭借用户发表、评论、分享的优势,已经成为互联网主要的信息源之一。根据调查显示,有,93.5%,的微博用户在微博上搜索过信息。其中,有,28.0%,的微博搜索用户每天都在微博上搜索。在微博搜索内容上,以热点新闻事件的搜索比例最高,为,70.4%,;其次为朋友信息和名人信息的搜索,比例分别为,64.6%,和,53.7%,,与国内微博的信息功能和社交功能相吻合。此外,有,27.5%,的用户在微博上搜索过品牌信息,有,19.6%,的用户搜索过厂商信息,购物信息的搜索凸显了微博的产品营销价值。,对网民搜索行为进行调查,2012,年中国网民搜索行为研究报告,手机搜索占有较大用户市场,但仍存在提升空间,搜索引擎作为互联网中的基础应用,是网民在互联网中获取所需信息的重要工具,影响着网民生活的各个方面。随着移动互联网的发展,越来越多的网民开始使用手机进行信息搜索,以随时随地查找信息。但相比电脑搜索市场,手机搜索不论是从用户规模还是从用户查找情境等各方面,还存在较大的提升空间。,对网民搜索行为进行调查,搜索引擎概述,指根据一定的,策略,、运用特定的,计算机程序,从,互联网,上搜集,信息,,在对信息进行,组织,和,处理,后,为用户提供,检索,服务,将用户检索相关的信息展示给用户的,系统,。,从广义上讲是用来对网络信息资源管理和检索的一系列软件,在,Internet,网上查找信息的工具或系统,起源:,1990,年加拿大蒙特利尔大学学生,Alan Emtage,开发的,Archie,。,基本思想:,所有网页都可能有连向其他网站,那么从跟踪,一个网站的链接开始就有可能检索到整个互联网。,发展:,由于,Archie,深受欢迎,受其启发,,Nevada(,美国的内华达州,)System Computing Services,大学于,1993,年开发了一个,Gopher(Gopher FAQ),搜索工具,Veronica(Veronica FAQ),。,Jughead,是后来另一个,Gopher,搜索工具。,1994,年,1,月,第一个既可搜索又可浏览的分类目录,EINet Galaxy(Tradewave Galaxy),上线。除了网站,搜索,它还支持,Gopher,和,Telnet,搜索。,1994,年,,Yahoo!,和,Lycos,的出现成功地使搜索引擎,的概念深入人心。,1995,年后。搜索引擎进入了高速发展时期,被誉,为仅次于门户网站的互联网第二大核心技术。,一般由搜索器、索引器、检索器和用户接口四个部分组成,搜索器:,其功能是在互联网中漫游,发现和搜集信息,索引器:,其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表,检索器:,其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息,用户接口:,其作用是接纳用户查询、显示查询结果、提供个性化查询项。,组成,从互联网上抓取网页,利用能够从互联网上自动收集网页的,Spider,系统程序,自动访问互联网,并沿着任何网页中的所有,URL,爬到其它网页,重复这过程,并把爬过的所有网页收集回来。,索引库的建立,由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在,URL,、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。,用户检索式的处理,当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。,检索结果输出,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。,主要包括以下几个步骤:,工作原理,搜索引擎类型,按照数据收录范围分,水平搜索引擎,垂直搜索引擎,水平搜索引擎,是相对于垂直搜索引擎而定义的,它就是我们传统意义上的搜索引擎,它的资源包罗万象,用户可以通过在检索栏中输入检索词来检索几乎何类型、任何主题的资源。但是鉴于水平搜索引擎收录的资源范围广,仅限于水平面上搜索,搜索深度不深、相关度较低等,人们提出了专业垂直搜索引擎。,典型的水平搜索引擎有:,百度,中文搜索引擎:,专门查询各种号码的搜索引擎,(,1),搜索结果的形式不同,。,水平搜索引擎提供的搜索结果是网页链接,其中匹配的原则是网页描述与关键字的相关度。,垂直搜索引擎提供的搜索结果是结构化的数据,几乎不需要用户具体打开网页就可以断定是否是自己需要的结果。,(2),搜索结果的排列方式不同,。,水平搜索引擎是按照系统设定的排序算法,自动根据相关性将网页排列,它的用户不能自主选择排列方式,只能被动的接受搜索引擎的排列顺序。,垂直搜索引擎的排列方式可以由用户设定,用户可以自主选择按照相关度等多种方式进行排序。这为用户更好地找到需求的信息很有帮助。,(3),搜索结果的查全率和查准率不同。,水平搜索引擎的结果经常是数量巨大的,而垂直搜索引擎因为检索的网站数目有限而相对较少。由此可以看出,水平搜索引擎的结果覆盖面比较广,而垂直搜索引擎的覆盖面相对有限。但是,从查准率的角度看,垂直搜索引擎的准确率很高,几乎可以达到,96%,以上。因为这些特定的信息都是在特定的相关网站上查找的,所以可以保证它的准确性。但是对于水平搜索引擎而言,因为搜索引擎在广泛的互联网上查找,另外用户也不可能准确地表达信息需求,所以准确率相对比较低。,(4),搜索结果的描述内容不同,。,水平搜索引擎在搜索结果中提供描述的内容包括标题、描述、,URL,链接三个部分。所以这些描述更多的是当前,URL,链接上的网页整体内容的介绍,而不是针对用户检索的特定信息的介绍。,垂直搜索引擎对搜索结果的描述针对性很强,从多个角度描述用户查找的特定信息。这样,用户几乎不需要点击链接就可以直接判断哪条检索结果是最需要的信息。,不同点,信息服务策略比较:,信息服务策略指的是信息服务活动中的服务方式和手段的组合和运用。在这两种搜索引擎中,服务方式存在很多共性,但在服务手段上存在着很大差异。,(1),从服务者的能动性方面,。两种搜索引擎都是被动服务方式,即都是在用户提出服务请求之后,搜索引擎才采取策略展开服务。,(2),从提供服务的时间方面。,两者在返回结果的时间上存在差异。虽然前面谈到垂直搜索引擎的结果数量相对于水平搜索引擎来说少得多,但是它的返回时间一般比水平搜索引擎长很多。,(3),从信息服务产品经营方面。,两种搜索引擎目前都是无偿服务,即对搜索信息的用户而言是免费服务。,(4),两种搜索引擎在服务者与用户于服务活动中的空间距离方面,都是运用网络搜索技术对网页进行抓取和分析,并整理成用户可以浏览的形式展现给用户。但是在运用具体的技术方面有所差异。水平搜索引擎是在整个互联网的网页中查找信息,依赖于搜索技术,抓取、索引、排序等技术。垂直搜索引擎只在特定主题的网站上查找,然后要对这些非结构化的信息进行提取。搜索引擎的,Spider,抓取网页后,采用的是网页结构化信息抽取技术、元数据采集技术、分词技术、索引技术等信息处理技术。,不同点,信息服务模式比较:,信息服务模式主要指的是搜索引擎与用户交互的方式,即用户在使用搜索引擎查找信息时对搜索引擎的操作、反馈、再使用的过程模式。通过对服务模式的比较,可以看出不同种类的搜索引擎与用户之间检索结果的浏览中,不断调整自己的提问要求,逐渐找到相对准确地需求表达式。,垂直搜索引擎的用户只需要一次输入关键字,就可以准确地找到需要的信息,;,如果这种信息没有被查找到,用户就没有办法来解决,因为没有其它的检索词可以更换,只能选择更换另外的一种搜索引擎扩大检索范围。,在实际工作中得知,搜索引擎的使用由通用到专业目前来看是一种趋势。传统的水平搜索引擎只能够一股脑给你信息。从这个角度讲,信息多了会造成一部分搜索结果是垃圾,而垃圾会影响用户的感受,以及持续使用该搜索引擎的兴趣。,而垂直搜索引擎应当可以更好地做到懂得用户的需求,从而给出更好的结果,在个性化服务上做得更好。,不同点,目录式搜索引擎,全文搜索引擎,元搜索引擎,按照工作方式分,目录式搜索引擎,目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(,Keywords,)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的,Yahoo,雅虎。其他著名的还有,Open Directory Project,(,DMOZ,),LookSmart,、,About,等。国内的搜狐、新浪、网易搜索也都属于这一类。,优点:使用户清晰方便地查找到某一大类信息,尤,其适合那些希望了解某一范围内信息,并不严,格限于查询关键字的用户。,缺点:搜索范围较全文搜索引擎要小许多,尤其是,当用户选择分类不当时,可能遗漏某些重要的,信息源。,全文搜索引擎,是名副其实的搜索引擎,国外具代表性的有,Google,、,Fast/AllTheWeb,、,AltaVista,、,Inktomi,、,Teoma,、,WiseNut,等,国内著名的有百度(,Baidu,)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。,优点:信息量大、更新及时、毋需人工干预,缺点:返回信息过多,需筛选无用信息,从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(,Indexer,),俗称,“,蜘蛛,”,(,Spider,)程序或,“,机器人,”,(,Robot,)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的,7,家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如,Lycos,引擎。,元搜索引擎,元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有,InfoSpace,、,Dogpile,、,Vivisimo,等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如,Dogpile,,有的则按自定的规则将结果重新排列组合,如,Vivisimo,。,优点:,返回结果的信息量更大、更全,。,缺点:,不能够充分使用所使用搜索引擎的功,能,用户需要做更多的筛选。,非主流搜索引擎,1,、集合式搜索引擎:如,HotBot,在,2002,年底推出的引擎。该引擎类似,META,搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的,4,个引擎当中选择,因此叫它,“,集合式,”,搜索引擎更确切些。,2,、门户搜索引擎:如,AOL Search,、,MSN Search,等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。,3,、免费链接列表(,Free For All Links,,简称,FFA,):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起,Yahoo,等目录索引来要小得多。,搜索引擎的检索方法与策略,简单搜索:输入一个单词(关键词)进行搜索,,也叫单词搜索,词组搜索:指输入两个单词以上的词组(短语),,提交搜索引擎检索并反馈结果,也叫,短语检索词组或短语放在引号,“”,内,,这样得到的结果最精确。,常用检索方法,语句搜索:输入任何自然语言问句,提交搜索引擎检索,并反馈结果。(并非所有的搜索引擎都支持),目录搜索:按搜索引擎提供的分类目录逐级检索,用户,一般不需要输入检索词,而是按照检索系统,所给的几种分类项目,选择类别进行检索,,也叫分类搜索。,高级搜索:用布尔逻辑组配方式检索,也叫定制检索。,其他检索方法,搜索引擎中常用的操作逻辑符是,:AND,、,OR,、,NOT,。,与,:用,and,或者*表示,如:问题*中国,检索同时包含,A,和,B,的文献;,或,:用,or,或者,+,表示,如:信息,+,知识,检索含有,A,或者含有,B,的文献,或者同时包含,A,和,B,的文献;,非,:用,not,或,-,表示,如:飞机,-,直升机,检索包含,A,,但不包含,B,的文献。,逻辑操作符,不同的搜索引擎有不同逻辑操作符,(,1,)布尔逻辑算符,AND,,,OR,,,NOT,;如,Excite,(,2,),“,+,”,和,“,-,”,的使用:在一般的搜索中可用,“,+,”,来指定检索结果必须包括某个词,用,“,-,”,来指定检索结果中必须排除某个词。如检索式:,+A+B,microwave-hospital,。如,Yahoo,(,3,)空格和,空格一般表示,“,与,”,,一般表示,“,或,”,。如,Google,和搜狐。,1,、明确搜索目标,2,、选择合适的搜索工具,判断标准:快速,(搜索工具内部应该有一个含有时间变量 的数据库,能保证所查询的信息都是最新和最全面的。)、,准确,(相当准确的搜索程序,搜索精度高,查到的信息总能与要求相符)、,易用(,能否搜索整个互联网?搜索结果出来后,能否改变描述的长短或改变显示结果页面的数量?)、,强劲,(既有简单查询的能力,也有高级检索的功能),3,、制定搜索的检索式(关键词),4,、根据结果重复搜索过程,5,、分析、评估所找到的信息,搜索策略,随搜索工具的变化及外界环境的变化,搜索策略也应该相应变化。尝试了解更多的搜索工具。检索到有价值的信息。,典型搜索引擎介绍:,Google,、百度、,Scirus,Google,Google,是全球最大的并且最受欢迎的,搜索引擎,,主要的搜索服务有:网页搜索,图片搜索,视频搜索,地图搜索,新闻搜索,购物搜索,博客搜索,论坛搜索,学术搜索,财经搜索等。,Google,创始人,Larry Page,(拉里,佩奇,)和,Sergey Brin,(谢尔盖,布林)在,斯坦福大学,的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息,搜索者,。,1998,年,9,月发明,,,Google Inc.,于,1999,年创立。,2000,年,7,月份,,Google,替代,Inktomi,成为,Yahoo,公司的搜索引擎,同年,9,月份,,Google,成为中国网易公司的搜索引擎。,98,年至今,,GOOGLE,已经获得,30,多项业界大奖。,创立,“,Google,”,一词源于单词,“,Googol,”,,据说是因拼错而产生的。,“,Googol,指的是,10,的,100,次幂,写出的形式为数字,1,后跟,100,个零。,Google,公司采用这个词显示了公司想征服网上无穷无尽资料的雄心。,Google,词义的另一种解释:,G,意义为手。,00,为多个范围,,L,意为长,,E,意为出,把它们合一起,意义为:我们,GOOGLE,无论在哪里都能为您找出很长的一大堆您想要的东西。,名字由来,.hk/,地址,GOOGLE,支持多达,132,种语言,包括简体中文和繁体中文;,GOOGLE,网站只提供搜索引擎功能,没有花里胡哨的累赘;,GOOGLE,速度极快,据说有,8000,多台服务器,,200,多条,T3,级宽带;,GOOGLE,的专利网页级别技术,PageRank,能够提供高命中率的搜索结果;,GOOGLE,的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;,GOOGLE,的,“,网页快照,”,功能,能从,GOOGLE,服务器里直接取出缓存的网页。,特色,独特的搜图功能。,相比而言,,Google,的搜图功能是其它搜索引擎所没有的,,Google,据说能搜索近四亿多张的图片。在,Google,的,SEO,中点击,“,图像,”,便可进入其图像搜索操作界面。你可在关键字栏内敲进描述图片内容的关键字,如,“,巩俐,”,,这样就会搜到大量有关巩俐的图片。图片的排列标准到底有什么规律,目前还很难看出。搜索结果为您提供了一个很直观的缩略图版以及对这个缩略图片的简单描述,比如图像文件的大小、名称等。,特色,号称自己为,“,互联网上最好用的图像搜索工具,”,。,Google,图像搜索目前支持的语法包括基本的搜索语法如,“,”,、,“,-,”,、,“,OR,”,、,“,site,”,和,“,filetype:,”,。其中,“,filetype:,”,的后缀只能是几种限定的图片类似,如,JPG,,,GIF,等。,示例:查找南航校园网内飞机的图片,检索式:飞机,site:,特色,英文在线的活词典。,充分利用,Google,的搜索特性可以充当一个在线活词典的角色。无论是你想查找某个词的意思还是想了解某个词的用法,都可将,Google,作为一个在线活词典。进入英语,G oogle,,敲入你想查的单词,比如想查一下,suggest,的用法,这时浏览器就会带你进到有关网站,然后就能看到单词,suggest,下有一道横线,点这个链接,就跳到另一个网站,,Google,已把单词提交给这个网站的查询脚本。,特色,出色的页面翻译,。,我们在浏览页面时,除了中文网页,还有很多英文或者其它文字的页面。中文当然没问题,你也懂些英文,但你不见得就能懂法文、德文、拉丁文。如果搜索出的页面是这些文字怎么办?,G oogle,为您提供了不错的网页翻译功能。虽然目前只能支持有限的法语、拉丁语、德语、葡萄牙语和西班牙语,但我们得承认,这种功能已经很难得了。机器翻译是个很前沿的人工高智能课题,您指望翻出的结果和专门用目标语言撰写的内容相同在目前是不可能的,至少能让您看明白。,特色,极强的新闻网站群。,Google,的四大功能模块之一便是新闻组搜索。点进,“,新闻群组,”,,你会发现这里有着世界上几乎全部著名的新闻大网站的链接,敲入关键词后,,google,就会在这些大网站中搜索。同时提供了各种主题的讨论区,可以直接点进。不理想的是,其内容多以英文居多。,特色,手气不错:,是,Google,首页搜索框中最显眼的两个按键之一(另一个自然是,“,Search,”,),用户如果在搜索中选择按下这个按键,将会被直接带到,Google,认为,“,最准确,”,的搜索结果,节约你的搜索时间。,特色,直接进入最符合搜索条件的网页,集成化的工具条:,为了方便用户,,Google,提供了工具条,集成于浏览器中,用户无需打开,Google,主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面,PageRank,等。最方便的一点在于用户可以快捷的在,Google,主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。安装,Google,的工具条,可以访问,“,toolbar.G(用时,0.,25,秒),找到约,26,200,000,条结果(用时,0.21,秒),基本搜索语法,非,不区分大小写,逻辑,“,与,”,:用空格表示,逻辑,“,非,”,:用,“,-,”,表示,减号前必须留一个空格,逻辑,“,或,”,:用,“,OR,”,表示,短语检索:用引号,搜索引擎最基本的语法,“,与,”“,非,”,和,“,或,”,,这三种搜索语法,Google,分别用,“,”,(空格)、,“,-,”,和,“,OR,”,表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用,“,”,连起来),目标信息不能含有的关键字(用,“,-,”,去掉),目标信息可能含有的关键字(用,“,OR,”,连起来)。,基本搜索语法,杂项语法,1,通配符问题,很多搜索引擎支持通配符号,如,“,*,”,代表一连串字符,,“,?,”,代表单个字符等。,Google,对通配符支持有限。,它目前只可以用,“,*,”,来替代单个字符,而且包含,“,*,”,必须用,引起来。比如,,“,以*治国,”,,表示搜索第一个为,“,以,”,,末两个为,“,治国,”,的四字短语,中间的,“,*,”,可以为任何字符。,关键字的字母大小写,Google,对英文字符大小写不敏感,,“,GOD,”,和,“,god,”,搜索的结果是一样的。,搜索整个短语或者句子,Google,的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作,“,与,”,操作符。示例:搜索关于第一次世界大战的英文信息。搜索:,world war I,搜索引擎忽略的字符以及强制搜索,Google,对一些网路上出现频率极高的英文单词,如,“,i,”,、,“,com,”,、,“,www,”,等,以及一些符号如,“,*,”,、,“,.,”,等,作忽略处理。,如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的,“,+,”,号,杂项语法,2,注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。,对搜索的网站进行限制,“,site,”,表示搜索结果局限于某个具体网站或者网站频道,如,“,”,、,“,”,,或者是某个域名,如,“,”,、,“,com,”,等等。如果是要排除某网站或者域名范围内的页面,只需用,“,-,网站,/,域名,”,。,注意:,site,后的冒号为英文字符,而且,冒号后不能有空格,否则,,“,site:,”,将被作为一个搜索的关键字。此外,网站域名不能有,“,http,”,以及,“,www,”,前缀,也不能有任何,“,/,”,的目录后缀;网站频道则只局限于,“,频道名,.,域名,”,方式,而不能是,“,域名,/,频道名,”,方式。诸如,“,金庸,site:鲁迅的中文,(,简体,),网页。共约有,9060,项查询结果,搜索用时,0.34,秒。,查询某一类文件(往往带有同一扩展名),“,filetype:,”,-GOOGLE,特色查询,不过功能已经非常强大,可以做很多意想不到的事情哦。,Google,已经可以支持,13,种非,HTML,文件的搜索。除了,PDF,文档,,Google,现在还可以搜索,Microsoft Office(doc,ppt,xls,rtf,)、,Shockwave Flash(swf),、,PostScript(ps),和其它类型文档。新的文档类型只要与用户的搜索相关,就会自动显示在搜索结果中。,示例:搜索关于电子商务(,ECOMMERCE,),的,PDF,文档。,搜索:,“,ecommerce filetype:pdf,”,搜索技巧,结果:已向英特网搜索,ecommerce filetype:pdf.,共约有,377,000,项查询结果,搜索用时,0.19,秒。,搜索的关键字包含在,URL,链接中,“,inurl,”,语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如,“,MP3,”,、,“,GALLARY,”,等,于是,就可以用,INURL,语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。,INURL,语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。,示例:查找,MIDI,曲,“,梁博,”,。,搜索:,“,inurl:mp3,梁博,”,注意:,“,inurl:,”,后面不能有空格,,GOOGLE,也不对,URL,符号如,“,/,”,进行搜索。例如,,GOOGLE,会把,“,cgi-bin/phf,”,中的,“,/,”,当成空格处理。,搜索技巧,结果:已搜索有关,inurl:mp3,梁博的中文,(,简体,),网页。共约有,25,400,项查询结果,搜索用时,0.21,秒。,搜索的关键字包含在网页标题中,intitle,网页标题,就是,HTML,标记语言,title,中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。,示例:查找巩俐的照片集。,搜索:,intitle:,巩俐,写真集,搜索技巧,结果:已搜索有关,intitle:,巩俐,写真集,的中文,(,简体,),网页。共约有,36,600,项查询结果,搜索用时,0.21,秒。,搜索所有链接到某个,URL,地址的网页,如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而,“,link,”,语法就能让你迅速达到这个目的。,示例:搜索所有含指向,“,”,链接的网页。,搜索:,“,link:,”,注意:,“,link,”,不能与其他语法相混合操作,所以,“,link:,”,后面即使有空格,也将被,GOOGLE,忽略。,搜索技巧,结果:已搜索有关,link:,的中文,(,简体,),网页。共约有,592,项查询结果,搜索用时,0.09,秒。,高级检索,高级检索,高级检索功能,可以排除某个特定站点的网页,(,限定,网域,),可以对检索结果页面的语言类型进行限制(限定,语种,),可以限定检索结果的,时间,范围(更新日期),可以限定,关键词出现的位置,(字词位置),可以检索链向某一个网页的所有页面(键连功能),可以检索与某一个网页相关的所有网页(相似网页检索),高级检索示例,输入检索条件,图片搜索,号称,“,互联网上最好用的图片搜索工具,”,图像搜索的工作原理:,Google,分析页面上图像附近的文字、图像标题以及许多其它元素来确定图像的内容。,Google,还使用复杂的算法来删除重复的内容,并确保在搜索结果中首先显示质量最好的图像。,Google,图像搜索目前支持的语法包括基本的搜索语法如“”、“-”、“,OR”、“site”,和“,filetype:”。,其中“,filetype:”,的后缀只能是几种限定的图片类似,如,JPG,GIF,等,搜索图片一般性结论:如果要搜索的图片是分散的,则用,google,图片搜索;如果要搜索的图片通常是处于某个图片集合中的,则不适合用,google,图片搜索,学术搜索,含期刊论文、学位论文、图书、预印本、文摘、技术报告等学术文献,文献源自学术出版物、专业学会、预印本库、大学及网上学术论文。,按相关度排序,考虑全文、作者、出版物及被引情况。采取自动分析与抽取引文的方法,了解有关某一领域的学术文献,;,某一作者的著述,并提供,书目信息,中文学术搜索的文献来源于万方和维普资讯,学术搜索,Stand on the shoulders of giants,许多学术研究是建立在他人的基础上,地图搜索,Google,地图是,Google,提供的服务,为使用者提供强大、使用者友善的地图技术以及本地公司资讯,包括公司位置、联络资讯以及行车路线指示。,Google,地图通过很多来源收集信息,从而提供最佳的地图。,地图搜索,Google earth,我们了解了谷歌的一些有趣的内容,希望你也能去探索。,我们展示了谷歌的很多应用,这些应用并不是谷歌的全部,即使谷歌的全部应用也只是网络信息环境中的很小一部分。沧海一粟的感觉真的让个人感觉很渺小。你现在是否理解了,“,网上冲浪,”,?,百度,百度(,Nasdaq,简称:,BIDU,)是全球最大的中文,搜索引擎,2001年10月22日正式发布,是全球最大的中文搜索引擎,其功能完备,搜索精度高,在中文搜索的支持方面有些地方甚至超过了,Google,,是目前国内技术水平最高的搜索引擎,其独创的核心技术,“,超链分析,”,是新一代搜索引擎的关键技术,已为世界各大搜索引擎普遍采用。,2000,年,1,月由,李彦宏,、,徐勇,两人创立于北京,中关村,,致力于向人们提供,“,简单,可依赖,”,的信息获取方式,创立,“,百度,”,二字源于,中国,宋朝,词人,辛弃疾,的,青玉案,元夕,词句,“,众里寻他千百度,”,,象征着百度对中文信息检索技术的执著追求。,名字的由来,百度首页:,逻辑算符,空格=“与”;“|”=“或”;“-”=“非”,基本检索,搜索范围限定,“,intitle:,”,网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式,是把查询内容中,特别关键的部分,用,“,intitle:,”,领起来。,例如,找,林青霞,的写真,就可以这样查询:写真,intitle:,林青霞,注意,,intitle:,和后面的关键词之间,不要有空格。,高级检索语法,限定在特定站点,“,site:,站点域名,”,有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上,“,site:,站点域名,”,。,例如,在新浪里找中国好声音,就可以这样查询:中国好声音,site:,注意,,“,site:,”,后面跟的站点域名,不要带,“,,”,;,另外,,site:,和站点名之间,不要带空格。,高级检索语法,限定在,url,链接中,网页,url,中的某些信息,常常有某种有价值的含义。于是,您如果对搜索结果的,url,做某种限定,就可以获得良好的效果。实现的方式,是用,“,inurl:,”,,后跟需要在,url,中出现的关键词。,例如,找关于,photoshop,的使用技巧,可以这样查询:,photoshop inurl:jiqiao,上面这个查询串中的,“,photoshop,”,,是可以出现在网页的任何位置,而,“,jiqiao,”,则必须出现在网页,url,中。,注意,,inurl:,语法和后面所跟的关键词,不要有空格。,高级检索语法,精确匹配,如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。,例如,搜索,上海科技大学,,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,,“,上海科技大学,”,,获得的结果就全是符合要求的了。,高级检索语法,书名号是百度独有的一个特殊查询语法。在其他,搜索引擎,中,书名号会被忽略,而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影,“,手机,”,,如果不加书名号,很多情况下出来的是通讯工具,手机,而加上书名号后,,手机,结果就都是关于电影方面的了。,语法字符,含 义 及 用 法,intitle:,限定在网页标题中搜索,site:,限定在特定站点搜索,inurl:,限定在,URL,链接中搜索,filetype:,文档类型(如:,doc,、,jpg,、,mpeg,、)限定,例:“信息检索,filetype:all,”,表示结果中含有“信息检索”的所有文档类型的文件,双引号(“”)或书名号(),检索结果的精确匹配,总结,高级检索语法,相关搜索,在搜索结果页面下方提示若干与输入的关键词很相似的查询词,供用户从中选择,结果中找,相当于,“,二次检索,”,,可以帮助用户逐步缩小查找的范围,直至得到最佳结果,调整搜索结果,我们了解了百度的一些有趣的内容,希望你也能去探索。,我们也展示了百度的很多应用,这些应用并不是百度的全部,即使百度的全部应用也只是网络信息环境中的很小一部分。沧海一粟的感觉真的让个人感觉很渺小。你现在是否理解了,“,网上冲浪,”,?,百度校园是百度的一个比较新的频道,由百度校园品牌部运作。百度校园倾听来自校园的声音,展开与校园师生的互动,是百度与学校沟通的桥梁。,校园百度,百度阅读是百度为了满足用户阅读类需求而推出的产品,包含面向版权方的,百度阅读开放平台,和面向阅读类用户的各个展示终端。用户在百度阅读开放平台上提交的资源,百度阅读为用户提供多终端的展现,目前包括百度优质产品:,百度应用,、,百度文库书店,、,百度无线,,多个终端逐步接入中。,百度阅读,支持中英、中日在线互译,支持网页翻译,在输入框输入网页地址即可,提供一键清空、复制功能、支持双语对照查看,使您体验更加流畅,百度在线翻译,Sciru
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服