ImageVerifierCode 换一换
格式:PDF , 页数:4 ,大小:145.77KB ,
资源ID:6024893      下载积分:10 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/6024893.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文(简单的认识搜索引擎.pdf)为本站上传会员【xrp****65】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

简单的认识搜索引擎.pdf

1、云客网云客网 您网站的流量加油站您网站的流量加油站SEO 排名 http:/ referer,但网站 SEO 优化工作,依然不可缺少。因为做 SEO 优化,是为了使网站更加适合搜索引擎的检索行为,为网站带来自然流量。常言道,知己知彼,百战不殆,下面,就和白掌一起来认识一下搜索引擎把。首先,和白掌一起认识一下什么是搜索引擎。搜索引擎,就是在搜索框中,直接输入所需信息的关键词,就可从互联网中获取与搜索词相关信息的软件系统。通常,这些搜索结果会呈现在搜索结果页,搜索到的信息,可能是网页,可能是图像,也可能是其它类型的文件。对于人工实时维护更新的站点,大多情况下,也就是我们所优化的网站,搜索引擎会派

2、出基于一定算法的网站爬虫来抓取站点实时更新的信息。但是,在搜索引擎发展之初,并没有网站爬虫的存在。然后,让我们一起来看一下搜索引擎早期的发展。在互联网发展早期,蒂姆伯纳斯李建立了第一个网站并托管在 CERN(欧洲核子研究组织)的服务器上。后来,蒂姆在这个网站中列举了其它网站,其中尚存有记录的是 1992 年的一次具有历史意义的快照。但随着越来越多服务器上线,这份列表无法及时更新,自后再上线的新服务器,都会出现在 NCSA Mosaic 下一个名为“Whats New”的分类中。第一个被用于在互联网上提供搜索服务的工具时 Archie,这一象征“Archive“的名称,并不包含其中的字母”v“。

3、这一工具,是由蒙特利尔市 McGillUniversity 计算机科学专业的学生 Alan Emtage、Bill Heelan 和 J.Peter Deutschz于 1990 年做成。他们下载了公共匿名 FTP 站点上所有文件的目录列表,创建了一个可对文件名称进行搜索的数据库。但不管怎样,受数据量的限制,Archie不能索引这些站点的内容,只能进行手动搜索。1991 年,Mark McCahill 创建了 Gopher 系统。它的出现促使两大新搜索程序-Veronica 和 Jughead-诞生。类似于 Archie,这两项搜索程序可搜索收录于Gopher 索引系统中的文件名和标题。其中,

4、Veronica 提供了在 Gopher 列表的大多数目录标题中进行关键词搜索的服务,Jughead 则是一个从特定 Gopher 服务器获取菜单信息的工具。当搜索引擎 Archie 的名称还未收录到 Archie 系列丛书中,Veronica和Jughead就已存在于这套丛书中,不过其中会索引Archie相关的内容。1993 年夏天,虽然专业目录有人工维护,但尚没有为 Web 而存在的搜索引擎。Geneva 某大学的 Oscar Nierstrasz 写了一系列 Perl 手稿。Oscar 会在这些手稿中,定期反馈网页的情况,后来他又按照一种标准格式,将这些手稿编辑了一遍。这些手稿,就是之后

5、 W3Catalog 的雏形,web 的第一个原始搜索引擎发布于1993 年 9 月 2 日。-云客网云客网 您网站的流量加油站您网站的流量加油站SEO 排名 http:/ 年 6 月,Matthew Gray 打造了第一个 web robot(搜索引擎爬虫机器人)-the Perl-based World Wide Web Wanderer,并将其用于生成一种叫做 Wandex的索引。Wanderer 存在的目的是为了衡量万维网(World Wide Web)的大小,Web的第二个搜索引擎是Aliweb,它出现于1993年11月。Aliweb没有采用web robot,它是使用一种特定的格式

6、来索引每一个站点的信息。1993 年 12 月,Jonathon Fletcher 创建了 Jump Station 系统。这种系统使用一种 Web Robot 来发现网页并为其建立索引,同时,用一种 web 格式来作为其搜索程序的接口。Jump Station 可以说是世界上第一个 World Wide Web 的搜索引擎。它将网页搜索引擎的三大基本特征-抓取、索引和搜索-集于一体。但是由于 JumpStation 所在平台可用资源的局限性,其索引内容仅限于 web robot 遇到的网页标题和副标题。1994 年,WebCrawler 诞生,它是允许 Web Robot 爬取“全文内容“的

7、搜索引擎之一。与其前辈不同的是,它支持用户搜索任一网页中的任一个搜索词。之后,它成为所有主流搜索引擎的标准,也是第一个被公众所熟知的搜索引擎。同年,卡内基梅隆大学创建了 Lycos。Lycos 是搜索引擎中的元老,最早提供信息搜索服务的网站之一,也是重要的商业典型。1996 年,Lycos 以收录 6000W文件位居当时最大的搜索引擎。随后,互联网中出现很多搜索引擎。这些搜索引擎包括 Magellan 网际网路搜索引擎、EXCITE 搜索引擎、Infoseek 资讯查找、因特通、Northern Light 搜索引擎和 AltaVista,纷纷抢占人气。Yahoo!是当时广受欢迎的搜索方式,但

8、它的搜索功能仅能在它的网页目录下运行,而不是其网页的全文本副本。查询的人也可以浏览目录,而无需进行关键词搜索。1996 年,Netscape 计划在其浏览器打造一款专属自己并极具特色的搜索引擎。消息发出后,对此感兴趣的互联网公司很多,Netscape 就改变计划,与五家主流搜索引擎达成协议,将这五个搜索引擎轮流放在 Netscape 的搜索引擎页。这五家公司分别是 Yahoo!,Magellan,Lycos,Infoseek 和 Exicite。1998 年,Google 从 G 引入了 PPC 的概念,简单的说就是,买卖搜索词,这对于之后搜索引擎商业化具有重大意义,使互联网变现成为可能。在

9、20 世纪 90 年代末期,搜索引擎,也以互联网投资风暴中的明星产品而著称。有些公司高调进入互联网市场,在首次公开募股中均获得了创纪录的收益。有些公司则砍掉了其公共搜索引擎,转型为专门的营销公司,比如 Northern Light。很多搜索引擎公司都遭遇了投机泡沫(1995-2001)期间的互联网泡沫,鼎盛于1999 年,结束于 2001 年。2000 年前后,Google 搜索引擎声名鹊起。正如谷歌后来的创始人 Sergey Brin和 Larry Page 所写的 Anatomy of a Search Engine 一文中所解释的,PageRank 技术的提出采用谷歌搜索可以得到较好的搜

10、索结果。这一为网页排名的迭代算法,是通过互联网浩瀚的超链接关系来确定页面的等级。Google 把从 A 网页到 B 网-云客网云客网 您网站的流量加油站您网站的流量加油站SEO 排名 http:/ A 网页给 B 网页的“点赞”,然后 Google 根据“点赞”网页(甚至来源的来源,即链接到 A 网页的网页)和“被点赞”网页的等级来决定新的等级,简单的说,一个高等级的网页可使其它低等级页面的等级提升。谷歌搜索也一直为其搜索引擎维持一个简洁的页面。相反,谷歌的很多竞争对手都选择将其搜索引擎嵌入到某一门户网站。树欲静而风不止,谷歌因其饱受欢迎一直在被 MysterySeeker 恶搞,比如前段时间

11、谷歌地图中显示白宫是个“黑鬼屋”。2000 年,Yahoo!在 Inktomi 的搜索引擎中提供搜索服务。2002 年,Yahoo!收购 Inktomi,并于 2003 年收购 Overture。2004 年,Yahoo!兼并了 Inktomi 和Overture 的技术,推出自己的搜索引擎,与谷歌成为竞争对手。1998 年秋天,Microsoft 采用 Inktomi 的搜索结果推出 MSN 搜索。1999 年上半年,MSN 开始在 Inktomi 搜索结果中掺杂来自 Looksmart 搜索结果。1999 年有一段时间,MSN 搜索也会采用 AltaVista 的搜索列表。2004 年,

12、Microsoft 开始专注搜索技术,打造自己的 Web Robot。2009 年 1 月 1 日,Microsoft 将 MSN更名为 Bing 并上线。2009 年 7 月 29 日,Yahoo!与 Microsoft 达成合作关系,在这一合作中,Yahoo!可得到 Microsoft Bing 技术的支持。最后,和白掌一起来了解一下搜索引擎的工作。搜索引擎的工作通常分为三个步骤,即爬行、索引,搜索。简单地说,搜索引擎会存储标记有 html 的网页,这些网页通常都是网站爬虫(有时也称作蜘蛛)抓取来的。而网站爬虫,会定期到访网站,并爬行网站内容的自动程序。站长可通过 robots.txt 文

13、件来排除不希望被爬虫抓取的页面。爬虫将页面内容抓取回来后,搜索引擎会对这些内容进行分析,以确定如何索引这些内容,例如,搜索引擎会从网页的标题、网站内容、题目或 Meta 标签中提取出关键词。网页的数据会存储至索引库,用于之后的搜索词搜索。用户的搜索词可以是单个的词,索引会帮助用户尽可能快的找到搜索词相关的信息。搜索词处理用户在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对搜索词进行处理,如中文特有的分词处理,去除停止词,判断是否需要启动整合搜索,判断是否有拼写错误或错别字等情况。搜索词的处理必须十分快速。排序对搜索词处理后,搜索引擎程序便开始工作,从索引数据库中找出所有包含搜索词的网页,并且根据排名算法计算出哪些网页应该排在前面,然后按照一定格式返回到“搜索”页面。-云客网云客网 您网站的流量加油站您网站的流量加油站SEO 排名 http:/ SEO 的帮助,搜索引擎常常不能正确的返回最相关、最权威、最有用的信息。

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服