1、搜索引擎优化培训教程(2007-03-02) 本内容部分参照 胡宝介 的《搜索引擎优化(SEO)知识完全手册》,40%为原创。 前言 正确认识搜索引擎优化 第一部分:域名和主机对 SEO 的影响 域名选择与 SEO 主机选择与 SEO 第二部分:搜索引擎优化的核心:关键字策略 关键字的选择 关键字密度 关键字分布 第三部分:对搜索引擎友好的网页设计制作 目录结构和 URL 导航结构 框架结构 图像优化 表格使用 网页减肥 第四部分:SEO 指导下的技术支持 Title 和 Meta 标签 动
2、态网页优化 第五部分:搜索引擎优化的重点:链接策略 搜索引擎分类目录 高质量导入链接 导出链接和内部链接 关键词链接文本及上下文语意 第六部分:走在钢丝上的搜索引擎优化作弊 SEO 作弊手段 搜索引擎对作弊的处罚 第七部分:Google 、百度 Google 百度 第八部分:网站优化流程 前言:正确认识搜索引擎优化 真正的 SEO 是通过采用易于搜索引擎索的合理手段,使网站对用户和搜索引擎更友好 (Search Engine Friendly),从而更容易被搜索引擎收录及优先排序。搜索引擎优化是 一种搜索引擎营销指导
3、思想,而不仅仅是对 google 的排名。搜索引擎优化工作贯穿网 站策划、建设、维护全过程的每个细节,值得网站设计、开发和推广的每个参与人员了解其 职责对于 SEO 效果的意义。 优化好的网站,从搜索引擎来的流量将会有很大的提高,不过这仅仅是能带来用户,而真正能够留住用户的是网站的内容。所以搜索引擎优化仅仅辅助手段,在网站建设的过程中仍然要将大部分精力放着网站内容的完善上。 第一部分:域名和主机对 SEO 的影响 一、域名选择与 SEO 1. 域名与 IP: 每一个网站的域名对应一个 IP 地址,通常大部分中小企业网站都存放
4、在由一台服务器划分出来的若干虚拟主机上,由多个网站共享一 台服务器和 IP 地址,一些 WEB 服务器中有成百上千个域名共享一个 IP 地址的情况。这样对站长来说成本较低,但对网站的搜索引擎排名带来以下潜在风险: a.共享主机的其他网站如果被搜索引擎惩罚,将或多或少波及你的网站。对此,某搜索引擎曾 有如下忠告:“如果同一 IP 下有一个网站作弊,那么我们的搜索引擎会对该 IP 下的所有网 站进行惩罚”;不过幸运的是,大部分搜索引擎不会如此武断,如 Google、baidu,一般是不会进行 这种连带性惩罚的。 不过风险还是有的,要尽量避免。 提示:你要做的事是获得你的域名所在主机上所有的
5、域名是否被搜索引擎惩罚,来判断你的域名放在这里是否安全。 问题1:如何获得域名对应的IP呢? 回答:使用123cha IP查询、 IP查询,这是查询我的网站的例子。 问题2:如何获得该服务器上有多少个域名呢? 回答: 登录 查询,通常能显示部分域名。全部的需要花钱购买。 例如:61.135.129.236 显示: There are 11 domains hosted on this IP address. Here are a few of them: B D E S S 问题3:如
6、何查询一个域名是否被搜索引擎惩罚? 回答:1.查看该域名的注册时间。 因为一个刚刚注册的域名,没有被收录是很正常的。 到中国万网查询。 例如:查询,,supercss查询。 获得注册时间 2004-09-06 09:52。 时间很久了,应该被搜索引擎收录。 2.查询是否被搜索引擎惩罚。 例如:在google里输入 site: ,如果有结果,就正常的。如果没有,就是惩罚了,例如:site: ,这是我朋友的一个网站,以前收录最高达到10000页,后作弊被K。 b.如果搜索引擎对有些 Spammer 服务器进行了惩罚,其 IP 被认为是 Spam,则连带该 IP 下 的所有
7、网站都会受到牵连,使这些网站的排名下降或在搜索引擎中被清除。 问题3:Spammer 是什么? 回答:Spammer 垃圾邮件发送者。 通常网络提供商的虚拟主机很少将邮件服务器放着上面的,所以这个可不必担心。如果是自己使用的独立服务器,同时用作邮件服务器的话,经常发生垃圾邮件,将会导致IP被查封。 问题4:申请新域名的时候需要注意什么? 回答:要申请的新域名可能以前被人使用过,到期了没有续费,在注册时,仍然可以注册,在google里面可能会存在以前的信息,或者曾经被搜索引擎惩罚过,所以要先搜索一下这个域名以前是否存在过。 方法:www.archive.org查询域名的历史
8、信息。 总结:找主机提供商一定要找信誉好的提供商。 2.二级域名(次域名): 二级域名形式如:,而不是 。拥有自己的独立域名是 网站对搜索引擎友好的基础。目前有很多网站提供免费空间,如博客(Blog)免费空间, 企 业免费空间, 免费自助建站,电子商务平台等,通常为用户分配一个二级域名,或页面存放 于网站的某一路径下。 a.使用别人主域名的二级域名的弊端: 解释:主域名是别人的,而二级域名是你自己的。例如: 是某某的, 是自己的。 1.如果你所使用二级域名的主域名受到惩罚,那么你的网站也会受到牵连; 我以前有个网站,做浪
9、潮服务器的,域名在百度上排名很好,后来因为被百度屏蔽,导致我的浪潮服务器网站也被清除。 2.当域名供应商停止营业,那么你辛苦经营的网站也随着你域名的失去而付诸东流; 3.网站流量排名的时候,你所有的流量都会归功于所依托的顶级域名。 alexa 排名 默认就是顶级域名。 问题1:如何规避这些风险呢? 回答:最好为自己的二级域名网站注册一个独立域名,然后做域名转发(免费),目前很多拍卖网的店铺都适合采用此种方法,对顾客访问和网站管理很有用。即使有一天你的二级域名的主站停止营业了,你还可以再做一个相同的网站,因为你的独立域名没有变,老用户仍然可以找到你。 例如:,隐藏目的地址:
10、 通常域名转发是上述方法。 b.使用别人主域名的二级域名的优势: 1.可以借助主域名的资源,使排名快速提升。 举例:汽车,排名在前几位的都是大网站的汽车频道。 i.在去年的虚拟主机关键词排名中,有一个网站很奇特,它主站是阿拉伯语言,而二级域名是中文,这个二级域名没有外链,收录也很少,但排名很高,原因就在于他的主站,PR为7,流量也很大。 ii.还要一阵大部分人使用 BLOG进行排名,主要也是利用主站的资源。例如:我的“浪潮服务器报价”,在百度里面搜索,有两个 ,都排在第一页。 c.使用自己的主域名,发展二级域名的优势: 1.网站流量排名的时候,所有的流量都会
11、归功于所依托的顶级域名。 例如: 是一个免费域名系统。查看它的 alexa流量,它自己的流量仅仅占23%,其他都是二级域名的流量。美姬园 。 2.搜索引擎收录时,二级域名算独立的网站,可以扩大收录页面的数量。 例如:site: 时,收录数量达到12,100,000 项; site: 时,有3,070,000 项; site: 时,有414,000 项; site:时,只有1项。 这就是说,只要不作弊,一个二级或三级域名至少能够收录一页,发展上万个二级域名,使收录的数量大量增加。 总结:根据现有条件,趋利避害,利用好二级域名。 3.域名中的字符: > 取域
12、名的原则除了方便用户访问之外,对搜索引擎而言,涉及到域名中是否包含关键词的问题。英文网页内容的网站如果在域名中含有关键字,或以复合关键字作域名,都应该用短横线隔开。如:www.made-in- 而不是 。这是因为搜索引擎通 常会把分隔符“-”当作一个空格来看待,因而能够识别出你的关键词,为网站排名加分( 尽管影响不是很大)。短横线隔开后的关键词组还可以获得更多的词组搜索结果,如 被认为只有一个词 madeinchina,而 made-in-china 则被看作正常的 made in China 词组。 > 例如在google里面搜索 made in china 。排名第一的是 www
13、made-in-,这个网址不仅好记,而且推广的时候也很方便。 此外,域名的后缀选择也有一定讲究。有一种观点认为:在同等情况下,代表非商业性网站 的后缀.org 和.net 有着比.com 更高的排名优势;对中文网站来说,表示中国域的.cn 和 又比无地区性的.com 有一定优势。 申请域名:万网域名注册 总结:虽然域名的选择作用有限,不过对网站排名也是加分,条件允许还是按照该项操作。 二、主机选择与 SEO 1.主机服务商选择 > 主机对网站的搜索引擎排名影响很大。在寻找主机提供商的时候,千万不要只考虑价格因素。 如果你多次向 G
14、oogle 提交网站,但 Google 却一直没有对其进行索引,则有可能是网站所在的服务器出了问题。因此选择服务器时要特别注意以下几点: a.避免使用免费主机:由于免费主机里面经常会出现 Spammers、镜像网站、桥页等 “搜索引擎垃圾”,很多搜索引擎都不愿意索引免费主机上的网站;同时搜索引擎目录如 Yahoo 也很难收录来自免费主机的商业站点。此外,免费主机的服务很难保证,常常服务器超 载,速度奇慢,宕机频繁,甚至关闭服务,这都会直接影响网站排名。 b.选择有信誉的主机提供商:搜索引擎的索引程序定期或不定期地来访问收录的网站 。对经常更新的网站,Google 的 Googleb
15、ot 漫游器——俗称“蜘蛛”,一般每天都会小 幅度地“爬” 一下,一个月进行一次大的索引。如果蜘蛛在索引时出现网页打不开或下载速度缓慢 ,则放弃索引。所以你的网站在任何时候都要正常工作,以博取蜘蛛的欢心。这就要求网站 存放的主机系统提供快速、稳定、安全的服务,最好有 24 小时客服支持和维护,保证你的网 站快速、可靠、稳定地运行。 > 不稳定的影响:我的服务器重新做系统,当机了2天,导致非常代码网被百度清除。 查询site:,已经不存在了。 问题1:如果服务器在搜索引擎来的时候重启了,会不会有影响? 回答:即使半小时内服务器链接不上,也不会导致搜索引擎排名变化。因为搜索引擎的蜘蛛要
16、来很多次,这次出现网页打不开,会隔一段时间重新索引。 总结:稳定的服务器是优化的最基础的保证 2.主机转移: > 如果你想转移网站的主机服务,要在取消原来的服务提供商之前,先找好新的供应商。先在新的服务商处开个帐号,确保所有的文件都正确无误地传到新服务器上。网站在新服务器上运行无碍后再联系你的原供应商,告知对方将终止合作,但确保他们不会马上关你的网站。再联系你的域名注册商(可能是原主机提供商),变更域名服务器(DNS)。域名服务器的功能就是把你的域名解析成计算机能够识别的 IP 地址。把旧的域名服务器改成新的,这个过程到生效时间大概 24-48 小时之内,少数情况下可能要 7
17、2 小时。这期间,如果一个搜索引擎刚好来抓你的网页,要么抓到旧的 IP 地址上的网站,要么抓到新的域名解析生效后的网站,总之都不会出现网站打不开的空档。 第二部分:搜索引擎优化的核心:关键字策略 一、关键字的选择 首先确定你的核心关键字,再围绕核心关键字进行排列组合产生关键词组或短句。选择关键字有以下技巧: a.站在客户的角度考虑潜在客户在搜索你的产品时将使用什么关键词? 比如:做手机的关键词,自然就想到 诺基亚、三星、摩托罗拉、索爱等。 b.将关键词扩展成一系列词组,如:营销→网络营销→网络营销管 理。 问题1:怎么找相关的词? 回答:通过百度
18、的“相关搜索”,例如 搜索 墨攻,看下面的 相关搜索中, 出现 墨攻下载 墨攻 bt 墨攻bt下载 墨攻票房 墨攻迅雷下载 墨攻剧情等 > 比如要 做 “墨攻 bt”关键词,是选择 “墨攻 bt” 还是 “墨攻bt下载”,原则上是越长的越好,长的包括短的。这样搜索任何一个都可以找到你。 在Google里面搜索, 关键词建议 。 c.不要用意义太泛的关键字。 如果你从事包装机械制造,选择“机械”作为你的核心关键字对你的优化是没有帮助的。实际上,为了准确找到需要的信息,搜索用户倾向使用具体词汇及组合寻找信息,而不是使用那些大而泛的概念。此外,使用意义太广的关键字,也意味着你的网站
19、要跟更多的网站竞争排名,难以胜出。 例如:中国***网 ,它的标题及关键词:
21、度指数。 例如查看“飞机票”每天的搜索量, 1922 次。有些词是搜索不到的,例如:去成都飞机票。这是因为 百度只统计通用的搜索词,太具体就需要成为 百度指数用户。 在Google里面比较你选择的关键词的搜索量。 Google trends 趋势图 g.查询关键词的竞争对手。 在最终确定一个关键词后,还要看有没有竞争对手,竞争对手少的词更容易做上去。 问题1:如何查找竞争对手? 回答: 1.查看该词搜索的结果数量,要加引号""来准确的搜索。 例如:浪潮服务器,搜索结果为194,000篇。 服务器,搜索结果39,200,000篇。 浪潮服务器 比 服务器更容
22、易做上去。 2.目测搜索结果页里面,网页内容是否优化。 方法很简单,就是看所搜索的关键词是不是在Title里面关键的地方出现,和出现的次数。 对于优化了这个关键词的网站,可以登录这个网站看看,代码是不是优化,Meta属性,以及外链。 3.对于产品类的关键词,可以查询百度竞价。 百度竞价,竞价太多的关键词不做。 4.对于竞争过于激烈的词,放弃这个关键词。 总结:最好的关键词是那些没有被广泛滥用而又很多人搜索的词。 二、关键字密度 在确定了自己的关键字之后,需要在网页文本中适当出现这些关键字。 a.控制关键词数量 一页中的关键词最多不要超过 3 个为佳
23、最好是一个,然后所有内容都针对这一个核心关键词展开 ,才能保证关键词密度合理。搜索引擎也会认为该页主题明确。如果确实有大量关键词需要呈现, 可以分散写在其它页面并针对性优化,让这些页面也具有“门页(entry)”的效果。这也是为什么首页和内页的关键词往往要有所区分的原因。最典型的情况是拥有不同的产品和服务的情况下,对每个产品进行单网页优化,而不是罗列在一个首页上。 > 比如:火车票,排名在前面的
24、京飞机票-上海飞机票-广州飞机票-飞机票价格查询-中国票务在线
25、提高关键词密度的方法有两个,增加关键词,或者减去非关键词内容。 总结:关键字最好一页一个,密度一般在 1%到5% 较为合适 。 三、关键字分布 a.网页代码中的 Title,META 标签(关键字 keywords 和描述 description) 例如:浪潮服务器报价
29、合多个搜索引擎索引排序规则,从而得到较好网站排名。
搜索引擎优化 Google 排名、 搜索引擎优化 Baidu 排名 。
c.超链接文本(锚文本)
例如:
搜索引擎优化
d.Header 标签
即正文标题
30、1标签,但是会使界面变的很难看? 回答: > 普通H1标签的效果:
31、性 Alt 中加入关键字是对搜索引擎友好的 好办法,它会认为该图片内容与你的关键字一致,从而有利于排名。
f.域名及路径、文件名。
英文网页内容的网站在进行域名选择和网页文件夹命名时,也可以考虑包含关键字(对关键 词组则要用短横线隔开),如 www.made-in-。不过对 Google 排名作用非常微小。
在google里面搜索langchao,域名或目录中带有langchao的字母就便绿。
排在第四的 ,是我的网站,我并没有针对langchao单词做
32、过任何的优化,只在路径中存在这个字母,说明域名路径中出现关键词还是有作用的 我做的一个例子:浪潮服务器报价,仅仅发布一篇介绍,选择了一个不常用的词组做上去了。 总结:合理分布关键字,是内部优化的核心 。 第三部分:对搜索引擎友好的网页设计制作 一、目录结构和 URL URL 是统一资源定位,即每个网页的网址、路径。网站文件的目录结构直接体现于 URL。清 晰简短的目录结构和规范的命名不仅有利于用户体验和网址传播,更是搜索引擎友好的体 现。 1.目录访问层次: : 即通过几层能够访问到最终页面,Google 最好为三层。 以 www.se
33、ochat.org为例。 www.seochat.org首页为第一层,百度优化为第二层, 百度如何优化为第三层。 这样的结果便于搜索引擎索引。百度如何优化 这个页面在百度和 google 里面都有收录。 问题1:如果我的网站目录层次大于三层,该怎么办? 回答:由于三层的目录,容纳的页面有限,需要多级目录。 这个时候使用前面我们讲过的二级域名的方式扩大级数。因为二级域名算独立网站,目录层次从当前二级域名算起。 例如:搜狐 ,汽车频道 问题2:为什么有的网页在本网站层数很多,也被Google收录呢? 回答:这些页面被其他网站引用,而Google从其他页面进入这个页面也
34、少于三层。 可以使用 link 命令查询该页的反相链接。例如:link: 。 link 命令只能查询3个月前的历史记录,当前的外链需要3个月后查询。 问题3:所有的搜索引擎是否都和Google一样? 回答:不是 百度收录的时候相对 宽容一些,例如:我的网站 天天收藏夹, 在百度里面 收录这个页面外国驻华使馆-天天收藏夹网站目录 而这个页面从首页算起,已经是第五层了。 总结:三层目录,是最佳的目录结构。 2.目录和文件命名: a.根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键词。但如果是关键词 组,则需要用分隔符分开。我们常用连字符“
35、和下划线“_”进行分隔,URL 中还经常出 现空格码“%20”。因此,如果以“中国制造”作文件名,就可能出现以下三种分隔形式: made-in-china.htm made_in_china.htm made%20in%20china.htm 连在一起之后,关键词就失去了意义。但事实上,至少在目前 Google 并不认同“_”为分隔符。对 Google 来说, made-in-china 和 made%20in%20china 都等于 made in china,但 made_in_china 就被读成了 madeinchina, 因此,目录和文件名称如果有关键词组
36、要用连字符“-”而不是下划线“_”进行分隔。 问题1:所有的搜索引擎是否都和Google一样? 回答:不是 在百度图片中,拼音路径比较有效的。 例如:site:www.***.cn,收录大部分都排在第一。 b.URL 应该越短越好。 有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目 录结构。由于 URL 中含有关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。 例如:要做英文关键词 computer,这样的目录 是错误的。 总结:合理的目录命名,可以对网页排名是加分的。 3.绝对 URL 和相对 URL:略
37、> 绝 对 URL : 即 网 页 路 径 使 用 包 含 顶 级 域 名 在 内 的 完 整 的 URL 。 如 : 是一个绝对路径,其中/page1/index.html 则为相对 路径,由浏览器自动在该链接前加上 。 总体上,Google 在排名时并不在意 URL 使用的是相对路径还是绝对路径。 4.动态 URL:略 > 目前很多网站都有数据库驱动生成的 URL,即动态 URL,往往表现为在 URL 中出现“?”、“= ”、 “%”,以及“&”、“$”等字符。动态 URL 极不利于搜索引擎抓取网页,严重影响网站排名, 通常是通过技术解决方案将动态 URL 转化成静态
38、的 URL 形式,如: 将 转化为 下文将会专门提到动态 URL 的解决方案。 问题1:为什么动态页面对搜索引擎不友好呢? 回答:1.因为这样会陷入死循环。这就是所谓的蜘蛛陷阱(spider traps)。 二、导航结构 1.主导航醒目清晰 主导航一般体现为一级目录,通过它们用户和蜘蛛程序都可以层层深入访问到网站所有重要 内容。因此主栏目必须在网站首页第一屏的醒目位置体现,并最好采用文本链接而不是图片。 例如:非常代码网 ,导航栏为一级目录。首 页 程序代码(C) 共享软件(S) 2.“面包屑型(Breadcrumbs)”路径 : > 所谓“面包屑”是比
39、喻用户通过主导航到目标网页的访问过程中的路径提示,使用户了解所 处网站中的位置而不至于迷失“方向”,并方便回到上级页面和起点。路径中的每个栏目最 好添加链接。如下: 例如:外国驻华使馆-天天收藏夹目录 首页 >> 政法军事(27631) >> 国际政治与外交(591) >> 外国驻华使馆(88) 即使没有详细的路径来源,也至少应该在每个子页面提示回首页的链接,包括页面的 LOGO 作链接。良好的目录导航,可以提高网站的流量。 3.首页突出重要内容 : > 除了主栏目,还应该将次级目录中的重要内容以链接的方式在首页或其它子页中多次呈现, 以突出重点。搜索引擎会对这
40、种一站内多次出现的链接给予充分重视,对网页级别 (PageRank)提高有很大帮助,这也是每个网站首页的网页级别一般高于其它页面级别的重 要因素,因为每个子页都对首页进行了链接。 例如:以前很多人使用博客做排名,原因就在于博客首页PR值大,而刚刚更新的博客会出现在首页,如果此时 搜索引擎来索引,收录,对个人博客作用很大,通常能够获得不错的排名。 还有我的非常代码网 小说下载,里面的内容都在 非常代码网 首页出现过,所以流量很大。 4.使用网站地图: > 网站地图(Site Map)是辅助导航的手段,多采用文本链接,以加快页面加载速度。 尤其对于那些采用图片导航和动态技术生
41、成的网页,通过在网站地图中进行文本链接, 可在一定程度上弥补蜘蛛程序无法识别图片和动态网页造成的页面不可见的风险。 需要注意,网站地图也要突出重点,尽量给出主干性内容及链接,而不是所有细枝末节。 一页内不适宜放太多链接。Google 明确提出“如果网站地图上的链接超过大约 100 个,则最 好将网站地图拆成多个网页”。 参考地址:网站管理员支持中心 例如: 若页面太多,可以考虑使用前面讲到的二级域名扩展。 使用工具 Xenu 生成网站地图: 浪潮服务器地图 总结:良好的导航结构能够使搜索引擎收录更多的网页。 5.Google SiteMap: Google新
42、推出的Sitemap,是对原来robots.txt的扩展,它使用XML格式来记录整个网站的信息并供Google读取,使搜索引擎能更快更全面的收录网站的内容。 Sitemap的作用就好像为网站提供了整站的RSS,而Google就是这些RSS的订阅者,只要网站有更新就会自动通知Google。这样一来,搜索引擎的收录由被动的拉变成了主动的推。 Google SiteMap 格式比较简单: 例如:我的Sitemap ,是分成2级的。如果数量比较少,只需要 一级页面。 使用 Sitemap 协议 总结:利用google sitemap,可以提高收录的数量。 三、框架结构
43、 框架结构,即帧结构(Frame),包括IFrame,Frame。 例如:框架结构示例,登录好后即框架结构。
45、无法识别框架,也没有什么兴趣去抓取框架中的内容。此外, 某些浏览器也不支持框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用 “Noframes”标签进行优化,把 Noframe 标签看做是一个普通文本内容的主页。在
46、本内容,对图片文件是视而不见的。同时,图像文件直接延缓页面加载时间,如果超过 20 秒网站还不能加载,用户极有可能离开你的网站。因此, 除非你的网站内容是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片, 更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的有三点:
1. 在保持图像质量的情况下尽量压缩图像的文件大小。
2. Alt 属性:
每个图像标签中都有 ALT 属性,搜索引擎会读取该属性以了解图像的信息。因此,最 好在所有插图的 ALT 属性中都有文字描述,并带上该页关键字在其中。
3.在图片上方或下方加上包含关键词的描述文本;
4.使用链接链接到这个图片。
例如:Google 图片搜索 NP370 浪潮英信NP370 G2排名第一。
Google的图像搜索(Googlebot-Image)和Google的文本搜索(Googlebot)不是同蜘蛛。
总结:避免使用大图片,使用Alt属性、文本或链接优化图片。
2.FLASH 优化:
> Flash 会使页面很好看,不过FLASH 网页有一个非常致命的问题,即大部分搜索引擎无法识别 FLASH 中的信息






