<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>SEM 一家之言 &#187; SEO案例</title>
	<atom:link href="http://www.semyj.com/archives/category/seo-anli/feed" rel="self" type="application/rss+xml" />
	<link>http://www.semyj.com</link>
	<description>关注SEO和PPC</description>
	<lastBuildDate>Sun, 18 Jul 2010 00:26:23 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>网页加载速度是如何影响SEO效果的</title>
		<link>http://www.semyj.com/archives/969</link>
		<comments>http://www.semyj.com/archives/969#comments</comments>
		<pubDate>Tue, 05 Jan 2010 09:34:19 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEO案例]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=969</guid>
		<description><![CDATA[“谷歌中文网站管理员博客”刚刚发表了一篇新文章，介绍了一下《google 网站管理员工具》中推出的新功能 -“网站性能”。这个工具是通过google工具栏记录了用户访问你网站的速度，并给出了很多加快你网站速度的建议。
http://www.googlechinawebmaster.com/2009/12/blog-post_30.html
而最近也传闻google将会把网页加载速度作为影响排名的一个因素。那么网页打开速度是不是能影响SEO效果？如果能影响，那是怎么影响的呢？
在揭示其中的道理之前，我希望大家能把上面那些传闻或“网站性能”的功能都忘掉。让我们追本溯源，来看看网页打开速度和SEO流量之间的关系。
做SEO有时候不需要听从别人给你的信息和意见，你只要专注于研究搜索引擎，同样也能成功的。这种关系的发现，也得益于早期我非常重视数据分析，所以我在《怎么样去学SEO（二）》中把数据分析能力列为SEOer应该具备的四大能力之一。由于有很多数据做支撑，现在我来给大家分析其中的联系，大家就容易看懂很多。
到了后期，连google也认识到了网页速度和SEO流量之间的关系，所以在这个“网站性能”以前就推出过相关的工具来帮助网站管理员。

要说明这种关系，就要从搜索引擎爬虫说起。不知道大家对于搜索引擎爬虫在一个网站上的行为有没有概念，我现在发一下某个网站（不是alibaba）的一些数据出来，大家就能意识到一些爬虫的特性了。下面是从服务器LOG日志中分析出的数据。
&#8212;-
从上面图1中可以看到google访问这个网站206次，这206次里面是由很多个不同的爬虫访问的。图2显示：有的爬虫一天之内来了8次，一共停留了2小时左右，有的爬虫来了1次，停留了20多个小时以上。所以这个网站是被很多个爬虫在不间断的访问的。为了计算方便，可以把google所有的爬虫停留在这个网站的总时间加起来。虽然一天只有24个小时的，但是google的爬虫这一天花在这个网站上的时间可能是成百上千多个小时。这里真实的数据是：在这个网站中，google所有爬虫那天在这个网站上花费的实际总时间是721个小时。
而服务器LOG日志里同样可以分析出爬虫在一个网页上的停留时间。如：
得到了这两个数据以后，用所有爬虫总的停留时间除以单个页面的停留时间，就是搜索引擎爬虫这天所抓取的页面总量。
721 小时× 3600 秒 ÷ 35 秒 = 74160 页
那么得到这个搜索引擎爬虫这天所抓取的页面总量有什么用呢？
对于一般的小网站来说，一天能被抓取 74160页是一个很不错数据。但是我上面给出的是一个中型网站，它整个网站的页面总量有800多万有SEO价值的页面。那么，在最理想的情况下，这些页面被搜索引擎抓取完要花费的时间为：
800万 ÷ 74160 页 = 108 天
这是理论上最理想的情况，实际上真实的情况为：
由于有多个爬虫在抓取网站，有很多的页面在一天之内是会被爬虫重复抓取的。有的页面一天之内被抓取20多次，有的页面一天之内只被抓取1次。通过 “停留总时间 ÷ 单个页面停留时间” 得到的页面数量，是没有去除那些重复抓取的页面的。所以搜索引擎一天之内实际抓取的不重复页面没有74160页那么多，而是40000页的样子。还有一点，爬虫今天抓取的页面，到了明天还有很多会被重复抓取。所以爬虫不光在同一天内会重复抓取很多页面，而且到了下一天还是会重复抓取前一天抓取过的很多页面。
这样下来，爬虫平均每天抓取不重复的页面数量就只有10000页的样子了。那么，要爬虫把这个网站所有的页面抓取完需要的时间为：
800万 ÷  1万页 = 800天
其实，这个800天抓取完整个网站还是太理想化了。实际的情况是很多网站由于结构的原因，有些网页创建后4-5年，都还没被爬虫抓取过。
上面的这个分析过程，都没用到什么惊天动地的计算方法。只要你有一点数据分析的意识，就能看清楚事实的。当一个网站收录量不理想，大家就应该去看看那些页面是不是被搜索引擎爬虫浏览过。如果一个页面都没有被搜索引擎爬虫浏览过，是不可能会被收录的。一个网站的收录量没有上去，那SEO流量的提升就会有很大的一个瓶颈。
根据我们刚才上面的那个分析过程，要提升网站的收录量，首先要解决的就是搜索引擎每天抓取网站的抓取量。而：
抓取量 =   爬虫总的停留时间 ÷ 单个页面的停留时间
一个网站，爬虫总的停留时间在某个期间是保持相对固定的。当然，有方法提高爬虫总的停留时间，不过这不是这篇文章要讲的内容。我们先通过减少个页面的停留时间也可以增加爬虫的抓取量。
减少爬虫单个页面的停留时间，可以简单的认为提高网页加载速度就可以了，虽然实际上这两个因素之间还存在着一个对应关系，但是这里先不讲。这个时候，网页的加载速度就和抓取量之间有了一个正比的关系，网页加载速度越快，爬虫整个的抓取量就越大。抓取量越大，有效收录量就会增加，从而促使SEO流量增加，因为给一个大中型网站带来流量的，90%以上都是长尾词。大中型网站，有时甚至是小网站，只要收录量增加一定的百分比，SEO流量也会增加一定的百分比。网页的加载速度，就和SEO流量之间建立了一个这样的关系。
其实，google也知道网页速度和SEO流量之间的关系，所以早在“网站性能”这个功能推出以前，就推出了另一个功能让大家去用，那个功能就是“google 网站管理员工具”里的“抓取统计信息”。那里把爬虫对你网站的抓取量，和你网页下载的平均时间都列了出来。
如果大家平常注意观察这里面的数据就会发现这样的规律：一旦网站下载时间减少了，那抓取量就会增大一点。
一般小网站，这样的规律还不是太明显。因为有其他影响这个规律的因素存在，而且小网站页面数太少了，爬虫随便多增加几百页的抓取量就影响了50%以上的抓取量。但是在大中型网站，这个规律是非常明显的。如：
当这个网站加快了网页加载速度，爬虫的抓取量就稳步增加了。这个图表能很有利的证明上面提到的理论。
这个图表也再次证明了我在《google 的良苦用心：网站管理员工具》里说的：“google网站管理员工具里的每个功能都是和SEO相关的”。
关于网页速度和排名，google否认曾经将网页速度列为提高排名的因素。而 Matt Cutts 最近也说：In a nutshell &#8211; while slow page load times won&#8217;t negatively impact your rankings, fast load times may have a positive effect.   有人把它翻译成：网页加载速度慢，不会影响Google排名，但是网页加载快却对排名有积极作用。 [...]]]></description>
			<content:encoded><![CDATA[<p>“谷歌中文网站管理员博客”刚刚发表了一篇新文章，介绍了一下《google 网站管理员工具》中推出的新功能 -“网站性能”。这个工具是通过google工具栏记录了用户访问你网站的速度，并给出了很多加快你网站速度的建议。</p>
<p><a href="http://www.googlechinawebmaster.com/2009/12/blog-post_30.html" target="_blank">http://www.googlechinawebmaster.com/2009/12/blog-post_30.html</a></p>
<p>而最近也传闻google将会把网页加载速度作为影响排名的一个因素。那么网页打开速度是不是能影响SEO效果？如果能影响，那是怎么影响的呢？</p>
<p>在揭示其中的道理之前，我希望大家能把上面那些传闻或“网站性能”的功能都忘掉。让我们追本溯源，来看看网页打开速度和SEO流量之间的关系。</p>
<p>做SEO有时候不需要听从别人给你的信息和意见，你只要专注于研究搜索引擎，同样也能成功的。这种关系的发现，也得益于早期我非常重视数据分析，所以我在《<a href="http://www.semyj.com/archives/512">怎么样去学SEO（二）</a>》中把数据分析能力列为SEOer应该具备的四大能力之一。由于有很多数据做支撑，现在我来给大家分析其中的联系，大家就容易看懂很多。</p>
<p>到了后期，连google也认识到了网页速度和SEO流量之间的关系，所以在这个“网站性能”以前就推出过相关的工具来帮助网站管理员。</p>
<p><span id="more-969"></span></p>
<p>要说明这种关系，就要从搜索引擎爬虫说起。不知道大家对于搜索引擎爬虫在一个网站上的行为有没有概念，我现在发一下某个网站（不是alibaba）的一些数据出来，大家就能意识到一些爬虫的特性了。下面是从服务器LOG日志中分析出的数据。</p>
<div id="attachment_985" class="wp-caption alignnone" style="width: 500px"><img class="size-full wp-image-985" title="spider1" src="http://www.semyj.com/wp-content/uploads/2010/01/spider1.gif" alt="爬虫访问次数" width="490" height="210" /><p class="wp-caption-text">图1：爬虫访问次数</p></div>
<p>&#8212;-</p>
<div id="attachment_986" class="wp-caption alignnone" style="width: 525px"><img class="size-full wp-image-986" title="spider2" src="http://www.semyj.com/wp-content/uploads/2010/01/spider2.gif" alt="爬虫停留时间" width="515" height="259" /><p class="wp-caption-text">图2：爬虫停留时间</p></div>
<p>从上面图1中可以看到google访问这个网站206次，这206次里面是由很多个不同的爬虫访问的。图2显示：有的爬虫一天之内来了8次，一共停留了2小时左右，有的爬虫来了1次，停留了20多个小时以上。所以这个网站是被很多个爬虫在不间断的访问的。为了计算方便，可以把google所有的爬虫停留在这个网站的总时间加起来。虽然一天只有24个小时的，但是google的爬虫这一天花在这个网站上的时间可能是成百上千多个小时。这里真实的数据是：在这个网站中，google所有爬虫那天在这个网站上花费的实际总时间是721个小时。</p>
<p>而服务器LOG日志里同样可以分析出爬虫在一个网页上的停留时间。如：</p>
<div id="attachment_988" class="wp-caption alignnone" style="width: 536px"><img class="size-full wp-image-988" title="spider3" src="http://www.semyj.com/wp-content/uploads/2010/01/spider3.gif" alt="爬虫停留时间" width="526" height="243" /><p class="wp-caption-text">图3：爬虫停留时间</p></div>
<p>得到了这两个数据以后，用所有爬虫总的停留时间除以单个页面的停留时间，就是搜索引擎爬虫这天所抓取的页面总量。</p>
<p>721 小时× 3600 秒 ÷ 35 秒 = 74160 页</p>
<p>那么得到这个搜索引擎爬虫这天所抓取的页面总量有什么用呢？</p>
<p>对于一般的小网站来说，一天能被抓取 74160页是一个很不错数据。但是我上面给出的是一个中型网站，它整个网站的页面总量有800多万有SEO价值的页面。那么，在最理想的情况下，这些页面被搜索引擎抓取完要花费的时间为：</p>
<p>800万 ÷ 74160 页 = 108 天</p>
<p>这是理论上最理想的情况，实际上真实的情况为：</p>
<p>由于有多个爬虫在抓取网站，有很多的页面在一天之内是会被爬虫重复抓取的。有的页面一天之内被抓取20多次，有的页面一天之内只被抓取1次。通过 “停留总时间 ÷ 单个页面停留时间” 得到的页面数量，是没有去除那些重复抓取的页面的。所以搜索引擎一天之内实际抓取的不重复页面没有74160页那么多，而是40000页的样子。还有一点，爬虫今天抓取的页面，到了明天还有很多会被重复抓取。所以爬虫不光在同一天内会重复抓取很多页面，而且到了下一天还是会重复抓取前一天抓取过的很多页面。</p>
<p>这样下来，爬虫平均每天抓取不重复的页面数量就只有10000页的样子了。那么，要爬虫把这个网站所有的页面抓取完需要的时间为：</p>
<p>800万 ÷  1万页 = 800天</p>
<p>其实，这个800天抓取完整个网站还是太理想化了。实际的情况是很多网站由于结构的原因，有些网页创建后4-5年，都还没被爬虫抓取过。</p>
<p>上面的这个分析过程，都没用到什么惊天动地的计算方法。只要你有一点数据分析的意识，就能看清楚事实的。当一个网站收录量不理想，大家就应该去看看那些页面是不是被搜索引擎爬虫浏览过。如果一个页面都没有被搜索引擎爬虫浏览过，是不可能会被收录的。一个网站的收录量没有上去，那SEO流量的提升就会有很大的一个瓶颈。</p>
<p>根据我们刚才上面的那个分析过程，要提升网站的收录量，首先要解决的就是搜索引擎每天抓取网站的抓取量。而：</p>
<p>抓取量 =   爬虫总的停留时间 ÷ 单个页面的停留时间</p>
<p>一个网站，爬虫总的停留时间在某个期间是保持相对固定的。当然，有方法提高爬虫总的停留时间，不过这不是这篇文章要讲的内容。我们先通过减少个页面的停留时间也可以增加爬虫的抓取量。</p>
<p>减少爬虫单个页面的停留时间，可以简单的认为提高网页加载速度就可以了，虽然实际上这两个因素之间还存在着一个对应关系，但是这里先不讲。这个时候，网页的加载速度就和抓取量之间有了一个正比的关系，网页加载速度越快，爬虫整个的抓取量就越大。抓取量越大，有效收录量就会增加，从而促使SEO流量增加，因为给<a href="http://www.semyj.com/archives/776">一个大中型网站带来流量的，90%以上都是长尾词</a>。大中型网站，有时甚至是小网站，只要收录量增加一定的百分比，SEO流量也会增加一定的百分比。网页的加载速度，就和SEO流量之间建立了一个这样的关系。</p>
<p>其实，google也知道网页速度和SEO流量之间的关系，所以早在“网站性能”这个功能推出以前，就推出了另一个功能让大家去用，那个功能就是“google 网站管理员工具”里的“抓取统计信息”。那里把爬虫对你网站的抓取量，和你网页下载的平均时间都列了出来。</p>
<p>如果大家平常注意观察这里面的数据就会发现这样的规律：一旦网站下载时间减少了，那抓取量就会增大一点。</p>
<p>一般小网站，这样的规律还不是太明显。因为有其他影响这个规律的因素存在，而且小网站页面数太少了，爬虫随便多增加几百页的抓取量就影响了50%以上的抓取量。但是在大中型网站，这个规律是非常明显的。如：</p>
<div id="attachment_1007" class="wp-caption alignnone" style="width: 529px"><img class="size-full wp-image-1007" title="tongji" src="http://www.semyj.com/wp-content/uploads/2010/01/tongji.GIF" alt="抓取统计信息" width="519" height="648" /><p class="wp-caption-text">抓取统计信息</p></div>
<p>当这个网站加快了网页加载速度，爬虫的抓取量就稳步增加了。这个图表能很有利的证明上面提到的理论。</p>
<p>这个图表也再次证明了我在《<a href="http://www.semyj.com/archives/692">google 的良苦用心：网站管理员工具</a>》里说的：“google网站管理员工具里的每个功能都是和SEO相关的”。</p>
<p>关于网页速度和排名，google否认曾经将网页速度列为提高排名的因素。而 Matt Cutts 最近也说：In a nutshell &#8211; while slow page load times won&#8217;t negatively impact your rankings, fast load times may have a positive effect.   有人把它翻译成：网页加载速度慢，不会影响Google排名，但是网页加载快却对排名有积极作用。 其实这样翻译是没有理解这句话，Matt Cutts的意思是：网页加载速度慢，不会影响Google排名，但是网页加载快却有积极作用。拿掉以前那个翻译中的“对排名”三个字即可。至于其中的原因，我想通过这篇文章大家都理解了吧。</p>
<p>这也是为什么我要在《<a href="http://www.semyj.com/archives/822">内部链接还是外部链接</a>》里强调一下的：有时候是因为“你没有掌握到他们那么多信息，所以你无法理解他们的话。也不会推测出他们的潜台词以及他们没有说全的话而已。” 我其实很少关注Matt Cutts说什么，但是我看到那篇翻译的文章，就断定Matt Cutts不会那么说。</p>
<p>另外，这个文章中的LOG日志分析工具，在我最近建立的“<a href="http://www.semyj.com/bbs/viewthread.php?tid=71&amp;extra=page%3D1" target="_blank">新基地论坛”上有下载</a>。不过那里需要论坛金币才能下载的。获得论坛金币最快的方法就是把你所拥有的好资源也贡献出来。我希望能用这个方法创造一个“人人为我，我为人人”的环境，做一个高质量的论坛。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/969/feed</wfw:commentRss>
		<slash:comments>90</slash:comments>
		</item>
		<item>
		<title>SEO案例：SEO是如何依赖技术分析的</title>
		<link>http://www.semyj.com/archives/620</link>
		<comments>http://www.semyj.com/archives/620#comments</comments>
		<pubDate>Sat, 03 Oct 2009 14:13:17 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEO案例]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=620</guid>
		<description><![CDATA[我前面的文章，都是从技术角度出发来做SEO的。这篇文章就再举几个例子，来说明一下做SEO为什么要依赖技术分析的。另外写这篇文章还出于我一直以来的一个想法，就是我一直都很想赞扬一下07年之前阿里巴巴某些做SEO的同事，他们很早就在SEO领域做出了非常多好的实践，也给网站做出了很大的贡献。
07年以前的阿里巴巴，经过几年的努力，已经把SEO做到了一个很高的境界。大家那时可能还只关注国内中文版的阿里巴巴，称“google是阿里巴巴的站内搜索引擎”。其实阿里巴巴国际站在国外同行当中的表现要更加优秀。当时很多产品类词语，排在首页的10个结果当中就可能会有6个是阿里巴巴国际站的。
当时领导SEO团队的人员是做技术出生，所以大家大量借助技术手段来分析和解决SEO当中出现的很多问题，取得了很好的效果。
因为涉及到现有的业务，只能说几个不那么敏感的例子。
Google 网站管理员工具刚出来的时候，我们网站有很多频道都验证不了那个google需要你上传的文件。工程师那边帮助查了很多问题，以为是什么跳转之类的没有做好。查了很多资料，也没有找到特征吻合的相关解决办法。而meta验证的方法因为技术上有一点问题做不了。
所以我们SEO团队就帮工程师去找问题。我同事瞿波不一会就找出问题出在什么地方了，原来问题出在泛解析上。

具体的过程是这样的：
用了泛解析的url，无论你把url组合成一个什么样子，都会有一个正常的页面给你的。比如：如果你网站的根目录下用了泛解析，http://www.xxxxxx.com/a.html 这个url是你网站本来正常的url。那么你随意的输入一个本来不存在的url 如 http://www.xxxxxx.com/adasdsadw.html  甚至 http://www.xxxxxx.com/@####￥￥.html  ，网站CMS返回的都是一个正常的页面。
这在一个大型网站中，很多地方出于业务需要，都是这么处理的。但是这样做，在“网站管理员工具”的验证方面就一定不能通过。为什么呢？
因为这样谁都可以把这个网站加到自己的网站管理员工具中。比如：www.made-in-china.com 根目录如果用了泛解析，我把这个网站添加到我的“网站管理员工具”里，系统要我验证一下 http://www.made-in-china.com/google15c03c9b508311f6.html   这个文件是不是存在的时候，因为有泛解析，这个文件是一定存在的，那么我就成功把这个本不属于我的网站加到我的“网站管理员工具”里了。我可以随意更改里面的很多设置。
而实际上这样的情况是不会发生的，因为google不光会验证你上传的文件存不存在，还会验证一个不应该存在的文件是不是不存在。google验证完你上传的文件后，接着会模拟一个叫做 google404errorpage.html 的页面是不是不存在。google觉得你网站根目录下恰好存在一个名叫google404errorpage.html的几率是零，所以如果检测下来发现你这个页面也存在的话，那就不能验证通过。google这个时候已经知道你这是因为泛解析导致的缘故。出于保护你的网站，google不会让这个验证通过。
上面的这个分析过程，在公开的渠道里是找不到的。现在在《google网站质量指南》里也只是让你给不存在的页面返回 4xx 状态码而已。
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&#38;answer=35638
而且这个规则也是最近加进去的。以前，根本找不到相关的资料来参考。
那我的同事为什么一下子就找到问题在哪里了呢？那是因为服务器的log日志里一定会记录google验证的这个过程的，把相关目录下、某个时间段的log日志调出来查看就可以看到了。
如果没有LOG日志分析，谁能想得到还有这么一个过程在里面呢？ 至今，还有很多网站验证不了这个文件的，现在就可以看看有没有这个泛解析的问题，或者去分析log日志看看。
还有一次，网站改版后，网站流量骤然下降了。我们知道影响SEO流量的因素有很多，那到底是什么原因导致流量下降呢。我以前的主管BEN通过自己的分析，觉得是url出了问题。
当时的url是这样的： http://www.alibaba.com/bin/buyoffer/mp3.html
我想很多人都不会觉得这个url有什么异常。但是在当时，这个url有一个致命问题的。
在02年google的爬虫还不是很成熟的时候，为了避免陷入死循环，爬虫不光会对那些有多余参数的url抓取量减少，还会对某些特定的目录不抓取的。这样的目录中，就有 /cgi-bin/  以及类似的 /bin/  这样的目录。学过CGI语言的人都知道，/cgi-bin/这个目录下是放置cgi程序的地方，这种目录下进行抓取是没什么意义的。/bin/这个目录也是其他很多系统或者语言默认的文件夹名称，这些目录下都不存在google应该抓取的页面，所以搜索引擎就屏蔽了这样的目录抓取。而偏偏我们定义的文件夹名称就是/bin/，google是不会抓取这个目录的。
之后，把这个目录名称改为/trade/，流量马上就恢复了。如今，百度也在robots文件的用法中，就拿/cgi-bin/这个目录做了例举。 http://www.baidu.com/search/robots.html
我相信这样的问题即使放到现在，也没有人敢怀疑是google本身出了问题。有些人还会从上百个因素里找一个看似很合理的原因，导致真正的原因被掩盖了。但是ben通过技术分析并实践，却得出了让人信服的结论。类似的事情，我后来也碰到过好几回，因为有他们的经验在鼓舞我，使我也做了一些让别人不能理解，但是却给网站带来很大流量的事情。
技术分析在和竞争对手抢流量的时候，也是竞争力之一。举一个不那么恰当的例子：
sitemap.xml刚出来的时候。我们自己制作好了sitemap.xml文件，但是毕竟这么大型的sitemap文件谁也没有做过，特别是里面权重的设置在一个大型网站来说是很有讲究的。所以我们就想参考一个国外主要竞争对手的文件。一开始通过一个方法拿到了他们的文件地址，但是怎么也打不开那个链接，老是返回404错误。通过国外的代理服务器去访问也是这样。最后，通过模拟google爬虫才能正常的访问这个文件。 原来同样非常重视SEO的这个对手，为了让自己的sitemap.xml文件不被其他人看到，只有对那种user-agent是google爬虫的访问才显示这个文件，由于浏览器的user-agent是很容易判断出来的，就拦截掉了浏览器的访问。
《怎么样去学SEO》一文，讲述了学SEO要从了解网站和搜索引擎相关的技术开始。而这篇文章就是让大家看看具体是如何应用的。阿里巴巴最早做SEO的那批人，早在国内还不知道SEO是什么的时候就已经涉及到了诸多技术问题，并马上取得压倒性的优势。虽然现在他们因为某些原因都没有在做SEO了，但是他们给网站的贡献是非常大的。我个人的观点: 从某方面来说，是SEO成就了alibaba。
]]></description>
			<content:encoded><![CDATA[<p>我前面的文章，都是从技术角度出发来做SEO的。这篇文章就再举几个例子，来说明一下做SEO为什么要依赖技术分析的。另外写这篇文章还出于我一直以来的一个想法，就是我一直都很想赞扬一下07年之前阿里巴巴某些做SEO的同事，他们很早就在SEO领域做出了非常多好的实践，也给网站做出了很大的贡献。</p>
<p>07年以前的阿里巴巴，经过几年的努力，已经把SEO做到了一个很高的境界。大家那时可能还只关注国内中文版的阿里巴巴，称“google是阿里巴巴的站内搜索引擎”。其实阿里巴巴国际站在国外同行当中的表现要更加优秀。当时很多产品类词语，排在首页的10个结果当中就可能会有6个是阿里巴巴国际站的。</p>
<p>当时领导SEO团队的人员是做技术出生，所以大家大量借助技术手段来分析和解决SEO当中出现的很多问题，取得了很好的效果。</p>
<p>因为涉及到现有的业务，只能说几个不那么敏感的例子。</p>
<p>Google 网站管理员工具刚出来的时候，我们网站有很多频道都验证不了那个google需要你上传的文件。工程师那边帮助查了很多问题，以为是什么跳转之类的没有做好。查了很多资料，也没有找到特征吻合的相关解决办法。而meta验证的方法因为技术上有一点问题做不了。</p>
<p>所以我们SEO团队就帮工程师去找问题。我同事瞿波不一会就找出问题出在什么地方了，原来问题出在泛解析上。</p>
<p><span id="more-620"></span></p>
<p>具体的过程是这样的：</p>
<p>用了泛解析的url，无论你把url组合成一个什么样子，都会有一个正常的页面给你的。比如：如果你网站的根目录下用了泛解析，http://www.xxxxxx.com/a.html 这个url是你网站本来正常的url。那么你随意的输入一个本来不存在的url 如 http://www.xxxxxx.com/adasdsadw.html  甚至 http://www.xxxxxx.com/@####￥￥.html  ，网站CMS返回的都是一个正常的页面。</p>
<p>这在一个大型网站中，很多地方出于业务需要，都是这么处理的。但是这样做，在“网站管理员工具”的验证方面就一定不能通过。为什么呢？</p>
<p>因为这样谁都可以把这个网站加到自己的网站管理员工具中。比如：www.made-in-china.com 根目录如果用了泛解析，我把这个网站添加到我的“网站管理员工具”里，系统要我验证一下 http://www.made-in-china.com/google15c03c9b508311f6.html   这个文件是不是存在的时候，因为有泛解析，这个文件是一定存在的，那么我就成功把这个本不属于我的网站加到我的“网站管理员工具”里了。我可以随意更改里面的很多设置。</p>
<p>而实际上这样的情况是不会发生的，因为google不光会验证你上传的文件存不存在，还会验证一个不应该存在的文件是不是不存在。google验证完你上传的文件后，接着会模拟一个叫做 google404errorpage.html 的页面是不是不存在。google觉得你网站根目录下恰好存在一个名叫google404errorpage.html的几率是零，所以如果检测下来发现你这个页面也存在的话，那就不能验证通过。google这个时候已经知道你这是因为泛解析导致的缘故。出于保护你的网站，google不会让这个验证通过。</p>
<p>上面的这个分析过程，在公开的渠道里是找不到的。现在在《google网站质量指南》里也只是让你给不存在的页面返回 4xx 状态码而已。</p>
<p><a href="http://www.google.com/support/webmasters/bin/answer.py?hl=cn&amp;answer=35638" target="_blank">http://www.google.com/support/webmasters/bin/answer.py?hl=cn&amp;answer=35638</a></p>
<p>而且这个规则也是最近加进去的。以前，根本找不到相关的资料来参考。</p>
<p>那我的同事为什么一下子就找到问题在哪里了呢？那是因为服务器的log日志里一定会记录google验证的这个过程的，把相关目录下、某个时间段的log日志调出来查看就可以看到了。</p>
<p>如果没有LOG日志分析，谁能想得到还有这么一个过程在里面呢？ 至今，还有很多网站验证不了这个文件的，现在就可以看看有没有这个泛解析的问题，或者去分析log日志看看。</p>
<p>还有一次，网站改版后，网站流量骤然下降了。我们知道影响SEO流量的因素有很多，那到底是什么原因导致流量下降呢。我以前的主管BEN通过自己的分析，觉得是url出了问题。</p>
<p>当时的url是这样的： http://www.alibaba.com/bin/buyoffer/mp3.html</p>
<p>我想很多人都不会觉得这个url有什么异常。但是在当时，这个url有一个致命问题的。</p>
<p>在02年google的爬虫还不是很成熟的时候，为了避免陷入死循环，爬虫不光会对那些有多余参数的url抓取量减少，还会对某些特定的目录不抓取的。这样的目录中，就有 /cgi-bin/  以及类似的 /bin/  这样的目录。学过CGI语言的人都知道，/cgi-bin/这个目录下是放置cgi程序的地方，这种目录下进行抓取是没什么意义的。/bin/这个目录也是其他很多系统或者语言默认的文件夹名称，这些目录下都不存在google应该抓取的页面，所以搜索引擎就屏蔽了这样的目录抓取。而偏偏我们定义的文件夹名称就是/bin/，google是不会抓取这个目录的。</p>
<p>之后，把这个目录名称改为/trade/，流量马上就恢复了。如今，百度也在robots文件的用法中，就拿/cgi-bin/这个目录做了例举。 <a href="http://www.baidu.com/search/robots.html" target="_blank">http://www.baidu.com/search/robots.html</a></p>
<p>我相信这样的问题即使放到现在，也没有人敢怀疑是google本身出了问题。有些人还会从上百个因素里找一个看似很合理的原因，导致真正的原因被掩盖了。但是ben通过技术分析并实践，却得出了让人信服的结论。类似的事情，我后来也碰到过好几回，因为有他们的经验在鼓舞我，使我也做了一些让别人不能理解，但是却给网站带来很大流量的事情。</p>
<p>技术分析在和竞争对手抢流量的时候，也是竞争力之一。举一个不那么恰当的例子：</p>
<p>sitemap.xml刚出来的时候。我们自己制作好了sitemap.xml文件，但是毕竟这么大型的sitemap文件谁也没有做过，特别是里面权重的设置在一个大型网站来说是很有讲究的。所以我们就想参考一个国外主要竞争对手的文件。一开始通过一个方法拿到了他们的文件地址，但是怎么也打不开那个链接，老是返回404错误。通过国外的代理服务器去访问也是这样。最后，通过模拟google爬虫才能正常的访问这个文件。 原来同样非常重视SEO的这个对手，为了让自己的sitemap.xml文件不被其他人看到，只有对那种user-agent是google爬虫的访问才显示这个文件，由于浏览器的user-agent是很容易判断出来的，就拦截掉了浏览器的访问。</p>
<p>《<a href="http://www.semyj.com/archives/489">怎么样去学SEO</a>》一文，讲述了学SEO要从了解网站和搜索引擎相关的技术开始。而这篇文章就是让大家看看具体是如何应用的。阿里巴巴最早做SEO的那批人，早在国内还不知道SEO是什么的时候就已经涉及到了诸多技术问题，并马上取得压倒性的优势。虽然现在他们因为某些原因都没有在做SEO了，但是他们给网站的贡献是非常大的。我个人的观点: 从某方面来说，是SEO成就了alibaba。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/620/feed</wfw:commentRss>
		<slash:comments>52</slash:comments>
		</item>
		<item>
		<title>SEO案例：锚文本、关键字、nofollow、Web标准化（二）</title>
		<link>http://www.semyj.com/archives/328</link>
		<comments>http://www.semyj.com/archives/328#comments</comments>
		<pubDate>Fri, 24 Jul 2009 04:31:15 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEO案例]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=328</guid>
		<description><![CDATA[上篇谈到了Globalsources是如何应用“锚文本”和“关键字”的。这篇还是讲Globalsources，我们来给它的做法改进一下，看看如何应用“nofollow”和“Web标准化”。
Globalsources的这些SEO优化，全是Stephen在06年指导他们完成的。之后，他们就一直延续了那时候的改造而没有进一步优化。
为了处理“Global Sources Home”这个文字干扰主页内容的表达，它用的是把文字转化成图片的方式。其实就像在上篇的评论中“cm”说的那样，可以保留这个文字，而用nofollow把这个锚文本屏蔽掉的。 不知道大家还记得吗，在“锚文本的重要性”中提到过：一个链接被nofollow, PR和锚文本是不会被传递的。所以，用了nofollow,也是一种不错的解决方法。这样，在大网站的话，和网页设计人员也好交代了。不然，文字图片化在他们看来是很奇怪的做法。这样做不会削弱锚文本对首页的影响力。
在那篇和ZAC的nofollw争论后，有很多人都问我为什么不用robots.txt文件或者 meta robots标签来控制爬虫的抓取。其实，nofollow是这两种方式无法替代的。具体的原因，等你真正打算用nofollow，来查看一个网页上所有的链接的时候就知道。
nofollow的应用，在另一个国外大网站上已经用到了炉火纯青的地步。这个或许以后可以说。
再来看“web标准化”，SEO要在这方面做文章就要时刻想着“web标准化”中的那个网页模型。那个模型不是给网页设计人员看的。

Globalsources 在处理logo指向首页的链接中，用的是退而求其次的方法。其实不用退而求其次的，有一种更好的方法，这种方法就是“图片替换”。有比较多的国外SEO人在用。
先看Globalsources的代码，是这样写的：
&#60;a name=”top” href=”http://www.globalsources.com”&#62;
&#60;img title=”globalsources.com – manufacturers” src=”http://…../SITE/I/GS2.GIF” border=”0″ alt=”globalsources.com – manufacturers” /&#62;&#60;/a&#62;
而“图片替换”的代码就是这样的：
1，
&#60;div id=&#8221;logo&#8221;&#62;
&#60;a href=&#8221;http://www.globalsources.com/&#8221;
title=&#8221;globalsources.com – manufacturers&#8221;&#62;globalsources.com – manufacturers&#60;/a&#62;
&#60;/div&#62;
然后在CSS文件里这样写：
2，
#logo a {
background: url(http://…../SITE/I/GS2.GIF);
height:80px;
width:300px;
text-indent:-1000px;
}
这样的做法，是先做一个完美的“内容层”和“结构层”给搜索引擎看。代码1中，既有锚文本，又有title属性。而不像原来一样是没有锚文本的，只有title属性和alt文本。
代码2是一个“表现层”，text-indent:-1000px; 的意思把文字偏移到屏幕的一千个像素以外。用户看不到那些文字的。然后把那张logo图片作为这个&#60;div&#62;的背景。把原来那个的logo图片放在CSS里来了。这样在外观上和原来是一模一样的。这种做法完美的平衡了用户体验与SEO。
这里有一个问题，就是google认不认为这个是作弊的方法。因为这个好像是隐藏内容，用户看到的和搜索引擎看到的不一样。这个担心确实有点道理。不过暂时来看，这个方法要应用得当，是没什么负面影响的。
因为这个方法其实一开始是网页设计人员为了更好的web标准化而做的。此方法由来以久而且比较多的网页设计人员在用。在08年11月份，有人咨询过google的工程师，这个方法，在技术上不会被列入作弊的范围的。但是如果你恶意应用，还是会被认为作弊。比如在里面写一大堆东西，或者用来隐藏一篇文章等等。
这种“图片替换”的思想就是把“内容层”的无关因素移到“表现层”。然后想办法怎么在“内容层”和“结构层”更好的表达信息给搜索引擎看。我上次说的web标准化会有很多技巧，这就是其中一个。还有更多技巧大家可以去发掘。
下篇博客我会讲一个三年前就预测到google会使用的排序方法。以及讲述一下我为什么能预测到这个。
]]></description>
			<content:encoded><![CDATA[<p>上篇谈到了Globalsources是如何应用“锚文本”和“关键字”的。这篇还是讲Globalsources，我们来给它的做法改进一下，看看如何应用“nofollow”和“Web标准化”。</p>
<p>Globalsources的这些SEO优化，全是<a href="http://www.adverted.com/" target="_blank">Stephen</a>在06年指导他们完成的。之后，他们就一直延续了那时候的改造而没有进一步优化。</p>
<p>为了处理“Global Sources Home”这个文字干扰主页内容的表达，它用的是把文字转化成图片的方式。其实就像在上篇的评论中“cm”说的那样，可以保留这个文字，而用nofollow把这个锚文本屏蔽掉的。 不知道大家还记得吗，在“<a href="http://www.semyj.com/archives/153">锚文本的重要性</a>”中提到过：一个链接被nofollow, PR和锚文本是不会被传递的。所以，用了nofollow,也是一种不错的解决方法。这样，在大网站的话，和网页设计人员也好交代了。不然，文字图片化在他们看来是很奇怪的做法。这样做不会削弱锚文本对首页的影响力。</p>
<p>在那篇和<a href="http://www.semyj.com/archives/104">ZAC的nofollw争论</a>后，有很多人都问我为什么不用robots.txt文件或者 meta robots标签来控制爬虫的抓取。其实，nofollow是这两种方式无法替代的。具体的原因，等你真正打算用nofollow，来查看一个网页上所有的链接的时候就知道。</p>
<p>nofollow的应用，在另一个国外大网站上已经用到了炉火纯青的地步。这个或许以后可以说。</p>
<p>再来看“web标准化”，SEO要在这方面做文章就要时刻想着“<a href="http://www.semyj.com/archives/84">web标准化</a>”中的那个网页模型。那个模型不是给网页设计人员看的。</p>
<p><span id="more-328"></span></p>
<p>Globalsources 在处理logo指向首页的链接中，用的是退而求其次的方法。其实不用退而求其次的，有一种更好的方法，这种方法就是“图片替换”。有比较多的国外SEO人在用。</p>
<p>先看Globalsources的代码，是这样写的：</p>
<p>&lt;a name=”top” href=”http://www.globalsources.com”&gt;<br />
&lt;img title=”globalsources.com – manufacturers” src=”http://…../SITE/I/GS2.GIF” border=”0″ alt=”globalsources.com – manufacturers” /&gt;&lt;/a&gt;</p>
<p>而“图片替换”的代码就是这样的：</p>
<p>1，</p>
<p>&lt;div id=&#8221;logo&#8221;&gt;<br />
&lt;a href=&#8221;http://www.globalsources.com/&#8221;<br />
title=&#8221;globalsources.com – manufacturers&#8221;&gt;globalsources.com – manufacturers&lt;/a&gt;<br />
&lt;/div&gt;</p>
<p>然后在CSS文件里这样写：</p>
<p>2，</p>
<p>#logo a {<br />
background: url(http://…../SITE/I/GS2.GIF);<br />
height:80px;<br />
width:300px;<br />
text-indent:-1000px;<br />
}</p>
<p>这样的做法，是先做一个完美的“内容层”和“结构层”给搜索引擎看。代码1中，既有锚文本，又有title属性。而不像原来一样是没有锚文本的，只有title属性和alt文本。</p>
<p>代码2是一个“表现层”，text-indent:-1000px; 的意思把文字偏移到屏幕的一千个像素以外。用户看不到那些文字的。然后把那张logo图片作为这个&lt;div&gt;的背景。把原来那个的logo图片放在CSS里来了。这样在外观上和原来是一模一样的。这种做法完美的平衡了用户体验与SEO。</p>
<p>这里有一个问题，就是google认不认为这个是作弊的方法。因为这个好像是隐藏内容，用户看到的和搜索引擎看到的不一样。这个担心确实有点道理。不过暂时来看，这个方法要应用得当，是没什么负面影响的。</p>
<p>因为这个方法其实一开始是网页设计人员为了更好的web标准化而做的。此方法由来以久而且比较多的网页设计人员在用。在08年11月份，有人咨询过google的工程师，这个方法，在技术上不会被列入作弊的范围的。但是如果你恶意应用，还是会被认为作弊。比如在里面写一大堆东西，或者用来隐藏一篇文章等等。</p>
<p>这种“图片替换”的思想就是把“内容层”的无关因素移到“表现层”。然后想办法怎么在“内容层”和“结构层”更好的表达信息给搜索引擎看。我上次说的web标准化会有很多技巧，这就是其中一个。还有更多技巧大家可以去发掘。</p>
<p>下篇博客我会讲一个三年前就预测到google会使用的排序方法。以及讲述一下我为什么能预测到这个。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/328/feed</wfw:commentRss>
		<slash:comments>45</slash:comments>
		</item>
		<item>
		<title>SEO案例：锚文本、关键字、nofollow、Web标准化（一）</title>
		<link>http://www.semyj.com/archives/273</link>
		<comments>http://www.semyj.com/archives/273#comments</comments>
		<pubDate>Wed, 22 Jul 2009 06:16:57 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEO案例]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=273</guid>
		<description><![CDATA[前面谈到了做SEO需要注意的好几个因素。但是因为工作上的原因，好多因素没有讲透的。（不过其实有些东西我给我们团队的人都没有讲过的。）我看到一些人的回复，对有些SEO因素有误解。
还有，我看到很多人都没怎么关注“Web标准化”这一篇文章。其实这篇文章不是在解释为什么要web标准化，而是这样的：几乎所有的SEO站内优化，最终都要体现在网页代码里，而在网页代码里，“结构层”和“内容层”里的东西如何写是很重要的。
所以接下来讲一个具体的案例，让大家了解一下一个SEO同行是怎么应用这些基本的因素的。
这个案例就是Globalsources，是一个非常重视SEO的网站。它在细节上的考虑，帮助它获得了很不错的SEO流量。
先看它的页面：
http://www.globalsources.com/manufacturers/A-C-Motor.html

首先，它很重视锚文本，因为锚文本描述了被链接的页面的内容。所以全站内所有指向首页（首页统一用顶级域名 www.globalsources.com）的链接，锚文本都是两个选好的关键字。
但是一般从网站设计的角度考虑，有很多指向首页的链接，是不能都用文字的。可以看看它网页的上部分，至少就有2个：
1，链接指向首页的logo就不是文字。遇到这样的情况，它就退而求其次，给这个链接的title属性和logo图片的alt文本都用和锚文本一样的文字。代码如下：
&#60;a name=&#8221;top&#8221; href=&#8221;http://www.globalsources.com&#8221;&#62;
&#60;img title=&#8221;globalsources.com &#8211; manufacturers&#8221; src=&#8221;http://&#8230;../SITE/I/GS2.GIF&#8221; border=&#8221;0&#8243; alt=&#8221;globalsources.com &#8211; manufacturers&#8221; /&#62;&#60;/a&#62;
这些文本也起到了和锚文本一样的效果。
2，有时候，指向首页的锚文本是一些&#8221; Home&#8221;、“back&#8221;之类的文字，这些文字削弱了对首页的描述。它的处理方式就是把这些文字图片化，然后再和那个logo的处理方式一样，在title和alt里面加文本。 大家看到的那个“Global Sources Home”其实不是文字，是图片而已。代码如：
&#60;a name=&#8221;top&#8221; href=&#8221;http://www.globalsources.com&#8221;&#62;
&#60;img title=&#8221;globalsources.com &#8211; manufacturers&#8221; src=&#8221;http://ak&#8230;&#8230;/I/HOMEICON.GIF&#8221; border=&#8221;0&#8243; alt=&#8221;globalsources.com &#8211; manufacturers&#8221; width=&#8221;119&#8243; height=&#8221;13&#8243; align=&#8221;absBottom&#8221; /&#62;&#60;/a&#62;
再来看它的锚文本是怎么选的。这个就涉及到SEO关键词的选择了。
它就给首页选了两个关键字：manufacturers （产品型搜索），globalsources（导航型搜索）
manufacturers 这个词语自然不必说，这个词语准确了描述了这个网站的内容，也是一个转化率很高的词语，本身的搜索量也是非常的大。给首页用这个词语，还有一个好处，是给这个网站“定了性”。所以它的其他很多页面在manufacturers的长尾关键词上都排得很好。关于“给网站定性”这一说会在以后的文章中解释。
而选“globalsources”这个词语，有些人可能有点惊讶的。其实，当你拥有自己独有的一个品牌或产品名，它就成了你自己的“导航型搜索”关键词。在看那篇“SEO关键词选择”的文章中，有些人可能只想着怎么把别人的“导航型搜索”流量导到自己的网站上来，却忽视了属于自己的“导航型搜索”。就象我在回复中说的那样，你有一个自己的品牌，你的客户可能是从朋友那里听到或你的广告上看到，然后才来搜索这个词语的。但是一搜之下，发现找不到你的网站，或者只有你的代理商排在前面。而这个客户可能是有购买意向，那这个损失是蛮大的。这种丢失了自己的“导航型搜索”关键词的情况，在很多中小网站中比较多。有时候，竞争对手抢了你的“导航关键字”，在把本来属于你的客户转化成自己的。这一点，在PPC中，是公开的策略了。
而globalsources这个网站，即使“globalsources”这个词不用在锚文本里，其实搜索这个词语它还是能排第一的。因为它是一个大站，一定有很多网站介绍它的时候，锚文本是这个关键字。而且它的域名就是它的品牌名，在外部链接的很多锚文本中，就会包含这个词语。如： 很多外部链接的锚文本就是它的域名本身—www.globalsources.com。所以外部链接的权重就可以让这个词语排第一。
不过，外部因素是很难控制的。它还要靠内部的锚文本来加强一下，加强这个词语的绝对排名优势，确保一定可以出现sitelink。
这样一操作，现在它的两个目的都达到了：
1，用美国IP ，在英文版的google.com 上搜索 “Manufacturers”，它排在第三。
2，同样，搜索“globalsources”，排名第一，而且有sitelink。





这篇博文写得有点啰嗦，所以要分成两篇来讲这个案例。其实，还可以给globalsources的做法改进一下的。大家可以先想一想怎么改进。
]]></description>
			<content:encoded><![CDATA[<p>前面谈到了做SEO需要注意的好几个因素。但是因为工作上的原因，好多因素没有讲透的。（不过其实有些东西我给我们团队的人都没有讲过的。）我看到一些人的回复，对有些SEO因素有误解。</p>
<p>还有，我看到很多人都没怎么关注“<a href="http://www.semyj.com/archives/84">Web标准化</a>”这一篇文章。其实这篇文章不是在解释为什么要web标准化，而是这样的：几乎所有的SEO站内优化，最终都要体现在网页代码里，而在网页代码里，“结构层”和“内容层”里的东西如何写是很重要的。</p>
<p>所以接下来讲一个具体的案例，让大家了解一下一个SEO同行是怎么应用这些基本的因素的。</p>
<p>这个案例就是Globalsources，是一个非常重视SEO的网站。它在细节上的考虑，帮助它获得了很不错的SEO流量。</p>
<p>先看它的页面：</p>
<p><a href="http://www.globalsources.com/manufacturers/A-C-Motor.html" target="_blank">http://www.globalsources.com/manufacturers/A-C-Motor.html</a></p>
<div id="attachment_309" class="wp-caption alignnone" style="width: 514px"><img class="size-full wp-image-309" title="Snap1" src="http://www.semyj.com/wp-content/uploads/2009/07/Snap12.gif" alt="Globalsources" width="504" height="223" /><p class="wp-caption-text">Globalsources</p></div>
<p><span id="more-273"></span></p>
<p>首先，它很重视锚文本，因为锚文本描述了被链接的页面的内容。所以全站内所有指向首页（首页统一用顶级域名 www.globalsources.com）的链接，锚文本都是两个选好的关键字。</p>
<p>但是一般从网站设计的角度考虑，有很多指向首页的链接，是不能都用文字的。可以看看它网页的上部分，至少就有2个：</p>
<p>1，链接指向首页的logo就不是文字。遇到这样的情况，它就退而求其次，给这个链接的title属性和logo图片的alt文本都用和锚文本一样的文字。代码如下：</p>
<p>&lt;a name=&#8221;top&#8221; href=&#8221;http://www.globalsources.com&#8221;&gt;<br />
&lt;img title=&#8221;globalsources.com &#8211; manufacturers&#8221; src=&#8221;http://&#8230;../SITE/I/GS2.GIF&#8221; border=&#8221;0&#8243; alt=&#8221;globalsources.com &#8211; manufacturers&#8221; /&gt;&lt;/a&gt;</p>
<p>这些文本也起到了和锚文本一样的效果。</p>
<p>2，有时候，指向首页的锚文本是一些&#8221; Home&#8221;、“back&#8221;之类的文字，这些文字削弱了对首页的描述。它的处理方式就是把这些文字图片化，然后再和那个logo的处理方式一样，在title和alt里面加文本。 大家看到的那个“Global Sources Home”其实不是文字，是图片而已。代码如：</p>
<p>&lt;a name=&#8221;top&#8221; href=&#8221;http://www.globalsources.com&#8221;&gt;<br />
&lt;img title=&#8221;globalsources.com &#8211; manufacturers&#8221; src=&#8221;http://ak&#8230;&#8230;/I/HOMEICON.GIF&#8221; border=&#8221;0&#8243; alt=&#8221;globalsources.com &#8211; manufacturers&#8221; width=&#8221;119&#8243; height=&#8221;13&#8243; align=&#8221;absBottom&#8221; /&gt;&lt;/a&gt;</p>
<p>再来看它的锚文本是怎么选的。这个就涉及到SEO关键词的选择了。</p>
<p>它就给首页选了两个关键字：manufacturers （产品型搜索），globalsources（导航型搜索）</p>
<p>manufacturers 这个词语自然不必说，这个词语准确了描述了这个网站的内容，也是一个转化率很高的词语，本身的搜索量也是非常的大。给首页用这个词语，还有一个好处，是给这个网站“定了性”。所以它的其他很多页面在manufacturers的长尾关键词上都排得很好。关于“给网站定性”这一说会在以后的文章中解释。</p>
<p>而选“globalsources”这个词语，有些人可能有点惊讶的。其实，当你拥有自己独有的一个品牌或产品名，它就成了你自己的“导航型搜索”关键词。在看那篇“<a href="http://www.semyj.com/archives/188">SEO关键词选择</a>”的文章中，有些人可能只想着怎么把别人的“导航型搜索”流量导到自己的网站上来，却忽视了属于自己的“导航型搜索”。就象我在回复中说的那样，你有一个自己的品牌，你的客户可能是从朋友那里听到或你的广告上看到，然后才来搜索这个词语的。但是一搜之下，发现找不到你的网站，或者只有你的代理商排在前面。而这个客户可能是有购买意向，那这个损失是蛮大的。这种丢失了自己的“导航型搜索”关键词的情况，在很多中小网站中比较多。有时候，竞争对手抢了你的“导航关键字”，在把本来属于你的客户转化成自己的。这一点，在PPC中，是公开的策略了。</p>
<p>而globalsources这个网站，即使“globalsources”这个词不用在锚文本里，其实搜索这个词语它还是能排第一的。因为它是一个大站，一定有很多网站介绍它的时候，锚文本是这个关键字。而且它的域名就是它的品牌名，在外部链接的很多锚文本中，就会包含这个词语。如： 很多外部链接的锚文本就是它的域名本身—www.globalsources.com。所以外部链接的权重就可以让这个词语排第一。</p>
<p>不过，外部因素是很难控制的。它还要靠内部的锚文本来加强一下，加强这个词语的绝对排名优势，确保一定可以出现sitelink。</p>
<p>这样一操作，现在它的两个目的都达到了：</p>
<p>1，用美国IP ，在英文版的google.com 上搜索 “Manufacturers”，它排在第三。</p>
<div id="attachment_314" class="wp-caption alignnone" style="width: 413px"><img class="size-full wp-image-314" title="Snap14" src="http://www.semyj.com/wp-content/uploads/2009/07/Snap14.gif" alt="一定要用美国IP ，在英文版的google.com查询" width="403" height="359" /><p class="wp-caption-text">一定要用美国IP ，在英文版的google.com查询</p></div>
<p>2，同样，搜索“globalsources”，排名第一，而且有sitelink。</p>
<div id="attachment_313" class="wp-caption alignnone" style="width: 412px"><img class="size-full wp-image-313" title="Snap13" src="http://www.semyj.com/wp-content/uploads/2009/07/Snap13.gif" alt="sitelink" width="402" height="420" /><p class="wp-caption-text">sitelink</p></div>
<div>
<dl id="attachment_313" style="width: 412px;">
<dt></dt>
</dl>
</div>
<p>这篇博文写得有点啰嗦，所以要分成两篇来讲这个案例。其实，还可以给globalsources的做法改进一下的。大家可以先想一想怎么改进。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/273/feed</wfw:commentRss>
		<slash:comments>53</slash:comments>
		</item>
	</channel>
</rss>
