<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>SEM 一家之言</title>
	<atom:link href="http://www.semyj.com/feed" rel="self" type="application/rss+xml" />
	<link>http://www.semyj.com</link>
	<description>关注SEO和PPC</description>
	<lastBuildDate>Tue, 09 Feb 2010 14:05:09 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.5</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>随便说说adwords和ppc</title>
		<link>http://www.semyj.com/archives/1072</link>
		<comments>http://www.semyj.com/archives/1072#comments</comments>
		<pubDate>Mon, 08 Feb 2010 06:34:15 +0000</pubDate>
		<dc:creator>Phyllis</dc:creator>
				<category><![CDATA[PPC入门]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=1072</guid>
		<description><![CDATA[在google之前，没有人想过搜索引擎还能赚钱。如今。adwords系统就像一台自动印钞机，为google带来每年百亿级美金的营收。而且，这个系统诞生到现在，还只有短短十年不到时间。
这篇博客想讲讲一些关于adwords的故事。如果这个领域没有adwords，我觉得可能很多人都会觉得没那么好玩吧。
google的adwords系统是在2000年10月投放的，但ppc（pay per click按点击收费）的概念最初并不是google发明的。早在google之前，overture就已经申请了专利（2001年），overture当时为一些网站提供付费广告系统的技术。2001年的时候，google的营收是$8500万，overture是$28800万，google还不到overture的零头。
2002年的时候overture起诉了google，称google侵犯了他们的专利。随后，2003，overture被雅虎收购，当时也是他最大的客户。对google的诉讼最终以yahoo取得google 270万股的股票告终。
如果google只是抄袭了overture的最初的概念，那就不会有今天的adwords。当时overture的模式是相对简单的：出价高者得到最好的位置/最高的曝光。就是完全按照广告主的出价来排名。google的创新是对这个模式的改进。其实现在想想很容易理解：排名高（曝光多）的广告如果没人点击，网站就没有收入。谷歌明白广告相关性的重要，引入了点击率的概念。经过改进后的模式就是这样：排名取决于出价和相关性，点击率越高的广告，出价不高也能取得好的排名，因为-出价低但是点击率高的广告很可能比出价高但是点击很少的广告带来更多收入。现在我们做adwords的人都可以看到每个关键字的“质量得分”，也明白他的重要性。关键词的质量得分由很多因素构成，但最重要的因素还是点击率，其他重要因素也都是围绕着相关性这一点。
这种发现现在看来很好理解，但是当时无疑是像发现一条经济规律一样了不起的，也给ppc这种模式注入了最核心的要素。加入了质量得分的新模式使得adwords得到了快速的可持续的发展。因为这种模式使得广告的三方面&#8211;用户、广告主、google都受益：用户希望得到更好的体验，不想被不相关的广告打扰；广告主希望得到对他们的产品或服务等感兴趣的流量；google希望为两者都提供更好的体验，获得更多的使用者。
adwords系统很好的保证了用户和广告主的利益：让用户和广告主之间彼此“选择”。随着adwords系统不断的完善以及一系列的其他sem工具，帮助广告主对用户的“选择”可以变得越来越精确。google也从中受益：越来越细分的市场也意味着越来越大容量的市场，允许更多广告主进入。用户也可以得到更好的体验：广告越来越“个性化”，不光不同关键词和网页广告会不同，不同时段，不同IP，不同语言，不同性别，不同年龄段&#8230;都可能会不一样。
如今如果你有一个网站，你想利用他推广你的产品或者服务。你选择adwords，可以做什么呢：你可以投放文字，图片，视频，你可以选择关键字，网站，终端设备等让用户在搜索时，浏览网页时，查找地图时，用手机查找时&#8230;看到你的广告，引起兴趣，并且通过点击来到你的网站。你可以在adwords后台选择用户的很多“属性”：像前面提及的那些：时间，国家，语言，性别，年龄等等。你可以通过查看你的网站流量分析用户喜欢什么，不喜欢什么，可能你买了一些不适合你的流量，然后你再决定如何改进：使得用户更喜欢你，然后google给你更多优惠，奖励你这种“相关性”的提高，你也得到更高回报的流量。对于google来说，绝大部分用户都是可以自助完成这些动作的，每天，只要google的服务器在运行，这个系统就像自动印钞机一样为google带来丰厚的收入。
ppc不同于seo，或者说更具优势的是：1.一切都更为可控，你决定不同的流量去向你网站哪些不同的页面，你决定用户看到的广告长什么样子，你还有很多其他“选择”；2. 不仅仅覆盖搜索网络，你的广告可以以多种形式呈现在其他地方，有很多产品或者服务用户其实不太会去google主动搜索；3. 快速，在除了China以外的国家，一般投放几个小时候后，你的广告就可以生效。当然ppc花钱，但如果你把marketing当做一种投资，那么最大的意义不在于你花出去多少，而是你的投资成功了与否，投资回报率多少，利润有多少，最后赚回了多少。而互联网上的这种投资，一切都是可控的，可衡量的，可追踪的，灵活的，这是一种新的marketing。
说到这里，插播一句，我觉得有些产品没选对，可能通过ppc成功概率比较小。开头不对，可能就没有以后了。还有任何市场的容量都是有限的，投资加倍，回报不一定加倍。
我知道看这个博客的很多都是做seo的，如果是个人的话，我相信做online的人，学学ppc还是很有必要的。我也希望在有余力的时候，分享一些自己做ppc的经验。让没有接触过这块的人，也能去尝试。
]]></description>
			<content:encoded><![CDATA[<p>在google之前，没有人想过搜索引擎还能赚钱。如今。adwords系统就像一台自动印钞机，为google带来每年百亿级美金的营收。而且，这个系统诞生到现在，还只有短短十年不到时间。</p>
<p>这篇博客想讲讲一些关于adwords的故事。如果这个领域没有adwords，我觉得可能很多人都会觉得没那么好玩吧。</p>
<p>google的adwords系统是在2000年10月投放的，但ppc（pay per click按点击收费）的概念最初并不是google发明的。早在google之前，overture就已经申请了专利（2001年），overture当时为一些网站提供付费广告系统的技术。2001年的时候，google的营收是$8500万，overture是$28800万，google还不到overture的零头。</p>
<p><span id="more-1072"></span>2002年的时候overture起诉了google，称google侵犯了他们的专利。随后，2003，overture被雅虎收购，当时也是他最大的客户。对google的诉讼最终以yahoo取得google 270万股的股票告终。</p>
<p>如果google只是抄袭了overture的最初的概念，那就不会有今天的adwords。当时overture的模式是相对简单的：出价高者得到最好的位置/最高的曝光。就是完全按照广告主的出价来排名。google的创新是对这个模式的改进。其实现在想想很容易理解：排名高（曝光多）的广告如果没人点击，网站就没有收入。谷歌明白广告相关性的重要，引入了点击率的概念。经过改进后的模式就是这样：排名取决于出价和相关性，点击率越高的广告，出价不高也能取得好的排名，因为-出价低但是点击率高的广告很可能比出价高但是点击很少的广告带来更多收入。现在我们做adwords的人都可以看到每个关键字的“质量得分”，也明白他的重要性。关键词的质量得分由很多因素构成，但最重要的因素还是点击率，其他重要因素也都是围绕着相关性这一点。</p>
<p>这种发现现在看来很好理解，但是当时无疑是像发现一条经济规律一样了不起的，也给ppc这种模式注入了最核心的要素。加入了质量得分的新模式使得adwords得到了快速的可持续的发展。因为这种模式使得广告的三方面&#8211;用户、广告主、google都受益：用户希望得到更好的体验，不想被不相关的广告打扰；广告主希望得到对他们的产品或服务等感兴趣的流量；google希望为两者都提供更好的体验，获得更多的使用者。</p>
<div id="attachment_1086" class="wp-caption alignnone" style="width: 379px"><img class="size-full wp-image-1086" title="1" src="http://www.semyj.com/wp-content/uploads/2010/02/1.jpg" alt="用户、广告主、google" width="369" height="297" /><p class="wp-caption-text">用户、广告主、google</p></div>
<p>adwords系统很好的保证了用户和广告主的利益：让用户和广告主之间彼此“选择”。随着adwords系统不断的完善以及一系列的其他<a href="http://www.semyj.com/archives/975">sem工具</a>，帮助广告主对用户的“选择”可以变得越来越精确。google也从中受益：越来越细分的市场也意味着越来越大容量的市场，允许更多广告主进入。用户也可以得到更好的体验：广告越来越“个性化”，不光不同关键词和网页广告会不同，不同时段，不同IP，不同语言，不同性别，不同年龄段&#8230;都可能会不一样。</p>
<p>如今如果你有一个网站，你想利用他推广你的产品或者服务。你选择adwords，可以做什么呢：你可以投放文字，图片，视频，你可以选择关键字，网站，终端设备等让用户在搜索时，浏览网页时，查找地图时，用手机查找时&#8230;看到你的广告，引起兴趣，并且通过点击来到你的网站。你可以在adwords后台选择用户的很多“属性”：像前面提及的那些：时间，国家，语言，性别，年龄等等。你可以通过查看你的网站流量分析用户喜欢什么，不喜欢什么，可能你买了一些不适合你的流量，然后你再决定如何改进：使得用户更喜欢你，然后google给你更多优惠，奖励你这种“相关性”的提高，你也得到更高回报的流量。对于google来说，绝大部分用户都是可以自助完成这些动作的，每天，只要google的服务器在运行，这个系统就像自动印钞机一样为google带来丰厚的收入。</p>
<p>ppc不同于seo，或者说更具优势的是：1.一切都更为可控，你决定不同的流量去向你网站哪些不同的页面，你决定用户看到的广告长什么样子，你还有很多其他“选择”；2. 不仅仅覆盖搜索网络，你的广告可以以多种形式呈现在其他地方，有很多产品或者服务用户其实不太会去google主动搜索；3. 快速，在除了China以外的国家，一般投放几个小时候后，你的广告就可以生效。当然ppc花钱，但如果你把marketing当做一种投资，那么最大的意义不在于你花出去多少，而是你的投资成功了与否，投资回报率多少，利润有多少，最后赚回了多少。而互联网上的这种投资，一切都是可控的，可衡量的，可追踪的，灵活的，这是一种新的marketing。</p>
<p>说到这里，插播一句，我觉得有些产品没选对，可能通过ppc成功概率比较小。开头不对，可能就没有以后了。还有任何市场的容量都是有限的，投资加倍，回报不一定加倍。</p>
<p>我知道看这个博客的很多都是做seo的，如果是个人的话，我相信做online的人，学学ppc还是很有必要的。我也希望在有余力的时候，分享一些自己做ppc的经验。让没有接触过这块的人，也能去尝试。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/1072/feed</wfw:commentRss>
		<slash:comments>60</slash:comments>
		</item>
		<item>
		<title>怎样形成一套非常科学系统的SEO方法</title>
		<link>http://www.semyj.com/archives/1032</link>
		<comments>http://www.semyj.com/archives/1032#comments</comments>
		<pubDate>Wed, 03 Feb 2010 08:33:36 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEO策略]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=1032</guid>
		<description><![CDATA[尽管SEO在中国已经不陌生，甚至都有形成一个行业的趋势，但是至今业内都还没有一套非常科学系统的分析方法。原因恐怕要归结于搜索引擎优化这个行业的特殊性。搜索引擎严格保守他们的算法，只公布一些大家很难去知道原因的指南。所以很多SEOer都在玩一个永远也不知道具体规则的游戏，这是这个行业混乱的根源。
我多次强调《google网站质量指南》的重要性，还因为这是搜索引擎告诉网站主的仅有的一些正确的规则，如果连这点规则都不好好掌握，那我还不确定大家能从什么地方得到更权威的指导。但是在实战中，尽管你熟读这个《指南》已经比很多人更了解搜索引擎的规则，不过仅仅知道这点东西是不够的，一套科学系统的分析方法能让你走得更远。
我想SEO经过了这么多年的发展，已经不应该再出现那种靠感性分析去做SEO的分析方法了。这种分析方法常用的语句就是：我觉得搜索引擎会如何如何。如：我觉得搜索引擎不会那么笨，这点一定能处理好；我觉得搜索引擎会把这个因素当作排名的因素之一&#8230;&#8230;。如果你是依靠感性分析去做SEO的，那你的SEO流量的变化曲线也是很感性的。当然更不能去无根据的臆测和道听途说。如：没有理论基础的去猜想搜索引擎会怎么样或者每逢搜索引擎的相关人员以及什么权威人士发表什么演说，就去盲目听从。

既然搜索引擎不告诉我们具体算法，那我们怎么才能建立这套科学系统的分析方法？答案是：从你知道的确信一定正确的理论开始，慢慢在实践中进化。
在上一篇《网页加载速度是如何影响SEO效果的》中的那个分析过程，就是从一个确切知道的理论去分析，然后得到了另一个确切的影响SEO流量的因素。在这个过程中，确信没有错的理论是：搜索引擎爬虫一定要抓取过那个页面以后，才会有机会收录这个网页的。根据文章中那个接下来的数据分析，可以得到：网页加载速度会在很大程度上影响SEO流量。
那接着分析，什么措施能影响网页加载速度呢？ 网络环境、服务器硬件、CMS本身都能影响网页加载速度。优化其中的任何一项，都能提升网页加载速度。那马上又可以得出：网络环境影响SEO流量、服务器硬件影响SEO流量、CMS本身的速度影响SEO流量。
接着分析，CMS本身的优化可以做的事情有哪些呢？ 启用Gzip压缩、合并CSS和JS文件、减少DNS查询、启用缓存等等都能优化CMS本身的速度。&#8230;&#8230;这些东西，看起来是这么的眼熟，那是因为在《google网站管理员工具》里的“网站性能”里，已经把这些建议都告诉你了。但是根据我们上面的这个分析过程，可以知道， “网站性能”里提到的这些优化，都是CMS本身的优化，并没有提到网络环境和服务器硬件的优化。只不过你确定这两个因素是确实影响SEO流量的。如果哪一天《google 黑板报》或者 google的官方博客（需要翻墙）上出现一篇文章，告诉你如何挑选一个好的服务器托管商，千万不要惊讶，因为你早就知道为什么了。google一直以来都在用这种方式告诉你要如何去优化一些什么因素，只是站在他们的立场，不会详细向你解释为什么要这么做。
通过数据分析，还能知道谁影响的程度大一点，谁小一点。
很多的常识因素都可以这样一步步进化下去，这个分析过程，是非常科学的。不管是对你自己还是其他人，其中的原理你都可以解释得非常清楚。并且在这个进化的过程中，你会发现你越来越能控制好SEO流量了。每一步的进化，意味着你对搜索引擎的了解又多了一点、SEO的知识结构又完善了一点，同时，对SEO流量的控制能力又变强了一点。同时，你发现你和网页设计师以及工程师的矛盾也越来越少，因为好的SEO，是不会让SEO和网页设计师以及工程师的利益是矛盾的。
只要经历过非常多这样的分析过程，一定会颠覆很多人原有的SEO知识结构。因为以前很多流传的SEO方法，很多都是感性分析的居多，没有解释为什么要这么做，没有数据上的支撑，甚至没有理论上的支撑，所以没有抓住重点。我在《分词与索引库》说过，可能你以为是细节的东西，其实是重点，你以为是重点的东西，其实都可以忽略。
那么，在日常的SEO工作中，是一些什么能力支撑着你去进行这样一个分析过程呢？
不知道大家还是不是记得我在《怎么样学SEO》提到的那四种能力，在这个分析过程中：
1，弄懂搜索引擎相关技术和原理：可以从根本上了解搜索引擎，确定很多一定正确的理论，并可以找到很多值得去分析的线索。
2，了解网站制作相关的技术：能让你清楚网站上有哪些因素能影响搜索引擎的哪些方面，并用什么方法来解决问题。
3，数据分析能力：可以了解各种现有的因素如何影响SEO流量，并依靠这种能力挖掘更多的因素。科学系统的SEO分析过程，从头到尾都离不开数据的支撑。
4，了解你要排名的那个搜索引擎：不管你怎么努力，还是会有一些数据上和理论上都无法理解的问题。每个搜索引擎就像和人一样，是有一定的秉性的。可以通过你对这个搜索引擎的了解来得到答案。同时了解这个搜索引擎，也能让你获得更多的可以分析的因素。
最后说一下，这种从常识出发来科学系统的进行SEO分析的方法比了解部分搜索引擎的算法还更能控制SEO流量。
可能很多人会反驳这个观点，比如前段时间我朋友就和我说某外贸B2C网站的创始人是从谷歌出来的，那他们一定能做好SEO，我说那是不可能的。只有那些自己做过搜索引擎的人才会理解为什么。比如：alibaba的B2B网站也算是一个搜索引擎，我是知道其中的排序规则的，但是如果给我一个商家的网站，要我在alibaba上获得流量，在没有一套科学系统的方法之前，我是肯定做不好的。因为搜索引擎的算法不是加减乘除，不是这个因素加那个因素做好了就可以获得好流量的。搜索引擎的设计者，知道这个或者那个因素的权重大小，以及可能产生的大致结果，但是具体的结果是自己也不能控制的。要不然百度的人，不会每天搜索上千个词语来查看搜索结果的准确度了。而google的成功，也有一部分原因是当初yahoo采用了它的搜索技术，google借此积累了大量数据，实践并改进了算法。
而且，在搜索引擎内部，只有极少数的人知道各个因素的权重大小，绝大部分设计搜索引擎的工程师，都是负责某个具体的任务，优化和解决某个具体的问题，如负责爬虫的工程师解决提高爬虫效率这一块的工作，负责内容消重的工程师就去减少索引重复内容。 连设计这个搜索引擎的工程师都如此，更别提一个远在其他国家的分公司的人员了。要不然，百度和google这么多离职的工程师不早就把算法泄漏了。
如果能自己用开源的程序做一个小规模的搜索引擎，就更能理解这个问题。即使这个搜索引擎的算法都是你自己调配的，你都不能预料到后来的搜索结果。而且做搜索引擎是一回事，在搜索引擎上拉流量又是另一回事了。不然google不会后知后觉的知道原来网页加载速度影响SEO流量。
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-
另注：
最近很久没有更新博客，是因为在忙离职的事情。我从2月12日开始就离开阿里巴巴了，phyllis也会在年后离开，我们打算一起自己做一些事情，如果有SEO和PPC方面需求的朋友可以和我们联系。
Email：guoping.seo@gmail.com 。 MSN : guoping.zhanggp@hotmail.com
以后这个博客还会照常更新，也有更多时间去管理论坛了。
]]></description>
			<content:encoded><![CDATA[<p>尽管SEO在中国已经不陌生，甚至都有形成一个行业的趋势，但是至今业内都还没有一套非常科学系统的分析方法。原因恐怕要归结于搜索引擎优化这个行业的特殊性。搜索引擎严格保守他们的算法，只公布一些大家很难去知道原因的指南。所以很多SEOer都在玩一个永远也不知道具体规则的游戏，这是这个行业混乱的根源。</p>
<p>我多次强调《<a href="http://www.google.com/support/webmasters/" target="_blank">google网站质量指南</a>》的重要性，还因为这是搜索引擎告诉网站主的仅有的一些正确的规则，如果连这点规则都不好好掌握，那我还不确定大家能从什么地方得到更权威的指导。但是在实战中，尽管你熟读这个《指南》已经比很多人更了解搜索引擎的规则，不过仅仅知道这点东西是不够的，一套科学系统的分析方法能让你走得更远。</p>
<p>我想SEO经过了这么多年的发展，已经不应该再出现那种靠感性分析去做SEO的分析方法了。这种分析方法常用的语句就是：我觉得搜索引擎会如何如何。如：我觉得搜索引擎不会那么笨，这点一定能处理好；我觉得搜索引擎会把这个因素当作排名的因素之一&#8230;&#8230;。如果你是依靠感性分析去做SEO的，那你的SEO流量的变化曲线也是很感性的。当然更不能去无根据的臆测和道听途说。如：没有理论基础的去猜想搜索引擎会怎么样或者每逢搜索引擎的相关人员以及什么权威人士发表什么演说，就去盲目听从。</p>
<p><span id="more-1032"></span></p>
<p>既然搜索引擎不告诉我们具体算法，那我们怎么才能建立这套科学系统的分析方法？答案是：从你知道的确信一定正确的理论开始，慢慢在实践中进化。</p>
<p>在上一篇《<a href="http://www.semyj.com/archives/969">网页加载速度是如何影响SEO效果的</a>》中的那个分析过程，就是从一个确切知道的理论去分析，然后得到了另一个确切的影响SEO流量的因素。在这个过程中，确信没有错的理论是：搜索引擎爬虫一定要抓取过那个页面以后，才会有机会收录这个网页的。根据文章中那个接下来的数据分析，可以得到：网页加载速度会在很大程度上影响SEO流量。</p>
<p>那接着分析，什么措施能影响网页加载速度呢？ 网络环境、服务器硬件、CMS本身都能影响网页加载速度。优化其中的任何一项，都能提升网页加载速度。那马上又可以得出：网络环境影响SEO流量、服务器硬件影响SEO流量、CMS本身的速度影响SEO流量。</p>
<p>接着分析，CMS本身的优化可以做的事情有哪些呢？ 启用Gzip压缩、合并CSS和JS文件、减少DNS查询、启用缓存等等都能优化CMS本身的速度。&#8230;&#8230;这些东西，看起来是这么的眼熟，那是因为在《google网站管理员工具》里的“网站性能”里，已经把这些建议都告诉你了。但是根据我们上面的这个分析过程，可以知道， “网站性能”里提到的这些优化，都是CMS本身的优化，并没有提到网络环境和服务器硬件的优化。只不过你确定这两个因素是确实影响SEO流量的。如果哪一天《<a href="http://www.googlechinablog.com/" target="_blank">google 黑板报</a>》或者 <a href="http://googleblog.blogspot.com/" target="_blank">google的官方博客</a>（需要翻墙）上出现一篇文章，告诉你如何挑选一个好的服务器托管商，千万不要惊讶，因为你早就知道为什么了。google一直以来都在用这种方式告诉你要如何去优化一些什么因素，只是站在他们的立场，不会详细向你解释为什么要这么做。</p>
<p>通过数据分析，还能知道谁影响的程度大一点，谁小一点。</p>
<p>很多的常识因素都可以这样一步步进化下去，这个分析过程，是非常科学的。不管是对你自己还是其他人，其中的原理你都可以解释得非常清楚。并且在这个进化的过程中，你会发现你越来越能控制好SEO流量了。每一步的进化，意味着你对搜索引擎的了解又多了一点、SEO的知识结构又完善了一点，同时，对SEO流量的控制能力又变强了一点。同时，你发现你和网页设计师以及工程师的矛盾也越来越少，因为好的SEO，是不会让SEO和网页设计师以及工程师的利益是矛盾的。</p>
<div id="attachment_1057" class="wp-caption alignnone" style="width: 368px"><img class="size-full wp-image-1057" title="z" src="http://www.semyj.com/wp-content/uploads/2010/02/z1.gif" alt="知识结构、SEO可控性、部门关系" width="358" height="400" /><p class="wp-caption-text">知识结构、SEO可控性、部门关系</p></div>
<p>只要经历过非常多这样的分析过程，一定会颠覆很多人原有的SEO知识结构。因为以前很多流传的SEO方法，很多都是感性分析的居多，没有解释为什么要这么做，没有数据上的支撑，甚至没有理论上的支撑，所以没有抓住重点。我在《<a href="http://www.semyj.com/archives/544">分词与索引库</a>》说过，可能你以为是细节的东西，其实是重点，你以为是重点的东西，其实都可以忽略。</p>
<p>那么，在日常的SEO工作中，是一些什么能力支撑着你去进行这样一个分析过程呢？</p>
<p>不知道大家还是不是记得我在《<a href="http://www.semyj.com/archives/489">怎么样学SEO</a>》提到的那四种能力，在这个分析过程中：</p>
<p>1，弄懂搜索引擎相关技术和原理：可以从根本上了解搜索引擎，确定很多一定正确的理论，并可以找到很多值得去分析的线索。</p>
<p>2，了解网站制作相关的技术：能让你清楚网站上有哪些因素能影响搜索引擎的哪些方面，并用什么方法来解决问题。</p>
<p>3，数据分析能力：可以了解各种现有的因素如何影响SEO流量，并依靠这种能力挖掘更多的因素。科学系统的SEO分析过程，从头到尾都离不开数据的支撑。</p>
<p>4，了解你要排名的那个搜索引擎：不管你怎么努力，还是会有一些数据上和理论上都无法理解的问题。每个搜索引擎就像和人一样，是有一定的秉性的。可以通过你对这个搜索引擎的了解来得到答案。同时了解这个搜索引擎，也能让你获得更多的可以分析的因素。</p>
<p>最后说一下，这种从常识出发来科学系统的进行SEO分析的方法比了解部分搜索引擎的算法还更能控制SEO流量。</p>
<p>可能很多人会反驳这个观点，比如前段时间我朋友就和我说某外贸B2C网站的创始人是从谷歌出来的，那他们一定能做好SEO，我说那是不可能的。只有那些自己做过搜索引擎的人才会理解为什么。比如：alibaba的B2B网站也算是一个搜索引擎，我是知道其中的排序规则的，但是如果给我一个商家的网站，要我在alibaba上获得流量，在没有一套科学系统的方法之前，我是肯定做不好的。因为搜索引擎的算法不是加减乘除，不是这个因素加那个因素做好了就可以获得好流量的。搜索引擎的设计者，知道这个或者那个因素的权重大小，以及可能产生的大致结果，但是具体的结果是自己也不能控制的。要不然百度的人，不会<a href="http://uicom.net/blog/?p=836" target="_blank">每天搜索上千个词语</a>来查看搜索结果的准确度了。而google的成功，也有一部分原因是当初yahoo采用了它的搜索技术，google借此积累了大量数据，实践并改进了算法。</p>
<p>而且，在搜索引擎内部，只有极少数的人知道各个因素的权重大小，绝大部分设计搜索引擎的工程师，都是负责某个具体的任务，优化和解决某个具体的问题，如负责爬虫的工程师解决提高爬虫效率这一块的工作，负责内容消重的工程师就去减少索引重复内容。 连设计这个搜索引擎的工程师都如此，更别提一个远在其他国家的分公司的人员了。要不然，百度和google这么多离职的工程师不早就把算法泄漏了。</p>
<p>如果能自己用开源的程序做一个小规模的搜索引擎，就更能理解这个问题。即使这个搜索引擎的算法都是你自己调配的，你都不能预料到后来的搜索结果。而且做搜索引擎是一回事，在搜索引擎上拉流量又是另一回事了。不然google不会后知后觉的知道原来网页加载速度影响SEO流量。</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-</p>
<p>另注：</p>
<p>最近很久没有更新博客，是因为在忙离职的事情。我从2月12日开始就离开阿里巴巴了，phyllis也会在年后离开，我们打算一起自己做一些事情，如果有SEO和PPC方面需求的朋友可以和我们联系。</p>
<p>Email：guoping.seo@gmail.com 。 MSN : guoping.zhanggp@hotmail.com</p>
<p>以后这个博客还会照常更新，也有更多时间去管理论坛了。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/1032/feed</wfw:commentRss>
		<slash:comments>86</slash:comments>
		</item>
		<item>
		<title>谷歌关键字广告优惠申请</title>
		<link>http://www.semyj.com/archives/1027</link>
		<comments>http://www.semyj.com/archives/1027#comments</comments>
		<pubDate>Wed, 20 Jan 2010 04:39:34 +0000</pubDate>
		<dc:creator>Phyllis</dc:creator>
				<category><![CDATA[PPC入门]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=1027</guid>
		<description><![CDATA[这个也许有点old了，谷歌的中小企业激励计划，记得是去年8、9月份的时候推出的。没有尝试过PPC的同学，强烈推荐去申请一下：谷歌关键字广告优惠申请
不过申请了不一定能通过，我有一次申请成功的经验，大致讲一下：
1. 针对新客户，所以你的网站以及gmail邮箱等是需要以前没有开通过adwords的，也没有申请过这个优惠券的。
2.申请能否通过，我的估计是，谷歌喜欢有潜力的网站，毕竟优惠用完了，是希望你能继续投入的。当然，有一些网站，产品属于禁限售的，应该是通不过的。纯粹做affiliate像淘客的，可能也不会给通过。不过大家可以申请试试。：）
关于PPC的问题，大家可以到新基地论坛找我，最近一段比较忙，但是基本上每天都会看看论坛。
还有就是希望等忙完这段，可以写一些PPC的入门到提高的文章。没有做过ppc的同学，就从申请优惠券开始吧。
]]></description>
			<content:encoded><![CDATA[<p>这个也许有点old了，谷歌的中小企业激励计划，记得是去年8、9月份的时候推出的。没有尝试过PPC的同学，强烈推荐去申请一下：<a href="https://www.google.com/appserve/fb/forms/cnawcoupon38/">谷歌关键字广告优惠申请</a></p>
<p>不过申请了不一定能通过，我有一次申请成功的经验，大致讲一下：</p>
<p>1. 针对新客户，所以你的网站以及gmail邮箱等是需要以前没有开通过adwords的，也没有申请过这个优惠券的。</p>
<p>2.申请能否通过，我的估计是，谷歌喜欢有潜力的网站，毕竟优惠用完了，是希望你能继续投入的。当然，有一些网站，产品属于禁限售的，应该是通不过的。纯粹做affiliate像淘客的，可能也不会给通过。不过大家可以申请试试。：）</p>
<p>关于PPC的问题，大家可以到<a href="http://semyj.com/bbs/">新基地论坛</a>找我，最近一段比较忙，但是基本上每天都会看看论坛。</p>
<p>还有就是希望等忙完这段，可以写一些PPC的入门到提高的文章。没有做过ppc的同学，就从申请优惠券开始吧。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/1027/feed</wfw:commentRss>
		<slash:comments>43</slash:comments>
		</item>
		<item>
		<title>如果google退出中国</title>
		<link>http://www.semyj.com/archives/1024</link>
		<comments>http://www.semyj.com/archives/1024#comments</comments>
		<pubDate>Wed, 13 Jan 2010 11:17:40 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[关于本站]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=1024</guid>
		<description><![CDATA[如果google退出中国。
那么我考虑将在近几年内尽快移民国外。。。
某些高高在上的猪脑袋的邪恶，导致了这个国家大大小小各种各样的邪恶。
]]></description>
			<content:encoded><![CDATA[<p>如果google退出中国。</p>
<p>那么我考虑将在近几年内尽快移民国外。。。</p>
<p>某些高高在上的猪脑袋的邪恶，导致了这个国家大大小小各种各样的邪恶。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/1024/feed</wfw:commentRss>
		<slash:comments>85</slash:comments>
		</item>
		<item>
		<title>对你有用的谷歌SEM工具</title>
		<link>http://www.semyj.com/archives/975</link>
		<comments>http://www.semyj.com/archives/975#comments</comments>
		<pubDate>Sun, 10 Jan 2010 03:18:05 +0000</pubDate>
		<dc:creator>Phyllis</dc:creator>
				<category><![CDATA[PPC入门]]></category>
		<category><![CDATA[SEM工具]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=975</guid>
		<description><![CDATA[好久没写东西了。这个博客原来是两个人合写的，但是绝大部分都是国平一个人在写。写文章对我真的是一件很痛苦的事情。今天这篇大部分是翻译自Gordon的文章，我觉得这些内容对于营销人员是非常有用的。
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-
作为一个站长或者PPCer, SEOer, 不论你是要开展付费搜索计划，还是希望对网站的自然搜索流量更进一步的观察，你都可以用谷歌的很多工具帮助制定计划，优化投放或者衡量产出。
谷歌的工具主要可以分为三类：
付费搜索工具-搜索网络
付费搜索工具-内容网络
自然搜索工具
在不同阶段，谷歌的工具都可以帮助你：

广告计划阶段-
谷歌搜索解析， 关键词工具，基于搜索的关键词工具,  流量估算工具， Ad Planner，多媒体广告制作工具, 相关搜索, 神奇罗盘, Adwords编辑器；
广告投放阶段-
转化优化工具，出价模拟工具，广告预览工具，展示位置工具，网站排除工具， 地理位置、语言等选择，投放时间设置
追踪效果，衡量产出-
使用转化跟踪工具，谷歌分析来跟踪不同来源流量的投入产出，用网站优化工具改善网站转化率，使用网站管理员工具找到并解决网站问题。
这个PPT更详细一点：


大部分工具可以在这个页面找到简介（只能找到英文版）
大部分工具我都用过，不过最喜欢用，用的最多是 adwords编辑器，关键词工具，谷歌分析，ad planner，特别推荐大家用ad planner，可能很多人都用过了，是一个非常有用的工具。
]]></description>
			<content:encoded><![CDATA[<p>好久没写东西了。这个博客原来是两个人合写的，但是绝大部分都是国平一个人在写。写文章对我真的是一件很痛苦的事情。今天这篇大部分是翻译自<a href="http://www.gordonchoi.com/google-sem-tools-20091204">Gordon</a>的文章，我觉得这些内容对于营销人员是非常有用的。</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-</p>
<p>作为一个站长或者PPCer, SEOer, 不论你是要开展付费搜索计划，还是希望对网站的自然搜索流量更进一步的观察，你都可以用谷歌的很多工具帮助制定计划，优化投放或者衡量产出。<br />
谷歌的工具主要可以分为三类：<br />
付费搜索工具-搜索网络<br />
付费搜索工具-内容网络<br />
自然搜索工具<br />
在不同阶段，谷歌的工具都可以帮助你：</p>
<p><span id="more-975"></span><br />
<strong>广告计划阶段-</strong><br />
<a href="http://www.google.com/insights/search/" target="_blank">谷歌搜索解析</a>， <a href="https://adwords.google.com/select/KeywordToolExternal" target="_blank">关键词工具</a>，<a href="http://www.google.com/sktool/">基于搜索的关键词工具</a>, <a href="http://www.google.com/sktool/" target="_blank"> 流量估算工具</a>， <a href="https://www.google.com/adplanner" target="_blank">Ad Planner</a>，多媒体广告制作工具, 相关搜索, 神奇罗盘, Adwords编辑器；<br />
<strong>广告投放阶段-</strong><br />
转化优化工具，出价模拟工具，广告预览工具，展示位置工具，网站排除工具， 地理位置、语言等选择，投放时间设置<br />
<strong>追踪效果，衡量产出-</strong><br />
使用<strong>转化跟踪工具</strong>，<strong>谷歌分析</strong>来跟踪不同来源流量的投入产出，用<strong>网站优化工具</strong>改善网站转化率，使用<strong>网站管理员工具</strong>找到并解决网站问题。</p>
<p>这个PPT更详细一点：</p>
<ul>
<iframe src="http://docs.google.com/present/embed?id=0AVGMTTM9RD1ZZGt4Y3NxZ18xODRmOXI5a3FncQ" frameborder="0" width="410" height="342"></iframe></ul>
<p>大部分工具可以在<a href="http://www.google.com/agencytoolkit/index-b.html" target="_blank">这个页面</a>找到简介（只能找到英文版）</p>
<p>大部分工具我都用过，不过最喜欢用，用的最多是 adwords编辑器，关键词工具，谷歌分析，ad planner，特别推荐大家用ad planner，可能很多人都用过了，是一个非常有用的工具。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/975/feed</wfw:commentRss>
		<slash:comments>33</slash:comments>
		</item>
		<item>
		<title>网页加载速度是如何影响SEO效果的</title>
		<link>http://www.semyj.com/archives/969</link>
		<comments>http://www.semyj.com/archives/969#comments</comments>
		<pubDate>Tue, 05 Jan 2010 09:34:19 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEO案例]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=969</guid>
		<description><![CDATA[“谷歌中文网站管理员博客”刚刚发表了一篇新文章，介绍了一下《google 网站管理员工具》中推出的新功能 -“网站性能”。这个工具是通过google工具栏记录了用户访问你网站的速度，并给出了很多加快你网站速度的建议。
http://www.googlechinawebmaster.com/2009/12/blog-post_30.html
而最近也传闻google将会把网页加载速度作为影响排名的一个因素。那么网页打开速度是不是能影响SEO效果？如果能影响，那是怎么影响的呢？
在揭示其中的道理之前，我希望大家能把上面那些传闻或“网站性能”的功能都忘掉。让我们追本溯源，来看看网页打开速度和SEO流量之间的关系。
做SEO有时候不需要听从别人给你的信息和意见，你只要专注于研究搜索引擎，同样也能成功的。这种关系的发现，也得益于早期我非常重视数据分析，所以我在《怎么样去学SEO（二）》中把数据分析能力列为SEOer应该具备的四大能力之一。由于有很多数据做支撑，现在我来给大家分析其中的联系，大家就容易看懂很多。
到了后期，连google也认识到了网页速度和SEO流量之间的关系，所以在这个“网站性能”以前就推出过相关的工具来帮助网站管理员。

要说明这种关系，就要从搜索引擎爬虫说起。不知道大家对于搜索引擎爬虫在一个网站上的行为有没有概念，我现在发一下某个网站（不是alibaba）的一些数据出来，大家就能意识到一些爬虫的特性了。下面是从服务器LOG日志中分析出的数据。
&#8212;-
从上面图1中可以看到google访问这个网站206次，这206次里面是由很多个不同的爬虫访问的。图2显示：有的爬虫一天之内来了8次，一共停留了2小时左右，有的爬虫来了1次，停留了20多个小时以上。所以这个网站是被很多个爬虫在不间断的访问的。为了计算方便，可以把google所有的爬虫停留在这个网站的总时间加起来。虽然一天只有24个小时的，但是google的爬虫这一天花在这个网站上的时间可能是成百上千多个小时。这里真实的数据是：在这个网站中，google所有爬虫那天在这个网站上花费的实际总时间是721个小时。
而服务器LOG日志里同样可以分析出爬虫在一个网页上的停留时间。如：
得到了这两个数据以后，用所有爬虫总的停留时间除以单个页面的停留时间，就是搜索引擎爬虫这天所抓取的页面总量。
721 小时× 3600 秒 ÷ 35 秒 = 74160 页
那么得到这个搜索引擎爬虫这天所抓取的页面总量有什么用呢？
对于一般的小网站来说，一天能被抓取 74160页是一个很不错数据。但是我上面给出的是一个中型网站，它整个网站的页面总量有800多万有SEO价值的页面。那么，在最理想的情况下，这些页面被搜索引擎抓取完要花费的时间为：
800万 ÷ 74160 页 = 108 天
这是理论上最理想的情况，实际上真实的情况为：
由于有多个爬虫在抓取网站，有很多的页面在一天之内是会被爬虫重复抓取的。有的页面一天之内被抓取20多次，有的页面一天之内只被抓取1次。通过 “停留总时间 ÷ 单个页面停留时间” 得到的页面数量，是没有去除那些重复抓取的页面的。所以搜索引擎一天之内实际抓取的不重复页面没有74160页那么多，而是40000页的样子。还有一点，爬虫今天抓取的页面，到了明天还有很多会被重复抓取。所以爬虫不光在同一天内会重复抓取很多页面，而且到了下一天还是会重复抓取前一天抓取过的很多页面。
这样下来，爬虫平均每天抓取不重复的页面数量就只有10000页的样子了。那么，要爬虫把这个网站所有的页面抓取完需要的时间为：
800万 ÷  1万页 = 800天
其实，这个800天抓取完整个网站还是太理想化了。实际的情况是很多网站由于结构的原因，有些网页创建后4-5年，都还没被爬虫抓取过。
上面的这个分析过程，都没用到什么惊天动地的计算方法。只要你有一点数据分析的意识，就能看清楚事实的。当一个网站收录量不理想，大家就应该去看看那些页面是不是被搜索引擎爬虫浏览过。如果一个页面都没有被搜索引擎爬虫浏览过，是不可能会被收录的。一个网站的收录量没有上去，那SEO流量的提升就会有很大的一个瓶颈。
根据我们刚才上面的那个分析过程，要提升网站的收录量，首先要解决的就是搜索引擎每天抓取网站的抓取量。而：
抓取量 =   爬虫总的停留时间 ÷ 单个页面的停留时间
一个网站，爬虫总的停留时间在某个期间是保持相对固定的。当然，有方法提高爬虫总的停留时间，不过这不是这篇文章要讲的内容。我们先通过减少个页面的停留时间也可以增加爬虫的抓取量。
减少爬虫单个页面的停留时间，可以简单的认为提高网页加载速度就可以了，虽然实际上这两个因素之间还存在着一个对应关系，但是这里先不讲。这个时候，网页的加载速度就和抓取量之间有了一个正比的关系，网页加载速度越快，爬虫整个的抓取量就越大。抓取量越大，有效收录量就会增加，从而促使SEO流量增加，因为给一个大中型网站带来流量的，90%以上都是长尾词。大中型网站，有时甚至是小网站，只要收录量增加一定的百分比，SEO流量也会增加一定的百分比。网页的加载速度，就和SEO流量之间建立了一个这样的关系。
其实，google也知道网页速度和SEO流量之间的关系，所以早在“网站性能”这个功能推出以前，就推出了另一个功能让大家去用，那个功能就是“google 网站管理员工具”里的“抓取统计信息”。那里把爬虫对你网站的抓取量，和你网页下载的平均时间都列了出来。
如果大家平常注意观察这里面的数据就会发现这样的规律：一旦网站下载时间减少了，那抓取量就会增大一点。
一般小网站，这样的规律还不是太明显。因为有其他影响这个规律的因素存在，而且小网站页面数太少了，爬虫随便多增加几百页的抓取量就影响了50%以上的抓取量。但是在大中型网站，这个规律是非常明显的。如：
当这个网站加快了网页加载速度，爬虫的抓取量就稳步增加了。这个图表能很有利的证明上面提到的理论。
这个图表也再次证明了我在《google 的良苦用心：网站管理员工具》里说的：“google网站管理员工具里的每个功能都是和SEO相关的”。
关于网页速度和排名，google否认曾经将网页速度列为提高排名的因素。而 Matt Cutts 最近也说：In a nutshell &#8211; while slow page load times won&#8217;t negatively impact your rankings, fast load times may have a positive effect.   有人把它翻译成：网页加载速度慢，不会影响Google排名，但是网页加载快却对排名有积极作用。 [...]]]></description>
			<content:encoded><![CDATA[<p>“谷歌中文网站管理员博客”刚刚发表了一篇新文章，介绍了一下《google 网站管理员工具》中推出的新功能 -“网站性能”。这个工具是通过google工具栏记录了用户访问你网站的速度，并给出了很多加快你网站速度的建议。</p>
<p><a href="http://www.googlechinawebmaster.com/2009/12/blog-post_30.html" target="_blank">http://www.googlechinawebmaster.com/2009/12/blog-post_30.html</a></p>
<p>而最近也传闻google将会把网页加载速度作为影响排名的一个因素。那么网页打开速度是不是能影响SEO效果？如果能影响，那是怎么影响的呢？</p>
<p>在揭示其中的道理之前，我希望大家能把上面那些传闻或“网站性能”的功能都忘掉。让我们追本溯源，来看看网页打开速度和SEO流量之间的关系。</p>
<p>做SEO有时候不需要听从别人给你的信息和意见，你只要专注于研究搜索引擎，同样也能成功的。这种关系的发现，也得益于早期我非常重视数据分析，所以我在《<a href="http://www.semyj.com/archives/512">怎么样去学SEO（二）</a>》中把数据分析能力列为SEOer应该具备的四大能力之一。由于有很多数据做支撑，现在我来给大家分析其中的联系，大家就容易看懂很多。</p>
<p>到了后期，连google也认识到了网页速度和SEO流量之间的关系，所以在这个“网站性能”以前就推出过相关的工具来帮助网站管理员。</p>
<p><span id="more-969"></span></p>
<p>要说明这种关系，就要从搜索引擎爬虫说起。不知道大家对于搜索引擎爬虫在一个网站上的行为有没有概念，我现在发一下某个网站（不是alibaba）的一些数据出来，大家就能意识到一些爬虫的特性了。下面是从服务器LOG日志中分析出的数据。</p>
<div id="attachment_985" class="wp-caption alignnone" style="width: 500px"><img class="size-full wp-image-985" title="spider1" src="http://www.semyj.com/wp-content/uploads/2010/01/spider1.gif" alt="爬虫访问次数" width="490" height="210" /><p class="wp-caption-text">图1：爬虫访问次数</p></div>
<p>&#8212;-</p>
<div id="attachment_986" class="wp-caption alignnone" style="width: 525px"><img class="size-full wp-image-986" title="spider2" src="http://www.semyj.com/wp-content/uploads/2010/01/spider2.gif" alt="爬虫停留时间" width="515" height="259" /><p class="wp-caption-text">图2：爬虫停留时间</p></div>
<p>从上面图1中可以看到google访问这个网站206次，这206次里面是由很多个不同的爬虫访问的。图2显示：有的爬虫一天之内来了8次，一共停留了2小时左右，有的爬虫来了1次，停留了20多个小时以上。所以这个网站是被很多个爬虫在不间断的访问的。为了计算方便，可以把google所有的爬虫停留在这个网站的总时间加起来。虽然一天只有24个小时的，但是google的爬虫这一天花在这个网站上的时间可能是成百上千多个小时。这里真实的数据是：在这个网站中，google所有爬虫那天在这个网站上花费的实际总时间是721个小时。</p>
<p>而服务器LOG日志里同样可以分析出爬虫在一个网页上的停留时间。如：</p>
<div id="attachment_988" class="wp-caption alignnone" style="width: 536px"><img class="size-full wp-image-988" title="spider3" src="http://www.semyj.com/wp-content/uploads/2010/01/spider3.gif" alt="爬虫停留时间" width="526" height="243" /><p class="wp-caption-text">图3：爬虫停留时间</p></div>
<p>得到了这两个数据以后，用所有爬虫总的停留时间除以单个页面的停留时间，就是搜索引擎爬虫这天所抓取的页面总量。</p>
<p>721 小时× 3600 秒 ÷ 35 秒 = 74160 页</p>
<p>那么得到这个搜索引擎爬虫这天所抓取的页面总量有什么用呢？</p>
<p>对于一般的小网站来说，一天能被抓取 74160页是一个很不错数据。但是我上面给出的是一个中型网站，它整个网站的页面总量有800多万有SEO价值的页面。那么，在最理想的情况下，这些页面被搜索引擎抓取完要花费的时间为：</p>
<p>800万 ÷ 74160 页 = 108 天</p>
<p>这是理论上最理想的情况，实际上真实的情况为：</p>
<p>由于有多个爬虫在抓取网站，有很多的页面在一天之内是会被爬虫重复抓取的。有的页面一天之内被抓取20多次，有的页面一天之内只被抓取1次。通过 “停留总时间 ÷ 单个页面停留时间” 得到的页面数量，是没有去除那些重复抓取的页面的。所以搜索引擎一天之内实际抓取的不重复页面没有74160页那么多，而是40000页的样子。还有一点，爬虫今天抓取的页面，到了明天还有很多会被重复抓取。所以爬虫不光在同一天内会重复抓取很多页面，而且到了下一天还是会重复抓取前一天抓取过的很多页面。</p>
<p>这样下来，爬虫平均每天抓取不重复的页面数量就只有10000页的样子了。那么，要爬虫把这个网站所有的页面抓取完需要的时间为：</p>
<p>800万 ÷  1万页 = 800天</p>
<p>其实，这个800天抓取完整个网站还是太理想化了。实际的情况是很多网站由于结构的原因，有些网页创建后4-5年，都还没被爬虫抓取过。</p>
<p>上面的这个分析过程，都没用到什么惊天动地的计算方法。只要你有一点数据分析的意识，就能看清楚事实的。当一个网站收录量不理想，大家就应该去看看那些页面是不是被搜索引擎爬虫浏览过。如果一个页面都没有被搜索引擎爬虫浏览过，是不可能会被收录的。一个网站的收录量没有上去，那SEO流量的提升就会有很大的一个瓶颈。</p>
<p>根据我们刚才上面的那个分析过程，要提升网站的收录量，首先要解决的就是搜索引擎每天抓取网站的抓取量。而：</p>
<p>抓取量 =   爬虫总的停留时间 ÷ 单个页面的停留时间</p>
<p>一个网站，爬虫总的停留时间在某个期间是保持相对固定的。当然，有方法提高爬虫总的停留时间，不过这不是这篇文章要讲的内容。我们先通过减少个页面的停留时间也可以增加爬虫的抓取量。</p>
<p>减少爬虫单个页面的停留时间，可以简单的认为提高网页加载速度就可以了，虽然实际上这两个因素之间还存在着一个对应关系，但是这里先不讲。这个时候，网页的加载速度就和抓取量之间有了一个正比的关系，网页加载速度越快，爬虫整个的抓取量就越大。抓取量越大，有效收录量就会增加，从而促使SEO流量增加，因为给<a href="http://www.semyj.com/archives/776">一个大中型网站带来流量的，90%以上都是长尾词</a>。大中型网站，有时甚至是小网站，只要收录量增加一定的百分比，SEO流量也会增加一定的百分比。网页的加载速度，就和SEO流量之间建立了一个这样的关系。</p>
<p>其实，google也知道网页速度和SEO流量之间的关系，所以早在“网站性能”这个功能推出以前，就推出了另一个功能让大家去用，那个功能就是“google 网站管理员工具”里的“抓取统计信息”。那里把爬虫对你网站的抓取量，和你网页下载的平均时间都列了出来。</p>
<p>如果大家平常注意观察这里面的数据就会发现这样的规律：一旦网站下载时间减少了，那抓取量就会增大一点。</p>
<p>一般小网站，这样的规律还不是太明显。因为有其他影响这个规律的因素存在，而且小网站页面数太少了，爬虫随便多增加几百页的抓取量就影响了50%以上的抓取量。但是在大中型网站，这个规律是非常明显的。如：</p>
<div id="attachment_1007" class="wp-caption alignnone" style="width: 529px"><img class="size-full wp-image-1007" title="tongji" src="http://www.semyj.com/wp-content/uploads/2010/01/tongji.GIF" alt="抓取统计信息" width="519" height="648" /><p class="wp-caption-text">抓取统计信息</p></div>
<p>当这个网站加快了网页加载速度，爬虫的抓取量就稳步增加了。这个图表能很有利的证明上面提到的理论。</p>
<p>这个图表也再次证明了我在《<a href="http://www.semyj.com/archives/692">google 的良苦用心：网站管理员工具</a>》里说的：“google网站管理员工具里的每个功能都是和SEO相关的”。</p>
<p>关于网页速度和排名，google否认曾经将网页速度列为提高排名的因素。而 Matt Cutts 最近也说：In a nutshell &#8211; while slow page load times won&#8217;t negatively impact your rankings, fast load times may have a positive effect.   有人把它翻译成：网页加载速度慢，不会影响Google排名，但是网页加载快却对排名有积极作用。 其实这样翻译是没有理解这句话，Matt Cutts的意思是：网页加载速度慢，不会影响Google排名，但是网页加载快却有积极作用。拿掉以前那个翻译中的“对排名”三个字即可。至于其中的原因，我想通过这篇文章大家都理解了吧。</p>
<p>这也是为什么我要在《<a href="http://www.semyj.com/archives/822">内部链接还是外部链接</a>》里强调一下的：有时候是因为“你没有掌握到他们那么多信息，所以你无法理解他们的话。也不会推测出他们的潜台词以及他们没有说全的话而已。” 我其实很少关注Matt Cutts说什么，但是我看到那篇翻译的文章，就断定Matt Cutts不会那么说。</p>
<p>另外，这个文章中的LOG日志分析工具，在我最近建立的“<a href="http://www.semyj.com/bbs/viewthread.php?tid=71&amp;extra=page%3D1" target="_blank">新基地论坛”上有下载</a>。不过那里需要论坛金币才能下载的。获得论坛金币最快的方法就是把你所拥有的好资源也贡献出来。我希望能用这个方法创造一个“人人为我，我为人人”的环境，做一个高质量的论坛。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/969/feed</wfw:commentRss>
		<slash:comments>82</slash:comments>
		</item>
		<item>
		<title>那些藏在《google网站质量指南》里的SEO技巧</title>
		<link>http://www.semyj.com/archives/951</link>
		<comments>http://www.semyj.com/archives/951#comments</comments>
		<pubDate>Thu, 17 Dec 2009 08:48:30 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEO必读]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=951</guid>
		<description><![CDATA[写这篇文章是因为最近收到很多人的咨询，感觉很多人还是没有去看最基础的东西-《google网站质量指南》。有些人是不知道怎么看，有些人是不屑于看吧。所以再啰嗦的写一下如何看这个《指南》。
其实很多的SEO技巧，在这里都写得清清楚楚的，很多技巧是连一些目前的SEO专家都还不知道的。虽然我说新手要去看《指南》，但是很多SEO多年从业人员都可以看看。
SEO如果算是一门学问的话，那它和其他所有的学问一样。都要从最基本的东西学起，要下得了苦功夫的。最近翻《读者》的时候看到一个故事，觉得应该和大家分享一遍，文章抄录如下：
陆宗达曾拜国学大师黄侃为师。见过先生，黄侃一个字也没给陆宗达讲，只给他一本没有标点的《说文解字》，说：“点上标点，点完见我。”陆宗达依教而行。
再见老师时，黄侃翻了翻那卷了边的书，说：“再买一本，重新点上。”
第三次见老师时，陆宗达送上点点画画得已经不成样子的《说文解字》。黄侃点点 头，说：“再去买一本点上。”
三个月后，陆宗达又将一本翻得很破的《说文解字》拿来，说：“老师，是不是还要再点一本？我已经准备好了。”
黄侃说：“标点三次，《说文解字》你已经烂熟于心，这文字之学，你已得大半，不用再点了。以后，你做学问也用不着再翻这书了。”黄侃将书扔进书堆里，这才给陆宗达讲起了学问的事。
后来，陆宗达终于成为我国现代训诂学界的泰斗。他回忆说：“当年翻烂了三本《说文解字》，从此做起学问来，轻松得如庖丁解牛。”
看完这个故事，我觉得对于我们SEOer来说，《google网站质量指南》就是那本要去翻烂的书。里面那些最基本的东西，是构建整个SEO理论依据的基石。以后所有的技巧什么的都是从这些基本的东西发展而来的。下苦功夫研究完以后，就不太会有让你困惑的东西。我非常相信上文中陆宗达说的：从此做起学问来轻松得如庖丁解牛。以前我把《google网站质量指南》里的几百篇文章都翻来覆去看完以后，就有类似的感觉。

而读《google网站质量指南》，不像研究搜索引擎的基本原理一样，有很多晦涩难懂的东西。《google网站质量指南》里非常偏重于直接告诉你如何去做是最好的。下面我分析一些《google网站质量指南》里的文章，看看里面向我们展示了多少技巧。
《google网站质量指南》要从这里开始阅读：http://www.google.com/support/webmasters/
这里只是一个总的目录，以后的几百篇文章都没有一个清晰的列表，要顺着一个个的链接下去才能读完。
先来看这一篇：《我的网站在搜索方面表现不佳》 网址：
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&#38;answer=34444
首先，文章一开始就讲述了搜索引擎的目标和搜索结果是怎么出来的：
我们的目标是为每个查询返回高度匹配的结果。搜索结果是通过我们的搜索索引返回的。
我们都知道搜索引擎一定会遵循为用户返回高度匹配的结果的。在谈到搜索结果是如何出来的时候，google这里用的字眼是“通过搜索索引返回的”。 “搜索索引”有一个链接，那篇文章里面解释了搜索引擎的工作流程。如果仔细看的话，会发现很多有意思的东西。如提到索引的时候，它写到：
Googlebot 会处理所抓取的每个网页，以便将其找到的所有字词和这些字词在每个网页上的位置都汇编到包含大量索引的列表中。
这里就说了建立索引的时候，关键词的位置，搜索引擎是会记录的。建议大家也看一下我的那篇《分词与索引库》，就应该知道google其实告诉了你蛮多的知识点，如果你自己深究下去的话，是会很有收获的。
再回到《我的网站在搜索方面表现不佳》这篇文章，里面接着写到：
如果您的网站已与网络上的其他网站建立起可靠的链接，那么，我们很有可能会在下次抓取时再度添加您的网站。
用“可靠的链接”来描述优质的外部链接非常合适，其中包括了：链接你的网站的权重、链接存在的时间长久度、链接页面内容的合适度等等。
接着讲了用什么样的步骤提高你的排名。文中写到：
查看您的网站是否被 Google 编入了索引
确保 Google 能够找到并抓取您的网站
确保 Google 能够将您的网站编入索引
确保您的内容实用且具有相关性
这4点是这篇文章内容的提纲。我不知道大家看到这4点的时候看到了什么。我看到的内容是：1、2、3点说的是收录量，第4点说的是排名。而关于收录量，又分为三步：先查询网站有多少页面被收录，然后再确保有没有爬虫抓取过你的网站，最后看看网站的收录量有多少。这个步骤恰好是我优化大型网站的时候的步骤。我还会用很多的数据来查看这些方面都做到了什么程度。
看一篇文章也好，一本书也好，一定要看它的内容结构。为什么作者会那么安排内容都是有原因的。我就经常感觉我以前的文章很少有人看懂。而如果看过《搜索引擎营销-网站流量大提速》这本书的人，不知道有没有人能回想起整本书的结构，以及很多文章的结构？
在谈到“查看您的网站是否被 Google 编入了索引”这一点的时候，google写了一个简单的方法判断你的网站有没有被惩罚：
在 Google 上搜索 www.[您的域名].com。如果您的网站未出现在搜索结果中，或在搜索结果中的排名不佳，那么，这说明，您的网站可能由于违反了网站管理员指南而受到了处罚。
这里要注意的是，如果搜索你的域名，排名不佳的话也可能是你的域名受到了惩罚。
在“确保 Google 能够找到并抓取您的网站”这一项内容中，google稍微写了一下爬虫在页面上的抓取模式：
我们的抓取过程是根据网页网址的列表进行的，该列表是在之前进行的抓取过程中生成的，且用网站管理员提供的站点地图数据进行扩充。在 Googlebot 访问每个网站时，它会检测每个网页上的链接，并将这些链接添加到它要抓取的网页列表中。
搜索引擎爬虫到达了一个页面后，这个页面上的所有链接都是会收集的。但是很多链接不一定会被爬虫接着访问，而是放在一个网址列表里，等着下次来访问。至于下一次什么时候来访问，访问了是不是会被收录，就看其他因素了。这里写得不详细，所以不是很好理解。要更深入的理解整个过程，可以查看搜索引擎原理之类的书籍就可以理解了。以后我会写一下爬虫的具体访问过程，其中分为单个爬虫如何处理、多个爬虫如何协同处理的。
google还有写：
如果您最近调整了您的网站结构，或将网站移到了新的域中，那么，以前排名较高的网页现在可能会排名不佳。为避免出现这种情况，请在您的 .htaccess 文件中使用 301 重定向（&#8221;永久重定向&#8221;）来灵活地重定向用户、Googlebot 和其他信息采集软件。
这里要着重看“灵活地重定向”几个字。很多人在做301重定向的时候是不能灵活的处理的，因为他们的URL没有规划好，所以只能简单的把所有的某类URL重定向到同一个URL。其实为了保证效果，最好是用正则表达式继承前面URL的特征来跳转。另外顺便提一下，百度这样的搜索引擎对于不是用.htaccess 文件做的跳转是识别不好的。所以有些网站用PHP代码做301跳转后，百度依然不识别。
另外还写到：
即便您的网站已经编入索引，站点地图仍是向 Google 提供有关您的网站和您认为最重要网址的信息的一种方法。
这里强调了sitemap.xml文件不光是帮助收录的，更是让搜索引擎了解你的网站的。特别注意sitemap.xml文件里权重的设置。
在“确保您的内容具有相关性且实用”这一项里，写了两点平常大家不去注意的内容。如：
通过查看热门搜索查询页来了解用户到达您网站的方式。第一个列表会显示您的网站最常出现在哪些 Google 搜索中。第二个列表则显示用户通过点击哪些 Google 搜索来进入您的网站。此信息非常有用，因为它能使您深入了解用户搜索的内容（第一个列表），以及哪些搜索内容可吸引用户点击您的网站（第二个列表）。
了解 Google 查看您网站的方式。关键字页会显示其他网站链接到您网站时所使用的关键字和短语。了解其他用户查看您网站的方式可帮助您弄清如何最有效地定位您的受众。
我在《google 的良苦用心：网站管理员工具》中说过，webmaster tools里面的每一个功能都是对SEO有用的。“热门搜索查询”和“关键字”都是webmaster tools里面的功能。这里的“热门搜索查询”有一个链接，里面解释了各种数据代表什么意思以及如何应用好这个数据。看完那里的内容应该可以解决很多人的疑问。如：以前有人问我“热门搜索查询”那里显示的排名是不是不准，其实是没有理解那个排名的意思，那里的排名是过去几天的平均最高排名。 “热门搜索查询”这里虽然只提供了这么一个简单的工具，但是大家应该学会的是这个工具的一种思想。在优化很多网站的时候，有排名的关键词和实际带来流量的关键词是有差别的。那么接下来就可以做一点什么事情来改善这个情况了。
“关键字”这里就可以查看你的外部链接的语义相关性。如果能常看这个数据，很多人应该就不会去到处乱发链接了。
接下来还写了一个让你增加流量的方法：
优秀的图片内容可能是增加点击量的绝佳方法。我们建议您在发布图片时，仔细考虑如何尽可能为用户带来最佳体验并遵循我们的图片指南。
图片的SEO流量，在国外SEO流量中是能占到很高的比例的。特别是在一些B2B, B2C , C2C网站，基本能达到所有SEO流量的20%左右。“图片指南”有一个链接，里面都是告诉你如何提高图片SEO流量的方法。 和我在《怎么样去学SEO（三）》中讲的一样，这些方法都是终极的解决方案。不过有些方法还是要你带着思考去看的。如：里面为什么要你指定所有图片的宽和高呢？不光了为网页速度，还因为搜索引擎的图片搜索结果只会返回适当大小的图片，一个只有10 x 8像素的按钮图片是不可能出现在搜索结果里的。有些东西《指南》里不能明着告诉你，但是你可以自己推测出来。
回到这篇《我的网站在搜索方面表现不佳》，文章最后还讲了两点：
您的竞争对手基本上无法破坏您网站的排名，也不可能将您的网站从我们的索引中删除。
 
这里顺便说一下，最应该担心的不是对手陷害你的网站，而是看自己的SEO方法有没有违反搜索引擎的质量指南。这点在百度尤为重要，因为一些SEOer觉得正常的方法，百度都列为作弊行列，很多“正常”的网站被K，如果不是百度自己系统出问题的话，都是因为作弊的原因。
我们数据中心之间的差异偶尔会导致搜索结果排名出现波动。当您执行 Google 搜索时，您的查询会被发送到 Google 数据中心以便检索搜索结果。我们有多个数据中心，决定将查询发送到哪个数据中心的因素（例如，地理位置和搜索访问量）有很多。由于我们的数据中心并不是都可以进行同步更新，因此，处理您查询的数据中心不同，所产生的搜索结果排名也可能会有所偏差。
这里已经说得非常明白了。如果去了解搜索引擎的原理，就还能发现对于搜索引擎来说，这种多数据中心有很多好处，不过一个很大的坏处就是同步数据很麻烦。但是为了给用户最好的搜索结果，这种牺牲是值得的。这里是让很多人明白，有时候排名的波动可能什么异常也没有，仅仅是你的查询被定位到了不同的数据中心。
我这篇文章篇幅太长，不一一赘述了。如果哪天我也做SEO培训的话，我也会要求培训的人员先看完这个《指南》，才能开始上课的。另外，最近太忙，有非常多的邮件和MSN上的咨询都来不及回复，望见谅。
]]></description>
			<content:encoded><![CDATA[<p>写这篇文章是因为最近收到很多人的咨询，感觉很多人还是没有去看最基础的东西-《google网站质量指南》。有些人是不知道怎么看，有些人是不屑于看吧。所以再啰嗦的写一下如何看这个《指南》。</p>
<p>其实很多的SEO技巧，在这里都写得清清楚楚的，很多技巧是连一些目前的SEO专家都还不知道的。虽然我说新手要去看《指南》，但是很多SEO多年从业人员都可以看看。</p>
<p>SEO如果算是一门学问的话，那它和其他所有的学问一样。都要从最基本的东西学起，要下得了苦功夫的。最近翻《读者》的时候看到一个故事，觉得应该和大家分享一遍，文章抄录如下：</p>
<blockquote><p>陆宗达曾拜国学大师黄侃为师。见过先生，黄侃一个字也没给陆宗达讲，只给他一本没有标点的《说文解字》，说：“点上标点，点完见我。”陆宗达依教而行。</p>
<p>再见老师时，黄侃翻了翻那卷了边的书，说：“再买一本，重新点上。”</p>
<p>第三次见老师时，陆宗达送上点点画画得已经不成样子的《说文解字》。黄侃点点 头，说：“再去买一本点上。”</p>
<p>三个月后，陆宗达又将一本翻得很破的《说文解字》拿来，说：“老师，是不是还要再点一本？我已经准备好了。”</p>
<p>黄侃说：“标点三次，《说文解字》你已经烂熟于心，这文字之学，你已得大半，不用再点了。以后，你做学问也用不着再翻这书了。”黄侃将书扔进书堆里，这才给陆宗达讲起了学问的事。</p>
<p>后来，陆宗达终于成为我国现代训诂学界的泰斗。他回忆说：“当年翻烂了三本《说文解字》，从此做起学问来，轻松得如庖丁解牛。”</p></blockquote>
<p>看完这个故事，我觉得对于我们SEOer来说，《google网站质量指南》就是那本要去翻烂的书。里面那些最基本的东西，是构建整个SEO理论依据的基石。以后所有的技巧什么的都是从这些基本的东西发展而来的。下苦功夫研究完以后，就不太会有让你困惑的东西。我非常相信上文中陆宗达说的：从此做起学问来轻松得如庖丁解牛。以前我把《google网站质量指南》里的几百篇文章都翻来覆去看完以后，就有类似的感觉。</p>
<p><span id="more-951"></span></p>
<p>而读《google网站质量指南》，不像研究搜索引擎的基本原理一样，有很多晦涩难懂的东西。《google网站质量指南》里非常偏重于直接告诉你如何去做是最好的。下面我分析一些《google网站质量指南》里的文章，看看里面向我们展示了多少技巧。</p>
<p>《google网站质量指南》要从这里开始阅读：<a href="http://www.google.com/support/webmasters/" target="_blank">http://www.google.com/support/webmasters/</a></p>
<p>这里只是一个总的目录，以后的几百篇文章都没有一个清晰的列表，要顺着一个个的链接下去才能读完。</p>
<p>先来看这一篇：《我的网站在搜索方面表现不佳》 网址：</p>
<p><a href="http://www.google.com/support/webmasters/bin/answer.py?hl=cn&amp;answer=34444" target="_blank">http://www.google.com/support/webmasters/bin/answer.py?hl=cn&amp;answer=34444</a></p>
<p>首先，文章一开始就讲述了搜索引擎的目标和搜索结果是怎么出来的：</p>
<blockquote><p><strong>我们的目标是为每个查询返回高度匹配的结果。搜索结果是通过我们的搜索索引返回的。</strong></p></blockquote>
<p>我们都知道搜索引擎一定会遵循为用户返回高度匹配的结果的。在谈到搜索结果是如何出来的时候，google这里用的字眼是“通过搜索索引返回的”。 “搜索索引”有一个链接，那篇文章里面解释了搜索引擎的工作流程。如果仔细看的话，会发现很多有意思的东西。如提到索引的时候，它写到：</p>
<blockquote><p><strong>Googlebot 会处理所抓取的每个网页，以便将其找到的所有字词和这些字词在每个网页上的位置都汇编到包含大量索引的列表中。</strong></p></blockquote>
<p>这里就说了建立索引的时候，关键词的位置，搜索引擎是会记录的。建议大家也看一下我的那篇《<a href="http://www.semyj.com/archives/544" target="_self">分词与索引库</a>》，就应该知道google其实告诉了你蛮多的知识点，如果你自己深究下去的话，是会很有收获的。</p>
<p>再回到《我的网站在搜索方面表现不佳》这篇文章，里面接着写到：</p>
<blockquote><p><strong>如果您的网站已与网络上的其他网站建立起可靠的链接，那么，我们很有可能会在下次抓取时再度添加您的网站。</strong></p></blockquote>
<p>用“可靠的链接”来描述优质的外部链接非常合适，其中包括了：链接你的网站的权重、链接存在的时间长久度、链接页面内容的合适度等等。</p>
<p>接着讲了用什么样的步骤提高你的排名。文中写到：</p>
<blockquote><p><strong>查看您的网站是否被 Google 编入了索引<br />
确保 Google 能够找到并抓取您的网站<br />
确保 Google 能够将您的网站编入索引<br />
确保您的内容实用且具有相关性</strong></p></blockquote>
<p>这4点是这篇文章内容的提纲。我不知道大家看到这4点的时候看到了什么。我看到的内容是：1、2、3点说的是收录量，第4点说的是排名。而关于收录量，又分为三步：先查询网站有多少页面被收录，然后再确保有没有爬虫抓取过你的网站，最后看看网站的收录量有多少。这个步骤恰好是我优化大型网站的时候的步骤。我还会用很多的数据来查看这些方面都做到了什么程度。</p>
<p>看一篇文章也好，一本书也好，一定要看它的内容结构。为什么作者会那么安排内容都是有原因的。我就经常感觉我以前的文章很少有人看懂。而如果看过《<a href="http://www.semyj.com/archives/581">搜索引擎营销-网站流量大提速</a>》这本书的人，不知道有没有人能回想起整本书的结构，以及很多文章的结构？</p>
<p>在谈到“查看您的网站是否被 Google 编入了索引”这一点的时候，google写了一个简单的方法判断你的网站有没有被惩罚：</p>
<blockquote><p><strong>在 Google 上搜索 www.[您的域名].com。如果您的网站未出现在搜索结果中，或在搜索结果中的排名不佳，那么，这说明，您的网站可能由于违反了网站管理员指南而受到了处罚。</strong></p></blockquote>
<p>这里要注意的是，如果搜索你的域名，排名不佳的话也可能是你的域名受到了惩罚。</p>
<p>在“确保 Google 能够找到并抓取您的网站”这一项内容中，google稍微写了一下爬虫在页面上的抓取模式：</p>
<blockquote><p><strong>我们的抓取过程是根据网页网址的列表进行的，该列表是在之前进行的抓取过程中生成的，且用网站管理员提供的站点地图数据进行扩充。在 Googlebot 访问每个网站时，它会检测每个网页上的链接，并将这些链接添加到它要抓取的网页列表中。</strong></p></blockquote>
<p>搜索引擎爬虫到达了一个页面后，这个页面上的所有链接都是会收集的。但是很多链接不一定会被爬虫接着访问，而是放在一个网址列表里，等着下次来访问。至于下一次什么时候来访问，访问了是不是会被收录，就看其他因素了。这里写得不详细，所以不是很好理解。要更深入的理解整个过程，可以查看搜索引擎原理之类的书籍就可以理解了。以后我会写一下爬虫的具体访问过程，其中分为单个爬虫如何处理、多个爬虫如何协同处理的。</p>
<p>google还有写：</p>
<blockquote><p><strong>如果您最近调整了您的网站结构，或将网站移到了新的域中，那么，以前排名较高的网页现在可能会排名不佳。为避免出现这种情况，请在您的 .htaccess 文件中使用 301 重定向（&#8221;永久重定向&#8221;）来灵活地重定向用户、Googlebot 和其他信息采集软件。</strong></p></blockquote>
<p>这里要着重看“灵活地重定向”几个字。很多人在做301重定向的时候是不能灵活的处理的，因为他们的URL没有规划好，所以只能简单的把所有的某类URL重定向到同一个URL。其实为了保证效果，最好是用正则表达式继承前面URL的特征来跳转。另外顺便提一下，百度这样的搜索引擎对于不是用.htaccess 文件做的跳转是识别不好的。所以有些网站用PHP代码做301跳转后，百度依然不识别。</p>
<p>另外还写到：</p>
<blockquote><p><strong>即便您的网站已经编入索引，站点地图仍是向 Google 提供有关您的网站和您认为最重要网址的信息的一种方法。</strong></p></blockquote>
<p>这里强调了sitemap.xml文件不光是帮助收录的，更是让搜索引擎了解你的网站的。特别注意sitemap.xml文件里权重的设置。</p>
<p>在“确保您的内容具有相关性且实用”这一项里，写了两点平常大家不去注意的内容。如：</p>
<blockquote><p><strong>通过查看热门搜索查询页来了解用户到达您网站的方式。第一个列表会显示您的网站最常出现在哪些 Google 搜索中。第二个列表则显示用户通过点击哪些 Google 搜索来进入您的网站。此信息非常有用，因为它能使您深入了解用户搜索的内容（第一个列表），以及哪些搜索内容可吸引用户点击您的网站（第二个列表）。</strong></p>
<p><strong>了解 Google 查看您网站的方式。关键字页会显示其他网站链接到您网站时所使用的关键字和短语。了解其他用户查看您网站的方式可帮助您弄清如何最有效地定位您的受众。</strong></p></blockquote>
<p>我在《<a href="http://www.semyj.com/archives/692">google 的良苦用心：网站管理员工具</a>》中说过，webmaster tools里面的每一个功能都是对SEO有用的。“热门搜索查询”和“关键字”都是webmaster tools里面的功能。这里的“热门搜索查询”有一个链接，里面解释了各种数据代表什么意思以及如何应用好这个数据。看完那里的内容应该可以解决很多人的疑问。如：以前有人问我“热门搜索查询”那里显示的排名是不是不准，其实是没有理解那个排名的意思，那里的排名是过去几天的平均最高排名。 “热门搜索查询”这里虽然只提供了这么一个简单的工具，但是大家应该学会的是这个工具的一种思想。在优化很多网站的时候，有排名的关键词和实际带来流量的关键词是有差别的。那么接下来就可以做一点什么事情来改善这个情况了。</p>
<p>“关键字”这里就可以查看你的外部链接的语义相关性。如果能常看这个数据，很多人应该就不会去到处乱发链接了。</p>
<p>接下来还写了一个让你增加流量的方法：</p>
<blockquote><p><strong>优秀的图片内容可能是增加点击量的绝佳方法。我们建议您在发布图片时，仔细考虑如何尽可能为用户带来最佳体验并遵循我们的图片指南。</strong></p></blockquote>
<p>图片的SEO流量，在国外SEO流量中是能占到很高的比例的。特别是在一些B2B, B2C , C2C网站，基本能达到所有SEO流量的20%左右。“图片指南”有一个链接，里面都是告诉你如何提高图片SEO流量的方法。 和我在《<a href="http://www.semyj.com/archives/535">怎么样去学SEO（三）》</a>中讲的一样，这些方法都是终极的解决方案。不过有些方法还是要你带着思考去看的。如：里面为什么要你指定所有图片的宽和高呢？不光了为网页速度，还因为搜索引擎的图片搜索结果只会返回适当大小的图片，一个只有10 x 8像素的按钮图片是不可能出现在搜索结果里的。有些东西《指南》里不能明着告诉你，但是你可以自己推测出来。</p>
<p>回到这篇《我的网站在搜索方面表现不佳》，文章最后还讲了两点：</p>
<blockquote><p><strong>您的竞争对手基本上无法破坏您网站的排名，也不可能将您的网站从我们的索引中删除。</strong><br />
 </p></blockquote>
<p>这里顺便说一下，最应该担心的不是对手陷害你的网站，而是看自己的SEO方法有没有违反搜索引擎的质量指南。这点在百度尤为重要，因为一些SEOer觉得正常的方法，百度都列为作弊行列，很多“正常”的网站被K，如果不是百度自己系统出问题的话，都是因为作弊的原因。</p>
<blockquote><p><strong>我们数据中心之间的差异偶尔会导致搜索结果排名出现波动。当您执行 Google 搜索时，您的查询会被发送到 Google 数据中心以便检索搜索结果。我们有多个数据中心，决定将查询发送到哪个数据中心的因素（例如，地理位置和搜索访问量）有很多。由于我们的数据中心并不是都可以进行同步更新，因此，处理您查询的数据中心不同，所产生的搜索结果排名也可能会有所偏差。</strong></p></blockquote>
<p>这里已经说得非常明白了。如果去了解搜索引擎的原理，就还能发现对于搜索引擎来说，这种多数据中心有很多好处，不过一个很大的坏处就是同步数据很麻烦。但是为了给用户最好的搜索结果，这种牺牲是值得的。这里是让很多人明白，有时候排名的波动可能什么异常也没有，仅仅是你的查询被定位到了不同的数据中心。</p>
<p>我这篇文章篇幅太长，不一一赘述了。如果哪天我也做SEO培训的话，我也会要求培训的人员先看完这个《指南》，才能开始上课的。另外，最近太忙，有非常多的邮件和MSN上的咨询都来不及回复，望见谅。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/951/feed</wfw:commentRss>
		<slash:comments>69</slash:comments>
		</item>
		<item>
		<title>内部链接还是外部链接？</title>
		<link>http://www.semyj.com/archives/822</link>
		<comments>http://www.semyj.com/archives/822#comments</comments>
		<pubDate>Sun, 06 Dec 2009 08:57:54 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEO策略]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=822</guid>
		<description><![CDATA[这篇文章承接上篇《热门还是长尾？大中型网站的关键词优化策略》。明白了长尾效应在一个大中型网站中的作用后，还需要明白内外部链接谁更重要。
在搜索引擎上，去获取流量的最基本单位就是网页。一个网页的外部链接因素，对这个网页的排名影响很大。这个网页的外部链接，既有同一个网站的其他页面给的站内链接，也有其他网站上的网页给的站外链接。下面文章里的内部链接是指站内链接，外部链接是指站外链接。那么在优化一个网站的时候，是特别注意优化内部链接还是外部链接呢？或者在分析一个网页排名的时候，是觉得内部链接贡献的价值大，还是外部链接的价值大？
长久以来，大家都非常重视外部链接。源于那么一个说法，那就是：一个网站你自己说你的网站里有什么是不算数的，要别的网站说你这个网页里有什么才算数；相对于你自己如何评价自己，别人的评价才更准确。 所以很多人在做一个页面的排名的时候，只做一件事情，就是疯狂的给这个网页做外部链接。而内部链接呢，很多人认为不重要或对排名影响不大。
这种说法应该是有人从PR值的计算方法发展而来的。因为在PR值的计算理论里，影响一个网页PR值的是这个网页的外部因素。当扩大到整个网站的时候，有人就认为影响这个网站整体排名的因素来自于其他网站。其实这个说法有一个明显的误区，就是没有明白网页和网站的区别。别说PR值和排名没有直接的关系，就算在PR值的计算理论里，向来也只有网页才是被计算的对象，而不是整个网站。列在搜索结果页面的，也是一个个的网页。
那如果一个网页同时有10个外部链接和10个内部链接，谁对排名的影响大呢。我们再来看那个“外部链接的评价更准确”的理论。其实这个理论要成立是要有一个前提的，那就是互联网上所有的网页都是不值得信任的，要靠这些网页彼此之间的关系才可以确定谁更重要、谁的内容更和什么关键词相关。这在一个搜索引擎建立的初期，是非常科学的方法。但是，搜索引擎发展到现在，积累了大量的数据，环境也不一样，那很多问题都要重新审视了。Matt Cutts曾经说过google不会停止对PR值的改进，其实更多的其他改进也是如此。而百度的超链分析法，在面对如此泛滥的群建链接的情况下，也会做出相应的修改的。

实际上，最清楚那个网站里面讲什么内容、哪些内容是重点的，是那个网站自己本身。别人都没有那个网站那样清楚它自己。但是搜索引擎并不能确保那个网站会如实的标注自己的内容。所以才会借助别的网站对那个网站的评价来区分。但是如果那个网站是一个值得信任的网站呢？搜索引擎是不是可以相信那个网站自己对自己的描述？答案是肯定的。
如果一个经历过时间的考验、无论从各种渠道都表明那是一个值得信任的网站。它说自己的网站有什么内容的时候，那应该是很准确的。而外部网站对它的描述可能反而是不全面和不准确的。自己对自己的描述，就是内部链接，别人对自己的描述，就是外部链接。 这个时候是内部链接更重要还是外部链接更重要呢？这个时候，很难说谁更重要，起码这两者都是一样重要的。因为都是值得信任的网页对另一个网页的描述。
所以在优化一个网站，特别是有点历史了的大中型网站的时候，不用那么特意区分外部链接还是内部链接。可以借鉴计算PR值的视角，把你要优化的网站看成是无数个网页的组合，每个网页以外的链接都是要注意优化的链接。有了这种视角，在分析很多网页的排名的时候也不会困惑了。很多人还一直不明白为什么有的网页只有7个内部链接就排得很好，而自己有几十个外部链接还是没什么好的排名。国内也有不少人在优化一些大中型网站，应该可以观察到一个现象，就是，只要你尽可能用白帽的手段优化网站，当积累到一定的程度，网站的SEO流量会有一个突发性的整体提升，这主要就是内部链接的功劳。
只要你优化的网站不是那种只有几十个网页的网站，不然都要先关注好内部链接再去关注外部链接。
不过有些人心里应该还是有疑问。 Matt Cutts曾经用花钱和赚钱的说法比喻过内外部因素的重要性。他说：“考虑如何花好100元是一个好的网站结构的问题，但是对于大多数人来说，如何另外再赚300元更能使他们受益”。 这句话好像是在说外部链接要比内部链接更重要。实际上这句话没有错，从搜索引擎的角度和互联网全局的角度来看这是对的。但是在具体的操作过程中就不一样了。
对于大中型网站，不知道有没有人去统计过自己网站外部链接的数量以及每天别的网站会给自己的网站增加了多少外部链接。（google webmaster tool里可以看到一个网站的大部分外部链接）只要稍微有点名气的网站，每天别人给你贡献的外部链接的数量要远远超过你每天自己给自己加的外部链接的数量。而且从质量上来说，那些链接也要好得多。那你何必每天辛辛苦苦去加那么一小部分链接呢？而对于小网站，只要你的网站不是几十个页面，你要先分配好内部链接，才能更好的利用好外部链接。花钱和赚钱的那个比喻，这个时候真实的情况变成了：你每天都有几百万元进账，但是花钱的时候这些钱有50%都浪费掉了，其他该花钱的地方要么只花了一少部分，要么完全没有钱。这个时候你说每天再去赚几万、几十万更重要还是先管理好钱怎么花更重要呢？只要你侧重做一个网站的SEO，积累一段时间后，你都是那个需要去研究怎么花好100元的人，而不是大多数还要去赚300元的人。
（这里我很想顺便说一下如何对待搜索引擎的工作人员说的话。我相信他们在公开场合是不会故意误导你或者说假话的。你要看那个说话的人在这个公司是处于什么样的职位，是在什么时间、什么场合、出于什么样的目的说那样的话。很多时候都不会是他们的说法错误，而是你没有掌握到他们那么多信息，所以你无法理解他们的话。也不会推测出他们的潜台词以及他们没有说全的话而已。）
接下来想谈一下外部链接，因为有很多人来咨询，而且我也看到一些人还没意识到一些误区。由于篇幅过长只讲两点。
1，怎么样去做好外部链接。
先放下这个问题。我们先来看看搜索引擎如何判断一个网站的外部链接是好链接。在互联网上，如果一个网页很受欢迎，就会有很多其他的网页链接或引用。那它的外部链接增长的速度，用一个曲线图来表示是这样的：
 虽然会有一些外部链接因为那个网页消失了或者删除了给你的外部链接，但是总体趋势还是上涨的。
如果碰到一个突然很热门的网页被大量转载，那它的曲线图应该是这样的。
关于这种突然热门的网页，可以去看看最近“成都暴力拆迁引发自焚”的视频页面：
http://v.youku.com/v_show/id_XMTM1OTQ3MTcy.html
点击页面上的“全部视频信息”，往下拉，可以看到这个视频最近被转载的记录：
这里的外部网站链接的增长幅度和那个曲线图的增长曲线是吻合的。
那如果一个网页的外部链接是群发或者群建的呢？曲线图就是这样的：
 因为群发和群建的链接，很多会被大量删除的。而且这个群建的网站，也没办法保证经常性的去群建和群发。这正应了那句老话：路遥知马力，日久见人心。搜索引擎对好的网站不会埋没你的好，差的网站最终也逃不过时间的检验。
这三种不同的网页的外部链接曲线图，用一些简单的数学公式就可以判断并描述出来，准确率应该至少90%以上。
2，在哪些网站上做外部链接好？
太多的人还是执迷于博客群建一类的方法。博客群建和论坛群发，在百度和google短时间都会有一些效果。不过从上面的曲线图可以得知，一旦你开始这样做，离被搜索引擎惩罚也不远了的。
搜索引擎依据外部链接的速率来判断一个网站是否作弊，在很多情况下也有失误的时候。所以尺度很宽松，只有一些实在是很明显的网站才会被处罚（百度不一定很宽松）。不过搜索引擎还有其他的检验方法，就是看你的网站经常出现在什么样的网页上。这种判断是非常容易实现的。
和上面的曲线图一样，一个正常的网站，外部链接出现在什么地方是有自己的规律的。运用数学的方法，也能把这些好的网站和不好的网站区分开来。
我以前和别人合作做过一个项目，就是要用爬虫把互联网上所有的企业网站都搜集下来。乍看一下这个是不可能完成的事情，因为企业网站的设计千差万别，代码有各种写法，怎么可能判断哪个网站是企业网站哪个不是呢？后来用排除法就轻松解决了主要问题。因为互联网上的动态网站，真正从头到尾自主开发的非常少（那些网站也不太会作弊）。大多是用一些开源的CMS，如 wordpress, discuz 等等。有的网站依附于一些知名的网站系统，如新浪博客，51空间等。这些系统都有自己的特征，只要根据这些特征设定好过滤规则，这些网站是很容易被排除掉的。后来检测结果，发现准确率有80%以上。
上面的2个问题，我都没有正面回复。那如何做外部链接最好呢？
负责任的回答是：不去为了SEO而刻意地做外部链接最好。 你只要专注于你的内容，考虑别人如何才能主动链接你就好。即使主动去推送信息，也要在别人恰好需要你的地方出现。大家可以回忆一下，没有SEO之前，网站都是如何做外部链接的就明白了。上面那个视频，短短的3天时间就有4000多个外部引用，以后还会被大量引用。如果要这个网站依靠人力去做，大家觉得要用多少人、多少时间和多少钱才能达到同样的效果呢？
]]></description>
			<content:encoded><![CDATA[<p>这篇文章承接上篇《<a href="http://www.semyj.com/archives/776">热门还是长尾？大中型网站的关键词优化策略</a>》。明白了长尾效应在一个大中型网站中的作用后，还需要明白内外部链接谁更重要。</p>
<p>在搜索引擎上，去获取流量的最基本单位就是网页。一个网页的外部链接因素，对这个网页的排名影响很大。这个网页的外部链接，既有同一个网站的其他页面给的站内链接，也有其他网站上的网页给的站外链接。下面文章里的内部链接是指站内链接，外部链接是指站外链接。那么在优化一个网站的时候，是特别注意优化内部链接还是外部链接呢？或者在分析一个网页排名的时候，是觉得内部链接贡献的价值大，还是外部链接的价值大？</p>
<p>长久以来，大家都非常重视外部链接。源于那么一个说法，那就是：一个网站你自己说你的网站里有什么是不算数的，要别的网站说你这个网页里有什么才算数；相对于你自己如何评价自己，别人的评价才更准确。 所以很多人在做一个页面的排名的时候，只做一件事情，就是疯狂的给这个网页做外部链接。而内部链接呢，很多人认为不重要或对排名影响不大。</p>
<p>这种说法应该是有人从PR值的计算方法发展而来的。因为在PR值的计算理论里，影响一个网页PR值的是这个网页的外部因素。当扩大到整个网站的时候，有人就认为影响这个网站整体排名的因素来自于其他网站。其实这个说法有一个明显的误区，就是没有明白网页和网站的区别。别说PR值和排名没有直接的关系，就算在PR值的计算理论里，向来也只有网页才是被计算的对象，而不是整个网站。列在搜索结果页面的，也是一个个的网页。</p>
<p>那如果一个网页同时有10个外部链接和10个内部链接，谁对排名的影响大呢。我们再来看那个“外部链接的评价更准确”的理论。其实这个理论要成立是要有一个前提的，那就是互联网上所有的网页都是不值得信任的，要靠这些网页彼此之间的关系才可以确定谁更重要、谁的内容更和什么关键词相关。这在一个搜索引擎建立的初期，是非常科学的方法。但是，搜索引擎发展到现在，积累了大量的数据，环境也不一样，那很多问题都要重新审视了。Matt Cutts曾经说过google不会停止对PR值的改进，其实更多的其他改进也是如此。而百度的超链分析法，在面对如此泛滥的群建链接的情况下，也会做出相应的修改的。</p>
<p><span id="more-822"></span></p>
<p>实际上，最清楚那个网站里面讲什么内容、哪些内容是重点的，是那个网站自己本身。别人都没有那个网站那样清楚它自己。但是搜索引擎并不能确保那个网站会如实的标注自己的内容。所以才会借助别的网站对那个网站的评价来区分。但是如果那个网站是一个值得信任的网站呢？搜索引擎是不是可以相信那个网站自己对自己的描述？答案是肯定的。</p>
<p>如果一个经历过时间的考验、无论从各种渠道都表明那是一个值得信任的网站。它说自己的网站有什么内容的时候，那应该是很准确的。而外部网站对它的描述可能反而是不全面和不准确的。自己对自己的描述，就是内部链接，别人对自己的描述，就是外部链接。 这个时候是内部链接更重要还是外部链接更重要呢？这个时候，很难说谁更重要，起码这两者都是一样重要的。因为都是值得信任的网页对另一个网页的描述。</p>
<p>所以在优化一个网站，特别是有点历史了的大中型网站的时候，不用那么特意区分外部链接还是内部链接。可以借鉴计算PR值的视角，把你要优化的网站看成是无数个网页的组合，每个网页以外的链接都是要注意优化的链接。有了这种视角，在分析很多网页的排名的时候也不会困惑了。很多人还一直不明白为什么有的网页只有7个内部链接就排得很好，而自己有几十个外部链接还是没什么好的排名。国内也有不少人在优化一些大中型网站，应该可以观察到一个现象，就是，只要你尽可能用白帽的手段优化网站，当积累到一定的程度，网站的SEO流量会有一个突发性的整体提升，这主要就是内部链接的功劳。</p>
<p>只要你优化的网站不是那种只有几十个网页的网站，不然都要先关注好内部链接再去关注外部链接。</p>
<p>不过有些人心里应该还是有疑问。 Matt Cutts曾经用花钱和赚钱的说法比喻过内外部因素的重要性。他说：“考虑如何花好100元是一个好的网站结构的问题，但是对于大多数人来说，如何另外再赚300元更能使他们受益”。 这句话好像是在说外部链接要比内部链接更重要。实际上这句话没有错，从搜索引擎的角度和互联网全局的角度来看这是对的。但是在具体的操作过程中就不一样了。</p>
<p>对于大中型网站，不知道有没有人去统计过自己网站外部链接的数量以及每天别的网站会给自己的网站增加了多少外部链接。（google webmaster tool里可以看到一个网站的大部分外部链接）只要稍微有点名气的网站，每天别人给你贡献的外部链接的数量要远远超过你每天自己给自己加的外部链接的数量。而且从质量上来说，那些链接也要好得多。那你何必每天辛辛苦苦去加那么一小部分链接呢？而对于小网站，只要你的网站不是几十个页面，你要先分配好内部链接，才能更好的利用好外部链接。花钱和赚钱的那个比喻，这个时候真实的情况变成了：你每天都有几百万元进账，但是花钱的时候这些钱有50%都浪费掉了，其他该花钱的地方要么只花了一少部分，要么完全没有钱。这个时候你说每天再去赚几万、几十万更重要还是先管理好钱怎么花更重要呢？只要你侧重做一个网站的SEO，积累一段时间后，你都是那个需要去研究怎么花好100元的人，而不是大多数还要去赚300元的人。</p>
<p>（这里我很想顺便说一下如何对待搜索引擎的工作人员说的话。我相信他们在公开场合是不会故意误导你或者说假话的。你要看那个说话的人在这个公司是处于什么样的职位，是在什么时间、什么场合、出于什么样的目的说那样的话。很多时候都不会是他们的说法错误，而是你没有掌握到他们那么多信息，所以你无法理解他们的话。也不会推测出他们的潜台词以及他们没有说全的话而已。）</p>
<p>接下来想谈一下外部链接，因为有很多人来咨询，而且我也看到一些人还没意识到一些误区。由于篇幅过长只讲两点。</p>
<p>1，怎么样去做好外部链接。</p>
<p>先放下这个问题。我们先来看看搜索引擎如何判断一个网站的外部链接是好链接。在互联网上，如果一个网页很受欢迎，就会有很多其他的网页链接或引用。那它的外部链接增长的速度，用一个曲线图来表示是这样的：</p>
<div id="attachment_922" class="wp-caption alignnone" style="width: 398px"><img class="size-full wp-image-922" title="1" src="http://www.semyj.com/wp-content/uploads/2009/12/1.gif" alt="外部链接变化" width="388" height="232" /><p class="wp-caption-text">外部链接变化</p></div>
<p> 虽然会有一些外部链接因为那个网页消失了或者删除了给你的外部链接，但是总体趋势还是上涨的。</p>
<p>如果碰到一个突然很热门的网页被大量转载，那它的曲线图应该是这样的。</p>
<div id="attachment_928" class="wp-caption alignnone" style="width: 398px"><img class="size-full wp-image-928" title="2" src="http://www.semyj.com/wp-content/uploads/2009/12/2.gif" alt="外部链接变化" width="388" height="232" /><p class="wp-caption-text">外部链接变化</p></div>
<p>关于这种突然热门的网页，可以去看看最近“成都暴力拆迁引发自焚”的视频页面：</p>
<p><a href="http://v.youku.com/v_show/id_XMTM1OTQ3MTcy.html" target="_blank">http://v.youku.com/v_show/id_XMTM1OTQ3MTcy.html</a></p>
<p>点击页面上的“全部视频信息”，往下拉，可以看到这个视频最近被转载的记录：</p>
<div id="attachment_929" class="wp-caption alignnone" style="width: 319px"><img class="size-full wp-image-929" title="jilu" src="http://www.semyj.com/wp-content/uploads/2009/12/jilu.gif" alt="该视频的外站引用记录" width="309" height="353" /><p class="wp-caption-text">该视频的外站引用记录</p></div>
<p>这里的外部网站链接的增长幅度和那个曲线图的增长曲线是吻合的。</p>
<p>那如果一个网页的外部链接是群发或者群建的呢？曲线图就是这样的：</p>
<div id="attachment_931" class="wp-caption alignnone" style="width: 398px"><img class="size-full wp-image-931" title="3" src="http://www.semyj.com/wp-content/uploads/2009/12/3.gif" alt="外部链接变化情况" width="388" height="232" /><p class="wp-caption-text">外部链接变化情况</p></div>
<p> 因为群发和群建的链接，很多会被大量删除的。而且这个群建的网站，也没办法保证经常性的去群建和群发。这正应了那句老话：路遥知马力，日久见人心。搜索引擎对好的网站不会埋没你的好，差的网站最终也逃不过时间的检验。</p>
<p>这三种不同的网页的外部链接曲线图，用一些简单的数学公式就可以判断并描述出来，准确率应该至少90%以上。</p>
<p>2，在哪些网站上做外部链接好？</p>
<p>太多的人还是执迷于博客群建一类的方法。博客群建和论坛群发，在百度和google短时间都会有一些效果。不过从上面的曲线图可以得知，一旦你开始这样做，离被搜索引擎惩罚也不远了的。</p>
<p>搜索引擎依据外部链接的速率来判断一个网站是否作弊，在很多情况下也有失误的时候。所以尺度很宽松，只有一些实在是很明显的网站才会被处罚（百度不一定很宽松）。不过搜索引擎还有其他的检验方法，就是看你的网站经常出现在什么样的网页上。这种判断是非常容易实现的。</p>
<p>和上面的曲线图一样，一个正常的网站，外部链接出现在什么地方是有自己的规律的。运用数学的方法，也能把这些好的网站和不好的网站区分开来。</p>
<p>我以前和别人合作做过一个项目，就是要用爬虫把互联网上所有的企业网站都搜集下来。乍看一下这个是不可能完成的事情，因为企业网站的设计千差万别，代码有各种写法，怎么可能判断哪个网站是企业网站哪个不是呢？后来用排除法就轻松解决了主要问题。因为互联网上的动态网站，真正从头到尾自主开发的非常少（那些网站也不太会作弊）。大多是用一些开源的CMS，如 wordpress, discuz 等等。有的网站依附于一些知名的网站系统，如新浪博客，51空间等。这些系统都有自己的特征，只要根据这些特征设定好过滤规则，这些网站是很容易被排除掉的。后来检测结果，发现准确率有80%以上。</p>
<p>上面的2个问题，我都没有正面回复。那如何做外部链接最好呢？</p>
<p>负责任的回答是：不去为了SEO而刻意地做外部链接最好。 你只要专注于你的内容，考虑别人如何才能主动链接你就好。即使主动去推送信息，也要在别人恰好需要你的地方出现。大家可以回忆一下，没有SEO之前，网站都是如何做外部链接的就明白了。上面那个视频，短短的3天时间就有4000多个外部引用，以后还会被大量引用。如果要这个网站依靠人力去做，大家觉得要用多少人、多少时间和多少钱才能达到同样的效果呢？</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/822/feed</wfw:commentRss>
		<slash:comments>119</slash:comments>
		</item>
		<item>
		<title>Lynx 在线版以及浏览器插件</title>
		<link>http://www.semyj.com/archives/827</link>
		<comments>http://www.semyj.com/archives/827#comments</comments>
		<pubDate>Thu, 26 Nov 2009 08:09:16 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEM工具]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=827</guid>
		<description><![CDATA[最近还是太忙，所以关于内外部链接的文章还没开始写。现在给大家一个Lynx 在线版以及相关的浏览器插件。
我在《Lynx浏览器在SEO上的应用》一文中介绍过这个工具。不过有些人说在linux下没有安装好或者有乱码的出现。后来有人给我看了国外的一个Lynx在线版，但是那个在线版也存在着一些问题。我的这个Lynx 在线版把那些问题都解决了，使用起来还不错。
如果正在仔细阅读《google网站质量指南》的朋友应该能注意到，在这个《google网站质量指南》里，至少十几篇文章中都出现了要你去用Lynx检测网站的提示。而且是一到具体的做法的时候，都说：请用Lynx去检测你的网站，因为它和爬虫看到的内容几乎一样。这个工具在05年就有一些一线的SEOer在用了。
使用方法非常简单，你只要填入你要查看的URL，点击“查看”就可以了。网址要以http://开头。


URL:





如，我输入http://www.baidu.com/ ，查看到的界面如下：



输出的结果分为两部分：
第一部分，就是搜索引擎爬虫看到的内容，这个内容和别的查看方式都不一样。不仅显示了文字信息，还显示了网页的结构信息。去了解搜索引擎的原理就会知道，这种结构信息也是搜索引擎会储存下来的。 并且在分析你的网站讲了什么信息的时候，这些结构信息就是判断的依据。每个锚文本旁边还标上了这个链接的序号。
第二部分就是网站中所有爬虫能够识别的链接。有些网页这里会显示隐藏的链接。经常有人问我这个隐藏链接要不要紧，我这里统一回答一下：其实不是太重要，当你网站的SEO优化是正规的方法的话，可以忽视掉这个；但是当你用了很多黑帽的方法，这个隐藏链接就是让你“罪加一等”的地方。所以在alibaba的首页虽然也检测出几个隐藏链接，但是都没改过来。
刚接触这个工具，可能很多人不觉得这个工具有什么用的。建议大家用这个工具前，先看完以下几篇文章：
《分词与索引库》
《Lynx浏览器在SEO上的应用》
《把Web标准化进行得更彻底一点》
《“丰富网页摘要”，让你的网站与众不同。》
《“锚文本”在SEO方面的重要性》
这个工具支持绝大部分编码，日文、韩文、俄文等等都没问题的。
还有两个浏览器插件，一个是给 Firefox的，一个是给IE 的。
1，下载Lynx 在线版 for IE                           IE卸载文件
2，下载Lynx 在线版 for Firefox
装上了插件后，在你浏览一个网页的时候，在网页上点击右键的弹出菜单里，会有“以Lynx方式查看”的选项。这样非常方便平常大家查看网页。
由于这个工具放在国外的虚拟主机上，可能速度有点慢的。我还不知道有多少人会用这个工具，到时候可能有短暂的时间会使用不了。
不过大家可以先慢慢用着，以后还有讲述如何更好的应用这个工具的文章。
为了更好的推广这个工具，大家可以在自己的网站上，加上这个工具。
代码为：
&#60;form action=&#8221;http://lynx.semyj.com/lynxview.php&#8221; enctype=&#8221;application/x-www-form-urlencoded&#8221; method=&#8221;get&#8221; target=&#8221;_blank&#8221;&#62;
URL:
&#60;input id=&#8221;url&#8221; style=&#8221;width: 300px;&#8221; name=&#8221;url&#8221; type=&#8221;text&#8221; value=&#8221;http://&#8221; /&#62; &#60;input type=&#8221;submit&#8221; value=&#8221;查看&#8221; /&#62;
&#60;/form&#62;
另外 Lynx 的发音为：[liŋks]    点此听发音：http://www.103.net/dictzh/content/pronzh/000073867585.mp3

]]></description>
			<content:encoded><![CDATA[<p>最近还是太忙，所以关于内外部链接的文章还没开始写。现在给大家一个Lynx 在线版以及相关的浏览器插件。</p>
<p>我在《Lynx浏览器在SEO上的应用》一文中介绍过这个工具。不过有些人说在linux下没有安装好或者有乱码的出现。后来有人给我看了国外的一个Lynx在线版，但是那个在线版也存在着一些问题。我的这个Lynx 在线版把那些问题都解决了，使用起来还不错。</p>
<p>如果正在仔细阅读《google网站质量指南》的朋友应该能注意到，在这个《google网站质量指南》里，至少十几篇文章中都出现了要你去用Lynx检测网站的提示。而且是一到具体的做法的时候，都说：<a href="http://www.google.com/support/webmasters/bin/answer.py?hl=cn&amp;answer=35769#2" target="_blank">请用Lynx去检测你的网站，因为它和爬虫看到的内容几乎一样</a>。这个工具在05年就有一些一线的SEOer在用了。</p>
<p>使用方法非常简单，你只要填入你要查看的URL，点击“查看”就可以了。网址要以http://开头。</p>
<hr style="border:1 dashed #5151A2" size="1" />
<div>
<form action="http://lynx.semyj.com/lynxview.php" enctype="application/x-www-form-urlencoded" method="get" target="_blank">URL:</p>
<input id="url" style="width: 300px;" name="url" type="text" value="http://" />
<input type="submit" value="查看" />
</p>
<hr style="border:1 dashed #5151A2" size="1" />
<p><span id="more-827"></span></p>
<p>如，我输入http://www.baidu.com/ ，查看到的界面如下：</p>
</form>
</div>
<form action="http://lynx.semyj.com/lynxview.php" enctype="application/x-www-form-urlencoded" method="get">
<div id="attachment_847" class="wp-caption alignnone" style="width: 513px"><img class="size-full wp-image-847" title="lynx" src="http://www.semyj.com/wp-content/uploads/2009/11/lynx.gif" alt="以lynx查看百度" width="503" height="507" /><p class="wp-caption-text">以lynx查看百度</p></div>
<p>输出的结果分为两部分：</p>
<p>第一部分，就是搜索引擎爬虫看到的内容，这个内容和别的查看方式都不一样。不仅显示了文字信息，还显示了网页的结构信息。去了解搜索引擎的原理就会知道，这种结构信息也是搜索引擎会储存下来的。 并且在分析你的网站讲了什么信息的时候，这些结构信息就是判断的依据。每个锚文本旁边还标上了这个链接的序号。</p>
<p>第二部分就是网站中所有爬虫能够识别的链接。有些网页这里会显示隐藏的链接。经常有人问我这个隐藏链接要不要紧，我这里统一回答一下：其实不是太重要，当你网站的SEO优化是正规的方法的话，可以忽视掉这个；但是当你用了很多黑帽的方法，这个隐藏链接就是让你“罪加一等”的地方。所以在alibaba的首页虽然也检测出几个隐藏链接，但是都没改过来。</p>
<p>刚接触这个工具，可能很多人不觉得这个工具有什么用的。建议大家用这个工具前，先看完以下几篇文章：</p>
<p>《<a href="http://www.semyj.com/archives/544">分词与索引库</a>》</p>
<p>《<a href="http://www.semyj.com/archives/426">Lynx浏览器在SEO上的应用</a>》</p>
<p>《<a href="http://www.semyj.com/archives/84">把Web标准化进行得更彻底一点</a>》</p>
<p>《<a href="http://www.semyj.com/archives/374">“丰富网页摘要”，让你的网站与众不同。</a>》</p>
<p>《<a href="http://www.semyj.com/archives/153">“锚文本”在SEO方面的重要性</a>》</p>
<p>这个工具支持绝大部分编码，日文、韩文、俄文等等都没问题的。</p>
<p>还有两个浏览器插件，一个是给 Firefox的，一个是给IE 的。</p>
<p>1，下载<a href="http://www.semyj.com/upload/lynx.reg">Lynx 在线版 for IE  </a>                         <a href="http://www.semyj.com/upload/lynx_unistall.reg">IE卸载文件</a></p>
<p>2，下载<a href="http://www.semyj.com/upload/lynx_viewer.xpi">Lynx 在线版 for Firefox</a></p>
<p>装上了插件后，在你浏览一个网页的时候，在网页上点击右键的弹出菜单里，会有“以Lynx方式查看”的选项。这样非常方便平常大家查看网页。</p>
<div id="attachment_882" class="wp-caption alignnone" style="width: 483px"><img class="size-full wp-image-882" title="IE-FF" src="http://www.semyj.com/wp-content/uploads/2009/11/IE-FF.gif" alt="浏览器右键菜单" width="473" height="381" /><p class="wp-caption-text">浏览器右键菜单</p></div>
<p>由于这个工具放在国外的虚拟主机上，可能速度有点慢的。我还不知道有多少人会用这个工具，到时候可能有短暂的时间会使用不了。</p>
<p>不过大家可以先慢慢用着，以后还有讲述如何更好的应用这个工具的文章。</p>
<p>为了更好的推广这个工具，大家可以在自己的网站上，加上这个工具。</p>
<p>代码为：</p>
<blockquote><p>&lt;form action=&#8221;http://lynx.semyj.com/lynxview.php&#8221; enctype=&#8221;application/x-www-form-urlencoded&#8221; method=&#8221;get&#8221; target=&#8221;_blank&#8221;&gt;</p>
<p>URL:</p>
<p>&lt;input id=&#8221;url&#8221; style=&#8221;width: 300px;&#8221; name=&#8221;url&#8221; type=&#8221;text&#8221; value=&#8221;http://&#8221; /&gt; &lt;input type=&#8221;submit&#8221; value=&#8221;查看&#8221; /&gt;</p>
<p>&lt;/form&gt;</p></blockquote>
<p>另外 Lynx 的发音为：[liŋks]    点此听发音：<a href="http://www.103.net/dictzh/content/pronzh/000073867585.mp3" target="_blank">http://www.103.net/dictzh/content/pronzh/000073867585.mp3</a></p>
</form>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/827/feed</wfw:commentRss>
		<slash:comments>99</slash:comments>
<enclosure url="http://www.103.net/dictzh/content/pronzh/000073867585.mp3" length="4104" type="audio/mpeg" />
		</item>
		<item>
		<title>答复SEM Watch 的采访内容</title>
		<link>http://www.semyj.com/archives/824</link>
		<comments>http://www.semyj.com/archives/824#comments</comments>
		<pubDate>Sat, 21 Nov 2009 01:58:31 +0000</pubDate>
		<dc:creator>国平</dc:creator>
				<category><![CDATA[SEM访谈]]></category>

		<guid isPermaLink="false">http://www.semyj.com/?p=824</guid>
		<description><![CDATA[插一篇SEM Watch的采访内容。回答得比较仓促，不过还是不想修改，原文登出吧。
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;
1.前不久的点石北京茶话会上提出了SEM,SEO 2.0的概念，认为SEO的关注点应该从之前排名和流量的关注，更远更高的看向转化率和营销。你对目前国内SEO行业发展情况有什么看法呢？
其实早就应该看转化率和营销，只要往深处再想一点就谁都明白的。另外不应该说SEO2.0的概念，SEO就是SEO。
我现在还不清楚国内的SEO是不是可以成为一个行业，因为至今还没有一个规范出来。或者说有现成的规范但是很多人还没认识到，如google的《网站质量指南》。有些人认为SEO前景堪忧，我觉得如果SEO还是给人一种忽悠的感觉的话，那确实堪忧。但是如果能有一个标准和规范去操作，很多方法是能让局外人也能信服的话，那就前景很大。毕竟现在大家都用搜索引擎找信息，而SEO还是效果最好的网络营销手段。
SEO就算短时间不能有标准，也要形成一套公认的非常科学的SEO方法。推行这套方法也相当于有了半个标准了。
2.你对那些没有能力组建自己公司SEO部门的中小企业有什么样的SEO建议？

先做好内容，从用户的角度提供更多有价值的内容出来。内容稍微一多，就需要做SEO方面的优化了。把SEO外包可以的，但是不要事先自己来定义应该怎么做SEO。比如：给几十个关键词，要一个SEO代理公司把这些词语做上去。那SEO公司就不得不用不正规的方法。做SEO的最终目的还是为了营销，所以只要能带来效果，就不要拘泥于形式。
即使是小网站，也应该用整站优化的思维来做SEO。如果有专职的技术人员或网页设计人员，可以让他们参考《google网站质量指南》来不断地改进自己的网站，那在SEO方面也会做得很不错了。
3.从你多年的经验来说，SEO 的工作应该在网站运营中占怎样的地位，算得上是不可或缺的吗？
只要人们还是用搜索引擎在找信息，那就需要SEO。而且越大的网站，越需要SEO。它在一个大中型网站中是不可或缺的。如果说UED（User experience design）是为了让网页对用户友好，那么SEO就是为了让网页对搜索引擎友好。SEO在一个网站中基本和UED是同样的地位。但它更好的地方是它能带来非常直接的效果。
4.SEO 的从业者应该具有什么样的素质？
一定的技术能力，如了解搜索引擎，会做网站，以及其他相关的技术技能。
数据分析能力，能从错综复杂的数据中找到规律性的东西和本质的东西。
多年互联网从业经验，能从Marketing角度考虑问题。
一定的悟性、热衷于实践。创新、有韧性、懂策略性思维，擅于直达本质的思考问题。
另外，很好的人品。
5.你认为现在很多人做 SEO 的人只是四处交换链接，做群发和伪原创的状况正常吗？你看到的现状是什么样的？
这种情况可以理解的，因为SEO确实能带来不错的经济效应。但是我觉得这些方法都用错了。我了解很多黑帽方法，但是从来没看到过哪个黑帽方法能有做白帽的方法好的。
群发的坏处大大多于好处，有点经验的人应该都不会做的。伪原创有很多人在做，但是我觉得他们做的事情回报太低了，其实在做一件无意义的事情。至今应该还没有靠做伪原创做成一家公司的，但是靠做其他事情成立了一家公司的比比皆是。
6.你认为SEO行业的市场规范应该由谁来主导确定？或者说谁来定SEO的黑或白？另外，现在SEO能够寻找到与搜索引擎直接对话的机会吗？与搜索引擎有直接的交流吗?
只能由众多的SEO从业者自发的规范。如果是google，它其实已经带头推出了《网站质量指南》。这对这个行业的规范起到了很好的促进作用，就看SEO从业者愿不愿意遵守了。
界定SEO的黑与白，当然是搜索引擎。但是我们能看到一个这样的规律：在拿不属于自己的SEO流量的，一般都是黑的。在拿属于自己的SEO流量的就一般是白的。
与google的对话，就去google的网站管理员论坛。这里面提出的很多问题都可以被google的人看到。不过google貌似没有推广好，很多人忽视了它而更愿意去一些SEO论坛。
百度几乎没有对话的窗口。
7.百度和Google在中国的SEO行业的规范中现在能起到多大的作用？
google起到的作用很大，不过它的这个《网站质量指南》的标准应该大力推广的。百度在这些方面没有什么建树。来源于它长期把SEO当敌人看，要等百度意识到SEO可以和搜索引擎双赢还需要时日。
&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-
另外预告一下：最近开发了个SEO工具，测试得差不多了，不久就会放出来。
]]></description>
			<content:encoded><![CDATA[<p>插一篇SEM Watch的采访内容。回答得比较仓促，不过还是不想修改，原文登出吧。</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;</p>
<p>1.前不久的点石北京茶话会上提出了SEM,SEO 2.0的概念，认为SEO的关注点应该从之前排名和流量的关注，更远更高的看向转化率和营销。你对目前国内SEO行业发展情况有什么看法呢？</p>
<p>其实早就应该看转化率和营销，只要往深处再想一点就谁都明白的。另外不应该说SEO2.0的概念，SEO就是SEO。<br />
我现在还不清楚国内的SEO是不是可以成为一个行业，因为至今还没有一个规范出来。或者说有现成的规范但是很多人还没认识到，如google的《网站质量指南》。有些人认为SEO前景堪忧，我觉得如果SEO还是给人一种忽悠的感觉的话，那确实堪忧。但是如果能有一个标准和规范去操作，很多方法是能让局外人也能信服的话，那就前景很大。毕竟现在大家都用搜索引擎找信息，而SEO还是效果最好的网络营销手段。</p>
<p>SEO就算短时间不能有标准，也要形成一套公认的非常科学的SEO方法。推行这套方法也相当于有了半个标准了。</p>
<p>2.你对那些没有能力组建自己公司SEO部门的中小企业有什么样的SEO建议？</p>
<p><span id="more-824"></span></p>
<p>先做好内容，从用户的角度提供更多有价值的内容出来。内容稍微一多，就需要做SEO方面的优化了。把SEO外包可以的，但是不要事先自己来定义应该怎么做SEO。比如：给几十个关键词，要一个SEO代理公司把这些词语做上去。那SEO公司就不得不用不正规的方法。做SEO的最终目的还是为了营销，所以只要能带来效果，就不要拘泥于形式。</p>
<p>即使是小网站，也应该用整站优化的思维来做SEO。如果有专职的技术人员或网页设计人员，可以让他们参考《google网站质量指南》来不断地改进自己的网站，那在SEO方面也会做得很不错了。</p>
<p>3.从你多年的经验来说，SEO 的工作应该在网站运营中占怎样的地位，算得上是不可或缺的吗？</p>
<p>只要人们还是用搜索引擎在找信息，那就需要SEO。而且越大的网站，越需要SEO。它在一个大中型网站中是不可或缺的。如果说UED（User experience design）是为了让网页对用户友好，那么SEO就是为了让网页对搜索引擎友好。SEO在一个网站中基本和UED是同样的地位。但它更好的地方是它能带来非常直接的效果。</p>
<p>4.SEO 的从业者应该具有什么样的素质？</p>
<p>一定的技术能力，如了解搜索引擎，会做网站，以及其他相关的技术技能。<br />
数据分析能力，能从错综复杂的数据中找到规律性的东西和本质的东西。<br />
多年互联网从业经验，能从Marketing角度考虑问题。<br />
一定的悟性、热衷于实践。创新、有韧性、懂策略性思维，擅于直达本质的思考问题。<br />
另外，很好的人品。</p>
<p>5.你认为现在很多人做 SEO 的人只是四处交换链接，做群发和伪原创的状况正常吗？你看到的现状是什么样的？</p>
<p>这种情况可以理解的，因为SEO确实能带来不错的经济效应。但是我觉得这些方法都用错了。我了解很多黑帽方法，但是从来没看到过哪个黑帽方法能有做白帽的方法好的。</p>
<p>群发的坏处大大多于好处，有点经验的人应该都不会做的。伪原创有很多人在做，但是我觉得他们做的事情回报太低了，其实在做一件无意义的事情。至今应该还没有靠做伪原创做成一家公司的，但是靠做其他事情成立了一家公司的比比皆是。<br />
6.你认为SEO行业的市场规范应该由谁来主导确定？或者说谁来定SEO的黑或白？另外，现在SEO能够寻找到与搜索引擎直接对话的机会吗？与搜索引擎有直接的交流吗?</p>
<p>只能由众多的SEO从业者自发的规范。如果是google，它其实已经带头推出了《网站质量指南》。这对这个行业的规范起到了很好的促进作用，就看SEO从业者愿不愿意遵守了。<br />
界定SEO的黑与白，当然是搜索引擎。但是我们能看到一个这样的规律：在拿不属于自己的SEO流量的，一般都是黑的。在拿属于自己的SEO流量的就一般是白的。<br />
与google的对话，就去google的网站管理员论坛。这里面提出的很多问题都可以被google的人看到。不过google貌似没有推广好，很多人忽视了它而更愿意去一些SEO论坛。<br />
百度几乎没有对话的窗口。</p>
<p>7.百度和Google在中国的SEO行业的规范中现在能起到多大的作用？</p>
<p>google起到的作用很大，不过它的这个《网站质量指南》的标准应该大力推广的。百度在这些方面没有什么建树。来源于它长期把SEO当敌人看，要等百度意识到SEO可以和搜索引擎双赢还需要时日。</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;-</p>
<p>另外预告一下：最近开发了个SEO工具，测试得差不多了，不久就会放出来。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.semyj.com/archives/824/feed</wfw:commentRss>
		<slash:comments>52</slash:comments>
		</item>
	</channel>
</rss>
