接下来的两篇文章,会讨论网站是选热门关键词还是长尾关键词,以及应该注意内部链接还是外部链接。
相信很多SEOer都有这样经历:开始做一个网站的SEO的时候,都是先选一些计划中要排名的词语,希望藉由这些词语在搜索引擎上获得大量的流量。在这些词语中,有些人选的是些热门词;有些人明智一点,是一些在当前的能力下能做到的适当热门的词语。在接下来的过程中,会集中很多的“资源”来做这些这些词语的排名。包括在title中适当的重复这些关键词;突出这些关键词的密度;外部链接指向这些关键词页面等等。不过,在计划中的词语还没有排名的时候,很多人会发现网站其实已经有一些SEO流量了。而去分析流量就会发现,流量几乎都不是计划中的这些关键词带来的,而是各种各样奇怪的长尾词。等到计划中的关键词有好的排名的时候,根据网站的不同,有些网站可能大部分流量靠那些热门关键词贡献,而有些网站则不然。
那么,在做一个网站的SEO关键词优化的时候,是把精力偏重放在做热门关键词还是做长尾关键词呢?
为了看清楚这个问题,我们需要来看看用户使用搜索引擎的现状。
不需要太多的数据参考,可以回想我们自己或者周围其他人使用搜索引擎的情况,就会发现:
Searchstatus 是一个Firefox上的SEO插件,是一个非常好用的SEO辅助工具。不过因为它的官方版本只有英文版,所以普及程度还不高。我最近花时间把这个插件汉化了一下并增减了上面的一些功能,现在提供给大家使用。
点击下面的图标就可以安装。或者把文件下载下来后,把这个文件拖到Firefox的窗口上也可以安装。
安装后,工具条默认显示在右下角的浏览器状态栏里。

软件菜单
现在有很多的大中型网站都有专职的SEOer,相信很多SEOer在执行SEO项目的时候会碰到各种各样的问题。这篇文章就探讨一下如何在一个大中型网站推行SEO。
做SEO的人都清楚:SEO能给网站带来大量免费的流量。不过在一个大中型网站中,是由很多部门配合一起来做这个网站的,SEO所要改动的很多东西基本上涉及到各个部门,那就需要他们来配合你的改动。这样一个过程是很庞杂的,对做SEOer的水平要求很高。
很多SEOer在公司遇到的各种问题就不描述了,相信很多人都经历过。接下来我想说的是SEOer为什么会碰到这些问题,还有怎么去解决。
首先最要命的是SEO看起来没有一个固定的标准。而一个网站中的其他岗位,大家都有标准,该怎么做和不该怎么做不会有太大的异议。所以平常做事,凡是涉及到SEO的,好像都是SEO团队的人说了算,别的部门觉得SEO就是一个黑盒子,不明白你的下一个改动是什么样的理由。加上如果一个SEO团队中有好几个人,水平又参差不齐的话,先别说和其他部门沟通了,自己团队内部都沟通不好。自己团队内有各种不同意见,即使你有统一的说法传递到其他部门,但是因为很多原因,传到其他部门的信息也是非常混乱的。由此产生的其他各种问题在很多大中型网站屡见不鲜。
2005年的google做了大量的调整,因为到了05年,很多SEO的方法慢慢泛滥了起来。同时很多网站主对google如何对待他们的网站一直没有明确的途径去了解。google应对这个局面的方法非常的开放,也非常聪明,就是希望和网站主达成一种双赢的局面。所以有了google webmaster tools (网站管理员工具)这个工具。
这个工具从推出到现在,经历了很多次的增增减减,它努力追求让这个工具越来越对站长有利。一直以来,我都看到很多人对它的认识还不够深刻,所以单独来讲一讲这个工具是很有必要的。
《利用Google Search Appliance 服务器做SEO》一文中,我曾经说:“会把GSA后台的操作也讲述一下。到时候你会对google webmaster tool这个工具有更深一层的理解。” GSA就是一台把google整个硬件和软件打包在一起的服务器。这台服务器就是一个小型的google搜索引擎,它以前的版本的名字就叫 google mini , 能形象的说明这个服务器的性质。

黄色的是GSA,蓝色的是google mini
说了很多SEO相关的东西,但是从来没有说说如何去对待SEO。我想这篇文章比很多篇讲如何去做SEO的文章都还对大家有用一些。
王通曾经写过一篇《阿里巴巴B2B必然走向衰落》,虽然这篇文章一塌糊涂,但是这篇文章当中说阿里巴巴依靠SEO成功的观点我觉得是对的,只是没有他说的那么简单。《SEO是如何依赖技术分析的》一文的结尾我也提到:“从某方面来说,是SEO成就了阿里巴巴”。为了让大家更明白一点,我可以说一些已经公开了的信息:阿里巴巴是先有英文站,才有中文站的。而在08年以前,阿里巴巴英文站的收入都是占到阿里巴巴整个收入的70%。可能有人会说,阿里巴巴英文站的收入都是来自于国内那些做外贸的中国人,但是,在早期,那些外贸企业之所以肯爽快的付费,是因为在阿里巴巴上确实有效果。而这种效果,来自于大量优质的国外买家的流量。
我看到有些人用alexa分析阿里巴巴的流量构成,说绝大部分流量都是中文的流量,其实是分析有误的。因为阿里巴巴中文站的域名是 china.alibaba.com ,和英文站 www.alibaba.com 是同一个主域名。所以alexa把中文站的流量也算进了英文站的流量里。而alexa上的数据本来也就不准的。(这个alexa其实可以抛弃不用了,可以用adplanner代替)
那么这些大量优质的买家流量如何来的呢? 大家可以想一想,一个中国人做的网站,不能去国外那么多国家的电视上做广告,不能搞一些类似“赢在中国”的活动。大家也不会听你一个明星般的企业主“忽悠”。那还能有什么办法?无非就只有在线营销。
已经有很多网友问我百度如何优化了,不过我一直不清楚如何来写更合适。
有好几个原因。首先是,很多知识,我不先介绍一下的话,到时候我写出来大家不容易理解。就如我博客刚开的时候,我就想写《SEO案例:锚文本、关键字、nofollow、Web标准化》这篇文章,但是如果一开始不讲一下为什么要重视锚文本、如何选关键字、nofollow的作用、为什么要标准化的话,很多人可能会觉得我只是讲了一个特别注意细节的案例。
所以我会先把google的优势讲明白,把搜索引擎是怎么运作的讲明白,然后才能把如何做百度优化讲明白。我博客里的很多文章都是从google的角度出发来讲SEO的,但是你都可以思考一下同样的事情要是百度来处理的话,会如何去解决。
第二个原因就是百度优化和google优化在技术上有80%是相似的,所以不用特别的区分是百度优化还是google优化。而且,做一个网站的SEO工作,那些流程和方法都是一样的。说起相似性,你就可以看到:一个在google上排名很强势的网站,在百度上也会有不错的排名。还有,百度前几年不是一直宣称google侵犯了百度在超链分析法上的专利吗,虽然很荒谬,但是可以看出百度也是注重外部链接的。而且现在还有一个趋势就是,百度在算法上越来越模仿google。
另一个原因就是其他方面的。互联网的圈子其实很小,百度排名确实有一些技巧,但是我今天在这里说明的技巧,明天大家就不能用了。
我前面的文章,都是从技术角度出发来做SEO的。这篇文章就再举几个例子,来说明一下做SEO为什么要依赖技术分析的。另外写这篇文章还出于我一直以来的一个想法,就是我一直都很想赞扬一下07年之前阿里巴巴某些做SEO的同事,他们很早就在SEO领域做出了非常多好的实践,也给网站做出了很大的贡献。
07年以前的阿里巴巴,经过几年的努力,已经把SEO做到了一个很高的境界。大家那时可能还只关注国内中文版的阿里巴巴,称“google是阿里巴巴的站内搜索引擎”。其实阿里巴巴国际站在国外同行当中的表现要更加优秀。当时很多产品类词语,排在首页的10个结果当中就可能会有6个是阿里巴巴国际站的。
当时领导SEO团队的人员是做技术出生,所以大家大量借助技术手段来分析和解决SEO当中出现的很多问题,取得了很好的效果。
因为涉及到现有的业务,只能说几个不那么敏感的例子。
Google 网站管理员工具刚出来的时候,我们网站有很多频道都验证不了那个google需要你上传的文件。工程师那边帮助查了很多问题,以为是什么跳转之类的没有做好。查了很多资料,也没有找到特征吻合的相关解决办法。而meta验证的方法因为技术上有一点问题做不了。
所以我们SEO团队就帮工程师去找问题。我同事瞿波不一会就找出问题出在什么地方了,原来问题出在泛解析上。
很多人很关心google Caffeine的更新,有些猜测说是为了应对bing的突起而做的改动。
前面讲了很多理论,那这次我们来实践一下,从搜索引擎的角度,来判断一下google Caffeine到底更新了什么。
先看google官方的解释: http://googlewebmastercentral.blogspot.com/2009/08/help-test-some-next-generation.html (需要翻墙)
我觉得,这次改动主要是重写了搜索引擎的底层架构,涉及到爬虫、索引库、排序规则等等很多方面。提升的方向主要是google一直以来追求的速度,而速度的提高会进一步带来准确性和全面性的提升。
Google是一个对速度的追求达到了变态的地步的公司。他们的价值观之一就是“速度为王”。举好几个例子:你可以在google首页看到,所有的代码被压缩成几行,因为这样能提高加载速度,甚至在代码变量的命名上,都是坚持能用1个字母的就不用2个字母的原则;google非常多的产品大量应用AJAX技术,就是为了在速度上更快一点;在google的历史上,曾经想把搜索结果首页的默认条数从10条增多到30条,用户也乐意接受这个改动,但是测试下来,发现这样会拖慢0.5秒的速度就放弃了。
追求速度不光是为了用户打开页面快而考虑的。我相信google在98年就开始意识到这样一个瓶颈问题:摩尔定律描述了每隔数年计算机的硬件水平就翻倍。而互联网上的信息,也是这样一个规律。有人甚至说是每隔9个月互联网上的信息量就翻倍。搜索引擎要保证一个基本的信息查全率,就需要能跟上这种信息暴增的速度。
要特别感谢网友 wyw 提供的消息。他联系了这本书的译者 董金伟老师,得到答复说数月前书稿已经交给出版社,08版即将上市销售。 我也发邮件去询问了一下,董金伟老师特意去出版社确认过,得到的消息是:国庆期间这本书就可以上架销售了。
所以大家可以再等几天就可以买到08版的中文版了。
另外,我很想和大家更多的在线下交流,以后有大家什么聚会的话就可以叫上我。国庆假期我会在宁波。
MSN : guoping.zhanggp@hotmail.com
分词是很多做SEO的人常听到的概念,为了让大家在这个方面不会有疑惑,现在要来讲一下分词以及索引库。这也是更深入的了解搜索引擎的开始。
搜索引擎每天都是在处理一个基本的需求:用户搜索一个关键词,搜索引擎马上找到相关的网页给用户。这个过程要怎么实现呢? 下面就分步来了解这个过程。
首先搜索引擎要尽可能多的把互联网上的网页搜集下来,这样能提供大量的网页给用户查询。这一部分由爬虫来解决,顺着互联网上的链接一个个往下抓取。最后就有了一堆记录着网页各种信息的资料库。目前的现状,最后能使这个资料库里有大概100多亿个网页。资料库里记录了这些网页的URL,整个网页的HTML代码,网页标题等等信息。
然后,搜索引擎拿到用户输入的这个关键词后,要从这个资料库里把相关的网页找出来给用户。这里就碰到好几个问题了: