我也谈一下nofollow

写这个文章是因为看到ZAC的两篇博文。觉得很多人都可能受到误导,所以特意说明一下。

一篇是ZAC一年前写的nofollow控制站内权重,一篇是最近写的nofollow会浪费PR和权重

我要说的是,这两篇文章里表达的观点都错了。如果ZAC有在大型网站做SEO的经验,那他一定会知道他错误的理解了他引用的文章。

nofollow是05年google推出的一个属性,理论上加了nofollow属性的链接爬虫都不抓取。当初推出这个属性主要是为了应对日益泛滥的群发作弊。后来小部分SEO人认识到了nofollow链接对SEO的好处,有了一些应用nofollow的技巧。其实,直到现在,nofollow都还是一个有利的SEO手段。

我们先来看看Matt Cutts(google反作弊组的老大)的博客里关于nofollow的描述。(这也是ZAC引用的链接)

 http://www.mattcutts.com/blog/pagerank-sculpting/

这里面从来没有说明nofollow会浪费PR和权重,这里面只有一个观点,那就是你即使加了 nofollow,也不会使你的PR值增高。原文中有个例子:

“So what happens when you have a page with “ten PageRank points” and ten outgoing links, and five of those links are nofollowed? Let’s leave aside the decay factor to focus on the core part of the question. Originally, the five links without nofollow would have flowed two points of PageRank each (in essence, the nofollowed links didn’t count toward the denominator when dividing PageRank by the outdegree of the page). More than a year ago, Google changed how the PageRank flows so that the five links without nofollow would flow one point of PageRank each.”

意思就是说:你原来有一个页面PR值有10点,这个页面中有10个链接。nofollow之前每个链接分到1点的PR值。如果你nofollow掉其中5个链接,你以为剩下的5个链接每个链接能分到2点的PR值,但是实际上,每个链接还是只能分到1点PR值。

也就是说,在单个链接的PR值的计算上,根本不会听从nofollow这个属性。博客中的意思是,那些被nofollow的链接的PR值和锚文本不会被传递。没被传递,不是意味着PR值就节省下来被传递到其他链接了,计算单个链接的PR值的时候,nofollow还是不能影响到。google这样做,是不想网站所有者为了控制PR值,把一些好的内容给nofollow了。但是,也就只有这样而已,并不代表nofollow就没有用了。更不会浪费PR和权重了。原文的中Matt Cutts的一个回答说的很明白了,就是你要想一想没有nofollow之前是什么状况。

要清楚nofollow的作用以及为什么说ZAC错了,要从头说起。

一个网站,只要页面稍微一多(比如只要有个几百页以上),就遇到一个问题,就是搜索引擎在短短的几天内,没办法把你的所有网页都抓取一遍。几百个网页都这样,那一些B2B、B2C、招聘网站、分类网站等等稍微大一点的网站这个问题就更加严重,如果你有google webmaster tool ,去“抓取统计信息”里看看就明白了,爬虫一天访问的页面量可能不到你页面总量的1%。页面没有被爬虫抓取,就意味着这些页面要被收录是不可能的。一旦收录情况不理想,整个网站要获取SEO的机会也是少了很多。

当nofollow属性出来,一些做SEO的人合理应用了nofollow属性以后,发现爬虫每天的抓取量就应声上去了,接着网站整体的收录量上去了,整体的SEO流量也上去了。(这种方已经是一少部分SEO人屡试不爽的技巧)为什么呢?

因为只要你合理的应用nofollow属性,就会帮助爬虫节省很多时间,还可以让爬虫更多的抓取那些有收录价值的页面。比如:你网站上有一些链接是 “注册”、“发送反馈”、或者“添加到购物车”等等的链接,这些链接是没有收录价值也不会有排名的。这种“垃圾页面”放上nofollow属性以后,爬虫就不爬了,就会去爬别的没有放上nofollow属性的链接。这样,你节省了爬虫时间(在一定的的期间,爬虫呆在你网站上的总时间是相对固定的)。然后,也可以“控制”爬虫抓取重要的页面,让那些还没被爬虫抓取的好页面有被收录的机会。虽然爬虫可能还是没有百分百抓取完你的全部网页,但是已经改善太多了。

然后,一般大型网站都是用模版的,理论上,你在一个页面上nofollow掉10个链接,如果这样的页面有100万个,那你就节省了1千万个爬虫抓取“垃圾页面”的机会。而我的实际工作中,有时候一个页面上可以nofollow掉50个链接,以及涉及到上千万页面。

nofollow正确的做法就是这样的,nofollow要控制站内权重,也是通过这种做法实现的。所以ZAC的两篇博文都没有理解那些在一线SEO人员的做法。nofollow又怎么浪费权重了呢?

至于PR值,真正务实的SEO人从来不在意这个,因为事实上PR值和排名关系不大。我相信以前擅用nofollow的人也没有想过用它来控制PR值。

前段时间,有个朋友问我快速提高SEO流量的做法,现在这就是一个。如果不是为了让大家不受到误导,我可能不会公开讲出来。正是因为以前有人误导nofollow可以控制PR值,才有人去把自己有价值的页面也nofollow掉了。google这么做非常及时,免得大家误入歧途。那些企图用nofollow控制PR值的人也真的是自食其果。我在另一篇博文里也说了,SEO其他提高流量的方法有的是,作弊是最蠢的。

做整站优化,如果你老板给你一个网站要你马上提高SEO流量,那你就合理的应用nofollow,我敢说,在2个月内涨30%以上的流量是完全可能的。这是白帽SEO,国外很多顶尖的网站也都是这么做的。发展到后面,nofollow还有很多非作弊的技巧。

如果有人还不信我说的,其实,在《google网站质量指南》里,明确的说明了nofollow的应用。

http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=96569 

这份说明更新于 2009年5月12日。正是Matt Cutts宣布nofollow不能塑造PR值的时候。里面说的意思就是,被nofollow的链接,PR值或锚文本不会被传递。但没有说这些没被传递的PR值就被节省下来了。

另外,Matt Cutts在博客中也说,google明明就是从webmaster tool后台通知网站主了,或者在《google网站质量指南》里写明白了,很多人就是不会看的。

《google网站质量指南》是最权威的SEO教材,这个我要到下篇博文里讲为什么。我在阿里内部的每次培训都要推荐大家去看《google网站质量指南》。另外我的博客很多读者是上过我培训课的阿里人,可以看看我发的PPT,上面说了,nofollow是提高爬虫效率的方法。



63 Responses to “ 我也谈一下nofollow ”

  1. dacong 说:

    好文!学习了。

    • Recollection 说:

      借楼主的位置发表下, 国平老师在还没有发布这篇文章这前我就问过国平老师,NOfollow,Rebost.txt,mate标签 这三个标签用来分流,如果说在google用Nofollow是最好的,上次没有入时问题老师,这次留言问下老师,如果我用Rebost.txt来禁止与Nofollow有什么区别吗,

      我是指在爬取这方面,不是说PR,

    • 晓枫 说:

      上面的,什么是软文你又知道?

  2. cherry 说:

    很实用的技巧,相信大家都在其它网站上看到过(一些SEO做得很好的网站)。

    如果nofollow真的会浪费PR和权重,相信没有那么多的傻瓜愿意这么做的啦~~~

  3. kyw 说:

    写的非常好。
    SEO圈需要能独立思考的人。

  4. TWITTER 说:

    你的BLOG用户体验非常差劲。用FIREFOX看起来,文字颜色和背景都是灰白的。看起来非常吃力。你不配是一个好的SEO。

    • 国平 说:

      这个BLOG刚做,确实很多地方都不好

    • 天客 说:

      LZ修养要加强。请不随便说别人“不配。。。”

    • 阿汇 说:

      晕,我倒蛮喜欢这种简洁的版面的。

    • Recollection 说:

      每个人的风格都不一样,说话客气点,如果你感觉这个地方不试合你,,你可以不用来! 提议可以,但你要尊重下Blog主人,本来国平老师就是在分享自己的知识,有更好的意见大家可以客客气气的指出来。

      继续支持国平老师!! 希望能多写出这样的好文章来, 刚这文章,我亲自试验过,真的很有用,
      但还是有要求的,
      1.服务速度与稳定,
      2.外链
      3.内部优化

  5. Evance 说:

    嗯嗯,太谢谢国平的分享.
    你说的意思我明白了.
    现在研究一下matt的原文.

  6. 国平 说:

    robots.txt和meta robots无法替代nofollow
    robots.txt只能按URL特征阻止
    meta robots还是浪费了爬虫时间

    看Matt Cutts的博客,如果还留有以前的那个PR的计算公式的印象,很难理解过来的。
    google不会停止PR的算法规则的更新

  7. [...] 7号就看到阿里巴巴SEO国平的这篇博客帖子,以及他在我博客的留言,他认为我误解了Matt Cutts的意思,并误导了其他人。本来也没想回应,因为属于正常的各家之言。9号有朋友告诉我,国平同志在点石论坛也发了帖子,貌似引起了一些争论。为了不至于引起国平所说的误导,我想还是简单回应一下。 [...]

  8. 墨痕 说:

    感觉你和zac谈的侧重点不同,当然理解也不同,貌似zac是从pr上说的。而博主是看到了nofollow可以控制搜索爬行,进而提高收录质量。
    不知道这样理解对不

  9. 核桃 说:

    的确已经讲得很详细了,谢谢分享!

  10. fxy110 说:

    发现了很多老面孔,讲的很好

  11. eshen 说:

    很实用,也很受用,SEO行业很少出现争议,尤其是对于菜鸟级别的我们,前辈们的话我们几乎无条件接受,但是很少真正去思考对方所说的是否正确。看来我们也的像你一样用怀疑的眼光来学习SEO了。谢谢你的文章。

  12. kevin 说:

    你忽略了对待出站链接的nofollow的用处。
    “你原来有一个页面PR值有10点,这个页面中有10个链接。nofollow之前每个链接分到1点的PR值。如果你nofollow掉其中5个链接,你以为剩下的5个链接每个链接能分到2点的PR值,但是实际上,每个链接还是只能分到1点PR值”
    如果我在这个页面spam的话10个点可能变成100个1000个点。 分给你自己blog链接的权重会不会少呢?
    这点我不知道MAT有没有 特别说明。

  13. 小新 说:

    写的真好以后要长关注了

  14. shunyiseo 说:

    其实国平的意思是想说nofollow真的很有用而zac在误导大家不要用nofollow,其实我想zac更多的是从nofollow传递pr和权重的作用来考虑的,而国平主要是从nofollow节约爬行时间增加收录的作用来说的,其实很两个人的说法都是对的,而且也说明用nofollow有利有弊。就按照国平说的,用nofollow可以促进收录更多有价值的页面,但是毋庸置疑,网站的pr值浪费得很严重,虽然说被nofollow掉的那个页面获得了pr可能也没用,但是它以把pr继续传递给有价值的页面呀。这里说一下58同城,它之所以有那么多高pr值的域名和页面不就是因为pr传递得好么。我想从国平说的可以推断,阿里巴巴的每个页面的pr值肯定没有58高。不要跟我说pr没有用,虽然直接的没有用,但是间接的作用还是很大,这谁都知道。就说你阿里巴巴现在拿一个pr为0的页面来和我pr为5的页面交换链接,我会干?不要说是大站就牛气了,还是要看硬东西的。所以最终的问题要归结到使用nofollow到底是利大于弊还是弊大于利,我想这个应该是因站而异的。

  15. reamo 说:

    之前我也很早在webmasterworld上看到这个文章,有点不理解,在点石论坛上提问了也没有人回答!Google的算法一直在变,但是他公布这个nofollow属性以后,真正作用了多少,又改变了什么,好像目前还没有人真正试验到!还需静观其变了!冒昧问一下,可以和你的博客做个链接么?

  16. 我@soho 说:

    其实matt cutts的文章是6月份的,在6月20日我就翻译了,可惜人微言轻,没被人关注。

    我觉得国平兄的理解不对,至少没理解PageRank sculpting的含义。以我@soho网赚博客为例,某个页面PageRank为X,存在Y个不带NoFollow标签的导出链接(包括站内链接),还有Z个加了NoFollow标签的导出链接。

    以前Google的做法是:Z个链接完全没有PageRank,而Y个链接能分配到X/Y点PageRank。
    改变后,Z个链接依然没有PageRank,但每个Y链接能分配的PageRank变为X/(Y+Z),PageRank在递减。

    如果博客留言越多,博客内部pagerank流失越严重。

    正是由于以前nofollow标签完全没参与pagerank的流动,所以才有PageRank sculpting,方便我们把站点页面权重集中导出到某几个页面上。

    • 天才狐狸 说:

      “如果博客留言越多,博客内部pagerank流失越严重。” 我感觉不是这样的;因为这个假设是建立在留言是垃圾群发的基础上;首先Spider在抓取页面的时候不会去判断是这个页面是博客还是新闻列表又或者论坛;
      其次,留言越多证明这篇博客内容是热点,是有价值的内容;应该赋予更高的权重;
      其次PR的计算应该不会因为链接导出多而流失,否则sina或者导航站的首页PR应该趋于0

  17. 国平 说:

    我在这片文章里回应了一下ZAC的文章
    http://www.semyj.com/archives/153

  18. 消防器材 说:

    nofollow是05年google推出的一个属性,理论上加了nofollow属性的链接爬虫都不抓取。

    博主这句话绝对是错的。

    • 国平 说:

      恩 ,可以详细说一下么?

    • zetal 说:

      nofollow属性不代表google的spider不去抓取链接, 只是不进行PR值的传递, 类似美味书签里的那些外链都是有nofollow属性的, google还是应该可以抓取到的吧….

  19. [...] 接着国平貌似察觉到了什么机遇,紧跟着一篇《我也谈一下nofollow》,为了引起对方的关注,特意的在SEO每天一贴的对应文章中留下了评论。恰到好处的国平的文章带有链接,因此在对应文章出留下两处值得Zac关注的标记。一个是评论、另一个是博客引用在评论处留下的ping段略。 [...]

  20. [...] 1、nofollow“联系我们、隐私政策、注册页面”等对排名无用的页面 2、nofollow的运用,参考:http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=96569 3、zac和国平关于nofollow的争论,参考:http://www.semyj.com/archives/104 [...]

  21. 天才狐狸 说:

    同意楼主的观点,nofollow的标签只是Google期望网站长能把最有效的内容告诉spider,而不是让spider去抓取很多的无效链接,就像Yahoo不也是在页面中支持特殊的tag,去告诉它的spider某些内容是不要抓取的;
    这些标签的目的还是用协议去做让Spider系统和我们的网站做简单的交流;比如我就用nofolow把动态的搜索结果禁止,反正抓了spider看到也是满篇的script代码,其他的什么都看不见

  22. 小珊瑚 说:

    谢谢国平老师精彩的讲解,看了您的文章让我从一点不懂到对nofollow的使用有了比较清晰的理解。然后根据国平老师的文章加上自己的理解对nofollow的知识点整理了一下,如果您有时间麻烦您能否指点一下文章的正确性。
    以后经常来这里学习,希望国平老师继续发表好文章!顶你!!!

  23. 孙运坤 说:

    不错,SEO圈就需要这样的氛围,对于问题要敢于发表自己的看法,即便对方是行业权威,只有这样,这个行业才能进步!

  24. 青岛SEO 说:

    我觉得大家都是在揣测Matt Cutts的意思而已

    具体如何还是根据自己的理解去实践才是最重要的

  25. ttjj博客 说:

    为什么不用robots.txt来引导蜘蛛应该抓取哪些页面呢?对搜索引擎有用的页面和没用的页面都不是在一个目录下的。多数情况下,nofollow只用在评论留言的链接里面。

    • lowkey 说:

      我觉得你的思想很错误的,nofollow可以运用的地方太多了,比如说一些可能存在的重复页面,甚至是有的标签页。

  26. 学习了,用模板套用确实轻松,看来我又要改版了!

  27. ineverdie 说:

    我觉得有几个地方说得有些问题:
    1: nofollow之后的网页链接应该不是不爬,而是这个链接的权重不会计算在内,如果要禁止爬虫访问,最简单的办法还是robots.txt,当然用nofollow可以通知一些优先级,比如你说的注册页面链接全部加上nofollow,这个实际上应该降低了注册页面的权重从而降低了爬虫访问这个叶面的频率,而不是因为加了nofollow所以不爬。

    2:”理论上,你在一个页面上nofollow掉10个链接,如果这样的页面有100万个,那你就节省了1千万个爬虫抓取“垃圾页面”的机会。”,这个基本上是不成立的,除非你的每一个网页上面的连接都是不一样的,但是实际上,你的100万个网页x10个链接很有可能就是10个网页(每一个网页指向的“垃圾网页”基本上都是一样的),所以你节约的很有可能只有10个,或者100个,但是绝对不是1千万个那么多。

    • ineverdie 说:

      上面写错了一个地方:
      ——————
      当然用nofollow可以通知一些优先级
      ——————
      应该是
      当然用nofollow可以控制一些优先级

  28. andy 说:

    《google网站质量指南》能给个下载地址吗?

  29. [...] 在那篇和ZAC的nofollw争论后,有很多人都问我为什么不用robots.txt文件或者 meta robots标签来控制爬虫的抓取。其实,nofollow是这两种方式无法替代的。具体的原因,等你真正打算用nofollow,来查看一个网页上所有的链接的时候就知道。 [...]

  30. mars 说:

    讨论这些问题没有实际意义, 刻意的去阻止链接传递的做法我不赞同,按照google的pr阻尼算法,当页面数量较多而且层次比较多的时候,页面交叉链接的数量越到,也就是你链给其他页面的数量越多,而其他页面再链接其他页面的数量越多的时候,google的pr值将最大化,因为google总提供了一个0.15让你赚.

  31. 大话仙剑 说:

    博客里的nofollow 真的不能用?

  32. 芝兰之室 说:

    博主理解错误了!~nofollow并不是没有原来的作用,而只是占了PR链接数量分布的一部分,但是没有效果而已

  33. 越看越晕了 淡定…淡定….

  34. 有没有用,是否真的如博主所理解的那样,还是得检验,实践出真理。

    支持大家对此的讨论,因为讨论,然后才会有标准。

  35. noob 说:

    意思就是说:你原来有一个页面PR值有10点,这个页面中有10个链接。nofollow之前每个链接分到1点的PR值。如果你nofollow掉其中5个链接,你以为剩下的5个链接每个链接能分到2点的PR值,但是实际上,每个链接还是只能分到1点PR值。

    5个链接得到的PR传递不是总共5么???剩下的5点PR不是被浪费了么?博主似乎还是没理解ZAC的意思

    • 国平 说:

      PR值不存在浪费一说的 。

      ZAC认为:PR值决定了网站的排名,所以以前需要nofollow节省PR值,而现在nofollow的改变会浪费PR值。

      这个前提是不对的,后面说PR值浪费了就更加不对。

  36. Ah!!! at last I found what I was looking for. Somtimes it takes so much effort to find even tiny useful piece of information.
    Nice post. Thanks

  37. [...] 建议长期打开着“高亮Nofollow链接”,建议看一下《我也谈一下nofollow》这篇文章。 [...]

  38. 推荐几个nofollow做的不错的站点吧 说:

    谢谢

  39. Hi, my K-meleon browser is rendering your site weirdly just thought you might want to know.

  40. seo实验 说:

    讨论不错,值得学习。任何行业都一样,独立思考,自己实践认可了的才是真的。

  41. [...] 1、nofollow“联系我们、隐私政策、注册页面”等对排名无用的页面 2、nofollow的运用,参考:http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=96569 3、zac和国平关于nofollow的争论,参考:http://www.semyj.com/archives/104 [...]

  42. Vladik 说:

    ……

    сайтС Наступающей Пасхой

  43. Easily, the article is actually the best topic on this registry related issue. I fit in with your conclusions and will eagerly look forward to your next updates. Just saying thanks will not just be sufficient, for the fantasti c lucidity in your writing. I will instantly grab your rss feed to stay informed of any updates.

  44. jackli 说:

    分析的很不错。看问题需要全面。

  45. Mercy Kalfas 说:

    :O So mush Info :O : THis Is he MOst AMAzing SIte DUDe:

  46. [...] 27. 给予搜索引擎不同的信息 – 你用WordPress么?那么你可以给你的评论链接加上个nofollow标签,这样搜索引擎将会和用户得到不同的信息。用户看到并点击一个链接,而搜索机器人则看到的是一个不要跟随的信号。关于Nofollow更详细的资料推荐国平的这篇文章:http://www.semyj.com/archives/104 [...]

  47. [...] 27. 给予搜索引擎不同的信息 – 你用WordPress么?那么你可以给你的评论链接加上个nofollow标签,这样搜索引擎将会和用户得到不同的信息。用户看到并点击一个链接,而搜索机器人则看到的是一个不要跟随的信号。关于Nofollow更详细的资料推荐国平的这篇文章:http://www.semyj.com/archives/104 [...]

  48. vemmaur 说:

    Very Interesting Blog! Thank You For Thi Post!

  49. seo小菜 说:

    国平老师,其实所谓nofollow会浪费PR和权重是这样解释的。我们首先看这句话:你原来有一个页面PR值有10点,这个页面中有10个链接。nofollow之前每个链接分到1点的PR值。如果你nofollow掉其中5个链接,你以为剩下的5个链接每个链接能分到2点的PR值,但是实际上,每个链接还是只能分到1点PR值。这样说来,本来这个页面应该有十个投票机会,nofollow五个后,只剩五个投票机会,这样就失去了五个投票机会。你和ZAC写的博文我都认真看了。这个确实是ZAC没解释清楚。

发表回复