或者

nofollow,noindex,noachive在SEO中的应用

作者:聚擎 浏览:113 发布时间:2017-05-24
分享 评论 0

最近老婆在推一个站排名的时候,找着听了几堂互联网的SEO课程,因为目前我的主要精力不在SEO上,但为了多汲取一些该行业的最新技巧信息,于是让她把课程录下来,有空的时候听听。这就听到了那位老师对于nofollow在排名中的见解。

 
nofollow的seo

他关于nofollow的见解是:对不参与排名,承载不太重要信息的页面等使用nofollow可以有效的聚集权重,引导蜘蛛,增进蜘蛛抓取效率,让有价值的页面获得更多展现几率。

 

说的没错,在年中接的那本SEO基础教程中,我已经说过这个。所以这不是新观点。虽然不新,但作为SEO的一个细节还是有必要追究追究。本文正是在这样的背景下产生的。不单是nofollow,还有noindex,noarchive,目的都在于针对蜘蛛做友好的引导,同时也是有目的引导,以求给双方带来更好的价值和体验。

 

什么是nofollow?故名思义,告诉搜索引擎,你好,这个链接别跟踪。为何不跟踪?第一他是个重复链接,比如一个页面已经有了某页面的通道,但为了用户体验或方便你一定得再给一次或者多次这个链接,但这个重复对于蜘蛛来说并不是什么好事,假设它爬取到这第二个链接,它必须执行一次计算判定这个链接是不是重复,如果是不爬取,不是,爬取,这个计算有可能还不止一次,耗不耗蜘蛛时间资源等?毫无疑问。而如果你加一个nofollow标签就不同了,它可以依据此直接skip,这就是蜘蛛友好。第二它是个类似关于我们的页面,不太重要,站到搜索引擎立场去看,这对于网民有无特别价值?无。至少对大多数人来说是没有的,但对自己的访客却是有价值的,不能没有,但作为收录排名是很次要的页面,所以使用nofollow,帮助搜索引擎识别,将蜘蛛资源分配到其它能带来流量,客户,或者其他利益的页面去,由于网站重要度不一,分配的蜘蛛资源不一样,给你抓取的时间分配不一样,有意识的排除不太有价值的页面,目的就是想将有限的蜘蛛分配到更有价值的地方去,所谓资源优化配置,或者最大化使用资源。至于蜘蛛的多少和蜘蛛单次爬行时间可以从服务器日志获取,假设来说,每周有100个蜘蛛来访,单次爬行时间为2分钟,爬行深度为2级,而你网站是三级。这就意味着这2分钟,可能只在首页和最新页面之一,两三个比较好的权重页做了短暂停留,當然如果没有nofollow,他可能其中一次或者几次爬取就在在线留言页面,联系方式页面,这样就很清楚的看到咱们的这次蜘蛛来访浪费了部分,本来可以多抓取几个页面的,却让蜘蛛去了几个老的不太重要的页面。第三死链接,比如因为什么因素导致死链接了,但是又因为某种因素这个链接还不能删,nofollow掉就是种友好而对自己有利的选择。第四给别人做的广告,或者类似的东西,你只想做个文字链广告而已,并不想给它传递权重,或者导蜘蛛给它,nofollow掉就是种可行的处理方式。

 

由此可见,nofollow就是为了蜘蛛友好,为了资源最大化,为了集权给重点排名页面。说过这,就得说到那堂课对一个旅游网站的nofollow分析,首页1800多个链接,使用了1100多个nofollow,合理吗?合理。这正体现着他们内部有一个策略型的SEO团队在。一个大型网站要从搜索引擎获取流量,绝不会将所有页面一视同仁对待,一是精力问题,二是资源问题,三是价值问题。而且我敢肯定的是他们每个nofollow都绝非随意,一定做过AB测试,对每个链接的重要度做过细致评估,这种做法才是真正科学的SEO优化方案及有效的执行。

 

nofollow的另外两个兄弟,noindex其意思是,不要索引,就是说你可以爬我,但是不要收入你的数据库,为什么呢?这个页面或许有导向其他页面的链接,或许是个中间页,等等,但它没有排名的价值,你抓过去放数据库,展现出来对我一点用都没有,对于你也一样,与其如此我不如友好的告诉你别抓过去了,为你省点服务器资源。就这个意思。具体比如一个站内导航页,很多链接可以帮助蜘蛛遍历整个网站,也可以给访客一个指南针,但是对于排名来说没什么太大价值,只是一个例子而已,get到这层意思就行具体执行中还得靠自己去掂量。

 

另一个兄弟叫noarchive,我在上上家公司中使用过。意思是不要保存快照,就是说你既可以抓我爬我,也可以索引,排名等,但是不要保存快照,快照就是抓取的时候保存在搜索引擎库中的页面数据。或者不叫不可以保存快照,是你别放出来。通常来说,可能基于快照更新慢,搜索引擎不常来,使用这个策略让它总来,當然这个是我猜的,我使用它就是为了让竞争对手看不到我的快照数据,这也是衡量竞争对手的一个指标,让它知道的越少,我越能保持领先优势,如此而已。