或者

百度索引量下降的原因及解决方法

作者:数风流人物 浏览:137 发布时间:2018-03-30
分享 评论 0

作为一名专业的SEO人员,我们很多的时候都在研究站点中有多少页面可以作为搜索候选结果,也就是一个网站的索引量,所谓网站索引量,就是搜索引擎抓取你网站的数量,这能影响到网站收录率,是一个非常重要的SEO因素。


索引量是流量的基础,索引量数据的每一个变动都拨动着站长敏感的神经,站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户,页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引,那么,导致百度索引量下降的原因有哪些呢?其解决的方法是什么呢?


一、百度官方的原因


对于导致百度索引量下降的原因,首先我们就要先检查一下是否是因为百度自身导致的结果,简单的来说,建议你可以从以下2个方面来入手。


1、配额再分配


同类数据量接近索引分配总额,配额量再分配,有升的就会有降的。


博客的解决方法:对于这种情况,只能是想办法超过竞品,争取高额分配。


2、数据异常错误


A、错误惩罚


应对某类作恶行为而新算法上线,但由于蝴蝶效应,导致部分站点被错误惩罚而清除大量索引。


博客的解决方法:反馈百度方,请求解除惩罚。


B、地区性数据异常


部分地区数据抓取或查询异常,导致误判站点情况而清除相应索引数据或输出错误索引量,如百度dns系统升级事件。


博客的解决方法:反馈百度官方,由百度检查各地蜘蛛执行情况。


C、接口调用数据错误、数据丢失、数据备份衍生异常


博客的解决方法:反馈百度官方,由百度检查相关数据情况。


二、网站本身的原因


除了百度自身的原因会导致百度索引量下降,还有就是网站自身的原因了,具体来说有以下6点:


1、内容数据所在的网址url未规范统一


常规来说,对于这点我们是要分2个方面来分析的:


(1)、自己站点url规范统一


多域名都可以200状态正常访问网页内容;一个域名下出现多种url形式可以访问相同内容,如大小写url、url规则变更等。


博客的解决方法:选择主域名(或主url),其他域名下的所有url都301重定向到主域名或主url,并站长工具提交域名改版(或目录url改版)。


(2)、外部平台使用己站数据


A、市场合作,站点数据调用到其他平台上;内容主动外发,推广人员完整转发自有内容到高质量平台 这两个原因都有可能导致搜索引擎收录了外部平台的内容而拒绝了原网站内容。


博客的解决方法:使用站长平台链接提交工具的主动推送功能,及时提交网站新出现的链接,延迟将内容调用到其他平台的时间。


B、被镜像,用户通过其他举办主体的域名或url直接可访问己方内容


博客的解决方法:关注域名解析安全和服务器安全;绑定唯一可解析的域名或唯一可访问的url;页面内容中链接使用绝对地址。


2、站点受青睐度下降


对于网站因为百度的青睐度下降而导致的索引量下降,我们有可以分为以下4种情况来分析,对此,也为大家做了一一的介绍:


(1)、网页内容相关


A、内容质量度下降


博客的解决方法:提高内容质量度,简单的来说,杜绝简单拷贝,多做整合信息。


B、更新量及频率下降


博客的解决方法:稳定的更新频率,视内容发展情况,扩充编辑团队,生产更多新内容,让网站索引避免下降,持续增加(当更新量及频率下降明显,那么配额就会下降,首先表现抓取频次下降,导致索引量下降)。


C、时效性信息消失


博客的解决方法:时效性的信息,大部分一般在数据库不会长期保留,所以需要持续挖掘新的时效信息点,整合相关内容。


D、部分区域出现不良信息


博客的解决方法:杜绝大量外链软文、恶劣弹窗广告、非法敏感类信息、专门针对搜索引擎作弊的内容等。


(2)、触犯惩罚算法


博客的解决方法:关注站长工具消息和百度网页搜索动态,按官方公告说明来整改站点,并进行反馈,然后等待算法更新。


(3)、特型url不被信任


博客的解决方法:定制各类url的索引查询规则;定位索引量下降的特型url;排查该类url当日、前一日、本周、历史索引情况;找出未被入库的数据可能存在的问题;处理完后,增强该类url与百度数据沟通(途径有sitemap、批量提交url、数据推送等)。


(4)、站点被搜索引擎信任度下降


A、非法投票嫌疑(链接工厂等)


博客的解决方法:珍惜自己页面的投票权,对于劣质网页坚决不投票,尽量减少站点的导出链接。


B、主题变动(如从教育领域跨入医疗领域)


博客的解决方法:将旧领域的网页进行死链处理后向百度进行提交,封禁相关旧url的被访问权,然后再上线新主题相关内容,加强对百度的数据提交。


C、受牵连


相同ip下非法站点偏多,同一域名所有人举办的网站大都被惩罚且情况恶劣等。


博客的解决方法:离开恶邻,获取搜索引擎的各产品的相关反馈方式,请求给予解禁,等待恢复正常索引。


D、政策性原因


如香港主机、国外主机站点由于各种你懂的原因,稳定性可能较差。


博客的解决方法:国内主机备案,合法符合政策经营。


3、网页模板相关


从SEO的角度,网站的网页也会影响到百度索引,具体来说有以下3点:


(1)、主体内容区域对蜘蛛的限制


博客的解决方法:取消登陆查看信息等限制,让蜘蛛便捷畅快的 采集 到己站数据。


(2)、启用了对蜘蛛不友好的技术


博客的解决方法:对需要蜘蛛识别的内容,不要启用对蜘蛛不友好的技术来调用。


(3)、响应式模板干扰蜘蛛识别页面类型(pc、移动)


博客的解决方法:提交特定的url对应关系(尽量parrten级);meta标记移动版本url及适合浏览的设备;自主适配;增强pc、移动不同模板源码标签的区分度,帮助百度识别页面类型。


4、源码相关


源码错误较严重,如编码错误、标签使用错误等;源码改动严重,蜘蛛 采集 数据后重新观察分析;某类url下的TD(网页title、description)变化,如变化比例大、变化页面量大,页面进行更改后会重走建索引库流程,如果页面质量达不到建索引库标准会从线上消失。


博客的解决方法:校验源码,准确的源码是蜘蛛 采集 数据进行分析的基础;link内链结构、url地址形式、页面主题、页面各区域html标记等尽量维持改动前的情况;逐步、分期更换TD(网页title、description),结合页面主题、用户实际需求来制定合理的TD,不欺骗不误导用户。


5、已入库的url对蜘蛛状态有变化


关于这方面,主要有以下4点需要分析的:


(1)、robots声明,禁止蜘蛛抓取


博客的解决方法:查看百度站长工具robots及抓取情况。


(2)、url规则变化,原有url无法访问


博客的解决方法:特别是linux和win服务器之间的数据迁移,可能会出现大小写url支持变化,确保各类url规则不变化,url必须重构的时候,做好旧新url的301重定向,站长工具提交改版需求。


(3)、提示错误页面


博客的解决方法:由于误删,则可以数据恢复,并维持url对应网页内容的更新变化,提高抓取频次,如果确定要删除,那么提交死链,删除死链后,再robots禁止,觉得这种情况的索引下降无需担忧。


(4)、被入侵


博客的解决方法:防止url对蜘蛛进行非法跳转操作;防止url对应的网页内容对蜘蛛出现内容大变化,特别是一些违法乱纪的内容。


6、DNS、服务器问题


最后,导致百度索引量下降的常见原因,还有DNS和服务器的原因,具体来说,有以下几点:


(1)、DNS问题


关于DNS问题,主要就是:DNS不稳定;DNS不安全。


博客的解决方法:选择可靠的DNS服务;沟通强调对蜘蛛的稳定性;防止DNS解析到非正常ip;防止解析的网站ip频繁变动;防止DNS管理漏洞,导致被恶意解析;防止DNS解析挂靠在小代理等技术能力、管理规范、道德法律约束都欠缺的平台上。


(2)、服务器问题


A、可访问性差


博客的解决方法:尽量让目标地区所有运营商来路的用户都能在3秒内打开网站,最佳1秒内;监控网站运行状态,合理设置目标地区的所有运营商监控节点及监控项目、监控频率。


B、屏蔽百度ua或ip


博客的解决方法:多利用百度站长工具,查看百度抓取网页的情况。


C、防刷压力值设定


博客的解决方法:将蜘蛛解析到专用空间;如出现访问陡增的ip,查看是否为蜘蛛再确定是否禁止访问。