简单整理了已经结束的“百度带你装壕带你飞”活动中与站长相关的试题答案,希望对大家有所帮助。
注:信息相关权利(包含但不限于版权、最终解释权)归百度站长平台所有。
扣号内为个人理解,仅供参考。选择题经重新表述为肯定句,含义及准确性可能发生变化。部分内容存在时效性,已尽力恰当表述。
欢迎补充、质疑、更正,相关人员,我会在篇尾为其署名。为不影响阅读,质疑信息会被标注,统一在篇尾说明。
1 基本术语及常识
(1) SEO指的是搜索引擎优化。
(2) 百度所说的页面大小是指压缩后的页面大小。
(3)Wordpress常被搜索引擎优化人员用来建立博客。
(4) 200HTTP状态码是搜索引擎返回的抓取正常的状态码。
(5) 307是HTTP状态码。(HTTP1.1新规定的一种临时重定向状态码,与302的区别表现在于,在POST请求被重定向后,会要求客户端询问客户,是否需要向被重定向网址发送POST请求,而不是直接以GET方式打开被重定向的网址)
2 数据提交
2.1 URL提交工具:
(1) 新站登陆搜索引擎最佳的时间是:把网站结构基本完善上线后,提交给搜索引擎。
(2) URL提交工具不需要验证网站就可以使用。而外链查询、百度索引量、搜索关键词都需要验证网站后使用。
2.2 Sitemap工具:
(1) Sitemap工具支持的格式有:txt文本格式,xml格式,Sitemap索引格式,不支持JS格式。
(2) Sitemap工具中的文本格式的sitemap文件,每个文本文件最多可以包含50000条url。(以 Sitemap工具实际标注为准)
(3) Stemap提交后,百度根据网站设置的Stemap文件更新周期抓取网站。
(4) 通过Sitemap工具提交的一个Sitemap包最大可以有10MB。(以 Sitemap工具实际标注为准)
(5) 提交的Sitemap都会被百度抓取并收录吗:不保证全部收录,与页面质量相关。
(6) 百度不支持跨域名的Sitemap。
2.3 结构化数据
(1) 百度站长平台结构化数据工具现在开放了四类结构化数据的提交,分别是:通用问答、在线文档、资料下载、软件下载。(截止到2014年年末)
(2) discuz!结构化数据插件的功能包括:自动推送Sitemap,优化内容收录;实时推送论坛新内容,加快收录;优质内容,优化展现,提升用户点击率。
2.4 死链工具
(1) 死链提交工具可以使用xml格式。
(2) 死链提交工具不支持*.a.example.com格式。
(3) 不能在死链提交工具中直接提交网站目录。
(4) 在百度站长平台提交死链前,必须将网页状态码设置成404。
(5) 给死链提交工具里的文件包里完全不能有活链。
(6) 移动端和PC端的死链规范是一样的。
(7) 死链提交半个月不生效可以重新提交。
3 网页抓取
3.1 百度蜘蛛的判断:
(1) 站点通过DNS反查“Baiduspider”的真实性时,该spider的hostname除了baidu.com格式命名外,还可能是*.baidu.jp
3.2 robots书写规范、及robots工具使用:
(1) 封禁百度UA的正确写法:User-agent: Baiduspider Disallow: /
3.3 meta标注书写规范:
(1) 不想让百度保留网页的快照,可以在页面头部添加<meta name="robots" content="noarchive">(注意大小写)
(2) 百度暂不支持noindex(注意暂时不支持)
3.4 如何抓取
(1) 论坛采用登陆可访问的限制,百度不能抓取到内容。
(2) 如果网页过长,搜索引擎会去抓底部链接。
3.5 抓取诊断、网站IP发生变化的处理
(1) 百度站长平台抓取诊断工具,每个网站一个月可以使用300次。
(2) 发现百度解析IP有误,应该使用抓取诊断工具纠错。
(3) DNS解析改变导致IP发生变化时,最好通过百度站长平台抓取诊断工具向百度报错,而不坐等百度更新。
3.6 抓取频次
(1)抓取频次下降的可能因素:robots封禁、UA封禁、CDN故障,与未交保护费无关。
(2) 百度站长平台的抓取频次指的是蜘蛛每天的抓取量。
(3) 抓取频次工具能够统计网站的重定向(301、302)、未找到(404)、服务器无响应(501,502等)、服务器链接超时等抓取状态数据。
3.7 闭站保护
(1) 闭站保护功能的入口是网站分析——抓取频次中。
(2) 闭站保护恢复后,流量和收录如何恢复:流量变化与闭站保护时间长短有关,无关预估。
(3) 申请取消闭站保护却不成功的原因是死链率过高,与百度忙不过来,网站质量低下无关。
3.8 网站URL书写规范
(1)百度对于带#号的URL如何收录?答:仅收录#之前的URL内容(注意百度目前和谷歌的处理方式不同)
(2)对URL规则的正确阐述包括:URL尽量短且易读,动态URL变量参数尽量少用,百度搜索引擎不歧视动态URL。(早期对动态URL的疑虑,主要原因是网页抓取时的“蜘蛛陷阱”,随着技术的进步,已经有所改善,但使用动态URL和伪静态,仍应注意,针对不同的参数,应返回不同的页面,对于不存在的页面,应返回正确的404状态码)
(3)URL不需要一定设置为静态或伪静态。
(4)URL长度有限制,不应超过1024字节。
(5)URL中的连词符“_”和“-”没区别。
(6)百度解析时对每一段目录名的长度的要求是:总长度别超过1024字节就可以。
(7)meta标注中url字段不可以使用相对路径(如使用Canonical,mobile-agent)。
4 网页索引及收录
(1) 怎么查询站点收录情况更准确:使用百度站长平台提供的百度索引量工具。
(2) 每天Site我的网站,为什么数据波动很大,原因是?Site出的数量仅仅是估值,没有什么玄机,还是要以百度站长平台索引量工具中的数据为准。
(3) Https站点想被百度收录的办法是制作Http版本。
5 网页排名
5.1 域名年龄的影响
(1)域名年龄会在站点打分中起到微小的作用。
(2) 购买老域名做新内容,各项站点得分不会继承。
(3)买来的域名不会继承之前从百度得到的评分属性。
5.2 网页速度的影响
(1)网页打开速度会影响排名。
(2)广告加载时间会算在网页响应时间内。
(3)使用百度云加速,可以让网站响应速度更快。(百度不会区别对待网站是否使用CDN,使用何种CDN)
5.3 网页内容的影响
5.3.1 优质内容的判断及原创星火计划
(1)百度搜索引擎对时效性的基本要求:新增资源、高价值资源、具有一定受众群体,与知名大站无关。
(2)优质原创资源的要求:本网站首创,非抄袭模仿的、内容和形式都具有独特个性的资源,且具有社会共识价值的资源,符合国家相关规定。转载及简单二次加工内容不满足此要求。
(3)百度为了保护优质原创资源推出了原创星火计划。
5.3.2 无效、垃圾及过期信息的处理
(1)关于UGC(用户产生内容)站点,帖子删除后,即通过百度站长平台提供的死链工具进行提交,对站点管理更有利。站长应随时关注建站程序的安全更新,及时安装补丁程序。误区是不良信息、垃圾内容不是站长发布的,站长不需要对此负责。
(2)百度如何看待网站上的过期信息:过期信息可以被当作内容死链分析出的页面,不会产生太多负面影响。如果过期信息过多且通过百度过去的流量过多的话,有可能受到惩罚,过期信息在网站整体内容的占比过大,可能会影响百度对网站内容质量的判断。
5.3.3 重复内容的判断、影响及处理方法
(1)关于站内重复,文本内容一样,结构不一样算重复。
(2)N个子域内容相似度高,对SEO有负面影响。
(3)如果您站内必须有一组内容完全相同或高度相似的网页,该怎样告诉百度搜索引擎哪个是规范的网页,避免权重分散?
应使用 Canonical 标签。(详细介绍 百度站长平台网址/wiki/112/)
5.4 网页外部链接,外链工具的使用
(1)百度判断网站外链的原则是:是否是用户或其他网站的真心推荐,是否具有高质量的推荐意义。
(2)外链拒绝工具每天可以提交1000条规则。(以拒绝外链工具实际标注为准)
(3)外链分析工具能够查看别人网站的外链数据。
(4)垃圾外链包括:搜索结果页发出的链接,站长服务类网站自动生成的链接,恶劣垃圾作弊站自动采集来的链接。
(5)新闻源出售外链是否会被清理出新闻源。
(6)典型的外链作弊手段有:虚假锚文本、黑站加链接、买卖链接、web2.0群发。
5.5 作弊的判断与惩罚
5.5.1 常见误区的真相
(1)关键词的出现次数,与判为作弊无关。
(2)修改首页的meta description不会受到惩罚。
(3)新闻源站点有作弊行为的时候照罚不误。
(4)网站因作弊从百度消失,不能通过百度推广重新收录。
5.5.2 网站快照的关联
(1)快照时间与网站是否惩罚没关系。
(2)我的网站快照退回了以前很旧的时间,是因为百度会保存多个网页快照,现在呈现的不是你喜欢的那个版本,与惩罚与否无关。
5.5.3 广告的关联
(1)网站放了Google广告不会被惩罚,百度只针对广告对浏览体验的影响来决定是否惩罚网页,与广告提供商无关。
(2)关于JS代码弹窗与结果排名的关系:只要JS代码弹窗对用户没有负面影响就不会受惩罚。
5.5.4 针对性算法
(1) 绿萝算法打击的情况有:出售链接、购买链接、软文发布,不包含弹窗广告,弹窗广告属于百度石榴算法打击的范畴。
(2) 百度绿萝算法针对发布软文的新闻站点会进行打击:利用子域名大量发布软文,会直接屏蔽子域名,大量发软文的站点将清理出百度新闻源。情节不严重者,也会有影响。
(3) 百度搜索引擎石榴算法集中打击具有恶劣广告、妨碍用户体验的网站。
(4) 冰桶算法属于百度移动搜索算法,主要针对强行弹窗app下载、用户登录、大面积广告等影响用户正常浏览体验的页面。
6 搜索结果展现
(1) 如何让网页在百度搜索结果以图文结果展现:图片内容必须与页面内容紧密相关,图片大小尽量接近于121*75。如果出现作弊或恶劣低质图片,将有相应的处理机制:A、屏蔽出图;B、 降低站内url排序;C、严重者整站将受到影响。
(2) 我的网站没有加V认证的原因:没有参与凤巢广告投放。
(3) 搜索关键词数据能够提供网站热门关键词的展示量、点击量及点击率。(站长平台——网站分析——搜索关键词工具)
7 网站改版,改版工具的使用
(1) 网站换了新域名,需要将网站所有页面301到新域名。不仅仅是首页及重要页面。
(2) 老域名跳转到新域名,如何设置:必须所有页面301至新域名的相应页面。
(3) 网站改版域名跳转时,必须将页面设置成301状态码。
(4) 网站更换了域名,不一定要去百度站长平台改版工具提交,但提交之后效果会更好。
(5) 网站改版工具支持域名改版、目录改版,不支持改版取消。
(6) 301跳转后,原网页不会被立即删除,会与跳转后的新网页同时存在一段时间。
(7)使用百度站长平台的改版工具前,需对旧页面设置301重定向。那么301重定向需要设置多久?答案:直至新网页的抓取、收录、排序达到预期后再解除。
(8) 百度301无承诺的生效时间,与网站整体的抓取频次及内容多少等很多因素有关。
8 网站移动化开发,开放适配工具的使用
(1) 按百度提供的移动端优化的三个方法:自适应、META声明、SITEMAP提交,三者权重都一样。
(2)百度PC-移动开放适配服务方案包括:自主适配、标注Meta声明、提交对应关系Sitemap,不包括验证PC-移动网站。
(3)目前的3G、4G时代,用html5协议语言建设移动站点对百度最友好。
(4)开放适配工具,XML里的链接不可以有中文。
(5)如何查询网站开放适配进度?即查询流程:登陆注册→验证网站→站长工具→开放适配工具→开放适配进度查询。
9 百度站内搜索、百度分享及百度推荐
(1)向百度站长平台提交种子页面应该使用站内搜索。
(2)百度站内搜索基本信息设置搜索LOGO支持的格式有:PNG,IPG(JPG/JPEG),GIF,不包含AMP,但支持BMP。
(3)百度站内搜索项目的核心搜索技术来自百度。
(4)百度站内搜索项目支持的功能包括:搜索提示、关键词屏蔽、智能置顶等,但不支持相关推荐,相关推荐是百度推荐的功能。
(5)百度站内搜索项目为合作网站提供站内搜索核心技术支持。
(6)百度分享可以带来的好处包括:给网站带来回访流量,提升网站倍Baiduspider抓取的速度,在百度搜索结果中展示网站分享量,但是不能提高站点评分。
10 百度站长平台的注册、验证及客户端、百度站长学院
(1)百度站长平台支持的验证您的网站的方式有:文件验证、html标签验证、CNAME验证。
(2)在百度站长平台完善您的联系方式,需要填写:手机号、邮箱、QQ号,微信号是非必须的。
(3)百度站长平台目前已经上线了IOS版本的APP(截止到2014年年末)。
(4)百度站长平台站长学院目前提供了五大官方课程内容,分别是:百度搜索引擎工作原理、网站建设、内容建设、网站优化、无线搜索。
评论(0人参与,0条评论)
发布评论
最新评论