或者

关于文章原创度的一些观点和看法

作者:微笑 浏览:190 发布时间:2018-03-01
分享 评论 0

通常来说,网站收录减少,很有可能是因为站内文章原创度不高造成的,自从百度推出原创计划之后,网站内容的原创度对于网站排名的影响变得越来越重要,可是原创的内容毕竟很少,而且创作起来也非常困难,所以很多人开始对内容进行少许的创新,使之能够更好的满足SEO优化需求,其中最为常见的方法就是伪原创。


一般来说,伪原创达到70%左右,在百度算法中就能被默认为原创文章,然后在这些内容中适当增加一些关键词,就能够作为很好的原创文章来使用,那么这样针对这种SEO文章如何编辑才能够更好的发挥优化效果呢?


总有人在说自己的文章被抄袭,然后抄袭者收录了,自己的却没有被收录,我曾经我也这样想,甚至我使用屏蔽右键、屏蔽复制等手段来克制抄袭者的恶意竞争行为,对此,我今天我有不同的看法,也有不同的观点。


1、未收录不代表未抓取


确实,为了SEO的发展,自己辛辛苦苦写了两篇原创文章,被一个大型网站抄袭秒收录,而自己的站点却不收录,这是一件非常让人尴尬的事情,那么真的不收录,就不是原创了吗?


很多朋友是这样认为的,自己的文章没有被收录,而抄袭者的却收录了,所以百度判断自己抄袭了别人的文章,所以自己权重也就一直上不来,排名一直没有,其实这是一个错误的观点,我曾在百度排名规则的文章中提到,百度收录是需要经过抓取、识别、释放这三个流程,其中在释放的流程中,需要判断整体网站的质量,当整体网站质量过关,收录相对较快,当整体网站信誉度没有达到百度的标准,百度将会暂时保留你的文章,不被释放出来。


不被释放出来,但是已经经过了抓取和识别这两个流程,在这里特别的说一下抓取的流程,当网站建立以后,提交到搜索引擎,搜索引擎基本每天都会来抓取,大家可以试着安装百度云加速后台可以统计出抓取的页面,如果抓取不够,也可以在百度站长平台中设置抓取频率和sitemap自动推送,这样抓取的是完全没有压力,设置方法如下:


打开【百度站长平台】点击左侧导航【我的网站】-【站点管理】-【添加网站】-输入网站域名,根据自身条件验证网站。


然后点击左侧导航【页面抓取】-【链接管理】-提交方式选择【sitemap】,然后将自己的网站地图提交上去,更新时间更具你网站的更新时间来设置,比如网站每天更新一篇文章,那么就填写1天,论坛、门户可能添加的比较多。


另外,在把sitemap地图写到robots里面,抓取基本是完全没有问题,那么接下来就进入识别系统,每一个页面抓取了,就一定会进行识别对比,是否会出现重复,与互联网的内容重复度有多少,从而判断出页面的原创度,那么在已经判断出原创度的时候,再来谈收录,先收录谁不代表谁就是原创了!


2、为什么抄袭者的网站更容易收录?


那么还有一个问题来了,既然要抓取、识别、释放这么复杂的流程,为何抄袭我们网站的内容还先收录呢?这是大家很纠结的这个问题,我也纠结了很久,直到有一天,我自己做了一个平台,每天让自媒体人发布非常原创内容的时候,我才总结出来,为何越抄袭越容易收录!


在谈论抄袭者网站为何会收录块的时候,我觉得咱们先要搞清楚新闻内容是收录流程,新闻内容相对普通的内容收录较快,因为新闻内容具有时效性,所以必须当场发当场收录,然后释放出来,不然拖到第二天在收录的话,这个新闻可能不热了,关注的人也就少了,百度从而失去了这个体验。


而抄袭者的网站与新闻内容类似,通常抄袭者的网站是抄袭过多篇文章,其中有直接抄袭原创者,也就抄袭二手文章,抄来抄去,互联网同样的文章就非常多了,当一篇文章被互联网多次抄袭,这就意味着这篇文章比较热门,不热门怎么会这么多人抄袭呢?最终就出现了一个热点效应,收录的门槛也就降低了,所以就出现了抄袭者抄袭了你的文章,比你还先收录。


3、如何判断文章的原创度?


并不是你网站有文章,是你自己写的,就一定会被搜索引擎认为这是一篇原创文章,因为其中还有很多技术方面的问题,搜索引擎还未能解决。


记得我曾经在一个网站每天更新一篇文章,一篇文章的字数只有100字左右,但是文章页面非常简单,简单到整个页面没有JS、CSS、HTML代码,只有文字,但收录却非常好,而有一些网站,用JS、CSS、html代码把网站修饰的非常漂亮,但是发布的文章却不收录,这让我开始觉得代码与原创度有直接关系。


我忘记了,在哪里看到过这样的一句话 搜索引擎只能识别200KB以内的内容 ,对于一个网站而言,200KB算是很大了,博客只有30KB左右,所以博客在搜索引擎中抓取是完全没有压力,如果你的网站有超过200KB,我觉得你是应该要优化了。


这和网站的文件大小有什么关系呢?好,我们来看看,搜索引擎在抓取一个页面的流程是从头到底,任何一个页面都有一个共同点,那就是头部一样、底部一样,唯一不一样的就是文章内容,那么搜索引擎在抓取头部有10KB左右是一模一样的,到中部文字的时候只有2KB是不一样的,而底部又有10KB是一模一样的,那么还会认为这是原创文章吗?


这里还得给大家灌输一个理念,那就是搜索引擎是不认识字的,他只有把这个汉字放到他的数据库去对比,当一对比一个新文章页面的时候,总共22KB的页面,居然有20KB一模一样,就算是写了原创文章,也会被列入到伪原创的列表中去。


经过我3年的SEO优化加测试,我对原创文章的判断得出了这样的一个理论,当一个页面比较大的时候,一个页面的不同点至少占页面的1/3,那么写多少文字呢?比如你页面有10KB,那么至少的写3KB的文字,剩下的7KB相同,这些才不容易被列入到伪原创的列表中,当然,这是我个人得出的理论,并没有完全的证据和理论来证明。


4、按照百度算法把握原创关键点


网站的要害前提是高质量的内容,内容在规划时要剖析要害字和摆设要害字,对文章进行整篇筹划,融入SEO思维,所以要害词在进行摆设时就需求很多的内容,网站编纂就需求先撰写好文章,并嵌入要害字,把主要害字或许要害字摆设好。


网站内容是查找引擎调查网站主题的主要路子,所以案读写作变得尤为主要,我们写文章的时候一定要把握几个关键词点:首页你要明白自己网站的文章是写给谁看的?用户喜欢什么文章和内容?再是文章中的关键词是什么?要害词是什么?然后用户需要搜索哪些词?用户比较关注的是那么词和自己网站相关,最后用户能否可以经过我的文章调查到其他相关内容,进一步吸引和引导我们的用户。


5、用写作细节提高网站内容的质量


比如我们用一个案例说明 什么是SEO 的文章在篡写时,文章的题目起首该当包括 什么是** 或许 ** 这个要害词,文章题目的权重最高,单个题目比拟长的,建议在前6个字中很好的嵌入要害字,其次是在文中的第一段和小题目以及文章平分别呈现,并要求天然,查找引擎关于文章中第一段的内容是比拟注重的。


我们也以为第一段是整篇文章中的主要部分,所以在写作时要留意第一段的写作,很多网站编纂在转载文章时也大多是经过修正第一段内容和做伪原创的,所以在第一段前200个字符中必需包括 什么是搜索引擎优化 这个要害词,而且在文章中恰当凸起这个要害词,但不要要故意聚积,而是天然的显示,特殊是文章小题目中呈现要害词,由于我们凡间将小题目的文本加粗,查找引擎对加粗的文本是比拟注重的(目前的说法是加粗的做法起的效果不大了)。


我们在写作时,不只要思索到要害词的地位、结构,更主要的是要思索文章的可读性,在优化文本内容的还不要为了SEO而疏忽了用户,让文章具有较好的可读性,给查找引擎和用户供应高质量内容才是SEO的中心思维。


我们在写作时分要思索到用户的体验方法,将主要的文本内容链接到响应的页面,愈加便于读者的体验,而且利于SEO的网站内链要求,指导拜访者经过文章中呈现的要害词进入某个详细的页面,而且让查找引擎经过链接锚文本调查你所链接页面的意义,例如针对 什么是搜索引擎优化 这个要害词进行写作,我们需求在文中呈现 什么是搜索引擎优化 等要害词的时分链接到我们详细页面,来进步转换率,这是SEO写作时需求思索的,只要掌握了这样的用户心理个百度引擎的方法,才能写出 粘性 的文章,才能更好的把握我的网站关键词排名。


6、如何写高伪原创的文章?


由于很多站长不是专业的写文章的,对于写文章没什么耐性,通常都是把人家的文章拿过来,将第一段和最后一段简单的修改一下就发布了,其实现在的百度算法是可以识别这样粗糙的伪原创的,那如果在自己文笔不太好的情况下,如何来写一些高伪原创的文章呢?


(1)、标题一定要修改


百度在收录文章的时候如果发现标题和其它的标题有相似的地方,是很难收录的,因为百度收录也是先从标题开始的,如果他不收录你的标题,内容是很难收录的。


(2)、首段一定要修改


网上很多的文章都是从别人那里copy过来的,所以我们在写伪原创的时候第一段一定要修改,有的朋友说不知道怎么修改,其它我也不太清楚,但相信你把内容看一下,大概的意思知道了,然后用自己的话给表达出来,估计你的内容和别人肯定不一样了。


(3)、适当有加关键字


在网页中适当的加一些关键字,然后在关键字里面加上一些链接相信这样的内容对提高伪原创也是很有帮助的。


(4)、改版段落的位置


网上很多的文章他多有第一,第二,这样的段落他们都是平等的,如果把这些段落的位置换一下,然后把里面的内容再简单的修改一下,相信也是一种伪原创的方法。


(5)、结尾也要修改


最后一段的内容也要修改一下,怎么修改呢?和第一段相同,把正个文章从头到尾看一下,然后用自己的话给他一个总结,相信他的伪原创性也是很高的。


7、防止抄袭最好的办法


对于防止抄袭的方法,什么禁止右键、禁止复制这些方法都弱爆了,对方要抄袭、要采集,你这么点技术禁止,对他来说是完全没有作用,况且人家采集是直接从代码中采集,并非实际来到了你的网站,而且还会让你的读者觉得你网站体验就严重问题,所以,我非常不建议使用这些方法来禁止抄袭者,我也是这方面的过来人,现在我是用这些方法来对策的。


当我今天把文章写出来后,不管是否收录明天将会把文章通过投稿的形式发布出去,通过投稿的形式,对方会完全的尊重并且保留你的版权,即使没有留下链接版权,至少也会留下品牌词的版权。


投稿成功以后,当抄袭者在此抄袭这篇文章的时候,互联网已经有很多此文章了,第一他会觉得互联网文章太多,不会再次抄袭了,因为他想抄原创文章,第二就算他抄袭了,互联网你投了这么多文章,最终公认的版权是你的,并且多个页面有URL直接指向你的页面,这也是给你这篇文章做了一个最好的外链。


其实,对于抄袭者并不是很可怕,对我们来说,应该是一件好事情,当他们抄习惯了,自然会帮我们做到推广的作用。