重复内容一直是网站管理员们热议的话题之一,而提到重复内容说得最多的就是搜索引擎不收,重复内容质量低,重复内容影响排名,重复内容会导致降权之类的。其实搜索引擎收录重复的内容吗?da安显而易见是肯定的。如果搜索引擎不收录重复内容,那就没有采集文章之说,不会有原创文章陆续被刷到了后面之说,也不会有投稿之说,更不会有百度原创计划之说。
其实互联网就是一张大网,而这个大网又分为不同的领域、不同的行业、不同的企业、不同的网站,而这些又组成了很多不同的小网,一篇文章在一个网里面有,不代表其它网里面也有,特别是一篇质量好、受众多、时效性强的文章应该存在于每一个网并得到好的对待,就相当于一本好书,出自美国,非常多人喜欢,那么就会有各个国家不同的出版社购买出版权,每个国家每个地区的人都可以看到并且可以非常好的去选择、购买,不需要一定去美国才能买到。
同样搜索引擎也会最大化的去传播好的内容,搜索引擎是服务绝大多数用户的,优质的内容需要绝大多数用户能看得到,如果你的网站权重很低,在搜索引擎没有好的排名,或者说抵不过别人部分匹配的,甚至根本没有收录,那么这篇好文章就只能被少数人看到,觉得部分有需求的却得不到满足。如果说搜索引擎只收录你网站这篇文章,其他站点转走的都不收录,那么能看到这篇文章的用户数量就会大打折扣,就算这篇文章排名很好,那也仅仅就这一篇,用户没有其他选择,你的网站卡得让你抓狂用户也只能看你的,这很明显是搜索引擎不愿意看到的,所以有必要收录在不同网的这篇文章,这样才能让绝大部分用户能根据自己的喜好选择不同的落地点来阅读这篇文章。
另一方面,不同网站的页面整体效果、网站布局、附加价值是不一样的,而在搜索引擎消噪过程主要是针对同一网站的页面,不同网站的差异性也造成了各个网站内容的差异性,这也是为什么建议在做伪原创的时候可以适当的给网页加噪。还有一点就是网站的一个权威度和对于搜索引擎的信任度,对于像新浪首页、腾讯新闻首页等这样的网站,搜索引擎信任度高,因为这样的网站本身就可以给绝大部分用户需求,所以重复又何妨?
稀缺与重复
稀缺主要是描述页面在互联网中的独特性。很多人觉得稀缺就等同于无重复,其实稀缺与重复对于搜索引擎来说根本就不矛盾,看看百度搜索引擎研发部给我们的解释:
某人发表了一篇针对某新闻事件的原创博客,随后被新浪转载到了新闻频道。从描述的内容上讲,这是一种重复。但这种重复仅仅是主体内容上的重复,一方面它的转载带来了访问速度、稳定性等方面的增益,并且之后的检索用户还有可能用“新闻事件新浪”来检索此新闻。这可以被称之为站点增益。因此即使主题内容没有任何变化,新浪的这次转载也是有价值的,其稀缺度也是较高的。
同样,反过来说,如果转载的网站相当不知名,则其无法带来站点名、稳定性、速度等的增益。更有甚者,转载之后在页面上加入大量广告妨碍阅读,或者只转载了内容中不完整的一部分,这样的转载,或者说采集,就是纯重复的,与采集源相比,就是没有检索价值的了。
所以对于主体内容重复的页面,我们应该评价其是否存在站点增益和内容增益,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低,才认为它是标准的重复。这就是为什么你的原创在别人那排名比你好的原因。
总而言之,搜索引擎是收录重复内容的,只是说随着收录重复内容量的不但增加,合格的附加价值也在增加,想要继续被收录就会变得更加困难,除非你能有更好的附加价值,所以搜索引擎对于重复内容的收录也是有上限的,价值越高的内容肯定上限越高,当重复收录量越接近这个上限,想被收录就越难,这就是之后再选择伪原创的原因,因为内容的改变加大了收录的可能。