网页相似度是指不同两个网页之间相同部分的代码字节数占两个网页总字节数的百分比,顾名思义就是不同网页的相似程度,如果你的网站了其他网站的文章,那么可以说你这个网页和之前原创文章的网页是“相似”的SEO鼓励原创内容,目的就是避免出现太多相似文章。如果你网站里的网页与网上其他网页有着较高的相似度,那么权重应该不会太高的。http://www.yixiin.com/ad/
同样的,在同一个网站里,不同的页面也会存在相似度问题,这个也是应该注意的。不知道大家在查询自己网站收录情况的时候有没有遇到过这样的一句话:“提示:为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果。”可见搜索引擎是很在意网页相似度的。我们在进行网站整体结构优化的时候,就要注意尽量使网页相似度降到最小。
一般不同网页间的相似度在60%左右是可以被接受的,因为每个网页之间必然存在相同的部分,比如导航菜单、比如版权信息等,我们不可能每一页的导航和版权信息都写的不同。那么我们要降低网页相似度,就要尽可能的减少网页中的相同部分,尽可能增加网页中不同的部分。
下面我们先从一些细节方面来说说,怎么减少不同网页之前相同的部分。
首先观察一下你所有网页公共部分的代码,将其中的广告代码都采用JS调用,将网页CSS样式采用外联的方式,将大大节省这些代码的长度,也就是减少了网页相似度的分子,此外,公共部分中有哪些不重要的东西,尽可能去掉它们,举个简单的例子,大多数朋友网站的文章页底部都有PoweredbyXXXCMS以及备-案号这些东西,其实这些只在首页显示就行了,至于内容页面,能省的就省吧,看看百度知道或百度贴吧的内容页,人家底部多简洁…… http://www.yixiin.com/news/
除了减少不同网页的公共部分代码,最重要的方面还是要增加不同的部分,如果条件允许的话,能开启内容页的评论功能最好了,因为不同的内容,网友所写的评论肯定是不同的,不过因为众所周知的原因,评论功能不是每个站长都敢开启的。不同的网页都有它们唯一的一些标识,比如文章的ID,每篇文章的ID肯定是不同的,那么设想一下,如果我们在内容页里都加上