我们的网站质量算法的定位在于通过减少劣质内容的罗列,帮助人们找到“优质”网站。最近的“Panda“算法解决了通过算法来评估网站质量的艰巨任务。现在,我们希望解释一些推动我们算法开发的想法和研究。
以下是一些人们可以用来评估网页或文章“质量”的问题,http://www.yixiin.com/sitemap/index-htm-mid-5.html 这些问题也就是我们在编写用于评估网站质量的算法时所考虑的问题。这可以看做是我们对用户想法的猜测。
当然,我们不是在披露我们的算法中使用的实际排名信息,因为我们不希望人们去赌我们的搜索结果;但是如果你希望了解Google的思路,以下问题提供了一些有关我们如何看待这一问题的指导:
• 你是否相信此文章中提供的信息?
• 在你看来,此文章是由深谙主题的专家或爱好者所写,还是在性质上较为肤浅的文章?
• 此网站中是否有相同或相似主题的多余内容,只是关键词稍微有些变化?
• 你愿意向此网站提供你的信用卡信息吗?
• 文章是否有拼写、格式或事实错误?
• 文章主题是由网站读者的真实兴趣来主导,还是网站通过猜测可能在搜索引擎中排名较好的话题来确定?
• 文章是否提供原创内容、信息,原创报道,原创研究或原创分析?
• 与搜索结果中的其它网页相比,这个网页是否具有重大价值?
• 在内容方面有多少质量控制?
• 文章是否兼具描述事物的好坏两方面?
• 网站是否为其同主题网站方面的公认权威?
• 网站内容是否由许多创建者批量创建或外包创建的?或者由于网站网络巨大,单个网页或网站的关注度很低?
• 文章是经过精心编辑的,还是随意或匆忙创建的?
• 你是否相信此网站提供的健康相关的信息?
• 在看到这个网站名称时,你是否会视此网站为权威信息来源?
• 这篇文章是否提供关于主题的完整或全面的说明?
• 此文是否包含有深刻分析或不那么浅显的有趣信息?
• 对于这类网页,你是否希望添加到收藏夹,与朋友分享或向他人推荐?
• 这篇文章是否有过多分散注意力或干扰主要内容的广告?
• 你认为你会在纸质杂志、百科全书或书籍中读到本文吗?
• 此文章是否短小、没有实质内容,或者缺乏有帮助的具体内容?
• 此网页的制作属于非常关心和注意细节,还是不那么注意细节?
• 用户从此网站看到网页时会抱怨吗? http://www.yixiin.com/sell/jiajubaihuo-c122-1.html
http://www.yixiin.com/sell/shangyefuwu-c131-1.html
编写一个评估网页或网站质量的算法是更为艰巨的任务,但是我们希望以上问题提供了一些有关我们如何编写那些区分优质网站和劣质网站的算法的见解。