Zone Indexes算法,是一种对网页进行区域划分并分别给予权重的搜索引擎算法。搜索引擎会结合这种算法和其他消噪技术,如VIPS算法,对一个网站中的内容进行“消噪”,并对每一块区域赋予权重,从而展现网页中真正有价值的内容。
正如在上一篇关于搜索引擎算法的文章《TF-IDF算法在SEO优化中的衍生应用》所述的那样。本博是以SEO为主题,涉及IR领域只是为了让大家更好的了解搜索引擎,从而达到改善网站优化效果的目的。所以本文还是用浅显易懂的语言来介绍Zone Indexes在搜索引擎优化领域的衍生应用。http://www.yixiin.com/photo/
Zone Indexes算法SEO定义
Zone Indexes算法,我们暂且翻译它为“分区索引”算法(IR领域的大牛欢迎指正翻译错误),是一种在网站标准化中结构层面对网站或网页进行分区划分,再对每一区域赋予权重的算法。我们用一个简单的例子来理解这个算法,假设一个网页中只含有三块内容,即标题、描述、内容文本;同时假设搜索引擎对着三块区域所赋予的权重为0.3、0.1和0.6分:
标题:0.3分
描述:0.1分
内容:0.6分
现在我们做为一个用户,在搜索引擎中键入“布尔 算法”,以本篇文章为例,它得到的权重为:
标题:“Zone Indexes算法与网站权重划分”,出现“算法”1次,得0.15分
描述:Zone Indexes,是一种对网页进行区域划分并分别给予权重的搜索引擎算法……,出现“算法”1次,得0.01分
内容:现在我们做为一个用户,在搜索引擎中键入“布尔 算法”,以本篇文章为例……出现“布尔 AND算法”得0.6分
总计:0.76分
即,我这篇文章是将Zone Indexes算法而非布尔算法,但因为“算法”一词符合了搜索要求,在没有其他权重因素影响的情况下,这篇文章仍然跟索引词有关,应该出现在搜索结果中。
然而,搜索引擎对Zone Indexes算法的应用远非这么简单—它是以一个网页为单位进行区分的。
结构层面,是指构成网站的html语言。如我们在做SEO工作时经常会用到的h1-h4、strong、a、img标签等。搜索引擎是可以看到并分析这些标签的。而这些标签也告诉了搜索引擎某一个网站中内容直接的关系。
我们知道,一个普通的网站,至少拥有以下区域:
header头部区域http://www.yixiin.com/news/
content内容区域
footer页脚区域
再复杂一些的网站,会拥有以下区域:
nav导航区域
sidebar边栏区域
comments评论区域
link友链区域
大型网站的内部构造就更为复杂。与VIPS对视觉上噪音区域区分不同的是,Zone Indexes是在结构方面对网站进行消噪,比如:
content是最重要的区域,一般在div中被标为content的区域,是搜索引擎赋予权重最高的区域。header其次,因为该部分拥有标题和描述,而这些内容也是对索引网站有至关重要的作用的。
nav导航、sidebar边栏一般而言则不是那么重要,而footer页脚、comments评论区域一般则是噪音区域(还有link友链和ad广告等等)。
在HTML5中,这种基于语义的网站结构被进一步加强,我们知道html5中已经直接支持article、audio、body、footer等标签。
Zone Indexes算法SEO实例
这里我们看一个利用Zone Indexes算法对网站进行SEO的例子,案例来自于大名鼎鼎的雅虎(这个例子也是很多SEO高手在分析网站结构是喜欢举的例子)。
我们打开这个网站,然后查看其源代码,在接近页脚处,我们发现这么一段代码:
对于搜索引擎而言,它们将网站按区域进行划分后,需要决定哪部分是重要的而那部分是不重要的,然后给相应的区域赋予权重。除了上文中说的通过id或class进行划分外,它们还会结合采取“文本代码比”的方式。因为在某种情况下,即使在页脚的内容,也不见得不重要。
因为写作和程序的原因,如果在一段内容中,文字+图片远远大于代码,则可以认定这块内容是重要的。反之,如果代码内容大于文字+图片,那么这块内容就是不重要的。
这很合情合理且符合逻辑和实际,不是吗?
雅虎在标记related区域的时候,上面的区域是描述,下面的区域是链接。如何能让下面的区域不被搜索引擎认为是“噪音区”且不重要,然后被丢弃呢?雅虎的办法是加入一个“related”区域,即相关推荐区,将上下区域联系起来,然后把yat-pseo-foot做为一个整体内容,让搜索引擎去抓取并收录。避免了搜索引擎的“消噪”处理。
在了解以上基于Zone Indexes算法的SEO实例后,我们还需要学习一个SEO的技巧就是:不要在你想突出的位置加入太多的HTML代码,以防文本代码比出现问题而被搜索引擎判定为噪音区。比如那种满屏都是链接的“正文”以及锚链接的“页脚”。
通过Zone Indexes算法,我们可以了解搜索引擎对网站区域划分和权重赋予的一些基本知识;利用这些知识,可以帮助我们突出网站核心内容,降低搜索引擎对网站噪音区的判定。而这些算法和知识,再次突出了网站内部结构的重要性。