目录结构和URL
URL是统一资源定位,即每个网页的网址、路径。网站文件的目录结构直接体现于URL。清晰简短的目录结构和规范的命名不仅有利于用户体验和网址传播,更是搜索引擎友好的体现。
目录层次:
对于一个小型网站来说,一般只有一层子目录,如下:
是域名,home是一级目录名,page是文件名。
对搜索引擎而言,这种单一的目录结构最为理想,即扁平结构(Flat)。
而对规模大一些的网站,往往需要二到三层子目录。象这样:
搜索引擎还是会去抓取二到三层子目录下的文件,但最好不要超过3层,如果超过4层,象以下这个页面,搜索引擎就很难去搜索它了:
当然,以下情况下,即使深入第四层甚至更深层次的页面,也同样能被搜索到:
1、如果该页**了重要内容,有大量来自其它网站的外部链接(Inbound links);
2、如果在首页上增加一个该页的链接,可以通过首页直接到达,搜索Spider还是可以轻易地找到它;
3、如果有其它网站在顶级页面上链接了该页,其效果就好似你在自己的首页上做了该链接。
此外,图形、脚本、CGI-BIN和CSS样式表则各自建立专门的目录收入其中,一般不放在根目录下。
目录和文件命名:
根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键词。但如果是关键词组,则需要用分隔符分开。我们常用连字符-和下划线_进行分隔,URL中还经常出现空格码%20。因此,如果以中国制造作文件名,就可能出现以下三种分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
但事实上,至少在目前Google并不认同_为分隔符。对Google来说, made-in-china和made%20in%20china都等于made in china,但made_in_china就被读成了madeinchina,连在一起之后,关键词就失去了意义。
因此,目录和文件名称如果有关键词组,要用连字符-而不是下划线_进行分隔。
URL应该越短越好。有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目录结构。由于URL中含有关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。
绝对URL和相对URL:
绝对URL:即网页路径使用包含顶级域名在内的完整的URL。
如:/page1/index.html是一个绝对路径,其中/page1/index.html则为相对路径,由浏览器自动在该链接前加上。
总体上,Google在排名时并不在意URL使用的是相对路径还是绝对路径。 动态URL: 目前很多网站都有数据库驱动生成的URL,即动态URL,往往表现为在URL中出现?、=、%,以及&、$等字符。动态URL极不利于搜索引擎抓取网页,严重影响网站排名,通常是通过技术解决方案将动态URL转化成静态的URL形式,如:
将 转化为 下文将会专门提到动态URL的解决方案。
导航结构
网站导航是对引导用户访问网站的的栏目、菜单、在线帮助、布局结构等形式的统称。其主要功能在于引导用户方便地访问网站内容,是评价网站专业度、可用度的重要指标。同时对搜索引擎也产生诸多提示作用。概括地讲,网站在导航方面应注意以下几点:
1、主导航醒目清晰
主导航一般体现为一级目录,通过它们用户和蜘蛛程序都可以层层深入访问到网站所有重要内容。因此主栏目必须在网站首页第一屏的醒目位置体现,并最好采用文本链接而不是图片。
2、面包屑型(Breadcrumbs)路径
所谓面包屑是比喻用户通过主导航到目标网页的访问过程中的路径提示,使用户了解所处网站中的位置而不至于迷失方向,并方便回到上级页面和起点。路径中的每个栏目最好添加链接。
如下: 网信设计: 网信日志 > 技术资讯 > 网络营销
即使没有详细的路径来源,也至少应该在每个子页面提示回首页的链接,包括页面的LOGO作链接。
3、首页突出重要内容
除了主栏目,还应该将次级目录中的重要内容以链接的方式在首页或其它子页中多次呈现,以突出重点。搜索引擎会对这种一站内多次出现的链接给予充分重视,对网页级别(PageRank)提高有很大帮助,这也是每个网站首页的网页级别一般高于其它页面级别的重要因素,因为每个子页都对首页进行了链接。
4、使用网站地图
网站地图(Site Map)是辅助导航的手段,最初是为用户设计,以方便用户快捷到达目标页。良好的网站地图设计常常以网站拓扑结构体现复杂的目录关系,具有静态、直观、扁平、简单的特点。多采用文本链接,不用或少用修饰性图片,以加快页面加载速度。以上特点符合搜索引擎友好的要求,因此网站地图在SEO中也有重要的意义。尤其对于那些采用图片导航和动态技术生成的网页,通过在网站地图中进行文本链接,可在一定程度上弥补蜘蛛程序无法识别图片和**页造成的页面不可见的风险。
需要注意,网站地图也要突出重点,尽量给出主干性内容及链接,而不是所有细枝末节。一页内不适宜放太多链接。Google明确提出如果网站地图上的链接超过大约 100 个,则最好将网站地图拆成多个网页。
框架结构
框架结构,即帧结构(frame)网页表现为一个页面内的某一块保持固定,其它部分信息可以通过滚动条上下或左右移动显示,如左边菜单固定,正文信息可移动,或者顶部导航和LOGO部分保持固定,其它部分上下或左右移动。我们的邮箱通常都采用框架建构。框架型网页的另一个表现是,深层页面的域名通常不会在URL中体现出来,即使进入深层子页面,浏览器显示出来的URL仍然是主页的URL。
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用Noframes标签进行优化,把Noframe标签看做是一个普通文本内容的主页。在区域中包含指向frame页的链接以及带有关键词的描述文本,同时在框架以外的区域也出现关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
图像优化
一般而言,搜索引擎只识读文本内容,对图像是不可见的。同时,图像文件直接延缓页面加载时间,如果超过20秒网站还不能加载,用户和搜索引擎极有可能离开你的网站。因此,除非你的网站内容是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片,更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的核心有两点:增加搜索引擎可见的文本描述,以及在保持图像质量的情况下尽量压缩图像的文件大小。
Alt属性:
每个图像标签中都有ALT属性,搜索引擎会读取该属性以了解图像的信息。因此,最好在所有插图的ALT属性中都有文字描述,并带上该页关键字在其中。
Gif和JPGE图像优化:
Alt属性和文本说明都只是对图像之外的文本环境进行优化,下面简单谈谈对图片本身的优化处理。对图片文件优化的目的是在尽量不影响图像画面效果的情况下,将其文件大小降到最低,以加快页面整体下载速度。
网页图片格式主要有GIF和JPGE两种形式。一般来讲,GIF适用于线图和企业标识;JPEG适宜照片元素的格式。主要通过减少GIF颜色数量、缩小图片尺寸和降低分辩率来缩小文件,也可以采用层叠样式表达到优化的目的。PhotoShop的版本越高越适用于网络图形。此外,将大图片切割成若干小图片于不同的表格区间内进行拼接,也可以相对加快下载时间。
FLASH优化:
由于FLASH优美的视觉效果和广阔的创意空间,FLASH技术在网页设计和网络广告中的应用非常广泛,很多网站首页甚至全部用FLASH设计。但FLASH网页有一个非常致命的问题,即大部分搜索引擎无法识别FLASH中的信息。Google也只能检索到部分Flash文件中的内嵌链接。
FLASH优化可以从以下三个方面来考虑:
1、做一个辅助HTML版本: 保留原有FLASH版本的同时,还可以设计一个HTML格式的版本,这样既可以保持动态美观效果,也可以让搜索引擎通过HTML版本的网页来发现网站。
2、将Flash内嵌HTML文件: 还可以通过改变网页结构进行弥补,即不要将整个网页都设计成Flash动画,而是将Flash内容嵌入到HTML文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从HTML代码中发现一些必要的信息,尤其是进入内容页面的链接。 即使首页全部动用了FLASH,也应该将进入内页的关键性按钮/链接置于FLASH文件之外,以独立纯文本链接的方式呈现。上文案例将中文版链接置于FLASH文件中,使得蜘蛛程序一无所获,无法抓取到内页信息。
3、付费登录搜索引擎: 如果FLASH网站错过了被免费的技术型搜索引擎自动检索的机会,或者搜索结果排名效果不太理想,可以通过付费登录或做搜索引擎关键词广告,同样被用户搜索到。