从网站目录到框架结构的内部优化深度剖析
网站目录结构优化
网站的目录结构层次不宜太深,扁平的单一层次结构是较为理想的状态http://www.yixiin.com/spread/。但这个对于某些网站来说不现实,但目录层次也最好不要超过三层。假如一个网站,它的目录结构是这样的,XXX/sports/football/china/CSL/club/hengda,我要是爬虫,在爬这个网站的时候肯定会想,“坑爹呢,无底洞呢这是,不爬了不爬了”。所以,网站的目录层次一定要尽量扁平。那么怎样解决这个问题呢,有个办法就是使用二级甚至三级域名,比如前面说的目录结构可以简化为hengda.XXX.xxx,但前提是你的这个目录下面首先得有足够丰富的内容,如果没有,最好先使用目录结构,只是将其精简。
网站代码优化
首先,网站的代码要尽量简洁,剔除掉无用的代码,能合并的代码尽量合并在一起。同时,CSS文件、js文件与网页文件分开存放,在网页代码中调用。
代码优化有几个好处:一是能减小文件的体积,加快访问速度;二是对搜索引擎更加友好,避免让它爬行无用的代码;三是可以让代码的维护更加方便。
关键词优化
关键词的优化涉及到关键词的选取与关键词的密度以及关键词的分布。
每个网页的关键词不要选取太多,两三个就合适了;确定的关键词应当契合你页面主题,否则读者点进去发现得不到他们想要的,会很快退出,带来的只是垃圾流量;应当注重使用长尾关键词,注重长尾和尖头的运用;关键词的密度不能太大,通常认为6%左右较为适宜,切忌关键词堆砌;关键词要合理分布在网页标题、meta标签、以及页面内容中。
网站链接优化
网站链接优化主要有以下几点:做好内部链接,适当的导出链接,使用好锚文本。
检查内部链接,消除断链、死链;做好网页之间的相互链接,将网站中的相关内容合理的链接起来;最好为搜索引擎制作一份网站地图,有利于蜘蛛对网站的爬取;使用好锚链文本,使用与链接到页面主题高度相关的文本,避免使用图片或者js;使用好“nofollow”属性,避免让蜘蛛爬去你不希望爬去的页面;适当的导出链接,一个完全没有导出链接的站也是不受搜索引擎欢迎的。
网页标签优化
这里主要注意以下几个重要的标签。
title标签,页面的标题应当突出页面的主题,尽量不要使用过多的文字。
meta元标签,这里主要有keyword以及description,keyword中使用页面的关键词;description中,做好对页面内容的描述,尽量做到简洁明了,突出主题,没有必要在其中使用大量的关键词。
虽说现在的搜索引擎已经不怎么看重这几个标签了,但你的标题、描述具有足够的吸引力时,也会吸引用户来到你的网站,所以这几个标签仍需用心去写。
strong、h1、h2…这类标签用于强调关键词,能够让搜索引擎知道你的重点是什么。
noframes标签,框架结构是不受搜索引擎欢迎的,这个标签有可能一定程度上解决爬虫爬取框架页面的问题,但也不一定保证爬虫能正常爬取。所以,尽量避免在网页中使用框架结构。
网站图片、flash优化
搜索引擎只能读取文本内容,不能识别图片和flash。对于图片,可以使用alt属性为图片添加描述信息,让搜索引擎能够读懂,可以适当包含页面的关键词,同时,当图片不能访问时,alt的描述内容可以显示在页面上,可以方便访问者理解网页内容。
flash页面能够有非常华丽的展示效果,但搜索引擎去不理会它,所以,对于要做SEO的网站,尽量避免使用全站flash,如果非得使用,也最好添加与之匹配的文字网站,供搜索引擎读取。
http://www.yixiin.com/news/