什么是死链接?
简单地讲,死链接指原来正常,后来失效的链接。死链接发送请求时,服务器返回404错误页面。
这些情况下出现死链:
动态链接在数据库不再支持的条件下,变成死链接。http://www.yixiin.com/news/
某个文件或网页移动了位置,导致指向它的链接变成死链接。
网页内容更新并换成其他的链接,原来的链接变成死链接。
网站服务器设置错误。
从用户的角度来看,死链接和错误链接的表现是一样的,所以一般我们并不需要区别死链接和错误链接。
作为 SEO 人员或网站管理员,我们要避免网站出现死链接,因为从死链接的多少可以评价一个网站的权威性。
检查网站有死链接怎么办?
办法是:找到死链接所在的位置,去除掉。
简单讲,死链接指返回不存在页面或错误页面的链接。详细了解,请点击:什么是死链接?
怎么知道网站上有死链接?
我们强力推荐两款可以查找死链接的工具:
Google网站管理员工具,可以找出Google收录的网页上的死链接总个数以及链接形式。简洁明了。但只能对经过验证的网站进行检查。
Xenu-死链接检测工具,一个需要安装的客户端软件,可以对所有网站进行马上检查。检查结果数据报告非常详细。
检查网站有死链接,怎么找到这些死链接的位置并删除或改正?
以上介绍的Xenu-死链接检测工具把死链接所在的网页地址也提供了,可以很方便通过这个工具纠错。但如果你的站点死链接很多且有规律,不妨考虑一下采用robots.txt 文件把一些链接屏蔽(建议高端用户尝试)。
robots.txt文件有什么必要?
什么是robots.txt文件?
搜索引擎机器人通过链接抵达互联网上的每个网页,并抓取网页信息。搜索引擎机器人在访问一个网站时,会首先检查该网站的根目录下是否有一个叫做robots.txt的纯文本文件。当我们的网站有一些内容不想被搜索引擎收录,我们可以通过设置robots.txt文件告知搜索引擎机器人。
如果网站上没有禁止搜索引擎收录的内容,则不用设置robots.txt文件,或设置为空。
从SEO的角度,robots.txt文件是一定要设置的,原因:
网站上经常存在这种情况:不同的链接指向相似的网页内容。这不符合SEO上讲的“网页内容互异性原则”。采用robots.txt文件可以屏蔽掉次要的链接。
网站改版或URL重写优化时原来不符合搜索引擎友好的链接需要全部屏蔽掉。采用robots.txt文件删除旧的链接符合搜索引擎友好。
一些没有关键词的页面,比如本站的这个页面屏蔽掉更好。
一般情况下,站内的搜索结果页面屏蔽掉更好。http://www.yixiin.com/photo/
如何替换请求URL中的文字
以下解决方案,仅适用于Apache服务器。
在.htaccess文件中添加以下语句:
RewriteCond %{REQUEST_URL} "string1"
RewriteRule "(.*)"string1(.*)" "$1string2$2" [N,PT]
例如当客户端发出请求URL:example.com/string1/abcstring1.html,则转换为目标URL:example.com/string2/abcstring2.html。其中[N]标记告诉Apache重新执行重写规则,直到RewriteCond失效为止。只要请求URL中包含需要替换的字符串,它就会一直重复地执行。当所有的string1都被替换完毕,则RewriteCond失效。本例子中,RewriteCond执行了2次。[PT]告诉mod_rewrite把重写的URL传送到Apache来进行接下来的处理工作。
我们都知道,关键字是否在URL中对于网站SEO至关重要。对于建站初期不注重SEO的站点,特别是大型站点,本功能真是雪中送炭。
注意:使用本功能时,有时会把非目标字符也做了修改,假如例子中的“abcstring1”不是目标字符,但这个功能也会替换了它。
当然,你或许可以通过这个功能获得另外的启发:改版时,如何保留原链接,创建新的URL?
404页面该怎么做?
404页面的目的是:告诉浏览者其所请求的页面不存在或链接错误,同时引导用户使用网站其他页面而不是关闭窗口离开。
很多开源系统包括CMS系统、Blog系统等不提供404页面或提供的404页面并未达到SEO的要求,这让网站的权威性大打折扣。
404页面该达到怎么样的效果才符合SEO要求?
搜索引擎通过HTTP状态码来识别网页的状态。当搜索引擎获得了一个错误链接时,网站应该返回404状态码,告诉搜索引擎放弃对该链接的索引。而如果返回200或302状态码,搜索引擎就会为该链接建立索引,这导致大量不同的链接指向了相同的网页内容。结果是,搜索引擎对该网站的信任度大幅降低。——很多网站存在这个问题:404页面返回的是200或302状态码而不是404状态码。
正确建立404页面的方法是:(仅适合Apache服务器)
在.htaccess 文件中加入代码: Errordocument 404 /Error.html
建立一个简单的html404页面命名 Error.html
把 Error.html放置在网站根目录
如果碰到困难,参考本站:错误网页、SEO十万个为什么的.htaccess文件。
注意:
不要将404错误直接转向到网站首页,这将导致首页不被收录;
/Error.html 前面不要带主域名,否则返回的状态码是302或200状态码。
对404页面有其他疑问?进入论坛讨论:关于404页面
Xenu-死链接检测工具
Xenu 是一款深受业界好评,并被广泛使用的死链接检测工具。
时常检测网站并排除死链接,对网站的 SEO 非常重要,因为大量死链接存在会降低用户和搜索引擎对网站的信任。
我们推荐的死链接检测工具 Xenu 主要具有以下特征:
需要下载安装,不到1M大小,用户界面非常简洁,操作简单。
检测彻底:能够检测到图片、框架、插件、背景、样式表、脚本和 java 程序中的链接。
报告形式合理多样,死链接一目了然。
提供出现死链接的网页,方便扫除导出链接错误。
能够侦测重定向URL
可以选择是否侦测站外链接。
对于小型简单网站,可以用来制作HTML格式网站地图。