银汉孤星问:
该怎么查看bd蜘蛛来过我的网站 ?该怎么去查网站日记 ?要申述。
zwj_1002 的奉复:
你把IIS日记从空间下到本地,而后用文本工具敞开;
2010-05-14 15:52:03 W3SVC1 121。187。5。143 GET /category-8-b0-min1100-max2200.html - 80 - 220.181.7.74 Baiduspider+(+baidu/search/spider.htm) 200 0 0
剖析下 200 0 0组成局部 sc-status(协议面貌) sc-substatus(协议子面貌) sc-win32-status(Win32面貌码)
sc-status(协议面貌): 200 连署成功
sc-substatus(协议子面貌) :0 成功
sc-win32-status(Win32面貌码):0 代表抓取成功并带次数据库 ; 64 指定的网络名不再可用
1: 在这个过访记录里面121.187.5.143是你服务器的IP地址,220.181.7.74 是bd蜘蛛的IP,/category-8-b0-min1100-max2200.html 为蜘蛛过访你的页面 80是端口 GET是敞开形式 W3SVC1是记录的文件夹,这搭申说,bd蜘蛛已情节访了你的category-8-b0-min1100-max2200.html 这个页面,那么最关紧的是最终面的这个参变量200 0 0。
2、200 0 0 成功过访该页面,0代表抓取成功并带次数据库。这个时分你就放心了,这个页面已经被bd收录,不过还没有开释出来,bd更新时就可能开释出来。
3:200 0 64 网络上传流着如此三种讲解第一:64为K站的先兆。第二64的出现只是64位操作系统。第三:网络不可达,因为某种端由无法纯粹敞开页面,还是网络不定这些端由,以致蜘蛛无法带回页面还是说不抓取该页面,所以200 0 64的讲解也应当为:过访了该页面,但并没有任何抓取也没有带次数据库。这种端由多为空间不定、服务器不定。
4:304 0 0这个回返码代表蜘蛛过访的页面没有更新,和他之前来的时分是同样的,所以看见这个不要担心,蜘蛛来过,只然而你没有更新,所以他也不愿意带走这个页面。
5:404 0 0这个是代表404页面,不过有个很严重的问题,这个回返码奉告我们,蜘蛛莅临了404页面并把他带走了,解体~~~~,要是这么的话基本上你要背兴了,要你有太多的404,那么蜘蛛便会不断是抓取,不断的带走,这么会导致无数的重复页面,终极以致K站还是降权,不错的回返骂是404 0 64 这就代表蜘蛛没有抓取你这个页面。
6:500不对500不对是服务器内部不对,是由手续的不对导致的,我不懂手续,不过500不对是会给你减分的,这点基本的逻辑都可以想的到,要发现500不对,马上查看是哪个页面的,而后去修正以下不对吧!
7:302要在日记中发现302的回返码也是需要注意的,302为临时重定向,要你是长期的将这个页面重定向到另一个页面,麻烦你使役301永久重定向,要是302的话bd蜘蛛下次来还会过访这个页面,这么又会导致复制大量页面的问题,结果肯定是K,所以,插空查缉以下。
陈中平的奉复:
每个网络蜘蛛都有自个儿的名称,在抓取网页的时分,都会向网站标明自个儿的身份。网络蜘蛛在抓取网页的时分会发送一个烦请,这个烦请中就有一个字段为User-agent,用于标识此网络蜘蛛的身份。例如Google网络蜘蛛的标识为GoogleBot,Baidu网络蜘蛛的标识为BaiDuSpider,Yahoo网络蜘蛛的标识为Inktomi Slurp。假如在网站上有过访日记记录,网站管理员就能晓得,哪些搜引得擎的网络蜘蛛过来过,啥子时分过来的,以及读了若干数据等等。
经过ftp,查看见后台有一个包含“log”的文件。这个文件就是日记。经过查看日记中是否有baiduspider的脚迹。有baiduspider就申说bd蜘蛛来过网站。
小刀SEO 的奉复:
网站日记普通储存在虚拟主机的logfiles文件夹下,可以经过FTP工具将网站日记下载下来,经过txt文档形式查看。