一、通过百度蜘蛛下载回来的网页放到补充数据区,才会形成稳定的排名,所以说只要下载回来的东西都可以通过指令找到补充数据是不稳定的有可能在各种计算的过程中给k掉,检索区的数据排名是相对比较稳定的百度目 前是缓存机制和补充数据相结合的正在向补充数据转变,这也是目 前百度收录困难的原因,也是很多站点今天给k明天又放出来的原因。二、深度优先和广度优先。深度优先抓取的目的为了抓取高质量的网页,这个战略是由调度来计算和分配的百度蜘蛛只负责抓取,http://www.yixiin.com/photo/权重优先是指反向连接较多的页面的优先抓取,这也是调度的一种策略,一般情况下网页抓取抓到40%正常范围,60%算很好,100%不可能的当然抓取的越多越好。http://www.yixiin.com/news/