前几天写的“IIS日志中的200 0 64(sc-win32-status)状态”中提到大家对该现象的最普遍的说法,就是说“百度蜘蛛留下的64是意味着页面将被K或者放入沙盒”,
今天终于说服服务器管理员提供了公司一个被百度、Google、Yahoo都K过的网站IIS日志的下载,使用昨天写的“IIS网站日志导入分析系统”开始查询分析。
从24号到30号这7天内,平时使用的几个搜索引擎每天均有爬行记录。可见即使在网站被封之间,搜索引擎还是继续爬行并观察。
开始说百度的200 0 64问题:
7天内搜索引擎只有百度留下几个64,以下记录是只包含首页的Http状态为200的是截图【不包含子状态,查询条件:百度蜘蛛+页面+IP+Http状态+win32状态】:
29号百度这个IP抓取首页开始是200 0,从第3行到第5行出现64,但是服务器发送字节为0,接受字节却大于0,30号开始又变成200 0,而这2天内除了添加信息之外首页并没有修改。
我想这样还不能说明某些人的说法是错误的,那就看看下面截图【查询条件:日期+时间+IP+页面+HTTP状态】:
声明:这个IP是我本地IP。
25号第一条记录正常,3秒后,我刷新首页,出现64
35秒时候再刷新【因为当时网速很慢,这段时间内没有打开】,仍是64,但是HTTP状态是206【206——服务器已经完成了部分用户的GET请求】,说明已经完成一部分,但是在发送之前就出现了64
第四条记录win32竟出现1236【1236 0x04D4 本地系统已经终止网络连接】,也就是说服务器端已完成一部分请求但是还未发送,我本地就强制停止了页面执行。
再看看其他浏览者出现64时候的截图:
可以看出,不仅仅是百度会留下64,任何人都可能会留下64,这仅当服务器出现“指定的网络名不再可用”的时候才会出现。
这样就可以说了,百度蜘蛛留下200 0 64的时候并不是所谓的“意味着页面将被K或者放入沙盒”。
但是究竟是什么引起“指定的网络名不再可用”,大家可以网上搜索一下。