我建了两个网站,没有任何被任何博客添加友链,没有在任何网站上留下过 url ,但是我都在这两个服务器里的 access.log 里看到了谷歌爬虫(虽然我设置了 robots.txt 不让爬取)。难不成是靠遍历 ip 地址吗?
1
xzem 2016-11-17 20:08:41 +08:00
比如说 chrome
|
2
DesignerSkyline 2016-11-17 20:13:21 +08:00 via iPad
Google chrome 的安全检测服务可能会导致这个现象
|
3
yankebupt 2016-11-17 20:16:25 +08:00 via Android
爬的时候不遵循 robots.txt 的也有可能是伪造成谷歌爬虫的其他爬虫,比如安全机构
|
4
yushiro 2016-11-17 20:18:53 +08:00 via iPhone
网站有域名,根据域名注册商的列表爬。
|
5
whwq2012 OP @DesignerSkyline 什么意思?
|
7
DesignerSkyline 2016-11-17 22:13:38 +08:00
@whwq2012 safebrowsing probes
|
11
flynaj 2016-12-15 00:09:24 +08:00 via Android
看 ip 地址,如果不是 google 的服务器就是伪造的,可能是扫描
|