1
tikazyq 2019-05-27 17:29:56 +08:00
需要记录代理 ip 的有效性,如果是使用了 API,先缓存到数据库中。
顺便打个广告,Crawlab 是一个专注于爬虫的集成了爬虫管理、任务调度、任务监控、数据分析等模块的分布式爬虫管理平台,非常适合对爬虫管理、爬虫工程化有要求的开发者及企业 https: //github.com/tikazyq/crawlab |
2
lucays 2019-05-28 19:51:53 +08:00 via Android
有中间件的,在 middleware 里写,至少按照 response.status 判断是不是 200
|
3
popbayun 2019-06-05 15:58:33 +08:00
建个代理 IP 池,失效或被 ban 就从池子里剔除掉
|