分布式爬虫是要共享一个 URL 池的么?
多台服务器的话,可以分布在全世界么?比如各地都买 vps
目前一般用什么语言写分布式爬虫? PHP 能行么(一直都用 php 爬的,但都是小爬虫)?谢谢
有没有一个综合性的思路,谢谢
1
yrj 2017 年 10 月 21 日 via iPad
参考 pyspider
|
2
t1518968889 2017 年 10 月 21 日 via Android
puppeteer
|
3
xielemon 2017 年 10 月 21 日
scrapy-redis
|
4
hcnhcn012 2017 年 10 月 22 日 via iPhone
scrapy-redis +1
|
5
SlipStupig 2017 年 10 月 23 日
scrapy+etcd
|
6
rainnus 2017 年 10 月 23 日
scrapy-redis + 2
|