1
FightingX 2019 年 4 月 28 日
我一般基于 httpclient 自己写下载器
|
3
xioxu 2019 年 4 月 28 日
虽然平时我也写 java, 但爬虫我还是喜欢用 python 的 scrapy, 简单好用, 爬虫常用场景都有内在支持。
|
4
fwrq41251 2019 年 4 月 28 日 |
5
yestodayHadRain 2019 年 4 月 28 日
Gecco 了解一下,我也是这几天刚接触的,感觉还是挺方便的
|
6
swuzjb 2019 年 4 月 28 日
Jsoup
|
7
canbingzt 2019 年 4 月 28 日
这种框架如果没有遇到 bug 的话,更新不更新应该是无所谓的吧,能满足需求就行了啊
|
8
quadrapop 2019 年 4 月 28 日
python 写爬虫就行,反正都是保存到数据库
java 一般我们用 Jsoup,还可以 |
9
uminokoe 2019 年 4 月 28 日
歪个楼,遇到需要使用 selenium 的情况用什么框架好呢?
|
10
xyooyx 2019 年 4 月 29 日
jdk11 开始内置 httpclient,可以配置 cookieMnager 自动管理 Cookie
|
11
zhangjinglongi 2019 年 4 月 29 日
dongliu 的 reuqests 也挺好用的,模仿的 python 的
|
12
ala2008 2019 年 4 月 29 日
一般使用就可以了吧
|
13
xinQing 2019 年 4 月 29 日
这个 webmagic 很成熟了啊,源码也比较简单,推荐使用~
|
15
wiix 2019 年 5 月 5 日
手撸一个
|