其实还有一方面,想知道java爬虫相对于Python爬虫有什么优势吗,Python的爬虫那么容易入门,开发那么方便。。。
(我发到这个版是因为觉得java版关注爬虫的应该没有这个版多)
1
xiaocsl 2015-03-16 02:58:48 +08:00 1
|
2
xxer 2015-03-16 09:05:04 +08:00
我感觉你弄颠倒了,爬虫最厉害的还是java
|
3
FeiMa 2015-03-16 09:13:29 +08:00
Nutch 这个是 Java 的。多了解一下。
|
4
zhfish 2015-03-16 10:58:47 +08:00
jsoup超帅
|
5
xuyankang 2015-03-16 12:18:06 +08:00
WebMagic是我实习公司的一位同事做的,用起来还不错。
|
6
shoumu 2015-03-16 12:20:59 +08:00 1
Top 50 open source web crawlers for data mining
http://www.bigdata-madesimple.com/top-50-open-source-web-crawlers-for-data-mining/ |
7
ZOwl 2015-03-16 15:05:35 +08:00
看规模吧,大规模的话就要考虑语言的运行时效率等因素了,这个时候开发效率不一定有那么重要
|
8
hadesqiao 2015-03-16 15:15:48 +08:00
mark
|
9
doushini 2015-03-16 23:10:31 +08:00 via Android
httpclient+htmlparser
|
10
professorz OP @xuyankang 一个月前我看到你的回答没重视到,今天偶然Google进了这个webmagic的项目页面,看了一天没停下来,觉得将近浪费了一个月5555.
如果可以的话,转告你同事他做的太棒了。 顺道感谢Google,感谢github。 |