1
ufo22940268 2013 年 6 月 25 日
http://www.crummy.com/software/BeautifulSoup/bs4/doc/
我刚刚用这个做了一个爬虫系统,感觉良好 |
2
bravejoe 2013 年 6 月 25 日
可以看下这个python的开源爬虫框架 http://scrapy.org/
|
3
xieren58 2013 年 6 月 25 日
用node.js啦,异步,处理html可以用jquery。~~~~~~
|
5
gullon 2013 年 6 月 25 日
@ufo22940268
Beautiful是用来解析网页的。。。怎么可以说用bs4做了个爬虫系统呢 |
6
ufo22940268 2013 年 6 月 25 日
@gullon 我理解错了
|
9
acpp 2013 年 6 月 25 日
@ufo22940268 能说下你说的那个效率怎么样吗
|
10
seraphimhj 2013 年 6 月 25 日
nodeJS,以前用node.io写过一个爬房价的工具
|
11
ufo22940268 2013 年 6 月 25 日 via iPhone
@acpp 我只是觉得用起来顺手,开发快,还有我可能理解错了爬虫的意义了
|
12
duhastmich 2013 年 6 月 26 日
|
13
duhastmich 2013 年 6 月 26 日
@Ricepig 爬虫不异步或者多线程那效率也太低了吧。。
|
14
gullon 2013 年 6 月 26 日
|