1
workaholic 2013-03-30 20:18:58 +08:00
用java写的? 基于什么库?
|
2
ipoh 2013-03-30 22:51:16 +08:00
楼主怎么买的 我也想买一个
|
3
sohoer OP @workaholic 用的HttpURLConnection+正则,没有用其它第三方库,xpath,javascript支持倒是用了,不过现在把他当成插件了。
@ipoh 淘宝买的,如果需要你留个邮箱我把交易记录发给你,我现在每天晚上都是开着的,在爬煎蛋妹子图,稳定性挺好的。 |
4
workaholic 2013-03-31 12:36:43 +08:00
我最近也在爬图片,请教个问题:图片上水印你怎么处理的?肯定不希望自己的图片上带上别的网站的水印吧?
|
5
chemhack 2013-03-31 12:43:00 +08:00 via iPad 3
@workaholic 自己的图片。。。。。 我真是吐槽无力了
|
6
workaholic 2013-03-31 12:45:57 +08:00
@chemhack 神经病
|
8
34D 2013-03-31 16:04:23 +08:00 via Android
自己的图片吐槽无力+1。
|
9
workaholic 2013-03-31 16:32:26 +08:00
@34D QNMLGB
|
10
goxofy 2013-03-31 16:59:06 +08:00
自己的图片吐槽无力+1
|
11
ywencn 2013-03-31 17:06:06 +08:00
没懂你们在说什么自己的图片?
|
13
jason52 2013-05-19 16:27:25 +08:00
-----------------
from pyquery import PyQuery as pq import time fp=open("meizhitu.txt",'w') for i in range(800,813): url = 'http://jandan.net/ooxx/page-' + str(i) d1 = pq(url) posts = [] for anchor in d1('#comments p>img'): anchor = d1(anchor) ans = anchor.attr('src') posts.append(ans) print >>fp,ans print ans fp.close ---------------------- 用pyquery写了一个简单的爬妹子图的脚本 |
14
jason52 2013-05-19 16:29:04 +08:00
哎呀,v2ex发代码都乱掉了。。python缩进都没了。。看来以后不能直接放代码了。。
|