爬虫怎么下载图片,jsoup 拿到 Document 后怎么存图片
是解析 Document 里面的 src 路径 再请求一次吗,
请求一次 Document 不能保存里面的图片吗
要是几十张图片, 莫不是要再请求几十次,才能下载下来啊
有没有办法拿到 Document 里面的图片 src 直接可以下载的
只 get 一次
1
M003 2020-07-10 17:42:03 +08:00
这你不是想多了么,浏览器访问,还都是根据 src 再次请求图片资源的.
|
2
l4ever 2020-07-10 18:01:24 +08:00
想什么呢, 你以为浏览器打开一个页面就请求了一次吗?
js/css/img 还不都是根据内容再去加载的? |
4
autoname OP 其实我是想,爬 dz 的验证码
这是图片直链,misc.php?mod=seccode&update=49424&idhash=cS0 但是不能这么直接访问是没效果的,虽然带上 cookie 啥的,验证码也会变, 但是回帖校验的时候还是提示错误, 得先请求一次这个地址, misc.php?mod=seccode&action=update&idhash=cS0&0.0423275371233075&modid=undefined 然后去校验,才是正确的 问题是,这里面只能发送一次 get 请求, 到这个地址去更新验证 misc.php?mod=seccode&action=update&idhash=cS0&0.0423275371233075&modid=undefined 但 这个页面又不是验证码直链,得不到直链。就没办法解码了 不知道怎么弄了,求 dz 爬虫大佬指点 |
5
Wait845 2020-07-11 00:44:34 +08:00
dz 是什么敏感词🐎
|
6
autoname OP |