V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
shonky
V2EX  ›  问与答

是否有下载HTML中的图片到本地文件的软件工具

  •  
  •   shonky · 2019-05-21 17:06:00 +08:00 · 4641 次点击
    这是一个创建于 2011 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如题,本地电脑有一份HTML文件,想把文件中的图片与图片地址都下载下来,是否有这样的软件工具可以达到这一目的呢, 如果仅能下载HTML中的图片到一文件夹中,也可以。

    有没有大佬知道这样的软件工具的呢

    86 条回复    2019-08-12 08:19:36 +08:00
    eisuto
        1
    eisuto  
       2019-05-21 17:14:03 +08:00 via Android
    。。直接在 html 中找到图片的地址就行呀
    geelaw
        2
    geelaw  
       2019-05-21 17:15:00 +08:00 via iPhone
    Internet Explorer 的另存为就可以下载所有图片。
    ly50247
        3
    ly50247  
       2019-05-21 17:15:13 +08:00
    wget -F -i html 文件
    shonky
        4
    shonky  
    OP
       2019-05-21 17:23:33 +08:00 via Android
    @eisuto 图片太多了。想找个能批量下载的。
    shonky
        5
    shonky  
    OP
       2019-05-21 17:24:17 +08:00 via Android
    @ly50247 win7。另存为可以把里面所有图片都下载下来么。
    ctro15547
        6
    ctro15547  
       2019-05-21 17:28:03 +08:00
    迅雷啊
    Ultraman
        7
    Ultraman  
       2019-05-21 17:28:54 +08:00 via Android
    Ctrl+S
    shonky
        8
    shonky  
    OP
       2019-05-21 17:38:04 +08:00 via Android
    @vcinex 并没有保存图片选项。
    shonky
        9
    shonky  
    OP
       2019-05-21 17:38:35 +08:00 via Android
    @ctro15547 迅雷下载 html 中的图片。第一次听说。好的,谢谢了,等下试试。
    shonky
        10
    shonky  
    OP
       2019-05-21 17:40:05 +08:00 via Android
    html 里面不只有图片,还有文字。

    我只想下载图片。图片太多了。手动点不现实。

    有什么工具可以嗅探 html 中的全部图片并下载到文件夹里面的呢
    wangsongyan
        11
    wangsongyan  
       2019-05-21 17:41:34 +08:00 via iPhone
    浏览器右键保存成 html,顺带文件就下来了
    Track13
        12
    Track13  
       2019-05-21 17:42:50 +08:00 via Android
    浏览器有插件可以做到
    fater
        13
    fater  
       2019-05-21 17:46:19 +08:00
    ImageAssistant 这个插件不错
    Jamy
        14
    Jamy  
       2019-05-21 17:56:37 +08:00
    我怀疑你在开车, 可是我又没有证据
    shonky
        15
    shonky  
    OP
       2019-05-21 17:58:24 +08:00 via Android
    @wangsongyan 我是本地就有 HTML 这个文件。

    我想把这文件里的图片下载下来。

    HTML 里面是 一个图片,一个说明。我想把图片分离下来,一个个成为单独图片。
    shonky
        16
    shonky  
    OP
       2019-05-21 17:58:43 +08:00 via Android
    @fater 我去试试
    shonky
        17
    shonky  
    OP
       2019-05-21 18:02:57 +08:00 via Android
    @fater 显示没有提取图片权限。这个是要设置什么呢
    Vegetable
        18
    Vegetable  
       2019-05-21 18:05:21 +08:00
    右键保存网页,打开文件夹,按类型排序,复制图片.
    shonky
        19
    shonky  
    OP
       2019-05-21 18:06:52 +08:00 via Android
    @Vegetable 就三种类型,web,web,pdf。
    Vegetable
        20
    Vegetable  
       2019-05-21 18:08:16 +08:00
    @shonky 右键另存为,会同时生成一个.html 文件和一个同名文件夹,你打开那个文件夹看一下
    shonky
        21
    shonky  
    OP
       2019-05-21 18:13:09 +08:00 via Android
    @Vegetable 是有文件夹,但里面有一个图片。并不是所有的图片。
    shonky
        22
    shonky  
    OP
       2019-05-21 18:13:27 +08:00 via Android
    @fater 这个好像下不了本地 html 的图片。
    LuvF
        23
    LuvF  
       2019-05-21 18:24:31 +08:00 via Android
    试试 idm ?
    ma6254
        24
    ma6254  
       2019-05-21 18:26:51 +08:00 via Android
    xpath 或者 selector 匹配下 img 标签或者链接就可以了
    shonky
        25
    shonky  
    OP
       2019-05-21 18:37:27 +08:00 via Android
    @LuvF 试了。不支持。
    shonky
        26
    shonky  
    OP
       2019-05-21 18:37:59 +08:00 via Android
    @ma6254 不懂。win7
    Bwoywan
        27
    Bwoywan  
       2019-05-21 18:40:26 +08:00 via Android
    IDM 可以的,装上扩展后,右键下载链接,筛选一下
    shonky
        28
    shonky  
    OP
       2019-05-21 18:50:18 +08:00 via Android
    @Bwoywan 不行呢
    Bwoywan
        29
    Bwoywan  
       2019-05-21 18:54:45 +08:00 via Android
    @shonky 额,这个在线没问题啊…
    iyaozhen
        30
    iyaozhen  
       2019-05-21 18:54:50 +08:00
    360 浏览器好像可以
    Bwoywan
        31
    Bwoywan  
       2019-05-21 18:58:02 +08:00 via Android
    shonky
        32
    shonky  
    OP
       2019-05-21 20:27:53 +08:00 via Android
    @Bwoywan 我这个不是下网站里的图片。

    是本地 html,用浏览器打开。IDM 表示不支持。
    shonky
        33
    shonky  
    OP
       2019-05-21 20:28:07 +08:00 via Android
    @iyaozhen 360 么
    edgnoz
        34
    edgnoz  
       2019-05-21 20:29:59 +08:00
    迅雷,然后选 jpg png 啊
    secondwtq
        35
    secondwtq  
       2019-05-21 21:23:38 +08:00   ❤️ 1
    我记得小时候用 Windows + 若干国产软件的时候,右键网页的任意位置就有“使用 XXXX 下载全部链接”。然而我从来没用到过

    现在不用 Windows,也不用国内大厂的软件了,这种奇怪的需求偶尔却会有,此时不用任何花哨的第三方工具的解决方案是:打开 console 输入 [...document.getElementsByTagName("img")].map(a => a.src).join('\n'),结果拷贝下来然后 wget -i
    zhizunzz
        36
    zhizunzz  
       2019-05-21 21:31:59 +08:00 via Android   ❤️ 1
    我也有这个需求,1688 的图片下载,我自己造了个浏览器扩展用的,看看文档写起来还是挺简单的
    zouchtssn
        37
    zouchtssn  
       2019-05-22 05:39:51 +08:00
    Chrome 有插件 Fatkun Batch Download Image
    有源文件的话直接正则匹配一下图片地址即可
    按理说 Windows 保存到本地的 HTML 文件应该附带页内的资源文件在一个同名文件夹里面啊?
    dfjslkjdf
        38
    dfjslkjdf  
       2019-05-22 07:21:47 +08:00
    软件工具是指?
    代码,爬虫之类? 还是什么的?
    有很多浏览器插件可以做这个功能,
    eagle 也可以。
    zhensjoke
        39
    zhensjoke  
       2019-05-22 08:16:59 +08:00
    实在不行试试单页模板扒手。。。wuyublog.com 的。
    Bwoywan
        40
    Bwoywan  
       2019-05-22 08:59:42 +08:00 via Android
    @shonky 本地啊…应该有工具吧,如果是那种一个文件的。
    shonky
        41
    shonky  
    OP
       2019-05-22 09:16:11 +08:00
    @Bwoywan 在线网站上的图片是可以。但本地HTML会报错。
    rain0002009
        42
    rain0002009  
       2019-05-22 09:22:29 +08:00
    本地起个服务器 不就都可以了
    shonky
        43
    shonky  
    OP
       2019-05-22 09:22:37 +08:00
    @secondwtq  图片地址是有很多的,但在WIN 7 下用IDM下载,只下载下来一个图片。
    shonky
        44
    shonky  
    OP
       2019-05-22 09:24:37 +08:00
    @zhizunzz 我不是下在线网站的图片,是自己本地HTML中图片。一个HTML文件,想分离下载其中的图片。但世面上很多扩展只支持下载在线网站上的图片。
    shonky
        45
    shonky  
    OP
       2019-05-22 09:25:46 +08:00
    @zouchtssn 这个插件我也下了。没用。正常网站会显示下载当前页面的图片,在HTML页面,不会显示此选项。我下了三个这样的扩展插件了了。
    shonky
        46
    shonky  
    OP
       2019-05-22 09:26:49 +08:00
    @rain0002009 起个服务器,是啥操作。没有简单易操作的么。
    shonky
        47
    shonky  
    OP
       2019-05-22 09:28:38 +08:00
    @zhensjoke 这网站上找不到你说的这个东西。
    Bwoywan
        48
    Bwoywan  
       2019-05-22 09:31:02 +08:00 via Android   ❤️ 1
    @shonky 据我了解哈,HTML 文件加载图片不是得有 assets 文件夹,加载外部的资源,如果没有,那就是加载的外链,外链就可以通过下载链接,或者链接加了防盗链…
    Bwoywan
        49
    Bwoywan  
       2019-05-22 09:31:31 +08:00 via Android
    @Bwoywan 我也不是很懂前端…
    shonky
        50
    shonky  
    OP
       2019-05-22 09:34:21 +08:00
    @secondwtq 谢谢。IDM能下载,但下载过程会出现问题。![Screenshot_8.png]( https://i.loli.net/2019/05/22/5ce4a6bd07f1e21440.png)

    还是只能下载成功众多图片地址中一个图片。批量失败。也不知道为什么
    zouchtssn
        51
    zouchtssn  
       2019-05-22 09:34:26 +08:00
    @shonky #44
    是 html 还是 mhtml 文件?
    如果是 html 可以看清空缓存后断网是否还能加载,如果不能的话正则匹配一下 html 文件中的图片链接就行
    如果仍然显示,检查一下是不是页面内图片被编码为 base64 了
    shonky
        52
    shonky  
    OP
       2019-05-22 09:38:52 +08:00
    @Bwoywan  HTML中图片,正是显示外链图片地址得来的。但HTML图片太多了,想找个能批量下载其中图片地址的工具。能分离,能下载
    shonky
        53
    shonky  
    OP
       2019-05-22 09:39:36 +08:00
    @zouchtssn 好的,谢谢老哥
    AlexSummer
        54
    AlexSummer  
       2019-05-22 10:40:48 +08:00
    Qzier
        55
    Qzier  
       2019-05-22 10:52:41 +08:00 via iPhone
    正则表达式提取下,然后复制到迅雷里面下载
    fater
        57
    fater  
       2019-05-22 11:18:23 +08:00
    @shonky 抱歉,(⊙o⊙)…我没试过本地 html 文件,而且都没出现过这个提示。 我都是直接在线提取网页的图片文件。打开提取本页图片后,单击选中你要的图片,或者全选。然后下载选中,打开下载目录就有个该网页的文件夹,你所选择的图片都会在该文件夹内。不行的话,多试几下。
    tadtung
        58
    tadtung  
       2019-05-22 12:36:23 +08:00 via Android
    @shonky 这个没试过,不过你可以搭建个本地 web 环境,这样再下。
    写个简单爬虫都解决。
    shonky
        59
    shonky  
    OP
       2019-05-22 12:39:15 +08:00 via Android
    @fater 试了在线都 ok。本地是不可以的。
    shonky
        60
    shonky  
    OP
       2019-05-22 12:39:53 +08:00 via Android
    @tadtung 🚣🏻

    我有很多的想法,就差个编程技能了。
    shonky
        61
    shonky  
    OP
       2019-05-22 12:40:19 +08:00 via Android
    @justin2018 这个试过了。没用,只能提取在线网站的。
    tadtung
        62
    tadtung  
       2019-05-22 12:45:24 +08:00 via Android
    @shonky。。。Python 爬图片还是很简单的,你可以直接百度,几分钟。

    另外就是我上面说的,你在本地搭个 web 环境,网站本地部署,然后直接用工具下 127.0.0.1,这个也不能下吗?这也是在线网站,应该能下的。
    nznd
        63
    nznd  
       2019-05-22 13:26:07 +08:00
    teleport ultra 感觉还是蛮好用的
    moonkiller
        64
    moonkiller  
       2019-05-22 13:31:58 +08:00
    chrome 有插件可以下载当前页面的图片
    cheng4741
        65
    cheng4741  
       2019-05-22 14:22:47 +08:00
    试了楼上说的保存网页,亲测有效
    ![Screen Shot 2019-05-22 at 2.18.59 PM.png]( https://i.loli.net/2019/05/22/5ce4ea04f21d098740.png)
    vipwpcom
        66
    vipwpcom  
       2019-05-22 14:30:19 +08:00
    使用 charles 工具,浏览过的都可以保存
    ben1024
        67
    ben1024  
       2019-05-22 14:37:52 +08:00
    自己开发的,爬取同 /异步渲染网页,进行本地化存储

    [MasterCloner/Cornerstone]
    registerrr
        68
    registerrr  
       2019-05-22 14:38:21 +08:00
    idm 了解一下
    ben1024
        69
    ben1024  
       2019-05-22 14:38:54 +08:00
    beckyao
        70
    beckyao  
       2019-05-22 15:37:00 +08:00
    下载网页不就搞定了
    stevenbipt
        71
    stevenbipt  
       2019-05-22 15:59:47 +08:00 via Android
    chrome 直接保存网页全都有了
    HarryQu
        72
    HarryQu  
       2019-05-22 16:11:55 +08:00
    简单的用 wget、复杂的写爬虫 :
    如下载 A 站首页相关文件
    wget -p -H -q Https://www.acfun.cn -e robots=off
    bigmama
        73
    bigmama  
       2019-05-22 16:23:02 +08:00
    http://www.greenxf.com/soft/142461.html
    图片 css html 什么都给你拔下来
    impony
        74
    impony  
       2019-05-22 17:24:15 +08:00
    Mac 下有一个软件,叫 SiteSucker
    shonky
        75
    shonky  
    OP
       2019-05-22 19:21:28 +08:00 via Android
    @impony win7 在这
    shonky
        76
    shonky  
    OP
       2019-05-22 19:21:56 +08:00 via Android
    @bigmama 好哦。我试试
    shonky
        77
    shonky  
    OP
       2019-05-22 19:22:16 +08:00 via Android
    @ben1024 好哦。谢谢老哥
    shonky
        78
    shonky  
    OP
       2019-05-22 19:23:40 +08:00 via Android
    @tadtung 已解决。用楼上的一行代码,在用 idm 下载。

    已批量下载完毕。
    shonky
        79
    shonky  
    OP
       2019-05-22 19:24:16 +08:00 via Android
    感谢各位老哥,问题已解决。

    代码加 idm。谢谢热心老哥。
    zhensjoke
        80
    zhensjoke  
       2019-05-29 16:35:55 +08:00
    @shonky http://soft.wuyublog.com:8000/ 有的。。你没点开 “本站所有软件” 看、、
    shonky
        81
    shonky  
    OP
       2019-05-29 18:52:53 +08:00 via Android
    @zhensjoke 看到了。198 一年
    zhensjoke
        82
    zhensjoke  
       2019-05-30 09:04:16 +08:00
    @shonky 有免费版。。。。足够你用。。。。。
    shonky
        83
    shonky  
    OP
       2019-05-30 18:58:16 +08:00 via Android
    @zhensjoke 好的。谢谢老哥
    dalieba
        84
    dalieba  
       2019-08-11 04:13:30 +08:00 via Android
    有个插件可以搞定:Download All Images
    dalieba
        85
    dalieba  
       2019-08-11 04:14:21 +08:00 via Android
    Web image downloader 也可以
    地址 https://www.webimagedownloader.com/
    shonky
        86
    shonky  
    OP
       2019-08-12 08:19:36 +08:00 via Android
    @dalieba 谢谢老哥
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2777 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 42ms · UTC 15:09 · PVG 23:09 · LAX 07:09 · JFK 10:09
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.