V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
across
V2EX  ›  问与答

有什么类似 Web Scraper 的爬虫插件么,支持批量 url 抓取数据的。

  •  
  •   across · 2020 年 7 月 28 日 · 2945 次点击
    这是一个创建于 2015 天前的主题,其中的信息可能已经有所发展或是发生改变。
    没做过爬虫,需求是这样的:
    20+个网页,每个网页里面有几十个数据条目。
    设定好规则抓取数据, 希望每天开机时自动跑一遍收集下数据就可以了,不限工具。Web Scraper 的 Sitemap Json 不支持批量 URL 导入,20+个网页挨个点还是麻烦····

    之前查了下 Puppeteer 很好上手,不过跑了下,触发反爬机制了(里面有几个网页是电商的=_=)。
    3 条回复    2020-07-28 22:29:24 +08:00
    ila
        1
    ila  
       2020 年 7 月 28 日 via Android
    加钱,楼下帮你搞定
    locoz
        2
    locoz  
       2020 年 7 月 28 日 via Android   ❤️ 2
    八爪鱼,下一个
    Hansah
        3
    Hansah  
       2020 年 7 月 28 日   ❤️ 1
    火车浏览器 /火车采集器
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   964 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 20:57 · PVG 04:57 · LAX 12:57 · JFK 15:57
    ♥ Do have faith in what you're doing.