V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Counter
V2EX  ›  问与答

Python 是最适合用来做爬虫和模拟登录的语言吗?

  •  
  •   Counter · 2019-05-13 09:32:06 +08:00 · 2138 次点击
    这是一个创建于 2008 天前的主题,其中的信息可能已经有所发展或是发生改变。

    对于这两个方面,只讨论开发效率的话

    10 条回复    2019-05-13 20:02:57 +08:00
    Arnie97
        1
    Arnie97  
       2019-05-13 10:06:46 +08:00 via Android
    只考虑开发效率的话,应该是 JS + headless Chrome,自己模拟浏览器肯定不会比直接用真的浏览器更方便
    locoz
        2
    locoz  
       2019-05-13 11:59:52 +08:00   ❤️ 1
    只讨论开发效率的话,通常来说是的,因为现有的库很多很完善了,各种加解密、字节操作都能随意地搞,实在不行再调用其他语言搞就好了。
    murmur
        3
    murmur  
       2019-05-13 13:02:50 +08:00
    现在的爬虫在语言已经没优势了,拼的是反扒,反扒这块就跟 python 没关了
    102400
        4
    102400  
       2019-05-13 14:35:55 +08:00
    不是
    Counter
        5
    Counter  
    OP
       2019-05-13 15:33:11 +08:00
    @102400 愿闻其详
    mooncakejs
        6
    mooncakejs  
       2019-05-13 15:36:48 +08:00
    nodejs 出来之前是,nodejs 成熟后,最适合的是 js
    q8164305
        7
    q8164305  
       2019-05-13 15:42:19 +08:00 via Android
    我觉得是 js
    102400
        8
    102400  
       2019-05-13 15:42:31 +08:00   ❤️ 1
    @Counter Python 所谓的爬虫框架和各种爬虫入门教程,确实容易让人觉得是写爬虫的不二之选,然而用其它语言来做对比并不见得有优势,唯一的优点就是教程和库多,复杂验证惨景的爬虫或者说模拟登陆 python 并没有优势,说句大实话,甚至不如易语言
    Orciorc
        9
    Orciorc  
       2019-05-13 15:43:30 +08:00 via Android
    就模拟登录和信息获取这一块,curl 和 python 的 request 深得我心,java 的 okhtttp 正在尝试
    superalsrk
        10
    superalsrk  
       2019-05-13 20:02:57 +08:00
    手动狗头。。其实这俩需求, 使用最广的技术栈其实是易语言
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2637 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 03:45 · PVG 11:45 · LAX 19:45 · JFK 22:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.