V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
linziyanleo
0.01D
V2EX  ›  程序员

Vibe Coding 之怪像:用更强模型的菜鸡比用弱一点模型的大佬更强吗?

  •  1
     
  •   linziyanleo · 1 天前 · 3724 次点击

    最近的项目中大胆地尝试使用 Cursor + Opus 4.5 进行代码采纳率 80%+ 的 Vibe Coding ,尽量不用手动修改,结果比我预料的要好很多很多。甚至有一些原本要琢磨很久的复杂逻辑也很快搞定了。

    但我旁边的大佬配合 Claude Code + Sonnet 4.5 的编码效率貌似没有我这么理想。一方面是需求变动导致的重构,还有一个就是生成的代码多且质量参差不齐。要么是选择浪费时间在无尽的 CR 里,要么是留下一坨暂时先跑着,等粪坑快炸了再来填。Cursor + Opus 4.5 的情况就好很多。

    论基本功 / 工作经验,大佬肯定比我强,这让我突然感到一阵恐慌:模型不光抹平了技术人员的经验和技巧差距,甚至能力的一点提升就能让你超过多年从业的大佬。那老员工岂不是更没有存在的必要了?我不相信 AGI 会短时间内实现,但是 Claude 只是稍微出手,就已经让我看到了未来自己的命运。

    氪金就会更强这条道理最后在技术领域也复现了。Show me your code 未来也无法体现一个程序员的真正实力,或者代码能力已经不再重要了。

    第 1 条附言  ·  1 天前
    大佬的项目难度确实比我高多了,都是从 0 开始的项目,只是每天听他吐槽 Sonnet 4.5 的代码不靠谱要来回填坑,但是我自己用 Opus 4.5 感觉强很多,有感而发。

    账号是公司提供的,公司不允许自己买服务用在工作项目上。但是账号有限额,自己也没法充值,用完就没了。
    39 条回复    2026-01-08 21:34:09 +08:00
    irrigate2554
        1
    irrigate2554  
       1 天前
    有没有可能大佬领取的任务难度本身就比你的高
    MindMindMax
        2
    MindMindMax  
       1 天前
    有没有可能是:

    你的项目太简单了。 从 0 开始比较简单。
    别人的项目太复杂、技术债务多,AI 处理起来也没那么简单。
    elron
        3
    elron  
       1 天前
    这就能让你飘起来
    irrigate2554
        4
    irrigate2554  
       1 天前   ❤️ 2
    OP 就是飘了,给你个几十层复杂逻辑的陈年老 bug 让你拿着 AI 修就老实了。
    weixind
        5
    weixind  
       1 天前   ❤️ 1
    除了兴致来了刷算法题的时候手敲。我的 99.9% 的代码都是大模型吐出来的了。

    但是我并不觉得一个经验不太足的同事能够替代我的工作。

    AI 现阶段能做到“指哪打哪”。但是“指哪”的能力还不够。

    而且复杂系统编程工作 coding 的占比没那么高,很大一部分精力在搞“现状”和“未来”。
    weishu
        6
    weishu  
       1 天前   ❤️ 1
    还在用弱鸡模型的,怎么能叫“大佬”呢?起码在这一点的认知上,他不如你。
    如果大佬用最强的模型,依然可以吊打菜鸡,这是毋庸置疑的。大佬强的不仅是编码能力,而是问题建模,架构与演进能力,工程素养和踩过无数坑得到的经验和直觉。
    模型在菜鸡眼里是个许愿神灯,要什么就给什么;在大佬眼里是超级杠杆。强模型并不会自动让人变强,反而可能让不成熟的工程方式更快地产生更大的错误。
    0x663
        7
    0x663  
       1 天前   ❤️ 1
    @weishu OP 举例 大佬用的 CC + Sonnet4.5 就代表着大佬一定知道 Opus4.5 更快更好,为什么不用,显然是钱的问题。而不是认知问题。
    linziyanleo
        8
    linziyanleo  
    OP
       1 天前
    大佬的项目难度确实比我高多了,都是从 0 开始的项目,只是每天听他吐槽 Sonnet 4.5 的代码不靠谱要来回填坑,但是我自己用 Opus 4.5 感觉强很多,有感而发。
    JShen
        9
    JShen  
       1 天前   ❤️ 1
    @linziyanleo 你给大佬买个好的模型,后面给你打点好的绩效,代码不是打打杀杀,有的时候人情世故也要来点。
    weishu
        10
    weishu  
       1 天前
    @0x663 当然是认知问题,用更好的模型,实际上最终花的时间更少,花钱买时间,这就是认知。省这一点钱,还不如想想怎么挣回来。
    linziyanleo
        11
    linziyanleo  
    OP
       1 天前
    @JShen 学习了,最有用的建议 账号是公司提供的,我还是给大佬买咖啡吧
    0x663
        12
    0x663  
       1 天前
    @weishu #10 站在公司的角度当然没错,问题是看描述不像是公司能给报销使用 AI 的钱,为什么我要花自己的钱为公司提供更高更快的产出?如果要花钱买时间的话,那我不如不工作时间全是自己的,也不用去出卖身体和时间了。
    Enivel
        13
    Enivel  
       1 天前
    有没有可能大佬能看出来代码中的隐藏问题,对代码质量要求也比较高?
    flmn
        14
    flmn  
       1 天前   ❤️ 1
    我觉得最大的可能是:
    大佬看出了 ai 生成代码的问题,所以手工修改/来回反复比较多。
    而年轻人只要看代码跑起来了就提交了……这就是所谓的:不知道自己不知道。
    qwz
        15
    qwz  
       1 天前
    你觉得 ai 好用 大概率是因为你用 ai 来解决的问题比较常见(足够的数据量被拿来训练)
    你的同事要解决的问题在 ai 模型的训练数据里的不常见
    loryyang
        16
    loryyang  
       1 天前
    并不会,你这两个模型的差距本来就不大,主要还是看怎么使用,我这边用开源的 Kimi ,都觉得挺好用的,有很少的情况下,感觉模型能力不太行,就用免费 gemini
    其实正常来讲,越是资深的人,有了大模型,会越强,因为大模型补足的是编码能力,而架构、设计确实更需要人来把控的,这方面资深的技术优势会更加明显
    loryyang
        17
    loryyang  
       1 天前
    @loryyang #16 再接一句: 但是越是资深的人,越难转变思想,新人是非常容易接受大模型 vibe coding 的
    wenerme
        18
    wenerme  
       1 天前
    用了 Opus 4.5 后,其他模型都是垃圾
    JYii
        19
    JYii  
       1 天前
    并非一定是模型的原因。
    对我来说生成的后端代码,每次是一定有改动的,甚至让其回滚。
    但是对于前端代码,大多一次就过了,因为只能看懂能正常跑。
    weishu
        20
    weishu  
       1 天前
    @0x663 时间是自己的,不是公司的。如果想着在公司工作,多花点时间无所谓,那怎么能摆脱“出卖身体和时间”这种状况呢?
    8355
        21
    8355  
       1 天前
    如果是真大佬,实际上就算是 opus 也没有达到大佬的标准,看你描述的实际上也不是真大佬。
    yarawen
        22
    yarawen  
       1 天前
    Opus 确实是碾压般的强。
    我用的 copilot , 只有它是 3X 倍率计费。
    写出的代码只有需求上描述不清楚的问题,从来没有它本身写的问题。
    能力比较接近的是 GPT-5.2, GPT-5.1Codex-Max
    你跟佬提一句 Opus 好强,他就算现在没体会,也早晚会体会到的。
    等到佬跟你用一个 Opus ,就又回到一个水平线了。
    在大家不了解 Opus 多强之前,
    趁现在多偷懒摸鱼吧。
    git00ll
        23
    git00ll  
       1 天前
    大佬 review 了 ai 的代码觉得不行,你觉得可以,会不会因为你没看出来
    0x663
        24
    0x663  
       1 天前
    @weishu #20 怎么是多花点时间呢?用 AI 一天用作 8 个小时,不用 AI 一天也是工作 8 个小时,只不过任务进度不同罢了。
    sillydaddy
        25
    sillydaddy  
       1 天前
    从我的经验来看 Opus 比 Sonnet 强不少。现在 Cursor 里面用 1 次 Opus 算 2 个 request ,但比 Sonnet 靠谱,Sonnet 两次不一定比得上 Opus 一次。
    weiming
        26
    weiming  
       1 天前
    大佬太抠门了,sonnet 把把返工纯浪费时间。cc 基本只用 opus ,cursor 的 gpt xhigh 。都掏钱了就别用抠抠索索用弱的模型了。
    xieshaohu
        27
    xieshaohu  
       1 天前
    sonnet 和 opus 的差距没有这么大。领取的任务难度等级更能影响结果。
    NotLongNil
        28
    NotLongNil  
       1 天前
    @linziyanleo #8 大佬能看出 AI 的代码有问题,但你看不出,这就是差距
    FlashEcho
        29
    FlashEcho  
       1 天前
    4.5 opus 也没比 sonnet 强很多啊,官方发的 benchmark ,swe-bench ,opus 是 80%,sonnet 是 77%,大概率是你的项目比较简单
    FlashEcho
        30
    FlashEcho  
       1 天前
    @0x663 #24 真实工作中只有一部分时间是用来写代码的,也没法节约很多时间,而且只要你想干就有干不完的活,没必要自己花钱给公司提效。几个月前最开始 pro plan 还不能用 opus 呢(现在能用额度也很少),也就是说必须开 max plan ,一个月给公司贡献 200 刀还是超过目前大部分人的经济水平了
    herbloo
        31
    herbloo  
       1 天前
    有点感觉 AI 带来太多无意义的垃圾代码了
    kakki
        32
    kakki  
       1 天前
    想多了,你都不在人家的 scope 里面.
    craftsmanship
        33
    craftsmanship  
       1 天前 via Android
    我也是体感上 opus 比 sonnet 要强 所以在有选择的情况下 无脑用最强的就行了 虽然我的时间不像大佬那么宝贵 但模型效率低会显著影响到我摸鱼的长度
    ofyann
        34
    ofyann  
       1 天前
    模型是一个方面,但是现在感觉还是人更重要。
    0x663
        35
    0x663  
       1 天前
    @FlashEcho #30 是的,同意 没必要自己花钱给公司提效
    suibianwanwan
        36
    suibianwanwan  
       1 天前
    opus 是比 sonnet 强, 但是差距没你说的这么明显
    zxjxzj9
        37
    zxjxzj9  
       1 天前
    @weixind 大部分程序员工作时候的难点都是指哪而不是打哪吧,只有很小一点程序员的工作是真的难在打哪,比方说写数据库内核的那种
    MIUIOS
        38
    MIUIOS  
       1 天前
    @irrigate2554 #4 已老实,搞出线上大问题过。
    yufeng0681
        39
    yufeng0681  
       1 天前
    如果想得到当前结论, 确实还要去看一下项目需求的差异,已实现代码的情况(复杂度,算法)。
    都是用工具, 新手开着法拉利,也不如赛车手开桑塔纳跑得快(山路)。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   932 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 19:55 · PVG 03:55 · LAX 11:55 · JFK 14:55
    ♥ Do have faith in what you're doing.