V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
ktyang
V2EX  ›  程序员

探讨一下使用 AI 开发和维护大型项目的经验

  •  
  •   ktyang · 8 小时 35 分钟前 · 1643 次点击

    最近在尝试使用 AI 来构建一个比较大型的工程,用了几个 Agent 分别扮演设计、编码、测试、审核的角色,开发了一段时间以后感觉非常的力不从心,对整体项目的掌控感越来越差,感觉随时都有可能会在我预料不到的地方爆炸一下。想请教一下大家有没有什么好的想法或者思路呀。

    27 条回复    2025-12-29 19:09:10 +08:00
    4ark
        1
    4ark  
       8 小时 29 分钟前
    设计、编码、测试、审核有在项目内产出完整的文档吗?能否随时切换到人工维护的状态。可以使用 speckit/openspec 这类工具
    OC0311
        2
    OC0311  
       8 小时 17 分钟前
    我觉得 AI 写的项目只能 AI 维护了,并且时间长了 AI 也没法维护了
    maichael
        3
    maichael  
       8 小时 14 分钟前   ❤️ 1
    因为你“管理能力不足”,你可以把 Agent 的想象成一个黑盒,输入需求,输出代码/文档,至于里面是人工智能还是“人工”智能其实无所谓,本质上你就相当于管了一个小开发团队,你兼职了项目管理+产品管理+团队管理,你要以“管理”的思路去优化整个开发流程。
    defunct9
        4
    defunct9  
       8 小时 13 分钟前
    去死噻,根本无法维护,弄半天跟头蠢驴似的,提示半天,方向不对,努力白费,浪费一堆 token
    craftsmanship
        5
    craftsmanship  
       7 小时 30 分钟前 via Android
    @defunct9 模型不行/prompt 准备工作没到位
    现在的 LLM 已经可以写得比大部分码农要工整规范了
    justdoitzZ
        6
    justdoitzZ  
       7 小时 24 分钟前   ❤️ 2
    感觉一定要做好文档管理,模块化管理,不断分阶段总结和记录形成文档。让 AI 知道这些项目的进度和架构,不然过一段时间,就一团糟了。解决完了一个疑难问题也要总结形成经验文档。
    defunct9
        7
    defunct9  
       6 小时 49 分钟前
    擦,写一堆的 prompt ,比代码还复杂
    winglight2016
        8
    winglight2016  
       6 小时 31 分钟前
    用了几个 Agent 分别扮演设计、编码、测试、审核的角色————这一步毫无意义,升级模型比优化 prompt 更有效。

    现在感觉能用的首选 gemini3 ,其次 codex5.2 ,其他的都没法用。
    ktyang
        9
    ktyang  
    OP
       6 小时 14 分钟前
    @4ark 都有文档产出,但是不能保证都非常完整。而且文档数量也已经很多了。我先去学习一下你说的工具,非常感谢~
    sentinelK
        10
    sentinelK  
       6 小时 10 分钟前
    1 、扮演角色有什么目的吗?
    2 、是否有节省上下文的针对性设计?
    3 、期待的交互模式是什么?全自动?半自动?还是开发人员驱动?
    4 、“大型项目”有多大?
    5 、你用的什么 AI 模型与工具?
    ktyang
        11
    ktyang  
    OP
       6 小时 9 分钟前
    @maichael 本质上管了一个小开发团队这个是接受的,LLM 是无法做到人那样会对自己的工作有长期的上下文并且去负责任的,现在的问题是该如何提升这种管理能力呢?
    ktyang
        12
    ktyang  
    OP
       5 小时 52 分钟前
    @sentinelK 1.主要就是尝试把不同的工作解耦出来,试图增加掌控力。2.这方面可能欠缺比较多,欢迎给出一些建议哈。3.期待的交互模式半自动吧,其实自己也没有想好,最初的想法就是看了 openai 的那个分享想尝试一下能做成什么样子。4.现在还没有那么巨大哈,ROS 相关的目前有十几个模块吧。5.codex 、antigravity 、claude code 都有。
    skyemin
        13
    skyemin  
       5 小时 48 分钟前
    几个 agent 之间怎么交互,通过文档吗?
    jacketma
        14
    jacketma  
       5 小时 47 分钟前
    要做到一次性全命中还是非常难的,至少要保证能看得懂 AI 的代码逻辑,后续还有修改的空间。如果人工已经很难参与进去了,那就变成黑箱屎山,没救了
    wwhontheway
        15
    wwhontheway  
       5 小时 37 分钟前
    一开始就搞几个 agent 没必要吧,感觉复杂化了。
    sentinelK
        16
    sentinelK  
       5 小时 31 分钟前
    @ktyang
    有没有一种可能,垂直形态的工作分工才是 AI 驱动编程的更好方式?(逻辑复杂度低,上下文长度小,成果人工审核难度不大)

    没有上下文边界(比如有详尽文档就不要直接接触代码),半自动没有开发介入,且横向分工的结果就是最后就是压到后面的工序积累的误差爆炸。导致整个项目的正确产出没有任何的统计学优势。

    最终结果必然就会不稳定。
    fulln
        17
    fulln  
       5 小时 30 分钟前
    不要生成脱离掌控的代码,及时回正。 只要不符合代码规范的及时让 ai 改写
    fulln
        18
    fulln  
       5 小时 26 分钟前
    但是 注意的是, 既然 ai 驱动了, 就不要手动去改了,效率低到让人发指。 让 ai 去改就效率高很多
    duuu
        19
    duuu  
       5 小时 20 分钟前
    真的很难。我使用 opus4.5 ,重构一个前端老项目里的一个大页面,大概一万行代码都写在一个文件里。上下文严重超出,AI 无法读完全部代码,最后重构完丢失了很多功能细节。

    ai 拆分功能,一个功能一个功能做,最后生成了 80 多个文档,导致你发现问题的时候很难找到对应哪个文档。
    想写自动化测试,用 AI 写测试代码,要跑通也花费大量的时间和 token 。。

    我的流程是:AI 阅读代码->出改进文档->根据文档优化代码->提交代码->AI 审核 git 记录优化是否合理,是否有遗漏。结果每次审核都发现遗漏。

    当然如果让人来做,读一万行代码也是个灾难。。
    v2tex
        20
    v2tex  
       5 小时 16 分钟前
    v2tex
        21
    v2tex  
       5 小时 15 分钟前
    thevita
        22
    thevita  
       5 小时 15 分钟前
    因为你不是在用 AI 提效,是想逃避困难,AI 能把已知的算法写得比你好,你应该把更多精力放在真正关键的挑战上,想想业务,想想系统该怎么设计,现在成了: 有个问题搞不定了,扔给 AI 吧,还是搞不定?搞个 Agent ,如果还是搞不定就整个更复杂的 Agent
    v2tex
        23
    v2tex  
       5 小时 1 分钟前
    @v2tex 放弃发图了,

    简要来说就是要给项目一套全局信息,AST 类似人类的 DNA 或者容器的 dockerfile ,代码只是 DNA 解析的产物,可以随时放弃
    bearbest
        24
    bearbest  
    PRO
       3 小时 30 分钟前
    我的经验是作为 AI 的项目经理,不需要纠结实现的细枝末节,但是需要掌控项目架构,并在使用 AI 创建项目甚至后续迭代过程中严格引导 AI 遵循当前的架构设计。禁止非必要的不符合架构设计的逻辑实现。

    在开发新特性/修复缺陷/重构逻辑的时候,不是一股脑儿地把整个项目给 AI ,而是选择性地添加相关的文件作为本次对话的上下文。
    zjsun
        25
    zjsun  
       3 小时 14 分钟前
    宝子们加油,我等着抄你们作业🤪
    guiyumin
        26
    guiyumin  
       2 小时 29 分钟前
    1. 自己读代码
    2. 经常读代码
    3. 遇到要重构的,立刻要求重构
    4. 测试,亲自测试
    mooncakeSec
        27
    mooncakeSec  
       48 分钟前
    不讲提效,只从维护的角度,经常重构,让代码清晰,让你可以理解逻辑,看不懂就重构
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3209 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 11:57 · PVG 19:57 · LAX 03:57 · JFK 06:57
    ♥ Do have faith in what you're doing.