V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jolly336
V2EX  ›  人工智能

AI-关于移动端自验证能力的疑问?

  •  
  •   jolly336 · 1 天前 · 302 次点击

    根据 Claude Code 的 Boris 经验分享 ( https://x.com/bcherny/status/2007179832300581177),里面提到了在 AI 编程实践中,「 AI 自行验证闭环( Self-Verification Loop )」是决定输出质量的关键能力之一。 通过为 AI 引入验证自身结果的能力(如自动运行测试、校验 UI 行为、比对预期输出),可以让 AI 在「编码 → 验证 → 修正」之间形成自动化闭环,而不是一次性生成代码即结束。 这种闭环机制本质上让 AI 从“代码生成器”升级为“具备自我纠错能力的执行体”,是实现稳定、高质量 AI 编程输出的基础。

    在移动端研发场景中,APP 应用效果强依赖真实的手机进行运行与验证,可以在 AI Coding 后构建出产物部署到手机上预览让 AI 自查。但这里涉及一个问题,如何让 AI 进入到修改的目标页面,不想每次认为手动点击?

    能想到的思路是:1 ) 对每个页面的入口点击建立一条条线路信息,可以召回让 AI 按线路进去目标页面; 2 )让 AI 利用手机的截屏来 OCR 识别自己判断进入,但过程漫长且不可控,消耗 token ;

    备注:在仓库里面还有 AB 配置的实验开关这些,细节不少。

    大家有什么好的办法吗?

    2 条回复    2026-01-27 11:07:55 +08:00
    maolon
        1
    maolon  
       1 天前
    我最近在开发 app ,感觉最简单朴素也是最实用的方法,直接写一个 e2e run book 的 md 让他读这个 file 然后按照固定行为检查(调用模拟器的 mcp )。
    另外 token 消耗这个问题基本无解,就算是现在配置过的 mcp 只返回文字 layout 和按钮 id ,在关键步骤他还是要截图然后 agent 这边读图,依然是很烧 token 的行为(不如说自动化测试就没有不烧 token 的),好消息是未来 token 会越来越便宜,变成随便烧也没事的状态
    Dabney
        2
    Dabney  
       17 小时 57 分钟前
    @maolon 老哥有最佳实践可以参考一下么?
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   947 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:05 · PVG 05:05 · LAX 13:05 · JFK 16:05
    ♥ Do have faith in what you're doing.