V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
molvqingtai
V2EX  ›  程序员

AI 驱动浏览器操作实现原理?

  •  
  •   molvqingtai ·
    molvqingtai · 13 小时 40 分钟前 · 911 次点击

    最近看到 google 的一个 AI 插件,可以让 AI 操作浏览器收集信息,对 AI prompt 了解甚少,对它的实现原理很感兴趣

    插件视频: https://www.youtube.com/watch?v=2XJqLPqHtyo

    6 条回复    2024-12-23 01:35:46 +08:00
    clhcowboy
        1
    clhcowboy  
       13 小时 21 分钟前
    浏览器插件可以获取到你需要的信息
    herich
        2
    herich  
       12 小时 28 分钟前
    比较关注的是 AI 驱动的浏览器能否高正确率的通过各种网站的 anti bot 机制
    hongjic93
        3
    hongjic93  
       8 小时 51 分钟前
    AI (文本加视觉模型)+ 浏览器自动化工具。

    工具比如 browserbase: https://github.com/browserbase/stagehand
    有用是有用,但可靠度要看不同厂商在对自家内容平台保护的力度。道高一尺魔高一丈
    kulove
        4
    kulove  
       8 小时 47 分钟前
    之前做过类似的 Demo ,读取 HTML 网页+截图来做的(单一的不准确),因为插件不能注入代码,所以封装了诸如点击、滚动、输入的各种事件,效果么还行,就是成本爆炸,所以没有上线。
    lizhenda
        5
    lizhenda  
       6 小时 57 分钟前
    一般是基于视觉,感觉成本很高啊。并且获得的数据准确性存疑。
    YuanJiwei
        6
    YuanJiwei  
       5 小时 49 分钟前
    哈哈,巧了,我现在正在探索利用 pupputeer 实现 Google Mariner 的各种方案
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1056 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 23:25 · PVG 07:25 · LAX 15:25 · JFK 18:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.