V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
q534
V2EX  ›  分享发现

Claude 推出金融服务,这是近期看过最抽象的新闻,是我理解有问题吗

  •  
  •   q534 · 41 天前 · 1229 次点击
    这是一个创建于 41 天前的主题,其中的信息可能已经有所发展或是发生改变。
    想象一下你有一个超智能的 excel 表格,但是准确率只有 55%。这东西准确率不达到 99.xxx% 有人敢用吗

    来源: https://www.anthropic.com/news/advancing-claude-for-financial-services

    "These updates build on Sonnet 4.5’s state of the art performance on financial tasks, topping the Finance Agent benchmark from Vals AI at 55.3% accuracy."
    3 条回复    2025-10-28 12:22:36 +08:00
    maichael
        1
    maichael  
       41 天前
    你但凡点进去「 Finance Agent benchmark 」就能知道 55.3% 这个表现已经是现在所有大模型里面排行第一的,而且比第二强很多。
    q534
        2
    q534  
    OP
       41 天前
    @maichael 六年级学生的数学还比二年级强很多呢,你让他给你报税吗?我的意思是,fundamentally AI 金融服务是行不通的。因为金融需要准确,任意一个公司的会计都有一大堆 excel 来计算保证各项数据的准确。况且,这个“最优秀”的学生,也只有一半的准确率。
    superares
        3
    superares  
       41 天前 via Android   ❤️ 1
    @q534 有没有可能,在美国,不少人水平不如六年级学生
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5312 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 08:10 · PVG 16:10 · LAX 00:10 · JFK 03:10
    ♥ Do have faith in what you're doing.