V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Livid
240.34D
592.53D
V2EX  ›  OpenAI

来自预测市场 Polymarket: 2025 年哪家公司做了最好的大模型?

  •  
  •   Livid ·
    PRO
    · 22 小时 54 分钟前 · 1003 次点击
    Solana
    V2EX 支持通过 Solana 网络向内容作者打赏
    JoeJoeJoe 打赏了 20 $V2EX
    9 条回复    2025-12-27 11:22:28 +08:00
    Dorathea
        1
    Dorathea  
       22 小时 41 分钟前
    为什么 Google 一骑绝尘?
    不至于差这么多啊
    tanranran
        2
    tanranran  
       22 小时 40 分钟前
    @Dorathea 有全世界最大的用户内容数据库,有很多上亿用户的产品可以应用落地
    Inn0Vat10n
        3
    Inn0Vat10n  
       22 小时 3 分钟前
    @Dorathea 因为这个预测是根据模型评测榜来的,而 google 的模型目前在这个排行榜排名第一,另外 25 年也快过完了,其他家发布新模型评测结果赶上的概率不大
    xing7673
        4
    xing7673  
       21 小时 47 分钟前
    说实话 gemini 3 幻觉率还是高,随便用用得了。
    很多问题还是没解决
    dcsuibian
        5
    dcsuibian  
       21 小时 14 分钟前   ❤️ 1
    谷歌数据没输过,体验没赢过
    potatowish
        6
    potatowish  
       20 小时 52 分钟前 via iPhone
    Gemini 这模型能力像是数据堆出来的,指令遵循程度不如 ChatGPT ,幻觉率也高。
    IwfWcf
        7
    IwfWcf  
       14 小时 43 分钟前   ❤️ 1
    @Dorathea 结果的判定标准是 Chatbot Arena LLM 的榜单,参与的人是想赢钱而不是真的在投票
    labubu
        8
    labubu  
       12 小时 0 分钟前
    google gemini 3 pro 是真的好用
    Egfly
        9
    Egfly  
       10 小时 11 分钟前
    最近在做视频理解相关的项目,gemini 3 pro 全方位吊打所有人
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2729 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 13:34 · PVG 21:34 · LAX 05:34 · JFK 08:34
    ♥ Do have faith in what you're doing.