V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
neteroster
V2EX  ›  OpenAI

Claude 3 Haiku 已经可用

  •  
  •   neteroster · 255 天前 · 2801 次点击
    这是一个创建于 255 天前的主题,其中的信息可能已经有所发展或是发生改变。

    前些天,Anthropic 宣布发布 Claude 3 系列模型,包含 Opus (大号),Sonnet (中号)以及 Haiku (小号)三大模型。发布时,只有 Opus 和 Sonnet 立即可用。

    根据 Chatbot Arena[1] 的统计,Opus 当前已经在 95% 置信区间内与 OpenAI 当前最强模型 GPT4-Turbo 打成平手; Sonnet 也超越了老款 GPT4-0314 与 GPT4-0613 。

    根据个人体验,以及在 X ,Telegram 群组与其他一些来源收集到的体验信息,Opus 在代码能力普遍被认为相对 GPT4-Turbo 具有一定优势。

    昨天,Haiku 正式可用,具有如下主要特点:

    1. 便宜。输出输出分别:0.25$/1.25$ 每百万 Tokens 。相比之下,gpt-3.5-turbo 0.5$/1.5$ 每百万 Tokens 。
    2. 200K Tokens 上下文窗口,远超 gpt-3.5-turbo( 16K )。(单次输出仍然限制为 4K Tokens )
    3. 支持图片输入。
    4. 在各项基准测试中均(显著)领先 gpt-3.5-turbo
    5. 非常快!

    同样地,基于个人体验以及身边的统计学,Haiku 确实表现出了很好的综合能力,在大部分需求中可以替代 GPT 3.5 。

    令我印象最深刻的是,它的识图能力很好。要求其充当 OCR 工具,对中文文本与数学公式的识别准确率远超 gpt-4-vision-preview。除了一些不常见的汉字容易识别出错之外,其余部分都不错。(用过 GPT4V 的应该知道那玩意识别中文烂成啥样)

    [1] Chatbot Arena 基于互联网用户盲测,对模型打分排名,相对贴近实际应用,因而有一定实际参考价值。

    另外,个人角度上,也希望大家能多关注非 OpenAI 的大语言模型,以及各种开源模型,这对这一领域的健康持续发展也是很重要的。

    10 条回复    2024-03-16 05:14:58 +08:00
    neteroster
        1
    neteroster  
    OP
       255 天前
    这里有一个免费的测试链接(不过没法发图): https://labs.perplexity.ai/
    右下角改为 claude-3-haiku 即可。
    ErYiii
        2
    ErYiii  
       255 天前
    有没有 Claude 分流规则🧐🧐
    natsunoshion
        3
    natsunoshion  
       255 天前 via iPhone
    claude 官网老是封我号,不知道什么原因
    Noicdi
        4
    Noicdi  
       255 天前
    自 claude3 出来我就在用 Sonnet ,不知道是不是每日限额还是啥的,感觉上比 GPT 3.5 好用
    chitanda
        5
    chitanda  
       255 天前
    Sonnet 确实好用,中文读起来很舒服,gpt4 的中文,味儿太浓了。Claude pro 不知道能不能用国内银行的 visa 开通,怕被封一直没试过
    iyaozhen
        6
    iyaozhen  
       255 天前
    poe 上的 Sonnet 感觉已经够用了,已经抛弃 GPT 3.5 了
    RichardChou
        9
    RichardChou  
       255 天前
    我也感觉 Claude3 比 GPT 强,不过 Claude 条数比较少,封号又严重
    Contextualist
        10
    Contextualist  
       254 天前   ❤️ 1
    我的某个创业朋友表示已经把主要业务逻辑从 GPT-4-Turbo 切换到 Claude 3 Opus 了,说是 Opus 在逻辑推理和遵循指令上有明显优势。这让我对 Claude 仅擅长行文修辞的老印象有所改变了。
    经过了之前的低迷期,Anthropic 似乎又支棱起来了啊
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1183 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 18:26 · PVG 02:26 · LAX 10:26 · JFK 13:26
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.