V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
106npo
V2EX  ›  OpenAI

有支持中文的语音转文字的模型么

  •  
  •   106npo · 10 天前 · 628 次点击

    试过 openAI 的 whisper ,不管是 medium 还是 large V1~V3 ,中文都被污染的非常严重.不是无法识别,就是输出中有不少广告内容.

    不知道是否有针对中文训练好的模型或者权重呢,如果能支持 Whisper-faster Whisper.cpp 就更好了

    5 条回复    2025-12-19 10:07:28 +08:00
    haiku
        1
    haiku  
       10 天前 via Android
    阿里记得有类似的
    Auston
        2
    Auston  
       10 天前
    funasr ,里面很多
    ModerRAS
        3
    ModerRAS  
       10 天前
    广告那个,有没有可能是因为静音的部分出幻觉了?那种一般做个 vad 都能破掉大部分的。其他的你可以打开硅基流动看看,那边还有一些免费的 asr 模型的,我主要用个阿里那个 sensevoice 。
    106npo
        4
    106npo  
    OP
       10 天前 via Android
    @ModerRAS 是在有背景音乐时做语音转文字的。vad 也有点误差。不过日语和英文都能很准确的转文字,只有中文没有任何有效的输出,不是空白就是幻觉广告😂
    ModerRAS
        5
    ModerRAS  
       9 天前
    @106npo 那就不知道了,我一般不太容易出这些问题,没加 vad 都还算准确,不知道你的是啥情况。我用的是 ggml 的 whisper-large-v3-turbo 。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2628 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 11:59 · PVG 19:59 · LAX 03:59 · JFK 06:59
    ♥ Do have faith in what you're doing.