V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
ns2250225
V2EX  ›  分享创造

造了个同声传译应用,欢迎使用交流~

  •  
  •   ns2250225 ·
    ns2250225 · 3 天前 · 653 次点击

    项目地址: https://github.com/ns2250225/Simultaneous-Interpretation

    界面预览:

    备注: 记得创建.env 文件,可以配置中转的 url 地址,保证网络能访问就行

    actopas
        1
    actopas  
       3 天前
    还没用同声传译怎么避免类似实时转录里的那种修正字幕行为
    ns2250225
        2
    ns2250225  
    OP
       3 天前
    @actopas #1 不是很明白,什么是修正字幕行为鸭
    actopas
        3
    actopas  
       3 天前
    @ns2250225 就是实时转录会有识别失误比如一个词识别成另外一个翻译出来就是不同的意思了,这种失误会在一句话快要完整说完的时候确定下来最终这句话到底是什么,而说话的全过程都在不停修正这句话,有考虑这个问题吗
    ns2250225
        4
    ns2250225  
    OP
       3 天前 via Android
    @actopas 好像用大一点的模型识别正确率就会提高一点
    ns2250225
        5
    ns2250225  
    OP
       2 天前
    @actopas #3 除了选参数更大的 asr 模型外,大模型也可以重写识别的结果鸭
    wangyangbjkk
        6
    wangyangbjkk  
       1 天前 via iPad
    延迟多少这个 大模型 ChatGPT 的 api 是不是慢 用 deepl 的 api 试试延迟多少
    ns2250225
        7
    ns2250225  
    OP
       1 天前 via Android
    @wangyangbjkk 这个项目支持所有 openai 格式的模型的,填 url 就行,意味着可以用本地部署的模型或者用 deepseek 或者 qwen ,glm 等 api
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2740 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 13:58 · PVG 21:58 · LAX 05:58 · JFK 08:58
    ♥ Do have faith in what you're doing.