V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
IBMall
V2EX  ›  分享发现

Meta 开源全新音频压缩技术 EnCodec,比 MP3 小 10 倍

  •  
  •   IBMall · 2022-11-06 19:38:33 +08:00 · 2216 次点击
    这是一个创建于 740 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Meta 旗下基础人工智能研究 (FAIR) 团队在 AI 驱动的音频超压缩领域取得了成功,构建了一个由三部分组成的系统,并对其进行端到端训练,以将音频数据压缩到目标大小,然后可以使用神经网络对这些数据进行解码。与 64 kbps 的 MP3 相比,Meta 的新技术 EnCodec 实现了大约 10 倍的压缩率,而且没有质量损失。

    Meta 表示,该技术尚未涵盖视频,但目前已在计划中,其目标是改进视频会议、流媒体电影以及在 VR 中与朋友玩游戏等的音频体验。EnCodec GitHub

    转自

    9 条回复    2022-11-07 08:26:13 +08:00
    konecho
        1
    konecho  
       2022-11-06 19:47:58 +08:00   ❤️ 1
    先放个信息论在这里
    RiverMud
        2
    RiverMud  
       2022-11-06 19:54:45 +08:00 via iPhone   ❤️ 2
    还是美剧《硅谷》里的那个压缩算法 nb 。
    cpstar
        3
    cpstar  
       2022-11-06 20:01:13 +08:00
    一个大胆的想法,传输的并非原始数据,而是 AI 构建的算法,就是源端用 AI 生成构建算法,AI 在目标端按照算法实时合成。
    所以,并不存在压缩,而是摘要,1#的信息论就不存在了。
    systemcall
        4
    systemcall  
       2022-11-06 20:08:19 +08:00
    @cpstar #3
    纯语音的话,我记得这几年确实有公司做过,英伟达好像就搞过,码率比 amr 还低,但是效果还不错
    gzlock
        5
    gzlock  
       2022-11-06 21:21:07 +08:00
    google 也有一个类似的项目
    https://github.com/google/lyra
    ericls
        6
    ericls  
       2022-11-06 22:23:39 +08:00 via iPhone
    从文章提取关键词
    传输关键词
    另一头用 AI 根据关键词写作?
    cest
        7
    cest  
       2022-11-06 23:42:33 +08:00
    @cpstar #3 这不就是两端都自带一个巨大 dictionary
    ungrown
        8
    ungrown  
       2022-11-07 00:25:19 +08:00 via Android
    和 mp3 比怎么好意思的,有本事跟 opus 比
    chenqh
        9
    chenqh  
       2022-11-07 08:26:13 +08:00
    虽然有点钻牛角尖,但是我还是想法,你音频算法这么 NB,为什么短视频看不到呢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1186 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 18:30 · PVG 02:30 · LAX 10:30 · JFK 13:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.