Meta 开源全新音频压缩技术 EnCodec，比 MP3 小 10 倍 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 1172 天前的主题，其中的信息可能已经有所发展或是发生改变。

Meta 旗下基础人工智能研究 (FAIR) 团队在 AI 驱动的音频超压缩领域取得了成功，构建了一个由三部分组成的系统，并对其进行端到端训练，以将音频数据压缩到目标大小，然后可以使用神经网络对这些数据进行解码。与 64 kbps 的 MP3 相比，Meta 的新技术 EnCodec 实现了大约 10 倍的压缩率，而且没有质量损失。

Meta 表示，该技术尚未涵盖视频，但目前已在计划中，其目标是改进视频会议、流媒体电影以及在 VR 中与朋友玩游戏等的音频体验。EnCodec GitHub

9 条回复 • 2022-11-07 08:26:13 +08:00

1

konecho

2022 年 11 月 6 日

1

先放个信息论在这里

2

RiverMud

2022 年 11 月 6 日 via iPhone

2

还是美剧《硅谷》里的那个压缩算法 nb 。

3

cpstar

2022 年 11 月 6 日

一个大胆的想法，传输的并非原始数据，而是 AI 构建的算法，就是源端用 AI 生成构建算法，AI 在目标端按照算法实时合成。
所以，并不存在压缩，而是摘要，1#的信息论就不存在了。

4

systemcall

2022 年 11 月 6 日

@cpstar #3
纯语音的话，我记得这几年确实有公司做过，英伟达好像就搞过，码率比 amr 还低，但是效果还不错

5

gzlock

2022 年 11 月 6 日

google 也有一个类似的项目
https://github.com/google/lyra

6

ericls

2022 年 11 月 6 日 via iPhone

从文章提取关键词
传输关键词
另一头用 AI 根据关键词写作？

7

cest

2022 年 11 月 6 日

@cpstar #3 这不就是两端都自带一个巨大 dictionary

8

ungrown

2022 年 11 月 7 日 via Android

和 mp3 比怎么好意思的，有本事跟 opus 比

9

simple2025

2022 年 11 月 7 日

虽然有点钻牛角尖,但是我还是想法,你音频算法这么 NB,为什么短视频看不到呢

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 5532 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 1501ms · UTC 06:44 · PVG 14:44 · LAX 22:44 · JFK 01:44
♥ Do have faith in what you're doing.