1
em70 2023-10-20 21:49:24 +08:00
是 openai 训练的一个叫 next to audio 的模型提供的服务,API 可能 11 月 6 日会发布
希望这种周边模型像 whisper 一样能开源出来 |
3
em70 2023-10-20 22:37:51 +08:00
@bywenshu #2 twitter 上看到的,还没发布,可能正式发布不是这个名字.已知信息是.openai 用大模型技术做的语音合成
|
4
youthfire 2023-10-20 22:40:26 +08:00 via iPhone
@em70 #1 开源的那个 whisper 快吗?我没跑过,用的 api 速度倒是非常快,就是量大了也费钱
|
5
yanyao233 2023-10-21 08:35:25 +08:00 via Android 1
@youthfire 现在有 whisper jax ,whisper cpp ,这两个比官方的 whisper 开源版快很多,可以试一试。模型 api 用的就是 large v2 ,应该效果是一样的
|
8
youthfire 2023-10-21 09:48:39 +08:00 via iPhone
@bywenshu #6 因为一楼正好提到了 whisper 。它本身就有开源免费又有收费 api 两套方案,就顺便问问速度差距。因为之前在其他网站看到说开源的速度很慢,自己也没跑过。
|
9
yiencho 2023-10-21 12:59:45 +08:00 1
就是文本转语音,api 还没开放给普通用户,我看到开放给 spotify 的新闻了,下面这个
https://newsroom.spotify.com/2023-09-25/ai-voice-translation-pilot-lex-fridman-dax-shepard-steven-bartlett/ spotify 用它来生成多语言的播客 |