我在学前端的时候刷到一个讲解什么是纯函数的视频, 声音是 AI 生成的,但他用的这个音色非常特殊, 不是各大语音合成厂商提供好的预制角色, 火山引擎和微软 Azure 里的预制音色都没找到他这种音色, 这种音色是他自己调的吗,是用 Azure 定制性训练出来的么
源视频:什么是纯函数 https://www.bilibili.com/video/BV1QM41197sz/
1
gaobh 2023-11-05 11:54:25 +08:00 via iPhone
腾讯云和阿里云的合成看看
|
2
WarlockMan OP @gaobh
国内的几个大厂都看过了,预制角色里面没这种音色,像是自己用材料训练的定制音色。 目前语音合成领域前沿大厂有微软,谷歌,字节跳动旗下的火山, 目前就体验这几家能把声音做到自然, 百度,阿里和腾讯的引擎有很重的机械音,能听出非常不自然,感觉在梯队上差了一级。 现在的微软 Azure 语音合成在"自然"这个指标上应该是最高的, 大概在七八年前好像,微软有个语音助手的项目叫 cortana , 从那个时候微软就在死磕拟真程度, 那时候它的自然度就已经是这么高了。 字节的火山引擎我猜测大概率是调用的微软接口, 大厂就这么几家,也就是微软在一直烧钱死磕 AI 领域十多年, 其他厂商想赶上短时间应该很难, 所以我猜测大概率是用的微软 Azure 接口训练的定制音色, 但我只是猜测,不敢肯定 |
3
asrpub 2023-11-05 12:19:10 +08:00 via Android
就是普通的 TTS 吧,多找找其他的厂商,像魔音工坊也可以看看
|
4
LLaMA2 2023-11-06 09:45:03 +08:00 1
|