V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
TWorldIsNButThis
V2EX  ›  分享发现

ai 已经几乎可以拟合人类的唱歌的音色了

  •  1
     
  •   TWorldIsNButThis · 2023-04-11 22:37:33 +08:00 · 2423 次点击
    这是一个创建于 578 天前的主题,其中的信息可能已经有所发展或是发生改变。
    一些以音色见长的歌手的非边缘区域的声音还原得尤为逼真
    比如 ai 孙燕姿
    [「 AI 孙燕姿 」《下雨天》 cover 南拳妈妈] https://www.bilibili.com/video/BV1Rc411W7ba
    7 条回复    2023-04-12 15:36:38 +08:00
    z4oSkDNGGC2svsix
        1
    z4oSkDNGGC2svsix  
       2023-04-12 00:14:04 +08:00
    求相关技术的关键字
    foam
        2
    foam  
       2023-04-12 00:38:58 +08:00 via Android
    有关键字不 老哥们
    shuxiaokai
        3
    shuxiaokai  
       2023-04-12 01:17:14 +08:00 via Android   ❤️ 1
    @foam so-vits
    maolaohei
        4
    maolaohei  
       2023-04-12 01:17:36 +08:00 via Android
    现在模仿音色的有(干声)高要求 diffsvc ,低要求 sovits rvc ddps ,我用了 sovits 感觉还行
    zhangleijuly
        5
    zhangleijuly  
       2023-04-12 09:10:25 +08:00
    上周看创业直播相关的产品已经都有了,不过还存在版权等问题
    baobao1270
        6
    baobao1270  
       2023-04-12 09:52:47 +08:00
    AI 有两种,或者说四种
    从呈现结果来说,一种叫 SVC ,就是唱歌的;一种叫 TTS ,就是传统的生成说话音频
    从处理方式来说,一种是 DiffSinger 为代表的合成器,通过输入乐谱( MIDI 等)来合成声音;一种是 VITS 为代表的换声器,就是把一段音频的音色换成另一个的音色
    kloseWu
        7
    kloseWu  
       2023-04-12 15:36:38 +08:00
    @x02 so-vits
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1995 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 16:15 · PVG 00:15 · LAX 08:15 · JFK 11:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.