1
XanderChen 2020-04-04 13:43:58 +08:00
emmmm...找个厉害的音频编辑软件,看看有没有独立音轨?然后提取出来?
(是不是叫音轨?有错请指正。) 大概就能想到这方法。还是你想用代码写个提取的工具,ffmpeg 看看有没有相关的方法? 如果没有独立音轨...emmm... 那就等大佬的方案吧... |
2
JerryCha 2020-04-04 14:52:57 +08:00 1
不知道
大概频域处理吧,两个人的说话声音肯定不一样,响度也可能不一样 当然各自独立一条轨道肯定最容易处理 |
3
V69EX 2020-04-04 14:57:10 +08:00
像 youtube 用的那种语音转字幕的软件,应该可以,字幕上有时间,根据转换后的文字是中文还是英文来反过来将视频分片。
|
4
V69EX 2020-04-04 14:57:48 +08:00 1
就算软件只能识别英文也没问题,不能识别的就当中文了。
|
5
llj5935 2020-04-04 15:10:50 +08:00 1
讯飞听见的语音技术可以识别中文中夹杂的英文单词,说明其算法能力具备识别中英文的功能。但是他们还没有做剪辑剥离,相信既然能识别,做剥离是很简单的了。
|
6
cnleoyang OP |
8
diggerdu 2020-04-04 15:31:38 +08:00 via iPhone 1
如果不是一个人说过的可以先做 speaker diarization
|
12
w1573007 2020-04-04 16:52:01 +08:00 via Android 1
开源项目:spleeter 。主要是音频人声分离,不过这个主要是对音乐中的人声进行提取,生成干音。楼主可以试试,我用它分离干音品质可以进行重新混音
|
15
winterbells 2020-04-04 21:55:00 +08:00
你这个 idea 实现起来有点 difficult 啊
|
16
CaiXiaobai 2020-04-04 22:09:05 +08:00
科大讯飞有 声音识别转文字,你值得拥有
|
17
liuzhiyong 2020-04-05 13:25:26 +08:00
同意楼上的,这方面科大讯飞比较猛,用过他们的 TTS,非常牛。
|