想象中能切成一句话一个文件的样子,大家有没有见过此类工具呢... 没有的话就要自己写了...
2
love 2020-04-12 11:32:57 +08:00
我搞过一个轮子,发现字幕文件的时间并不精准,在观看整个完整电影的时候是查觉不出来的,但分句就有问题了,如果人讲的话长一点,很多时候分出来会少半个词。。。除非一次切相近大段话成一个文件,比如设定 2 秒内讲的话全放在一起,但这样效果有时也不好(看电影情况)
|
3
rock_cloud 2020-04-12 11:38:54 +08:00
建议找现成的 ASR api,一般都会带时间戳输出的
|
4
klesh 2020-04-12 12:32:33 +08:00
有字幕文件吗?里面都带有时间戳。
音频分离和切割可以用 ffmpeg 。 这个用 shell 脚处理一下应该很方便。 |
5
Hades300 OP @revalue 好的 目前基于 ffmpeg 找到了一个分离视频的 https://github.com/foone/SplitBySubs/
|
7
Hades300 OP |
8
rock_cloud 2020-04-12 16:18:37 +08:00
@Hades300 可能你误解了,我的意思是找语音识别的接口,这种接口会给出每个字准确的时间,能够精确到百分之一秒,如果你需要这样高精度的时间戳的话
|
9
mgrddsj 2020-04-13 01:39:39 +08:00
|