V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  younger027  ›  全部回复第 1 页 / 共 1 页
回复总数  12
听博士的。
战略性插眼,学习方案
28 天前
回复了 EagerTo 创建的主题 程序员 今天是 1024。
节日快乐
97 天前
回复了 spotsung 创建的主题 程序员 关于影视二创和搬运的
@spotsung 就这一整套逻辑来说,目前模型+python 可以完成(已经实验过),成本不会很高。但是有几个问题哈。
1.提出的音频质量如何,这个很影响转文字的质量,据我实验中文视频的错误率比英文会高很多,比如中文名,多音字。所以你可能需要些技术,降噪?去回音?
2.大模型的翻译(中--》英,韩,日)质量都不高,google 的付费翻译接口,也只是个平均值的效果。
3.目前 tts 的效果确实不错,声音效果不错。chattts,cosyvoice,gptsovits 都可以试试看。
4.我尝试过音轨合并,然后合成到原来的视频上,这一部很难,效果不好。主要是 1.换语言后,句子发音长短不一样。2.整体合并的效果很不好,听起来很别扭。(我使用 python 包搞的,如果你的效果好的话,也可以分享下。)

基本我经历的就这么几个问题,你可以试试看。毕竟不动手,啥问题也没有。动手了,问题和我也不一定一样。
99 天前
回复了 spotsung 创建的主题 程序员 关于影视二创和搬运的
@vacuitym 音频转文字吗?开源的模型有试过吗?
104 天前
回复了 awanganddong 创建的主题 Go 编程语言 golang 依赖循环的问题。
人家问问题,你会就解答,不会就闭嘴。最烦 10 楼的,讲了一堆 pi 话,来显示自己来了?
直接 cf R2 走起就好了 免费
@zhutianjingtu 你是真会算啊 xd
什么领域的呢?你这个太宽泛了
188 天前
回复了 coderMonkey 创建的主题 游戏 现在还有玩 LOL 的吗
喜欢喷人的,可以组队吗?手动狗头
194 天前
回复了 maidenAssassins 创建的主题 问与答 那个丑丑的头像怎么弄的,教教我
俺也来了
谢谢大佬,MTUzODY5NzM5MkBxcS5jb20=
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1376 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 17:39 · PVG 01:39 · LAX 09:39 · JFK 12:39
Developed with CodeLauncher
♥ Do have faith in what you're doing.