请教一下关于语音识别的问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 1000 天前的主题，其中的信息可能已经有所发展或是发生改变。

一个完整话的录音，里面包含杂音或多个人的声音的情况下，如何能识别成功转为正确的文字？不知道是不是的官方文档漏看了，还是使用不当，我尝试了百度、阿里、讯飞的，遇到这种情况的语音就识别错误，返回为空我也能接受，但是反馈的是什么嗯、啊的文字

怎样才能处理啊，我使用的是 python3

2 条回复 • 2023-04-29 22:29:13 +08:00

gpt5

2023 年 4 月 29 日

这个问题目前没有服务能解决，除非再加一个语言模型判断是不是人话。

abczise

2023 年 4 月 29 日

@gpt5 哪里有这种模型？