百度提供免费的语音接口,想做个实时语音转写文字的 app,特此发帖求推荐哪些源码项目比较合适?
想借鉴某些源码思路,写个字幕式的,效果和小米闻声 app 差不多吧
可以求讯飞听见,小米闻声 app 类似的源码?
我不知道小米闻声怎么做到实时转写文字的,我能想到的无非分割音频文件,每个音频 1s,转成 PCM 格式进行上传,等收到数据包提取转换后的文字再输出,但一句话说完,这句话的音频文件转换后的文字没法看。。。
1
ch2 2021-05-12 18:40:12 +08:00
语音识别你分割了就丧失了前后文语境,肯定识别不出来的
你想要实时的那就是本机实时预测,具体怎么做是人家的商业秘密,不可能让你白嫖的 |
3
ALLROBOT OP 免费不行,就上付费的
|
4
cutemurphy2888 2021-05-12 19:24:56 +08:00
腾讯的同声传译
|
5
gainsurier 2021-05-12 19:48:40 +08:00
苹果本地有 api 可以直接调用
|
6
agoodob 2021-05-12 21:48:12 +08:00
实时? websocket 呗。
如果不用实时的,而且手头有 .mp3 .aac 等音视频文件希望拖到一个程序里直接转文字,看一下: https://github.com/1c7/Translate-Subtitle-File |
7
inhzus 2021-05-12 22:06:18 +08:00 via iPhone
直接用现成的实时语音转文字,已经非常成熟了,别折腾自己。阿里云、腾讯等等都有,市场价 1-2 元每小时
|
8
ethanlu 2021-05-12 22:12:58 +08:00
|
9
ALLROBOT OP @inhzus 那怎么引入那些成熟的产品接口。。。?我想搞个 AR 版的语音转文字,类似电子游戏的字幕一句句浮现眼前的效果
|
10
ALLROBOT OP @gainsurier 苹果没试过,可以去试试
|
11
ALLROBOT OP @gainsurier 你这么一说,我想起了微软好像也有,我去瞧瞧
|
13
ALLROBOT OP @inhzus https://ai.baidu.com/ai-doc/SPEECH/qk76b444d 已经在看百度语音的 sdk 手册了
@agoodob 了解 websocket 了,语音识别我没怎么接触,第一次接触这方面的。。。抱歉哈,在看 sdk 手册了,如楼上所言,根据 sdk 进行开发吧 |
14
muhuan 2022-01-30 11:54:29 +08:00
楼主最后选择的哪个?我也有一些 1h 左右的语音,想转化为文本
|