最近有个语音识别的问题,就是怎么处理断句呢,比如我说了一句话,紧接着说另一句话,我现在的处理是按照固定的时间去识别,比如录了 2 秒之后去识别,这就导致一个问题,这 2 秒内可能有两句话,但另一句可能只说了一半就被录下,导致整个识别之后的句子就不通顺,所以请教各位大佬,这里应该怎么处理,才能让语句识别的更精确一点
1
xuelang 310 天前
试试 azure 的 speech_to_text ?
|
2
pipixiarwksb OP @xuelang 这个我来试下
|
3
raycool 310 天前
|
4
pipixiarwksb OP @raycool 好的 哥 我试下
|