1
wweerrgtc 2024-11-25 10:02:12 +08:00
语音转文字的工具, 都可以区分是谁在说话
|
2
fengci 2024-11-25 10:03:48 +08:00
一些公司的成品,有会议记录功能,都有看到这个功能。
|
3
Frankcox OP @wweerrgtc Whisper 命令行直接运行可以进行区分吗?我之前用 whisper 只语音转文字过,没试过区分。
|
6
raydied 2024-11-25 10:36:05 +08:00 via Android
模仿飞书或腾讯会议吗?一般用声纹识别的方案。
|
8
cyp0633 2024-11-25 10:55:11 +08:00
whisper.cpp 应该支持 NER ,但应该是需要搭配特定模型的,然后还有这篇文章 https://arxiv.org/abs/2409.08107 或许也相关
|
9
sighforever 2024-11-25 11:02:33 +08:00
阿里出的 funasr 工具包
|
10
mumbler 2024-11-25 11:17:44 +08:00
就是说话人识别,用 whisperX, win 桌面直接用 https://github.com/Purfview/whisper-standalone-win 即可,Faster-Whisper-XXL.exe 命令行工具,免安装部署
|
11
San668 2024-11-25 12:14:19 +08:00
好像目前 ai 就阿里做的还可以,还免费 叫通义听悟
|