V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  nocmt  ›  全部回复第 1 页 / 共 10 页
回复总数  183
1  2  3  4  5  6  7  8  9  10  
@korvin #17 你要有时间的话,可以给你开腾讯会议远程调试一下。联系我 bm9jbXRvbmVAZ21haWwuY29t
@korvin 输出不用选 BlackHole 2ch (输入选这个)
,另外查看系统设备的 麦克风音量显示那边有没有变化

手机这边有没有允许麦克风输入?要给浏览器权限和这个页面麦克风权限。看你手机截图貌似没有开启麦克风
@paopjian 也不多,主要是指令要明确(起码看得懂代码),然后就搞定了。
@aresyang 最近好多 AI 语音输入法,所以才有这个想法,另外主要是这些输入法可以解析音频修改后输出。
1 月 16 日
回复了 seven777 创建的主题 奇思妙想 我有这个需求,请教老师们如何实现较好
总结一下,建议本地运行相关大模型,不然费用非常非常高(毕竟语音识别按秒收费)。
2026 年 1 月 13 日 V1.1.3
● 新增字幕显示方式:双语、仅原文、仅译文
● 优化音频采集转录逻辑,使用流式处理替代文件读写,显著降低功耗并提升性能
● 优化悬浮窗显示效果

2026 年 1 月 12 日 V1.1.1
● 修复语音识别使用云端模型时保存配置检查报错问题
● 修改默认文本翻译配置为硅基流动
● 设置页面新增目标语言选择(支持多种常见语言)
● 语音识别新增过滤无效词处理

2026 年 1 月 10 日 V1.1.0
● 新增麦克风拾音功能,支持系统音频/麦克风切换
● 新增软件激活功能
● 新增粤语识别支持
● 适配无障碍服务以支持通话音频录制
● 优化权限检查流程和提示
@metalvest 提供部署或者对接服务,你用云端的也可以,自己搭建主要是不要钱。
我也接受收费协助部署后端服务(包含 ASR 和 LLM ),10 块钱就行。
@renchong 你怎么打包下载呢?里面的东西按需下载就好
@renchong 包含了大模型呀
@renchong 可以呀,字幕类型选择通知栏。
2025 年 11 月 28 日
回复了 doctorzry 创建的主题 程序员 求 Windows+MacOS 剪切板历史同步方案
2025 年 11 月 27 日
回复了 colorbeta 创建的主题 Android Android 有什么很方便的 wifi 网页传输文件的软件么
https://fengling.nocmt.com/

用这个吧,效果很好。
2025 年 9 月 15 日
回复了 nocmt 创建的主题 分享创造 给 LM-Studio Server API 做了个代理,增加联网搜索能力
@miaoxiaomayi #8 对,这样就会直接生成
2025 年 9 月 15 日
回复了 nocmt 创建的主题 分享创造 给 LM-Studio Server API 做了个代理,增加联网搜索能力
1  2  3  4  5  6  7  8  9  10  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1972 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 16:00 · PVG 00:00 · LAX 08:00 · JFK 11:00
♥ Do have faith in what you're doing.