大家好,最近受 Wispr Flow 的启发,我自己做了一个 macOS 上的 AI 语音输入法,名字叫 秒言,目前只支持 macOS 。
我自己是高频输入用户,日常在写代码注释、产品文档、长文本时,越来越不想打字。但实际用下来,大多数语音输入工具都有一个共同问题:
识别完还得改,而改字的成本并不低。
我做这个产品的目标只有一个:
在中文环境下,尽量做到「说完就能直接用」,而不是「说完再编辑」。
这是被问得最多的一个问题。
不做本地识别,原因其实很直接:
目前本地 ASR 在中文准确率上仍然存在明显短板
实际体验往往是:每次输入后都需要修正几个字
对我来说,这已经破坏了语音输入本该带来的效率提升
因此,秒言采用的是 云端 ASR + 强后处理 的方案,目标不是“能用”,而是:
尽量少改,甚至不改。
简单概括当前阶段的侧重点:
中文识别速度与准确率优先
针对真实输入场景做了大量后处理
中英文混输
口语表达修正
尽量减少打断式 UI ,输入完成后直接回填到当前输入框
在我自己的日常使用中,大多数场景已经可以做到 0 编辑或极少编辑。
比较适合:
macOS 用户
写文档、写说明、写长文本
已经对「传统语音输入需要频繁修改」感到厌烦的人
可能不太适合:
强依赖完全离线使用的场景
对云端方案完全无法接受的用户
对开发人员额外做了一些偏“效率工具”的能力:
在 Shell 终端中
可以直接说出你想执行的命令
例如:
“查看当前系统磁盘占用情况”
会直接输出:
df -h
在编辑器中
需要写正则时可以直接描述意图
例如:
“帮我写一个正则,查找所有电话号码”
目前还在持续迭代阶段,欢迎直接试用。
如果你也在 macOS 上大量输入中文,或者对语音输入体验有更高要求,非常欢迎试一试。任何真实反馈,对我来说都很有价值。
1
tuitangli OP 欢迎大家使用
|
2
xunqin 5 天前
|
3
evilrabbit 5 天前
看起来不错呀,支持一下
|
4
tuitangli OP 感谢支持
|
5
korvin 4 天前
支持支持,最近冒出来好多语音输入法
|