V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
oldcai
0.01D
V2EX  ›  分享创造

[免费] LazyTyper:用「嘴」写代码,给 Claude Code 发语音(Mac 首发)

  •  5
     
  •   oldcai ·
    PRO
    ·
    oldcai · 2025 年 8 月 10 日 · 13878 次点击
    这是一个创建于 160 天前的主题,其中的信息可能已经有所发展或是发生改变。

    吸上 Vibe Coding 这段时间,我发现和 Claude Code 聊天最大的痛点不是 token 不够,而是要输入的字太多。长 prompt 、长解释,手敲真累。

    我把市面上语音输入法都试了个遍:要么贵、要么卡、要么贵还卡。干脆自己写了一个“按住说话、松开出字”的小工具。

    越用越顺手:除了和 Claude Code 对需求、调 bug 、写 commit ,各种 prompt……

    现在也不用吐槽微信电脑版为啥没有语音识别了

    我现在已经很少用键盘长篇打字了。

    既然自己爽了,就免费分享给大家。

    LazyTyper = 语音写代码,双手解放。

    • 按住全局快捷键说话,松开即把文字插入到光标处( VS Code / 终端 / 浏览器 / 微信,有输入框就行)
    • 自动标点、多语言,自然说就行
    • 体感 3–7× 更快(长 prompt 尤其明显)

    支持的语音识别引擎

    四选一,都有用不完的免费额度,还可随时切换

    Groq ( Whisper )、Mistral ( Voxtral )、AssemblyAI 、豆包语音

    平台 & 价格

    • macOS 首发(如果大家喜欢,会尽快做 Windows 版)
    • 免费,无广告!

    官网与下载:https://lazytyper.com/zh

    Bug 、建议、Windows 版、支持其他模型,等等,有什么问题都可以留言,我会跟进完善。

    第 1 条附言  ·  2025 年 8 月 15 日
    @charlesss 已经更新,是否保持麦克风权限,现在可以设置了。
    @Znemo 已修复。隐私和统计可以保存啦。
    @conge @iorilu @korvin @musi @c4fun @LAMBO @clarkyu @qhd @sillydaddy @LinJunzhu

    请到官网 https://lazytyper.com/zh 升级到 1.1.8 版本,现在已经修复了之前的问题,而且又支持了新的后端 ElevenLabs 。
    在测试过程中,我发现 ElevenLabs 是中英文混输最准确的,比所有的基于 Whisper 的方案都要准确。
    特别是在说变量名的时候,它甚至都可以直出驼峰的格式,但是竟然也不影响说英文的时候,按照一个一个单词的输出,所以也很神奇。

    ElevenLabs 长期提供 10000/月的额度。好像是一个 token 一个额度?应该够用很久。


    @Dalexfefun @xpzouying 哈哈哈哈哈,感谢喜爱。
    可能我自己才是最高频的用户,所以很难不好用 😂
    第 2 条附言  ·  2025 年 8 月 15 日

    LazyTyper v1.1.9 正式上线

    ✨ 永久免费!

     目前只支持 Mac 版

    ⊞ Windows 版正在适配中

    https://lazytyper.com/zh

    安装包才10M+

    支持的AI类型

    • 🆕 ElevenLabs(编码最强搭档)
    • 豆包语音(中文诗词歌赋)
    • Whisper
    • Mistral

    还新增了很多贴心小功能!

    Solana
    V2EX 支持通过 Solana 网络向内容作者打赏
    Livid 打赏了 20 $V2EX
    130 条回复    2025-12-31 15:18:29 +08:00
    1  2  
    Tink
        1
    Tink  
    PRO
       2025 年 8 月 10 日
    666 以后真的可以不摸键盘了
    dream7758522
        2
    dream7758522  
       2025 年 8 月 10 日 via Android   ❤️ 1
    老罗说:666
    conge
        3
    conge  
    PRO
       2025 年 8 月 10 日 via Android
    嘿,得试试这个。
    katwalk
        4
    katwalk  
       2025 年 8 月 10 日
    还愣着干什么?快出 Windows 版啊
    inyfee
        5
    inyfee  
       2025 年 8 月 10 日
    666~~~
    niubilewodev
        6
    niubilewodev  
       2025 年 8 月 10 日   ❤️ 2
    其实 Mac 可以设置按两下地球键就开启语音输入。
    只是中英文混编的时候效果比较差。
    fmvp520
        7
    fmvp520  
       2025 年 8 月 10 日
    期待 Windows 版!
    oldcai
        8
    oldcai  
    OP
    PRO
       2025 年 8 月 10 日
    @niubilewodev 这个是的,新一点的笔记本上还有一个专门的按键。
    但是识别率感人,基本没法中英文混输。
    sampeng
        9
    sampeng  
       2025 年 8 月 10 日 via iPhone
    你在工位上:你是大纱碧吗?为什么这里有 bug ?我说了无数次这个业务逻辑你为什么还没听懂?能做做不做滚…

    然后你就被开了…
    wanniwa
        10
    wanniwa  
       2025 年 8 月 10 日
    免费获取那个网址为什么我打开是个接口...然后还报错
    wanniwa
        11
    wanniwa  
       2025 年 8 月 10 日
    @wanniwa 试了下,访问了下 groq 官网好像就是不行,哈哈哈。可能是我网问题
    goushengnankong
        12
    goushengnankong  
       2025 年 8 月 10 日
    为什么在 Mac 系统上会一直显示一个录音机被使用的图标?这个图标是否代表这个软件一直在使用我的麦克风进行录音?
    daybreakfangyang
        13
    daybreakfangyang  
       2025 年 8 月 10 日
    @dream7758522 老罗想法超前了,技术没跟上
    easychen
        14
    easychen  
       2025 年 8 月 10 日
    市面上,搜狗输入法自带的新版不行了,长语音老出问题,但讯飞的还行啊,有 Mac 版而且也是免费的。

    现在 Trae 直接内置语音输入了,也能用,就是不支持长语音,一输入就自动中断了。讯飞的可以语音和文字输入并行,一般一些复杂的代码和公式我会一边语音一边手工输入。
    GoHard
        15
    GoHard  
       2025 年 8 月 10 日   ❤️ 1
    @easychen 讯飞的根本不敢用,之前窃取用户隐私,公告简单说了下就完了,真的恶心
    oldcai
        16
    oldcai  
    OP
    PRO
       2025 年 8 月 10 日
    @goushengnankong 好问题,简单说是 feature 不是 bug 。
    因为获取麦克风权限这个过程它会有延迟,按了快捷键以后,它不是马上就可以直接开始录音,体验上面就有一个割裂感。
    为了优化这个体验,会延迟释放掉这个权限
    后面可以考虑用一个设置选项来禁用这个功能
    oldcai
        17
    oldcai  
    OP
    PRO
       2025 年 8 月 10 日
    @wanniwa 我尽快更新一个版本,让中文用户默认选择豆包语音吧。
    不过测了一圈下来,如果是中英文混合输入的话,还是 Groq 的 whisper 比较强大。
    clarkyu
        18
    clarkyu  
       2025 年 8 月 10 日
    体验了一下,按住 option+tab 直接弹出设置框... 然后语音之后没任何反应
    不知道是不是我个人设置跟软件有冲突
    steveway
        19
    steveway  
       2025 年 8 月 10 日
    trae:英雄所见略同(狗头
    oldcai
        20
    oldcai  
    OP
    PRO
       2025 年 8 月 10 日
    @clarkyu 你好,权限界面有没有显示什么权限没有获取到呀?

    我的确在刚开始的引导上面没做好,接下来会做一下引导。
    主要是要授予权限和申请 API key 。 这两步设置好了,就可以正常使用了。
    LinJunzhu
        21
    LinJunzhu  
       2025 年 8 月 10 日
    @clarkyu 我也是,没法使用。放弃了
    LinJunzhu
        22
    LinJunzhu  
       2025 年 8 月 10 日   ❤️ 1
    @oldcai #20 KEY 和权限都有了,手动点击按钮能够测试使用。

    当在其他任何应用里,按住快捷键直接弹出 设置框,没了
    sillydaddy
        23
    sillydaddy  
       2025 年 8 月 10 日
    太爽了,以后再也不用打大段的文字了!!绝对是使用 AI 的必备。 试了下 macOS 自带的语音输入,混杂的英文单词识别不太理想,但中文识别已经非常准确了。
    oldcai
        24
    oldcai  
    OP
    PRO
       2025 年 8 月 10 日
    @LinJunzhu 了解啦,感谢反馈,我先看一下。
    大概是判断有没有辅助功能的权限有问题,没判断对。
    我去掉这个弹窗,尝试输出并换成通知的方式引导,或许体验会好一点。
    qhd
        25
    qhd  
       2025 年 8 月 10 日
    用了 AI ,太想要语音输入法了
    Censhuang
        26
    Censhuang  
       2025 年 8 月 10 日 via iPhone
    好奇,你都支持豆包 ai 了。豆包 ai 就支持全局语音输入吧,有快捷键。并且豆包 ai 也支持会议记录。
    我不是推广豆包,豆包的缺点是这是告诉你这是一个浏览器。
    clarkyu
        27
    clarkyu  
       2025 年 8 月 10 日
    @oldcai 权限没问题,全绿. api key 没问题. 首选豆包, curl 测试过.
    clarkyu
        28
    clarkyu  
       2025 年 8 月 10 日
    @oldcai 22 楼这哥们跟我一个现象 ...
    oldcai
        29
    oldcai  
    OP
    PRO
       2025 年 8 月 10 日
    就没有哪个老哥跑通的吗?应该也有不少吧。 能不能也发一下,多少给点鼓励。


    @Censhuang 是的,有两点原因。
    一个是我这个总共也就 10 兆大小的安装包;豆包那个几百兆,还带一个浏览器,我虽然体型臃肿,但是讨厌应用臃肿。
    然后我这个反应快速,基本上是随手一按就能说话。它那个启动速度要慢很多,而且你一边说,要一边等它出字。实际使用下来,LazyTyper 让我使用的感觉更爽。
    LAMBO
        30
    LAMBO  
       2025 年 8 月 10 日
    都设置好了,没跑通。按快捷键只弹窗,没有任何反应。还有,如何退出软件?
    oldcai
        31
    oldcai  
    OP
    PRO
       2025 年 8 月 10 日
    @LAMBO 托盘里面右键退出。看看退出重开试试。


    抱歉各位,遇到问题的同学请把机型和系统版本什么的发邮件给我 [email protected]
    如果方便,请将日志 ~/Library/Application\ Support/com.lazytyper.desktop/logs/ 也打包发我一下。
    我定位一下问题。晚点出个新版本,能不能帮我测试一下

    难怪大佬们说 tauri+svelte 会有一堆 work on my machine 的问题😂抱歉让大家陪我踩坑。
    zlo309618100
        32
    zlo309618100  
       2025 年 8 月 10 日
    一直用的豆包语音,mac 上挺好用的。
    huweic
        33
    huweic  
       2025 年 8 月 10 日
    太棒了,我之前也一直在用豆包语音,但是太重了奈何没有替代品,很需要这种轻量级专注输入的工具~
    wwyf
        34
    wwyf  
       2025 年 8 月 10 日
    挺好的,填上语音编程的空白了
    iorilu
        35
    iorilu  
       2025 年 8 月 11 日
    如果能配上本地语音更好
    c4fun
        36
    c4fun  
       2025 年 8 月 11 日
    挺好的,不过已经有 Wispr flow 在用了,而且 Wispr flow 可以中英文混合输入
    geying
        37
    geying  
       2025 年 8 月 11 日
    支持一下
    musi
        38
    musi  
       2025 年 8 月 11 日
    有没有测试过哪家识别率最高,另外还有 gemini 也支持语音
    unclejimao
        39
    unclejimao  
       2025 年 8 月 11 日
    @dream7758522 大模型把老罗抄的裤衩子都不剩了
    korvin
        40
    korvin  
       2025 年 8 月 11 日
    今天怎么回事,没有特意搜索,就刷信息流,x 上刷到两个借助大模型语音转文字的应用,这里又刷到一个。
    oldcai
        41
    oldcai  
    OP
    PRO
       2025 年 8 月 11 日
    @korvin 哈哈哈,你被老大哥盯上了。

    @musi 测过,不太适合做输入场景。

    @c4fun 我这个免费,整顿一下市场😂

    @iorilu 本地语音速度其实和云端比起来要差很多。能不能展开讲讲你的诉求?


    @LAMBO
    @clarkyu
    @LinJunzhu
    @wanniwa

    https://lazytyper.com/

    新版本上线了,几位有空帮忙再看一下,还有没有问题~~
    iorilu
        42
    iorilu  
       2025 年 8 月 11 日
    @oldcai 我意思是目前这些应用基本都是调用类似 whisper 的 api

    其实 github 有一些库可以把 whisper 变成兼容 openai 的本地 api

    你只要提供一个自定义 api 的方式就行, 就和很多 ai 应用一样, 自定义 base_url, model 之类参数就行
    LinJunzhu
        43
    LinJunzhu  
       2025 年 8 月 11 日
    @Censhuang 豆包 ai 支持全局语音输入么? 入口在哪呢?愣是没找到
    Znemo
        44
    Znemo  
       2025 年 8 月 11 日   ❤️ 1
    Privacy & Analytics 每次启动软件都会被自动勾选。
    oldcai
        45
    oldcai  
    OP
    PRO
       2025 年 8 月 11 日
    @Znemo 感谢反馈,下一个版本会修复。
    korvin
        46
    korvin  
       2025 年 8 月 12 日

    按住模式和切换模式修改没有作用,不管选哪个,两种效果同时存在。
    conge
        47
    conge  
    PRO
       2025 年 8 月 12 日
    已经安装使用了,效果非常好。
    oldcai
        48
    oldcai  
    OP
    PRO
       2025 年 8 月 12 日
    @musi (免费的里面)中文识别里面,豆包的识别率最强。中英文混合输入,Whisper 的识别率最高。英文输入法 Mistral ,Assembly AI 都还可以。
    本来我还想支持 11 Labs ,不过他们的免费额度有点少,所以一直犹犹豫豫,不知道要不要加。

    @korvin 嘿嘿,是的,同时兼容两种会影响使用吗?
    我本来想去掉这个设置的,但是感觉我的想法不一定对,就先保留了。等一波反馈。

    @conge 谢谢鼓励! 47 楼了终于拿到第一个好评,不容易 😂 其他同学也不要害羞,快来夸一夸 LazyTyper
    korvin
        49
    korvin  
       2025 年 8 月 12 日
    @oldcai 不影响使用,但会让我觉得这设置是个 bug
    kingrever
        50
    kingrever  
       2025 年 8 月 12 日
    在 macbook 上安装了,但不知道怎么启用,上面任务栏也没有显示啊
    Censhuang
        51
    Censhuang  
       2025 年 8 月 12 日
    @LinJunzhu #43 仔细翻一遍设置,实在找不到就把豆包卸载重新安装,引导页面里有
    oldcai
        52
    oldcai  
    OP
    PRO
       2025 年 8 月 13 日
    @kingrever Launchpad 里面找不到一只 😺 么
    charlesss
        53
    charlesss  
       2025 年 8 月 13 日
    体验了下,会一直获取麦克风,这样会导致在听歌的时候声音变得很大。
    charlesss
        54
    charlesss  
       2025 年 8 月 13 日
    @easychen 用了段时间讯飞,确实可以,之前用微信输入法,输入法上还是有区别,就换回去了,啥时候微信输入法也可以能语音就好了
    oldcai
        55
    oldcai  
    OP
    PRO
       2025 年 8 月 13 日
    @charlesss 的确,蓝牙耳机就会有这个问题。
    暂时的解法是把输入设备换成你的笔记本。
    LinJunzhu
        56
    LinJunzhu  
       2025 年 8 月 13 日
    @Censhuang #51 翻了好几遍,最后发现是在 [快捷键] 里可以触发,其他都没找到相关入口,醉了。
    xpzouying
        57
    xpzouying  
       2025 年 8 月 14 日
    确实非常好用,使用语音输入法给楼主点赞。
    Dalexfefun
        58
    Dalexfefun  
       2025 年 8 月 14 日
    好用好用,给 cai 神点赞
    liulicaixiao
        59
    liulicaixiao  
       2025 年 8 月 15 日
    我刚看到一个类似的工具 https://wisprflow.ai/
    oldcai
        60
    oldcai  
    OP
    PRO
       2025 年 8 月 15 日
    @liulicaixiao 你再看看,它免费吗😂
    liulicaixiao
        61
    liulicaixiao  
       2025 年 8 月 15 日
    @oldcai #60 我是今天逛之前买的一个产品大礼包发现的这个新东西,然后就突然想起来论坛里有人也做了类似的软件了。
    oldcai
        62
    oldcai  
    OP
    PRO
       2025 年 8 月 15 日
    @liulicaixiao

    哦哦,了解了。我记得那个大礼包是大概可以免费用一年。
    你可以先用用他的,再过来对比一下。
    给我一些使用的反馈,比如哪里觉得爽,但是 LazyTyper 没有的,帮助 LazyTyper 提升一下。

    其实 LazyTyper 比它支持的 AI 更多(它只支持 Whisper )
    中英文混排识别率:它的识别率其实没有 LazyTyper 新加的 ElevenLabs 好
    中文的识别率:也没有 LazyTyper 支持的豆包好
    qfdk
        63
    qfdk  
    PRO
       2025 年 8 月 15 日
    火山引擎凭证验证失败:Invalid VolcanoEngine API credentials: 所有重试都失败了。最后的错误: 无法连接到服务器,请检查网络连接
    oldcai
        64
    oldcai  
    OP
    PRO
       2025 年 8 月 15 日
    @qfdk 奇怪,有没有对照一下引导文档中的 id/key 格式,是长的差不多的吗?
    有没有开梯子或者有其他的复杂的网络情况?
    LinJunzhu
        65
    LinJunzhu  
       2025 年 8 月 15 日
    之前一直没办法使用的 BUG 终于修复了,达到可用状态。

    提个建议: 如果能一边说一边出文字,就最好了。 参考手机端的微信输入法#语音输入/系统的语音输入
    qfdk
        66
    qfdk  
    PRO
       2025 年 8 月 16 日
    @oldcai 过两天再试试吧. 没有梯子哈.
    qfdk
        67
    qfdk  
    PRO
       2025 年 8 月 16 日   ❤️ 1
    ElevenLabs 还是好用 !
    rafa
        68
    rafa  
       2025 年 8 月 16 日
    顶一个,已经开始爽用了
    s4nd
        69
    s4nd  
       2025 年 8 月 16 日
    来个 windows 版吧
    theo
        70
    theo  
       2025 年 8 月 16 日   ❤️ 1
    @oldcai 赞一个,正在爽用
    确实遇到了「火山引擎凭证验证失败」的问题,还有偶发的触发不成功的问题,都是多次退出重新启动后解决了。
    apollo007
        71
    apollo007  
       2025 年 8 月 16 日
    很不错,不过就是感觉有点慢,不是很快就出来的感觉。我希望的是呢。等我把话说完,他立刻就能出结果。
    apollo007
        72
    apollo007  
       2025 年 8 月 16 日   ❤️ 1
    @apollo007 #71 用着用着好像它的速度越来越快了,不错。目前来讲体验 99 分。
    followad
        73
    followad  
       2025 年 8 月 16 日 via iPhone
    会玩 会玩
    november
        74
    november  
       2025 年 8 月 16 日
    安静,你吵到我用 TNT 了。
    ccc00
        75
    ccc00  
       2025 年 8 月 16 日
    请问豆包可以无限量使用吗?
    oldcai
        76
    oldcai  
    OP
    PRO
       2025 年 8 月 16 日
    @ccc00 可以的,你安装后可以看到引导,有详细说明。
    @november 安静,你吵到我用 LazyTaper 了。
    leetcode2020
        77
    leetcode2020  
       2025 年 8 月 16 日
    @oldcai 想请教一下,这个项目是基于 Tauri 开发的吗?另外,在 macOS 上有试过使用 Apple 自带的 Speech Framework 吗?想了解一下实际效果如何。
    oldcai
        78
    oldcai  
    OP
    PRO
       2025 年 8 月 17 日
    @leetcode2020 对,Tauri+Svelte
    Apple 的识别率不太好,中英混输也比较难受,后面提升了再加。
    优先加识别率对生产力有帮助的。如果有更好的欢迎提。
    xiaket
        79
    xiaket  
       2025 年 8 月 17 日
    没有泼冷水或者冒犯的意思. 很多时候人说话, 尤其是比较长的内容, 会有不少的语气助词或各种停顿. 所以我自己本地做这个功能( https://github.com/xiaket/etc/tree/master/murmur)的时候, 先是丢给 whisper 识别, 后面再把识别出来的文本拿去给 OpenAI 润色一遍. 这样效果会好一点.
    oldcai
        80
    oldcai  
    OP
    PRO
       2025 年 8 月 17 日
    @xiaket 没有没有,超级欢迎提意见。提到这么深入的问题,说明你肯定是同道中人。

    其实我也考虑过这个问题,之前甚至调研过其他的产品,有的也有润色成书面语等功能。
    但是实际测试下来,它的确有时候会让你有惊喜(比如口述 emoji 表情),但是更多时候它会添乱。
    而且最重要的问题是,它会让我对语音转的文字没有信心。会增加不必要的校对的心力。

    我觉得作为一个主要目的是输入的产品,还是要忠于输入。

    而且其实不管是 Whisper 还是 ElevenLabs 这两款都会有将你轻微的停顿去除的功能,有大概 5%左右的纠错的能力;
    至于豆包语音这种,它会把你的思考的那些声音,发出的“嗯”,“呃”的声音也加进去,我也针对实现了一个功能,去机械化地去除这样的一些停顿。暂时做到了用于 Vibe Coding 的时候我比较满意的程度。

    你的建议我先拿小本本记下。我想的也不一定对,先看一下大家的意见,后面我会考虑。
    如果你有好的案例,欢迎给我分享一下,我会再考虑考虑。
    cat
        81
    cat  
       2025 年 8 月 18 日
    官网顶部的菜单链接 没有跟随当前语言
    在中文页面下点菜单会跳到英文页面
    而且链接标题与位置也不一致
    pigll
        82
    pigll  
       2025 年 8 月 18 日
    这也太秀了吧
    oldcai
        83
    oldcai  
    OP
    PRO
       2025 年 8 月 18 日
    @cat 感谢提出,链接已经修正。并加入 discord 群组等链接。
    内容也有点 outdated 了,因为之前本来只打算支持 whisper 。后面我更新下。

    😏 不过翻译没有对应是有意为之的,因为不一定是一一对应的关系。
    比如统计到我自己使用的时候中文有 7 ~ 8 倍,但是英文才 3 ~ 4 倍。
    HXM
        84
    HXM  
       2025 年 8 月 18 日
    期待 Windows 版本!
    billzhuang
        85
    billzhuang  
       2025 年 8 月 18 日
    Can you hear me?This is very fast. I like it.Awesome. Please continue.
    billzhuang
        86
    billzhuang  
       2025 年 8 月 18 日
    豆包不能听英文吗?
    oldcai
        87
    oldcai  
    OP
    PRO
       2025 年 8 月 18 日
    @billzhuang 你要是说纯英文,豆包也可以。但是你要是中英文混合的话,它可能就经常在英语的部分会空耳。
    pigfloyd
        88
    pigfloyd  
       2025 年 8 月 19 日
    太好了,终于可以用嘴辱骂 ai 了
    PaperZai
        89
    PaperZai  
       2025 年 8 月 23 日
    很好,macos 自带的识别率不行,国内的准确率豆包的确是 t0 级别的
    PaperZai
        90
    PaperZai  
       2025 年 8 月 23 日
    可以隐藏一下 macos 菜单栏图标的选项吗,黄色的看着有点醒目和不协调。
    n2l
        91
    n2l  
       2025 年 8 月 31 日
    @Tink 未来 AI 成熟后真不敢想,普通人就算完全没计算机背景,只要说出需求,什么编码不编码的,我没必要懂,那是机器该做的事,那时候情商会是评价人的决定性指标。
    ddddd0
        92
    ddddd0  
       2025 年 8 月 31 日
    我用的是 wisper flow ,ios + mac ,发现它存在一些 wispher 的固有问题,比如偶尔有严重幻觉;音量小的时候、或者有点口音的时候精度还是不够高,错误率比较高;另外这个软件服务端不稳定


    刚配置完 LazyTyper ,正在尝试 lazytyper + elevenlabs stt ,只是目前没有 ios 端,只在 mac 端用
    Rangertwo
        93
    Rangertwo  
       2025 年 9 月 8 日
    太棒了,好用!另外有个小建议,在语音输入时,如果能够在输入框里显示一个录音中或输入中的图标就更好了,有时候说长段语音会担心这个软件是否正在运行 hhh
    oldcai
        94
    oldcai  
    OP
    PRO
       2025 年 9 月 8 日
    @Rangertwo 挺棒的想法,目前是在托盘图标里面显示这个状态的。

    @ddddd0 你好呀,手机上的使用场景多吗?我看最大的使用场景微信里面本身就包含语音输入,所以我不知道有没有必要去做手机版本。
    bnbvb
        95
    bnbvb  
       2025 年 9 月 12 日
    如果能用本地模型就好了,whisper large-v3-turbo 跑本地我基本就够用了
    oldcai
        96
    oldcai  
    OP
    PRO
       2025 年 9 月 12 日
    @bnbvb 如果支持 OpenAI compatible 的协议,你觉得怎样?@iorilu 之前也提过这个
    v2AKS
        97
    v2AKS  
       2025 年 9 月 12 日
    目前好像是自动回车的,在聊天过程中很不方便,能把自动回车加个开关设置吗
    bnbvb
        98
    bnbvb  
       2025 年 9 月 13 日
    @oldcai 兼容 openai 接口挺好的。另外对于 whisper 模型,我觉得得允许设置 prompt ,不然识别率有点难看
    oldcai
        99
    oldcai  
    OP
    PRO
       2025 年 9 月 13 日
    @AnkhSpirit 这个是可以关闭的,请看一下设置

    @bnbvb okk ,我考虑下。有没有比较理想的 prompt 可以分享一下?我考虑作为默认 prompt: [email protected]
    Lemonadeccc
        100
    Lemonadeccc  
       2025 年 9 月 13 日
    能不能接入微信,直接语音过去了。家里一个电脑跑 codex 活儿 cc ,然后连自己的微信,在外可以随时用 cc
    1  2  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2806 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 49ms · UTC 02:05 · PVG 10:05 · LAX 18:05 · JFK 21:05
    ♥ Do have faith in what you're doing.