V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
287854442
1.32D
V2EX  ›  Joe's Talk 🪐

一个大胆的预言:语音输入将成为绝对主流

  •  1
     
  •   287854442 · 9 小时 20 分钟前 via Android · 6470 次点击

    先说结论:大概 1~2 年之后,语音输入在移动设备上将会成为主流的输入方式。文字输入基本被淘汰,就跟现在基本没有人会用手写输入一样。

    为什么?因为效率。

    一个操作熟练的一般人大概每分钟能打 80~100 个汉字,人的说话速度大概是每分钟 160~240 个汉字。

    现在 AI 语音输入法可以识别得非常快,非常准确,基本上可以跟上说话的速度。比如说我写的这一段,用的是豆包的语音输入(利益不相关,纯佩服),一个错别字都没有改过(最多是修改一下标点符号。)甚至一些很生僻的词也能识别出来。

    当然,随着这个预测的出现,另外一个是谁能把握到这个语音输入的机会(包括软件和硬件),谁可能就会成为未来输入的统领者。这个预测的一个很大的变数是 AI 时代语音输入法门槛会比较低,做一个九十分的语音输入应该都不是一个很复杂且很费劲的事情。比的是谁能做到 99 分。

    你觉得呢?

    第 1 条附言  ·  8 小时 37 分钟前
    为了避免歧义这里稍微补充一下这里所说的 “语音输入” 的含义:

    语音 -----AI-----> 文本

    就是现有很多输入法中的 按空格说话,然后用 AI 识别语音成文本,并不是 微信中的 发语音,这是两个事情, 后者也不需要预测了
    Solana
    V2EX 支持通过 Solana 网络向内容作者打赏
    JoeJoeJoe 打赏了 20 $V2EX
    171 条回复    2026-01-28 00:11:37 +08:00
    1  2  
    opengps
        1
    opengps  
       9 小时 17 分钟前   ❤️ 40
    我都不爱说话,让我用语音输入?
    lqy2575395
        2
    lqy2575395  
       9 小时 16 分钟前   ❤️ 3
    不太可能,一天本来就打不了几个字,高频打字的场景也就上班时间,整个办公室都在语音输入,不得不跟菜市场一样
    shadowyue
        3
    shadowyue  
       9 小时 14 分钟前   ❤️ 6
    嗓子:我耐久度比手低
    287854442
        4
    287854442  
    OP
       9 小时 13 分钟前 via Android
    @opengps 不爱说话是个好习惯。
    @lqy2575395 没事,所以说是个预测嘛。如果大家都觉得个必然趋势,那我也就没有预测的必要了。 其实说话声音不一定很大,窃窃私语都已经完全够使用了。而且我觉得这个不是个问题。大家都用的时候,就都不奇怪了。想想口罩.
    Krylo
        5
    Krylo  
       9 小时 13 分钟前 via iPhone   ❤️ 2
    用嘴表达自己的即时思维,其实有难度。
    night98
        6
    night98  
       9 小时 12 分钟前
    输入法这玩意我只信任本地模式
    loading
        7
    loading  
       9 小时 12 分钟前 via Android
    冷知识:大部分输入法按住空格就是语音输入。

    能不能别发语音。
    287854442
        8
    287854442  
    OP
       9 小时 11 分钟前 via Android
    @Krylo 没错,哥们,你肯定是一个很懂表达的人。其实大部分人都是张口就来,根本不关心什么思维,🐶
    loading
        9
    loading  
       9 小时 10 分钟前 via Android
    我觉得 op 不知道手机输入法直接就能语音转文字,不用去豆包的。这玩意已经出现很多年了。
    ice000
        10
    ice000  
       9 小时 10 分钟前   ❤️ 1
    语音相当于广播.......
    287854442
        11
    287854442  
    OP
       9 小时 8 分钟前 via Android
    @night98 没毛病
    @loading 我特烦别人发语音,除了我妈
    shortawn
        12
    shortawn  
       9 小时 7 分钟前   ❤️ 1
    不可能。语音输入法的保密性为零,仅凭这一点,绝不可能成为主流。除非什么时候可以发展到仅识别唇形而不采集声音就能完成输入。
    jjianwen68
        13
    jjianwen68  
       9 小时 7 分钟前
    现在法庭上类似书记员的职位淘汰了吗,以及其他类似场景
    liu731
        14
    liu731  
    PRO
       9 小时 6 分钟前
    其实打字有一个优势,就是高密度、快速校验要表达意思。在发送前核对 0.5s 就行
    287854442
        15
    287854442  
    OP
       9 小时 6 分钟前 via Android
    @loading 知道的,之前苹果自带输入法,微信输入法什么的,我也已经用了很久了,但是它们准确率不太高。有一半的情况都需要再手动改。但是豆包输入法我试用下来基本上是 20 次需要改一次,觉得是可以到一个日常可以使用的级别。
    tetora
        16
    tetora  
       9 小时 5 分钟前
    意念(默读)输入
    dushixiang
        17
    dushixiang  
       9 小时 5 分钟前
    你的字体怎么有点特殊?
    Building
        18
    Building  
       9 小时 3 分钟前   ❤️ 3
    罗永浩给你点了个赞
    287854442
        19
    287854442  
    OP
       9 小时 2 分钟前 via Android
    @shortawn 所以说是个预测,可以等等看,至少在移动设备上,我感觉这个预测的概率还挺高的。

    @jjianwen68 我觉得这不是同一个问题。针对你这个问题,我觉得是录像和录音可以完美取代书记员这个职位。

    @liu731 校验本身都是要做的。在不出错的情况下还好,出错的情况下,就需要改了。目前输入法的准确率,我觉得都还差一些。
    287854442
        20
    287854442  
    OP
       8 小时 59 分钟前 via Android
    @dushixiang 啊,有吗?没注意到呀。

    @Building 哈哈哈哈

    @tetora 这个太高端了,但搞不好有生之年还真能见到,马斯克那个脑机接口,真搞下来的话...
    lneoi
        21
    lneoi  
       8 小时 58 分钟前
    不用语音输入,微信的发送语音就是这领域的代表。看看现在是打字的多还是发语音的多就知道了
    evill
        22
    evill  
       8 小时 58 分钟前   ❤️ 1
    ”文字输入基本被淘汰“ 给你一些场景,公共场合比如地铁、公交、办公室
    这些场合都不适合语音
    catazshadow
        23
    catazshadow  
       8 小时 57 分钟前 via Android
    1980 年代的科幻片已经预测过了
    Govin
        24
    Govin  
       8 小时 56 分钟前
    微信语音我几乎不用,跟长辈聊天都是打字的,你跟我说要成为绝对主流?
    IIce
        25
    IIce  
       8 小时 56 分钟前
    打字打错了能删除,说错了咋删除呢
    evill
        26
    evill  
       8 小时 56 分钟前
    还有一个问题,语音转文字就是纯文字
    而手打文字会有表情符号、谐音梗、表情包等,这些语音转文字代替不了
    Sawyerhou
        27
    Sawyerhou  
       8 小时 55 分钟前
    一两年之内估计比较难,有生之年有可能,不过应该也是个过渡形态,终极形态应该是脑机接口,意识流输入。
    MoonShot
        28
    MoonShot  
       8 小时 52 分钟前
    语音只能说是辅助输入,最终极的交互还是要到脑机层面
    guqikang
        29
    guqikang  
       8 小时 49 分钟前   ❤️ 15
    “小声点,你吵到我用 TNT 了!”
    Gilfoyle26
        30
    Gilfoyle26  
       8 小时 46 分钟前
    啊? 2026 年 OP 才得出这个结论么?微信的成功就是因为可以发语音,这点极大的扩展了使用人群,才有了今天的微信。而微信语音功能是 2011 年 5 月 10 日 随着微信 2.0 版本 的发布而正式推出的。也就是 15 年前。
    dawee2y
        31
    dawee2y  
       8 小时 42 分钟前
    招笑预测
    7gugu
        32
    7gugu  
       8 小时 40 分钟前
    确实,特别是用过豆包之后就让我意识到这个可能了。豆包对于中英文数字混合识别的能力,非常强大,很多专业术语可以直接说,豆包都能够正确识别出来。而且分词能力也很强大,能准确的识别语气词和正文,现阶段豆包输入法已经有一部分的功力了。
    renmu
        33
    renmu  
       8 小时 38 分钟前 via Android   ❤️ 1
    老罗领先世界十年!
    shaozelin030405
        34
    shaozelin030405  
       8 小时 38 分钟前
    想多了,纸质媒体到现在还没死呢。微信语音都多少年了,你是 gg 还是 mm ?
    wu67
        35
    wu67  
       8 小时 37 分钟前
    爱不爱说话是一个问题.
    在公共场所说话也是个问题. 有些东西合不合适、内容敏感与否...
    在办公室同上...
    stinkytofux
        36
    stinkytofux  
       8 小时 36 分钟前
    语音输入法至少已经有十几年的历史了, 最早讯飞就是专门做这个的. 而且现在所有输入法都带语音输入, 甚至 IOS 的右下角常驻语音输入按钮.

    跟现在的 AI 根本没有任何关系. 这玩意成不了绝对主流, 也可以说早就成为主流输入方式之一了. 不爱用的人不会用, 爱用的人早就用上了.
    location123
        37
    location123  
       8 小时 35 分钟前
    单纯 vibe coding 或者讨论需求代码 来说 我喜欢语音输入 描述一个需求的时候 我打字只会打一点 剩下让 ai 猜 而语音输入我能说的很详细
    cmdOptionKana
        38
    cmdOptionKana  
       8 小时 32 分钟前 via Android
    一般人独处的时间不够多,不足以形成语音输入的习惯。
    bruce0
        39
    bruce0  
       8 小时 31 分钟前   ❤️ 1
    还好你限定场景是移动端,要不然我不敢想,每天公司一群人在朗读代码是什么场面

    int main() {
    ......
    return 0;
    }

    朗读出来, "因他, 空格, 们, 左括号,有括号,座花括号,..... 瑞 ten 零,分号,右花括号" 😂😂😂
    sudodo
        40
    sudodo  
       8 小时 31 分钟前
    楼主确实听大胆的
    CaptainD
        41
    CaptainD  
       8 小时 26 分钟前
    绝无可能,最主要的原因是语音效率远低于文字

    如果语音的效率更高,那么播客类 app 应该常年是 app store 下载前几,但显然是图文和视频,小红书、抖音、YouTube 就是几个现实例子

    视频的效率其实比较低,但胜在简单,而文字,尤其是图文结合效率远大于语音和视频
    DigitaIOcean
        42
    DigitaIOcean  
       8 小时 26 分钟前
    我语音输入占比 50%
    NakeSnail
        43
    NakeSnail  
       8 小时 23 分钟前
    我也是这么认为,至少会需要新的输入方式了,vibe coding 多了就感觉打字也很累
    NakeSnail
        44
    NakeSnail  
       8 小时 21 分钟前
    @bruce0 你这个忽略了 ai 的作用,实际场景可能会变成说出你的需求,ai 帮你处理这些东西
    287854442
        45
    287854442  
    OP
       8 小时 21 分钟前
    @bruce0 哈哈哈哈
    @DigitaIOcean 我也差不多,还日益增加

    =============
    怎么上面还有说用微信语音呢,这都什么时代的玩意儿了
    Muniesa
        46
    Muniesa  
       8 小时 20 分钟前 via Android
    正在感冒的我感觉不大行
    hahiru
        47
    hahiru  
       8 小时 20 分钟前
    你尝试一下就知道了。输入文字我可以斟词酌句,语音输入是什么情况?
    额,这个,然后么,……,反正就,然后吧,卧槽,哎不对,那家伙…………………………

    弄成口语化文字的话,除非大模型能准确转译口语为书面语。
    而且我自己打错字了我可以忍,因为是我马虎了。你让我回过头检查 AI 有没有理解错误或者打错字,那我不能忍。我还不如自己打字。
    HotieCutie
        48
    HotieCutie  
       8 小时 19 分钟前
    绝对不会是主流,除非大家都不会打字了。打字是可以组织语言的,可以随时删除,但是语音不行,说错一点就得重新来
    zhoiiiii
        49
    zhoiiiii  
       8 小时 18 分钟前
    还真别说,我家里现在除了我,发微信都喜欢语音转文字
    287854442
        50
    287854442  
    OP
       8 小时 17 分钟前
    @NakeSnail 是的,vibecoding 的时候感觉打字太费劲了
    287854442
        51
    287854442  
    OP
       8 小时 17 分钟前
    =======================
    =======================
    =======================
    =======================
    287854442
        52
    287854442  
    OP
       8 小时 16 分钟前
    这里说的不是 [发语音]
    =======================
    =======================
    =======================
    =======================
    jjwjiang
        53
    jjwjiang  
       8 小时 15 分钟前   ❤️ 1
    典型的码农思维想产品,你随便找个上班的人问问,他一天有多少时间可以放肆的说出自己想打出的字?
    287854442
        54
    287854442  
    OP
       8 小时 12 分钟前
    @jjwjiang 哈哈哈哈哈
    @shaozelin030405 gg/mm 应该可以追溯到 QQ 时代了,2005 年左右
    spencer00
        55
    spencer00  
       8 小时 12 分钟前
    @loading 重点是豆包语音输入好用呀,自动的基本上都不行
    zerovoid
        56
    zerovoid  
       8 小时 11 分钟前
    语音输入早就有了,我记得当年锤子手机就有一个什么语音的功能,影响语音输入的不是识别准确率,而是使用场景,你在公司和家里也用语音输入吗,那不得被人直接轰出去。
    xFrye
        57
    xFrye  
       8 小时 9 分钟前
    嘘,吵到我用 tnt 了
    ethusdt
        58
    ethusdt  
       8 小时 7 分钟前
    跑个题,你这个主题内容和附言字体为什么和其他的(帖)不一样?
    YLGG
        59
    YLGG  
       8 小时 6 分钟前
    公共场合不适合语音 这就注定不能成为主流
    adimn
        60
    adimn  
       8 小时 6 分钟前
    还是喜欢打字, 因为打字的空余我会想后面该说的话

    写代码的人打字快的是不是比打字慢的技术高一样
    BelovedOne
        61
    BelovedOne  
       8 小时 5 分钟前
    @ethusdt 我也想问,为啥这个帖子的文字是宋体。。。
    dajj
        62
    dajj  
       8 小时 5 分钟前
    费嗓子,你能一天说 8 小时吗,加班的时候说 10 小时
    fionasit007
        63
    fionasit007  
       8 小时 3 分钟前
    总结了一下,这么多问题,op 就没想过吗,还预测
    1 ,正确率不可能百分百,中间出错修改成本比手写大;
    2 ,语音识别没人的个性,发送其他非常规文字(谐音梗表情包图片之类的),不喜欢加标点符号,加各种标点符号之类的;
    3 ,有的文字只会写不会读(现在输入法支持你认一半,会把这个字放进错误拼音里),还有单词也是只会拼不会读;
    4 ,用手写和用口读人的表达不一样,一般手写更加完整更好的表达输出人的意图;
    5 ,大多数环境语言输入不方便;
    6 ,安全与隐私风险和高精度肯定需要网络;
    kfpenn
        64
    kfpenn  
       8 小时 2 分钟前
    你说的是 TNT 吗?
    thealert
        65
    thealert  
       8 小时 1 分钟前
    不如相信 脑机接口
    kaishi123
        66
    kaishi123  
       8 小时 1 分钟前
    反正我一个人或者开车的时候,回微信都是语音转文字。只不过都是最基础的语音识别,没有试过 AI 修改或者润色。
    doruison
        67
    doruison  
       8 小时 1 分钟前
    不可能!
    公共场合你想下有些化方便说吗
    还有就是,楼上说的思维表达问题,非要书面不可
    WuSiYu
        68
    WuSiYu  
       7 小时 59 分钟前
    没隐私,还吵,不好编辑,全是缺点
    helloeather
        69
    helloeather  
       7 小时 57 分钟前 via iPhone
    再高端点,直接读取大脑的输出
    wangsd
        70
    wangsd  
       7 小时 56 分钟前
    我感觉不太行,语言输出太快了,大脑来不及思考,打字可以边打边思考。
    cfer
        71
    cfer  
       7 小时 55 分钟前
    未来肯定是脑机接口或者更先进的头戴外设之类的。语音就算了吧,打字都能打错更别说语音了。
    jonty
        72
    jonty  
       7 小时 54 分钟前
    手写输入>语音消息>语音输入
    lizongwu
        73
    lizongwu  
       7 小时 47 分钟前
    现在的人机交互受限于人的感官,要么视觉,要么听觉,随便乱猜也能 50%概率蒙对。下一次革命性的人机交互肯定是 neuralink 这种,绕过感官直接通过神经信号实现人机交互(拿好你的 tsla )。再说了,输入法就算做上天了又能怎么样
    nightlight9
        74
    nightlight9  
       7 小时 43 分钟前
    基本同意,豆包语音输入法已经很强了。差不多日常场景 30%会用语音输入
    比如我微信聊天经常都是用豆包语音输入文字。
    语音 --> 口语

    但专业性输出还是得 100%靠打字、代码、文章、文档等。
    不过这些应该也不是什么问题,AI 以后应该可以一键把口语化的东西转换成专业性的东西。
    语音 --> 口语 --> 专业性输出
    legendBro
        75
    legendBro  
       7 小时 42 分钟前
    楼主一定是公共场合刷抖音开外放的那种人
    milkpuff
        76
    milkpuff  
       7 小时 41 分钟前
    罗永浩时代的语音输入就已经非常准确可用,现在十来年了还没有成为主流。
    JoeJoeJoe
        77
    JoeJoeJoe  
    PRO
       7 小时 41 分钟前
    @legendBro 有点武断了.
    JoeJoeJoe
        78
    JoeJoeJoe  
    PRO
       7 小时 41 分钟前
    @dushixiang 因为我这个节点开了衬线字体样式
    vicalloy
        79
    vicalloy  
       7 小时 40 分钟前
    和 AI 交互的时候用语音输入确实挺方便的。
    不过很多时候不需要这么快的输入速度,用键盘输入,给自己留点思考的时间。
    craftsmanship
        80
    craftsmanship  
       7 小时 38 分钟前 via Android
    我最讨厌的就是微信语音 从来不用 也讨厌所有没有特殊情况就给我发语音的人
    11000111010
        81
    11000111010  
       7 小时 38 分钟前
    要说有可能的未来十到二十年或者更久之后 我倒觉得脑机接口有重大突破的话,让人类意识入网 可以通过意识输入文字这种。那个时候可能是主流了
    monkey110
        82
    monkey110  
       7 小时 37 分钟前 via Android
    所以安卓语音输入法最准的是哪个?
    nancyii
        83
    nancyii  
       7 小时 36 分钟前
    上班时候跟老婆聊天语音输入合适吗
    Hudiebbk
        84
    Hudiebbk  
       7 小时 36 分钟前
    s 手机端我现在基本都是语音转文字了,电脑端办公室不好一直逼逼
    Hyxiao
        85
    Hyxiao  
       7 小时 32 分钟前
    我还是挺期待语音输入对接 AI Coding 的场景的,虽然现在 cursor 也支持,但只是语音输入识别,而并非真正意义上的即时输入和响应,什么时候可以做到一边说话,代码一边改动,页面一边变化,可以随时打断调整,这体验真的直接拉满了
    june4
        86
    june4  
       7 小时 31 分钟前
    我就喜欢用语音输入。不过都 ai 时代了,一个能打的都没有。
    iOS 自带是垃圾,且 iOS 对第三方语音输入非常不友好。另外目前的语音输入似乎并没有上下文智能。总之改进的余地还是非常大的。
    GodIsJasonBourne
        87
    GodIsJasonBourne  
       7 小时 30 分钟前   ❤️ 1
    朕的黄金铲铲呢?朕要去挑大粪糊醒楼主了
    Dispatcher
        88
    Dispatcher  
       7 小时 28 分钟前   ❤️ 1
    以后再看到楼主这样逼逼叨叨的,直接一巴掌抽过去。

    为什么我相信文字的力量,而不是语音(包括转文字)的力量?因为,楼主这样的人,只单纯关注速度和识别率。
    实际上,这是低智能群体的最喜欢的东西,典型的华为思维、小米思维。

    抛开隐私,扰民等等索引因素,我只想说,表达速度快,真的就是正确吗?
    输入速度快,有什么意义呢?不经思考,脱口而出,只能是废话连篇。
    重视文字输入速度的,估计只有速记员。普通一年打字也就那几十万,平均下来一分钟,不论谁一百还是一百五的输入速度,有区别吗?非得你语音输入,二百五的输入速度,显着你了是吧?

    除了对线骂街,我是想不出超快速输入文字有何用?
    k2g
        89
    k2g  
       7 小时 27 分钟前
    有些人想到的东西可以直接通过语言说出来,但是有些人需要边想边组织成文字才能说出来,这样的话语音输入反而更慢了:
    想法 -> 语言 -> 屏幕文字
    vs
    想法 -> 脑内文字 -> 语言 -> 屏幕文字
    dyxLike
        90
    dyxLike  
       7 小时 20 分钟前
    只有输入大段句子的时候效率高, 短文本时不如手打
    Awes0me
        91
    Awes0me  
       7 小时 20 分钟前
    你这个字体好难看啊,怎么弄的
    evan9527
        92
    evan9527  
       7 小时 18 分钟前
    你一定知道 QWERTY 键盘的设计初衷确实不是为了追求打字速度,它的诞生是为了“慢”下来。从而降低打字速度,减少机械故障。
    如果用上语音输入,这种“故障”就会出现在人脑里,语音输入是一种连续线性的输出,很多人把话说顺畅的能力都没有。语音输入反复修改反而极大的降低效率。
    287854442
        93
    287854442  
    OP
       7 小时 17 分钟前 via Android
    @Dispatcher 表达想法,不管你赞同不赞同,我觉得都没问题,没必要骂骂咧咧的,上升到人身攻击吧?啥叫“逼逼叨叨”的?啥叫“低智能群体了”?这些还都能忍,竟然“小米思维” 这个忍不了 (哈哈哈哈
    @JoeJoeJoe 这里有个有人身攻击的。
    MrLeion
        94
    MrLeion  
       7 小时 17 分钟前
    开会和地铁上怎么破?
    JoeJoeJoe
        95
    JoeJoeJoe  
    PRO
       7 小时 12 分钟前
    @287854442 我只能删帖, 人身攻击的话直接 at livid 其他人没有这个权限
    287854442
        96
    287854442  
    OP
       7 小时 11 分钟前 via Android
    @monkey110 目前我觉得是豆包输入法。看谁能突破这个。

    @june4 可以尝试试试豆包输入法,在用豆包输入法之前,我一直以为语音输入还不行。它给了我一些惊喜。

    ------------

    豆包的产品在这吗?打钱。
    JoeJoeJoe
        97
    JoeJoeJoe  
    PRO
       7 小时 11 分钟前
    @ethusdt 看#78 我在这个节点设置了衬线字体样式
    287854442
        98
    287854442  
    OP
       7 小时 9 分钟前 via Android
    @JoeJoeJoe 没事儿,我觉得
    @Dispatcher 这老哥现实中大概率是个率直的人,说话很直接,哈哈哈
    JoeJoeJoe
        99
    JoeJoeJoe  
    PRO
       7 小时 9 分钟前
    @Awes0me 看#78 我在这个节点设置了衬线字体样式
    JoeJoeJoe
        100
    JoeJoeJoe  
    PRO
       7 小时 7 分钟前
    @Dispatcher
    @287854442 我还去扒拉了一下回复 没找到😂 这条回复我觉得还好, 是很有质量的回复了 有思考 有依据 是很认真的辩论
    1  2  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2212 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 16:11 · PVG 00:11 · LAX 08:11 · JFK 11:11
    ♥ Do have faith in what you're doing.