V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
yanwen
V2EX  ›  问与答

如何将录音文件转为文本?

  •  
  •   yanwen · 2015-05-18 11:46:49 +08:00 · 7337 次点击
    这是一个创建于 3476 天前的主题,其中的信息可能已经有所发展或是发生改变。
    录了一段音。。很不想逐个逐个的一边听一边敲字。。
    有没有相关的软件可以将录音文件转为文本的?

    回答送感谢,谢谢大家
    19 条回复    2015-05-18 16:10:24 +08:00
    ynyounuo
        1
    ynyounuo  
       2015-05-18 11:56:09 +08:00   ❤️ 1
    中文?
    OCR 都已经如此艰难 ……
    SR/ASR 可以不用想准确率了。

    最简单的办法还是掏钱找人弄。
    Cohen
        2
    Cohen  
       2015-05-18 11:59:01 +08:00   ❤️ 1
    这是所有文秘都想要的功能。。。会议纪要
    Phariel
        3
    Phariel  
       2015-05-18 12:03:11 +08:00   ❤️ 1
    如果有这项功能,那些书记官什么的都可以下岗了。
    damngood
        4
    damngood  
       2015-05-18 12:07:33 +08:00   ❤️ 1
    可以使用 OSX 上的 dictation 功能来做. 不过需要第三方应用的帮助.
    我之前实验过可以把英文的 podcast 转成文字. 准确率还可以.
    中文的没有试过
    tearsinchina
        5
    tearsinchina  
       2015-05-18 12:08:04 +08:00   ❤️ 1
    微软的oxford项目呀,语音转文本,支持中文。
    http://www.projectoxford.ai/demo/speech#recognition
    Comdex
        6
    Comdex  
       2015-05-18 12:11:51 +08:00   ❤️ 1
    百度“云知声”与“讯飞语音云”,云知声还有个电脑版的demo只能识别10m以下的wav
    Esay
        7
    Esay  
       2015-05-18 12:34:17 +08:00   ❤️ 1
    @damngood 好奇是怎么做的 podcast 的文字转换,能不能把方法讲讲
    ynyounuo
        8
    ynyounuo  
       2015-05-18 12:44:37 +08:00   ❤️ 1
    @Esay
    Dictation 准确率一般的。
    英文的话,我觉得 YouTube 的 Auto Captions 是准确率最高的,所以投机取巧的办法就是转成黑屏视频然后上传 YouTube,再再 Caption 标签下选择 English - Automatic Captions,然后手动校准。一般时间轴就是挺准的了,然后英文识别率非常好。
    ynyounuo
        9
    ynyounuo  
       2015-05-18 12:44:59 +08:00
    @ynyounuo * 再在
    Esay
        10
    Esay  
       2015-05-18 12:49:46 +08:00   ❤️ 1
    @ynyounuo 多谢。
    听英语 Podcast 有时会听得不是特别清楚,要是能有份字幕就好多了。
    damngood
        11
    damngood  
       2015-05-18 12:52:29 +08:00   ❤️ 1
    @Esay 哈哈, 我也是这么想的. 所以之前有考虑过通过技术手段解决这个问题. 所以尝试过各种方法.
    dictation 是其中之一.
    具体方式我现在忘记了.
    我查查看.
    mrhuiyu
        13
    mrhuiyu  
       2015-05-18 13:00:02 +08:00   ❤️ 1
    我知道,等我截图
    Esay
        14
    Esay  
       2015-05-18 13:00:09 +08:00
    @damngood Cool, one more thing to hack.
    zxy
        15
    zxy  
       2015-05-18 13:00:17 +08:00 via iPhone   ❤️ 1
    录音宝? 试试?帮宣传部门同事找录音转文字时发现的
    mrhuiyu
        16
    mrhuiyu  
       2015-05-18 13:05:04 +08:00   ❤️ 1
    http://loveshan.net/wp-content/uploads/2015/05/IMG_2292.png
    据我所知,移动有貌似叫什么灵犀云。对说话标准和环境有较高要求。一般来说很准,照片是保险公司的留言,他只说了三次“喂”其余则是他们那边的环境音转成的其他文字。。。我不知道行妈妈这个词怎么出来的。。。。。
    我搜到的http://blog.csdn.net/isandra/article/details/43154193
    JohnChu
        17
    JohnChu  
       2015-05-18 14:38:41 +08:00 via Android   ❤️ 1
    @mrhuiyu 这个让我想起Google Voice也有这样的功能。
    JohnChu
        18
    JohnChu  
       2015-05-18 14:43:09 +08:00 via Android   ❤️ 1
    vimutt
        19
    vimutt  
       2015-05-18 16:10:24 +08:00   ❤️ 1
    怎么没人提微信 我感觉微信里的语音转为文字功能 很不错 识别率也很高
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   921 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 22:03 · PVG 06:03 · LAX 14:03 · JFK 17:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.