V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
Jackyxiaoc
V2EX  ›  奇思妙想

有没有朋友想一起拼一个 chatgpt 蓝牙音箱

  •  
  •   Jackyxiaoc · 2023-04-23 22:07:45 +08:00 · 6146 次点击
    这是一个创建于 604 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如果是只有一个人玩玩,搞一个能链接 chatgpt 的蓝牙音箱有点划不来,有朋友们想用的么,如果想玩的人多了,就开个团搞搞。预计成本 300 左右。

    产品名称
    chatgpt 蓝牙音箱

    需求描述
    该产品由树莓派和国产蓝牙音箱组成。
    树莓派链接 chatgpt 接口,为用户提供语音服务。
    该 chatgpt 蓝牙音箱服务端部署在用户自身的微软云账号上。
    该 chatgpt 音箱主要用到微软云的 serverless 和语音转换等接口。
    用户第一次使用该 chatgpt 的蓝牙音箱时,需在页面填充 openai 和微软云的 key 。
    该产品无广告。

    产品介绍:这是一款由树莓派和国产蓝牙音箱组成的产品,旨在为用户提供与 ChatGPT 语音服务的连接。它可以通过蓝牙连接到其他设备,使您可以享受到 ChatGPT 提供的语音服务。对于该 ChatGPT 蓝牙音箱,您需要将树莓派与 ChatGPT 接口连接起来,以提供语音服务。 服务端部署在您自己的 Microsoft 云账户上,其中使用了微软云的 serverless 和语音转换等接口。 第一次使用该 ChatGPT 蓝牙音箱,您需要在页面上填写 OpenAI 和 Microsoft 云的 API Key 。我们相信这款产品将会给您带来非常好的用户体验。
    55 条回复    2024-05-09 01:27:18 +08:00
    sakujo
        1
    sakujo  
       2023-04-23 23:03:51 +08:00
    是不是聪明一点的小爱音响?那倒是挺不错的
    Jackyxiaoc
        2
    Jackyxiaoc  
    OP
       2023-04-23 23:11:51 +08:00
    @sakujo 是的,用来哄哄小朋友什么的,练习下英文对话啥的,看上去还不错。
    sakujo
        3
    sakujo  
       2023-04-23 23:26:35 +08:00
    @Jackyxiaoc #2 有点意思 不过如果问它有用的信息它会胡说八道啊 这样没办法当语音助手了
    lloovve
        4
    lloovve  
       2023-04-23 23:50:33 +08:00 via iPhone
    你能保证稳定才行,树莓派太贵,直接上 esp32
    demen
        5
    demen  
       2023-04-23 23:51:10 +08:00
    其实交互过程感觉挺难受,你问一个问题之后几十上百字的内容用语音播放来听取?平时我们微信聊天看到超过 10s 的语音都有点翻白眼了吧
    viWww0vvxmolvY5p
        6
    viWww0vvxmolvY5p  
       2023-04-23 23:58:51 +08:00
    有兴趣
    luckjoe680
        7
    luckjoe680  
       2023-04-24 00:06:36 +08:00 via Android
    问题是 小爱音箱就能办到了…也用不了 300 啊…
    musi
        8
    musi  
       2023-04-24 08:06:53 +08:00 via iPhone
    太贵了,为啥不用手机?
    Tink
        9
    Tink  
       2023-04-24 08:23:07 +08:00
    树莓派太贵了
    Tink
        10
    Tink  
       2023-04-24 08:24:36 +08:00   ❤️ 2
    这个价格不如买黑板的初代小爱音箱,破解 ssh 后 劫持语音转到 c hatgpt
    jimbray
        11
    jimbray  
       2023-04-24 08:26:03 +08:00
    @demen 同意,之前用手机实现了一下语音问答,问一句,答得太多了,用语音播放有点难受,换成文字一下就看完了。纯问答我觉得没有什么意思。
    yuchenxing
        12
    yuchenxing  
       2023-04-24 08:45:28 +08:00
    怎么搞
    hoky
        13
    hoky  
       2023-04-24 08:52:51 +08:00 via iPhone
    为什么不直接用闲置的手机?
    iPhone 用 Siri
    Android 用 Tasker
    我都试过玩过一阵子
    后来因为直连 openai 响应慢玩的不多了
    totoro625
        14
    totoro625  
       2023-04-24 08:55:34 +08:00
    iPhone 安装 OpenCat: https://apps.apple.com/app/opencat/id6445999201
    填入 api key ,开启高级版,并开启 Siri 支持
    任意支持 Siri 的 iPhone/apple watch 均可用 Siri 调用 chatgpt 进行对话
    Biluesgakki
        15
    Biluesgakki  
       2023-04-24 09:20:00 +08:00
    如何做到流式传输结果 传回来一个字读一个字呢。不然的话响应时间太长了,需要等到全部返回结果才开始读
    timeance
        16
    timeance  
       2023-04-24 10:07:28 +08:00
    1. 树莓派的方案太贵
    2. 硬件部分,基本功能调通,麦克风如何降噪拾音等
    3. 软件部分怎么完善,例如 prompt ,唤醒和本地识别语音指令等

    ... 想法挺好的,要是真有完善的方案 会买一个来玩
    yfmir
        17
    yfmir  
       2023-04-24 10:36:15 +08:00
    就目前这 api 的连接环境来看还是算了吧
    littleBink
        18
    littleBink  
       2023-04-24 10:40:42 +08:00
    gpt 大部分回答都很长且书面,需要测试大量的 prompt 来优化
    aeli
        19
    aeli  
       2023-04-24 11:10:36 +08:00
    反应速度现在还不太行,GPT3 的回答虽然快,也要 1-2 秒,然后再转成语音发声,延迟会感觉比较明显的卡顿。

    GPT4 就不用说了,能正常时间内给你返回就不容易了
    zagfai
        20
    zagfai  
       2023-04-24 11:31:53 +08:00
    可以接入米家就行,我不需要很智能,当然,我能给出传感器数据能帮我判断我是不是睡醒,自动开关窗帘,判断我啥时候会回家自动帮我开空调,那也不错。
    ropzislaw
        21
    ropzislaw  
       2023-04-24 11:53:17 +08:00 via Android
    这个 idea 我也有过,最后被劝退了
    1. 需求多了生产线怎么弄,如何保证自己的生产线成本低
    2 延迟和输出延迟
    3 实时数据缺失
    Jackyxiaoc
        22
    Jackyxiaoc  
    OP
       2023-04-24 12:28:02 +08:00
    @mway 感谢。
    @luckjoe680 小爱的智能水平和 chatgpt 不太一样。
    @lloovve 感谢,我研究下。
    @musi 在家常驻使用比较舒服。
    @Tink 确实是个好办法,感谢。
    @yuchenxing 我研究下路径,如果可以的话,一起拼个单,组好了大家用,成本就下来了。
    @hoky 还是得有稳定的通道。
    @totoro625 长时间接着电源的小音箱在家小朋友什么的好玩。感谢,我研究下。
    @Biluesgakki 流式的话,这个得研究下。大概 10 个字一读会不会好点。
    @timeance 感谢支持,我研究下。
    @yfmir 估计得内置一个通道才行。
    @aeli 目前看是的。看看有没有更好的解决方案。
    @zagfai 如果更智能应该是个更好的体验。
    @ropzislaw 只是一个初步想法,天猫精灵的话二手成本是挺低的。如果单纯是树莓派的解决方案,树莓派也不会很贵。延迟这个通道可以解决。实时数据的话,可以导入谷歌的。

    感谢各位大佬们的建议。
    tags
        23
    tags  
       2023-04-24 13:51:38 +08:00
    不错不错,可以先在 linux 虚拟机上把系统搭起来,后面用啥硬件平台可以再说
    Socrazy
        24
    Socrazy  
       2023-04-24 13:55:45 +08:00
    Siri 上用了,其实很无聊,简单问题还行,太长的听起来很累
    freetree
        25
    freetree  
       2023-04-24 13:57:41 +08:00 via Android
    华强北听到了你的呼求😁
    yulgang
        26
    yulgang  
       2023-04-24 14:01:28 +08:00
    想法不错,但是树莓派成本有点高。。
    lambdaq
        27
    lambdaq  
       2023-04-24 14:02:05 +08:00
    @Socrazy 可以进一步搞点人设的 prompt 吧
    yulgang
        28
    yulgang  
       2023-04-24 14:05:14 +08:00
    如果你能开源的话,大家喜欢,可能会衍生出多个版本,不过一定会有人用你的开源代码拿去赚钱。😂
    Jackyxiaoc
        29
    Jackyxiaoc  
    OP
       2023-04-24 14:19:19 +08:00
    @tags 对,可以先测试下反应速度啥的,看看这些问题能否解决。
    @Socrazy 感谢,我先试试。
    @freetree 哈哈哈哈,如果有成品了直接买也是不错,不用自己折腾了。
    @yulgang 树莓派确实成本有点高,不过开源代码拿去赚钱这个国内很常见了。
    @lambdaq 对的。
    dangyuluo
        30
    dangyuluo  
       2023-04-24 16:09:58 +08:00
    直接用 Siri 就可以接入 ChatGPT 了
    Jackyxiaoc
        31
    Jackyxiaoc  
    OP
       2023-04-24 16:30:24 +08:00 via iPhone
    @dangyuluo 不知道咸鱼上 300 的 6s 能不能跑,如果可以的话,也是不错的选择。
    cloudzqy
        32
    cloudzqy  
       2023-04-24 17:31:36 +08:00
    这种自己走微软云文字转语音的,一般用什么方案识别关键字然后开始对话呀,如果一直开着的话,微软云也挺贵的。
    westoy
        33
    westoy  
       2023-04-24 17:39:57 +08:00
    做公开服务成本太高了吧

    京东的那个叮咚音箱都倒闭了.......
    zapper
        34
    zapper  
       2023-04-24 17:42:12 +08:00
    看了一下(可能是生成的)产品介绍。发现好像没说如何正确地拾音给 chatgpt

    所谓悲观者常常正确,乐观者往往成功。如果能接入插件将绝杀
    tags
        35
    tags  
       2023-04-24 17:44:54 +08:00
    唤醒词本地离线模型就能跑
    Jackyxiaoc
        36
    Jackyxiaoc  
    OP
       2023-04-24 18:11:25 +08:00
    @cloudzqy , @tags 大佬提供的方案是本地模型去识别关键词。谢谢 @tags
    @westoy 公司去做估计是难,利润空间不大,这个只是想做着自己玩玩的,给家里人也体验下 chatgpt 。
    @zapper 有道理。
    webdesigner
        37
    webdesigner  
       2023-04-24 19:23:27 +08:00 via iPhone
    从我使用 gpt 连接 siri 的体验来看,这个项目做出来体验会很差。api 目前要么用 sse 逐字输出,要么牺牲响应时间等待全部结果。逐字输出文字转语音效果会很差,一个一个字朗读。等待全部结果在朗读,用户响应时间特别长,你无法想象当你问完一个问题,就得等待十几秒钟来告诉你答案。如果这个方案可行,大厂早就整出来了。
    hanguofu
        38
    hanguofu  
       2023-04-24 21:18:38 +08:00
    @tags : 本地离线模型是指 whisper 吗 ?有没有更好的?
    wellqq
        39
    wellqq  
       2023-04-24 21:26:45 +08:00 via Android
    按你目前的阶段,感觉离成品还有一些路要走,不过有出来体验好我会买,有众筹通知一下
    fresco
        40
    fresco  
       2023-04-25 00:10:37 +08:00 via iPhone
    一直在找能语音对话的 app ,这个想法不错,成本低点就好了
    luckjoe680
        41
    luckjoe680  
       2023-04-25 07:21:45 +08:00 via Android
    @Jackyxiaoc 你可以看看 现在 chatgpt 现在已经有大佬接入小爱了 而且还很方便=.=
    Jackyxiaoc
        42
    Jackyxiaoc  
    OP
       2023-04-25 08:36:00 +08:00
    @webdesigner 确实,可能还需要看看有没有更好的方案啦。
    @wellqq 好的,谢谢支持。
    @fresco 嗯嗯,谢谢。
    @luckjoe680 如果有大佬折腾出来卖成品的话就不折腾了,等我看看,之前没看到。感谢提醒。
    aeli
        43
    aeli  
       2023-04-25 10:06:05 +08:00
    如果说成品的话,找 amaon 的音箱,它家的很容易开发改第三方,YouTube 上有人放出来教程改 ChatGPT 的
    Smackgg
        44
    Smackgg  
       2023-04-25 10:46:33 +08:00
    小爱 小度 自己写一个插件不就做到了?小度六七十块钱就能买到
    xuelu520
        45
    xuelu520  
       2023-04-25 11:25:50 +08:00
    需要短平快的对话,gpt 一大堆文字,给你转成语音,太难受了
    xinyana
        46
    xinyana  
       2023-04-25 12:43:34 +08:00 via Android
    墙的问题怎么搞定?内置墙?
    xsen
        47
    xsen  
       2023-04-25 14:09:17 +08:00
    现在 chatgpt 的模型,只适合用来替代搜索引擎、客服类似的
    用来做 ai 助理(语音对话)是真不合适,长篇大论、废话太多
    cloudzqy
        48
    cloudzqy  
       2023-04-25 14:24:00 +08:00
    @tags whisper 感觉中文不太行,同求一个本地模型
    cloudzqy
        49
    cloudzqy  
       2023-04-25 14:27:29 +08:00
    @webdesigner 这种可以折中一下,识别到标点符号断句就开始读,一句一句读,比小爱音箱什么的肯定慢,但是应该没十几秒。
    luobogooooo
        50
    luobogooooo  
       2023-04-25 22:43:13 +08:00
    笑到了,哈哈哈
    hoopan
        51
    hoopan  
       2023-04-26 09:39:35 +08:00
    家里有台待机的 NAS ,增加个麦克风、音响,是不是也能搞成 AI 音箱。

    有基于 chatgpt 的语音助手开源服务端吗?
    swxk521
        52
    swxk521  
       2023-04-26 23:36:53 +08:00
    https://space.bilibili.com/452098958
    这人做的感觉不错
    unii23i
        53
    unii23i  
       2023-04-27 11:49:35 +08:00
    这个真的很需要!我经常和天猫精灵对线
    zsrex
        54
    zsrex  
       2023-05-08 15:32:18 +08:00
    这个我感兴趣,之前折腾了一下 wukong-robot ,但 ubuntu 的系统太难搞了,可能我没有这个基础。
    smjbwyhhhh
        55
    smjbwyhhhh  
       223 天前
    这么多 DIY 教程,怎么就是没有一个拿出来卖的啊。。。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4360 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 05:33 · PVG 13:33 · LAX 21:33 · JFK 00:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.