V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yeeisme
V2EX  ›  推广

用你自己的数据, 5 分钟训练一个专属 ChatGPT,回答有据可依无幻觉

  •  1
     
  •   yeeisme · 2023-06-13 23:02:27 +08:00 · 2177 次点击
    这是一个创建于 515 天前的主题,其中的信息可能已经有所发展或是发生改变。

    不用自己去研究 langchain ,折腾向量数据。 无服务器,面向接口,利用 http://aiproxy.io/ 提供的自定义垂直聊天机器人、知识库能力,5 分钟就构建一个自己的聊天机器人。 只需要添加您的网站链接、PDF 等数据,即可获得类似 ChatGPT 的聊天机器人。让它专注于回答您设定的知识,减少逻辑错误和生成幻觉,只基于对您输入材料的理解去回答问题。

    您还可以使用此能力,将自己在网络上阅读的微信公众号文章,研究资料或其他文本形式的内容添加到知识库,让它帮你深度理解并记录,成为你的第二大脑。

    每一个回答,都是可解释的,回答时还会引用内容来源文档,保证准确无误。

    感兴趣的,可以看详细的文档: https://docs.aiproxy.io/dev/library

    下面展示一个利用此能力,构建的 TG 产品智能问答机器人,把产品文档的链接提交一下,就自动生成了一个如下效果的智能客服。

    产品智能客服

    说个题外话,aiproxy 除了提供垂直数据 chat ,这还是一个非常专业的 openai 接口代理平台,长期使用的开发者和团队用户,最低 10%费率,国内网络访问方便,还是非常划算的。

    产品最近也上线了开发者开放平台,各大围绕 chatgpt 构建的应用、插件作者,欢迎来试试。也可以来拿个邀请链接,贴到自己的博客或者产品页,实现 GPT 自由。

    10 条回复    2023-06-14 19:58:05 +08:00
    aduangduang
        1
    aduangduang  
       2023-06-14 10:36:04 +08:00
    10 元人民币能兑换 10000 积分,每个 token 价格为 0.02 积分,因此 10 元人民币可以用 500 个 tokens 。
    ???
    你要不要看看自己在说什么?
    yeeisme
        2
    yeeisme  
    OP
       2023-06-14 12:26:12 +08:00 via iPhone
    @aduangduang 数字推理 gpt3.5 模型也就这个水平了。你调用时可以上 gpt4 ,能好点。
    yeeisme
        3
    yeeisme  
    OP
       2023-06-14 12:26:58 +08:00 via iPhone
    @aduangduang 你也可以禁掉基于给定知识的推理,文档有什么答什么
    RageBubble
        4
    RageBubble  
       2023-06-14 15:47:00 +08:00
    这有点像对 GPT 进行微调,只不过 openia 只提供了 davince 以下的模型,使用你们这个可以直接微调 gpt4 。
    我已经买了会员了,准备好好研究一下。
    RageBubble
        5
    RageBubble  
       2023-06-14 15:48:55 +08:00
    另外,你们的教程文档我无法使用 gpt4 的 web browsing 功能浏览,希望能让 gpt 访问,我有时候不想自己看文档
    yeeisme
        6
    yeeisme  
    OP
       2023-06-14 16:11:36 +08:00
    @RageBubble 因为现在官方就还没放出 browsing 的 api ,后续平台计划自己做,敬请期待
    yeeisme
        7
    yeeisme  
    OP
       2023-06-14 16:13:18 +08:00
    @RageBubble 微调的成本可太高了。这个模式,今天看有会员用,一篇微信公众号的文章训练目前大概消耗 1 个积分,10 块钱可以买 1 万篇公众号文章。微调模型固定资源应该是 10 万起步吧。
    当然这功能正式放开,肯定要收平台存储和计算资源的费用。
    RageBubble
        8
    RageBubble  
       2023-06-14 17:00:02 +08:00
    @yipengfei329 #6 我的意思,当时我给 gpt4 你们的网址,想让 gpt4 去读里面的文档,然后让它告诉我怎么使用,有哪些功能。结果他说你们的 robots 阻止了它访问。
    RageBubble
        9
    RageBubble  
       2023-06-14 17:20:41 +08:00
    还有一点就是,你们会怎么处理用户上传的训练数据?
    yeeisme
        10
    yeeisme  
    OP
       2023-06-14 19:58:05 +08:00 via iPhone
    @RageBubble 向量化后存储,机密数据还是不适合用,openai 也会得到最后总结环节数据的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2622 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 05:15 · PVG 13:15 · LAX 21:15 · JFK 00:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.