V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
veotax
V2EX  ›  分享创造

基于 LangChain 的开源 GPT 向量 + 知识数据库,帮助个人或企业实现自己的专属 AI 问答助手

  •  
  •   veotax ·
    PRO
    · 2024 年 3 月 11 日 · 141023 次点击
    这是一个创建于 683 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Casibase ( https://github.com/casibase/casibase )是一套开源的基于 Web 的 AI 知识数据库,适合个人或者组织作为自己的专属内部 AI 知识库来使用。GitHub 已达到 1600+ stars ,欢迎体验~

    主要功能如下:

    • 支持 OpenAI GPT-4 模型、GPT Vision 图片解析、DALL-E 画图等功能;
    • 支持最新的 Claude 3 Opus 、Sonnet 等模型,超越 GPT-4 ;
    • 国际模型支持:Azure OpenAI 、Google Gemini Pro 、HuggingFace 、Cohere 等;
    • 国内模型支持:文心一言、通义千问、ChatGLM 、Minimax 、讯飞星火等;
    • 支持多种 Embedding 嵌入 API 接口,如 OpenAI V3, Ada V2, 百度文心一言等;
    • 支持多种通用文档格式:TXT, Markdown, Docx, PDF 等,支持 PDF 文件智能解析;
    • 支持以会话或消息为单位,计算所有大模型 API 的 Token 数和价格(美元或人民币),方便管理员进行 API 成本统计;
    • 支持 AI 小助手通过右下角弹框嵌入到应用网站,进行在线实时聊天,支持聊天会话人工接入;
    • 知识库文档存储支持本地存储,或云端存储(阿里云 OSS 、Amazon S3 、群晖 NAS 等几乎所有主流云存储都有支持);
    • 支持多用户、多租户,支持管理员进行用户管理、角色管理、权限管理,既适合个人使用,也适合组织使用;
    • 支持 QQ 、微信、企业微信、钉钉、Google 、GitHub 等多种第三方登录,支持短信登录、邮箱验证码登录登;
    • 支持谷歌 reCAPTCHA 、hCaptcha 、阿里云、GEETEST 极验、Cloudflare Turnstile 等多种人机验证方式,专业防盗刷;
    • 聊天会话云端存储,所有设备实时消息同步,随时可查看,不会丢失;
    • 支持中文、英文等在内的十几种界面语言。

    在线体验:

    源码:

    社区反馈:

    131 条回复    2026-01-08 21:25:15 +08:00
    1  2  
    metalvest
        101
    metalvest  
       2025 年 2 月 28 日
    @zdw189803631 用铜币好像可以把自己的帖子顶上去?
    fofo
        102
    fofo  
       2025 年 2 月 28 日
    @terranboy RAG 的核心是数据清洗(生成),特定领域的向量模型的微调,目前的开源框架主要都不关注这些。
    SkywalkerJi
        103
    SkywalkerJi  
       2025 年 3 月 4 日 via Android
    rag 召回数量是有限的,如果内容超过 k 值岂不是一定查不到。
    G64q9J89mN5KSgmE
        104
    G64q9J89mN5KSgmE  
       2025 年 3 月 4 日
    @terranboy
    RAG 核心是数据处理、向量化、召回、排序、重组,你哐哐哐把一堆文档丢进去,当然效果差
    这些要做好,都得手动开发,至少的是大数据+机器学习的技术栈了
    wyntalgeer
        105
    wyntalgeer  
       2025 年 3 月 4 日
    @terranboy 把你的文档扔给 AI 整理一下给 RAG ,再探再报
    clear
        106
    clear  
       2025 年 3 月 4 日
    和 ragflow 区别或者优势在哪里
    Bunsei
        107
    Bunsei  
       2025 年 3 月 4 日
    看起来还不错,有空试一试。
    xinta
        108
    xinta  
       2025 年 3 月 11 日
    @ren2881971 其实私有化,除了钱多,我觉得没啥优势,又不是军工涉密单位
    SethShi
        109
    SethShi  
       2025 年 3 月 17 日
    请教一下,像 cursor 那样项目级分析代码是用知识库分析?
    rqYzyAced2NbD8fw
        110
    rqYzyAced2NbD8fw  
       2025 年 3 月 19 日   ❤️ 1
    v2 新 casdoor
    potatowish
        111
    potatowish  
       2025 年 3 月 27 日 via iPhone
    @LanhuaMa #110 casdoor 小号起的项目
    clino
        112
    clino  
       2025 年 4 月 1 日
    支持 ldap 登入吗?我看了一下好像没说有支持,企业内用要支持这个比较好哈。
    veotax
        113
    veotax  
    OP
    PRO
       2025 年 4 月 1 日
    @clino 支持的
    vem
        114
    vem  
       2025 年 4 月 7 日
    @SimonZhong Text 2 SQL 有什么问题吗?我最近测下来,准确率比知识库要高很多
    zhangyou1010
        115
    zhangyou1010  
       2025 年 4 月 18 日
    和腾讯的 ima 比起来,效果怎么样?
    bzj
        116
    bzj  
       2025 年 4 月 29 日
    @ideaa 不开源不敢用
    avenger
        117
    avenger  
       2025 年 5 月 6 日 via iPhone
    https://rushiwowen.co/chat

    刚好,昨天也做了一个基于向量数据库,搜索佛经问答的功能,目前用的是阿里千问的接口,也是感觉到匹配内容不够精准
    G9E7GdL3f4NmG0hd
        118
    G9E7GdL3f4NmG0hd  
       2025 年 5 月 6 日
    一打开网页就报错啊
    jackbon
        119
    jackbon  
       2025 年 5 月 9 日
    到现在为止 没发现一款能达到工作辅助效果的本地知识库。 目前市面上的开源的基本都搭建调试过 达不到工作要求!
    01802
        120
    01802  
       2025 年 5 月 26 日 via Android
    anythingllm 自带了,不知道楼主的如何,抽空试试看。
    byby
        121
    byby  
       2025 年 5 月 27 日
    回答时出现错误。
    The target vector's length: [1536] should equal to knowledge vector's length: [3], target vector = [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0], knowledge vector = [0.1 0.2 0.3]
    veotax
        122
    veotax  
    OP
    PRO
       2025 年 5 月 28 日
    @smallflyk @byby 错误已修复,可以再试下
    opentrade
        123
    opentrade  
       2025 年 6 月 2 日
    @SimonZhong 的确也只有 RAGFlow 好点,但也没好太多,相比几款商业化方案,差距大太多。
    skuuhui
        124
    skuuhui  
       2025 年 6 月 27 日
    历史记录都没带吗?
    nasmatic
        125
    nasmatic  
       2025 年 7 月 10 日
    @opentrade 商业化方案有哪些
    Seanfuck
        126
    Seanfuck  
       2025 年 8 月 14 日
    这东西只适合大型文档,小型文档不如直接丢多模态大模型。
    TeslaM3
        127
    TeslaM3  
       2025 年 10 月 31 日
    效果差得一 b
    winson030
        128
    winson030  
       2025 年 11 月 1 日 via iPhone
    @nasmatic aws bedrock 应该不错
    newjuzi
        129
    newjuzi  
       2025 年 11 月 21 日
    有做过类似的项目,有一些难点和建议希望能分享出来,开源 GPT 向量 + 知识数据库 + MCP 做一些自动化开发 部署 以及对 飞书 jira 或者服务器进行一些操作的,把开发运维的日常工作做成类似于班车发版的形式,但是知识库对项目的一些逻辑原理的增益并不佳,MCP 对于飞书或者服务器的连接也效果不佳,不是因为网络条件服务器连不上,就是因为飞书 jira 上的一些操作没有开放接口做不了。至于知识库也是,注入了很多规范流程,但是模型理解的效果不佳,可能需要对模型进行重训,个人来说也没有那么多的时间和技术储备来做到用的很舒服。这点是比较难的
    avenger
        130
    avenger  
       2025 年 12 月 27 日 via iPhone
    @ffgrinder 向量负责召回 reranking 负责排序 现在一般是这样 效果也是因查询而异
    TabGre
        131
    TabGre  
       15 天前 via iPhone
    以我公司内部的 rag 应用 太垃圾了 都开始转为本地文件 grep 了
    1  2  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1010 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 18:49 · PVG 02:49 · LAX 10:49 · JFK 13:49
    ♥ Do have faith in what you're doing.