V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ryanwong97  ›  全部回复第 1 页 / 共 1 页
回复总数  3
@yb2313 除了文档解析比较好,其他都比较一般。不过文档解析是 RAG 的重要一环,不少业务场景对这块要求挺高。
@hwangyi 之前大致算了一下 kimi 的 API 接入方式的使用费用。moonshot-128k 现在的价格,是 6 分钱每千 token ,按照 50 人规模团队测算,假设每人每天对话 20 轮,一个月下来(就工作日 22 天)的话,费用接近一张 4090 的钱。
跟 LZ 类似的需求,现在主力在用 Dify ,同时还在备选观望 Bisheng 和 RAGFlow ,这俩还没部署,实际功能和体验尚不明确。

目前的主力解决方案是:框架用 Dify ,主要选择理由是完成度高,开箱即用。LLM 本地部署了 Qwen1.5-14b (基本上目前国产开源 10b 级别里面中文对话场景最强),也有 API 接入方式的 LLM ,比如 moonshot 。对智谱、百川和 yi 在实际任务中的表现比较失望。为了 RAG 任务本地还部了 embedding 模型和 rerank 模型。

知识库功能那块,Dify 目前的能力勉强算“能用”,自动分块基本上都是切稀碎,想要召回命中效果好,重新编辑 chunk 是必须的。而且对复杂文档的解析非常一般,这也是目前在看 RAGFlow 的原因(文档解析功能很牛,但整体框架的完成度太低)。

我这边的需求不仅仅是企业私有知识库,还需要对接企业数据库( MySQL )以实现 Chat to DB 的功能,目前还在研究解决方案摸索中。如果大家有合适的解决方案,也请推荐一下。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1055 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 19:40 · PVG 03:40 · LAX 11:40 · JFK 14:40
Developed with CodeLauncher
♥ Do have faith in what you're doing.