需求:
看好多方案,ragflow fastgpt langchain-chatchat ,不知道实际用起来如何?或者有其他推荐的方案?
ChatGPT-Next-Web-langchain 感觉在上游的简单前端框架下加 rag 的逻辑,还是有点勉强了。
update:
现在ragflow等已经支持graphrag了(dify不支持)。更好的rag策略还包括,anthropic的contextual-retrieval 等等。
对比使用来看,传统直接做分割的确实存在很多问题痛点。
1
mumbler 132 天前
个人用吗,可以试试 flashai.com.cn 的云端版,开箱即用,支持 mac 和 win ,本地知识库+本地向量化,另外还有带本地大模型版本
|
2
GrayXu OP @mumbler #1 谢谢,这个方案看上去限制蛮多的,付费了也只有 8b 的模型。我们已经有 embedding, rerank, chat 的完整 api 服务了。
|
3
lixen9 132 天前 1
fastgpt 试用过感觉还行,蛮符合你的需求来着,开源版本即可
|
6
echoless 132 天前
embed, rerank 这些 api 你是用的开源的么?
我倒是想整合 RAG 这些到 https://github.com/swuecho/chat (只有 chat 功能) 然后可以(optional) 配置 embed, rerank API. |
9
pieerepeng 132 天前 1
|
10
SoloKing 132 天前 via Android 1
dify+1
|
11
wm5d8b 131 天前 via Android
模型不在本地部署,全用 api ,钱包它同意嘛
本地用 ollama 部署挺简单的,就是大概 12G 显存得 24 小时处于 standby 状态 |
13
zqqian 127 天前
所以楼主最后调研的结果是什么,能说一下吗?
|