V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
wsbqdyhm
V2EX  ›  程序员

2025 年了,有没有这样的一个 ai 工具?

  •  
  •   wsbqdyhm · 3 天前 · 2982 次点击

    就是我有一些 word 文档、excel 文档、ppt 文档、图片、txt 文档,总之是大杂烩,放在一个文件夹,然后有没有 ai 工具能够根据这个文件夹去整合内容,例如提示词:我要在这个文件夹检索资料,然后输出一份年终总结 ppt 或者 pdf 。(图文并茂的那种)

    20 条回复    2025-01-15 22:13:26 +08:00
    v2exgo
        1
    v2exgo  
       3 天前
    ragflow 试一下,可以搞私人知识库,
    v2exgo
        2
    v2exgo  
       3 天前
    目前貌似 没有什么好的工具 能直接切分好 乱七八糟的文档,这些工具里面自带了一些文档切分工具,你可以看下,私人知识库,目前的难点就是将文档切分成元数据,后面都是接的各种大模型的接口
    leewlab
        3
    leewlab  
       3 天前
    notebooklm
    mumbler
        4
    mumbler  
       3 天前
    gemini 就可以,支持 200 万上下文,可以把各种文件上传,然后提问就行了
    yuwangG
        5
    yuwangG  
       3 天前
    你需要的是 RAG
    RRRoger
        6
    RRRoger  
       3 天前
    @yuwangG RAG 擅长的是检索回答 并不适合去总结 这个目前只能长上下文去做
    huihushijie1996
        7
    huihushijie1996  
       3 天前
    同问
    huihushijie1996
        8
    huihushijie1996  
       3 天前
    @huihushijie1996 感觉没有一个好用的 ai 本地知识库,好多不是部署麻烦,就是并不像本地 ai 知识库 打着本地知识库的名义实际是联网的
    635614874
        9
    635614874  
       3 天前
    腾讯 ima
    wqhui
        10
    wqhui  
       3 天前
    上传到知识库,然后总结
    RandomJoke
        11
    RandomJoke  
       3 天前
    楼上那些说 rag 的,RAG 是检索增强的,根本不适合做总结的啊。。。
    wsbqdyhm
        12
    wsbqdyhm  
    OP
       3 天前
    @v2exgo @leewlab @mumbler @yuwangG @635614874 好,谢谢以上各位,上面提到的 ragflow 、notebooklm 、gemini 、RAG 、腾讯 ima 都会用一轮,看哪个最为接近我的需求,随后回来反馈一下。
    zomfg
        13
    zomfg  
       3 天前
    @wsbqdyhm 等你来回来分享
    JayZXu
        14
    JayZXu  
       3 天前
    这需求其实现在来说不好实现
    RAG 知识库主要是为了大海捞针,但是总结是需要全文输入
    本质上,数据量大了,都要掌握,微调才是最好方法,但是又有点小题大做了
    blur1119
        15
    blur1119  
       3 天前
    kimi 不知道行不行 你试试
    clemente
        16
    clemente  
       3 天前
    我可以做.
    stong2
        17
    stong2  
       3 天前
    https://github.com/eosphoros-ai/DB-GPT
    有个 DB-GPT 的项目可以看看
    0x5c0f
        18
    0x5c0f  
       2 天前
    你这个其实需要的是像 fastgpt 这种的 , 但很多情况下,这些都得自己弄
    sampeng
        19
    sampeng  
       2 天前
    总结类的很难做到。
    我觉得有几个原因
    1.注意力问题,很好测试,弄一本书,随机插入固定字符串,让他总结在哪些地方,肯定会丢。不管有多大上下文。如果解决了这个问题,AI 的实用性是一大提升
    2.另一部分就是资源的格式问题,现在没有任何产品能做到完美的自动识别所有的资源。因为格式千奇百怪的,说的就是你 pdf 。OCR 技术可以帮忙,但是布局推测会有的好有的不好。
    3.就是成本问题,现在的成本如果做 rag 。资源特别多的成本是很高的,而且还要做到跨资源总结,目测是没有产品做到,就算做到,效果也很差。
    hez2010
        20
    hez2010  
       2 天前
    你说的超级增强版就是 Microsoft 365 Copilot (商业用户的那个,不是个人用户的)。
    买个 Microsoft 365 商业版订阅然后开个商业版的 Copilot ,他就会把你 OneDrive 里所有的数据都综合到一起让 AI 帮你组织起来。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3012 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 06:48 · PVG 14:48 · LAX 22:48 · JFK 01:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.