V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
MuskZhou
V2EX  ›  问与答

求助微信聊天记录训练 ai

  •  
  •   MuskZhou · 1 天前 · 1688 次点击
    如题所示,导出了大概 12 万条聊天记录,请问各位佬有什么好的办法训练让 ai 模仿吗
    17 条回复    2026-01-03 10:09:50 +08:00
    s609926202
        1
    s609926202  
       1 天前 via iPhone
    同问,我想把聊天记录做成知识库,做成什么格式的( excel ,txt 等)最好
    liuzimin
        2
    liuzimin  
       1 天前 via Android
    准备做秽土转生?
    qixinwuchen
        3
    qixinwuchen  
       1 天前 via iPhone
    感兴趣,关注一下
    vovov
        4
    vovov  
       1 天前 via iPhone
    我准备把聊天记录向量化,然后把匹配的数据用大模型来回答看看效果
    dji38838c
        5
    dji38838c  
       1 天前
    这思路..
    你直接拿这个问题用 AI 不就行了
    lloovve
        6
    lloovve  
       1 天前 via iPhone
    找到方案踢我一下,我也想转生一个
    okoklll
        7
    okoklll  
       1 天前
    试试 Weclone
    https://docs.llamafactory.online/docs/documents/best-practice/weclone
    zisen
        8
    zisen  
       1 天前
    euph
        9
    euph  
       1 天前 via Android
    刚问了哈基米,感觉瓶颈还是在 gpu
    might1
        10
    might1  
       1 天前 via Android
    更好奇是怎么导出来的微信聊天记录
    cxsz
        11
    cxsz  
       1 天前
    同好奇怎么导出数据
    hafuhafu
        12
    hafuhafu  
       1 天前   ❤️ 1
    需要自己清洗一下对话,去掉没用的信息,然后多次连续的消息拼成一个长句,最终应该变成 QA 形式的,你的对话是 Q ,对方的是 A 。
    然后用 LlamaFactory 之类的微调。
    之前稍微玩了一下,太久了忘了,反正看文档完事。
    jiandandkl
        14
    jiandandkl  
       18 小时 14 分钟前
    @okoklll 试过 weclone ,效果很不好
    MuskZhou
        15
    MuskZhou  
    OP
       14 小时 22 分钟前
    @might1 我的是 macOS ,微信回退到 3.8.0 然后用 wxdump
    MuskZhou
        16
    MuskZhou  
    OP
       14 小时 22 分钟前
    @cxsz 我的是 macOS ,微信回退到 3.8.0 然后用 wxdump
    okoklll
        17
    okoklll  
       14 小时 7 分钟前
    @jiandandkl 这个和数据质量关系还是挺大的,当时用的哪个模型呢
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1435 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 16:17 · PVG 00:17 · LAX 08:17 · JFK 11:17
    ♥ Do have faith in what you're doing.