V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
snoBall
V2EX  ›  问与答

有人拿过自己的微信聊天记录训练大模型吗?

  •  
  •   snoBall · 2024-11-11 17:27:21 +08:00 · 1351 次点击
    这是一个创建于 393 天前的主题,其中的信息可能已经有所发展或是发生改变。
    类似于这个项目里面的:
    https://github.com/LC044/WeChatMsg
    想玩一玩,但用运算力有可能造成隐私泄露,所以想问一下大概什么性能的机器能本地训练?
    3 条回复    2024-11-12 09:35:47 +08:00
    snoBall
        1
    snoBall  
    OP
       2024-11-11 21:10:32 +08:00 via Android
    真的没有人试过吗........
    Volekingsg
        2
    Volekingsg  
       2024-11-11 21:29:30 +08:00
    因为这种少量(相对预训练)数据怎么通过训练让 LLM 记住且会利用,还不丢失原有能力是件比较困难的事情。不是简单的 CPT 或者 SFT 就可以的
    pianjiao
        3
    pianjiao  
       2024-11-12 09:35:47 +08:00
    好像在哪里看见过有人用聊天记录训练 本地模型然后对话的。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1012 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 18:35 · PVG 02:35 · LAX 10:35 · JFK 13:35
    ♥ Do have faith in what you're doing.