V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  zhusimaji  ›  全部回复第 16 页 / 共 52 页
回复总数  1029
1 ... 12  13  14  15  16  17  18  19  20  21 ... 52  
2024-01-26 12:25:24 +08:00
回复了 LeeReamond 创建的主题 Python Transformer 是不是缺乏跨维度关系捕捉能力?
@Morriaty 有人回答了
2024-01-26 10:14:10 +08:00
回复了 LeeReamond 创建的主题 Python Transformer 是不是缺乏跨维度关系捕捉能力?
还好吧,现在都有专门的优化了,比如 Attention 有 flash attention 最近看 openai 新一代注意力机制 Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度。
2024-01-26 10:02:57 +08:00
回复了 LeeReamond 创建的主题 Python Transformer 是不是缺乏跨维度关系捕捉能力?
从实践来看,Attention 在推荐里用的也不少啊,MHA 用的挺广泛的
睡袋睡袋
2024-01-09 14:19:38 +08:00
回复了 ZZ74 创建的主题 Linux WSL2 哪个 Linux 发行版好用啊,最新的 Ubuntu 22 LTS 好像太新了
+1 20.04
2024-01-09 09:51:11 +08:00
回复了 Ytiaoa 创建的主题 macOS 2024 了,返朴归 Catalina ?
Sonoma 14.2 不过我是台式机黑果在家用😁
我之前淘宝买的 1.2*70 最便宜的松木花了 400 多,如果是真黑胡桃感觉值
2024-01-04 13:49:39 +08:00
回复了 starving 创建的主题 macOS 问下大家 m1pro 哪一个系统适合养老
Intel 黑果都是升级最新,m 系列怕啥
下班带娃,哄睡完看看视频,玩玩手游睡觉,开电脑不存在的
2023-12-29 10:03:29 +08:00
回复了 iorilu 创建的主题 程序员 怎么感觉 v2 这里很少有 ai 或大模型开发相关得讨论啊
当你在微调模型,发现需要 A100 H100 的时候就知道成本蛮高的
1 ... 12  13  14  15  16  17  18  19  20  21 ... 52  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5230 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 07:05 · PVG 15:05 · LAX 23:05 · JFK 02:05
♥ Do have faith in what you're doing.