很久没本地跑小模型了,之前用的 QWen3-30B-A3B 2507 效果最佳,现在想咨询下哪个模型效果会更好些
1
xtreme1 5 小时 49 分钟前
卡死 32G 显存么, 还得留点给上下文吧.
|
2
summerLast OP @xtreme1 用量化后的,32G 还有 10G 左右给上下文
|
3
slowgen 4 小时 22 分钟前
GLM-4.7-Flash
|
4
summerLast OP @slowgen 思维链模型吗
|