r/LocalLLaMA· rssEN16:13 · 05·31
Qwen3.6-35B vs Gemma4-26B:7900 XTX 上谁更快?
有人在 Radeon 7900 XTX 上跑了六个真实任务,对比 Qwen3.6-35B-A3B 和 Gemma4-26B-A4B。Gemma 总耗时 95.6 秒,比 Qwen 的 118.8 秒快约 20%;但 Qwen 解码速度更快(130 tok/s vs 78 tok/s),而且生成了 14,811 个 token,是 Gemma 的 7,3...
#Reasoning#Inference-opt#Code#Qwen
精选理由
这篇是 Reddit 上一个人在自己 7900 XTX 上做的对比测试,数据具体、场景真实。Qwen 解码快但输出 token 多,导致总时间反而更长,这个反直觉的点对本地部署选模型有实际指导意义。不过只有 6 个任务、单用户单卡,样本和场景都有限,所以重要性在 60–71 区间合理,不到 featured。
一句话点评
有人在 AMD 7900 XTX 上实测了 Qwen3.6-35B 和 Gemma4-26B 的六个真实任务。Gemma 总耗时 95.6 秒,比 Qwen 的 118.8 秒快约 20%;但 Qwen 解码速度更快(130 tok/s vs 78 tok/s),且生成了 14,811 个 token,是 Gemma 的 7,386 的两倍。
短评:Gemma 整体快,但 Qwen 输出更...
HKR 分解
hook ✓knowledge ✓resonance ✓