r/LocalLLaMA· rssEN02:59 · 04·23
RTX 3090 vs Intel Arc Pro B70:同机器跑 llama.cpp,B70 慢 71%
Reddit 用户在同一台机器上分别用 RTX 3090 和 Intel Arc Pro B70 跑 llama.cpp 基准测试。处理 512 token 的 prompt 时,B70 平均比 3090 慢 71.1%。生成阶段(128 token)B70 用 Vulkan 后端比 SYCL 后端慢 160%,但全文被截断,没给出完整的生成平均速度。...
#Inference-opt#Benchmarking#Tools#Nvidia
精选理由
一个 Reddit 用户的单来源跑分,HKR-K 过关是因为给了同机器实测数字:71.1% 和 160.0%。HKR-R 也过关,本地推理读者确实关心显卡和后端选择。但 HKR-H 偏弱,tg128 均值还被截断了,所以留在 all 层。
一句话点评
这篇帖子标题是 RTX 3090 和 Intel Arc Pro B70 在 llama.cpp 下的跑分对比,但正文被 Reddit 屏蔽了,实际内容为零。没有数据、没有结论,连图都加载不出来。所以这条信息目前只有标题有价值——它提示有人在做这个对比,但结果未知。如果你关心 Intel 独显跑大模型的性价比,可以自己去搜原帖或等后续更新。目前没法判断谁赢,也别信任何转述。
锐评
这组测试先把一个残酷事实摆明了:Arc Pro B70 在同机 pp512 里平均落后 RTX 3090 71.1%。我对这条的判断很简单,这不是一张卡“差一点没调好”,这是 Intel 在本地推理生态里还没把执行路径做平。你看表就知道,B70 用 Vulkan 时多数模型都在 3090 的四分之一附近,SYCL 有些模型能救回来,像 gemma-4-E2B-it 提升 50.3%,Qwen3.5-4B 提升 23.5%,但另一些反而更差,Qwen3.5-35B 和 Qwen3.6-35B 都慢了 49.7%。同一张卡,同一个 benchmark,后端切一下就从加速变减速,这不是“略有波动”,这是栈还没收敛。
我对这贴最大的保留也在这里:它不是一个干净的 apples-to-apples 对比。3090 跑的是主线 llama.cpp 的 Vulkan。B70 的 SYCL 跑的是 Docker 里的 Ubuntu 24.04,加的是 aicss-genai 的 fork。也就是说,比较里同时混进了 GPU、后端、代码分支、运行环境四个变量。这个条件下,结论只能写成“今天普通人按这套装法跑出来会这样”,不能写成“B70 硬件就是比 3090 慢 71.1%”。更何况 3090 这里都没上 CUDA。熟悉 llama.cpp 的人都知道,Nvidia 在这个项目上的主场一直不是 Vulkan。我自己没复跑,但如果把 3090 换成 CUDA 路径,差距大概率只会更大,不会更小。
这也是 Intel 这两年的老问题。它每次进本地 AI 讨论,卖点都容易落到显存容量、价格、某些模型能装下,少数 workload 还能打出好看的比值;一到通用开源栈,开发者先撞上的还是后端成熟度。去年到今年,不管是 oneAPI、SYCL,还是各类社区适配,Intel 都不是完全不能用,而是“你得先接受路径很多、结果很飘”。这对折腾党没问题,对想把机器变成稳定生产工具的人就很致命。3090 这种老卡到 2026 还在被拿来当基线,原因不神秘:不是它新,而是 CUDA 这套东西把可预期性做出来了。
还有一个标题里没讲透、正文也被截断的点:tg128 后半张表没给完,所以生成阶段的均值正文未披露。现在只能确认单个例子里,Qwen2.5-Coder-7B 的 B70 SYCL 比 B70 Vulkan 快 160.0%。这个数字看着猛,我反而更警觉。为什么 prompt processing 里多数模型只差个位数到 50%,到 generation 某个模型就能跳到 160%?是 kernel 选型差异,还是 batch、KV cache、quant 配置碰到了特别吃后端的点?帖子截断后没有条件说明,我不买“SYCL 已经全面翻身”这种讲法。
所以这条我会这样读:它证明的不是 B70 完全没戏,而是 Intel 还没拿到“默认可推荐”的资格。要让本地开发者改口,下一步需要的不是再发一组单点跑分,而是在主线 llama.cpp、统一环境、统一后端选项下,把 pp 和 tg 两段都稳定拉到能和 3090 Vulkan 接近,最好再公开完整命令、驱动版本、offload 层数。现在这贴已经有价值了,它把问题钉在软件栈,而不是继续把锅含糊地甩给硬件。
HKR 分解
hook —knowledge ✓resonance ✓