● P1X · @dotey(宝玉)· x-apiZH01:14 · 04·04
DeepSeek V4 推迟发布,重写底层代码,就为了跑在华为昇腾 950PR 上
V4 跳票了几个月,原因是 DeepSeek 把模型底层模块重写了一遍,专门适配华为和寒武纪的硬件。现在 V4 能直接跑在华为昇腾 950PR 芯片上,预计几周内发布。这颗芯片单卡算力号称是英伟达 H20 的 2.87 倍,有 112GB 显存,带宽 1.4TB/s,还是国内唯一支持 FP4 低精度推理的芯片。FP4 的好处是大幅压缩显存占用,一个原本...
#Inference-opt#Code#DeepSeek#Huawei
精选理由
这条消息 H、K、R 都站得住:华为芯片部署是强钩子,底层重写和芯片规格有料,国产算力替代的话题自带传播。没给更高分是因为这还属于发布前报道,模型规模、价格和实测性能都没披露,我会先打个折。
一句话点评
DeepSeek V4 要跑在华为芯片上,但正文没给任何技术细节或实测数据,先当传闻看。
锐评
这条消息说 DeepSeek 下一代模型 V4 会用华为芯片来跑,但来源只有一个未经验证的账号,正文是空的,没有任何技术指标、性能对比或合作方确认。如果属实,这意味着 DeepSeek 在训练或推理环节转向国产算力,可能跟供应链限制或成本考量有关。但眼下缺的东西太多:没说用的是昇腾哪个型号、是训练还是只做推理、模型规模多大、跟英伟达方案比效率差多少。这些数字不出来,没法判断是技术突破还是无奈之举。另外,华为芯片的软件生态和内存带宽一直是瓶颈,V4 如果真跑在上面,怎么解决这些坑也没提。建议等官方或第三方实测再下结论。
HKR 分解
hook ✓knowledge ✓resonance ✓