MIT 科技评论· rssEN12:25 · 04·09
MIT 科技评论今日速览:AI 不会撞墙、人造草坪争议与海水淡化数字
微软 AI 负责人 Mustafa Suleyman 发文反驳“AI 算力即将撞墙”的说法,认为三大进步在推动指数增长:更快的计算单元、高带宽内存、以及把分散 GPU 连成巨型超算的技术。正文没披露具体芯片型号、成本或时间表,但核心观点是把规模扩展看作系统架构问题,不只是堆单卡。另外,美国人造草坪安装量从 2001 年的 700 万平方米涨到 2024...
#Inference-opt#Mustafa Suleyman#Microsoft AI#Google DeepMind
精选理由
这篇是汇总,不是一手产品或研究发布。HKR-K 和 HKR-R 靠具体的基础设施杠杆和扩展瓶颈讨论过关。HKR-H 偏弱,正文没披露具体芯片、成本或时间表,也没有可验证的数据,所以分数在 60 多分,定级 all。
一句话点评
这篇是MIT Tech Review的每日汇总,核心看点是Mustafa Suleyman(微软AI CEO)写的专栏,他反驳“AI算力增长见顶”论,认为三大技术(更快计算单元、高带宽内存、GPU集群互联)会继续推动指数增长。注意这是观点文,不是实证研究,且Suleyman有利益立场。另外Meta发了新模型Muse Spark(首个来自其“超级智能实验室”的模型),但正文没披露具体参数和性能...
锐评
Suleyman用3个硬件抓手支撑“AI短期不会撞墙”,我不太买账。标题给了 faster compute、HBM、GPU interconnect 这3项,正文没给具体芯片、成本曲线、功耗条件,也没给训练或推理哪一侧先受益;在这种信息量下,把“墙不会来”讲得这么满,证据是不够的。
我同意他抓到了一半问题。过去一年,扩展瓶颈确实早就不是单卡 TFLOPS 了,而是系统工程:HBM 容量和带宽、机柜级互连、拓扑、封装、供电、散热、集群调度一起决定有效算力。Nvidia 这两代从 H100 到 Blackwell,再到 NVL72 这种整柜设计,卖点就已经不是一颗 GPU 有多强,而是 72 卡放在一起以后,训练吞吐和推理时延能不能稳定。Meta、xAI、OpenAI、Microsoft 这波大集群也都在证明同一件事:把 10 万卡接成“像一台机器”,难度远高于多买几万卡。
问题在于,这只能说明扩展还能继续,不等于回报还能指数走。HBM 和互连改善,解决的是系统利用率;它们没有自动解决数据质量、后训练成本、评测污染、真实产品留存这些更麻烦的约束。训练端过去还能靠更大集群吃到可见增益,到了 2025 年后,行业讨论已经明显从“再堆 pretraining”转向 inference-time compute、test-time search、agent scaffolding、工具调用。这个转向本身就在说明,单纯靠预训练扩展拿增益,边际已经没前两年那么陡。Suleyman这段话把硬件供给讲成能力进步的主因,我看着像把必要条件说成了充分条件。
还有一层我会更警觉:他说这话的身份是 Microsoft AI CEO。微软现在同时押数据中心 capex、模型分发和 Copilot 收入,叙事上天然需要“墙还很远”。这不代表他说错,但利益相关很强。尤其这篇只是 RSS 摘要,连“更快 basic calculators”具体指哪条路线都没展开,是 Blackwell 级 GPU,还是更长期的 ASIC、光互连、近存计算,正文都没披露。没有这些,读者无法判断他说的是未来 12 个月,还是 3 到 5 年。
我自己的判断很简单:短期内,算力扩展不会突然停;经济有效的扩展,已经比“卡更多”苛刻得多。谁能把 HBM、网络、功耗、编排、推理缓存、agent 工作流一起做顺,谁就继续往前;做不顺的团队,账单会先撞墙。
HKR 分解
hook —knowledge ✓resonance ✓