● P1Dwarkesh Patel 访谈· atomEN17:11 · 02·13
Anthropic CEO Dario Amodei称模型能力指数增长接近终点
Anthropic CEO Dario Amodei 在访谈里说,模型能力的指数增长曲线和他三年前预期的差不多,但这条曲线快走到头了,时间上可能就差一两年。他把进步归因于算力、数据、训练时长和可扩展的目标函数,并强调预训练和强化学习(RL)遵循的是同一套缩放逻辑,不是两套。RL 在数学和编程任务上同样表现出对数线性的收益,但正文没给出具体曲线、模型版本...
#Reasoning#Code#Alignment#Dario Amodei
精选理由
我会先打个折:正文没给实验曲线、模型版本或可复现参数,所以这不是一篇能拿来复盘的硬证据。但 Amodei 作为 Anthropic 的 CEO,把预训练和 RL 说成同一套扩展故事,并给指数增长判了个一两年的大限,这个信号级别很高。他提到 RL 在数学、编程任务上也是对数线性收益,说明靠堆算力还能再挤一阵子,但天花板已经在视野里了。对做模型训练和算力规划的人,这相当于一个方向性提醒:别按无限指数去押注。
一句话点评
Dario 说模型能力的指数增长快到头了,但最让他意外的是公众对此几乎没感觉。这话出自 CEO 之口,分量不轻,但正文没给出具体拐点证据。
锐评
Dario Amodei 在播客里直接说“我们接近指数增长的终点”,这是他作为 Anthropic CEO 给出的一个很重的判断。他回顾过去三年,认为模型从高中生水平一路爬到能做博士级任务、代码能力甚至更强,这个爬坡速度基本符合他预期。真正让他觉得离谱的,是圈内圈外还在吵那些老掉牙的政治话题,没多少人意识到这条曲线快要走平了。
不过,这篇对话正文只放了一小段节选,Dario 没有展开讲“终点”具体指什么——是预训练阶段的算力堆叠到头了,还是强化学习这条新路也快摸到天花板。他提到的“指数”到底衡量的是基准测试分数、经济价值还是别的指标,正文也没披露。另外,他说的“几年内数据中心里能跑出一个天才国家”这种远景,目前还缺落地的时间表和中间步骤。
我会先打个折:CEO 公开喊终点,本身就是一个值得关注的信号,说明顶级实验室内部可能已经在调整预期。但在看到更完整的论据和内部数据之前,别急着把这当成定论。
HKR 分解
hook ✓knowledge ✓resonance ✓