FEATUREDAI HOT 精选· aihot-apiZH18:31 · 05·26
Anthropic 工程师称 Claude Mythos 用“巧妙简洁的证明”解开了 OpenAI 此前攻克的 Erdős 数学猜想
Anthropic 工程师 Sholto Douglas 在 X 上说,Claude Mythos 用一个“巧妙简洁的证明”解决了 Erdős 单位距离猜想,而 OpenAI 前不久刚把这个问题当作 AI 数学推理的里程碑。团队的做法是把问题丢给多个独立的 Claude Code 实例,让它们各自找解题路径,再汇总分发,Mythos 经常走出和 Ope...
#Reasoning#Benchmarking#Anthropic#Sholto Douglas
精选理由
HKR 三项都成立:标题自带反差,信息点具体,又牵动前沿推理模型的竞争格局。但正文没披露证明内容、验证方式、Mythos 是否已发布,所以只能放 featured,不能上 P1——我会先打个折,等看到证明再说。
一句话点评
Anthropic 工程师说 Claude Mythos 用“巧妙简洁的证明”解决了 OpenAI 刚拿来当里程碑的 Erdős 猜想,但证明本身和验证过程都没公开。
锐评
这条消息更像一次技术秀肌肉,而不是一次完整的数学验证。Anthropic 工程师 Sholto Douglas 在 X 上说,Claude Mythos 用一个“巧妙简洁的证明”解决了 Erdős 单位距离猜想,而 OpenAI 前不久刚把这个问题当作 AI 数学推理的里程碑。团队的做法是把问题丢给多个独立的 Claude Code 实例,让它们各自找解题路径,再汇总分发,Mythos 经常走出和 OpenAI 模型不同的路。数学家 Daniel Litt 评价这个结果比 OpenAI 的“稍差一点”,但 Mythos 也找到了 OpenAI 的解法。
关键信息缺失很严重:正文没披露证明的具体内容、验证流程和基准测试设置。Anthropic 只公开了一份由 Opus 4.7 整理的证明版本,但没说明这个版本和 Mythos 原始输出的关系。另外,Claude Code 本身是一个让模型进业务流程干活的工具,不是纯语言模型,所以这次解题到底有多少是模型本身的推理能力,多少是工程流程的功劳,完全不清楚。
我会先打个折:在没看到独立验证和完整证明前,这更像一次内部实验的公关传播,而不是一个可复现的数学突破。
HKR 分解
hook ✓knowledge ✓resonance ✓