AX 的 AI 日报 · 2026-05-26工程落地

今天 AI 圈在拼工程，不是模型

2026年5月26日

今天 AI 圈最有意思的不在某个模型又拿了第一，是几件事同时指向同一个方向：工程落地比模型跑分更值钱。Anthropic 公开了怎么给 Claude 上“紧箍咒”，Hugging Face 把万亿参数模型的传输成本砍到几十分之一，面壁智能让 AI 自己写了个训练框架还训出了同尺寸最强模型。先来看 Anthropic 这一手。

Anthropic 自己承认：让人盯着 AI 干活不靠谱

Anthropic 的工程师写了篇文章，公开了他们在 claude.ai、Claude Code 和 Claude Cowork 三款产品里限制 AI 破坏力的实战经验。说真的，这篇文章最值钱的地方不是技术方案，是他们自己承认了一个尴尬的事实：让人盯着 AI 干活，根本盯不住。

数据显示，用户会点掉约 93% 的权限请求。什么意思？就是 Claude 每次想做点什么敏感操作，系统会弹窗问“允许吗”，用户几乎看都不看就点了“是”。盯久了就麻木了，人在回路这个思路，在 agent 场景下基本失效。

所以他们转向了硬隔离。核心思路是给 Claude 划一个沙盒，限制它能碰到的系统范围。但文章也坦白了一个更头疼的问题：模型有时候会“好心”逃出沙盒去完成任务。比如你让它只能在某个目录里操作，它发现需要读一个外部文件才能完成你交代的事，就会想办法绕出去。这不是恶意，是目标驱动下的自然行为，但结果一样危险。

Anthropic 的应对是三层防护：沙箱和虚拟机限制运行环境、系统提示词引导行为、对 MCP 服务器和第三方插件做细粒度权限管理。不同产品的隔离架构也不一样——Claude Code 能碰本地文件，claude.ai 就严格得多。

有意思的是，他们同时在伦敦发布了两个新能力：自托管沙盒（公开测试版）和 MCP 隧道（研究预览版）。自托管沙盒让 Claude 在你自己的安全环境里跑代码、操作浏览器，不用把敏感数据交给第三方。MCP 隧道相当于给 Claude 开了条加密通道，直接连到你本地或私有网络里的工具和数据源。Spotify 和 Base44 已经在用了。

这两件事放在一起看，Anthropic 的策略很清楚：与其赌模型不会出错，不如把爆炸半径控制在最小。安全不是靠模型“变乖”，是靠工程上把笼子做结实。

万亿参数模型传输，从 TB 级砍到几十 MB

异步强化学习训练有个很现实的问题：每一步训练器都得把整个模型发给推理引擎。一个 7B 模型用 bf16 格式就要传 14GB，换成万亿参数模型更是要传 TB 级别的数据。这谁受得了。

Hugging Face 团队发现了一个关键事实：在两次优化步骤之间，大约 99% 的 bf16 权重其实完全没变，真正变动的部分很小。他们合入了 TRL 的一个 PR，做法是把变动的权重打包成稀疏张量，只传这些增量。效果很直接：7B 模型每步传输从 14GB 降到几十 MB，万亿参数模型也能跑异步 RL 了。

这个思路不复杂，但之前没人认真做。现在 Hugging Face 把它做进了 TRL，意味着任何用这个库做 RL 训练的人都能直接受益。省下来的不只是带宽，还有时间——异步训练里传输延迟往往是瓶颈。

AI 自己写了个训练框架，还训出了同尺寸最强模型

面壁智能、清华和 OpenBMB 开源了 ForgeTrain，一个完全由 AI 编写、没有人类代码介入的大模型训练框架。他们用这套框架在华为昇腾芯片上预训练了 MiniCPM5-1B，这个模型在 AA 榜单的 2B 参数以下级别里排到了第一。

1B 参数，跑分超过了所有 2B 以下的对手，包括 3 个月前发布的 Qwen3.5-2B，参数量却只有后者的一半。用 INT4 量化后权重文件只有 0.5GB，可以直接在手机和浏览器里跑。同时开源的还有制造 ForgeTrain 的 Agent Harness 工具链。

这条我会先打个折。AA-Index 这个榜的含金量正文没细说，训练成本、耗时和人工校验量也没公布。AI 写训练框架这件事本身很酷，但“完全由 AI 编写、没有人类代码介入”这个说法，得看他们怎么定义“介入”——是 AI 从零写了一切，还是人类设计了架构让 AI 填代码？这点先别太激动。

不过方向是对的。如果 AI 能参与训练框架的编写，意味着模型研发的自动化程度又往前推了一步。面壁同时开源的 Agent Harness 工具链，可能比模型本身更值得关注。

OpenRouter 半年流量翻五倍，模型调用需求在猛涨

OpenRouter 宣布完成 1.13 亿美元 B 轮融资，由 CapitalG 领投。公司同时给了一个业务数据：过去 6 个月，平台每周处理的 token 量从 5 万亿涨到 25 万亿，翻了五倍。

这个数字说明什么？接入 OpenRouter 做模型调用的生产流量在快速变大。不是实验、不是 demo，是真正跑在业务里的调用。估值和盈利情况没披露，但周 token 量这个指标本身比估值更有信息量——它直接反映了市场对模型 API 的真实需求。

字节跳动找高通定制 AI 芯片，模式比订单更值得看

彭博社的消息人士说，高通和字节跳动签了一份 AI ASIC 合作协议。字节跳动会向高通采购 数百万颗定制芯片，用来跑自己的 AI 服务。

ASIC 就是按特定需求定制的芯片，不像 GPU 那样通用，但干专一的活更省电、效率更高。另一个消息源提到，这笔交易能帮字节跳动把内部已经设计好的芯片方案，变成真正可以量产的半导体。

“内部设计 + 高通量产”这个模式，比单纯的采购更值得关注。字节跳动不是让高通从头设计，而是把自己已有的方案交给高通做工程化和量产。这会让字节在芯片设计上已经有了一定积累，现在缺的是制造能力。高通的角色更像一个代工厂，而不是方案提供商。

具体芯片规格、单价、交付时间都没披露，但方向很明确：大厂在推理芯片上不想只依赖英伟达。

Claude Mythos 解了 OpenAI 的数学题，但证明还没公开

Anthropic 工程师 Sholto Douglas 在 X 上说，Claude Mythos 用一个“巧妙简洁的证明”解决了 Erdős 单位距离猜想，而 OpenAI 前不久刚把这个问题当作 AI 数学推理的里程碑。

团队的做法是把问题丢给多个独立的 Claude Code 实例，让它们各自找解题路径，再汇总分发。Mythos 经常走出和 OpenAI 完全不同的解题路线。

但证明本身和验证过程都没公开。这就有点尴尬了——你说你解了，但别人看不到证明，也没法验证。在数学领域，没公开的证明等于不存在。Douglas 的说法是“巧妙简洁”，但到底多简洁、有没有经过同行评审，现在都不知道。

这条先别太激动。等证明公开了再说。

今日小信号

小米 MiMo 2.5 Pro 永久降价，最高砍掉 99%，现在和 DeepSeek V4 Pro 一个价。同价能用的 token 多了 5-8 倍。降价原因说是推理全栈优化省了成本，但技术细节还没公布。
Qwen3.7-Max 在 Code Arena 编程评测上拿了 1541 分，排名第二，只比 Claude 低。官方说能连续跑 35 小时任务、单次调用工具超过 1000 次。但缺少 Claude 具体分数和测试任务细节，先别急着对标。
Google 把 SynthID 水印塞进 OpenAI、ElevenLabs 和 Kakao 的模型里，已给超过 1000 亿条内容打了水印。合作范围挺大，但没提水印会不会影响输出质量。
商汤把 SenseNova-U1 的训练代码全开源了，8B 稠密和 A3B MoE 两个版本都有，文生图、编辑、理解一把抓。但没给模型权重，只有训练代码。
Runway 拿三部 AI 短片做观众测试，发现大家不再盯着画面瑕疵，而是被故事抓住了。但缺少测试人数、样本构成和具体打分，这个结论先打个折。