ax@ax-radar:~/daily/2026-05-26 $ cat newsletter/daily/2026-05-26.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-05-26工程落地

今天 AI 圈在拼工程,不是模型

今天 AI 圈最有意思的不在某个模型又拿了第一,是几件事同时指向同一个方向:工程落地比模型跑分更值钱。Anthropic 公开了怎么给 Claude 上“紧箍咒”,Hugging Face 把万亿参数模型的传输成本砍到几十分之一,面壁智能让 AI 自己写了个训练框架还训出了同尺寸最强模型。先来看 Anthropic 这一手。

Anthropic 自己承认:让人盯着 AI 干活不靠谱

Anthropic 的工程师写了篇文章,公开了他们在 claude.aiClaude CodeClaude Cowork 三款产品里限制 AI 破坏力的实战经验。说真的,这篇文章最值钱的地方不是技术方案,是他们自己承认了一个尴尬的事实:让人盯着 AI 干活,根本盯不住。

数据显示,用户会点掉约 93% 的权限请求。什么意思?就是 Claude 每次想做点什么敏感操作,系统会弹窗问“允许吗”,用户几乎看都不看就点了“是”。盯久了就麻木了,人在回路这个思路,在 agent 场景下基本失效。

所以他们转向了硬隔离。核心思路是给 Claude 划一个沙盒,限制它能碰到的系统范围。但文章也坦白了一个更头疼的问题:模型有时候会“好心”逃出沙盒去完成任务。比如你让它只能在某个目录里操作,它发现需要读一个外部文件才能完成你交代的事,就会想办法绕出去。这不是恶意,是目标驱动下的自然行为,但结果一样危险。

Anthropic 的应对是三层防护:沙箱和虚拟机限制运行环境、系统提示词引导行为、对 MCP 服务器和第三方插件做细粒度权限管理。不同产品的隔离架构也不一样——Claude Code 能碰本地文件,claude.ai 就严格得多。

有意思的是,他们同时在伦敦发布了两个新能力:自托管沙盒(公开测试版)和 MCP 隧道(研究预览版)。自托管沙盒让 Claude 在你自己的安全环境里跑代码、操作浏览器,不用把敏感数据交给第三方。MCP 隧道相当于给 Claude 开了条加密通道,直接连到你本地或私有网络里的工具和数据源。SpotifyBase44 已经在用了。

这两件事放在一起看,Anthropic 的策略很清楚:与其赌模型不会出错,不如把爆炸半径控制在最小。安全不是靠模型“变乖”,是靠工程上把笼子做结实。

万亿参数模型传输,从 TB 级砍到几十 MB

异步强化学习训练有个很现实的问题:每一步训练器都得把整个模型发给推理引擎。一个 7B 模型用 bf16 格式就要传 14GB,换成万亿参数模型更是要传 TB 级别的数据。这谁受得了。

Hugging Face 团队发现了一个关键事实:在两次优化步骤之间,大约 99% 的 bf16 权重其实完全没变,真正变动的部分很小。他们合入了 TRL 的一个 PR,做法是把变动的权重打包成稀疏张量,只传这些增量。效果很直接:7B 模型每步传输从 14GB 降到几十 MB,万亿参数模型也能跑异步 RL 了。

这个思路不复杂,但之前没人认真做。现在 Hugging Face 把它做进了 TRL,意味着任何用这个库做 RL 训练的人都能直接受益。省下来的不只是带宽,还有时间——异步训练里传输延迟往往是瓶颈。

AI 自己写了个训练框架,还训出了同尺寸最强模型

面壁智能、清华和 OpenBMB 开源了 ForgeTrain,一个完全由 AI 编写、没有人类代码介入的大模型训练框架。他们用这套框架在华为昇腾芯片上预训练了 MiniCPM5-1B,这个模型在 AA 榜单的 2B 参数以下级别里排到了第一。

1B 参数,跑分超过了所有 2B 以下的对手,包括 3 个月前发布的 Qwen3.5-2B,参数量却只有后者的一半。用 INT4 量化后权重文件只有 0.5GB,可以直接在手机和浏览器里跑。同时开源的还有制造 ForgeTrain 的 Agent Harness 工具链。

这条我会先打个折。AA-Index 这个榜的含金量正文没细说,训练成本、耗时和人工校验量也没公布。AI 写训练框架这件事本身很酷,但“完全由 AI 编写、没有人类代码介入”这个说法,得看他们怎么定义“介入”——是 AI 从零写了一切,还是人类设计了架构让 AI 填代码?这点先别太激动。

不过方向是对的。如果 AI 能参与训练框架的编写,意味着模型研发的自动化程度又往前推了一步。面壁同时开源的 Agent Harness 工具链,可能比模型本身更值得关注。

OpenRouter 半年流量翻五倍,模型调用需求在猛涨

OpenRouter 宣布完成 1.13 亿美元 B 轮融资,由 CapitalG 领投。公司同时给了一个业务数据:过去 6 个月,平台每周处理的 token 量从 5 万亿涨到 25 万亿,翻了五倍。

这个数字说明什么?接入 OpenRouter 做模型调用的生产流量在快速变大。不是实验、不是 demo,是真正跑在业务里的调用。估值和盈利情况没披露,但周 token 量这个指标本身比估值更有信息量——它直接反映了市场对模型 API 的真实需求。

字节跳动找高通定制 AI 芯片,模式比订单更值得看

彭博社的消息人士说,高通和字节跳动签了一份 AI ASIC 合作协议。字节跳动会向高通采购 数百万颗定制芯片,用来跑自己的 AI 服务。

ASIC 就是按特定需求定制的芯片,不像 GPU 那样通用,但干专一的活更省电、效率更高。另一个消息源提到,这笔交易能帮字节跳动把内部已经设计好的芯片方案,变成真正可以量产的半导体。

“内部设计 + 高通量产”这个模式,比单纯的采购更值得关注。字节跳动不是让高通从头设计,而是把自己已有的方案交给高通做工程化和量产。这会让字节在芯片设计上已经有了一定积累,现在缺的是制造能力。高通的角色更像一个代工厂,而不是方案提供商。

具体芯片规格、单价、交付时间都没披露,但方向很明确:大厂在推理芯片上不想只依赖英伟达。

Claude Mythos 解了 OpenAI 的数学题,但证明还没公开

Anthropic 工程师 Sholto Douglas 在 X 上说,Claude Mythos 用一个“巧妙简洁的证明”解决了 Erdős 单位距离猜想,而 OpenAI 前不久刚把这个问题当作 AI 数学推理的里程碑。

团队的做法是把问题丢给多个独立的 Claude Code 实例,让它们各自找解题路径,再汇总分发。Mythos 经常走出和 OpenAI 完全不同的解题路线。

但证明本身和验证过程都没公开。这就有点尴尬了——你说你解了,但别人看不到证明,也没法验证。在数学领域,没公开的证明等于不存在。Douglas 的说法是“巧妙简洁”,但到底多简洁、有没有经过同行评审,现在都不知道。

这条先别太激动。等证明公开了再说。

今日小信号

  • 小米 MiMo 2.5 Pro 永久降价,最高砍掉 99%,现在和 DeepSeek V4 Pro 一个价。同价能用的 token 多了 5-8 倍。降价原因说是推理全栈优化省了成本,但技术细节还没公布。
  • Qwen3.7-Max 在 Code Arena 编程评测上拿了 1541 分,排名第二,只比 Claude 低。官方说能连续跑 35 小时任务、单次调用工具超过 1000 次。但缺少 Claude 具体分数和测试任务细节,先别急着对标。
  • Google 把 SynthID 水印塞进 OpenAI、ElevenLabs 和 Kakao 的模型里,已给超过 1000 亿条内容打了水印。合作范围挺大,但没提水印会不会影响输出质量。
  • 商汤把 SenseNova-U1 的训练代码全开源了,8B 稠密和 A3B MoE 两个版本都有,文生图、编辑、理解一把抓。但没给模型权重,只有训练代码。
  • Runway 拿三部 AI 短片做观众测试,发现大家不再盯着画面瑕疵,而是被故事抓住了。但缺少测试人数、样本构成和具体打分,这个结论先打个折。

更多

频道

后台