AX 的 AI 日报 · 2026-06-02基建与上市双线并行

今天 AI 圈在拼基建和上市，不是模型

2026年6月2日

今天 AI 圈最有意思的不在某个模型又能写代码了，是几张账本同时翻动：Alphabet 要融 800 亿美元搞基建、Anthropic 秘密交表准备上市、DeepSeek 第一次对外拿钱开口就是 500 亿。微软也掏出了自己的推理模型，不再只靠 OpenAI。先来看 Alphabet 这一笔。

Alphabet 八百亿不是一张支票，是给云和模型上的双保险

这一下我有点愣住了——今天 AI 投资圈最大的数字是 800 亿美元，但更值得看的不是金额，是结构。

Alphabet 计划通过股权融资筹集 800 亿美元，用来扩建 AI 基础设施。同一天，Anthropic 被曝已经秘密提交了上市申请。两条消息都来自彭博，但原文因为反爬机制没能抓到正文，只留了标题。估值、上市时间表和承销商这些关键信息现在都还看不到。

这种"云厂商深度绑定大模型公司"的合同，之前已经出现过两次。Microsoft 与 OpenAI 的关系是最早的模板，Google 自己之前也向 Anthropic 投过钱。但这次 Alphabet 的融资规模和 Anthropic 的 IPO 动作放在一起看，信号更清楚：Google 在给自己的云业务和模型供应上双保险。

Anthropic 上市意味着它需要更稳定的收入来源和更大的算力底座，而 Google 正好是那个能同时提供云合同和资金的角色。这一笔很贵，但很 Google。

DeepSeek 第一次对外拿钱，开口就是 500 亿

这条我会先打个折——所有数字都来自匿名信源，路透社自己都说"仍存在变动可能"。但数字本身够大，值得聊。

路透社援引知情人士消息，DeepSeek 正在谈第一轮外部融资，目标金额约 500 亿元人民币。钱到手后，公司估值大概在 3500 亿到 4000 亿之间。创始人梁文峰自己会跟投 200 亿，腾讯计划出 100 亿，宁德时代出 50 亿，这两家是最大的外部金主。另外，国家人工智能产业投资基金、网易、京东也在谈，最终投资方可能不到十家。

有意思的是宁德时代。一家电池巨头投大模型公司，看着不太搭，但仔细想想——AI 数据中心是吃电怪兽，宁德时代在储能和电力基础设施上的布局，跟 DeepSeek 未来的算力需求有直接交集。这不像是财务投资，更像是在为下一代基础设施占位。

不过，DeepSeek 之前一直靠创始人自有资金和量化交易收入撑着，现在第一次对外拿钱，开口就是 500 亿，估值直奔 4000 亿。这个节奏如果属实，说明他们接下来的算力扩张计划不小。但所有数字都还没落地，先别急着当真。

微软掏出自己的推理模型，不再只靠 OpenAI

微软在 Build 2026 上发了自己的第一款高级推理模型 MAI-Thinking-1。官方说这是个中等尺寸的模型，在一些软件工程基准上能跟一线模型打平。训练数据完全自建，没走知识蒸馏的捷径——也就是没拿别家大模型当老师来教它。

这是微软在模型自研上的一次表态。之前它主要靠 OpenAI，最近两家刚重新谈了合作，关系没那么紧了。微软在这个时候掏出自己的推理模型，信号很清楚：不把鸡蛋放一个篮子里。

但官方只说了"中等规模"和"关键基准打平"，没给具体参数和跑分。实际水平怎么样，得等第三方测。另外，微软在模型发布卡里加了个新指标：平均 token 用量。他们的新模型在 SWE-Bench Verified 上拿了 **71.

6 分**，但消耗的 token 只有 Claude Haiku 4.5 的三分之一。这会让现在衡量模型得看两个维度：活儿干得怎么样，以及干这活儿花了多少钱。靠烧 token 刷榜的时代在翻篇。

Claude Code 能自己生出一堆子代理分头干活了

Claude Code 新增了动态工作流功能，核心是让它在运行时执行 JavaScript 文件，按需创建并协调多个子代理。每个子代理有自己的上下文窗口，互不干扰，可以同时跑研究、安全分析和代码审查这些任务。

官方举的例子是让一个子代理查漏洞、另一个审代码逻辑，主代理最后汇总结果。这解决了单一上下文窗口里长时间跑任务容易出现的"智能惰性"问题——模型跑太久会开始偷懒或跑偏，拆成多个子代理各管一摊，效率更高。

但官方没提能同时跑几个子代理、多花的 token 怎么算钱。这种动态工作流通常消耗更多 token，更适合高价值复杂任务。实际用起来贵不贵、能跑多大体量的任务，得自己试。

Claude Code 团队自己也分享了内部实践。他们把智能体编程设为默认工作方式后，砍掉了传统的详细需求文档，改成"即时规划"——在动手前先让 Claude 收集上下文、理清任务。代码审查环节，Claude 会先过一遍代码风格和测试覆盖，人则把精力集中在法律合规这些专业判断上。这不是第三方评测，是他们自己的经验分享，效果数字没给，先当参考看。

特朗普签了 AI 安全评估令，但不是强制审批

特朗普政府推出一项自愿机制，AI 公司可以在前沿大模型发布前 30 天内，把模型提交给美国商务部下属的 CAISI 中心做安全评估，主要查模型的网络攻防能力。谷歌、微软和 xAI 已经同意配合，OpenAI 和 Anthropic 早在 2024 年就签了类似协议。

这次行政令明确不是强制审批，企业自己决定交不交，交了能拿到保密保护。政策转向的直接导火索是最近几起模型安全事件，但政府选的是"自愿合作"这条路，不是监管铁拳。

Anthropic 在 X 上表态支持，说这是加强美国 AI 领导地位的重要一步。OpenAI 也在呼吁通过全球领导力推进青年 AI 安全。但说实话，自愿机制的执行力取决于企业有多愿意配合，没有强制力的安全评估，更像是一种姿态。

Anthropic 把漏洞扫描项目扩到 150 家，覆盖水电医疗

Anthropic 把 Project Glasswing 的合作范围从约 50 家扩到约 150 家新机构，覆盖超过 15 个国家，新增了电力、水务、医疗、通信和硬件等关键基础设施行业。这些机构都有一个共同点：一旦代码库被攻破，影响可能超过 1 亿人。

前期合作方用 Claude Mythos Preview 已经扫出超过 1 万个高危或严重漏洞，现在 Anthropic 还推出了基于 Claude Opus 4.8 等公开模型的 Claude Security 产品，用于扫描代码并建议补丁。

但缺少误报率和修复落地情况。扫出漏洞是一回事，实际修了多少、误报率多高，这些才是衡量效果的关键。这点先别太激动。

今日小信号

ChatGPT 月活破 10 亿，Sensor Tower 估算它只用了大约三年，比 Google Maps、TikTok 和 YouTube 当年冲到这个数字的速度都快。但 Claude 的增速更猛：2026 年第二季度月活 5600 万，同比涨了约 640%，而 ChatGPT 同期增速是 62%。用户重叠后使用时长也在掉，这个第一坐得并不稳。
Holo3.1 发布，一口气放出 0.8B、4B、9B 和 35B-A3B 四个尺寸，首次提供 FP8、Q4 GGUF 和 NVFP4 压缩版，让模型能直接在个人设备上跑。35B-A3B 旗舰版在 AndroidWorld 测试里拿到 79.3% 的分数，但缺少这个分数的具体任务构成和对比基线。
阶跃星辰 Step 3.7 Flash 发布，196B MoE 架构，KV-cache 成本仅为 DeepSeek 模型的约 22%，采用 Apache 2.0 许可。这个效率数字如果属实，在推理成本上会有明显优势。
xAI 的 Grok 成了 Vapi 语音平台的默认引擎，覆盖 250 多万个语音代理。Vapi 自己盲测 Grok 拿了第一，但没公布对手和打分细节。
Nathan Lambert 离开 Ai2，结束 2.5 年 OLMO 等项目工作。他在 Ai2 主导或参与了 OLMO 和 Tulu 等开源模型项目，称其为职业生涯的巅峰。未来仍会继续深耕开源模型与开放科学领域。