今天 AI 圈在拼基建和上市,不是模型
今天 AI 圈最有意思的不在某个模型又能写代码了,是几张账本同时翻动:Alphabet 要融 800 亿美元搞基建、Anthropic 秘密交表准备上市、DeepSeek 第一次对外拿钱开口就是 500 亿。微软也掏出了自己的推理模型,不再只靠 OpenAI。先来看 Alphabet 这一笔。
Alphabet 八百亿不是一张支票,是给云和模型上的双保险
这一下我有点愣住了——今天 AI 投资圈最大的数字是 800 亿美元,但更值得看的不是金额,是结构。
Alphabet 计划通过股权融资筹集 800 亿美元,用来扩建 AI 基础设施。同一天,Anthropic 被曝已经秘密提交了上市申请。两条消息都来自彭博,但原文因为反爬机制没能抓到正文,只留了标题。估值、上市时间表和承销商这些关键信息现在都还看不到。
这种"云厂商深度绑定大模型公司"的合同,之前已经出现过两次。Microsoft 与 OpenAI 的关系是最早的模板,Google 自己之前也向 Anthropic 投过钱。但这次 Alphabet 的融资规模和 Anthropic 的 IPO 动作放在一起看,信号更清楚:Google 在给自己的云业务和模型供应上双保险。
Anthropic 上市意味着它需要更稳定的收入来源和更大的算力底座,而 Google 正好是那个能同时提供云合同和资金的角色。这一笔很贵,但很 Google。
DeepSeek 第一次对外拿钱,开口就是 500 亿
这条我会先打个折——所有数字都来自匿名信源,路透社自己都说"仍存在变动可能"。但数字本身够大,值得聊。
路透社援引知情人士消息,DeepSeek 正在谈第一轮外部融资,目标金额约 500 亿元人民币。钱到手后,公司估值大概在 3500 亿到 4000 亿之间。创始人梁文峰自己会跟投 200 亿,腾讯计划出 100 亿,宁德时代出 50 亿,这两家是最大的外部金主。另外,国家人工智能产业投资基金、网易、京东也在谈,最终投资方可能不到十家。
有意思的是宁德时代。一家电池巨头投大模型公司,看着不太搭,但仔细想想——AI 数据中心是吃电怪兽,宁德时代在储能和电力基础设施上的布局,跟 DeepSeek 未来的算力需求有直接交集。这不像是财务投资,更像是在为下一代基础设施占位。
不过,DeepSeek 之前一直靠创始人自有资金和量化交易收入撑着,现在第一次对外拿钱,开口就是 500 亿,估值直奔 4000 亿。这个节奏如果属实,说明他们接下来的算力扩张计划不小。但所有数字都还没落地,先别急着当真。
微软掏出自己的推理模型,不再只靠 OpenAI
微软在 Build 2026 上发了自己的第一款高级推理模型 MAI-Thinking-1。官方说这是个中等尺寸的模型,在一些软件工程基准上能跟一线模型打平。训练数据完全自建,没走知识蒸馏的捷径——也就是没拿别家大模型当老师来教它。
这是微软在模型自研上的一次表态。之前它主要靠 OpenAI,最近两家刚重新谈了合作,关系没那么紧了。微软在这个时候掏出自己的推理模型,信号很清楚:不把鸡蛋放一个篮子里。
但官方只说了"中等规模"和"关键基准打平",没给具体参数和跑分。实际水平怎么样,得等第三方测。另外,微软在模型发布卡里加了个新指标:平均 token 用量。他们的新模型在 SWE-Bench Verified 上拿了 **71.
6 分**,但消耗的 token 只有 Claude Haiku 4.5 的三分之一。这会让现在衡量模型得看两个维度:活儿干得怎么样,以及干这活儿花了多少钱。靠烧 token 刷榜的时代在翻篇。
Claude Code 能自己生出一堆子代理分头干活了
Claude Code 新增了动态工作流功能,核心是让它在运行时执行 JavaScript 文件,按需创建并协调多个子代理。每个子代理有自己的上下文窗口,互不干扰,可以同时跑研究、安全分析和代码审查这些任务。
官方举的例子是让一个子代理查漏洞、另一个审代码逻辑,主代理最后汇总结果。这解决了单一上下文窗口里长时间跑任务容易出现的"智能惰性"问题——模型跑太久会开始偷懒或跑偏,拆成多个子代理各管一摊,效率更高。
但官方没提能同时跑几个子代理、多花的 token 怎么算钱。这种动态工作流通常消耗更多 token,更适合高价值复杂任务。实际用起来贵不贵、能跑多大体量的任务,得自己试。
Claude Code 团队自己也分享了内部实践。他们把智能体编程设为默认工作方式后,砍掉了传统的详细需求文档,改成"即时规划"——在动手前先让 Claude 收集上下文、理清任务。代码审查环节,Claude 会先过一遍代码风格和测试覆盖,人则把精力集中在法律合规这些专业判断上。这不是第三方评测,是他们自己的经验分享,效果数字没给,先当参考看。
特朗普签了 AI 安全评估令,但不是强制审批
特朗普政府推出一项自愿机制,AI 公司可以在前沿大模型发布前 30 天内,把模型提交给美国商务部下属的 CAISI 中心做安全评估,主要查模型的网络攻防能力。谷歌、微软和 xAI 已经同意配合,OpenAI 和 Anthropic 早在 2024 年就签了类似协议。
这次行政令明确不是强制审批,企业自己决定交不交,交了能拿到保密保护。政策转向的直接导火索是最近几起模型安全事件,但政府选的是"自愿合作"这条路,不是监管铁拳。
Anthropic 在 X 上表态支持,说这是加强美国 AI 领导地位的重要一步。OpenAI 也在呼吁通过全球领导力推进青年 AI 安全。但说实话,自愿机制的执行力取决于企业有多愿意配合,没有强制力的安全评估,更像是一种姿态。
Anthropic 把漏洞扫描项目扩到 150 家,覆盖水电医疗
Anthropic 把 Project Glasswing 的合作范围从约 50 家扩到约 150 家新机构,覆盖超过 15 个国家,新增了电力、水务、医疗、通信和硬件等关键基础设施行业。这些机构都有一个共同点:一旦代码库被攻破,影响可能超过 1 亿人。
前期合作方用 Claude Mythos Preview 已经扫出超过 1 万个高危或严重漏洞,现在 Anthropic 还推出了基于 Claude Opus 4.8 等公开模型的 Claude Security 产品,用于扫描代码并建议补丁。
但缺少误报率和修复落地情况。扫出漏洞是一回事,实际修了多少、误报率多高,这些才是衡量效果的关键。这点先别太激动。
今日小信号
-
ChatGPT 月活破 10 亿,Sensor Tower 估算它只用了大约三年,比 Google Maps、TikTok 和 YouTube 当年冲到这个数字的速度都快。但 Claude 的增速更猛:2026 年第二季度月活 5600 万,同比涨了约 640%,而 ChatGPT 同期增速是 62%。用户重叠后使用时长也在掉,这个第一坐得并不稳。
-
Holo3.1 发布,一口气放出 0.8B、4B、9B 和 35B-A3B 四个尺寸,首次提供 FP8、Q4 GGUF 和 NVFP4 压缩版,让模型能直接在个人设备上跑。35B-A3B 旗舰版在 AndroidWorld 测试里拿到 79.3% 的分数,但缺少这个分数的具体任务构成和对比基线。
-
阶跃星辰 Step 3.7 Flash 发布,196B MoE 架构,KV-cache 成本仅为 DeepSeek 模型的约 22%,采用 Apache 2.0 许可。这个效率数字如果属实,在推理成本上会有明显优势。
-
xAI 的 Grok 成了 Vapi 语音平台的默认引擎,覆盖 250 多万个语音代理。Vapi 自己盲测 Grok 拿了第一,但没公布对手和打分细节。
-
Nathan Lambert 离开 Ai2,结束 2.5 年 OLMO 等项目工作。他在 Ai2 主导或参与了 OLMO 和 Tulu 等开源模型项目,称其为职业生涯的巅峰。未来仍会继续深耕开源模型与开放科学领域。