ax@ax-radar:~/daily/2026-06-01 $ cat newsletter/daily/2026-06-01.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-06-01账本翻动日

今天 AI 圈在拼账本,不是模型

今天 AI 圈最有意思的不在某个模型又能写代码了,是几张账本同时翻动:Anthropic 秘密交表准备上市、Google 要发新股融 800 亿美元砸 AI、智谱也要回 A 股科创板。模型这边,MiniMax 开源了 M3,代码跑分压过 GPT-5.5,token 成本只要十二分之一。先来看 Anthropic 这一笔。

Anthropic 秘密交表,9650 亿估值要上市了

这条我会先打个折——Anthropic 确实在官方博客宣布向 SEC 秘密递交了 IPO 申请,但具体发行多少股、定价多少、什么时候正式上市,全都没说。秘密申报的好处是前期不用公开详细财务和风险信息,可以先内部评估,等 SEC 审完了再决定要不要真的敲钟。

就在不到一周前,公司刚完成 H 轮 650 亿美元融资,投后估值冲到 9650 亿美元。他们同时披露年化营收已突破 470 亿美元,而 2025 年底这个数字还只有 90 亿,增速确实快。彭博把 Anthropic 和 SpaceXOpenAI 并列为 2026 年 IPO 热潮的主角,时间点可能在今年秋季。

但估值和募资额都没公布,SpaceX 和 OpenAI 也只是标题里提了一嘴。说实话,9650 亿这个数字放在当下 AI 公司的营收结构里,我会先看看后续 S-1 公开时的财务细节再说。

Google 要发新股融 800 亿,巴菲特跟投 100 亿

Alphabet(Google 母公司)要搞一笔 800 亿美元的股权融资,专门用于 AI 基础设施。这笔钱里,伯克希尔·哈撒韦会出 100 亿美元,算是给市场一个信号。800 亿这个数字说明 Google 对 AI 算力的投入还在猛踩油门,不是小修小补。

但正文没讲这笔钱具体怎么分——用在哪些数据中心、芯片采购还是人才招聘,也没说对现有股东稀释多少。如果是真的,这会是近年来科技公司最大规模的股权融资之一。巴菲特跟投 100 亿,更像是给这笔交易背书,而不是他自己突然变成了 AI 信徒。

智谱要回 A 股科创板,新股占 2% 到 8%

智谱在港交所发公告,准备申请在 A 股科创板上市。这次发行的全是新股,数量在 910 万到 3877 万股之间,占发行后总股本的 2% 到 8%,老股东不卖旧股。融来的钱主要投向三个地方:通用基座大模型、大模型 MaaS 一站式服务平台,以及补充流动资金。

另外公司打算把英文名从 Knowledge Atlas 改成 Z.AI。公告没披露具体的募资金额和估值,定价也还是未知数。老股东不套现这一点值得留意——说明这轮主要是公司自己要拿钱,不是早期投资人急着退出。

MiniMax 开源 M3,代码跑分压过 GPT-5.5,token 成本只要十二分之一

MiniMax 放出了一个叫 M3 的开源模型,把代码能力、一次能读 100 万 token的长上下文和原生多模态(能直接处理图像、音频)做在了一起。在 SWE-Bench Pro 这个代码基准上拿了 59.0%,比 GPT-5.5 的 **58.

6%** 和 Gemini 3.1 Pro54.2% 都高一点。

更值得看的是成本端。它用了叫 **MSA(MiniMax Sparse Attention)**的新型稀疏注意力架构,在 100 万 token 上下文下,每 token 计算成本降到前代的 1/20,预填充速度提升 9 倍以上,解码速度提升 15 倍以上。跟 GPT-5.5 比,token 成本只要 十二分之一

但权重还没放出来,现在只能通过 MiniMax Code、Token Plan 和 API 用。跑分是一回事,实际开发体验是另一回事,先别急着下单。

NVIDIA Cosmos 3 开放权重,图像和视频生成双榜第一

NVIDIACosmos 3Artificial Analysis 的开放权重榜单上,文本生图和图片转视频两项都排到了第一。它用了一种叫 Mixture-of-Transformers 的架构,把自回归推理器和扩散生成器拼在一起,有 16B 参数的 Nano 版和 64B 参数的 Super 版。Super 版在两项任务上分别超过了 HiDream-I1Wan 2.1

但榜单只比了开源模型,别直接当成全面碾压闭源。NVIDIA 同时发布了 工厂运营蓝图(FOX),一个用于构建自主工厂管理智能体的参考设计。富士康已经在用,预计把根源分析时间缩短 80%,劳动生产率提高 15%,机器故障率降低 10%

Meta 的 AI 客服被骗子用聊天方式骗走了 Instagram 账号

攻击者直接跟 Meta 的 AI 客服聊天,让它把目标账号的绑定邮箱换成自己的,就能把号拿走。问题出在这个 AI 被赋予了直接操作账号的权限,而且它没法区分对面是号主还是骗子。

报道没披露到底有多少账号受影响、漏洞现在修没修,也没给出能复现的具体步骤。但这事的核心不在技术漏洞,在权限设计——让一个还分不清真假的 AI 直接改账号绑定信息,本身就是个问题。

佛罗里达州起诉 OpenAI 和 Sam Altman,标题很重但细节很少

佛罗里达州总检察长指控 Altman 对人类生命"完全漠视",但起诉书缺少具体案件数量、受害者人数,也没说清楚 ChatGPT 到底在哪个环节、怎么导致了谋杀。目前只能当一份指控看,等后续法庭文件出来再说。

今日小信号

  • OpenRouter 上开源模型吃掉了近七成 token 用量,但别急着说闭源不行了——这个平台本身就更吸引爱折腾、爱比价的开发者。领跑的模型换得很快:DeepSeek 早期领先,随后被 MiniMax 和 Kimi 接棒,接着 Qwen、阿里开源系列、腾讯混元 Hy3 和 DeepSeek V4 轮番上阵。
  • Perplexity 把搜索流程写成了代码,让模型直接调自家搜索栈,省掉一步步喊函数的开销。思路很直接,但缺少性能对比,快多少、省多少还不知道。
  • JetBrains 开源了 Mellum2,一个 120 亿参数的混合专家模型,每次只激活 25 亿参数,推理速度比同级模型快一倍多,适合跑在需要快速响应的代码和文本任务上。
  • 阶跃星辰发了 Step 3.7 Flash,KV-cache 压到 DeepSeek 同类模型的 22%,显存省不少,但缺少跑分和延迟,先别太激动。
  • OpenBMB 联合清华发了两个开源数据集,预训练语料 600B+ token,中文量级目前最大,但效果验证只在一款小模型上跑过。

更多

频道

后台