ax@ax-radar:~/daily/2026-04-29 $ cat newsletter/daily/2026-04-29.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-04-29资本账本翻动

今天 AI 圈在拼账本,不是模型

今天 AI 圈最有意思的不在某个模型又能写代码了,是几张账本同时翻动:Anthropic 估值直接对标 OpenAI 喊到 9000 亿美元、软银借 400 亿买 OpenAI 股份现在要拉更多银行分摊、Google 把资本支出指引调到 1900 亿美元。模型这边也有动静,Mistral 放了个 128B 的稠密模型,DeepSeek 多模态开始灰度测试,但真正值得聊的是钱往哪流、谁在买单。先来看 Anthropic 这一笔。

Anthropic 估值喊到 9000 亿,但金额和条款都还没影

这条我会先打个折。彭博社援引知情人士说 Anthropic 正在考虑新一轮融资,估值锚定在 9000 亿美元以上。这个数字直接把它的身价拉到了和 OpenAI 一个量级——OpenAI 上一轮估值是 3500 亿美元,软银刚借了 400 亿美元去买它的股份。

但有意思的是,这轮融资的具体金额、领投方、交割时间表一概没提。现在只能看到一个很高的估值信号,实际条款还不清楚。Anthropic 上一轮是 Google 投的,最高 400 亿美元,其中 100 亿美元已经到位,剩下 300 亿美元取决于 Anthropic 是否达到特定营收目标。

如果这轮 9000 亿估值是真的,说明投资方对 Anthropic 的预期已经不只是"Google 的备胎"了。但缺少金额和条款,这个数字更像是一个谈判锚点,不是成交价。先别太激动。

软银借 400 亿买 OpenAI 股份,现在要拉更多银行分摊

这条跟上面那条放一起看才有意思。软银签了一笔 400 亿美元的过桥贷款,用来买 OpenAI 的股份。现在牵头行在把贷款拆给更多银行一起做——说明单家银行已经接不住这个规模了。

但利率、期限、抵押品一概没提。消息来自知情人士,具体条款还没公开。软银到底要拿多少 OpenAI 股权也不清楚。

把这两条放一起:Anthropic 在喊 9000 亿估值,OpenAI 的股份正在通过 400 亿贷款换手。AI 行业最顶层的资本游戏,已经不是"谁融了多少钱",而是"谁能接得住这个盘子"。软银这一笔要拉多家银行分摊,本身就说明风险敞口大到需要分散。

Google 资本支出调到 1900 亿,云增速跑赢 AWS 和 Azure

Tomer Tunguz 算了笔账:2026 年 Q1,三大云巨头资本支出合计 1120 亿美元。Google 云以 63% 的同比增长率领跑,远超微软 Azure 的 40% 和亚马逊 AWS 的 28%

Google 把 2026 年资本支出指引上调到 1800-1900 亿美元,超过微软的约 1200 亿美元。增长主要受企业 AI 解决方案驱动,云服务积压订单环比翻倍到超 4600 亿美元。客户通过 API 每分钟处理 160 亿个 token,同比增长 60%

Tunguz 的判断是 Google 凭借全栈自研的 Gemini 模型和 TPU 芯片,在增长速度和结构优势上表现突出。这个判断我基本买账——Google 的资本支出不只是"花钱买卡",它有自己的芯片、自己的模型、自己的云,三个齿轮咬在一起转。

但 1900 亿美元这个数也别忘了打折:资本支出指引不等于实际支出,而且 Google 对 Anthropic 的 400 亿投资里有一部分可能也算进去了。具体怎么拆账,公开信息没给。

Mistral 放了个 128B 稠密模型,许可证对高收入公司留了坑

Mistral AI 在 Hugging Face 上放出了 Mistral Medium 3.5,一个 1280 亿参数的稠密模型,上下文窗口拉到 25.6 万 token。能吃文本和图片,支持函数调用和 JSON 格式输出,推理强度可以按请求设成"无"或"高"。

许可证用的是修改版 MIT,但对高收入公司留了例外条款——具体收入门槛是多少,正文没写。这是个坑。Mistral 之前就玩过这手:模型开源,但商用有条件。如果你公司收入超过某个数,就得另外谈。

模型本身看起来扎实:128B 稠密、25.6 万上下文、多模态输入、工具调用。但 Mistral 没给基准分数,也没说跟 Llama 4、DeepSeek V4 比怎么样。想用的话得自己跑评测。

DeepSeek 多模态开始灰度测试,但名字、价格、API 全没公布

DeepSeek 研究员确认 V4 视觉版已经在灰度测试,官网首页上线了图片识别入口。一张截图显示模型花了 4 秒识别出一张文字不多的图片里的饮料种类和杯子类型。

但名字、参数量、定价、API 开放时间全没公布。从体验看,这应该是一个独立的多模态模型,不是把图片转文字再丢给纯文本模型那种拼接方案。想接进自己流程的朋友得再等等。

有意思的是,DeepSeek 这次上线很低调,没有发布会,没有博客,就是网页版多了个按钮。跟 Mistral 那种"模型放 Hugging Face 但许可证留坑"的玩法不一样,DeepSeek 是"功能先给你用,但技术细节不告诉你"。两种策略,一个共同点:都不急着把牌全亮出来。

OpenAI 解释 GPT-5.5 为什么爱说"哥布林",是奖励信号跑偏了

这条挺有意思。OpenAI 自己拆解了 GPT-5.5 老把"哥布林"挂嘴边的 bug:GPT-5.1 之后,ChatGPT 用"哥布林"的频率涨了 175%

书呆子风格的回复只占总回复的 2.5%,却贡献了 66.7% 的"哥布林"出现次数。

核心问题是奖励信号有偏差——训练时给"书呆子"人设的回复打了高分,这个偏好通过强化学习和后续训练扩散开了。2.5% 的回复风格,污染了三分之二的"哥布林"输出。

OpenAI 能公开拆自己的 bug,这点值得肯定。但这也说明了一个更底层的问题:大模型的输出风格,会被训练数据里极小比例的偏好带偏。不是"模型学坏了",是"奖励函数写歪了"。

今日小信号

  • Cursor 推出 SDK 公开测试版:几行 TypeScript 代码就能构建和部署智能体,支持 GPT-5.5,可以部署到本地或 Cursor 云的专用虚拟机。智能体正从个人工具变成组织的可编程基础设施。
  • OpenAI Responses API 接入 WebSocket:代理循环端到端速度提升最高 40%。瓶颈从推理转移到了 API 调用效率,WebSocket 在工具调用之间保持响应状态活跃。
  • 腾讯开源 440MB 翻译模型:Hy-MT1.5-1.8B-1.25bit,支持 33 种语言1056 个翻译方向,可在手机上完全离线运行。量化到 1.25 比特,比之前的 1.67 比特方法体积缩小 25%、速度提升约 10%
  • Ramp 的表格 AI 会偷偷传数据:安全公司 PromptArmor 发现攻击者可以在外部表格里藏白底白字的指令,诱导 AI 自动用公式把敏感财务数据传到攻击者网址。Ramp 说已经在 3 月 16 号修了。
  • AI 评估成本正成为新瓶颈:Hugging Face 算了笔账,单次前沿模型测试成本可达 2829 美元,相同任务成本差异可达 33 倍。高支出未必带来好结果:GAIA 测试中 2828 美元方案准确率 28.5%,1686 美元方案反达 57.6%。

更多

频道

后台