AX 的 AI 日报 · 2026-06-09模型变强，账本翻动

Claude Fable 5 来了，但今天 AI 圈在翻账本

2026年6月9日

今天 AI 圈最有意思的不在某个模型又能写代码了，是几张账本同时翻动：Anthropic 发了 Fable 5 和 Mythos 5，能力确实强，但更值得看的是 Apollo 和 Blackstone 在背后攒了个 350 亿美元的芯片融资局，中国那边也在筹划两万亿人民币的算力基建。模型在变强，但钱和算力的流向才是真正的暗线。先来看 Anthropic 这一发。

Claude Fable 5 很强，但 Anthropic 给它加了把安全锁

Anthropic 今天发了两个新模型：Claude Fable 5 和 Claude Mythos 5。Fable 5 是给普通用户用的安全版，Mythos 5 是给网络安全防御方用的无限制版，目前只通过美国政府合作项目开放。

先说能力。Fable 5 在软件工程、知识工作和视觉任务上都是新标杆。Stripe 测试时，它一天干完了原本一个团队两个月的代码迁移活。在 FrontierCode 这个新基准上——由 20 多位顶级开源维护者手工制作，判断标准是维护者愿不愿意合并代码——Fable 5 在最高难度档拿了 13.4% 的通过率，其他模型基本在 1% 到 5% 之间。Ethan Mollick 提前试了之后说，这模型比他用过的所有公开模型都强出一大截，能自己连续跑十几个小时，从零做一个等时线地图，自己派了一堆子 AI 去查了 2200 多个航班。

但 Anthropic 给 Fable 5 加了一个有意思的限制：碰到网络安全、生物化学和模型蒸馏这些敏感领域，它会自动切回能力更保守的 Claude Opus 4.8，平均每 20 次对话触发一次。能力最强的模型主动给自己加了安全刹车。这个设计思路跟其他家不太一样——不是靠外部过滤器，而是模型自己判断什么时候该退一步。

价格方面，两个模型都是 $10/百万输入 tokens、$50/百万输出 tokens，比之前的 Mythos Preview 降了一半。Mythos 5 在药物设计里实现了约 10 倍加速，分子生物学假说盲测获科学家偏好的概率约 80%。

我会先打个折：安全刹车的误触发率和具体判定逻辑还没公开，Mollick 的体验也没有参数和基准分佐证。但方向是明确的——Anthropic 在试图证明，最强能力和安全限制可以放在同一个模型里，而不是二选一。

Apollo 和 Blackstone 在背后攒了个 350 亿美元的芯片融资局

这条比模型发布更值得盯。华尔街两大资管巨头 Apollo 和 Blackstone 正在合作一笔 350 亿美元的 AI 融资，交易方包括 Anthropic 和芯片公司 Broadcom。

视频标题说这是为昂贵的 AI 芯片设计新的融资模式，但正文被 Bloomberg 的反爬机制挡住了，具体交易结构、钱怎么分、谁出多少都没披露。不过从参与方来看，这不像传统的风险投资，更像一种资产融资——把芯片作为底层资产，用未来算力收入来还钱。

这种模式之前不是没有。2024 年 CoreWeave 用 GPU 做抵押拿了 23 亿美元贷款，但 350 亿这个量级完全是另一个概念。如果这笔交易落地，它可能标志着一个全新 AI 投资类别的开端：不是投公司股权，而是投算力资产本身。

至于这能不能行，等交易细节出来再说。现在只能看到参与方和金额，结构还是一片黑。

中国准备砸两万亿人民币铺全国 AI 算力网

彭博社拿到消息，中国正在筹划一个五年约 2 万亿人民币（折合 2950 亿美元）的 AI 基建计划，核心是建大型数据中心。这笔钱主要用来解决国内 AI 发展的算力缺口，相当于国家出钱铺"算力高速公路"。

同时，台湾那边也在考虑对 AI 芯片出口大陆实施更严格的管制，以进一步跟美国出口限制对齐。两条消息放在一起看，算力正在变成地缘政治的核心筹码。

不过这条我先打个折。钱从哪来、怎么分、由哪些部门牵头、建成后算力怎么定价和分配，正文全没提。两万亿这个数字很猛，但没细则之前，它更像一个信号，不是一个计划。

德国法院判了：谷歌 AI 概览瞎编的内容，谷歌自己背锅

德国慕尼黑地区法院在一项临时禁令中认定，谷歌必须为 AI 概览生成的虚假内容直接担责。起因是谷歌的 AI 概览错误地把两家慕尼黑出版商跟诈骗、订阅陷阱等黑产扯上了关系，而这些指控在 AI 引用的链接原文里根本不存在。

法院的核心逻辑很直接：AI 概览不是传统搜索结果，它会用自己的话重新组织、评判信息，属于谷歌自己生产的内容，所以不能套用搜索引擎的间接侵权保护。

这个裁决可能为全球 AI 生成内容责任认定树立先例。之前各家大模型公司都在用"我只是个工具"来规避责任，但德国法院的逻辑把这个口子堵上了——如果你的 AI 用自己的话说了错话，那就是你在说话。

监管战不是要不要打的问题，是已经在打。

Gemma 4 12B 砍掉编码器，但跑分还没给

Google DeepMind 开源了 Gemma 4 12B，一个 120 亿参数的多模态模型。它最大的变化是去掉了传统的独立视觉/音频编码器，把所有输入统一交给 Transformer 处理，架构更简单。模型能直接听懂语音，不再需要先转文字。

官方说它用 Apache 2.0 协议开源，在 16GB 显存或统一内存的笔记本上就能跑，已经累计超过 1.5 亿次下载。但官方博客没给任何跑分，性能好坏全凭嘴说。

架构上砍掉独立编码器是个大改动，理论上能让模型更统一地理解不同模态的信息。但没有基准对比，就没法判断这个设计到底带来了多少实际提升。这点先别太激动。

对冲基金用几百个 AI 智能体替掉分析师，人只留最后批准权

彭博社消息，管理 180 亿美元的对冲基金 Magnetar Capital 在新产品里砍掉了人类分析师，改用几百个 AI 智能体去搜投资点子、研究公司、推荐仓位和预测趋势。人只保留最后一道关卡：批准交易。

这不是孤例。塔塔咨询服务（TCS） 今天也说以后招聘会放缓，原因是公司正在把更多 AI 智能体塞进业务流程里，让它们接手一部分原来由人做的外包工作。

两条消息放在一起，agent 进办公室的速度比很多人想的快。但 Magnetar 这条缺少回测、风控和架构细节，TCS 也没给具体数字和时间表。效果先别太当真，方向值得盯。

今日小信号

Cohere 开源 North Mini Code：30B 参数的 MoE 模型，每次只激活 3B 参数，在 SWE-Bench Verified 上 pass@10 跑到 80.2%。跑分挺高，但缺少推理延迟和显存占用数据。
Claude 托管智能体支持定时运行：现在能用 cron 表达式设定时任务，到点自动跑，还多了个 Vaults 功能存密码。但正文没写最小间隔和能存多少变量。
Cursor 欧洲总部放伦敦：主要是被客户逼的——金融医疗这些行业要求数据不出欧洲，不在当地设点就拿不到单子。SpaceX 手里还攥着 600 亿美元收购它的选择权。
小米 MiMo 推 UltraSpeed 模式：1T 参数模型输出突破 1000 tokens/s，用 FP4 混合量化和并行推测解码。API 限时开放两周，定价是原版的 3 倍。
有人用 GPT-5.5 替代 OCR 流程：把 23000 多篇 ChinaRxiv 论文免费放出来了，还带了更完整的英文翻译。省钱省事，但缺少成本和准确率对比。