Claude Fable 5 来了,但今天 AI 圈在翻账本
今天 AI 圈最有意思的不在某个模型又能写代码了,是几张账本同时翻动:Anthropic 发了 Fable 5 和 Mythos 5,能力确实强,但更值得看的是 Apollo 和 Blackstone 在背后攒了个 350 亿美元的芯片融资局,中国那边也在筹划两万亿人民币的算力基建。模型在变强,但钱和算力的流向才是真正的暗线。先来看 Anthropic 这一发。
Claude Fable 5 很强,但 Anthropic 给它加了把安全锁
Anthropic 今天发了两个新模型:Claude Fable 5 和 Claude Mythos 5。Fable 5 是给普通用户用的安全版,Mythos 5 是给网络安全防御方用的无限制版,目前只通过美国政府合作项目开放。
先说能力。Fable 5 在软件工程、知识工作和视觉任务上都是新标杆。Stripe 测试时,它一天干完了原本一个团队两个月的代码迁移活。在 FrontierCode 这个新基准上——由 20 多位顶级开源维护者手工制作,判断标准是维护者愿不愿意合并代码——Fable 5 在最高难度档拿了 13.4% 的通过率,其他模型基本在 1% 到 5% 之间。Ethan Mollick 提前试了之后说,这模型比他用过的所有公开模型都强出一大截,能自己连续跑十几个小时,从零做一个等时线地图,自己派了一堆子 AI 去查了 2200 多个航班。
但 Anthropic 给 Fable 5 加了一个有意思的限制:碰到网络安全、生物化学和模型蒸馏这些敏感领域,它会自动切回能力更保守的 Claude Opus 4.8,平均每 20 次对话触发一次。能力最强的模型主动给自己加了安全刹车。这个设计思路跟其他家不太一样——不是靠外部过滤器,而是模型自己判断什么时候该退一步。
价格方面,两个模型都是 $10/百万输入 tokens、$50/百万输出 tokens,比之前的 Mythos Preview 降了一半。Mythos 5 在药物设计里实现了约 10 倍加速,分子生物学假说盲测获科学家偏好的概率约 80%。
我会先打个折:安全刹车的误触发率和具体判定逻辑还没公开,Mollick 的体验也没有参数和基准分佐证。但方向是明确的——Anthropic 在试图证明,最强能力和安全限制可以放在同一个模型里,而不是二选一。
Apollo 和 Blackstone 在背后攒了个 350 亿美元的芯片融资局
这条比模型发布更值得盯。华尔街两大资管巨头 Apollo 和 Blackstone 正在合作一笔 350 亿美元的 AI 融资,交易方包括 Anthropic 和芯片公司 Broadcom。
视频标题说这是为昂贵的 AI 芯片设计新的融资模式,但正文被 Bloomberg 的反爬机制挡住了,具体交易结构、钱怎么分、谁出多少都没披露。不过从参与方来看,这不像传统的风险投资,更像一种资产融资——把芯片作为底层资产,用未来算力收入来还钱。
这种模式之前不是没有。2024 年 CoreWeave 用 GPU 做抵押拿了 23 亿美元贷款,但 350 亿这个量级完全是另一个概念。如果这笔交易落地,它可能标志着一个全新 AI 投资类别的开端:不是投公司股权,而是投算力资产本身。
至于这能不能行,等交易细节出来再说。现在只能看到参与方和金额,结构还是一片黑。
中国准备砸两万亿人民币铺全国 AI 算力网
彭博社拿到消息,中国正在筹划一个五年约 2 万亿人民币(折合 2950 亿美元)的 AI 基建计划,核心是建大型数据中心。这笔钱主要用来解决国内 AI 发展的算力缺口,相当于国家出钱铺"算力高速公路"。
同时,台湾那边也在考虑对 AI 芯片出口大陆实施更严格的管制,以进一步跟美国出口限制对齐。两条消息放在一起看,算力正在变成地缘政治的核心筹码。
不过这条我先打个折。钱从哪来、怎么分、由哪些部门牵头、建成后算力怎么定价和分配,正文全没提。两万亿这个数字很猛,但没细则之前,它更像一个信号,不是一个计划。
德国法院判了:谷歌 AI 概览瞎编的内容,谷歌自己背锅
德国慕尼黑地区法院在一项临时禁令中认定,谷歌必须为 AI 概览生成的虚假内容直接担责。起因是谷歌的 AI 概览错误地把两家慕尼黑出版商跟诈骗、订阅陷阱等黑产扯上了关系,而这些指控在 AI 引用的链接原文里根本不存在。
法院的核心逻辑很直接:AI 概览不是传统搜索结果,它会用自己的话重新组织、评判信息,属于谷歌自己生产的内容,所以不能套用搜索引擎的间接侵权保护。
这个裁决可能为全球 AI 生成内容责任认定树立先例。之前各家大模型公司都在用"我只是个工具"来规避责任,但德国法院的逻辑把这个口子堵上了——如果你的 AI 用自己的话说了错话,那就是你在说话。
监管战不是要不要打的问题,是已经在打。
Gemma 4 12B 砍掉编码器,但跑分还没给
Google DeepMind 开源了 Gemma 4 12B,一个 120 亿参数的多模态模型。它最大的变化是去掉了传统的独立视觉/音频编码器,把所有输入统一交给 Transformer 处理,架构更简单。模型能直接听懂语音,不再需要先转文字。
官方说它用 Apache 2.0 协议开源,在 16GB 显存或统一内存的笔记本上就能跑,已经累计超过 1.5 亿次下载。但官方博客没给任何跑分,性能好坏全凭嘴说。
架构上砍掉独立编码器是个大改动,理论上能让模型更统一地理解不同模态的信息。但没有基准对比,就没法判断这个设计到底带来了多少实际提升。这点先别太激动。
对冲基金用几百个 AI 智能体替掉分析师,人只留最后批准权
彭博社消息,管理 180 亿美元的对冲基金 Magnetar Capital 在新产品里砍掉了人类分析师,改用几百个 AI 智能体去搜投资点子、研究公司、推荐仓位和预测趋势。人只保留最后一道关卡:批准交易。
这不是孤例。塔塔咨询服务(TCS) 今天也说以后招聘会放缓,原因是公司正在把更多 AI 智能体塞进业务流程里,让它们接手一部分原来由人做的外包工作。
两条消息放在一起,agent 进办公室的速度比很多人想的快。但 Magnetar 这条缺少回测、风控和架构细节,TCS 也没给具体数字和时间表。效果先别太当真,方向值得盯。
今日小信号
- Cohere 开源 North Mini Code:30B 参数的 MoE 模型,每次只激活 3B 参数,在 SWE-Bench Verified 上 pass@10 跑到 80.2%。跑分挺高,但缺少推理延迟和显存占用数据。
- Claude 托管智能体支持定时运行:现在能用 cron 表达式设定时任务,到点自动跑,还多了个 Vaults 功能存密码。但正文没写最小间隔和能存多少变量。
- Cursor 欧洲总部放伦敦:主要是被客户逼的——金融医疗这些行业要求数据不出欧洲,不在当地设点就拿不到单子。SpaceX 手里还攥着 600 亿美元收购它的选择权。
- 小米 MiMo 推 UltraSpeed 模式:1T 参数模型输出突破 1000 tokens/s,用 FP4 混合量化和并行推测解码。API 限时开放两周,定价是原版的 3 倍。
- 有人用 GPT-5.5 替代 OCR 流程:把 23000 多篇 ChinaRxiv 论文免费放出来了,还带了更完整的英文翻译。省钱省事,但缺少成本和准确率对比。