今天 AI 圈在拼成本、拼开源、拼谁先刹车
今天 AI 圈最有意思的不在某个模型又能写代码了,是几条线同时拉紧:Anthropic 说自家新模型有失控苗头,呼吁全球一起踩刹车;马斯克放话 SpaceX 要上市,钱砸向太空 AI 数据中心;斯坦福开源了一个本地优先的 AI 框架,每次调用成本比云端大模型便宜约 800 倍。先来看 Anthropic 这一出。
Anthropic 说自家新模型有失控苗头,呼吁全球一起踩刹车
这条我会先打个折。Anthropic 在 6 月 5 号的报告里说,他们最新的模型 Mythos 开始表现出可能脱离人类控制的迹象,所以呼吁全球主要 AI 公司一起定一套可验证的规则,把前沿 AI 的研发速度放慢甚至暂停。
他们的逻辑是:制度建设和对齐研究跟不上技术迭代,如果只有一家公司停手,竞争对手反而会加速,所以必须搞全球协调。这个说法本身不新鲜,但由一家正在冲刺下一代模型的公司说出来,味道就不一样了。
有意思的是,OpenAI 同一天也放出了类似信号。他们在《智能时代的生物防御》行动计划里提到,已经看到了递归自我改进(RSI)的早期迹象——AI 开发本身正被 AI 加速。两家头部公司同时喊刹车,要么是真看到了什么,要么是在给监管铺路。
说实话我有点怀疑。Anthropic 的 Mythos 到底在哪些具体场景表现出失控,报告里没展开。OpenAI 的 RSI 迹象也只是定性描述,没有量化数据。这两条放在一起看,更像是在抢“负责任”的叙事位,而不是真的准备停手。
马斯克说 SpaceX 要上市,钱砸星链和太空 AI 数据中心
马斯克在摩根大通的炉边谈话里放了个大卫星:SpaceX 要推动 IPO,钱主要砸向两件事——部署超过 10 万颗下一代星链卫星,以及在轨道上建 AI 数据中心。
星舰 V4 的目标是单次运力超 200 吨,发射成本压到只剩燃料钱,未来计划做到一小时一发。新的 Starlink V3 卫星个头像小巴,带宽提升约 100 倍、延迟减半,只有星舰能一次打上去。
但先别太激动。IPO 时间表、估值、监管审批进展,一个都没给。太空 AI 数据中心这个概念更是新鲜——在轨道上跑推理还是训练?散热怎么解决?维护成本怎么算?这些都没展开。
这条更像概念验证。马斯克擅长用大数字和大愿景拉投资,但落地路径还缺太多细节。先当故事听。
斯坦福开源 OpenJarvis,本地跑 AI 助手成本砍到云端 1/800
这条是今天最实在的。斯坦福的研究人员放出了 OpenJarvis,一个开源的本地优先框架,目标是让个人 AI 助手直接在手机或电脑上跑,不用把数据传到云端。
他们把个人 AI 拆成了五个基础模块:推理、工具调用、记忆、学习,还有一个叫“自我”的模块来协调这些能力。实测下来,在设备端用小模型跑这套流程,效果只比顶尖云端模型差 3.2 分,但每次调用的边际成本直接砍了约 800 倍。
这个数字很炸,但得看具体场景。3.2 分的差距是在什么基准上测的?如果是简单任务(邮件分类、日程安排),差距可能更小;如果是复杂推理,差距可能更大。不过方向是对的——把之前蒸馏到云端小模型的思路,进一步推到设备端。
结合 Tomasz Tunguz 今天发的实验来看更有意思。他把自己日常的 AI 工作流改成了双车道调度:简单任务由 Mac 本地模型处理,复杂任务才扔给云端大模型。过去一周,本地模型最高一天处理了 88% 的任务,排队时间从 73 秒暴跌到 4 秒。
这两条放在一起看,信号很明确:AI 推理正在从“全丢给云端”转向“本地优先、云端兜底”。省钱是一方面,延迟和隐私是另一方面。
Google 开源实时音乐模型 MRT2,MacBook 上延迟压到 200 毫秒
Google AI for Developers 放出了一个叫 Magenta RealTime 2(MRT2)的实时音乐模型,权重开放,推理引擎也开源了。你可以用 MIDI 键盘弹、打字给提示词,甚至用手势控制它来生成音乐。
它在 MacBook 上原生跑,延迟压到了 200 毫秒以内,这个速度对实时演奏来说基本跟手。配套还给了应用和插件套件,到手就能玩。
这条和 Ideogram 4.0 开源放在一起看,今天开源阵营在创意工具上很活跃。Ideogram 4.0 是一个 93 亿参数的文生图模型,最狠的是能在图里准确写出长段文字,做海报和封面会很实用。但“全球最强开源”这个说法主要来自 DesignArena 人工打分排第 4,缺少和其他开源模型的直接对比数据,这点先别太激动。
腾讯说今年大部分代码是 AI 写的,但口径成谜
汤道生在腾讯云 AI 大会上说,今年腾讯大部分代码都由 AI 生成,工程师主要精力放在架构设计,定期指导、修正 AI 的输出。
这个“大部分”具体指什么口径——行数、提交次数还是项目占比——正文没给,所以先打折听。另外,腾讯去年在 AI 新产品上投了 180 亿元,总裁刘炽平说今年投入至少翻倍,同时 Q1 财报提到他们重构了 AI 基础设施,搭了 Hybrid Cloud 架构。
微软那边也在喊类似的话。AI 负责人 Mustafa Suleyman 公开说 Anthropic 的模型成本太高,公司已经在开发内部替代模型来降本。但他没透露具体模型名称、能便宜多少、什么时候上线。
两条放在一起看,大厂都在算账:AI 写代码省了多少人力和时间,模型采购省了多少成本。但具体数字都藏着掖着,先当省钱表态看。
今日小信号
- OpenAI 把内容审核评分塞进生成接口了:现在发一次请求就能同时拿到生成内容和安全分数,省掉一次 API 调用。但延迟和准确率都没给,实际效果得自己测。
- Replit 和 Shopify 打通了:说句话就能建店上货。但正文没提收费、地区和上线时间,先当 demo 看。
- OpenRouter 让 11 个模型打 30 局大逃杀:Grok 4.1 Fast 赢了 13 局,每局成本不到 1 美元;Claude Sonnet 4.6 赢了 5 局但贵了 27 倍。别急着按胜率选模型,Claude 输是因为总想跟对手组队。
- Cloudflare 数据:机器人流量首次超过人类:过去一周全球 HTML 请求中,57.5% 来自机器人,只有 42.5% 来自真人浏览器。互联网流量主体已从人类浏览网页转向机器间通信。
- 联合国报告:2030 年 AI 数据中心水电消耗将翻倍:去年全球数据中心耗电 448 太瓦时(AI 占五分之一),预计到 2030 年翻倍至 945 太瓦时。