今天 AI 圈在拼渠道,不是模型
今天 AI 圈最值得看的不是某个模型又刷新了榜单,是几家头部公司同时在做同一件事:把模型塞进企业流程里。OpenAI 和 Anthropic 各自拉上私募和投行,成立百亿美元级别的合资公司,专门帮企业部署 AI。白宫突然说要审查模型发布,直接原因是 Anthropic 的 Mythos 太强。迪士尼那边,一个员工 9 天调了 Claude 46 万次,平均 1.7 秒一次。先来看 OpenAI 和 Anthropic 这两笔合资账。
OpenAI 和 Anthropic 同时搞合资公司,但路子不太一样
今天 AI 圈最大的动作不是发模型,是两家头部公司同时宣布成立合资公司,专门做企业部署。OpenAI 拉上 TPG 和 Brookfield 等私募,成立了一家叫"部署公司"的合资企业,筹集了超过 40 亿美元。Anthropic 那边也不慢,联合 黑石、Hellman & Friedman 和 高盛,搞了个 15 亿美元的合资项目。
两条路子的共同点很明确:模型本身已经不是瓶颈了。OpenAI 的说法是,现在企业不用 AI 不是因为模型不够好,是缺整合团队、缺工作流、缺数据访问权限、缺安全规则。Anthropic 的表述也差不多——中型企业缺的不是 Claude 的能力,是把 Claude 嵌进核心运营流程的工程能力。
但仔细看,两家的打法有差别。OpenAI 的合资公司更像一个分发渠道——通过 TPG 和 Brookfield 的投资组合,直接触达超过 2000 家企业,打包软件、咨询和部署方案一起卖。Anthropic 这边更偏定制服务,派自己的应用 AI 工程师跟客户紧密合作,第一个落地案例是医疗健康领域的自动化文档处理。
"本次投资的 300 亿美元额度取决于 Anthropic 是否达到特定营收目标。"
有意思的是,Anthropic 这笔钱的结构跟 Google 之前那笔 400 亿美元投资有点像——不是一次性给完,而是分批、带条件。具体触发条件没公开,但说明投资方也在给自己留后路。
我会把这两件事放在一起看:AI 实验室的竞争正在从"谁的模型跑分高"转向"谁能把模型塞进更多企业的流程里"。合资公司不是技术故事,是渠道故事。至于这能不能跑通,几个月后看实际部署数量和续费率。
白宫突然想审查模型发布,Mythos 是导火索
这条我会先打个折——目前只有讨论,没有具体方案。但方向值得留意。
特朗普政府正在讨论一项行政令,打算成立一个由科技公司高管和政府官员组成的 AI 工作组,研究对新的 AI 模型做发布前正式审查。直接导火索是 Anthropic 推出了一个叫 Mythos 的强模型,让之前放手不管的政府有点慌了。
讨论方向包括参考英国的做法,让多个政府机构来确保模型达到安全标准。但具体审查什么标准、覆盖哪些模型、由哪个部门执行、什么时候落地,一概没定。
与此同时,欧盟也在跟 Anthropic 谈,想用 Mythos 给银行和公司做安全测试。关键看点不是技术本身,而是监管机构会不会把模型厂商的检测结果直接变成银行业的合规流程——如果真落地,等于让 AI 公司替监管定安全标准。
这两件事放在一起看,说明监管战不是要不要打的问题,是已经在打。但 Mythos 具体是什么、漏洞检测的原理和范围,目前公开信息太少,先别急着下结论。
迪士尼一个员工 9 天调了 Claude 46 万次,Meta 月烧 60 万亿 token
这条数据挺离谱的,但先别被标题带跑。
迪士尼内部上线了一个 AI 使用看板,追踪员工调用 Claude 的频率和 token 消耗。数据显示,一名员工在 9 个工作日内调用 Claude 约 46 万次,平均每 1.7 秒一次。与此同时,迪士尼正在裁员约 1000 人。
硅谷现在流行一个词叫"tokenmaxxing",就是比拼 AI token 消耗量。Meta 内部统计显示,其 8.5 万名员工在 30 天内消耗了 60 万亿 token,价值约 900 亿美元。Uber 的年度 34 亿美元 AI 预算在 4 个月内就花完了。
报告里还有一个有意思的数字:Claude 用户中非程序员用途已经超过半数。这说明 AI 在企业里的用法正在从写代码扩展到写文档、做分析、处理流程。
但 1.7 秒一次调用,说实话我有点怀疑是不是把 API 轮询也算进去了。如果是真人在用,这个频率基本不可能。更可能是自动化脚本在跑。这点上游没说清楚。
xAI 的 55 万张 GPU 只有 11% 在干活
这条来自 The Information 的报道,但原文被微信验证墙挡了,细节没法核实。已知的数字是:xAI 手里大概 55 万张英伟达 GPU,但模型浮点运算利用率(MFU)只有 11%,折算下来相当于真正在干活的卡就 6 万张左右。
文章把锅甩给了 HBM 显存读写、服务器之间通信、训练时空等和软件栈不统一这几个问题。作为对比,Meta 的利用率是 43%,Google 是 46%。
55 万张卡是什么概念?按 H100 的市价算,这批硬件成本大概在 150 到 200 亿美元之间。11% 的利用率意味着大部分钱花在了闲置算力上。
不过 MFU 这个指标本身有局限性——它只衡量训练时的浮点运算效率,不反映推理负载、模型并行策略、或者集群是否在做其他类型的计算。xAI 可能在跑大量推理任务,MFU 天然就低。这点上游报道没区分清楚。
豆包挂出付费订阅,最高 500 元/月,但还没开卖
字节跳动的豆包在苹果商店列出了三档月费订阅:68 元、200 元和 500 元,同时保留免费基础版。字节回应说具体信息以后续官方渠道为准,目前付费功能还没上线。
豆包 App 今年 4 月日活超过 1.4 亿,到 3 月模型日均调用量超过 120 万亿 token。这个量级在国内是头部的。
但各档位具体解锁什么能力、正式收费时间,一概没说。500 元/月的定价在国内 AI 产品里算高的,如果只是解锁更高频次的调用或者更长上下文,用户会不会买单还不好说。先别急着掏钱。
今日小信号
- Cerebras 准备上市,估值至少 266 亿美元。核心赌的是 OpenAI 的算力订单会持续砸给它,而不是芯片本身的技术指标。OpenAI 有没有持股、贡献了多少收入,都没披露。
- Sierra 拿了 9.5 亿美元,估值冲到 150 亿。公司说财富 50 强里超过 40% 在用,平台上跑了几十亿次对话。但缺营收和续费率,估值故事主要靠"大客户在用"撑着。
- Meta 找摩根士丹利和摩根大通操盘,为得州数据中心融资 130 亿美元。大科技公司建 AI 基础设施越来越靠举债,不是全用自有现金。说明烧钱已经烧到连大厂都要上杠杆了。
- OpenAI 总裁 Brockman 庭审承认持股近 300 亿美元。马斯克的律师追问为什么没捐给非营利基金会。这个数字是庭审口述,没写持股比例和估值依据,先别当精确身价看。
- GB300 NVL72 实测性能达 GB200 的 2.7 倍。纸面参数只提升约 1.5 倍,但全栈优化的复合增益让实际跑分远超理论算力。端到端实测才是硬道理。