编程助手开始按量收钱,AI 公司终于找到赚钱的感觉了
今天 AI 圈最值得看的不在某个模型又刷榜了,是几笔账同时翻动:Cognition 靠 Devin 一年收入涨了十几倍,估值冲到 260 亿美元;Anthropic 和 OpenAI 悄悄把企业编程助手从包月改成按量收费,个人用户 200 美元能烧掉 2180 美元的 token,但企业客户现在要按原价买单了。先来看 Cognition 这一笔。
Cognition 估值 260 亿美元,Devin 一年收入涨了十几倍
这条我会先打个折——260 亿美元估值、10 亿美元新融资,数字很大,但更值得看的是收入增速。Cognition 的年化收入从一年前的 3700 万美元涨到现在的 4.92 亿美元,涨了十几倍。核心产品 Devin 被定位成能自主干活的初级工程师,不是只补代码,而是能自己规划、测试、部署,走完多步骤流程。
公司不绑死一家模型,既用自己的模型,也接 OpenAI 和 Anthropic 的大模型。CEO 说目标是让工程师效率提升 10 倍,但这话目前只是他一个人说的,没看到独立验证。
有意思的是,Cognition 现在自称"全球最大的独立智能体实验室"。两年前 Devin 刚出来时,大家还在争论 AI 能不能真写代码,现在它已经是一家年化收入近 5 亿美元的公司了。
编程助手从包月改成按量收费,个人用户薅羊毛的日子可能快结束了
Simon Willison 发现了一个挺有意思的变化:从 2026 年 4 月起,Anthropic 和 OpenAI 悄悄把企业版编程助手的收费方式从固定座位费改成了按 API 调用量计费。他自己一个月用 Claude Code 和 Codex 烧掉的 token 折合 2180 美元,但个人套餐只要 200 美元。企业客户现在要按原价买单了。
Anthropic Enterprise 套餐变成每席位 20 美元/月外加 API 费用,OpenAI Codex 则直接按 API token 用量计费。同期发布的新模型 GPT-5.5(4 月 23 日)和 Opus 4.7(4 月 16 日)的 API 定价也显著高于前代版本。
Simon 的判断是这两家公司终于找到了产品市场契合点。我觉得更准确的描述是:他们终于找到了赚钱的感觉。之前编程助手是烧钱换用户,现在用户粘性上来了,开始收钱了。个人用户 200 美元烧 2180 美元 token 的差价,核心是是用企业客户的钱在补贴。这个窗口能开多久,不好说。
xAI 把 Grok 编程模型放上 API,价格对标 Claude
xAI 发布了专门干编程活的模型 grok-build-0.1,现在通过 API 公测。这个模型主要用来做网页开发、修 bug 这类需要模型自己调用工具、跑流程的任务,跟 Grok Build 命令行工具背后是同一个模型。速度标称每秒 100 个 token 以上,价格是输入每百万 token 1 美元、输出每百万 token 2 美元。
同时 xAI 也把 Grok 编程智能体塞进了 Kilo IDE 的扩展和命令行,订阅 SuperGrok 或 X Premium+ 就能用。门槛不低——两个订阅都是付费档,免费用户暂时没戏。
价格上,grok-build-0.1 的输出定价 2 美元/百万 token,跟 Claude 系列在一个区间。但缺少具体支持哪些编程语言或任务类型,也没说效果对比数据,这点先别太激动。
英伟达开源 Polar,不改代码就能让 Codex 跑分涨近 6 倍
英伟达搞了个叫 Polar 的开源框架,专门解决一个实际问题:怎么在不重写 Codex、Claude Code 这些现成代码工具的前提下,用强化学习去训练它们。Polar 的做法很取巧,它不碰工具本身的执行逻辑,而是在模型和工具之间的 API 接口上做文章,把对话记录、采样结果这些信息重新组织,让模型在多步任务里根据奖励信号自己学会更优操作。
实验结果是 Codex 跑分从 3.8% 拉到 26.4%,涨了近 6 倍。但这是 4B 小模型的实验,换大模型效果未知。
这个思路挺聪明——不重写工具,只在接口层加强化学习。如果大模型上也能复现这个涨幅,那编程助手的门槛会进一步降低。但现在只能说小模型上跑通了,别急着 extrapolate。
Anthropic 公开代码漏洞扫描流程,已报 1596 个漏洞
Anthropic 在这篇博客里讲了他们怎么用自家最强的 Claude Opus 模型去扫代码安全漏洞。整个流程分六步:先做威胁建模(搞清楚代码可能被怎么攻击),再把代码放进沙盒隔离运行,接着让模型找漏洞,找到后人工验证是不是误报,然后排优先级,最后出修复方案。
他们拿这套流程去扫开源项目,截至 2026 年 5 月 22 日共报出 1596 个漏洞,其中 97 个已经修了。但没给误报率和每条漏洞的验证成本。
Anthropic 自己的判断是:漏洞发现现在易于并行化,瓶颈已转移到后续的验证与处理阶段。这个判断挺实在——模型能快速扫出大量潜在漏洞,但人工验证跟不上,修得更慢。1596 个报出来,只修了 97 个,比例不到 7%。
今日小信号
- OpenAI 产品能直连你内网的 MCP 服务器了:ChatGPT、Codex 和 Responses API 现在可以走纯出站 HTTPS 去调你团队放在内网的 MCP 服务器,服务器不用暴露到公网。但正文没提延迟和鉴权细节,实际用之前最好先测一下。
- Runway 发布 MCP 服务器:让 Claude、ChatGPT 这类助手能在聊天窗口里直接调用 Runway 的模型生成图片和视频,省掉来回搬运素材的麻烦。接入的模型包括 Gen-4.5、Seedance 2.0 等。
- Perplexity 开源 Unigram 分词器:CPU 占用降了 5 到 6 倍,专门解决小模型在 GPU 上跑得快、但分词拖后腿的问题。
- 黄仁勋展示英伟达台湾新园区:计划每年在台湾砸约 1500 亿美元,比 AMD 一周前宣布的 100 亿美元高了 15 倍。但正文没讲钱花在哪、怎么花,先别太激动。
- 教皇发 AI 通谕,Anthropic 联创到场站台:教皇 Leo XIV 发了份叫《Magnifica Humanitas》的通谕,核心就一句:AI 一旦进入影响人生活的流程,就不再是纯技术问题。Anthropic 的 Christopher Olah 也去了发布现场。这事本身说明 AI 治理已从技术圈吵到了更广的社会权力层面。