AX 的 AI 日报 · 2026-05-27编程助手按量收费

编程助手开始按量收钱，AI 公司终于找到赚钱的感觉了

2026年5月27日

今天 AI 圈最值得看的不在某个模型又刷榜了，是几笔账同时翻动：Cognition 靠 Devin 一年收入涨了十几倍，估值冲到 260 亿美元；Anthropic 和 OpenAI 悄悄把企业编程助手从包月改成按量收费，个人用户 200 美元能烧掉 2180 美元的 token，但企业客户现在要按原价买单了。先来看 Cognition 这一笔。

Cognition 估值 260 亿美元，Devin 一年收入涨了十几倍

这条我会先打个折——260 亿美元估值、10 亿美元新融资，数字很大，但更值得看的是收入增速。Cognition 的年化收入从一年前的 3700 万美元涨到现在的 4.92 亿美元，涨了十几倍。核心产品 Devin 被定位成能自主干活的初级工程师，不是只补代码，而是能自己规划、测试、部署，走完多步骤流程。

公司不绑死一家模型，既用自己的模型，也接 OpenAI 和 Anthropic 的大模型。CEO 说目标是让工程师效率提升 10 倍，但这话目前只是他一个人说的，没看到独立验证。

有意思的是，Cognition 现在自称"全球最大的独立智能体实验室"。两年前 Devin 刚出来时，大家还在争论 AI 能不能真写代码，现在它已经是一家年化收入近 5 亿美元的公司了。

编程助手从包月改成按量收费，个人用户薅羊毛的日子可能快结束了

Simon Willison 发现了一个挺有意思的变化：从 2026 年 4 月起，Anthropic 和 OpenAI 悄悄把企业版编程助手的收费方式从固定座位费改成了按 API 调用量计费。他自己一个月用 Claude Code 和 Codex 烧掉的 token 折合 2180 美元，但个人套餐只要 200 美元。企业客户现在要按原价买单了。

Anthropic Enterprise 套餐变成每席位 20 美元/月外加 API 费用，OpenAI Codex 则直接按 API token 用量计费。同期发布的新模型 GPT-5.5（4 月 23 日）和 Opus 4.7（4 月 16 日）的 API 定价也显著高于前代版本。

Simon 的判断是这两家公司终于找到了产品市场契合点。我觉得更准确的描述是：他们终于找到了赚钱的感觉。之前编程助手是烧钱换用户，现在用户粘性上来了，开始收钱了。个人用户 200 美元烧 2180 美元 token 的差价，核心是是用企业客户的钱在补贴。这个窗口能开多久，不好说。

xAI 把 Grok 编程模型放上 API，价格对标 Claude

xAI 发布了专门干编程活的模型 grok-build-0.1，现在通过 API 公测。这个模型主要用来做网页开发、修 bug 这类需要模型自己调用工具、跑流程的任务，跟 Grok Build 命令行工具背后是同一个模型。速度标称每秒 100 个 token 以上，价格是输入每百万 token 1 美元、输出每百万 token 2 美元。

同时 xAI 也把 Grok 编程智能体塞进了 Kilo IDE 的扩展和命令行，订阅 SuperGrok 或 X Premium+ 就能用。门槛不低——两个订阅都是付费档，免费用户暂时没戏。

价格上，grok-build-0.1 的输出定价 2 美元/百万 token，跟 Claude 系列在一个区间。但缺少具体支持哪些编程语言或任务类型，也没说效果对比数据，这点先别太激动。

英伟达开源 Polar，不改代码就能让 Codex 跑分涨近 6 倍

英伟达搞了个叫 Polar 的开源框架，专门解决一个实际问题：怎么在不重写 Codex、Claude Code 这些现成代码工具的前提下，用强化学习去训练它们。Polar 的做法很取巧，它不碰工具本身的执行逻辑，而是在模型和工具之间的 API 接口上做文章，把对话记录、采样结果这些信息重新组织，让模型在多步任务里根据奖励信号自己学会更优操作。

实验结果是 Codex 跑分从 3.8% 拉到 26.4%，涨了近 6 倍。但这是 4B 小模型的实验，换大模型效果未知。

这个思路挺聪明——不重写工具，只在接口层加强化学习。如果大模型上也能复现这个涨幅，那编程助手的门槛会进一步降低。但现在只能说小模型上跑通了，别急着 extrapolate。

Anthropic 公开代码漏洞扫描流程，已报 1596 个漏洞

Anthropic 在这篇博客里讲了他们怎么用自家最强的 Claude Opus 模型去扫代码安全漏洞。整个流程分六步：先做威胁建模（搞清楚代码可能被怎么攻击），再把代码放进沙盒隔离运行，接着让模型找漏洞，找到后人工验证是不是误报，然后排优先级，最后出修复方案。

他们拿这套流程去扫开源项目，截至 2026 年 5 月 22 日共报出 1596 个漏洞，其中 97 个已经修了。但没给误报率和每条漏洞的验证成本。

Anthropic 自己的判断是：漏洞发现现在易于并行化，瓶颈已转移到后续的验证与处理阶段。这个判断挺实在——模型能快速扫出大量潜在漏洞，但人工验证跟不上，修得更慢。1596 个报出来，只修了 97 个，比例不到 7%。

今日小信号

OpenAI 产品能直连你内网的 MCP 服务器了：ChatGPT、Codex 和 Responses API 现在可以走纯出站 HTTPS 去调你团队放在内网的 MCP 服务器，服务器不用暴露到公网。但正文没提延迟和鉴权细节，实际用之前最好先测一下。
Runway 发布 MCP 服务器：让 Claude、ChatGPT 这类助手能在聊天窗口里直接调用 Runway 的模型生成图片和视频，省掉来回搬运素材的麻烦。接入的模型包括 Gen-4.5、Seedance 2.0 等。
Perplexity 开源 Unigram 分词器：CPU 占用降了 5 到 6 倍，专门解决小模型在 GPU 上跑得快、但分词拖后腿的问题。
黄仁勋展示英伟达台湾新园区：计划每年在台湾砸约 1500 亿美元，比 AMD 一周前宣布的 100 亿美元高了 15 倍。但正文没讲钱花在哪、怎么花，先别太激动。
教皇发 AI 通谕，Anthropic 联创到场站台：教皇 Leo XIV 发了份叫《Magnifica Humanitas》的通谕，核心就一句：AI 一旦进入影响人生活的流程，就不再是纯技术问题。Anthropic 的 Christopher Olah 也去了发布现场。这事本身说明 AI 治理已从技术圈吵到了更广的社会权力层面。