ax@ax-radar:~/daily/2026-05-27 $ cat newsletter/daily/2026-05-27.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-05-27编程助手按量收费

编程助手开始按量收钱,AI 公司终于找到赚钱的感觉了

今天 AI 圈最值得看的不在某个模型又刷榜了,是几笔账同时翻动:Cognition 靠 Devin 一年收入涨了十几倍,估值冲到 260 亿美元;Anthropic 和 OpenAI 悄悄把企业编程助手从包月改成按量收费,个人用户 200 美元能烧掉 2180 美元的 token,但企业客户现在要按原价买单了。先来看 Cognition 这一笔。

Cognition 估值 260 亿美元,Devin 一年收入涨了十几倍

这条我会先打个折——260 亿美元估值、10 亿美元新融资,数字很大,但更值得看的是收入增速。Cognition 的年化收入从一年前的 3700 万美元涨到现在的 4.92 亿美元,涨了十几倍。核心产品 Devin 被定位成能自主干活的初级工程师,不是只补代码,而是能自己规划、测试、部署,走完多步骤流程。

公司不绑死一家模型,既用自己的模型,也接 OpenAIAnthropic 的大模型。CEO 说目标是让工程师效率提升 10 倍,但这话目前只是他一个人说的,没看到独立验证。

有意思的是,Cognition 现在自称"全球最大的独立智能体实验室"。两年前 Devin 刚出来时,大家还在争论 AI 能不能真写代码,现在它已经是一家年化收入近 5 亿美元的公司了。

编程助手从包月改成按量收费,个人用户薅羊毛的日子可能快结束了

Simon Willison 发现了一个挺有意思的变化:从 2026 年 4 月起,AnthropicOpenAI 悄悄把企业版编程助手的收费方式从固定座位费改成了按 API 调用量计费。他自己一个月用 Claude CodeCodex 烧掉的 token 折合 2180 美元,但个人套餐只要 200 美元。企业客户现在要按原价买单了。

Anthropic Enterprise 套餐变成每席位 20 美元/月外加 API 费用,OpenAI Codex 则直接按 API token 用量计费。同期发布的新模型 GPT-5.5(4 月 23 日)和 Opus 4.7(4 月 16 日)的 API 定价也显著高于前代版本。

Simon 的判断是这两家公司终于找到了产品市场契合点。我觉得更准确的描述是:他们终于找到了赚钱的感觉。之前编程助手是烧钱换用户,现在用户粘性上来了,开始收钱了。个人用户 200 美元烧 2180 美元 token 的差价,核心是是用企业客户的钱在补贴。这个窗口能开多久,不好说。

xAI 把 Grok 编程模型放上 API,价格对标 Claude

xAI 发布了专门干编程活的模型 grok-build-0.1,现在通过 API 公测。这个模型主要用来做网页开发、修 bug 这类需要模型自己调用工具、跑流程的任务,跟 Grok Build 命令行工具背后是同一个模型。速度标称每秒 100 个 token 以上,价格是输入每百万 token 1 美元、输出每百万 token 2 美元

同时 xAI 也把 Grok 编程智能体塞进了 Kilo IDE 的扩展和命令行,订阅 SuperGrokX Premium+ 就能用。门槛不低——两个订阅都是付费档,免费用户暂时没戏。

价格上,grok-build-0.1 的输出定价 2 美元/百万 token,跟 Claude 系列在一个区间。但缺少具体支持哪些编程语言或任务类型,也没说效果对比数据,这点先别太激动。

英伟达开源 Polar,不改代码就能让 Codex 跑分涨近 6 倍

英伟达搞了个叫 Polar 的开源框架,专门解决一个实际问题:怎么在不重写 CodexClaude Code 这些现成代码工具的前提下,用强化学习去训练它们。Polar 的做法很取巧,它不碰工具本身的执行逻辑,而是在模型和工具之间的 API 接口上做文章,把对话记录、采样结果这些信息重新组织,让模型在多步任务里根据奖励信号自己学会更优操作。

实验结果是 Codex 跑分从 3.8% 拉到 26.4%,涨了近 6 倍。但这是 4B 小模型的实验,换大模型效果未知。

这个思路挺聪明——不重写工具,只在接口层加强化学习。如果大模型上也能复现这个涨幅,那编程助手的门槛会进一步降低。但现在只能说小模型上跑通了,别急着 extrapolate。

Anthropic 公开代码漏洞扫描流程,已报 1596 个漏洞

Anthropic 在这篇博客里讲了他们怎么用自家最强的 Claude Opus 模型去扫代码安全漏洞。整个流程分六步:先做威胁建模(搞清楚代码可能被怎么攻击),再把代码放进沙盒隔离运行,接着让模型找漏洞,找到后人工验证是不是误报,然后排优先级,最后出修复方案。

他们拿这套流程去扫开源项目,截至 2026 年 5 月 22 日共报出 1596 个漏洞,其中 97 个已经修了。但没给误报率和每条漏洞的验证成本。

Anthropic 自己的判断是:漏洞发现现在易于并行化,瓶颈已转移到后续的验证与处理阶段。这个判断挺实在——模型能快速扫出大量潜在漏洞,但人工验证跟不上,修得更慢。1596 个报出来,只修了 97 个,比例不到 7%。

今日小信号

  • OpenAI 产品能直连你内网的 MCP 服务器了:ChatGPT、Codex 和 Responses API 现在可以走纯出站 HTTPS 去调你团队放在内网的 MCP 服务器,服务器不用暴露到公网。但正文没提延迟和鉴权细节,实际用之前最好先测一下。
  • Runway 发布 MCP 服务器:让 Claude、ChatGPT 这类助手能在聊天窗口里直接调用 Runway 的模型生成图片和视频,省掉来回搬运素材的麻烦。接入的模型包括 Gen-4.5、Seedance 2.0 等。
  • Perplexity 开源 Unigram 分词器:CPU 占用降了 5 到 6 倍,专门解决小模型在 GPU 上跑得快、但分词拖后腿的问题。
  • 黄仁勋展示英伟达台湾新园区:计划每年在台湾砸约 1500 亿美元,比 AMD 一周前宣布的 100 亿美元高了 15 倍。但正文没讲钱花在哪、怎么花,先别太激动。
  • 教皇发 AI 通谕,Anthropic 联创到场站台:教皇 Leo XIV 发了份叫《Magnifica Humanitas》的通谕,核心就一句:AI 一旦进入影响人生活的流程,就不再是纯技术问题。Anthropic 的 Christopher Olah 也去了发布现场。这事本身说明 AI 治理已从技术圈吵到了更广的社会权力层面。

更多

频道

后台