ax@ax-radar:~/daily/2026-05-24 $ cat newsletter/daily/2026-05-24.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-05-24省钱与安全

今天 AI 圈在拼省钱,不是模型

今天 AI 圈最有意思的不在某个模型又能写代码了,是几张账单同时翻动:DeepSeek 要把旗舰模型价格永久打到两折五、AI 芯片近三分之二的钱花在了内存上、Reasonix 用一个缓存把 61 美元的任务砍到 12 美元。另一边,一场叫 TrapDoor 的供应链攻击把 AI 编程助手变成了新攻击面,34 个恶意包同时污染了 npm、PyPI 和 Crates.io。先来看 DeepSeek 这一刀。

DeepSeek 一刀砍到两折五,但只说了意图没给账本

这条我会先打个折。Bloomberg 发了条短讯,说 DeepSeek 打算把自家旗舰模型的 API 调用价格永久降到原价的四分之一。但缺的东西有点多:具体是哪个模型、哪些接口适用、什么时候生效,都没说,也没给出原来的定价基准。

在官方出公告之前,只能确认降价意图,算不出实际能省多少钱。如果降的是 DeepSeek V3R1 这类已经在打价格战的模型,那这一刀更多是巩固现有优势;如果降的是还没大规模开放的 V4,那信号意义更大——相当于提前锁客。

有意思的是,这条消息出来的时间点。OpenAI 刚把 5.5 静悄悄接进 API,Google 在给 Anthropic 备 400 亿,各家都在拼算力订座。DeepSeek 这时候喊永久降价,更像是在说:我不跟你们拼烧钱,我拼的是让更多人用得起。

至于这能不能行,等官方把账本摊开再说。

TrapDoor 供应链攻击:AI 编程助手的配置文件成了新攻击面

这条不用打折,是实打实的安全事件。一场叫 TrapDoor 的协调供应链攻击同时在 npmPyPICrates.io 上投放了 34 个恶意包,目标是偷加密货币、AI 和安全开发者的钱包、SSH 密钥和云凭证。

手法不是直接藏恶意代码,而是给流行开源项目提 Pull Request,往里面塞被篡改的 CLAUDE.md.cursorrules 配置文件。开发者把仓库拉到本地后,Claude CodeCursor 这类 AI 编程助手会把这些文件当成可信指令执行,可能在开发者完全不知情的情况下跑恶意命令。

这是第一次有人把 AI 助手本身当成攻击面来用。以前供应链攻击的思路是污染依赖包、藏后门,现在攻击者发现了一个更省事的入口:AI 助手会自动读项目里的配置文件,而且开发者很少会逐行审查这些文件。

说实话,这个攻击面会越来越大。Claude Code 刚出了自动模式,去掉权限确认弹窗,让多任务并行跑——这本身是提效的好功能,但也意味着模型可以直接执行写文件、跑命令等操作,误操作或恶意指令的防护全靠模型自身判断。安全机制这块,目前还没看到对应的加固。

AI 芯片成本结构变了:近三分之二的钱花在了内存上

Epoch AI 算了笔账:从 2024 年 Q12025 年 Q4,高带宽内存(HBM)在 AI 芯片物料成本里的占比从 52% 涨到了 63%。这个数字是拿 英伟达AMD谷歌亚马逊四家的 AI 芯片按出货量加权平均算出来的。

同期逻辑芯片的成本占比基本没动,在 13% 左右;先进封装从 19% 降到 15%,其他辅助部件从 15% 降到 9%。现在造一块 AI 芯片,近三分之二的钱不是花在计算核心上,而是花在了内存上。

这个趋势对推理成本的影响很直接。内存贵,意味着长上下文、大 batch size 的推理场景会更烧钱。反过来看,ReasonixDeepSeek V4 做的那个缓存方案——长代码会话里缓存命中率 99.82%,一个原本要烧掉 400M token、花 61 美元的任务直接砍到 12 美元——省的不是算力,是内存带宽。

不过 Reasonix 这条我得打个七折看。正文被微信验证页挡住了,具体怎么实现、什么场景测的都不清楚。99.82% 的命中率在长代码任务里听着合理,但换个场景可能就掉下来了。

Meta 把经理赶回去写代码,工程师转岗做数据标注

这条看着挺离谱的。Meta 裁员后没走的人日子也不好过。公司开始把一些工程经理重新赶回一线写代码(IC 岗),同时把部分做基础设施和 AI 的工程师调去搞数据标注。

关键数字:经理和下属的比例从以前的 1:8 直接拉到了 1:50,管理层被大幅压缩。另外还爆了个料,说 Meta 持有数据标注公司 Scale AI 49% 的股份,但正文没展开这个持股结构对转岗决策有多大影响。

这波操作比裁员本身更说明公司想省钱省到骨头里。把 AI 工程师调去搞数据标注,听着像是用自家人给自家投资的标注公司打工,但实际效果得打个问号——标注是体力活,工程师干这个,留存率和标注质量都不会太高。

布罗克曼首次亲口复盘 OpenAI 那场 72 小时政变

OpenAI 联合创始人兼总裁 格雷格·布罗克曼在一期播客里,第一次详细讲了公司最惊险的一次内部危机。他回忆了 Sam Altman 被董事会解雇后,自己接到电话时的场景、当天就辞职的原因,以及第二天在 Sam 家里策划"凤凰"备份公司的经过。

转折点出现在 Ilya Sutskever 发了一条推文之后。除了这场风波,他还聊了 OpenAI 早期在纳帕谷的闭关开发、与微软的合作谈判,以及他对 AGI 时间线的个人判断。

这期播客的细节比之前所有报道都更接近第一视角。之前外界对那 72 小时的了解主要靠二手报道和当事人零散的推文,布罗克曼这次是第一次坐下来完整复盘。对关心 OpenAI 治理结构的人来说,这期值得听。

华为说芯片制造突破了,但关键数字一个都没给

华为声称绕开了先进设备,用另一条技术路线做出了先进芯片。但工艺节点、良率、成本、量产时间——这些关键数字一个都没给。

现在只能当个信号看。华为在芯片制造上的进展一直被外界盯着,这次放话更像是在说"我们没被卡死",但离真正追上 台积电 还有多远,不好说。

今日小信号

  • 面壁智能联合清华开源了 BitCPM-CANN,国内首个完全基于华为昇腾训练的三值(1.58-bit)端侧大模型。参数只用 -1、0、1 三个值,比传统 BF16 省约 6 倍显存,8B 模型能塞进旗舰手机跑。国产算力全链路验证是亮点,但缺少具体跑分和手机端实测延迟。
  • Hugging Face 发了篇博客,把智能体拆成模型、脚手架和线束三层,给混乱的术语划了条实用边界。但它自己都说不是来定标准的,别当标准看。
  • Sakura Internet 要把 AI 数据中心投资翻到近 7 倍,日本也在抢算力。但原预算基数和时间线都不清楚,这个"7 倍"到底从多少涨到多少,目前只能看个方向。
  • FT 提议在 AnthropicSpaceX 董事会里塞一个总统提名、参议院确认的董事,但正文被付费墙挡了,落地细节一概不知,先当个口号听。
  • 开发者给 149 美元Orange Pi 板子手写了一套纯 C++ 推理引擎跑 MiniCPM-V 4.6,把文本生成速度从 2.88 token/s 拉到 5.90 token/s,翻了一倍。关键优化是给逐 token 解码写了自定义矩阵乘核。

更多

频道

后台