AX 的 AI 日报 · 2026-05-24省钱与安全

今天 AI 圈在拼省钱，不是模型

2026年5月24日

今天 AI 圈最有意思的不在某个模型又能写代码了，是几张账单同时翻动：DeepSeek 要把旗舰模型价格永久打到两折五、AI 芯片近三分之二的钱花在了内存上、Reasonix 用一个缓存把 61 美元的任务砍到 12 美元。另一边，一场叫 TrapDoor 的供应链攻击把 AI 编程助手变成了新攻击面，34 个恶意包同时污染了 npm、PyPI 和 Crates.io。先来看 DeepSeek 这一刀。

DeepSeek 一刀砍到两折五，但只说了意图没给账本

这条我会先打个折。Bloomberg 发了条短讯，说 DeepSeek 打算把自家旗舰模型的 API 调用价格永久降到原价的四分之一。但缺的东西有点多：具体是哪个模型、哪些接口适用、什么时候生效，都没说，也没给出原来的定价基准。

在官方出公告之前，只能确认降价意图，算不出实际能省多少钱。如果降的是 DeepSeek V3 或 R1 这类已经在打价格战的模型，那这一刀更多是巩固现有优势；如果降的是还没大规模开放的 V4，那信号意义更大——相当于提前锁客。

有意思的是，这条消息出来的时间点。OpenAI 刚把 5.5 静悄悄接进 API，Google 在给 Anthropic 备 400 亿，各家都在拼算力订座。DeepSeek 这时候喊永久降价，更像是在说：我不跟你们拼烧钱，我拼的是让更多人用得起。

至于这能不能行，等官方把账本摊开再说。

TrapDoor 供应链攻击：AI 编程助手的配置文件成了新攻击面

这条不用打折，是实打实的安全事件。一场叫 TrapDoor 的协调供应链攻击同时在 npm、PyPI 和 Crates.io 上投放了 34 个恶意包，目标是偷加密货币、AI 和安全开发者的钱包、SSH 密钥和云凭证。

手法不是直接藏恶意代码，而是给流行开源项目提 Pull Request，往里面塞被篡改的 CLAUDE.md 和 .cursorrules 配置文件。开发者把仓库拉到本地后，Claude Code 或 Cursor 这类 AI 编程助手会把这些文件当成可信指令执行，可能在开发者完全不知情的情况下跑恶意命令。

这是第一次有人把 AI 助手本身当成攻击面来用。以前供应链攻击的思路是污染依赖包、藏后门，现在攻击者发现了一个更省事的入口：AI 助手会自动读项目里的配置文件，而且开发者很少会逐行审查这些文件。

说实话，这个攻击面会越来越大。Claude Code 刚出了自动模式，去掉权限确认弹窗，让多任务并行跑——这本身是提效的好功能，但也意味着模型可以直接执行写文件、跑命令等操作，误操作或恶意指令的防护全靠模型自身判断。安全机制这块，目前还没看到对应的加固。

AI 芯片成本结构变了：近三分之二的钱花在了内存上

Epoch AI 算了笔账：从 2024 年 Q1 到 2025 年 Q4，高带宽内存（HBM）在 AI 芯片物料成本里的占比从 52% 涨到了 63%。这个数字是拿 英伟达、AMD、谷歌和亚马逊四家的 AI 芯片按出货量加权平均算出来的。

同期逻辑芯片的成本占比基本没动，在 13% 左右；先进封装从 19% 降到 15%，其他辅助部件从 15% 降到 9%。现在造一块 AI 芯片，近三分之二的钱不是花在计算核心上，而是花在了内存上。

这个趋势对推理成本的影响很直接。内存贵，意味着长上下文、大 batch size 的推理场景会更烧钱。反过来看，Reasonix 给 DeepSeek V4 做的那个缓存方案——长代码会话里缓存命中率 99.82%，一个原本要烧掉 400M token、花 61 美元的任务直接砍到 12 美元——省的不是算力，是内存带宽。

不过 Reasonix 这条我得打个七折看。正文被微信验证页挡住了，具体怎么实现、什么场景测的都不清楚。99.82% 的命中率在长代码任务里听着合理，但换个场景可能就掉下来了。

Meta 把经理赶回去写代码，工程师转岗做数据标注

这条看着挺离谱的。Meta 裁员后没走的人日子也不好过。公司开始把一些工程经理重新赶回一线写代码（IC 岗），同时把部分做基础设施和 AI 的工程师调去搞数据标注。

关键数字：经理和下属的比例从以前的 1:8 直接拉到了 1:50，管理层被大幅压缩。另外还爆了个料，说 Meta 持有数据标注公司 Scale AI 49% 的股份，但正文没展开这个持股结构对转岗决策有多大影响。

这波操作比裁员本身更说明公司想省钱省到骨头里。把 AI 工程师调去搞数据标注，听着像是用自家人给自家投资的标注公司打工，但实际效果得打个问号——标注是体力活，工程师干这个，留存率和标注质量都不会太高。

布罗克曼首次亲口复盘 OpenAI 那场 72 小时政变

OpenAI 联合创始人兼总裁 格雷格·布罗克曼在一期播客里，第一次详细讲了公司最惊险的一次内部危机。他回忆了 Sam Altman 被董事会解雇后，自己接到电话时的场景、当天就辞职的原因，以及第二天在 Sam 家里策划"凤凰"备份公司的经过。

转折点出现在 Ilya Sutskever 发了一条推文之后。除了这场风波，他还聊了 OpenAI 早期在纳帕谷的闭关开发、与微软的合作谈判，以及他对 AGI 时间线的个人判断。

这期播客的细节比之前所有报道都更接近第一视角。之前外界对那 72 小时的了解主要靠二手报道和当事人零散的推文，布罗克曼这次是第一次坐下来完整复盘。对关心 OpenAI 治理结构的人来说，这期值得听。

华为说芯片制造突破了，但关键数字一个都没给

华为声称绕开了先进设备，用另一条技术路线做出了先进芯片。但工艺节点、良率、成本、量产时间——这些关键数字一个都没给。

现在只能当个信号看。华为在芯片制造上的进展一直被外界盯着，这次放话更像是在说"我们没被卡死"，但离真正追上 台积电 还有多远，不好说。

今日小信号

面壁智能联合清华开源了 BitCPM-CANN，国内首个完全基于华为昇腾训练的三值（1.58-bit）端侧大模型。参数只用 -1、0、1 三个值，比传统 BF16 省约 6 倍显存，8B 模型能塞进旗舰手机跑。国产算力全链路验证是亮点，但缺少具体跑分和手机端实测延迟。
Hugging Face 发了篇博客，把智能体拆成模型、脚手架和线束三层，给混乱的术语划了条实用边界。但它自己都说不是来定标准的，别当标准看。
Sakura Internet 要把 AI 数据中心投资翻到近 7 倍，日本也在抢算力。但原预算基数和时间线都不清楚，这个"7 倍"到底从多少涨到多少，目前只能看个方向。
FT 提议在 Anthropic 和 SpaceX 董事会里塞一个总统提名、参议院确认的董事，但正文被付费墙挡了，落地细节一概不知，先当个口号听。
开发者给 149 美元的 Orange Pi 板子手写了一套纯 C++ 推理引擎跑 MiniCPM-V 4.6，把文本生成速度从 2.88 token/s 拉到 5.90 token/s，翻了一倍。关键优化是给逐 token 解码写了自定义矩阵乘核。