AX 的 AI 日报 · 2026-05-21账本翻动

今天 AI 圈在拼账本，不是模型

2026年5月21日

今天 AI 圈最有意思的不在某个模型又能写代码了，是几张账本同时翻动：DeepSeek 在谈 700 亿首轮融资、Anthropic 提前两年盈利、Intuit 裁 3000 人转投 AI、加州开始研究 AI 抢饭碗怎么赔。先来看 DeepSeek 这一笔。

DeepSeek 700 亿首轮融资，梁文锋自己掏 200 亿还承诺继续开源

这条数字大到需要先喘口气——700 亿元人民币，DeepSeek 正在敲定首轮外部融资，投前估值约 450 亿美元。如果落地，这将是中国科技初创公司首轮融资的最高纪录。

更值得看的是结构。腾讯、IDG 资本和砺思资本接近参投，而创始人梁文锋个人也可能注资约 200 亿元。他在投资者会议上明确说了两件事：公司会继续做开源模型，目标是通用人工智能，不急着商业化。

说实话，这个表态在现在的融资环境里挺少见。大部分公司拿大钱的时候都会开始谈商业化路径、谈收入模型，但梁文锋直接把这条路堵上了——至少公开层面是这样。

不过文章也提到，具体金额和最终参投方还没锁。700 亿这个数字目前是"接近敲定"，不是"已到账"。我会先打个折，等正式公告。

Anthropic 提前两年盈利，但新模型分词器让成本偷偷涨了 12-30%

华尔街日报的消息，Anthropic 二季度营收预计冲到 109 亿美元，同比增长 130%，运营利润约 5.59 亿美元。去年夏天他们自己还说最早 2028 年才能盈利，现在提前了两年。

增长主要靠两件事：编程工具被大量公司用起来，Claude 开始接那种能自己跑一段时间的"干活型"任务。需求大到算力一度不够用，逼着 Anthropic 去签新数据中心合同。

但有个细节值得留意——新模型的分词器让实际成本涨了 12-30%。这个数字不在营收报表里，但在使用成本上很真实。也就是说，Anthropic 赚钱了，但用户用新模型的成本也在涨。这两件事不矛盾，但放在一起看更有意思。

特朗普临阵叫停 AI 安全评估令，马斯克和扎克伯格连夜游说

这条的戏剧性在时间线上。特朗普在签字仪式前几小时突然取消了一份 AI 行政令，原本这份命令要求政府在 AI 模型公开发布前先做安全评估。

据 Axios 报道，直接原因是特朗普的 AI 顾问大卫·萨克斯、Meta 的扎克伯格和 xAI 的马斯克都强烈反对，在签字前夜到当天上午分别游说了特朗普。特朗普本人也一直不喜欢监管，事后对记者说，监管会拖慢美国 AI 的领先速度。

草案里还有一个细节：让财政部在安全漏洞出现时介入。这个条款如果落地，等于给 AI 安全开了财政干预的口子。现在整份命令被叫停，监管派和安全派这一轮算是输了。

智谱把旗舰模型跑到 400 tokens/s，但快是快了，稳不稳还不知道

智谱在 5 月 22 日给部分企业客户开放了 GLM-5.1-highspeed 接口，输出速度标称 400 tokens/s，说是目前大模型厂商里最快的。

过去跑得快的模型通常能力会打折，这次智谱声称把旗舰模型的能力和低延迟同时塞进了生产环境。提速主要靠 GLM 团队和 TileRT 团队在三个层面做的系统优化：推理引擎重写了核心路径来提升单卡吞吐、调度层做了动态批处理、模型层可能用了量化或蒸馏。

但正文没提具体能力测试和价格。快是快了，稳不稳、贵不贵还得看实测。400 tokens/s 这个数字如果真能在生产环境稳定跑，对实时对话、代码补全这类场景是实打实的提升。但如果能力打折或者价格翻倍，那就只是另一个"高速但阉割"的选项。

加州把 AI 抢饭碗正式摆上政策桌面，重点不是拦着而是怎么分钱

加州州长纽森签了一份行政令，要求州政府各部门研究遣散费、失业保险和员工持股这类保障措施。背后的判断是：AI 不是一次性端掉整个岗位，而是一点点替代具体任务。

为此会建一个劳动力数据看板，争取更早看到哪些行业在受冲击。政策核心是想把 AI 省下来的钱，通过股权或薪酬补贴分回给员工。

正文也承认，光靠职业培训可能解决不了岗位被彻底替代后的就业错配。这个表态挺实在——不是"培训一下就能转型"那种敷衍，而是承认有些岗位可能真的回不来了。

同一天，Intuit 宣布裁员超过 3000 人，约占全球员工总数的 10%，理由就是战略重组、聚焦 AI。Cloudflare 的 CEO 也在《华尔街日报》上写了篇文章，讲怎么决定用 AI 替代哪些员工。这几件事放在一起看，加州这份行政令不是超前焦虑，是已经开始追着现实跑了。

腾讯开源翻译模型，1.8B 版本压到 440MB 能直接在手机上跑

腾讯放出了 Hy-MT2 多语言翻译模型，支持 33 种语言互译。7B 和 30B-A3B 两个版本在开源模型里翻译质量最好，比很多参数大几十倍的模型还强。

更实用的是 1.8B 轻量版，用 AngelSlim 1.25-bit 量化技术把体积压到 440MB，主流手机芯片就能本地跑，推理速度比上一代快 1.5 倍。官方说这个轻量版性能超过了微软等商业翻译 API。

如果这个性能声明在第三方测试里能复现，440MB 的离线翻译模型对旅行、隐私敏感场景、边缘设备部署都是实打实的好消息。但"超过商业 API"这个说法需要看具体测试集和语种覆盖，先别太激动。

今日小信号

OpenAI Codex 的 /goal 模式转正了：AI 能自己跑几小时甚至几天的任务，中间可以随时看进度、改方向或暂停。但缺少稳定性数据和实际跑通案例。
Codex 还能远程操控锁屏 Mac 了：OpenAI 说手机就能指挥锁屏黑屏的 Mac 干活，但只给了一个文档链接，权限边界、收费和上线时间都没提。
Cursor 复盘云端智能体踩坑史：最大的教训是开发环境本身就是产品。模型缺个依赖不会报错，只会悄悄变笨。他们后来迁到 Temporal 上，可靠性从 99% 拉到 99.9% 以上，每天处理超 5000 万次操作。
Runway 上线 Aleph 2.0 和 Edit Studio：把生成、剪辑、后期塞进一个平台，主打用自然语言改视频还能先预览。但缺少技术参数和定价。
Viggle 上线 3D 格斗游戏：上传照片就能生成可玩的格斗角色，公测免费还送礼品卡。但没提支持哪些平台。