今天 AI 圈在拼账本,不是模型
今天 AI 圈最有意思的不在某个模型又能写代码了,是几张账本同时翻动:DeepSeek 在谈 700 亿首轮融资、Anthropic 提前两年盈利、Intuit 裁 3000 人转投 AI、加州开始研究 AI 抢饭碗怎么赔。先来看 DeepSeek 这一笔。
DeepSeek 700 亿首轮融资,梁文锋自己掏 200 亿还承诺继续开源
这条数字大到需要先喘口气——700 亿元人民币,DeepSeek 正在敲定首轮外部融资,投前估值约 450 亿美元。如果落地,这将是中国科技初创公司首轮融资的最高纪录。
更值得看的是结构。腾讯、IDG 资本和砺思资本接近参投,而创始人梁文锋个人也可能注资约 200 亿元。他在投资者会议上明确说了两件事:公司会继续做开源模型,目标是通用人工智能,不急着商业化。
说实话,这个表态在现在的融资环境里挺少见。大部分公司拿大钱的时候都会开始谈商业化路径、谈收入模型,但梁文锋直接把这条路堵上了——至少公开层面是这样。
不过文章也提到,具体金额和最终参投方还没锁。700 亿这个数字目前是"接近敲定",不是"已到账"。我会先打个折,等正式公告。
Anthropic 提前两年盈利,但新模型分词器让成本偷偷涨了 12-30%
华尔街日报的消息,Anthropic 二季度营收预计冲到 109 亿美元,同比增长 130%,运营利润约 5.59 亿美元。去年夏天他们自己还说最早 2028 年才能盈利,现在提前了两年。
增长主要靠两件事:编程工具被大量公司用起来,Claude 开始接那种能自己跑一段时间的"干活型"任务。需求大到算力一度不够用,逼着 Anthropic 去签新数据中心合同。
但有个细节值得留意——新模型的分词器让实际成本涨了 12-30%。这个数字不在营收报表里,但在使用成本上很真实。也就是说,Anthropic 赚钱了,但用户用新模型的成本也在涨。这两件事不矛盾,但放在一起看更有意思。
特朗普临阵叫停 AI 安全评估令,马斯克和扎克伯格连夜游说
这条的戏剧性在时间线上。特朗普在签字仪式前几小时突然取消了一份 AI 行政令,原本这份命令要求政府在 AI 模型公开发布前先做安全评估。
据 Axios 报道,直接原因是特朗普的 AI 顾问大卫·萨克斯、Meta 的扎克伯格和 xAI 的马斯克都强烈反对,在签字前夜到当天上午分别游说了特朗普。特朗普本人也一直不喜欢监管,事后对记者说,监管会拖慢美国 AI 的领先速度。
草案里还有一个细节:让财政部在安全漏洞出现时介入。这个条款如果落地,等于给 AI 安全开了财政干预的口子。现在整份命令被叫停,监管派和安全派这一轮算是输了。
智谱把旗舰模型跑到 400 tokens/s,但快是快了,稳不稳还不知道
智谱在 5 月 22 日给部分企业客户开放了 GLM-5.1-highspeed 接口,输出速度标称 400 tokens/s,说是目前大模型厂商里最快的。
过去跑得快的模型通常能力会打折,这次智谱声称把旗舰模型的能力和低延迟同时塞进了生产环境。提速主要靠 GLM 团队和 TileRT 团队在三个层面做的系统优化:推理引擎重写了核心路径来提升单卡吞吐、调度层做了动态批处理、模型层可能用了量化或蒸馏。
但正文没提具体能力测试和价格。快是快了,稳不稳、贵不贵还得看实测。400 tokens/s 这个数字如果真能在生产环境稳定跑,对实时对话、代码补全这类场景是实打实的提升。但如果能力打折或者价格翻倍,那就只是另一个"高速但阉割"的选项。
加州把 AI 抢饭碗正式摆上政策桌面,重点不是拦着而是怎么分钱
加州州长纽森签了一份行政令,要求州政府各部门研究遣散费、失业保险和员工持股这类保障措施。背后的判断是:AI 不是一次性端掉整个岗位,而是一点点替代具体任务。
为此会建一个劳动力数据看板,争取更早看到哪些行业在受冲击。政策核心是想把 AI 省下来的钱,通过股权或薪酬补贴分回给员工。
正文也承认,光靠职业培训可能解决不了岗位被彻底替代后的就业错配。这个表态挺实在——不是"培训一下就能转型"那种敷衍,而是承认有些岗位可能真的回不来了。
同一天,Intuit 宣布裁员超过 3000 人,约占全球员工总数的 10%,理由就是战略重组、聚焦 AI。Cloudflare 的 CEO 也在《华尔街日报》上写了篇文章,讲怎么决定用 AI 替代哪些员工。这几件事放在一起看,加州这份行政令不是超前焦虑,是已经开始追着现实跑了。
腾讯开源翻译模型,1.8B 版本压到 440MB 能直接在手机上跑
腾讯放出了 Hy-MT2 多语言翻译模型,支持 33 种语言互译。7B 和 30B-A3B 两个版本在开源模型里翻译质量最好,比很多参数大几十倍的模型还强。
更实用的是 1.8B 轻量版,用 AngelSlim 1.25-bit 量化技术把体积压到 440MB,主流手机芯片就能本地跑,推理速度比上一代快 1.5 倍。官方说这个轻量版性能超过了微软等商业翻译 API。
如果这个性能声明在第三方测试里能复现,440MB 的离线翻译模型对旅行、隐私敏感场景、边缘设备部署都是实打实的好消息。但"超过商业 API"这个说法需要看具体测试集和语种覆盖,先别太激动。
今日小信号
- OpenAI Codex 的 /goal 模式转正了:AI 能自己跑几小时甚至几天的任务,中间可以随时看进度、改方向或暂停。但缺少稳定性数据和实际跑通案例。
- Codex 还能远程操控锁屏 Mac 了:OpenAI 说手机就能指挥锁屏黑屏的 Mac 干活,但只给了一个文档链接,权限边界、收费和上线时间都没提。
- Cursor 复盘云端智能体踩坑史:最大的教训是开发环境本身就是产品。模型缺个依赖不会报错,只会悄悄变笨。他们后来迁到 Temporal 上,可靠性从 99% 拉到 99.9% 以上,每天处理超 5000 万次操作。
- Runway 上线 Aleph 2.0 和 Edit Studio:把生成、剪辑、后期塞进一个平台,主打用自然语言改视频还能先预览。但缺少技术参数和定价。
- Viggle 上线 3D 格斗游戏:上传照片就能生成可玩的格斗角色,公测免费还送礼品卡。但没提支持哪些平台。