ax@ax-radar:~/daily/2026-04-25 $ cat newsletter/daily/2026-04-25.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-04-25DeepSeek V4 开源日

DeepSeek V4 开源,华为芯片能跑了

今天 AI 圈最热闹的事是 DeepSeek V4 终于发了,两个型号,能跑在华为昇腾芯片上,API 还打了 2.5 折。但更值得看的是几条暗线:OpenAI 为枪击案道歉、一个 23 岁年轻人用 ChatGPT 解了 60 年数学难题、Anthropic 让 AI 代理互相买卖二手物品。先来看 DeepSeek 这一波。

DeepSeek V4 发了两个型号,最大看点是能跑华为芯片

DeepSeek V4 今天正式发了预览版,一共两个型号:V4 Pro 总参数 1.6 万亿,每次激活 490 亿V4 Flash 总参数 2840 亿,激活 130 亿。两个模型都支持 100 万 token 上下文,用了新的混合稀疏注意力机制,相比 V3.2,长文本处理时计算量只要 27%,显存占用只要 10%

但这次最值得看的不是参数,是芯片。DeepSeek 明确说 V4 能在华为昇腾芯片上跑。彭博之前报道 V4 延迟发布就是因为转向国产芯片,现在看这个转向已经落地了。对国内开发者来说,这会让不用非得抢英伟达的卡才能跑最新模型。

API 定价也很有意思。Pro 版百万 token 输出成本只要 6 元,而且从现在到 5 月 5 日还有 2.5 折优惠。这个价格比 Claude Opus 4.

6 便宜一个数量级,测评显示性能跟 Opus 4.6 基本持平。SGLang 和 Miles 团队在发布当天就接好了推理和 RL 训练适配,首发即用,不用等。

不过有一点要打折:这是预览版,不是正式版。技术报告和权重都发了,但生产环境的稳定性还没经过大规模验证。价格便宜是真便宜,但能不能稳定跑、会不会有隐藏的成本边界,还得看接下来几周的实际使用反馈。

OpenAI 为枪击案道歉,事前封了凶手账号但没报警

这条比较沉重。Sam Altman 给加拿大 Tumbler Ridge 镇的居民写了一封道歉信。事情是:18 岁的 Jesse Van Rootselaar 被警方认定为一起大规模枪击案的嫌疑人,造成 8 人死亡。而 OpenAI 早在 2025 年 6 月就发现她的 ChatGPT 账号在聊枪支暴力内容,当时就封了号。

内部员工争论过要不要报警,最后选择了沉默。道歉信承认了这一点,但没解释为什么内部争论后还是没报警。

这事戳破了一个尴尬的现实:AI 公司在内容审核上能发现风险信号,但从"发现"到"行动"之间,缺了一条明确的红线。OpenAI 封号是做了内容审核该做的事,但面对可能的人身伤害威胁,封号够不够?内部争论过说明有人觉得不够,但决策机制没让"报警"成为选项。这个缺口不是 OpenAI 一家的问题,整个行业都没想清楚。

23 岁年轻人用 ChatGPT 一条提示词解了 60 年数学难题

这条我会先打个折,但故事本身确实挺有意思。Liam Price 没有高等数学背景,靠 ChatGPT ProGPT-5.4 Pro 模型,只输入了一次提示词,就给出了一个关于"原始集合"的 Erdős 猜想的证明,贴在了 erdosproblems.com 上。

这道题问的是:当集合里的数都很大时,Erdős 和的下限到底是多少。此前包括陶哲轩在内的数学家都卡在思路上,集体在第一步拐错了弯。Price 的证明绕开了这个弯。

但先别太激动。上游报道缺了几个关键信息:完整猜想是什么、证明有没有经过同行评审、Price 的提示词具体是什么。一个没受过专业训练的人用 AI 解出 60 年难题,这事如果经过同行评审确认,确实是个标志性事件。但在那之前,它更像一个"AI 辅助数学发现"的有趣案例,而不是"AI 替代数学家"的证据。

Anthropic 让 69 个员工用 AI 代理互相买卖二手物品

Anthropic 做了个叫 Project Deal 的内部实验:69 名员工每人领 100 美元预算,让 AI 代理替他们在二手市场里买卖真实物品。最终成了 186 笔交易,总金额超过 4000 美元

实验同时跑了四个市场,分别用不同水平的模型。用更聪明模型代理的用户,成交结果确实更好,但用户自己没感觉出来——Anthropic 管这叫"代理溢价盲区"。

这个实验有意思的地方不在交易量,在它碰到了一个真问题:当 AI 代理替你做事时,你根本不知道它做得好不好。模型能力提升带来的收益,用户感知不到。这会让代理产品的用户体验设计会很难做——你怎么让用户信任一个他们看不懂的代理?

Cohere 吞下德国 Aleph Alpha,背后是 Lidl 母公司的钱

加拿大 AI 公司 Cohere 正在收购德国的 Aleph Alpha,两家政府都点了头。Cohere 上一轮估值 68 亿美元,这次交易由 Lidl 母公司 Schwarz Group 出钱撑腰,但具体收购价没公布。

合并后的新公司主打"主权 AI"——企业数据不用经过微软或谷歌的服务器,自己完全掌控。两家虽然都是各自国家的"本土 AI 希望",但单独跟 OpenAI、Anthropic 抢客户都吃力。合并后至少在欧洲市场有了一个更完整的"非美国云"选项。

不过收购价没公布,先别急着算账。主权 AI 的卖点能不能转化成实际客户,还得看欧洲企业买不买账。

别把 AI 代理当同事,把它嵌进软件里

今天有两篇文章在说同一件事,角度不同但结论很近。

Feldera 的联合创始人 Gerd Zellweger 认为,现在流行的 AI 代理太像人了:爱解释、爱总结、需要来回对话,用起来很累。他提出应该把代理嵌入现有软件,让它安静地在后台干活。给了三种集成模式:命令行接口、声明式配置、以及像 Kubernetes 控制器那样的自主循环。

另一篇来自 Mark Nottingham,他直接戳破"AI 代理为你工作"这个说法。他列了 8 个互联网信任崩塌的真实案例,其中一个是微软新版 Outlook 会偷偷把第三方邮箱密码传到自家云端,再分给 700 多个数据伙伴。核心问题不是模型不够聪明,而是当软件能替你做事时,它到底在替谁做事。

两篇放在一起看,结论很清楚:代理的方向不是更像人,是更不像人。安静、可审计、边界清晰,比能聊天重要得多。

今日小信号

  • OpenAI 悬赏 2.5 万美元找能一次绕过 GPT-5.5 五道生物风险题的提示词,条件很严:干净对话、不触发审核。但没公布这五道题具体有多难,也没说部分成功的奖金给多少。
  • llama.cpp 终于支持 FP4 推理了,NVFP4 和 MXFP4 两种格式落地。理论上能让大模型在更低端显卡上跑起来,但速度、显存占用和硬件支持全没披露——正文被 Reddit 登录墙挡住了。
  • 单张 RTX 5090 跑 Qwen3.6-27B,实测生成速度约每秒 80 个 token,上下文窗口开到 218k。对 27B 模型来说速度不错,长文档场景下延迟可控。
  • Wuphf 是个开源项目,让多个 AI 模型通过 Markdown 文件和 Git 共享上下文协同干活。想法挺野,但 GitHub 上只有 94 颗星,说明还早。
  • 缅因州州长否决了全州数据中心暂停令,但 AI 基建的瓶颈正从芯片转向州级电网政治。

更多

频道

后台