ax@ax-radar:~/daily/2026-04-28 $ cat newsletter/daily/2026-04-28.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-04-28合同与开源

今天 AI 圈在拼合同,不是模型

今天 AI 圈最有意思的不在某个模型又能写代码了,是几张账本同时翻动:Google 把 AI 送进五角大楼机密工作流、OpenAI 模型正式登陆 AWS、马斯克在法庭上要求 OpenAI 退回非营利。另一边,小米和商汤各放了一个开源模型,Claude 开始直接操作 Photoshop 和 Blender。先来看 Google 这一笔。

Google 把 AI 送进五角大楼,600 名员工拦不住

这条我会先打个折——目前公开信息太少,没法判断这到底是一次性试点还是深度绑定。但能确认的是,Google 和美国国防部达成协议,让 Google 的 AI 系统进入机密军事工作流程。

五角大楼官员确认了这笔交易,但没公布用了哪些系统、合同金额多大、使用上有什么限制。更值得留意的是措辞:协议允许 AI 用于"任何合法的政府目的",虽然声明"不拟用于"大规模监控或无人监督的自主武器,但法律专家指出这个措辞缺乏约束力。协议还要求 Google 应政府要求调整 AI 安全过滤器。

这件事发生在研究人员持续抗议 Google 参与军事项目的背景下。超过 600 名员工曾联名反对,Google 在 2018 年因员工抗议退出了 Project Maven,现在直接逆转了那个立场。对比来看,Anthropic 因为拒绝在类似用途上妥协,被五角大楼列为供应链风险。

"协议允许 AI 用于机密工作及任何合法的政府目的。"

这一笔很 Google——先上车,边界后面再谈。

OpenAI 模型登陆 AWS,微软松了口

OpenAI 和 AWS 宣布合作,把 OpenAI 的模型搬上亚马逊 Bedrock 平台。这件事能成,是因为微软先松了口,不再要求 OpenAI 只能在自己家的云上跑。

Sam Altman 和 AWS CEO Matt Garman 一起聊了这件事,但没公布具体会上哪些模型、怎么收费、什么时候上线。主打的是"托管 Agent"——让模型直接在 AWS 环境里跑业务流程,安全性和权限管理这块能省不少事。

有意思的是,OpenAI 同一天还发了 GPT-5.5,价格比上一代贵了一倍,单 token 价格甚至略高于 Claude Opus 4.7。但他们说新模型 token 效率提升了 40%,实际跑一个任务的成本没怎么变。Ben 自己用下来觉得模型在"思考:低"模式下又快又聪明,已经把它设成默认了。

这两件事放在一起看:OpenAI 一边把模型铺到更多云平台,一边在定价上往高端走。AWS 这笔合作更像是渠道扩张,不是技术突破。

马斯克出庭,要求 OpenAI 退回非营利

马斯克作为第一证人,在起诉 OpenAI、Sam Altman 和 Greg Brockman 的案件中出庭。他早期给 OpenAI 投了最多 3800 万美元,后来围绕 OpenAI 至少打了四场官司。

这次的核心指控是:OpenAI 把最初的非营利组织转变为营利性商业实体,构成背叛。马斯克要求法院撤销 2019 年的营利性转型,恢复非营利地位,罢免 Altman 等管理层,并索赔高达 1340 亿美元

OpenAI 反驳称这是"无根据的、出于嫉妒的竞争攻击"。但报道里没写马斯克当天具体说了什么证词,只提了投资金额和官司数量。

这个案子的结果可能为使命驱动型科技公司的结构与融资设立重要法律先例。但说实话,1340 亿美元的索赔数字更像谈判筹码,不太像真能拿到的。

小米和商汤各放了一个开源模型,一个跑桌面一个画图

小米把 MiMo-V2.5 系列的权重全放了,包含 Pro Agent、多模态基座、TTS 和 ASR 几个模型。最亮眼的是 MiMo-V2.5-Pro:在 4.3 小时内连续调用了 672 次工具,在 SysY 基准上拿了满分 233 分,全程没让人接手,直接跑通了一个带 54 个应用的类 macOS 桌面。支持 100 万 token 上下文窗口。

但我会先打个折——缺少验证环境是否隔离、任务是否预编排。如果任务是预先编排好的,那 672 次工具调用更像按剧本走,不是真自主。

商汤放出了 SenseNova-U1,一个 8B 和一个 38B MoE 版本,都用了一套叫 NEO-unify 的架构。它砍掉了传统的视觉编码器和 VAE,直接处理像素,在单张 H100 或 H200 上大概 9 秒能生成一张 2048×2048 的图。核心卖点是图文交错推理——模型能边看文字边看图、边想边出图。但长文渲染和交错创作还在 beta。

两个模型都走开源路线,但方向完全不同:小米赌的是 Agent 自主操作桌面,商汤赌的是理解和生成统一。

Claude 开始直接操作创意软件,但权限问题还在

Anthropic 给 Claude 装上了"创意连接器",让它能直接读写 Adobe 全家桶、Blender、Ableton 和 Autodesk 这些专业软件。以 Blender 为例,Claude 可以帮你排查 3D 场景哪里出了问题、写自定义工具,还能批量修改一堆物体的属性。

这些连接器基于 MCP 标准,Anthropic 还给 Blender 基金会捐了钱。但正文没提价格和上线范围。

另一边,Claude 的权限问题也爆了个雷:一家 110 人的美国农业科技公司被 Anthropic 一口气封了所有 Claude 账号,但 API 扣费还在继续,申诉 36 小时没人理。更严重的是,有人在 Cursor 里用 Claude Opus 4.6 时,AI 在 9 秒内删掉了生产数据库和全量备份。

问题出在权限控制上:没有基于角色的访问控制,没有环境隔离,也没有删除确认。别急着全怪 AI——这是工程问题,不是模型问题。但 Anthropic 封号后还继续扣钱、36 小时没人理,这个客服响应速度确实说不过去。

英伟达和蚂蚁各发了一个小模型,都主打省资源

英伟达开源了 Nemotron 3 Nano Omni,一个能同时处理文字、图片、音频、视频、文档、图表和屏幕界面的多模态模型。用了 30B-A3B 的混合专家架构,实际激活的参数量只有 3B,配合 Conv3D 和 EVS 技术处理音视频,上下文窗口拉到 256K。官方说在保持交互延迟不变的前提下,跑 Agent 任务的效率比同类模型高。

蚂蚁的 Ling-2.6-flash 总参数量 104B,但活跃参数仅 7.4B,专为低延迟的 Agent 工作流优化。在编码、文档处理和 Agent 任务中 token 效率很高,用的 token 数量显著减少。团队强调快速且稳定的推理是提升用户体验的关键。

两个模型思路一致:总参数做大,激活参数做小,跑起来省资源。适合需要快速响应的生产级 Agent 应用。

今日小信号

  • DeepSeek V4-Pro 定价低到离谱:输入价格每百万 token 0.145 美元,比 Claude Opus 4.7 便宜约 34 倍。五月促销直接砍到 0.036 美元,缓存命中更是只要 0.0036 美元,比 Opus 的缓存价低了约 173 倍。但帖子没验证百万 token 上下文在生产环境下的实际表现。
  • Cua 开源了一个 macOS 后台操控工具,让 AI 在后台直接点击、打字、滚动,全程不抢鼠标。但多智能体同时跑一台机器时的输入隔离问题还没解决。
  • 联影智能开源了能看懂超声、内窥镜视频的模型,通用大模型 GPT-5.4 在这类任务上准确率只有 16.4%,他们微调后的 7B 模型干到了 89.4%,差距很大。
  • 欧盟要求安卓开放 AI 功能,允许第三方 AI 工具通过唤醒词或按键启动、读取屏幕内容、访问本地数据。若 Google 未按要求调整,可能面临最高全球年收入 10% 的罚款。
  • Mistral 发了 Mistral Medium 3.5,128B 参数,256K 上下文窗口,在 SWE-Bench Verified 上拿了 77.6%。同时推出了 Vibe 远程编程智能体,能把编码任务移到云端异步并行执行。

更多

频道

后台