AX 的 AI 日报 · 2026-06-08上市与速度

OpenAI 交表上市，小米把 1T 模型跑进 1000 token/s

2026年6月8日

今天 AI 圈两条线同时跑：一条是 OpenAI 秘密交表准备上市，另一条是小米把 1 万亿参数模型在单台 8 卡机器上推到每秒 1000 token 以上。中间还夹着微信 AI 开始内测、苹果把 Gemini 接进自家框架、以及 Cognition 用 150 道手工题给编程模型泼了盆冷水——最强模型代码合并通过率只有 13.4%。先看 OpenAI 这一笔。

OpenAI 秘密交表，但高管拿多少钱现在还看不到

OpenAI 本周一向 SEC 秘密提交了 S-1 草案，正式启动 IPO。Anthropic 在 6 月 1 号也交了同样的文件。两家前后脚交表，但因为是秘密提交，高管薪酬、业务风险、收入结构这些关键信息现在全都看不到。

同一天，Sam Altman 和首席科学家帕霍茨基联合发了篇博客，宣布 OpenAI 进入"第三阶段"。三个目标：先造出能自动做研究的 AI 研究员，再用它加速科学和产品开发，最后给每个人配一个个人 AGI，帮你处理工作、学习、写代码、做生意、健康文书和日常决策。时间节点定在 2028 年 3 月。

坦率地讲，这篇博客更像愿景声明，不是路线图。怎么验证目标是否达成、花多少钱、安全措施和失败预案，正文一个字没提。Altman 画了张 2028 年的饼，但上市文件里真正关键的数字现在还锁在 SEC 的柜子里。

有意思的是，Altman 另一家公司 Tools for Humanity 正在裁员，原因是营收不行。这家估值 25 亿美元的公司主打项目叫 World，靠一个银色球形扫描仪采集虹膜来验证真人身份，顺带发自己的加密货币 Worldcoin。一边是 OpenAI 准备上市，一边是扫眼球发币的公司赚不到钱在裁人，这对比挺说明问题。

小米把 1T 模型跑进 1000 token/s，但 API 价格是原版 3 倍

小米 MiMo 联合 TileRT 给 1 万亿参数的 MoE 模型加了个 UltraSpeed 模式，输出速度首次超过 1000 tokens/s，只用了单台标准 8-GPGPU 节点——不是 Cerebras 或 Groq 那种专用硬件方案。

技术上有几个点值得看。模型这边用了 FP4 混合量化，只量化 MoE 的 Expert 部分，搭配 DFlash 的块级 masked 并行推测解码。coding 场景下平均一次能接受 6.30 个 token，相当于猜对的命中率不低。

但价格不便宜。UltraSpeed API 定价是原版的 3 倍，目前限免两周（6 月 8 日到 23 日），企业可以邮件联系申请。输出体验提升约 10 倍，但成本也翻了三倍，这笔账得自己算。

Cognition 用 150 道手工题给编程模型泼了盆冷水

Cognition 搞了个叫 FrontierCode 的编程评测，找了 20 多位资深开源维护者手工出了 150 道题，每道题平均花 40 小时以上，还配了 3000 多条审核规则。核心标准就一个：维护者看完代码愿不愿意合入主分支。

他们直接点名 SWE-Bench 这类老评测，说里面超半数通过的代码其实是没法维护的垃圾。结果挺惨淡：Claude Opus 4.8 和 GPT-5.5 在最高难度档通过率只有 13.4%，近九成代码维护者看不上。

这个数字比很多 benchmark 上 80%、90% 的分数诚实得多。它暴露的不是模型能不能写代码，而是写出来的代码能不能进真实项目。13.4% 的合并通过率意味着，即使最强模型，在资深维护者眼里大部分产出还是"重写吧"。

微信 AI 开始内测，两种模式让小程序被 AI 直接操作

微信开放平台发了接入指引，确认微信 AI 在内测。开发者可以选两种模式：自动模式是授权平台读小程序源码，不用额外开发，AI 就能分析页面并直接操作；开发模式是自己写技能提交审核，让 AI 调用。两种模式不冲突，可以同时开，也不影响现有小程序服务。

同时，微信还在灰度测试一个右滑就能呼出的 AI 助手，用自然语言指令直接调用数百万个小程序，比如帮你点咖啡。微信还跟 华为、荣耀、小米、OPPO、vivo 合作，让手机系统助手也能跨应用调微信的服务，6 月 8 号已经放出了开发者接入指引。

官方说"微信 AI"这个名字可能还会改。接入规模、具体技术实现和开放程度目前还看不到完整细节，但方向很清楚：微信想把 AI 塞进用户和小程序之间的每一个入口。

苹果把 Gemini 接进自家框架，但 Siri AI 在欧盟跳票了

苹果在 WWDC 上宣布了两件事，一件开放，一件被卡。

开放的是：苹果专门设计了一套新架构，把谷歌的 Gemini 模型深度整合进自家生态。Anthropic 也同步发了 Swift 包，让 Claude 直接接入苹果的 Foundation Models 框架，开发者写三行代码就能调用，返回的是 Swift 原生类型，不用自己解析 JSON。支持多步推理、代码生成、联网搜索和数据分析，但要求 iOS 27 起步，老设备用不了。

被卡的是：苹果发了一篇简短声明，说因为欧盟《数字市场法》（DMA），Siri 的新 AI 功能不会随 iOS 27 和 iPadOS 27 一起在欧盟推出。具体哪些功能被拦、什么时候能在欧盟上线，正文一个字都没提。

苹果同时发布了第三代 Apple Foundation Models（AFM），与 Google 合作定制，包含五个模型，覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。隐私是核心设计原则，但具体模型参数量、性能基准和上线时间表都还没公布。

面壁开源 VoxCPM2，200 万小时数据训练，能说 30 种语言和 9 种方言

OpenBMB 把 VoxCPM2 的技术报告和模型都放出来了，Apache 2.0 协议。这是个 20 亿参数的语音生成模型，用超过 200 万小时的多语言语音数据训练，能说 30 种语言和 9 种中文方言。

它主要干三件事：按自然语言指令设计语音、可控地克隆声音，以及高保真地延续一段语音。技术方案上，它把语音拆成两步走——先用 16kHz 做语义编码，再用 48kHz 做波形重建，在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具全部开源，可以直接商用。

200 万小时训练数据这个量级，加上 Apache 2.0 协议，对做语音产品的团队来说是个实在的礼物。

今日小信号

高德发布 ABot-Earth0.5：号称全球首个原生 3D 城市世界模型，一张卫星图 10 分钟生成公里级 3D 城市场景，成本号称只要传统的 1%。已覆盖 190 多个国家和地区，输出 3DGS 格式能直接拖进 Unity。但"全球首个"和"覆盖 190 国"的说法缺少技术细节，先当 demo 看。
马斯克要把数据中心搬上天：SpaceX 公布 AI1 轨道 AI 数据中心卫星方案，每颗卫星持续算力约 120 kW，往返延迟 6-8 毫秒。但散热和发射成本这两座大山，正文一个数字都没提。
Hivemind 让编程助手互相抄作业：自动收集 Claude Code、Codex 等助手的操作轨迹，把成功套路存成技能共享。Claude Code 准确率涨了 19.1 分，Codex 涨了 24.8 分。但正文没提测试集规模和任务类型，效果先打个折。
NotebookLM 升级：对话里能直接跑多步骤任务，推理能力升级，新增一批输出格式。但具体格式、价格和普通用户上线时间都没说。
工信部和国资委发通知：2026 年底前人形机器人要进真实场景干活，万台落地。但正文没提钱从哪来，成本谁扛。