ax@ax-radar:~/daily/2026-06-08 $ cat newsletter/daily/2026-06-08.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-06-08上市与速度

OpenAI 交表上市,小米把 1T 模型跑进 1000 token/s

今天 AI 圈两条线同时跑:一条是 OpenAI 秘密交表准备上市,另一条是小米把 1 万亿参数模型在单台 8 卡机器上推到每秒 1000 token 以上。中间还夹着微信 AI 开始内测、苹果把 Gemini 接进自家框架、以及 Cognition 用 150 道手工题给编程模型泼了盆冷水——最强模型代码合并通过率只有 13.4%。先看 OpenAI 这一笔。

OpenAI 秘密交表,但高管拿多少钱现在还看不到

OpenAI 本周一向 SEC 秘密提交了 S-1 草案,正式启动 IPO。Anthropic 在 6 月 1 号也交了同样的文件。两家前后脚交表,但因为是秘密提交,高管薪酬、业务风险、收入结构这些关键信息现在全都看不到。

同一天,Sam Altman 和首席科学家帕霍茨基联合发了篇博客,宣布 OpenAI 进入"第三阶段"。三个目标:先造出能自动做研究的 AI 研究员,再用它加速科学和产品开发,最后给每个人配一个个人 AGI,帮你处理工作、学习、写代码、做生意、健康文书和日常决策。时间节点定在 2028 年 3 月

坦率地讲,这篇博客更像愿景声明,不是路线图。怎么验证目标是否达成、花多少钱、安全措施和失败预案,正文一个字没提。Altman 画了张 2028 年的饼,但上市文件里真正关键的数字现在还锁在 SEC 的柜子里。

有意思的是,Altman 另一家公司 Tools for Humanity 正在裁员,原因是营收不行。这家估值 25 亿美元的公司主打项目叫 World,靠一个银色球形扫描仪采集虹膜来验证真人身份,顺带发自己的加密货币 Worldcoin。一边是 OpenAI 准备上市,一边是扫眼球发币的公司赚不到钱在裁人,这对比挺说明问题。

小米把 1T 模型跑进 1000 token/s,但 API 价格是原版 3 倍

小米 MiMo 联合 TileRT 给 1 万亿参数的 MoE 模型加了个 UltraSpeed 模式,输出速度首次超过 1000 tokens/s,只用了单台标准 8-GPGPU 节点——不是 Cerebras 或 Groq 那种专用硬件方案。

技术上有几个点值得看。模型这边用了 FP4 混合量化,只量化 MoE 的 Expert 部分,搭配 DFlash 的块级 masked 并行推测解码。coding 场景下平均一次能接受 6.30 个 token,相当于猜对的命中率不低。

但价格不便宜。UltraSpeed API 定价是原版的 3 倍,目前限免两周(6 月 8 日到 23 日),企业可以邮件联系申请。输出体验提升约 10 倍,但成本也翻了三倍,这笔账得自己算。

Cognition 用 150 道手工题给编程模型泼了盆冷水

Cognition 搞了个叫 FrontierCode 的编程评测,找了 20 多位资深开源维护者手工出了 150 道题,每道题平均花 40 小时以上,还配了 3000 多条审核规则。核心标准就一个:维护者看完代码愿不愿意合入主分支。

他们直接点名 SWE-Bench 这类老评测,说里面超半数通过的代码其实是没法维护的垃圾。结果挺惨淡:Claude Opus 4.8GPT-5.5 在最高难度档通过率只有 13.4%,近九成代码维护者看不上。

这个数字比很多 benchmark 上 80%、90% 的分数诚实得多。它暴露的不是模型能不能写代码,而是写出来的代码能不能进真实项目。13.4% 的合并通过率意味着,即使最强模型,在资深维护者眼里大部分产出还是"重写吧"。

微信 AI 开始内测,两种模式让小程序被 AI 直接操作

微信开放平台发了接入指引,确认微信 AI 在内测。开发者可以选两种模式:自动模式是授权平台读小程序源码,不用额外开发,AI 就能分析页面并直接操作;开发模式是自己写技能提交审核,让 AI 调用。两种模式不冲突,可以同时开,也不影响现有小程序服务。

同时,微信还在灰度测试一个右滑就能呼出的 AI 助手,用自然语言指令直接调用数百万个小程序,比如帮你点咖啡。微信还跟 华为、荣耀、小米、OPPO、vivo 合作,让手机系统助手也能跨应用调微信的服务,6 月 8 号已经放出了开发者接入指引。

官方说"微信 AI"这个名字可能还会改。接入规模、具体技术实现和开放程度目前还看不到完整细节,但方向很清楚:微信想把 AI 塞进用户和小程序之间的每一个入口。

苹果把 Gemini 接进自家框架,但 Siri AI 在欧盟跳票了

苹果在 WWDC 上宣布了两件事,一件开放,一件被卡。

开放的是:苹果专门设计了一套新架构,把谷歌的 Gemini 模型深度整合进自家生态。Anthropic 也同步发了 Swift 包,让 Claude 直接接入苹果的 Foundation Models 框架,开发者写三行代码就能调用,返回的是 Swift 原生类型,不用自己解析 JSON。支持多步推理、代码生成、联网搜索和数据分析,但要求 iOS 27 起步,老设备用不了。

被卡的是:苹果发了一篇简短声明,说因为欧盟《数字市场法》(DMA),Siri 的新 AI 功能不会随 iOS 27 和 iPadOS 27 一起在欧盟推出。具体哪些功能被拦、什么时候能在欧盟上线,正文一个字都没提。

苹果同时发布了第三代 Apple Foundation Models(AFM),与 Google 合作定制,包含五个模型,覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。隐私是核心设计原则,但具体模型参数量、性能基准和上线时间表都还没公布。

面壁开源 VoxCPM2,200 万小时数据训练,能说 30 种语言和 9 种方言

OpenBMB 把 VoxCPM2 的技术报告和模型都放出来了,Apache 2.0 协议。这是个 20 亿参数的语音生成模型,用超过 200 万小时的多语言语音数据训练,能说 30 种语言9 种中文方言

它主要干三件事:按自然语言指令设计语音、可控地克隆声音,以及高保真地延续一段语音。技术方案上,它把语音拆成两步走——先用 16kHz 做语义编码,再用 48kHz 做波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具全部开源,可以直接商用。

200 万小时训练数据这个量级,加上 Apache 2.0 协议,对做语音产品的团队来说是个实在的礼物。

今日小信号

  • 高德发布 ABot-Earth0.5:号称全球首个原生 3D 城市世界模型,一张卫星图 10 分钟生成公里级 3D 城市场景,成本号称只要传统的 1%。已覆盖 190 多个国家和地区,输出 3DGS 格式能直接拖进 Unity。但"全球首个"和"覆盖 190 国"的说法缺少技术细节,先当 demo 看。

  • 马斯克要把数据中心搬上天:SpaceX 公布 AI1 轨道 AI 数据中心卫星方案,每颗卫星持续算力约 120 kW,往返延迟 6-8 毫秒。但散热和发射成本这两座大山,正文一个数字都没提。

  • Hivemind 让编程助手互相抄作业:自动收集 Claude Code、Codex 等助手的操作轨迹,把成功套路存成技能共享。Claude Code 准确率涨了 19.1 分,Codex 涨了 24.8 分。但正文没提测试集规模和任务类型,效果先打个折。

  • NotebookLM 升级:对话里能直接跑多步骤任务,推理能力升级,新增一批输出格式。但具体格式、价格和普通用户上线时间都没说。

  • 工信部和国资委发通知:2026 年底前人形机器人要进真实场景干活,万台落地。但正文没提钱从哪来,成本谁扛。

更多

频道

后台