ax@ax-radar:~/daily/2026-05-19 $ cat newsletter/daily/2026-05-19.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-05-19Google I/O 搜索变天

Google I/O 把搜索框改成了对话框

今天 AI 圈被 Google I/O 刷屏了,但最有意思的不是某个模型跑分又高了,是搜索框开始自己干活了。Gemini 3.5 Flash 把搜索入口从敲关键词改成了直接说需求,AI Mode 月活过了 10 亿。另一边,Karpathy 选了 Anthropic 而不是老东家 OpenAI,Kimi 半年融了 39 亿美元估值翻四倍。先来看 Google 这一波。

Google 把搜索框改成了对话框,但速度数据先别太激动

Google I/O 今天最大的动作不是发了多少模型,是把搜索入口从"敲关键词"改成了"直接说完整需求"。底层跑的是新发布的 Gemini 3.5 Flash,官方说速度是 GPT-5.5 的四倍,但没给具体延迟数字——这条我会先打个折,等实测。

交互上,搜索框会动态变大,支持文字、图片、视频、文件甚至语音输入。AI Mode 上线一年后月活过了 10 亿,查询量每季度翻倍,说明用户确实在用,不是 PR 吹出来的。

有意思的是,Google 这次把 AI Overviews 和 AI Mode 整合成了统一的 AI 搜索体验,支持多轮对话和跨模态推理。你扔一张图、一段视频、一个 PDF,它能结合上下文给你定制化回答。这跟传统搜索的逻辑已经完全不同了——以前是你问它找,现在是它帮你理。

但"速度是 GPT-5.5 的四倍"这个说法,没给延迟数据、没给测试条件、没给对比基准。Google 自己的 Antigravity 平台上能快 12 倍,但那是自家优化过的环境。真实用户端到端的响应时间,现在还不知道。

Gemini 3.5 Flash 专为跑流程设计,但缺任务成功率

Google 这次掏出的 Gemini 3.5 系列第一个模型 Flash,定位很明确:让模型进业务流程干活,处理那种步骤多、周期长的任务。在 Terminal-BenchMCP Atlas 这两个考编程和代理能力的测试里,分数压过了自家上一代 3.1 Pro。

速度方面,比别家顶尖模型快 4 倍,放自家 Antigravity 上能快 12 倍。但跟搜索那条一样,缺少具体延迟数字和任务成功率。跑得快不代表跑得对,代理场景里准确率比速度重要得多。

Jeff Dean 在大会上强调了"行动能力",意思是模型不只是回答问题,是能实际操作工具、调用 API、完成多步骤任务。这个方向没错,但产品化程度现在看不出来。

Antigravity 2.0:93 个智能体 12 小时拼出一个操作系统,不到 1000 美元

这条数字很炸,但演示不等于产品化,先打七折看。Google 在 I/O 上放出了 Antigravity 2.0 平台,现场演示让智能体从零构建了一个能跑起来的操作系统,只用了 12 小时

具体做法是同时跑 93 个子智能体,总共调了超过 1.5 万次模型、处理了 26 亿个 token,最后算下来 API 成本不到 1000 美元。平台集成了新的智能体系统和自然语音交互,已经对全球用户开放。

如果这个数字能复现,意味着复杂软件工程的自动化成本正在降到"一顿饭钱"级别。但演示环境是可控的,真实项目里需求变更、遗留代码、安全合规这些坑,93 个智能体能不能填,现在不知道。

Gemini Omni:一句话改视频挺直观,但缺性能数据

Google 推出了 Gemini Omni,这是 Gemini 家族目前能力最全的版本,能同时处理文字、图片、音频和视频,并直接生成这些格式的内容。现场演示了对话式视频编辑,用户说句话就能换掉视频里的角色或背景。

先放出来的是速度更快的 Gemini Omni Flash,已经在 Gemini App、Google Flow 和 YouTube Shorts 上线。Sundar Pichai 说它"结合了对物理的直观理解与 Gemini 在历史、科学和文化背景方面的知识"。

但缺少任何性能数据或成本信息。视频生成的推理成本比文本高几个数量级,如果定价没出来,开发者没法做预算。目前更像一个 demo,离真正能用还有距离。

Karpathy 去了 Anthropic,没提具体做什么

Andrej Karpathy 发推说自己加入了 Anthropic。他之前管过特斯拉 Autopilot 的 AI,也是 OpenAI 的联合创始人,2024 年彻底离开 OpenAI 后去做了 AI 教育创业项目 Eureka Labs。

这次选 Anthropic 而不是老东家,对 OpenAI 来说算是一次明显的人才流失。连 Elon Musk 都忍不住在 X 上称赞 Anthropic。

但正文没写他在 Anthropic 的具体职位、负责哪个方向、带不带团队。光看这条推,只能确认人才往 AI 安全那边又挪了一步,实际影响有多大,现在判断还太早。

Kimi 半年融了 39 亿美元,估值翻四倍,新股东里出现了国资

月之暗面 Kimi 正在进行一笔 20 亿美元(约 136 亿人民币)的融资,已接近收尾。新股东名单里出现了国智投、北京人工智能基金等国资机构,以及中国移动这样的央企。

今年 1 月和 2 月,Kimi 已经密集完成了三轮融资,分别拿了 5 亿、7 亿和 7 亿美元。加上最新这笔,不到半年融资总额超过 39 亿美元,估值比去年 11 月的约 43 亿美元翻了四倍多。

钱是到位了,但商业化能不能跑通,正文没提。国内大模型 to C 产品的付费转化一直是难题,Kimi 的用户增长和留存数据现在看不到。

微软前高管开撕:Copilot 付费用户实际使用率不到 3%

微软前 Windows AI 合作总监 Matt Veloso 跳出来说了几个扎心数字:2023 到 2025 年,微软靠和 OpenAI 的合作赚了约 300 亿美元,但搭进去的成本高达 1000 亿美元。更惨的是 Copilot,虽然到处预装,付费用户里真正在用的不到 3%

他还提到,微软在必应搜索上砸了重金做 AI 化,市场份额纹丝不动。内部已经要求部分团队在 2026 年 6 月底前停用 Claude Code,统一改用 GitHub Copilot CLI,表面理由是统一工具链,实际更像省钱和锁客。

3% 这个数字比单纯说亏钱更扎心。Copilot 是微软 AI 战略的旗舰产品,如果付费用户都不怎么用,说明产品价值没传达到位,或者用户根本没找到必须用的场景。

今日小信号

  • NVIDIA 开源 LongLive 2.0:用 4-bit 量化在 50 亿参数模型上跑到每秒 45.7 帧,比很多短视频方案还快。但正文没写最长能生成几分钟、显存吃多少,先别太激动。
  • Claude 推出自托管沙箱:代理可以在你自己的安全边界里运行,默认就用你设好的安全策略。MCP 隧道还是研究预览版,正文没细说怎么用。
  • OpenAI 给 YC 每家创业公司 200 万美元 API 额度换股权:正文没写占股比例和额度有效期,这招有点像当年 Yuri Milner 给每家创业公司投钱的打法,只不过这次 OpenAI 给的是 API 额度不是现金。
  • ChatGPT 图像生成周用量冲到 15 亿次:OpenAI 自己发推说的,但缺少任何用例或技术细节,更像一次 PR 报数。
  • Qwen3.7-Max 发布:在 Terminal Bench 2.0 上拿了 69.7 分,比 DeepSeek-V4-Pro Max 高 1.8 分,但缺少上下文长度、定价和 API 开放时间。

更多

频道

后台