AX 的 AI 日报 · 2026-05-19Google I/O 搜索变天

Google I/O 把搜索框改成了对话框

2026年5月19日

今天 AI 圈被 Google I/O 刷屏了，但最有意思的不是某个模型跑分又高了，是搜索框开始自己干活了。Gemini 3.5 Flash 把搜索入口从敲关键词改成了直接说需求，AI Mode 月活过了 10 亿。另一边，Karpathy 选了 Anthropic 而不是老东家 OpenAI，Kimi 半年融了 39 亿美元估值翻四倍。先来看 Google 这一波。

Google 把搜索框改成了对话框，但速度数据先别太激动

Google I/O 今天最大的动作不是发了多少模型，是把搜索入口从"敲关键词"改成了"直接说完整需求"。底层跑的是新发布的 Gemini 3.5 Flash，官方说速度是 GPT-5.5 的四倍，但没给具体延迟数字——这条我会先打个折，等实测。

交互上，搜索框会动态变大，支持文字、图片、视频、文件甚至语音输入。AI Mode 上线一年后月活过了 10 亿，查询量每季度翻倍，说明用户确实在用，不是 PR 吹出来的。

有意思的是，Google 这次把 AI Overviews 和 AI Mode 整合成了统一的 AI 搜索体验，支持多轮对话和跨模态推理。你扔一张图、一段视频、一个 PDF，它能结合上下文给你定制化回答。这跟传统搜索的逻辑已经完全不同了——以前是你问它找，现在是它帮你理。

但"速度是 GPT-5.5 的四倍"这个说法，没给延迟数据、没给测试条件、没给对比基准。Google 自己的 Antigravity 平台上能快 12 倍，但那是自家优化过的环境。真实用户端到端的响应时间，现在还不知道。

Gemini 3.5 Flash 专为跑流程设计，但缺任务成功率

Google 这次掏出的 Gemini 3.5 系列第一个模型 Flash，定位很明确：让模型进业务流程干活，处理那种步骤多、周期长的任务。在 Terminal-Bench 和 MCP Atlas 这两个考编程和代理能力的测试里，分数压过了自家上一代 3.1 Pro。

速度方面，比别家顶尖模型快 4 倍，放自家 Antigravity 上能快 12 倍。但跟搜索那条一样，缺少具体延迟数字和任务成功率。跑得快不代表跑得对，代理场景里准确率比速度重要得多。

Jeff Dean 在大会上强调了"行动能力"，意思是模型不只是回答问题，是能实际操作工具、调用 API、完成多步骤任务。这个方向没错，但产品化程度现在看不出来。

Antigravity 2.0：93 个智能体 12 小时拼出一个操作系统，不到 1000 美元

这条数字很炸，但演示不等于产品化，先打七折看。Google 在 I/O 上放出了 Antigravity 2.0 平台，现场演示让智能体从零构建了一个能跑起来的操作系统，只用了 12 小时。

具体做法是同时跑 93 个子智能体，总共调了超过 1.5 万次模型、处理了 26 亿个 token，最后算下来 API 成本不到 1000 美元。平台集成了新的智能体系统和自然语音交互，已经对全球用户开放。

如果这个数字能复现，意味着复杂软件工程的自动化成本正在降到"一顿饭钱"级别。但演示环境是可控的，真实项目里需求变更、遗留代码、安全合规这些坑，93 个智能体能不能填，现在不知道。

Gemini Omni：一句话改视频挺直观，但缺性能数据

Google 推出了 Gemini Omni，这是 Gemini 家族目前能力最全的版本，能同时处理文字、图片、音频和视频，并直接生成这些格式的内容。现场演示了对话式视频编辑，用户说句话就能换掉视频里的角色或背景。

先放出来的是速度更快的 Gemini Omni Flash，已经在 Gemini App、Google Flow 和 YouTube Shorts 上线。Sundar Pichai 说它"结合了对物理的直观理解与 Gemini 在历史、科学和文化背景方面的知识"。

但缺少任何性能数据或成本信息。视频生成的推理成本比文本高几个数量级，如果定价没出来，开发者没法做预算。目前更像一个 demo，离真正能用还有距离。

Karpathy 去了 Anthropic，没提具体做什么

Andrej Karpathy 发推说自己加入了 Anthropic。他之前管过特斯拉 Autopilot 的 AI，也是 OpenAI 的联合创始人，2024 年彻底离开 OpenAI 后去做了 AI 教育创业项目 Eureka Labs。

这次选 Anthropic 而不是老东家，对 OpenAI 来说算是一次明显的人才流失。连 Elon Musk 都忍不住在 X 上称赞 Anthropic。

但正文没写他在 Anthropic 的具体职位、负责哪个方向、带不带团队。光看这条推，只能确认人才往 AI 安全那边又挪了一步，实际影响有多大，现在判断还太早。

Kimi 半年融了 39 亿美元，估值翻四倍，新股东里出现了国资

月之暗面 Kimi 正在进行一笔 20 亿美元（约 136 亿人民币）的融资，已接近收尾。新股东名单里出现了国智投、北京人工智能基金等国资机构，以及中国移动这样的央企。

今年 1 月和 2 月，Kimi 已经密集完成了三轮融资，分别拿了 5 亿、7 亿和 7 亿美元。加上最新这笔，不到半年融资总额超过 39 亿美元，估值比去年 11 月的约 43 亿美元翻了四倍多。

钱是到位了，但商业化能不能跑通，正文没提。国内大模型 to C 产品的付费转化一直是难题，Kimi 的用户增长和留存数据现在看不到。

微软前高管开撕：Copilot 付费用户实际使用率不到 3%

微软前 Windows AI 合作总监 Matt Veloso 跳出来说了几个扎心数字：2023 到 2025 年，微软靠和 OpenAI 的合作赚了约 300 亿美元，但搭进去的成本高达 1000 亿美元。更惨的是 Copilot，虽然到处预装，付费用户里真正在用的不到 3%。

他还提到，微软在必应搜索上砸了重金做 AI 化，市场份额纹丝不动。内部已经要求部分团队在 2026 年 6 月底前停用 Claude Code，统一改用 GitHub Copilot CLI，表面理由是统一工具链，实际更像省钱和锁客。

3% 这个数字比单纯说亏钱更扎心。Copilot 是微软 AI 战略的旗舰产品，如果付费用户都不怎么用，说明产品价值没传达到位，或者用户根本没找到必须用的场景。

今日小信号

NVIDIA 开源 LongLive 2.0：用 4-bit 量化在 50 亿参数模型上跑到每秒 45.7 帧，比很多短视频方案还快。但正文没写最长能生成几分钟、显存吃多少，先别太激动。
Claude 推出自托管沙箱：代理可以在你自己的安全边界里运行，默认就用你设好的安全策略。MCP 隧道还是研究预览版，正文没细说怎么用。
OpenAI 给 YC 每家创业公司 200 万美元 API 额度换股权：正文没写占股比例和额度有效期，这招有点像当年 Yuri Milner 给每家创业公司投钱的打法，只不过这次 OpenAI 给的是 API 额度不是现金。
ChatGPT 图像生成周用量冲到 15 亿次：OpenAI 自己发推说的，但缺少任何用例或技术细节，更像一次 PR 报数。
Qwen3.7-Max 发布：在 Terminal Bench 2.0 上拿了 69.7 分，比 DeepSeek-V4-Pro Max 高 1.8 分，但缺少上下文长度、定价和 API 开放时间。