AX 的 AI 日报 · 2026-05-15落地比模型贵

今天 AI 圈在拼落地，不是模型

2026年5月15日

今天 AI 圈最有意思的不在某个模型又刷榜了，是几件事同时指向同一个方向：把 AI 塞进真实流程。Runway 让广告片从对话里长出来、飞书 CLI 45 天万星说明开发者吃“可见可控”这套、OpenSquilla 用智能路由把成本砍了九成。另一边，杨立昆劝博士生别搞 LLM 了，黄仁勋劝 CS 毕业生去当技工——两个卖铲子的人同时说挖金子没那么容易，这事本身就值得看。先聊杨立昆这一出。

杨立昆劝博士生别搞 LLM 了，他自己去赌世界模型

杨立昆在 Unsupervised Learning 播客里把话讲得很直：LLM 这条路有天花板，到 2027 年 纯靠堆语言数据做不出真正的智能。他劝博士生别再往里扎，自己离开 Meta 后创立的 AMI 公司，核心押注在“世界模型”上——让 AI 像人一样通过观察和互动去理解物理世界，而不是只读文本。

有意思的是，他在访谈里跟老搭档 Hinton 和 Bengio 在图灵奖观点上公开分歧，还把 OpenAI 和 Anthropic 比作 Sun Microsystems——这话翻译过来就是：你们现在风光，但架构上有硬伤，迟早被更底层的范式替代。

访谈里缺的是 AMI 具体在做什么、世界模型的技术路线是什么、有没有验证数据。杨立昆的判断一向有前瞻性，但“世界模型”这个概念说了好几年，至今没有能跟 LLM 在实用层面掰手腕的产品。我会先打个折：方向可能对，但时间表没人说得准。

黄仁勋在 CMU 毕业典礼上说：电工水管工比你们有前景

这条跟杨立昆的访谈放在一起看，有种奇怪的对称感。黄仁勋在 卡内基梅隆大学 2026 届计算机科学毕业典礼上直接说，技工的前景比计算机毕业生好。他引了一组数据：Randstad 分析显示技工需求增速是白领的三倍，机器人技术员岗位涨了 107%，而斯坦福研究发现 AI 相关职位的早期就业反而降了 16%。顶级电工年薪能超过 10.6 万美元，还不用背学费贷款。

另一边，科技公司今年砸了 7000 亿美元 建数据中心，全球到 2030 年预计达 7 万亿美元。这些基础设施靠的是人，不是提示工程师。制造业每进 100 个新工人就有 102 人离开，缺口在扩大。

黄仁勋是卖 AI 铲子的人，他劝你别挖金子去修水管——这话从他嘴里说出来，分量不一样。他不是在唱衰 AI，是在说 AI 基建本身会创造比 AI 编程更多的确定性岗位。

Anthropic 估值 9000 亿，五个月翻五倍的收入从哪来

这条数字涨得有点夸张。据 FT 报道，Anthropic 的估值从 2026 年 2 月的 3500 亿美元 涨到 5 月的 9000 亿美元，三个月接近翻了三倍。年度经常性收入从 2025 年底的 90 亿美元 涨到 2026 年 5 月底的 450 亿美元，五个月翻了五倍。

这两个数字说明客户在快速掏钱，市场给的预期也很高。但缺的是收入结构——是靠 API 调用撑起来的，还是大客户长约？利润率多少？客户集中度怎么样？这些都没披露。估值翻三倍、收入翻五倍，如果背后是几个大客户签了长约，那跟广泛的市场 adoption 是两回事。

同时，微软那边也透了底：对 OpenAI 的累计投入已超过 1000 亿美元，包括 130 亿美元 原始投资和大量 Azure 基础设施成本。合作已为微软带来约 300 亿美元 营收。双方续签了非独家协议，微软不再支付收入分成，将 OpenAI 的分成上限设为到 2030 年累计 380 亿美元，比原协议省了约 970 亿美元。纳德拉说微软是在“没人愿意下注”时承担了风险。

这两笔账放在一起看：Anthropic 在快速吸金，微软在重新谈条款省钱。AI 投资正在从“闭眼砸钱”转向“算账阶段”。

英国三大金融监管机构警告：最强 AI 的网络攻击能力已远超专业人员

英国财政部、央行和 金融行为监管局 联合发声明，说现在最先进的 AI 模型搞网络攻击比普通专业人员快得多、范围更大、成本还更低。央行行长贝利上个月点名了 Anthropic 的 Mythos 产品，认为它已经带来明显的网络安全风险。

缺的是测试方法和量化指标。“远超”到底远多少？攻击速度快了多少倍？成本低到什么程度？这些都没给。声明主要是提醒企业提前做好防范，但缺少可操作的具体指引。

这条跟 Gary Marcus 在 Fortune 发的另一篇呼应上了——他说美国各州和联邦已提出约 1200 项 AI 相关法案，其中约 150 项 已通过，但缺乏统一的全国性政策框架。碎片化对企业和消费者都不利。Marcus 呼吁先问对问题、排好优先级，而不是继续堆法案，但他也没给出具体的统一框架内容。

监管战不是要不要打的问题，是已经在打，但两边都还没找到准星。

Runway Agent：一次对话，产品图变广告片

Runway 新上线的 Agent 功能，让你在同一个对话窗口里上传产品照片、给点想法，它直接吐出一条制作完成的广告。官方帖子没提背后用的是哪款模型、怎么收费、能生成多长的视频，也没说目前开放了哪些地区。

如果它真能省掉剪辑和合成的环节，对做短视频广告的团队来说挺省钱。但“一次对话出片”听起来像黑盒——中间能不能调？不满意能不能局部改？可控性怎么样？这些都得上手才知道。

同一天，Krea 2 也正式为 Pro 用户上线，商汤在 Hugging Face 开源了 SenseNova-U1-8B-MoT-Infographic，一个专门生成信息图的 8B 模型，能输出海报、图表、食谱卡甚至 arXiv 论文页。在 IGenBench 的指令匹配度上比基础版涨了 18.2 分，提升挺明显。但缺训练数据来源和生成速度，实际部署时延迟和可控性存疑。

AI 生成正在从“能生成”转向“能直接用”，但“直接用”的门槛比“能生成”高得多。

飞书 CLI 45 天万星：开发者吃“可见可控”这套

飞书开源了一个叫 lark-cli 的命令行工具，45 天在 GitHub 上拿到超过一万颗星，是国内办公套件里第一个破万星的开源项目。这个工具让 AI 能直接在命令行里建群、建文档，而且每一步操作都会先展示出来让你确认，不是那种在云端黑盒执行的 MCP 模式。主干代码已经合并了 10 位 外部开发者的贡献，对比钉钉和企业微信同类项目的外部贡献是零。

这种“可见可控”的特性，是开发者敢把任务交给 AI Agent 的前提。缺的是实际落地效果和出错率——万星说明关注度高，但生产环境跑起来稳不稳，还得看。

今日小信号

OpenSquilla 用智能路由把简单任务丢给便宜模型、复杂任务才调顶级模型，成本从 6 美元 降到 0.68 美元，降了近九成，性能只掉到 0.9251 分。四层记忆结构模拟人脑，支持 16 种工具按需加载。成本砍九成、性能几乎没掉，开源项目值得关注。
X 把“For You”推荐算法完整开源了，代码、预训练模型、内容理解服务都给了。核心是一套叫 Phoenix 的 Transformer 模型，基于 Grok 架构。缺训练数据规模和线上效果指标，实际效果得自己跑一遍才知道。
OpenAI 与 马耳他 政府达成全球首个国家级合作：公民学完一门 AI 素养课，就能免费拿一年 ChatGPT Plus（价值约 200 美元）。把“学 AI”和“免费用工具”绑在一起，用免费订阅当激励推全民 AI 扫盲，这个模式有意思。
Sai 把 AI 助手做成了独立桌面上的“虚拟同事”，你交代完深度研究就能走开，它自己开标签页、交叉引用、做笔记。缺用了什么模型、一次任务跑多久、成本多少，但“始终在线”的电脑使用代理形态已经摆出来了。
Claude Code v2.1.143 小版本更新：插件市场现在显示每个插件的预估 token 消耗，装之前能算算账；新增配置项让后台任务直接改当前文件，不用切分支。属于日常优化，但插件成本透明化对重度用户有用。