今天 AI 圈在拼落地,不是模型
今天 AI 圈最有意思的不在某个模型又刷榜了,是几件事同时指向同一个方向:把 AI 塞进真实流程。Runway 让广告片从对话里长出来、飞书 CLI 45 天万星说明开发者吃“可见可控”这套、OpenSquilla 用智能路由把成本砍了九成。另一边,杨立昆劝博士生别搞 LLM 了,黄仁勋劝 CS 毕业生去当技工——两个卖铲子的人同时说挖金子没那么容易,这事本身就值得看。先聊杨立昆这一出。
杨立昆劝博士生别搞 LLM 了,他自己去赌世界模型
杨立昆在 Unsupervised Learning 播客里把话讲得很直:LLM 这条路有天花板,到 2027 年 纯靠堆语言数据做不出真正的智能。他劝博士生别再往里扎,自己离开 Meta 后创立的 AMI 公司,核心押注在“世界模型”上——让 AI 像人一样通过观察和互动去理解物理世界,而不是只读文本。
有意思的是,他在访谈里跟老搭档 Hinton 和 Bengio 在图灵奖观点上公开分歧,还把 OpenAI 和 Anthropic 比作 Sun Microsystems——这话翻译过来就是:你们现在风光,但架构上有硬伤,迟早被更底层的范式替代。
访谈里缺的是 AMI 具体在做什么、世界模型的技术路线是什么、有没有验证数据。杨立昆的判断一向有前瞻性,但“世界模型”这个概念说了好几年,至今没有能跟 LLM 在实用层面掰手腕的产品。我会先打个折:方向可能对,但时间表没人说得准。
黄仁勋在 CMU 毕业典礼上说:电工水管工比你们有前景
这条跟杨立昆的访谈放在一起看,有种奇怪的对称感。黄仁勋在 卡内基梅隆大学 2026 届计算机科学毕业典礼上直接说,技工的前景比计算机毕业生好。他引了一组数据:Randstad 分析显示技工需求增速是白领的三倍,机器人技术员岗位涨了 107%,而斯坦福研究发现 AI 相关职位的早期就业反而降了 16%。顶级电工年薪能超过 10.6 万美元,还不用背学费贷款。
另一边,科技公司今年砸了 7000 亿美元 建数据中心,全球到 2030 年预计达 7 万亿美元。这些基础设施靠的是人,不是提示工程师。制造业每进 100 个新工人就有 102 人离开,缺口在扩大。
黄仁勋是卖 AI 铲子的人,他劝你别挖金子去修水管——这话从他嘴里说出来,分量不一样。他不是在唱衰 AI,是在说 AI 基建本身会创造比 AI 编程更多的确定性岗位。
Anthropic 估值 9000 亿,五个月翻五倍的收入从哪来
这条数字涨得有点夸张。据 FT 报道,Anthropic 的估值从 2026 年 2 月的 3500 亿美元 涨到 5 月的 9000 亿美元,三个月接近翻了三倍。年度经常性收入从 2025 年底的 90 亿美元 涨到 2026 年 5 月底的 450 亿美元,五个月翻了五倍。
这两个数字说明客户在快速掏钱,市场给的预期也很高。但缺的是收入结构——是靠 API 调用撑起来的,还是大客户长约?利润率多少?客户集中度怎么样?这些都没披露。估值翻三倍、收入翻五倍,如果背后是几个大客户签了长约,那跟广泛的市场 adoption 是两回事。
同时,微软 那边也透了底:对 OpenAI 的累计投入已超过 1000 亿美元,包括 130 亿美元 原始投资和大量 Azure 基础设施成本。合作已为微软带来约 300 亿美元 营收。双方续签了非独家协议,微软不再支付收入分成,将 OpenAI 的分成上限设为到 2030 年累计 380 亿美元,比原协议省了约 970 亿美元。纳德拉说微软是在“没人愿意下注”时承担了风险。
这两笔账放在一起看:Anthropic 在快速吸金,微软在重新谈条款省钱。AI 投资正在从“闭眼砸钱”转向“算账阶段”。
英国三大金融监管机构警告:最强 AI 的网络攻击能力已远超专业人员
英国财政部、央行 和 金融行为监管局 联合发声明,说现在最先进的 AI 模型搞网络攻击比普通专业人员快得多、范围更大、成本还更低。央行行长 贝利 上个月点名了 Anthropic 的 Mythos 产品,认为它已经带来明显的网络安全风险。
缺的是测试方法和量化指标。“远超”到底远多少?攻击速度快了多少倍?成本低到什么程度?这些都没给。声明主要是提醒企业提前做好防范,但缺少可操作的具体指引。
这条跟 Gary Marcus 在 Fortune 发的另一篇呼应上了——他说美国各州和联邦已提出约 1200 项 AI 相关法案,其中约 150 项 已通过,但缺乏统一的全国性政策框架。碎片化对企业和消费者都不利。Marcus 呼吁先问对问题、排好优先级,而不是继续堆法案,但他也没给出具体的统一框架内容。
监管战不是要不要打的问题,是已经在打,但两边都还没找到准星。
Runway Agent:一次对话,产品图变广告片
Runway 新上线的 Agent 功能,让你在同一个对话窗口里上传产品照片、给点想法,它直接吐出一条制作完成的广告。官方帖子没提背后用的是哪款模型、怎么收费、能生成多长的视频,也没说目前开放了哪些地区。
如果它真能省掉剪辑和合成的环节,对做短视频广告的团队来说挺省钱。但“一次对话出片”听起来像黑盒——中间能不能调?不满意能不能局部改?可控性怎么样?这些都得上手才知道。
同一天,Krea 2 也正式为 Pro 用户上线,商汤 在 Hugging Face 开源了 SenseNova-U1-8B-MoT-Infographic,一个专门生成信息图的 8B 模型,能输出海报、图表、食谱卡甚至 arXiv 论文页。在 IGenBench 的指令匹配度上比基础版涨了 18.2 分,提升挺明显。但缺训练数据来源和生成速度,实际部署时延迟和可控性存疑。
AI 生成正在从“能生成”转向“能直接用”,但“直接用”的门槛比“能生成”高得多。
飞书 CLI 45 天万星:开发者吃“可见可控”这套
飞书 开源了一个叫 lark-cli 的命令行工具,45 天在 GitHub 上拿到超过一万颗星,是国内办公套件里第一个破万星的开源项目。这个工具让 AI 能直接在命令行里建群、建文档,而且每一步操作都会先展示出来让你确认,不是那种在云端黑盒执行的 MCP 模式。主干代码已经合并了 10 位 外部开发者的贡献,对比钉钉和企业微信同类项目的外部贡献是零。
这种“可见可控”的特性,是开发者敢把任务交给 AI Agent 的前提。缺的是实际落地效果和出错率——万星说明关注度高,但生产环境跑起来稳不稳,还得看。
今日小信号
- OpenSquilla 用智能路由把简单任务丢给便宜模型、复杂任务才调顶级模型,成本从 6 美元 降到 0.68 美元,降了近九成,性能只掉到 0.9251 分。四层记忆结构模拟人脑,支持 16 种工具按需加载。成本砍九成、性能几乎没掉,开源项目值得关注。
- X 把“For You”推荐算法完整开源了,代码、预训练模型、内容理解服务都给了。核心是一套叫 Phoenix 的 Transformer 模型,基于 Grok 架构。缺训练数据规模和线上效果指标,实际效果得自己跑一遍才知道。
- OpenAI 与 马耳他 政府达成全球首个国家级合作:公民学完一门 AI 素养课,就能免费拿一年 ChatGPT Plus(价值约 200 美元)。把“学 AI”和“免费用工具”绑在一起,用免费订阅当激励推全民 AI 扫盲,这个模式有意思。
- Sai 把 AI 助手做成了独立桌面上的“虚拟同事”,你交代完深度研究就能走开,它自己开标签页、交叉引用、做笔记。缺用了什么模型、一次任务跑多久、成本多少,但“始终在线”的电脑使用代理形态已经摆出来了。
- Claude Code v2.1.143 小版本更新:插件市场现在显示每个插件的预估 token 消耗,装之前能算算账;新增配置项让后台任务直接改当前文件,不用切分支。属于日常优化,但插件成本透明化对重度用户有用。