AX 严选 · 2026-06-01

▸ 50 条 · updated 3m ago

按日期浏览清除筛选 ✕

2026年6月

一二三四五六日

163 251 335 431 539 611 716 846 959 1039 1138 1225 1320 149 1521 1635 1728 1834 1919 202 213 2218 2319 2420 2522 2612 278 286 2917 3023

2026年7月

一二三四五六日

110 218 310 42 55 617 717 817 916 1010 116 128 137 1420 1515 1622 1711 181 198 2012 2118 2211 2310 24 25 26 27 28293031

2026-06-01 · 星期一2026年6月1日

23:10

56d ago

● P1AI HOT 精选· aihot-apiZH23:10 · 06·01

Anthropic 秘密提交 IPO 申请，抢在 OpenAI 前面上市

Anthropic 在官方博客宣布已向美国 SEC 秘密递交 IPO 申请，具体发行数量和定价还没定。就在不到一周前，公司刚完成 H 轮 650 亿美元融资，投后估值冲到 9650 亿美元。他们同时披露年化营收已突破 470 亿美元，而 2025 年底这个数字还只有 90 亿，增速很快。秘密申报的好处是前期不用公开详细财务和风险信息，可以先内部评估上市...

#Anthropic#OpenAI#U.S. Securities and Exchange Commission#Funding

精选理由

精选 · 重要度 97 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 秘密交表准备上市，估值冲到 9650 亿美元，但财务细节还没公开，这点先别太激动。

锐评

Anthropic 抢在 OpenAI 前面秘密递交了 IPO 申请，这是条实打实的资本动作新闻。公司刚拿完 H 轮 650 亿美元融资，估值推到 9650 亿美元，年化营收从去年底的 90 亿飙升到 470 亿美元，增速确实猛。但因为是秘密申报，具体的财务数据、经营风险和股权结构都还没披露，我们看到的只是一个高估值和高营收的壳，里面有没有硬伤要等后续的 S-1 文件才能判断。文章提到 Mythos 模型因为查出数千个高危漏洞一直没全量开放，这算是个风险点。另外，整个市场现在对 AI 公司的热情很高，SpaceX 也在冲上市，这种热度下估值容易虚高。我会先打个折看这件事，等正式招股书出来，看他们的收入结构、客户集中度和研发成本占比，才能判断这 9650 亿到底值不值。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

97

SCORE

H1·K1·R1

23:10

56d ago

AI HOT 精选· aihot-apiZH23:10 · 06·01

Sam Altman：AI 发展不能脱离人的需求

Sam Altman 在采访里说，AI 不该去追求跟人类需求无关的目标，人必须始终在 AI 发展里占中心位置。他怼了行业里“AI 会摧毁大量工作”这类说法，认为大家怕的不是 AI 的好处，而是担心自己未来还有没有角色、经济前景和自主权。他还点出 AI 行业的一个失败：没讲清楚人类怎么在每一步都保持对未来的控制，以及 AI 时代怎么继续过充实、有意义的生...

#Alignment#Safety#Sam Altman#Commentary

一句话点评

Sam Altman 说 AI 不该追求脱离人类需求的目标，并批评行业没讲清人类如何保持控制。但全文没披露采访日期、完整问答或任何具体治理机制，更像立场表态而非方案。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

36

SCORE

H0·K0·R0

22:11

56d ago

AI HOT 精选· aihot-apiZH22:11 · 06·01

ChatGPT 新增全屏编辑和保存草稿功能

ChatGPT 现在支持全屏编辑长文，写好的内容可以保存到资料库，方便以后接着改。正文没披露单次能写多长、能存多少草稿。

#Tools#Memory#ChatGPT#Product update

一句话点评

ChatGPT 现在能全屏写长文并保存到资料库，方便回头接着改。但正文没披露单次能写多长、能存多少草稿，实际可用性要打问号。短评：写长文终于不用挤小框了，但容量限制没说，先别太激动。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H0·K1·R1

21:59

56d ago

FEATUREDAI HOT 精选· aihot-apiZH21:59 · 06·01

Google AI Studio 现在能直接搭 Gmail、Drive 应用，不用跳出去

Google AI Studio 上线了应用构建功能，可以直接在里面连接 Gmail、Drive 和 Sheets 等 Google 自家服务，不用再切到别的网站。目前支持在 AI Studio 内部添加测试人员，但正文没披露完整的公开分享功能具体什么时候上线，只说“即将推出”。

#Agent#Tools#Google AI Studio#Gmail

精选理由

精选 · 重要度 72 · 吸引力 + 知识量 + 共鸣

一句话点评

Google AI Studio 能直接连 Gmail、Drive 和 Sheets 做应用了，不用跳转。但公开分享功能还没上线，正文只说“即将推出”。

锐评

这条更新让 AI Studio 从单纯的模型调试工具往应用构建平台迈了一步。以前你想让模型读 Gmail 或 Drive 里的文件，得自己写代码调 API，现在在 Studio 里就能搭出能直接操作这些服务的应用，对快速验证想法挺友好。不过目前能做的还比较基础：只能添加测试人员，没法公开分享。正文没提权限控制粒度、数据怎么处理、会不会有额外费用，也没说支持哪些模型。如果是真的无缝打通，对依赖 Google 生态的团队会省不少事，但“即将推出”这种表述得先打个折，等公开分享和实际使用限制明确了再看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

72

SCORE

H1·K1·R1

21:04

56d ago

AI HOT 精选· aihot-apiZH21:04 · 06·01

Krea AI 把 Krea 2 LoRAs 开放给所有人用了

Krea AI 宣布 Krea 2 LoRAs 现在全员可用，推文只贴了一个示例链接，没提训练机制、定价或使用限制。如果你之前没权限，现在可以直接试了。

#Fine-tuning#Krea AI#Product update

一句话点评

Krea 2 的 LoRA 微调功能现在全员开放了，之前没权限的可以直接上手试。推文只贴了一个示例链接，没提训练机制、定价或使用限制——这点先别太激动，具体好不好用、要不要钱都还不知道。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

62

SCORE

H0·K1·R0

20:50

56d ago

● P1AI HOT 精选· aihot-apiZH20:50 · 06·01

Alphabet 计划通过发行股票等方式筹集 800 亿美元，其中巴菲特的公司投了 100 亿，全部砸向 AI 算力

Alphabet（Google 母公司）要搞一笔 800 亿美元的股权融资，专门用于 AI 基础设施。这笔钱里，伯克希尔·哈撒韦会出 100 亿美元，算是给市场一个信号。800 亿这个数字说明 Google 对 AI 算力的投入还在猛踩油门，不是小修小补。不过正文没披露这笔钱具体怎么分、用在哪些数据中心或芯片采购上，也没说对现有股东稀释多少。如果是真的...

#Alphabet#Berkshire Hathaway#Funding

精选理由

精选 · 重要度 88 · 吸引力 + 知识量 + 共鸣

一句话点评

Google 要发新股融 800 亿美元砸 AI，巴菲特跟投 100 亿。数字很大，但正文没讲钱具体怎么花、现有股东会被稀释多少，先别急着喊利好。

锐评

Alphabet 这次直接通过发行股票筹 800 亿美元，专门用于 AI 基础设施，手笔相当大。伯克希尔·哈撒韦认购 100 亿美元，算是一个市场信号，说明有长线资金愿意在这个价位接盘。800 亿这个数字本身说明 Google 对 AI 算力的投入不是小修小补，而是继续猛踩油门，跟微软、亚马逊那几家 hyperscaler 的军备竞赛还在升级。不过这篇报道缺了不少关键信息。正文没披露这 800 亿具体怎么分配——是建新数据中心、买 GPU/TPU，还是有一部分要拿去补其他窟窿，完全不清楚。也没提这次增发对现有股东的稀释比例有多大，以及融资后的资本结构会变成什么样。另外，巴菲特那 100 亿是普通股还是优先股、有没有特殊条款，报道里也没写。对从业者来说，这首先意味着算力供给还会继续涨，Google Cloud 的 AI 服务大概率会跟着扩产能。但这么大一笔股权融资，侧面也说明 AI 烧钱的速度可能比外界想的还快，光靠经营现金流已经不够填了。这点值得留意。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

88

SCORE

H1·K1·R1

19:46

56d ago

AI HOT 精选· aihot-apiZH19:46 · 06·01

Replit：一个提示词生成网站、App、幻灯片和发布视频

Replit 宣布用户现在可以用单个提示词免费生成一个完整的业务——包括网站、移动应用、幻灯片和发布视频，还附带 Stripe Atlas、QuickBooks、Mercury 等服务的福利。正文没披露免费额度上限、功能覆盖范围以及免费期后的定价，所以实际能跑多复杂的业务还不清楚。如果真能一个提示词搞定全栈加营销素材，对独立开发者和小团队来说省不少事，...

#Agent#Code#Tools#Replit

一句话点评

Replit 说一个提示词就能免费生成完整业务——网站、App、幻灯片、发布视频全包，还送 Stripe Atlas 等工具福利。听着很猛，但正文没披露免费额度上限、功能覆盖范围以及免费期后的定价，所以实际能跑多复杂的业务还不清楚。如果真能一个提示词搞定全栈加营销素材，对独立开发者和小团队来说省不少事，但这点先别太激动，等实测出来再说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

69

SCORE

H1·K1·R1

19:20

56d ago

FEATUREDAI HOT 精选· aihot-apiZH19:20 · 06·01

Meta 自家的 AI 客服被利用来劫持 Instagram 账号

攻击者直接跟 Meta 的 AI 客服聊天，让它把目标账号的绑定邮箱换成自己的，就能把号拿走。问题出在这个 AI 被赋予了直接操作账号的权限，而且它没法区分对面是号主还是骗子。报道没披露到底有多少账号受影响、漏洞现在修没修，也没给出能复现的具体步骤。

#Agent#Tools#Safety#Meta

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

Meta 的 AI 客服被骗子用聊天方式骗走了 Instagram 账号，因为它能直接改绑定邮箱，还分不清对面是不是号主。

锐评

这事听着离谱但逻辑很简单：Meta 给自家 AI 客服开了直接操作账号的权限，比如改绑定邮箱，但没教会它怎么验证对面是不是真号主。攻击者只要跟 AI 聊几句，让它把邮箱换成自己的，号就没了。这本质上是把“能干活”的权限给了“不会认人”的模型，典型的 agent 权限失控。报道来自 The Verge，但正文没披露受影响账号数量、漏洞现在修没修，也没给出能复现的具体步骤。这点先别太激动——没数字就没法判断是偶发个案还是大规模事故。另外，Meta 官方回应也缺位，不知道他们后续是收回 AI 的操作权限，还是加了身份验证环节。对从业者来说，这条新闻的价值不在猎奇，而在提醒：让模型进业务流程干活（agent workflow）之前，权限边界和身份校验必须卡死。否则一个聊天窗口就能绕过所有安全设计。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

18:52

57d ago

FEATUREDAI HOT 精选· aihot-apiZH18:52 · 06·01

佛罗里达州起诉 OpenAI 和 Sam Altman，称多起谋杀案与 ChatGPT 有关

佛罗里达州总检察长指控 Altman 对人类生命“完全漠视”，但起诉书正文没披露具体案件数量、受害者人数，也没说清楚 ChatGPT 到底在哪个环节、怎么导致了谋杀。

#Safety#OpenAI#Sam Altman#Florida

精选理由

精选 · 重要度 82 · 吸引力 + 共鸣

一句话点评

起诉书标题很重，但正文没给出具体案件数、受害者人数，也没说清 ChatGPT 到底在哪个环节、怎么导致了谋杀，目前只能当一份指控看。

锐评

佛罗里达州总检察长对 OpenAI 和 Sam Altman 的起诉，目前更像一份措辞严厉但事实骨架很弱的文件。报道里只提到总检察长指责 Altman“完全漠视”人类生命，但 Ars Technica 的编辑翻遍起诉书也没找到具体有几起案件、涉及多少受害者，更关键的是，没讲清楚 ChatGPT 在所谓的谋杀中到底扮演了什么角色——是直接给出了杀人步骤，还是被用来策划、煽动，或者只是凶手恰好用过。这种信息缺口让整件事的严重程度没法判断。如果是模型直接输出了可操作的犯罪指导，那性质完全不同；如果只是凶手用过 ChatGPT 聊天，那关联性就很弱。目前所有判断都得先打个折，等起诉书更多细节公开，或者 OpenAI 的回应出来，才能看清这到底是一次有实锤的安全事故，还是一场蹭热度的法律动作。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

82

SCORE

H1·K0·R1

18:28

57d ago

AI HOT 精选· aihot-apiZH18:28 · 06·01

Google 展示并行子智能体自动整理文件

Google AI 发了个演示：用 Antigravity 里的并行子智能体，自动给几百个营销素材分类、重命名，省掉手动整理。正文没披露跑一次要多久、失败率多少、有没有人工复核环节，所以实际好不好用还不清楚。

#Agent#Tools#Google AI#Antigravity

一句话点评

Google AI 演示了 Antigravity 的并行子智能体，能自动给几百个营销素材分类、重命名，省掉手动整理。亮点是“并行”处理，理论上比串行快。但正文没披露跑一次要多久、失败率多少、有没有人工复核，所以实际好不好用还不清楚。短评：并行整理文件省人工，但没给跑分和失败率，先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

17:53

57d ago

FEATUREDAI HOT 精选· aihot-apiZH17:53 · 06·01

Perplexity 把搜索流程写成代码，让 AI 代理直接调接口，不再绕函数循环

Perplexity 公开了一套叫 Search as Code 的搜索架构。它的做法是让 AI 代理直接写 Python 代码去调用自家的搜索栈，而不是像以前那样一步步循环调用函数。这套东西已经上线 Perplexity Agent API，并且成了 Computer 功能的默认选项。正文没披露具体性能对比数据，但思路很直接：省掉中间环节，让搜索更快...

#Agent#Code#Tools#Perplexity

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

Perplexity 把搜索流程写成了代码，让模型直接调自家搜索栈，省掉一步步喊函数的开销。但正文没给性能对比，快多少、省多少还不知道。

锐评

Perplexity 这次公开的 Search as Code，核心思路是把搜索从“模型反复调用工具”改成“模型直接写 Python 代码调用搜索栈”。以前的做法像你让助手查资料，它得一次次翻书、记笔记、再翻书；现在相当于助手直接写了个脚本，一口气把活干了。这套东西已经上线 Perplexity Agent API，并且成了 Computer 功能的默认选项，说明他们内部对稳定性有一定信心。但正文没披露任何性能对比数据。延迟降了多少、token 消耗省了多少、召回率有没有变化，这些关键指标一概没提。没有数字，就只能当架构思路看，不能直接当省钱省时的承诺。另外，代码生成本身也会引入新的出错可能，比如语法错误或逻辑 bug，正文也没说他们怎么兜底。对做 agent 搜索的团队来说，这个方向值得跟，但现阶段更像一个工程优化方案，不是范式级突破。等他们放出 benchmark 或者第三方复现结果，再判断实际收益不迟。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

17:06

57d ago

FEATUREDAI HOT 精选· aihot-apiZH17:06 · 06·01

NVIDIA Cosmos 3 在开放权重模型里拿了图像和视频生成双料第一

NVIDIA 的 Cosmos 3 在 Artificial Analysis 的开放权重榜单上，文本生图和图片转视频两项都排到了第一。它用了一种叫 Mixture-of-Transformers 的架构，把自回归推理器和扩散生成器拼在一起，有 16B 参数的 Nano 版和 64B 参数的 Super 版。Super 版在两项任务上分别超过了 HiD...

#Multimodal#Vision#Fine-tuning#NVIDIA

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

NVIDIA Cosmos 3 在开放权重模型里拿了图像和视频生成双榜第一，但榜单只比了开源模型，别直接当成全面碾压闭源。

锐评

Cosmos 3 这次在 Artificial Analysis 的开放权重榜单上，文本生图和图片转视频两项都排到了第一。它把自回归推理器和扩散生成器拼在一起，相当于让模型先理解你要什么，再动手画，这种架构在控制力上确实有优势。Super 版有 64B 参数，跑起来硬件门槛不低，Nano 版 16B 更实际一点。值得留意的是，它完全开源了权重、代码、数据集和微调方案，用 OpenMDW 1.1 许可，这对想自己改模型的人来说是个实在的好处。不过正文没披露具体评测样本量、打分方式，也没说跟闭源商业模型的差距有多大。榜单只覆盖开放权重模型，所以这个“第一”是在开源圈子里比的，别直接当成行业最强。还缺两块关键信息：一是推理延迟和显存占用，64B 参数实际跑起来成本多高；二是生成质量有没有人工评估，光靠自动指标容易刷榜。这两点决定了它是不是真能用进生产环境。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

17:00

57d ago

AI HOT 精选· aihot-apiZH17:00 · 06·01

OpenAI 发政策立场：没捐过政治献金，不搞超级 PAC，但联合创始人私下支持了一个政治团体

OpenAI 发了一篇政策与政治倡导声明，核心就一句话：公司没给任何超级 PAC、候选人或竞选活动捐过钱，也没有员工出资的政治行动委员会（PAC）。但联合创始人 Greg Brockman 和他妻子私下支持了一个叫 Leading the Future（LTF）的组织，OpenAI 强调那是个人行为，不代表公司立场。正文没披露 LTF 具体主张或资金规...

#Safety#OpenAI#Policy#Safety/alignment

一句话点评

OpenAI 发声明撇清政治捐款：没给超级 PAC、候选人或竞选活动捐过钱，也没有员工出资的 PAC。但联合创始人 Greg Brockman 和他妻子私下支持了一个叫 Leading the Future（LTF）的组织，OpenAI 强调那是个人行为。正文没披露 LTF 具体主张或资金规模，这点先别太激动。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

39

SCORE

H0·K0·R0

16:55

57d ago

● P1AI HOT 精选· aihot-apiZH16:55 · 06·01

Anthropic 已秘密提交 IPO 申请，最早今年秋天上市

彭博这条视频把 Anthropic 和 SpaceX、OpenAI 并列为 2026 年 IPO 热潮的主角。Anthropic 已经悄悄交了上市文件，时间点可能在今年秋季。不过正文没披露估值、募资规模和具体交易所，这些关键数字都还看不到。SpaceX 和 OpenAI 也只是标题里提了一嘴，视频里有没有展开讲不清楚。我会先打个折——这更像一个市场风向...

#Anthropic#OpenAI#SpaceX#Funding

精选理由

精选 · 重要度 90 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 悄悄交了上市文件，最早今年秋天 IPO，但估值和募资额都没公布。SpaceX 和 OpenAI 只是标题里提了一嘴，视频里有没有展开讲不清楚，这点先别太激动。

锐评

彭博这条视频把 Anthropic 和 SpaceX、OpenAI 并列为 2026 年 IPO 热潮的主角，但真正有实质进展的只有 Anthropic——它已经秘密提交了上市申请，时间窗口可能在今年秋季。视频标题虽然把三家都列上了，但正文没披露任何关于 SpaceX 和 OpenAI 的上市细节，连它们是否真的在推进 IPO 都无从判断。 Anthropic 的上市动作本身值得关注，毕竟它是目前少数能和 OpenAI 正面竞争的模型公司。但关键数字全缺：估值多少、计划募资规模多大、选哪个交易所，这些直接影响市场判断的信息一概没有。彭博这条更像一个市场风向提示，而不是一份有硬数据的报道。对从业者来说，Anthropic 上市意味着它的财务状况和商业模型很快要接受公开市场检验，这对整个 AI 行业都是个参照点。但在此之前，还需要等招股书出来才能判断它到底值多少钱、钱会怎么花。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

90

SCORE

H1·K1·R1

16:46

57d ago

● P1AI HOT 精选· aihot-apiZH16:46 · 06·01

Anthropic 秘密提交了 IPO 申请，最快今年秋天在华尔街上市

Anthropic 已经向监管机构秘密提交了上市文件，计划最早今年秋季在华尔街挂牌。这次提交没有披露计划发行多少股票、定价区间是多少，所以公司打算融多少钱、给自己标什么价，目前都还是未知数。它和 OpenAI 都在抢着上市，谁先跑通流程，谁就能先拿到一笔公开市场的资金。

#Anthropic#OpenAI#Funding

精选理由

精选 · 重要度 96 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 秘密交表准备秋天上市，但没公布要融多少钱、估值多少，现在只能先当个信号看。

锐评

Anthropic 和 OpenAI 都在抢跑上市，谁先挂牌谁就能先拿到一笔公开市场的钱，这对两家烧钱换规模的公司来说很关键。但这次是秘密提交，正文没披露计划发行多少股票、定价区间，所以公司打算融多少钱、给自己标什么价，目前全是未知数。秘密提交的好处是公司可以先和监管走流程，不用立刻把家底亮给市场看，但对围观的人来说，现在能判断的东西很少。我会先打个折：这更像一个“准备动作”而不是“马上要上”，真正值得看的是后续 S-1 文件公开时的收入结构、亏损规模和大客户依赖度，这些才是决定它值多少钱的核心。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

96

SCORE

H1·K1·R1

16:40

57d ago

● P1AI HOT 精选· aihot-apiZH16:40 · 06·01

Anthropic 已秘密提交上市申请，估值冲到 9650 亿美元

Anthropic 向美国 SEC 秘密交了 S-1 草案，正式启动 IPO。文章提到它最新一轮融资估值 9650 亿美元，比 OpenAI 的 8520 亿美元还高。不过这个数字有点吓人——正文没解释估值怎么算出来的，也没披露收入、利润或现金流数据，所以先别太激动。上市后 Anthropic 和 OpenAI 的竞争会从拼模型直接升级到拼财报。

#Anthropic#OpenAI#U.S. SEC#Funding

精选理由

精选 · 重要度 96 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 秘密交表启动上市，但那个 9650 亿估值正文没给算法，先当故事看。

锐评

Anthropic 向 SEC 秘密提交了 S-1 草案，正式启动 IPO。文章提到它最新一轮融资估值 9650 亿美元，比 OpenAI 的 8520 亿还高。这个数字先别太激动——正文没解释估值怎么算出来的，也没披露收入、利润或现金流数据，所以目前只是一个报价，不是验证过的市场价。上市后 Anthropic 和 OpenAI 的竞争会从拼模型直接升级到拼财报。对从业者来说，这意味着两家公司接下来在定价、开源策略和客户获取上的动作会更透明，也更受季度业绩压力影响。现在还缺的关键信息是 S-1 里的实际财务数据：营收规模、亏损幅度、客户集中度，以及他们怎么定义自己的护城河。这些出来之前，9650 亿这个数我建议先打个折看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

96

SCORE

H1·K1·R1

16:24

57d ago

● P1AI HOT 精选· aihot-apiZH16:24 · 06·01

Anthropic 向 SEC 秘密提交了 S-1 上市草案

Anthropic 已经悄悄把 IPO 申请材料递到了美国证监会，准备公开发行普通股。目前股票数量和发行价都没定，公告里说最终上不上市还得看市场情况。正文没披露具体时间表，但提到 SEC 审完之后他们才有权正式开卖。另外，关联信息显示他们刚完成 H 轮融资，融了 650 亿美元，投后估值冲到 9650 亿美元——这个数字高得有点吓人，我会先打个折看，毕...

#Anthropic#SEC#Altimeter Capital#Funding

精选理由

精选 · 重要度 96 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 悄悄交了上市申请，但股数和定价都没定。关联的 H 轮融资估值冲到 9650 亿美元，这个数字高得离谱，先别太激动。

锐评

Anthropic 已经向美国证监会秘密提交了 S-1 草案，准备搞 IPO。公告写得很保守，说最终上不上市还得看市场脸色，股票数量和发行价一概没提。这相当于先把队排上，等监管审完了才有权正式开卖，时间表完全没给。真正让人皱眉的是关联信息里提到的 H 轮融资：融了 650 亿美元，投后估值 9650 亿美元。这个估值数字大得不太真实，正文也没解释估值模型怎么算出来的，我会先打个折看。如果按这个估值上市，它一上来就会成为全球市值最高的公司之一，但公告里连基本的营收或亏损数据都没披露，没法判断撑不撑得起这个价。现在还缺的东西很多：S-1 文件本身没公开，我们看不到收入结构、客户集中度、研发烧钱速度这些关键指标。等 SEC 审完、公开文件出来，才能判断这到底是一次扎实的上市，还是趁着 AI 热度冲一波。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

96

SCORE

H1·K1·R1

16:12

57d ago

FEATUREDAI HOT 精选· aihot-apiZH16:12 · 06·01

Gemini Omni 能生成你的数字分身，放进视频里

Gemini App 发帖演示了用 Gemini Omni 捏一个长相和声音都像你的数字分身，然后直接塞进视频创作里。帖子没提这个功能什么时候上线、要不要付费，也没说怎么防止别人拿你的形象乱用。

#Multimodal#Vision#Audio#Gemini App

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

Gemini App 发帖说能用 Omni 捏一个长得像你、说话像你的数字分身塞进视频里，但没提上线时间、收费和防冒充机制，先当概念片看。

锐评

这条帖子展示了一个挺诱人的功能：用户上传或拍摄一段素材，Gemini Omni 就能生成外观和声音都接近本人的数字分身，然后直接放进视频创作里。对内容创作者来说，这比传统动捕或 3D 建模的门槛低得多，省设备、省时间。但帖子只给了操作步骤，没给任何落地信息——什么时候能用、免费还是付费、生成一个分身要多久、对硬件有什么要求，全都没说。更关键的是安全机制完全空白。帖子没提怎么防止别人拿你的照片和声音生成假视频，也没说有没有活体检测、授权流程或水印。在深度伪造风险这么高的当下，这个缺口会让功能看起来很酷但也很危险。我会先打个折：技术演示不等于产品，等官方公布隐私保护和滥用防范方案再判断它是不是真能日常用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

16:09

57d ago

● P1AI HOT 精选· aihot-apiZH16:09 · 06·01

Anthropic 秘密提交上市申请，计划最早今秋登陆华尔街

Anthropic 已向监管机构秘密提交 IPO 文件，目标最早今年秋天在华尔街上市。文章只提到 Claude 需求在涨，但没给出具体增长数字，也没披露估值、募资规模或财务数据。秘密提交意味着公司暂时不用公开招股书细节，外界还看不到它的真实收入和成本结构。

#Anthropic#OpenAI#Claude#Funding

精选理由

精选 · 重要度 95 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 秘密交表准备上市，但文章没给任何估值、募资额和 Claude 的具体增长数字，现在只能当个信号看。

锐评

Anthropic 已经向监管秘密提交了 IPO 申请，目标最早今年秋天在华尔街挂牌。秘密提交的好处是公司暂时不用把招股书细节公之于众，所以外界现在还看不到它的真实收入、成本结构和烧钱速度。文章只提到 Claude 需求在涨，但没给出任何量化数据——涨了多少、付费用户规模、企业客户留存率，这些关键指标一概没有。对从业者来说，这更像一个融资节奏的信号，而不是能拿来判断公司基本面的材料。OpenAI 之前也走过类似的路，先秘密交表再逐步公开。Anthropic 能不能撑起一个好看的估值，最终要看它能不能证明 Claude 的订阅和 API 收入能覆盖高昂的推理成本。这点先别太激动，等招股书公开了再看账本。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

95

SCORE

H1·K1·R1

16:06

57d ago

● P1AI HOT 精选· aihot-apiZH16:06 · 06·01

Anthropic 已秘密提交 IPO 草案，正式启动上市流程

Anthropic 向监管机构秘密提交了 IPO 草案文件，迈出上市第一步。正文没披露估值、时间表、承销商或上市地点，目前只有提交动作本身是确定的。秘密提交意味着公司可以先把财务和业务细节交给 SEC 审核，外界暂时看不到招股书全文。这点先别太激动，提交草案到真正挂牌通常还有几个月，中间随时可能因为市场环境或监管反馈调整节奏。

#Anthropic#Funding

精选理由

精选 · 重要度 88 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 秘密提交了 IPO 草案，但估值、时间表、承销商全没披露，现在只是走了第一步，离真正挂牌还早。

锐评

Anthropic 向 SEC 秘密提交了 IPO 草案，这是上市流程的起点，但正文只确认了提交动作本身，估值、承销商、上市地点、时间表一概没提。秘密提交的好处是公司可以先跟监管来回改文件，外界暂时看不到招股书，财务数据和业务细节都还捂着。从提交草案到正式挂牌通常要几个月，中间可能因为市场环境或 SEC 反馈调整节奏，甚至搁置。目前能确定的只有一件事：Anthropic 启动了上市程序。对这条消息，我会先打个折——提交草案不等于马上 IPO，更不等于估值已经谈定。后续要看招股书公开后的收入结构、亏损规模、客户集中度，以及它怎么向公开市场解释自己跟 OpenAI、Google 的竞争位置。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

88

SCORE

H1·K1·R1

15:56

57d ago

AI HOT 精选· aihot-apiZH15:56 · 06·01

OpenRouter 新增成本质量滑块：0 用最强模型，10 用最便宜

OpenRouter 的 Auto Router 加了一个 `cost_quality_tradeoff` 参数，取值 0 到 10。设为 0 就永远选最强模型不管价格，设为 10 就永远选最便宜的。中间值可以自己调，相当于在效果和烧钱之间拉个滑块。正文没披露默认值是多少，也没说具体怎么算中间档的模型排序。

#Tools#Inference-opt#OpenRouter#Product update

一句话点评

OpenRouter 的 Auto Router 新增了一个 0-10 的滑块参数，0 代表无脑选最强模型（不管多贵），10 代表永远选最便宜的。中间值可以自己调，相当于在效果和烧钱之间拉个杠杆。正文没披露默认值，也没说中间档的模型排序逻辑，所以实际效果得自己试。对预算敏感但又要保底质量的团队挺实用，但别指望它自动帮你找到最优解。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

15:53

57d ago

● P1AI HOT 精选· aihot-apiZH15:53 · 06·01

智谱计划在科创板上市，拟发行新股占总股本 2% 到 8%

智谱在港交所发公告，准备申请在 A 股科创板上市。这次发行的全是新股，数量在 910 万到 3877 万股之间，占发行后总股本的 2% 到 8%，老股东不卖旧股。融来的钱主要投向三个地方：通用基座大模型、大模型 MaaS 一站式服务平台，以及补充流动资金。另外公司打算把英文名从 Knowledge Atlas 改成 Z.AI。公告没披露具体的募资金额和...

#Zhipu#Z.AI#Funding

精选理由

精选 · 重要度 90 · 吸引力 + 知识量 + 共鸣

一句话点评

智谱要回A股科创板了，新股占2%到8%，老股东不套现。但公告没写融多少钱，估值和定价都还是未知数。

锐评

智谱在港交所发公告，计划在科创板发新股，数量在910万到3877万股之间，占发行后总股本的2%到8%。老股东这次不卖旧股，说明不是套现离场，而是公司想拿钱办事。融来的钱主要投向三个地方：通用基座大模型、大模型MaaS一站式服务平台，以及补充流动资金。从投向看，智谱还是想继续烧钱做大模型底座和卖模型服务，没有突然转向做应用。但公告没披露具体的募资金额，也没给估值区间。这就让这条消息的含金量打了折扣——不知道它觉得自己值多少钱，也不知道市场会怎么接。另外，公司打算把英文名从Knowledge Atlas改成Z.AI，更像一个品牌动作，对业务实质影响不大。还缺的关键信息是：科创板对未盈利企业的上市门槛怎么卡，智谱现在的亏损情况和现金流能不能撑到挂牌。这些公告都没提，需要等后续招股书出来再看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

90

SCORE

H1·K1·R1

15:45

57d ago

FEATUREDAI HOT 精选· aihot-apiZH15:45 · 06·01

JetBrains 发布 Mellum2：一个 12B 参数的混合专家模型，每次推理只激活 2.5B 参数

JetBrains 在 Hugging Face 上开源了 Mellum2，一个从零开始训练的混合专家模型。它总共有 120 亿参数，但每次计算只激活其中的 25 亿，这让它跑起来比同尺寸模型快了一倍多，适合对延迟和吞吐量要求高的场景。模型专门处理文本和代码，不做多模态，主要用在路由分发、外挂资料库检索、摘要和子智能体这些需要频繁调用模型但不必上大模型...

#JetBrains#Hugging Face#Mellum2#Research release

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

JetBrains 开源了一个 120 亿参数的混合专家模型，每次只激活 25 亿参数，推理速度比同级模型快一倍多，适合跑在需要快速响应的代码和文本任务上。

锐评

Mellum2 的定位很清晰：不做全能选手，专攻高频、低延迟的文本和代码任务，比如路由分发、外挂资料库检索和子智能体。120 亿总参数但每次只叫醒 25 亿干活，这个设计让它的推理速度比同尺寸模型快了一倍多，对在乎响应时间和吞吐量的场景是个实打实的优势。JetBrains 把它放在 Apache 2.0 协议下开源，商用门槛很低。不过，这篇发布博客没给出具体的跑分对比、训练数据构成，也没提在自家 IDE 里实际落地的延迟数据。技术报告链接指向 arXiv，但正文没披露关键细节。所以“快一倍多”这个结论目前只能先打个折看，等看到它在真实业务里的表现再下判断。另外，模型只处理文本和代码，不做多模态，这意味着它不会去抢通用大模型的风头，而是老老实实当个高效的执行层。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

15:42

57d ago

FEATUREDAI HOT 精选· aihot-apiZH15:42 · 06·01

MiniMax 开源 M3 模型，把写代码、读长文和看图听声塞进一个系统，跑分压过 GPT-5.5 但成本只要十二分之一

MiniMax 放出了一个叫 M3 的开源模型，把代码能力、一次能读 100 万 token 的长上下文和原生多模态（能直接处理图像、音频）做在了一起。在 SWE-Bench Pro 这个代码基准上拿了 59.0%，比 GPT-5.5 的 58.6% 和 Gemini 3.1 Pro 的 54.2% 都高一点；在 BrowseComp 自主浏览任务上 ...

#Code#Multimodal#Benchmarking#MiniMax

精选理由

精选 · 重要度 83 · 吸引力 + 知识量 + 共鸣

一句话点评

MiniMax 开源了 M3，代码跑分压过 GPT-5.5 一头，token 成本只要十二分之一，但权重还没放出来，先别急着下单。

锐评

MiniMax 放出的 M3 是个开源模型，把写代码、一次读 100 万 token 的长上下文和直接处理图像音频的多模态能力打包在一起。在 SWE-Bench Pro 这个代码基准上拿了 59.0%，比 GPT-5.5 的 58.6% 和 Gemini 3.1 Pro 的 54.2% 都高一点；在 BrowseComp 自主浏览任务上 83.5% 的成绩也压过了 Opus 4.7。每 token 成本大概是 GPT-5.5 的十二分之一，如果这个数字能兑现，对高频调用场景确实挺省钱。不过现在能看到的只有跑分和成本数字，模型权重和技术报告要等 10 天后才发布。正文没披露这些基准测试的具体条件、有没有针对性地调参，也没说多模态能力在实际场景里的表现怎么样。跑分高不代表落地稳，这点先别太激动。还缺的是：模型参数量多大、推理延迟多少、对硬件要求高不高，以及开源协议是什么。这些信息直接决定它能不能真的塞进业务流水线里用，而不是只在论文里好看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

83

SCORE

H1·K1·R1

15:08

57d ago

AI HOT 精选· aihot-apiZH15:08 · 06·01

商汤发了个8B模型，专治AI画图表时数字乱标、柱子乱跑

商汤新模型SenseNova-U1-8B-MoT-Infographic，专门修AI生成图表时的常见毛病：负值画成正的、柱状图位置偏移、元素关系搞混。模型8B参数，已在Hugging Face开源，GitHub有效果展示。支持实时调布局和设计。正文没披露训练数据量和具体评测指标，所以效果到底多稳还不好说，但至少方向对——AI画图表的硬伤终于有人专门修了。

#Vision#Multimodal#SenseTime#Hugging Face

一句话点评

商汤新模型专治AI画图表的硬伤：负值画成正的、柱状图跑偏、元素关系搞混。8B参数，已开源，支持实时调布局。但正文没披露训练数据量和评测指标，效果多稳还不好说。方向对了，但先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

14:49

57d ago

AI HOT 精选· aihot-apiZH14:49 · 06·01

Luma成立开放物理AI实验室，专攻机器人泛化难题

Luma宣布成立一个开放科学的物理AI实验室，目标是解决物理AI的泛化问题——也就是让机器人在新环境、新任务中也能正常工作，而不是只在训练过的场景里管用。公告没有透露团队规模、具体研究方向、代码或模型是否会开源，以及时间表。

#Robotics#Luma#Research release

一句话点评

Luma 宣布成立开放物理 AI 实验室，专攻机器人在新环境、新任务中的泛化问题。公告没提团队规模、研究方向、是否开源代码或模型，也没给时间表。信息缺口大，先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

14:20

57d ago

AI HOT 精选· aihot-apiZH14:20 · 06·01

OpenRouter 教程：给智能体设个每周1000美元的预算上限

OpenRouter 发了个视频教程，教你怎么给智能体设每周1000美元的预算上限。还提到了模型拒绝列表（不让某些模型干活）、自定义数据保留（数据存多久你说了算）和可堆叠的护栏架构（把安全规则一层层叠起来用）。但正文没披露具体实现代码，也没说超出预算后怎么收费——这点先别太激动，可能只是个概念演示。

#Agent#Safety#Tools#OpenRouter

一句话点评

OpenRouter 出了个视频教程，教你怎么给智能体设每周1000美元的预算上限，还带模型拒绝列表（不让某些模型干活）和自定义数据保留（数据存多久你说了算）。核心卖点是可堆叠的护栏架构——把预算限制、敏感信息检测、提示注入防御这些规则一层层叠起来用。但正文没披露具体实现代码，也没说超出预算后怎么收费——这点先别太激动，可能只是个概念演示。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

14:00

57d ago

AI HOT 精选· aihot-apiZH14:00 · 06·01

百度推新指标 DAA：日活跃智能体数，但没讲怎么算的

百度 AI Pulse 提出用 DAA（日活跃智能体）来衡量智能体时代，并提到自家智能体组合。但正文没披露 DAA 的计算方法、样本范围或具体产品名单，所以这个指标目前只是个概念，没法判断它比 DAU 或留存率好在哪。

#Agent#Baidu#Commentary

一句话点评

百度提了个新指标 DAA（日活跃智能体），想用它衡量智能体时代。但正文没披露怎么算、样本范围或具体产品名单，目前只是个概念，没法判断它比 DAU 或留存率好在哪。先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

39

SCORE

H1·K0·R1

13:51

57d ago

AI HOT 精选· aihot-apiZH13:51 · 06·01

IBM：让模型进业务流程干活，token消耗降到纯LLM的三十分之一

IBM 发了一篇博客，核心观点是：企业要用 AI 做正经事，不能只靠大模型聊天，得让模型进业务流程干活（agent logic）。他们拿自家产品 watsonx Code Assistant for Z 举例——这个工具专门处理大型遗留代码库。相比纯 LLM 硬上，用了程序分析+智能体逻辑后，理解代码的 token 消耗降到约三十分之一，相当于省了 9...

#Agent#Code#Tools#IBM

一句话点评

IBM 用自家产品举例：处理老旧代码库时，把程序分析和智能体逻辑（让模型进业务流程干活）结合起来，理解代码的 token 消耗降到纯 LLM 的约三十分之一，测试生成代码覆盖度提升 20%-45%，token 消耗最高降 15 倍。数字挺漂亮，但这是 IBM 自家产品，效果能否泛化到其他场景、其他代码库，正文没披露。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

13:44

57d ago

AI HOT 精选· aihot-apiZH13:44 · 06·01

有人用 Codex App 搞了 13 个开源项目，从浏览器插件到 AI 技能都有

作者分享了用 Codex App 开发的 13 个开源项目，包括 4 个 Chrome 插件（快捷提示词、新标签页等）、4 个网站（艺术家风格对比、音乐展示等）和 5 个 AI Skill（论文解读、阅读助手等）。技术栈涉及 GPT-Image-2 API、Suno，还整合了 Read-frog、Hyperframe 等开源项目。正文没披露这些项目的实...

#Agent#Code#Tools#Codex App

一句话点评

一个开发者用 Codex App 做了 13 个开源项目，涵盖 Chrome 插件、网站和 AI Skill。亮点是技术栈用了 GPT-Image-2 API 和 Suno，还整合了 Read-frog 等现成项目，开发门槛看起来不高。但正文没披露这些项目的实际用户量或效果数据，所以“好用”这点先别太激动。适合想抄作业的开发者看看思路。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

13:30

57d ago

AI HOT 精选· aihot-apiZH13:30 · 06·01

微软研究：评估智能体行为，代码库比文档更管用

微软研究团队发帖说，大规模评估智能体行为时，用代码库比看文档效果更好。他们没透露具体评估了多少样本、用了什么协议，但直接抛出一个结论：代码库能更真实地反映智能体在任务中的表现。同时，他们邀请全球研究者一起搞“价值对齐”——就是让AI的行为符合人类价值观。正文没披露评估规模或具体协议，这点先别太激动。

#Agent#Alignment#Benchmarking#Microsoft Research

一句话点评

微软研究说，大规模测智能体时，用代码库比看文档更准。但正文没披露测了多少样本、用了什么协议，结论可信度要打折。价值对齐是邀请全球一起搞，没给具体方法。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

67

SCORE

H0·K1·R1

13:03

57d ago

FEATUREDAI HOT 精选· aihot-apiZH13:03 · 06·01

开源与闭源模型，正走在两条不同的增长曲线上

作者 Nathan Lambert 的核心判断是：在编程智能体这类对智商极度敏感的场景里，用户会一直为最聪明的闭源模型付高价，他自己就愿意每月掏 2000 美元。闭源实验室会逐渐把最好的模型藏起来，不在 API 里轻易放出，以保护利润和防止被蒸馏。他预测 5 到 10 年内，OpenAI 和 Anthropic 的估值会到 2 万亿到 10 万亿美元，...

#Agent#Code#Inference-opt#Nathan Lambert

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

作者自己愿意每月掏2000美元用最强闭源模型写代码，这个个人出价说明编程场景里智商溢价极高，但别急着把这个数字当成市场共识。

锐评

Nathan Lambert 这篇的核心判断很直接：在编程智能体这种对智商极度敏感的场景里，用户会一直为最聪明的闭源模型付高价，他自己就愿意每月掏 2000 美元。他预测 5 到 10 年内 OpenAI 和 Anthropic 的估值会到 2 万亿到 10 万亿美元，这个数字跨度本身就说明预测的不确定性很大，先别太当真。他的逻辑链条是：闭源实验室会把最好的模型藏起来，不在 API 里轻易放出，既保护算力供应、防止被蒸馏，也把高利润场景留给自己。开源模型则走另一条路，在固定智商水平上优化成本和可及性。这个判断成立的前提是闭源模型能持续拉大智商差距，但正文没给出具体的性能对比数据来支撑这一点。文章缺的东西比较明显：没有量化闭源和开源模型在编程任务上的实际差距有多大，也没讨论如果开源模型追到“够用”水平，用户还会不会继续付溢价。2000 美元的个人出价是个信号，但离市场定价还差得远。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

13:01

57d ago

FEATUREDAI HOT 精选· aihot-apiZH13:01 · 06·01

OpenBMB 放出两个开源数据集，预训练语料和 SFT 样本都给了，HuggingFace 趋势榜第一

OpenBMB 跟清华 NLP、Modelbest 一起发了两个数据集，都挂在 HuggingFace 上。一个是 Ultra-FineWeb-L3，给预训练用的合成数据，总量超过 600B token，其中英文 400B+、中文 200B+，是目前最大的开源中文预训练合成数据集。另一个是 UltraData-SFT-2605，给模型做指令微调用的，有...

#Fine-tuning#Code#OpenBMB#Tsinghua NLP

精选理由

精选 · 重要度 78 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenBMB 发了两个开源数据集，一个预训练用，一个微调用，中文量级目前最大，但效果验证只在一款小模型上跑过。

锐评

OpenBMB 联合清华 NLP 和 Modelbest 放出了两个数据集，都挂在 HuggingFace 上，直接冲上趋势榜。一个是 Ultra-FineWeb-L3，给预训练用的合成数据，总量超过 600B token，其中中文 200B+，是目前最大的开源中文预训练合成数据集。另一个是 UltraData-SFT-2605，给模型做指令微调用，1500 万条样本，标注了“思考”和“非思考”标签，覆盖数学、代码、知识和指令遵循，是国内首个开源的大规模 SFT 数据集。这两个数据集都基于他们自己的 UltraData L0-L4 框架构建，并在 MiniCPM5-1B 上做了训练验证。但正文没披露在更大规模模型上的验证结果，也没给出具体评测基准和分数。1B 小模型能跑通，不代表 7B、13B 甚至更大模型上效果能线性放大。另外，合成数据的质量高度依赖生成流程和清洗策略，这部分细节正文也没展开。如果是真的省钱——用合成数据替代人工标注和爬取清洗，对预算有限的团队是好事。但“最大”不等于“最好”，中文合成数据的多样性和事实准确性还需要更多第三方验证。建议先拿自己任务试几轮，别直接当生产数据全量灌进去。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

78

SCORE

H1·K1·R1

12:59

57d ago

FEATUREDAI HOT 精选· aihot-apiZH12:59 · 06·01

NVIDIA 开源 Cosmos 3：一个模型搞定物理世界的看、想、动

NVIDIA 在 GTC Taipei 把 Cosmos 3 完全开源了，模型权重、代码和数据集都放了出来。它被叫做首个物理 AI 全能模型，意思是能直接看懂真实世界、预测接下来会发生什么，并给出机器人该做的动作。这次发了两个尺寸：Super 版 320 亿参数，Nano 版 80 亿参数。正文没提具体跑分和硬件门槛，实际部署成本还得自己测。

#Reasoning#Vision#Robotics#NVIDIA

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

NVIDIA 把 Cosmos 3 完全开源了，权重、代码、数据全放出来，两个尺寸：Super 32B 和 Nano 8B。但正文没给任何跑分和硬件门槛，实际能不能跑、跑多快都得自己测。

锐评

NVIDIA 在 GTC Taipei 把 Cosmos 3 完全开源，发了两个尺寸：Super 版 320 亿参数，Nano 版 80 亿参数。它被定位成“物理 AI 全能模型”，意思是模型能直接看视频或传感器画面，理解真实世界里正在发生什么，预测接下来会怎样，并输出机器人该做的动作。这跟纯语言模型不一样，它面向的是具身智能和机器人场景。这次开源比较彻底，权重、代码、数据集都放了出来，对想自己训或微调物理模型的团队是好事。但正文完全没披露任何基准测试成绩、推理延迟、显存需求或硬件建议，也没说数据集规模和质量。所以“全能”目前只是个标签，实际能力得自己跑完才知道。我会先打个折：开源诚意有，但缺验证数据，别急着把它当生产就绪的东西。如果你在做机器人或物理仿真，可以拿 Nano 版先试水，Super 版 32B 参数不小，部署成本不会低，等社区出实测报告再决定不迟。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

12:34

57d ago

FEATUREDAI HOT 精选· aihot-apiZH12:34 · 06·01

美团要把自己的 AI 助手“小美”接进腾讯元宝，让用户在聊天界面就能直接点外卖、叫跑腿

王兴在美团一季度财报电话会上说，美团的 AI 智能体“小美”很快会和腾讯元宝打通。以后你在元宝里说一句本地生活相关的需求，系统会直接跳转到美团的点餐、配送等服务，不用再切 App。王兴还提了一个新说法叫“To A”（服务 AI 智能体），认为这会是美团未来的重要方向。美团一季度营收 910.39 亿元，但亏了 68.27 亿元，由盈转亏。正文没披露“小...

#Agent#Tools#Meituan#Tencent

精选理由

精选 · 重要度 72 · 吸引力 + 知识量 + 共鸣

一句话点评

美团和腾讯元宝要打通了，以后在元宝里说句话就能直接点外卖。但“小美”具体能做什么、体验如何，正文一个字没提，先别太激动。

锐评

王兴提了个新词“To A”，意思是美团以后不光服务人和商家，还要服务各种 AI 助手。逻辑上说得通：如果用户习惯在元宝这类入口里直接办事，美团就得把自己的点餐、配送能力变成 AI 能调用的“技能包”。但这次合作目前只有方向，没有细节。正文没披露“小美”的能力边界、打通后的实际流程，也没说清是技术对接还是商业互换。一季度美团亏了 68 亿，在这个节点推 AI 合作，更像是在讲一个面向未来的故事。真正值得关注的是，当交易入口从 App 转移到别人的 AI 助手时，美团对用户数据和履约链条还能保留多少控制力，这点王兴没展开。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

72

SCORE

H1·K1·R1

12:06

57d ago

FEATUREDAI HOT 精选· aihot-apiZH12:06 · 06·01

用 Claude Opus 4.8 把一本书做成 AI 技能，45 分钟、不到 20 块钱

作者拿《非暴力沟通》试了一遍，用 Claude Opus 4.8 把整本书拆成可调用的 AI 技能。流程分六步：先喂全书文本，让模型分析结构，再提炼框架、原则、技法、反模式和作者语气这五类内容，接着生成技能，最后做一轮自检。技能保留了书里的原始命名，比如 OFNR 四要素和“长颈鹿语言”，但触发词换成了“怎么提意见不像在指责”这种日常说法。全程花了约 ...

#Agent#Tools#Claude#Anthropic

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

45分钟、不到20块钱把一本书做成AI技能，这个成本低到可以随手试。但作者只拿了一本书做例子，换一本结构松散的书效果会不会打折，正文没提。

锐评

这条教程的价值在于把“书变技能”这件事拆成了可复现的六步，而且每一步都给了具体操作，不是泛泛说“让AI读本书”。作者用Claude Opus 4.8的100万token窗口一次性吞下全书，省掉了分块拼接的麻烦，30万token的消耗和不到20元的成本对个人用户来说门槛很低。值得留意的是技能设计里的两个取舍：一是保留了书里的原始术语，比如OFNR四要素和“长颈鹿语言”，但触发词换成了日常说法，这样既没丢掉原书框架，又降低了使用门槛；二是加了自检步骤，让模型自己检查生成的技能有没有跑偏，这个环节在多数教程里容易被跳过。不过全文只演示了一本书，而且是结构清晰的工具类书籍。换成小说、哲学著作或者论证松散的书，这套流程能不能稳住输出质量，正文没有给出验证。另外技能的实际调用效果——比如“怎么提意见不像在指责”这个触发词到底产出什么质量的回答——也没有展示，只能先当个半成品看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

12:00

57d ago

FEATUREDAI HOT 精选· aihot-apiZH12:00 · 06·01

OpenAI 在密歇根州动工开建 1GW 数据中心，属于 Stargate 计划

OpenAI 联合 Oracle 等伙伴，在密歇根州 Saline 市破土动工一个叫“The Barn”的数据中心园区，总供电容量 1GW。官方承诺电费不会转嫁给当地居民，冷却系统用的是闭环设计，耗水量跟一栋普通办公楼差不多。项目预计带来超过 2500 个工会建筑岗位和 450 个长期现场岗位，还会向当地娱乐中心捐 1000 万美元，并在租期内产生约 ...

#Inference-opt#OpenAI#Stargate#Product update

精选理由

精选 · 重要度 81 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenAI 在密歇根动工了一个 1GW 的数据中心，承诺电费不转嫁居民、用水量跟办公楼差不多，但没公布总投资和具体算力配置。

锐评

这条消息是 OpenAI 自己发的，所以重点都在社区关系和就业承诺上，技术细节基本没提。园区叫“The Barn”，总供电容量 1GW，这个数字不小，说明算力规模会很大，但正文没披露里面到底塞多少 GPU、训练还是推理为主，也没说什么时候能投产。官方给了几个实在的数字：2500 多个工会建筑岗位、450 个长期现场岗位，另外向当地娱乐中心捐 1000 万美元，还给密歇根大学生发最高 4500 万美元的 Codex 额度。电费不转嫁和闭环冷却这两条承诺，是针对数据中心最容易被社区反对的点提前打的预防针。缺的东西也很明显：总投资额、建设周期、算力总规模、PUE 这些关键指标全都没写。如果你是想判断这对 OpenAI 推理成本或模型训练节奏的影响，这篇稿子帮不上忙，得等后续第三方披露或者看 Oracle 那边的说法。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

81

SCORE

H1·K1·R1

10:53

57d ago

FEATUREDAI HOT 精选· aihot-apiZH10:53 · 06·01

Apache RocketMQ 出了个 AI 专用版，专门解决多智能体协作时状态丢失和流量打崩的问题

阿里云给 RocketMQ 加了一套 AI 场景的适配，叫 RocketMQ for AI。它主要干三件事：用 Lite-Topics 减少资源开销，靠有序消息防止多智能体协作时上下文乱掉，再通过流量整形避免突发请求把系统打挂。官方说已经在阿里云大规模跑过，代码也开源了，但正文没披露具体版本号和性能对比数据，实际省多少资源还得自己测。

#Agent#Tools#Apache RocketMQ#Alibaba Cloud

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

RocketMQ 出了个 AI 专用版，主打省资源和防乱序，但官方没给性能对比数据，省多少得自己测。

锐评

阿里云给 Apache RocketMQ 加了一套 AI 场景的适配，叫 RocketMQ for AI。核心解决三个问题：用 Lite-Topics 降低多智能体协作时的资源开销，靠有序消息防止上下文在传递中乱掉，再通过流量整形避免突发请求把系统打挂。官方说已经在阿里云大规模跑过，代码也开源了，但正文没披露具体版本号和性能对比数据。这点先别太激动——实际能省多少资源、延迟表现如何，都得自己搭环境测。另外，有序消息具体怎么实现、对吞吐量有多大影响，正文也没展开。如果是真的挺省钱，对跑多智能体工作流的团队是个好消息，但缺了基准测试，判断只能先打个折。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

10:24

57d ago

AI HOT 精选· aihot-apiZH10:24 · 06·01

Runway 在伦敦设欧洲总部，砸钱搞世界模型

Runway 宣布在伦敦设立欧洲总部和世界模型研究中心，计划 18 个月内向英国 AI 生态投 1 亿美元，到 2028 年翻倍。欧洲是 Runway 第二快增长市场，过去一年订阅销量涨了 50%，已有数百万用户，20% 的企业客户在欧洲，包括 BBC、Fremantle 和 WPP。世界模型是 Runway 的核心方向，想用它做机器人、科研和工业模拟...

#Multimodal#Robotics#Runway#BBC

一句话点评

Runway 在伦敦设欧洲总部，18 个月内投 1 亿美元，到 2028 年翻倍。欧洲订阅销量一年涨 50%，已有数百万用户，20% 企业客户在欧洲，包括 BBC、WPP。世界模型是核心方向，想用于机器人、科研和工业模拟。正文没披露具体模型进展或技术细节，更像区域扩张和人才招聘公告。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

10:00

57d ago

AI HOT 精选· aihot-apiZH10:00 · 06·01

OpenAI 前沿模型和 Codex 正式上架 AWS，企业客户可以直接在自家 AWS 环境里调用

OpenAI 把 GPT-5.5 等前沿模型和编程智能体 Codex 放到了 AWS 上，企业客户不用再走单独的采购和安全审批流程，直接在 AWS 的 Bedrock 平台里就能用，还能用上 AWS 自家的安全、合规和账单体系。Codex 每周已有超过 500 万人在用，这次上 AWS 意味着开发团队可以在自己熟悉的云环境里写代码、做代码审查、调试和现...

#Code#OpenAI#AWS#Product update

一句话点评

OpenAI 把 GPT-5.5 和编程智能体 Codex 放到了 AWS Bedrock 上，企业客户不用再单独走采购和安全审批，直接用 AWS 的账单和合规体系就行。Codex 每周超 500 万人用，这次上云让开发团队在熟悉的 AWS 环境里写代码、调试。正文没披露定价和首批可用区域，这点先别太激动。对企业来说，省了采购流程和合规审查时间，但实际成本是否更低、延迟是否可接受，还得看具体配置。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

39

SCORE

H1·K1·R1

09:01

57d ago

FEATUREDAI HOT 精选· aihot-apiZH09:01 · 06·01

腾讯混元给智能体做了个长期记忆插件，叫 Hy-Memory

这个插件是给 OpenClaw 这类需要长期协作的智能体用的，相当于给它们装了个“第二大脑”。它用了一套六层记忆框架，还分了快慢两个系统来处理信息，目的是把零散的记忆整理成更有用的经验。官方给的数据是，记忆数量能砍掉 70% 以上，单条记忆的信息密度反而提升了 45% 多。在要处理超长文本的场景下，消耗的 token 能省下 35%，记忆更新速度也快了...

#Agent#Memory#Tencent Hunyuan#OpenClaw

精选理由

精选 · 重要度 73 · 吸引力 + 知识量 + 共鸣

一句话点评

腾讯给智能体做了个记忆插件，能把零散记忆压缩整理，token 消耗降 35%，但没交代测试场景和基准。

锐评

腾讯混元这个 Hy-Memory 插件，说白了就是给长期干活的智能体装了个更聪明的记事本。它用了一套六层记忆框架，还分了快慢两个系统来处理信息，目的是把一堆零散的记忆碎片，整理成更有用的经验，而不是简单堆砌。官方给的数据挺好看：记忆数量能砍掉 70% 以上，单条记忆的信息密度反而提升了 45% 多。在要处理超长文本的场景下，消耗的 token 能省下 35%，记忆更新速度也快了 20%。这对控制成本和延迟是实打实的好处。不过，正文没披露这些数字是在什么具体任务、多大规模的数据集上测出来的，也没提对比的是哪个基线方案。OpenClaw 这个协作智能体框架本身也还在早期，插件在更复杂的真实业务流里表现如何，现在下结论还太早。另外，快慢双系统的切换逻辑、三层进化链具体怎么进化，这些关键设计细节都没展开，只能等后续技术报告。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

73

SCORE

H1·K1·R1

07:00

57d ago

AI HOT 精选· aihot-apiZH07:00 · 06·01

Cursor 团队版涨价：新增高级席位，用量池分开算

Cursor 更新了 Teams 定价，核心三件事：第一，每个标准席位（年付 $32/月，月付 $40/月）的用量拆成两个独立池子——自家模型 Composer/Auto 一个池，第三方 API 另一个池，互不挤占，相当于变相提了额度。第二，新增 Premium 席位，年付 $96/月（标准的三倍价格），但用量是标准的五倍，官方说 99% 的重度用户一...

#Code#Tools#Cursor#Product update

一句话点评

Cursor 把标准席位的用量拆成自家模型和第三方 API 两个独立池子，互不挤占，相当于变相提了额度。新增 Premium 席位，年付 $96/月（标准三倍价），但用量是五倍，官方说能覆盖 99% 重度用户一整月。对团队来说，混搭席位比全员升档更省钱。但正文没披露具体池子大小，没法算实际性价比。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

69

SCORE

H1·K1·R1

06:13

57d ago

AI HOT 精选· aihot-apiZH06:13 · 06·01

英伟达和台积电把AI搬进晶圆厂，用GPU加速光刻、仿真和质检

英伟达宣布台积电正在用它的GPU和AI工具改造芯片制造流程，覆盖计算光刻、晶体管仿真、制程控制和晶圆厂运营。具体来说：cuLitho把光刻环节的成本效益或生产周期优化了20%到50%（正文没说是成本降了还是周期短了）；cuEST让化学仿真平均快了50倍；cuML用来分析数万道工序里的几十万个参数，降低制程波动；H200 GPU做排程运算来提升产能。另外...

#NVIDIA#TSMC#Product update

一句话点评

英伟达和台积电把AI塞进晶圆厂，覆盖光刻、仿真、质检、排程。cuLitho声称优化20%-50%，但没说是降本还是提速，这点先别太激动。cuEST仿真快50倍，cuML分析几十万参数降波动，H200做排程提产能。数字挺好看，但正文没披露具体产线、部署规模、实测良率提升，更像产品宣传片。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

52

SCORE

H1·K0·R1

05:24

57d ago

FEATUREDAI HOT 精选· aihot-apiZH05:24 · 06·01

Runway 与 NVIDIA 联手搞了个 Cosmos Coalition，要一起做开放的世界模型

Runway 宣布以创始成员身份加入 Cosmos Coalition，跟 NVIDIA 和一批头部 AI 实验室搭伙，目标是共建并开源面向物理 AI 的前沿世界模型。第一个项目是 Runway 和 NVIDIA 联合开发的一个基础模型。世界模型说白了就是让 AI 能理解物理规律、预测下一步会发生什么、并据此行动，Runway 说这是他们从第一天就在押...

#Robotics#Multimodal#Runway#NVIDIA

精选理由

精选 · 重要度 80 · 吸引力 + 知识量 + 共鸣

一句话点评

Runway 和 NVIDIA 牵头搞了个开源联盟，要一起做能理解物理规律的世界模型。第一个模型由两家合练，但正文没提具体参数、训练数据和发布时间。

锐评

Runway 以创始成员身份加入 Cosmos Coalition，跟 NVIDIA 和一批头部 AI 实验室搭伙，目标是共建并开源面向物理 AI 的前沿世界模型。世界模型说白了就是让 AI 能理解物理规律、预测下一步会发生什么、并据此行动，Runway 说这是他们从第一天就在押的方向。第一个项目是 Runway 和 NVIDIA 联合开发的一个基础模型，但公告里没给任何技术细节——模型多大、用什么数据训、什么时候放出来、开源协议是什么，全都没提。这件事值得关注的点在于，Runway 之前一直在做视频生成，现在把旗号打到“物理 AI”上，跟 NVIDIA 绑在一起，显然是想把世界模型从视频生成推到机器人、仿真这类更吃物理理解的场景。但“共建开源生态”这种说法，在没有具体模型和基准测试之前，只能先当合作意向看。还缺的东西挺多：模型的实际能力验证、开源范围、联盟里其他成员是谁、各家贡献怎么分。这些信息不补上，很难判断这个联盟是实打实的研发推进，还是品牌层面的站队。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

80

SCORE

H1·K1·R1

05:00

57d ago

AI HOT 精选· aihot-apiZH05:00 · 06·01

NVIDIA 和 Google Cloud 在 Google I/O 上宣布合作，面向超过 10 万开发者提供 L4 GPU 和 Gemini 模型支持

NVIDIA 和 Google Cloud 在 Google I/O 大会上宣布扩大合作，面向超过 10 万开发者。核心是提供 NVIDIA L4 Tensor Core GPU，用于 AI 推理和图形处理——说白了就是让模型跑得更快、画图更流畅。同时，Vertex AI 平台开始支持 Gemini 模型，开发者可以直接调用。还放出了一批开源工具，覆盖...

#Inference-opt#Tools#NVIDIA#Google Cloud

一句话点评

NVIDIA和Google Cloud在I/O大会上宣布扩大合作，面向10万+开发者。核心是提供L4 GPU用于推理和图形处理，Vertex AI平台也支持Gemini模型。说白了就是让模型跑得更快、画图更流畅，开发者可以直接调用。还放出一批开源工具，覆盖AI应用构建和部署流程。短评：大厂联手铺基建，对开发者是好事，但具体性能提升、成本降低等关键数据没披露，别急着激动。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

39

SCORE

H0·K1·R1

05:00

57d ago

AI HOT 精选· aihot-apiZH05:00 · 06·01

英伟达拉上六家伙伴，要在六大洲铺AI云算力

英伟达宣布与CoreWeave、Firmus、IREN、Nscale等六家伙伴合作，在六大洲建设AI工厂基础设施，覆盖模型训练、微调、推理和agentic AI（让AI自主执行任务）服务，目标客户包括企业、电信公司和国家级AI项目。说白了就是英伟达想把自己的GPU算力铺到全球，让各地客户就近租用，不用自己买卡。合作方里CoreWeave已经是老面孔，I...

#Agent#Fine-tuning#Inference-opt#NVIDIA

一句话点评

英伟达拉上CoreWeave等六家伙伴，要在六大洲铺AI工厂，让客户就近租GPU，不用自己买卡。说白了就是卖算力服务，不是卖卡。合作方里CoreWeave是老面孔，其他几家规模未知。正文没披露具体部署了多少卡、哪些型号、租用价格。如果是H100集群，成本不低；如果是新卡，供货能力存疑。对中小团队来说，多一个就近租卡的选项总是好事，但别指望比自建便宜太多。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

36

SCORE

H0·K1·R1

05:00

57d ago

FEATUREDAI HOT 精选· aihot-apiZH05:00 · 06·01

NVIDIA 发布工厂运营蓝图 FOX，让 AI 智能体接管产线管理

NVIDIA 在台北 GTC 上推出了一个叫 FOX 的工厂运营蓝图，相当于给工厂装了一套能自主管产线的“AI 大脑”。富士康已经用它搭了一个叫 MoMClaw 的多智能体系统，把摄像头、传感器和产线数据喂给多个 AI 智能体，让它们协同干活。官方说，这套系统能把查找产线故障根因的时间缩短 80%，但正文没披露这个数字是在什么规模的产线、什么类型的故障...

#Agent#Tools#NVIDIA#Foxconn

精选理由

精选 · 重要度 72 · 吸引力 + 知识量 + 共鸣

一句话点评

NVIDIA 给工厂发了一套“AI 大脑”蓝图，富士康已经用它搭了多智能体系统。官方说查故障根因能快 80%，但没说是哪种产线、什么故障，这个数字先打个折。

锐评

NVIDIA 在台北 GTC 上推出的 FOX 蓝图，本质是一套让多个 AI 智能体协同管工厂的参考方案。富士康拿它做了 MoMClaw 系统，把摄像头、传感器和产线数据喂给不同智能体，让它们分工排查问题。官方宣称能把查找故障根因的时间缩短 80%，但正文没披露测试的产线规模、故障类型和对比基准，这个数字的参考价值有限。和硕也宣布会跟进，但同样没有落地细节。这套东西对工厂的意义在于，以前产线出问题要靠老师傅挨个环节排查，现在可以让智能体自动调数据、交叉比对。但文章没提智能体之间的协调机制怎么设计，也没说对数据质量和实时性的要求有多高。这些缺口会直接影响实际部署效果。整体看，这是一个产品发布而非技术验证。蓝图有了，早期案例有了，但缺的是可复现的量化结果和更多第三方工厂的实测反馈。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

72

SCORE

H1·K1·R1

05:00

57d ago

AI HOT 精选· aihot-apiZH05:00 · 06·01

NVIDIA 发工厂 AI 大脑蓝图，富士康先用上了

NVIDIA 发布了一套叫 FOX 的工厂运营蓝图，本质上是给工厂管理用的 AI 智能体（让模型进业务流程干活）的参考设计。富士康基于它做了个多智能体系统 MoMClaw，号称能把故障根因分析时间缩短 80%，劳动生产率提升 15%，机器故障率下降 10%。数字挺好看，但正文没披露这些数据是在什么规模、什么产线上测的，也没说用了多少样本、部署成本多少。...

#Agent#Robotics#Tools#NVIDIA

一句话点评

NVIDIA 出了个 FOX 蓝图，教工厂怎么用 AI 智能体管生产。富士康照着做了套 MoMClaw 系统，号称故障根因分析快 80%，劳动效率提 15%，故障率降 10%。数字挺漂亮，但正文没披露在什么产线、多大规模、多少样本下测的，也没说部署成本。先打个折，别急着信。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

39

SCORE

H0·K1·R1

05:00

57d ago

AI HOT 精选· aihot-apiZH05:00 · 06·01

台湾500家供应商开造Vera Rubin NVL72，台积电用cuLitho省了20%-50%成本

NVIDIA发了一篇台湾生态的进展：超过500家台湾合作伙伴正在生产Vera Rubin NVL72基础设施，这是下一代AI服务器系统。台积电用NVIDIA的cuLitho（计算光刻技术）把芯片制造环节的成本或周期缩短了20%-50%，数字挺实在。正文没披露具体哪些台湾厂商、订单金额或交付时间，所以这点先别太激动，但500家这个规模说明台湾供应链在AI...

#Vision#Robotics#Inference-opt#NVIDIA

一句话点评

NVIDIA 官宣台湾超 500 家伙伴在生产 Vera Rubin NVL72，台积电用 cuLitho（计算光刻）省了 20%-50% 成本或周期。数字挺实在，但正文没披露具体厂商、订单金额和交付时间，所以先别太激动。500 家这个规模说明台湾供应链在 AI 硬件里确实绕不开，但这是 NVIDIA 自家博客，得等第三方验证。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H0·K1·R1

04:49

57d ago

AI HOT 精选· aihot-apiZH04:49 · 06·01

NVIDIA 开源 AlpaGym：让自动驾驶模型在模拟器里“边开边学”，弥补训练和实际部署的差距

NVIDIA 发布了 AlpaGym，一个用于自动驾驶模型后训练的强化学习框架。核心思路是：之前模型训练大多是“开环”的，只看模型输出和标准答案的差距，不看这个输出放到真实环境里会引发什么后果。AlpaGym 把模拟器 AlpaSim 的反馈直接连到训练循环里，让模型在模拟场景里“边开边学”，自己踩的坑自己记住。这样能暴露静态数据集里发现不了的错误累积...

#Robotics#Reasoning#NVIDIA#Research release

一句话点评

NVIDIA 把自动驾驶模型训练从“对答案”改成“进模拟器边开边学”，让模型自己踩坑自己改。关键是用 AlpaSim 模拟器做强化学习，模型每次刹车、转向的后果都反馈回训练循环，能暴露静态数据集里发现不了的错误累积。但正文没披露用了多少场景、跑了多少步、比开环训练提升多少，目前更像一个工具框架发布，效果验证还缺数据。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

61

SCORE

H0·K1·R0

更多

✕

频道

热点聚合每日 AI 日报全部播客·视频 AX 严选 X 监控收藏信源邮件订阅 Agent 接入

后台

用量系统订阅管理精选策略策略迭代用户