ax@ax-radar:~/curated $ grep -l 'curated=true' sources/
41 srcsignal 72%cycle 04:32

AX 严选 · 2026-06-01

38 · updated 3m ago
按日期浏览清除筛选
2026年6月
138235332422532610788299441029112912151371415161718192021222324252627282930
2026-06-01 · 星期一2026年6月1日
23:10
11d ago
AI HOT 精选· aihot-apiZH23:10 · 06·01
Sam Altman:AI 发展不能脱离人的需求
Sam Altman 在采访里说,AI 不该去追求跟人类需求无关的目标,人必须始终在 AI 发展里占中心位置。他怼了行业里“AI 会摧毁大量工作”这类说法,认为大家怕的不是 AI 的好处,而是担心自己未来还有没有角色、经济前景和自主权。他还点出 AI 行业的一个失败:没讲清楚人类怎么在每一步都保持对未来的控制,以及 AI 时代怎么继续过充实、有意义的生...
#Alignment#Safety#Sam Altman#Commentary
精选理由
HKR三项均不达标:这是一条缺乏采访背景、具体机制和可验证细节的Altman安全表态。按0/3规则,排除。
一句话点评
Sam Altman 说 AI 不该追求脱离人类需求的目标,并批评行业没讲清人类如何保持控制。但全文没披露采访日期、完整问答或任何具体治理机制,更像立场表态而非方案。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K0·R0
22:11
11d ago
AI HOT 精选· aihot-apiZH22:11 · 06·01
ChatGPT 新增全屏编辑和保存草稿功能
ChatGPT 现在支持全屏编辑长文,写好的内容可以保存到资料库,方便以后接着改。正文没披露单次能写多长、能存多少草稿。
#Tools#Memory#ChatGPT#Product update
精选理由
HKR-K 和 HKR-R 通过:文章给出了两个具体的工作流机制,但没有披露限制、上线范围或账户条款。这是 ChatGPT 一次常规的产品更新,不是重大能力发布。
一句话点评
ChatGPT 现在能全屏写长文并保存到资料库,方便回头接着改。但正文没披露单次能写多长、能存多少草稿,实际可用性要打问号。短评:写长文终于不用挤小框了,但容量限制没说,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
21:04
11d ago
AI HOT 精选· aihot-apiZH21:04 · 06·01
Krea AI 把 Krea 2 LoRAs 开放给所有人用了
Krea AI 宣布 Krea 2 LoRAs 现在全员可用,推文只贴了一个示例链接,没提训练机制、定价或使用限制。如果你之前没权限,现在可以直接试了。
#Fine-tuning#Krea AI#Product update
精选理由
一个小的产品可用性更新:K 通过是因为全员开放是个具体变化;H 和 R 弱,因为正文没提训练机制、价格、限制或效果证据。
一句话点评
Krea 2 的 LoRA 微调功能现在全员开放了,之前没权限的可以直接上手试。推文只贴了一个示例链接,没提训练机制、定价或使用限制——这点先别太激动,具体好不好用、要不要钱都还不知道。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
19:46
11d ago
AI HOT 精选· aihot-apiZH19:46 · 06·01
Replit:一个提示词生成网站、App、幻灯片和发布视频
Replit 宣布用户现在可以用单个提示词免费生成一个完整的业务——包括网站、移动应用、幻灯片和发布视频,还附带 Stripe Atlas、QuickBooks、Mercury 等服务的福利。正文没披露免费额度上限、功能覆盖范围以及免费期后的定价,所以实际能跑多复杂的业务还不清楚。如果真能一个提示词搞定全栈加营销素材,对独立开发者和小团队来说省不少事,...
#Agent#Code#Tools#Replit
精选理由
H、K、R 都达标,但来源只是官方 X 帖子,只提了功能名和合作方名字,没披露用了什么模型、成功率、定价限制或可复现的案例。当一条正常的 AI 编程产品更新处理就行,别过度解读。
一句话点评
Replit 说一个提示词就能免费生成完整业务——网站、App、幻灯片、发布视频全包,还送 Stripe Atlas 等工具福利。听着很猛,但正文没披露免费额度上限、功能覆盖范围以及免费期后的定价,所以实际能跑多复杂的业务还不清楚。如果真能一个提示词搞定全栈加营销素材,对独立开发者和小团队来说省不少事,但这点先别太激动,等实测出来再说。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
18:28
11d ago
AI HOT 精选· aihot-apiZH18:28 · 06·01
Google 展示并行子智能体自动整理文件
Google AI 发了个演示:用 Antigravity 里的并行子智能体,自动给几百个营销素材分类、重命名,省掉手动整理。正文没披露跑一次要多久、失败率多少、有没有人工复核环节,所以实际好不好用还不清楚。
#Agent#Tools#Google AI#Antigravity
精选理由
HKR 全过:并行子智能体加数百个资产构成具体抓手,也引发可靠性讨论。但只是 Google AI 单次演示,正文没披露运行时间、失败率或人工复核流程,所以分数压在 60–71 区间。
一句话点评
Google AI 演示了 Antigravity 的并行子智能体,能自动给几百个营销素材分类、重命名,省掉手动整理。亮点是“并行”处理,理论上比串行快。但正文没披露跑一次要多久、失败率多少、有没有人工复核,所以实际好不好用还不清楚。短评:并行整理文件省人工,但没给跑分和失败率,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:56
11d ago
AI HOT 精选· aihot-apiZH15:56 · 06·01
OpenRouter 新增成本质量滑块:0 用最强模型,10 用最便宜
OpenRouter 的 Auto Router 加了一个 `cost_quality_tradeoff` 参数,取值 0 到 10。设为 0 就永远选最强模型不管价格,设为 10 就永远选最便宜的。中间值可以自己调,相当于在效果和烧钱之间拉个滑块。正文没披露默认值是多少,也没说具体怎么算中间档的模型排序。
#Tools#Inference-opt#OpenRouter#Product update
精选理由
OpenRouter 给 Auto Router 加了个成本质量权衡旋钮,0到10,0用最强模型,10用最便宜。对天天算 API 账单的开发者来说,这是个实用的小更新,但只是路由策略上的微调,不算大新闻。
一句话点评
OpenRouter 的 Auto Router 新增了一个 0-10 的滑块参数,0 代表无脑选最强模型(不管多贵),10 代表永远选最便宜的。中间值可以自己调,相当于在效果和烧钱之间拉个杠杆。正文没披露默认值,也没说中间档的模型排序逻辑,所以实际效果得自己试。对预算敏感但又要保底质量的团队挺实用,但别指望它自动帮你找到最优解。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:53
11d ago
● P1AI HOT 精选· aihot-apiZH15:53 · 06·01
智谱计划在科创板上市,拟发行新股占总股本 2% 到 8%
智谱在港交所发公告,准备申请在 A 股科创板上市。这次发行的全是新股,数量在 910 万到 3877 万股之间,占发行后总股本的 2% 到 8%,老股东不卖旧股。融来的钱主要投向三个地方:通用基座大模型、大模型 MaaS 一站式服务平台,以及补充流动资金。另外公司打算把英文名从 Knowledge Atlas 改成 Z.AI。公告没披露具体的募资金额和...
#Zhipu#Z.AI#Funding
精选理由
智谱申请 A 股科创板上市,是国产基础模型公司里第一个明确走这条路的。公告给了新股占比区间 2%-8%,也说了钱要花在通用基座大模型、MaaS 平台和补充流动资金上,但没披露具体募资金额和时间表。我会先打个折:没金额就没法算估值,这点先别太激动。不过动作本身信号很强,说明头部玩家已经在抢资本市场的座次了。
一句话点评
智谱要回A股科创板了,新股占2%到8%,老股东不套现。但公告没写融多少钱,估值和定价都还是未知数。
锐评
智谱在港交所发公告,计划在科创板发新股,数量在910万到3877万股之间,占发行后总股本的2%到8%。老股东这次不卖旧股,说明不是套现离场,而是公司想拿钱办事。融来的钱主要投向三个地方:通用基座大模型、大模型MaaS一站式服务平台,以及补充流动资金。从投向看,智谱还是想继续烧钱做大模型底座和卖模型服务,没有突然转向做应用。 但公告没披露具体的募资金额,也没给估值区间。这就让这条消息的含金量打了折扣——不知道它觉得自己值多少钱,也不知道市场会怎么接。另外,公司打算把英文名从Knowledge Atlas改成Z.AI,更像一个品牌动作,对业务实质影响不大。 还缺的关键信息是:科创板对未盈利企业的上市门槛怎么卡,智谱现在的亏损情况和现金流能不能撑到挂牌。这些公告都没提,需要等后续招股书出来再看。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
15:08
11d ago
AI HOT 精选· aihot-apiZH15:08 · 06·01
商汤发了个8B模型,专治AI画图表时数字乱标、柱子乱跑
商汤新模型SenseNova-U1-8B-MoT-Infographic,专门修AI生成图表时的常见毛病:负值画成正的、柱状图位置偏移、元素关系搞混。模型8B参数,已在Hugging Face开源,GitHub有效果展示。支持实时调布局和设计。正文没披露训练数据量和具体评测指标,所以效果到底多稳还不好说,但至少方向对——AI画图表的硬伤终于有人专门修了。
#Vision#Multimodal#SenseTime#Hugging Face
精选理由
商汤发了个8B参数的小模型,专门修AI画图表时的负值显示错、柱子歪、元素乱这三个毛病,模型放Hugging Face上了。正文没披露评测基准、许可证类型和推理成本,信息比较薄,属于小模型更新类消息,给60-71分合理。
一句话点评
商汤新模型专治AI画图表的硬伤:负值画成正的、柱状图跑偏、元素关系搞混。8B参数,已开源,支持实时调布局。但正文没披露训练数据量和评测指标,效果多稳还不好说。方向对了,但先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:49
11d ago
AI HOT 精选· aihot-apiZH14:49 · 06·01
Luma成立开放物理AI实验室,专攻机器人泛化难题
Luma宣布成立一个开放科学的物理AI实验室,目标是解决物理AI的泛化问题——也就是让机器人在新环境、新任务中也能正常工作,而不是只在训练过的场景里管用。公告没有透露团队规模、具体研究方向、代码或模型是否会开源,以及时间表。
#Robotics#Luma#Research release
精选理由
HKR-H和HKR-R成立,但HKR-K弱:文章只宣布了实验室成立,没有路线图、人员或可复现的工作。这符合小型研究机构公告的60–71分区间。
一句话点评
Luma 宣布成立开放物理 AI 实验室,专攻机器人在新环境、新任务中的泛化问题。公告没提团队规模、研究方向、是否开源代码或模型,也没给时间表。信息缺口大,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
14:20
11d ago
AI HOT 精选· aihot-apiZH14:20 · 06·01
OpenRouter 教程:给智能体设个每周1000美元的预算上限
OpenRouter 发了个视频教程,教你怎么给智能体设每周1000美元的预算上限。还提到了模型拒绝列表(不让某些模型干活)、自定义数据保留(数据存多久你说了算)和可堆叠的护栏架构(把安全规则一层层叠起来用)。但正文没披露具体实现代码,也没说超出预算后怎么收费——这点先别太激动,可能只是个概念演示。
#Agent#Safety#Tools#OpenRouter
精选理由
HKR全过,因为教程给出了具体的成本上限和护栏机制,不是空谈。分数留在60–71区间:这是OpenRouter的产品教程,不是模型发布或平台级变化,信息量够但影响力有限。
一句话点评
OpenRouter 出了个视频教程,教你怎么给智能体设每周1000美元的预算上限,还带模型拒绝列表(不让某些模型干活)和自定义数据保留(数据存多久你说了算)。核心卖点是可堆叠的护栏架构——把预算限制、敏感信息检测、提示注入防御这些规则一层层叠起来用。但正文没披露具体实现代码,也没说超出预算后怎么收费——这点先别太激动,可能只是个概念演示。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:00
12d ago
AI HOT 精选· aihot-apiZH14:00 · 06·01
百度推新指标 DAA:日活跃智能体数,但没讲怎么算的
百度 AI Pulse 提出用 DAA(日活跃智能体)来衡量智能体时代,并提到自家智能体组合。但正文没披露 DAA 的计算方法、样本范围或具体产品名单,所以这个指标目前只是个概念,没法判断它比 DAU 或留存率好在哪。
#Agent#Baidu#Commentary
精选理由
触发硬排除规则6:这是一篇指标评论文章,没有数据、方法论、样本或案例。DAA是个好钩子,但信号不够,不值得推荐。
一句话点评
百度提了个新指标 DAA(日活跃智能体),想用它衡量智能体时代。但正文没披露怎么算、样本范围或具体产品名单,目前只是个概念,没法判断它比 DAU 或留存率好在哪。先别太激动。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K0·R1
13:51
12d ago
AI HOT 精选· aihot-apiZH13:51 · 06·01
IBM:让模型进业务流程干活,token消耗降到纯LLM的三十分之一
IBM 发了一篇博客,核心观点是:企业要用 AI 做正经事,不能只靠大模型聊天,得让模型进业务流程干活(agent logic)。他们拿自家产品 watsonx Code Assistant for Z 举例——这个工具专门处理大型遗留代码库。相比纯 LLM 硬上,用了程序分析+智能体逻辑后,理解代码的 token 消耗降到约三十分之一,相当于省了 9...
#Agent#Code#Tools#IBM
精选理由
HKR 三项都过,但这是 IBM 围绕 watsonx 写的厂商博客,不是独立评测或产品发布。具体指标让它不至于沦为公关稿,但缺少复现细节和独立验证,所以分数压在 60-71 区间。
一句话点评
IBM 用自家产品举例:处理老旧代码库时,把程序分析和智能体逻辑(让模型进业务流程干活)结合起来,理解代码的 token 消耗降到纯 LLM 的约三十分之一,测试生成代码覆盖度提升 20%-45%,token 消耗最高降 15 倍。数字挺漂亮,但这是 IBM 自家产品,效果能否泛化到其他场景、其他代码库,正文没披露。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
13:44
12d ago
AI HOT 精选· aihot-apiZH13:44 · 06·01
有人用 Codex App 搞了 13 个开源项目,从浏览器插件到 AI 技能都有
作者分享了用 Codex App 开发的 13 个开源项目,包括 4 个 Chrome 插件(快捷提示词、新标签页等)、4 个网站(艺术家风格对比、音乐展示等)和 5 个 AI Skill(论文解读、阅读助手等)。技术栈涉及 GPT-Image-2 API、Suno,还整合了 Read-frog、Hyperframe 等开源项目。正文没披露这些项目的实...
#Agent#Code#Tools#Codex App
精选理由
HKR全通过,因为帖子给出了13个Codex App项目的具体清单。重要性在60-71区间:缺少构建过程、质量证据和可复现条件。
一句话点评
一个开发者用 Codex App 做了 13 个开源项目,涵盖 Chrome 插件、网站和 AI Skill。亮点是技术栈用了 GPT-Image-2 API 和 Suno,还整合了 Read-frog 等现成项目,开发门槛看起来不高。但正文没披露这些项目的实际用户量或效果数据,所以“好用”这点先别太激动。适合想抄作业的开发者看看思路。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
13:30
12d ago
AI HOT 精选· aihot-apiZH13:30 · 06·01
微软研究:评估智能体行为,代码库比文档更管用
微软研究团队发帖说,大规模评估智能体行为时,用代码库比看文档效果更好。他们没透露具体评估了多少样本、用了什么协议,但直接抛出一个结论:代码库能更真实地反映智能体在任务中的表现。同时,他们邀请全球研究者一起搞“价值对齐”——就是让AI的行为符合人类价值观。正文没披露评估规模或具体协议,这点先别太激动。
#Agent#Alignment#Benchmarking#Microsoft Research
精选理由
微软研究院这篇讲智能体行为评估,核心结论是代码库比文档更有效,但没交代评估用了多少样本、什么场景,验证力度打折扣。价值对齐部分只是邀请参与,没有具体方法或数据。对从业者来说,代码库优于文档这个判断可以拿来参考,但别直接照搬——规模未知,效果可能不通用。整体信息密度中等,适合泛读标记。
一句话点评
微软研究说,大规模测智能体时,用代码库比看文档更准。但正文没披露测了多少样本、用了什么协议,结论可信度要打折。价值对齐是邀请全球一起搞,没给具体方法。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
10:24
12d ago
AI HOT 精选· aihot-apiZH10:24 · 06·01
Runway 在伦敦设欧洲总部,砸钱搞世界模型
Runway 宣布在伦敦设立欧洲总部和世界模型研究中心,计划 18 个月内向英国 AI 生态投 1 亿美元,到 2028 年翻倍。欧洲是 Runway 第二快增长市场,过去一年订阅销量涨了 50%,已有数百万用户,20% 的企业客户在欧洲,包括 BBC、Fremantle 和 WPP。世界模型是 Runway 的核心方向,想用它做机器人、科研和工业模拟...
#Multimodal#Robotics#Runway#BBC
精选理由
Runway 在伦敦设欧洲总部和世界模型研究中心,计划18个月投1亿美元,2028年前翻倍。有地点、有投资额、有时间线,信息够具体。但正文没披露任何新模型、论文或产品能力,属于常规行业新闻的上限。
一句话点评
Runway 在伦敦设欧洲总部,18 个月内投 1 亿美元,到 2028 年翻倍。欧洲订阅销量一年涨 50%,已有数百万用户,20% 企业客户在欧洲,包括 BBC、WPP。世界模型是核心方向,想用于机器人、科研和工业模拟。正文没披露具体模型进展或技术细节,更像区域扩张和人才招聘公告。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:00
12d ago
AI HOT 精选· aihot-apiZH07:00 · 06·01
Cursor 团队版涨价:新增高级席位,用量池分开算
Cursor 更新了 Teams 定价,核心三件事:第一,每个标准席位(年付 $32/月,月付 $40/月)的用量拆成两个独立池子——自家模型 Composer/Auto 一个池,第三方 API 另一个池,互不挤占,相当于变相提了额度。第二,新增 Premium 席位,年付 $96/月(标准的三倍价格),但用量是标准的五倍,官方说 99% 的重度用户一...
#Code#Tools#Cursor#Product update
精选理由
HKR三项全过,但这是Cursor Teams的定价机制更新,不是新的Agent能力或模型发布,落在60–71的产品/业务更新区间,所以给69分和all层级。
一句话点评
Cursor 把标准席位的用量拆成自家模型和第三方 API 两个独立池子,互不挤占,相当于变相提了额度。新增 Premium 席位,年付 $96/月(标准三倍价),但用量是五倍,官方说能覆盖 99% 重度用户一整月。对团队来说,混搭席位比全员升档更省钱。但正文没披露具体池子大小,没法算实际性价比。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
06:13
12d ago
AI HOT 精选· aihot-apiZH06:13 · 06·01
英伟达和台积电把AI搬进晶圆厂,用GPU加速光刻、仿真和质检
英伟达宣布台积电正在用它的GPU和AI工具改造芯片制造流程,覆盖计算光刻、晶体管仿真、制程控制和晶圆厂运营。具体来说:cuLitho把光刻环节的成本效益或生产周期优化了20%到50%(正文没说是成本降了还是周期短了);cuEST让化学仿真平均快了50倍;cuML用来分析数万道工序里的几十万个参数,降低制程波动;H200 GPU做排程运算来提升产能。另外...
#NVIDIA#TSMC#Product update
精选理由
H和R勉强过关,因为英伟达、台积电和晶圆厂确实戳中算力供应链。K直接挂掉:没披露任何可验证的机制或指标,所以只能归到低信息密度的常规报道档位。
一句话点评
英伟达和台积电把AI塞进晶圆厂,覆盖光刻、仿真、质检、排程。cuLitho声称优化20%-50%,但没说是降本还是提速,这点先别太激动。cuEST仿真快50倍,cuML分析几十万参数降波动,H200做排程提产能。数字挺好看,但正文没披露具体产线、部署规模、实测良率提升,更像产品宣传片。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
05:00
12d ago
AI HOT 精选· aihot-apiZH05:00 · 06·01
NVIDIA 和 Google Cloud 在 Google I/O 上宣布合作,面向超过 10 万开发者提供 L4 GPU 和 Gemini 模型支持
NVIDIA 和 Google Cloud 在 Google I/O 大会上宣布扩大合作,面向超过 10 万开发者。核心是提供 NVIDIA L4 Tensor Core GPU,用于 AI 推理和图形处理——说白了就是让模型跑得更快、画图更流畅。同时,Vertex AI 平台开始支持 Gemini 模型,开发者可以直接调用。还放出了一批开源工具,覆盖...
#Inference-opt#Tools#NVIDIA#Google Cloud
精选理由
触发了硬排除规则:云厂商合作推广。NVIDIA与Google Cloud的项目有具体数字,但本质仍是厂商宣传,没有颠覆性产品,因此重要性上限为39。
一句话点评
NVIDIA和Google Cloud在I/O大会上宣布扩大合作,面向10万+开发者。核心是提供L4 GPU用于推理和图形处理,Vertex AI平台也支持Gemini模型。说白了就是让模型跑得更快、画图更流畅,开发者可以直接调用。还放出一批开源工具,覆盖AI应用构建和部署流程。 短评:大厂联手铺基建,对开发者是好事,但具体性能提升、成本降低等关键数据没披露,别急着激动。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H0·K1·R1
04:49
12d ago
AI HOT 精选· aihot-apiZH04:49 · 06·01
NVIDIA 开源 AlpaGym:让自动驾驶模型在模拟器里“边开边学”,弥补训练和实际部署的差距
NVIDIA 发布了 AlpaGym,一个用于自动驾驶模型后训练的强化学习框架。核心思路是:之前模型训练大多是“开环”的,只看模型输出和标准答案的差距,不看这个输出放到真实环境里会引发什么后果。AlpaGym 把模拟器 AlpaSim 的反馈直接连到训练循环里,让模型在模拟场景里“边开边学”,自己踩的坑自己记住。这样能暴露静态数据集里发现不了的错误累积...
#Robotics#Reasoning#NVIDIA#Research release
精选理由
HKR-K通过,因为文章解释了闭环后训练的概念;但HKR-H/R不通过:没有基准数据、数据规模或广泛的行业钩子。这是一篇狭窄的NVIDIA开发者教程,不是硬排除项。
一句话点评
NVIDIA 把自动驾驶模型训练从“对答案”改成“进模拟器边开边学”,让模型自己踩坑自己改。关键是用 AlpaSim 模拟器做强化学习,模型每次刹车、转向的后果都反馈回训练循环,能暴露静态数据集里发现不了的错误累积。但正文没披露用了多少场景、跑了多少步、比开环训练提升多少,目前更像一个工具框架发布,效果验证还缺数据。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
04:35
12d ago
AI HOT 精选· aihot-apiZH04:35 · 06·01
Nemotron 3 Ultra 本周发布
NVIDIA AI 官方账号发了一条推文,说 Nemotron 3 Ultra 本周发布。正文只有这一句,没提模型参数量、上下文窗口、许可证、价格或发布渠道。目前能确认的只有发布时间窗口,其他信息等后续披露。
#NVIDIA#Product update
精选理由
H 和 R 通过,K 不通过:这只是一条 Nemotron 3 Ultra 的预告,没有规格、许可证或访问路径,属于小型产品更新。
一句话点评
NVIDIA 官宣 Nemotron 3 Ultra 本周发,但推文就一句话,没提参数量、上下文窗口、许可证或价格。目前只能确认发布时间,其他全是空。短评:先别激动,等具体参数和开源情况。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
03:59
12d ago
AI HOT 精选· aihot-apiZH03:59 · 06·01
NVIDIA Vera CPU:专为AI智能体工作负载设计的服务器芯片
NVIDIA发了一篇博客,讲他们新出的Vera CPU怎么给AI智能体(就是那种会自己调用工具、跑代码、查资料的模型)提速。核心逻辑是:以前大家只盯着GPU,但智能体每干一步——比如编译代码、跑个Python脚本、查数据库——都得靠CPU执行,而且步骤越多,CPU就成了瓶颈。Vera CPU有88个自研核心,配1.2 TB/s的LPDDR5X内存带宽,...
#Agent#Inference-opt#NVIDIA#Product update
精选理由
HKR-K勉强通过:Vera CPU明确关联了智能体工作负载和四种扩展机制。HKR-H和HKR-R不通过,因为正文只有厂商话术,没有性能、定价或可用性数据。
一句话点评
NVIDIA 发了一篇博客,说他们新出的 Vera CPU 专门给 AI 智能体(会自己调用工具、跑代码、查资料的那种模型)提速。核心逻辑是:以前大家只盯着 GPU,但智能体每干一步——比如编译代码、跑个 Python 脚本、查数据库——都得靠 CPU 执行,而且步骤越多,CPU 就成了瓶颈。Vera CPU 有 88 个自研核心,配 1.2 TB/s 的 LPDDR5X 内存带宽,官方说能...
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H0·K1·R0
03:39
12d ago
● P1AI HOT 精选· aihot-apiZH03:39 · 06·01
MiniMax 开源 M3 模型,支持百万 token 上下文和原生多模态
MiniMax 把 M3 模型开源了,权重公开可下载。它把三个能力塞进了一个模型里:编程水平摸到了 GPT-5.5 和 Gemini 3.1 Pro 的边(SWE-Bench Pro 得分 59.0%),能处理 100 万 token 的超长上下文,还原生支持图片和视频输入。长上下文不卡顿的关键是他们自研的 MSA 稀疏注意力机制——在 100 万 t...
#Code#Agent#Multimodal#MiniMax
精选理由
MiniMax M3开源了一个把文本、图像、音频塞进同一个模型的一体方案,上下文窗口拉到100万token。最实在的点是MSA注意力机制,每token计算成本降到前代的1/20,长文本推理能省不少钱。编码和Agent跑分看着不错,但正文没给出具体对比对象和测试细节,这点先别太激动。整体是一次有诚意的开源发布,信息量够,但验证还缺一环,所以放在featured而不是P1。
一句话点评
MiniMax 开源了 M3,一个模型同时搞定写代码、读百万 token 长文和看图看视频,目前开源模型里第一个做到这三合一的。
锐评
M3 最值得看的是它把三个能力打包进一个开源模型:写代码、处理超长上下文(100 万 token,差不多能一次吞下三体三部曲的量)和原生多模态(直接看懂图片和视频)。这在闭源模型里已经是标配,但开源模型里 M3 是第一个同时做到的。 性能数字挺能打:SWE-Bench Pro 编程测试拿了 59%,超过了 GPT-5.5 和 Gemini 3.1 Pro,逼近 Opus 4.7。在 SVG 生成和文档理解上也有超过头部闭源模型的成绩。不过这些基准测试和真实使用场景有差距,MiniMax 自己也承认了,所以他们搞了个模拟真实开发者行为的交互式评估框架,但正文没披露这个框架的具体数据和验证方式。 长上下文能跑起来靠的是他们自研的 MSA 稀疏注意力架构,把计算量砍到了原来的二十分之一,预填充阶段快 9 倍以上,解码阶段快 15 倍以上。这个优化思路很实际,但正文没给出 MSA 在哪些能力上比全注意力有明显折损,只说“绝大多数能力匹配”。这点先别太激动,等第三方实测。另外,模型权重开放到什么程度、商用条款怎么样,正文也没提,想直接拿来用的得自己去翻他们的授权协议。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
03:36
12d ago
AI HOT 精选· aihot-apiZH03:36 · 06·01
NVIDIA 把 AI 工厂的操作系统 DSX OS 开源了,目标是省电、快上线、少宕机
NVIDIA 正式发布了 DSX OS,这是一套专门给 AI 工厂(大规模跑推理和训练的算力集群)用的开源、模块化软件栈。它覆盖了从能源、芯片、基础设施到模型和应用五个层面,核心目标是让 AI 工厂更快投产、更省电、更稳定。正文提到,DSX OS 能把固定电力预算下能跑的 GPU 数量提升最多 40%,对推理性能影响很小——这对电费占大头的算力运营方来...
#Inference-opt#Tools#NVIDIA#Product update
精选理由
触发硬排除-纯营销:NVIDIA官方博客介绍了DSX OS的堆栈框架,但未披露版本、定价、部署条件或可验证的性能。HKR-K勉强通过;HKR-H/R不通过。
一句话点评
NVIDIA 把 AI 工厂的软件栈开源了,叫 DSX OS,覆盖能源、芯片、基础设施、模型和应用五层。核心卖点:固定电力下 GPU 数量最多能提 40%,对推理性能影响很小——电费大头玩家可以算算账。但正文没披露版本号、定价和部署门槛,开源到什么程度、能不能直接上手跑还不清楚。先别太激动,等实测。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
02:16
12d ago
AI HOT 精选· aihot-apiZH02:16 · 06·01
上海发文支持多模态智能体,自动驾驶要在共享出行和物流里落地
上海市政府发了服务业“十五五”规划,明确要支持多模态智能体开发,推动智能客服、智能运营这些工具规模化用起来。自动驾驶方面,说要“有序推进”在共享出行、物流运输等场景的应用。规划还提了具身智能,让机器人进家庭、养老、文旅场景。不过正文没披露具体预算、时间表或落地目标,所以目前还只是方向性表态,不是执行方案。
#Agent#Multimodal#Robotics#Shanghai Municipal People's Government
精选理由
这是一份上海市政府办公厅印发的服务业“十五五”规划摘要,点名支持多模态智能体、MaaS、智能驾驶和具身智能产品,场景覆盖共享出行、物流、家庭、养老、文旅。信息本身有政策指向性,但正文没披露资金规模、落地时间表或具体试点项目,所以只能算政策风向,不是执行信号。评分卡在66分合理:知道方向,但没法判断力度和节奏。
一句话点评
上海发了服务业“十五五”规划,明确支持多模态智能体、智能驾驶和具身机器人。方向很全,但正文没披露预算、时间表或落地目标,目前只是方向性表态,不是执行方案。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
00:00
12d ago
AI HOT 精选· aihot-apiZH00:00 · 06·01
AI 看跌情绪地图:做空比例最高的是 GPU 云厂商,不是英伟达
风投 Tomasz Tunguz 统计了 AI 相关股票的做空比例(卖空股数/总流通股),发现市场对 AI 的怀疑集中在特定板块,不是全面看空。AI 云和 neocloud(GPU 算力租赁公司)的中位做空比例最高,达 16.8%,远高于 SaaS 的 9.5% 和开发者工具的 8.9%。做空比例最高的个股都是中小市值公司:SoundHound AI ...
#NVIDIA#Commentary
精选理由
HKR三项都达标,但原文只给了空头比例对比,没有列出具体公司、时间窗口或统计方法。作为市场情绪评论有用,但信息缺口明显,不值得上精选。
一句话点评
风投 Tomasz Tunguz 统计了 AI 相关股票的做空比例,发现市场对 AI 的怀疑集中在特定板块,不是全面看空。AI 云和 neocloud(GPU 算力租赁公司)的中位做空比例最高,达 16.8%,远高于 SaaS 的 9.5% 和开发者工具的 8.9%。做空比例最高的个股都是中小市值公司:SoundHound AI 36.3%、C3.ai 32.2%、BigBear.ai 29...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
00:00
12d ago
AI HOT 精选· aihot-apiZH00:00 · 06·01
xAI 发布 Composer 2.5,一个主打“跑长任务、跟复杂指令”的编程模型
xAI 在 Grok Build 里上线了 Composer 2.5,入口在 /models 菜单里选。官方说它“快、先进、擅长长时间任务和复杂指令”,但正文没披露上下文窗口、跑分结果和定价。目前只对 SuperGrok 和 X Premium+ 用户开放,所以普通用户暂时用不了。如果你已经在用 Grok Build,可以敲 /model 切过去试试,...
#Code#xAI#Product update
精选理由
HKR-K 通过是因为文章给出了 Grok Build 的入口和付费层级访问方式。HKR-H/R 都弱:没披露价格、上下文窗口或基准结果,所以这只是一个常规的小版本更新。
一句话点评
xAI 发了 Composer 2.5,说是快、擅长长任务和复杂指令,但正文没披露上下文窗口、跑分和定价。目前只对 SuperGrok 和 X Premium+ 用户开放,普通用户用不了。如果你已经在用 Grok Build,可以敲 /model 切过去试试。 短评:xAI 发了个新编程模型,但关键参数全没给,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0

更多

频道

后台