ax@ax-radar:~/curated $ grep -l 'curated=true' sources/
41 srcsignal 72%cycle 04:32

AX 严选 · 2026-05-29

36 · updated 3m ago
按日期浏览清除筛选
2026年6月
138235332422532610788299441029112912151371415161718192021222324252627282930
2026-05-29 · 星期五2026年5月29日
23:58
14d ago
AI HOT 精选· aihot-apiZH23:58 · 05·29
ComfyUI 现在能直接调 OpenRouter 的 20 多个模型了
ComfyUI 新版本接入了 OpenRouter,你可以在同一个工作流里直接选 20 多个模型,不用再单独配置每个模型的 API。对做图生图、视频生成这类需要反复试模型的人来说,省了来回切换的麻烦。不过正文没提具体支持了哪些模型、有没有请求次数限制,也没说 ComfyUI 版本号,想用的话得自己去试。
#Tools#ComfyUI#OpenRouter#Product update
精选理由
HKR-K 和 HKR-R 通过:ComfyUI 工作流里能直接调 20 多个 OpenRouter 模型,省去来回切换工具。正文没披露版本号、费用和调用限制,只能算小产品更新。
一句话点评
ComfyUI 直接调 OpenRouter,工作流里能选 20 多个模型,省去挨个配 API 的麻烦。对反复试模型做图、做视频的人挺方便。但正文没提具体支持哪些模型、有没有调用次数限制,也没说 ComfyUI 版本号,想用还得自己试。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
22:31
14d ago
AI HOT 精选· aihot-apiZH22:31 · 05·29
DynoSim:用模拟跑一遍部署配置,省下大把GPU时间
NVIDIA 发了一个叫 DynoSim 的模拟器,专门用来调大模型推理服务的部署参数。调过的人都知道,模型后端、张量并行、调度策略、路由、KV 缓存这些变量互相影响,改一个可能把瓶颈挪到别处,而且跑一次真实实验就要占一堆 GPU。DynoSim 的思路是用离散事件模拟把整个 Dynamo 推理栈跑一遍,在虚拟时钟上模拟请求到达、调度、前向传播、KV ...
#Inference-opt#NVIDIA#Commentary
精选理由
HKR-K和HKR-R是弱正面:推理优化相关,但正文只给出了变量类别,省略了DynoSim机制、可复现结果和发布状态。
一句话点评
NVIDIA 发了个叫 DynoSim 的模拟器,专门用来调大模型推理服务的部署参数。调过的人都知道,模型后端、张量并行、调度策略、路由、KV 缓存这些变量互相影响,改一个可能把瓶颈挪到别处,而且跑一次真实实验就要占一堆 GPU。DynoSim 的思路是用离散事件模拟把整个 Dynamo 推理栈跑一遍,在虚拟时钟上模拟请求到达、调度、前向传播、KV 缓存等行为,而不是真的去跑 GPU。它用 ...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
22:23
14d ago
AI HOT 精选· aihot-apiZH22:23 · 05·29
Claude Design Card:把文字一键转成公众号首图和小红书卡片,支持28种布局
这是一个专为中文内容创作者设计的开源工具,能把文字、链接或文章直接生成视觉卡片,比如公众号首图、小红书图文卡、教程步骤卡。它自动提炼重点、选版式、生成HTML再截图成PNG,省掉手动用Figma或Canva的步骤。支持28种布局和10种主题,核心价值是自动化“写完文章后最繁琐的排版流程”。开源,适合经常发内容的创作者试试。
#Tools#claude-design-card#Figma#Canva
精选理由
HKR-H 和 HKR-K 通过:它把文字/链接/文章一键转成公众号首图、小红书卡片,对做内容运营的人是个实在的钩子,而且明确写了 28 种布局、10 种主题。HKR-R 弱:这是个 Claude 周边的小工具,不是模型能力或市场级别的发布,对多数从业者参考价值有限。
一句话点评
这个开源工具能把文字/链接一键转成公众号首图、小红书卡片,支持28种布局和10种主题,省掉手动开Figma的步骤。核心是自动提炼重点→选版式→生成HTML→截图PNG。开源免费,适合高频发内容的创作者。不过正文没披露生成一张图要多久、截图质量是否稳定,实际体验可能打折扣。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
21:03
14d ago
AI HOT 精选· aihot-apiZH21:03 · 05·29
ChatGPT 对话目录功能上线
ChatGPT 现在给超过5条回复的对话加了个目录,方便你快速跳转到聊到哪了。正文没说是全平台推送还是灰度测试,也没提用户能不能手动开关。
#Tools#ChatGPT#OpenAI#Product update
精选理由
HKR-K和HKR-R通过:5条回复触发条件具体,长对话导航痛点真实。HKR-H不通过:这只是一个小功能更新,平台范围和开关条件正文都没披露。
一句话点评
ChatGPT 给长对话加了目录,超过5条回复自动生成,方便跳转。官方没说是不是全量推送,也没提能否关闭。小改进,但长聊场景挺实用。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
20:40
14d ago
AI HOT 精选· aihot-apiZH20:40 · 05·29
Luma Agents 上线:输入内容自动生成宣传图
Luma Labs 宣布 Luma Agents 可以根据用户输入的内容和定义的“钩子”自动生成宣传图,省去手动设计。但正文只给了 App 链接,没提模型细节、定价、输出数量限制或上线范围,实际效果和成本还不清楚。
#Agent#Tools#Multimodal#Luma Labs
精选理由
HKR-H 靠“输入内容生成宣传图”这个自动化钩子过关,但 K 和 R 都很弱。没有硬性排除理由,所以留在低优先级的产品更新档位。
一句话点评
Luma 出了个“宣传图自动生成”工具,你给内容和一句钩子,它就能出图。正文只扔了个 App 链接,没提用了什么模型、怎么收费、一次能出几张、哪些地区能用。效果和成本全是问号,先别激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
20:10
14d ago
AI HOT 精选· aihot-apiZH20:10 · 05·29
Runway API 上新了五个模型,包括视频生成和图像放大
Runway API 新增了五个模型:Seedance 2.0(视频生成)、GPT Image 2(图像生成)、HappyHorse 1.0(未知用途)、Nano Banana Pro(可能是轻量模型)和 Magnific Precision Upscaler V2(图像放大)。官方说可以在一个接口里调用这些模型,但正文没披露价格、响应速度、调用次数限...
#Multimodal#Vision#Tools#Runway
精选理由
Runway API 例行端点扩展:HKR-K 有具体的模型列表,HKR-R 适合多模态集成决策,但 HKR-H 较弱,且正文没有给出定价、限制、延迟或新能力。
一句话点评
Runway API 一口气加了五个模型,包括视频生成 Seedance 2.0、图像生成 GPT Image 2、放大工具 Magnific Precision Upscaler V2,还有两个用途不明的 HappyHorse 1.0 和 Nano Banana Pro。官方说一个接口就能调,但没披露价格、响应速度、调用次数限制和地区可用性。如果价格合理,对想快速集成多种生成能力的开发者挺...
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
19:15
14d ago
AI HOT 精选· aihot-apiZH19:15 · 05·29
LlamaIndex 给 Google 新出的 Agents API 搭了个文档解析模板
LlamaIndex 团队基于 Google 刚发布的 Agents API 做了一个模板,让智能体能直接调用 LlamaParse 和 LiteParse 来解析非结构化文档。流程分四步:先配好 Git 仓库地址,把仓库克隆到智能体沙箱里,装上 LiteParse 命令行工具和 LlamaParse 的 SDK,最后用提示词驱动智能体干活。说白了就是...
#Agent#Tools#LlamaIndex#Google
精选理由
这是个小众开发者工具的模板更新:HKR-K靠具体的配置步骤和解析流程通过;HKR-H没有悬念或惊喜,不成立;HKR-R范围窄,没有行业争议点,所以定级为all而非featured。
一句话点评
LlamaIndex 给 Google Agents API 套了个模板,让智能体能直接调 LlamaParse 和 LiteParse 解析非结构化文档。流程四步:配 Git 仓库、克隆到沙箱、装 CLI 和 SDK、用提示词驱动。说白了就是把文档解析能力打包成智能体技能。 亮点是省去自己写工具调用的麻烦,适合快速搭文档处理流水线。但正文没披露解析速度、成本、支持的文件类型上限,也没说沙...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
19:00
14d ago
AI HOT 精选· aihot-apiZH19:00 · 05·29
Google 用 AI Studio 搞了个 I/O 2026 测验,全程“氛围编程”
Google 拿自家 AI Studio 工具,用“氛围编程”(就是靠自然语言描述需求让模型写代码,不手敲)做了个 I/O 2026 的在线测验。正文只说了工具和主题,没透露用了哪个模型、具体提示词怎么写、工作流怎么搭,也没说什么时候上线。想抄作业的从业者得自己试了。
#Code#Tools#Google#Product update
精选理由
官方测验推广;正文只说Google AI Studio用氛围编程生成,没有可复现的工作流、模型细节或产品变化。HKR三项全挂,所以排除。
一句话点评
Google 用自家 AI Studio 搞了个 I/O 2026 在线测验,全程靠“氛围编程”——也就是用自然语言描述需求让模型写代码,不用手敲。正文只说了工具和主题,没透露用了哪个模型、具体提示词怎么写、工作流怎么搭,也没说什么时候上线。想抄作业的从业者得自己试了。 短评:氛围编程做测验,噱头大于细节,缺模型和提示词,抄不了。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
18:59
14d ago
AI HOT 精选· aihot-apiZH18:59 · 05·29
Gemini Omni 演示:画个圆就能变视频
Gemini App 发了个演示:你上传一段画圆的视频,输入提示词“当我画完这个圆时,它变成了___”,模型就能把草图变成视频。效果看着挺酷,但正文没披露用了什么参数、什么时候开放、怎么收费。目前只是个 demo,离真正上手用还有距离。
#Multimodal#Vision#Gemini App#Gemini Omni
精选理由
官方 X 账号演示了一个具体的草图转视频流程,满足 H/K/R 的钩子、新知和相关性判断。但正文没披露模型参数、上线范围或价格,只是一个功能演示,不是正式发布,所以评分落在 60–71 区间。
一句话点评
Gemini App 演示了 Omni 的草图转视频功能:上传画圆视频,输入提示词“当我画完这个圆时,它变成了___”,模型就能生成视频。效果酷,但正文没披露用了什么参数、何时开放、怎么收费。目前只是个 demo,离上手还有距离。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
17:14
14d ago
AI HOT 精选· aihot-apiZH17:14 · 05·29
Kog 把推理速度拉到 3000 token/s,是常规的 10-30 倍
Kog 团队在 8 块 AMD MI300X 上跑出单用户 3000 token/s,8 块 NVIDIA H200 上 2100 token/s,而常规推理只有 100-300 token/s。他们把 LLM 解码当成内存流问题来解,用 monokernel 设计、重建同步机制、针对性内存映射,以及一个叫 Laneformer 的模型架构(延迟张量并...
#Inference-opt#Kog#AMD#NVIDIA
精选理由
Kog 团队在 8×AMD MI300X 上跑出单用户 3,000 tokens/s,比 8×NVIDIA H200 的 2,100 还快 43%,这个速度差距对推理成本影响很大——如果 MI300X 价格更低,那 AMD 在推理场景里就很有竞争力。不过正文没披露用了什么模型、什么精度、上下文多长,也没给复现细节,所以这个数字目前只能当个参考上限,不能直接拿来算实际部署成本。
一句话点评
Kog 在 8 块 AMD MI300X 上跑出单用户 3000 token/s,比常规推理快 10-30 倍。核心是把解码当内存流问题,用 monokernel 和 Laneformer 架构消除阻塞。但这是单用户场景,多用户并发下性能未知,且 Laneformer 是否通用、能否适配现有模型都没说。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:05
14d ago
AI HOT 精选· aihot-apiZH16:05 · 05·29
Gemini架构师聊幕后:Jeff Dean等四人出镜,但没提参数、架构或发布时间
Google AI的播客节目请来四位Gemini架构师,包括Jeff Dean。他们聊了团队如何推动AI前沿,但正文没披露模型参数、架构变化或发布时间线。想听八卦可以看,想找技术细节的可以跳过。
#Google AI#Jeff Dean#Gemini#Commentary
精选理由
HKR 中只有 H 靠嘉宾名字过关,K 和 R 都挂。正文本质是节目预告:嘉宾名单给了,但没有任何可验证的技术事实——参数、架构、发布时间全没提,也没有成本或竞争信息。
一句话点评
Google AI 播客请来四位 Gemini 架构师(包括 Jeff Dean)聊幕后故事,但正文没披露任何模型参数、架构变化或发布时间线。想听八卦可以看,想找技术细节的可以跳过。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
16:00
14d ago
AI HOT 精选· aihot-apiZH16:00 · 05·29
NVIDIA 开源 MCG 工具包:一分钟自动生成模型说明书,应对加州和欧盟 AI 法规
NVIDIA 发布了一个叫 MCG 的工具包,能自动给 AI 模型写说明书(Model Card)。你给它一个 GitHub 链接或上传文件,它就能在不到一分钟内生成一份包含模型用途、训练数据、性能、偏见、隐私等字段的文档。背后用了 RAG(外挂资料库)和 GPT-OSS-120B 模型来提取代码和文档里的信息。测试下来,91% 的字段能填上,准确率 ...
#Safety#Tools#NVIDIA#Product update
精选理由
HKR-K 和 HKR-R 通过:它有具体的文档生成机制和监管背景。这仍然是一篇 NVIDIA 开发者教程,没有模型发布、定价、基准测试或跨来源信号。
一句话点评
NVIDIA 出了个自动写模型说明书的工具 MCG,给个 GitHub 链接就能在 1 分钟内生成 Model Card,91% 字段能填上,准确率 76%。背后用了 RAG(外挂资料库)和自家 GPT-OSS-120B 模型。主要为了应付加州 AB-2013 和欧盟 AI 法案的合规要求。Oracle 已经在用了。 短评:填表自动化,合规省力,但准确率 76% 意味着近四分之一的字段可能...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
15:58
14d ago
AI HOT 精选· aihot-apiZH15:58 · 05·29
Replit 直播预告:Canvas 新功能 + Clerk 自定义登录
Replit 发了一条推文,预告一场直播,主题是 Canvas 新功能和用 Clerk 做自定义登录。但正文只给了一个直播链接,没透露任何具体信息:新功能是什么、登录流程怎么改、价格或上线时间,一概没提。想了解细节只能自己去看直播回放。
#Tools#Clerk#Product update
精选理由
标题看起来像产品更新,但正文只有一条直播链接,没有功能清单、登录机制或发布时间。信息缺口太大,无法判断价值,直接跳过。
一句话点评
Replit 预告直播讲 Canvas 新功能和 Clerk 自定义登录,但正文只甩了个直播链接,没提任何具体改动、价格或上线时间。想了解细节只能自己看回放,信息量约等于零。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
15:55
14d ago
AI HOT 精选· aihot-apiZH15:55 · 05·29
Gemini 本月更新:新界面 + 全天候智能体助手
Gemini 官方宣布了本月更新,核心是重新设计的界面和 Gemini Spark 的 24 小时智能体辅助。正文没披露具体功能细节、上线范围、支持平台、定价或性能变化,所以目前只能确认产品层面的标题信息。
#Agent#Gemini#Gemini Spark#Product update
精选理由
HKR-H 和 HKR-R 通过:Gemini Spark 作为全天候智能体是这次月更的钩子,也踩中了 Google 的竞争节奏。HKR-K 不通过:正文没披露功能细节、上线范围或价格,信息量只够当一条小产品更新看。
一句话点评
Gemini 本月更新主要提了两个点:界面重设计,以及 Gemini Spark 的 24 小时智能体辅助。但正文没披露任何具体功能、上线范围、平台或定价,所以目前只能当产品预告看。短评:界面和全天候助手是亮点,但没细节前先别激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
15:00
14d ago
AI HOT 精选· aihot-apiZH15:00 · 05·29
Kling AI 在戛纳展示全 AI 电影《RAPHAEL》制作流程
Kling AI 在戛纳放出了一部叫《RAPHAEL》的短片,全程用自家模型做,从创意到成片都走 AI 工作流。正文没披露用了多少算力、花了多少钱、做了多久,也没给可复现的步骤,所以目前只能当个概念展示看。
#Multimodal#Vision#Tools#Kling AI
精选理由
硬排除规则适用:这是纯营销案例。Kling AI 帮 RAPHAEL 做了电影,但正文既没有可复现的工作流,也没有硬指标。H/K/R 三项都不达标,所以分数低于 40。
一句话点评
Kling AI 在戛纳放了一部叫《RAPHAEL》的短片,全程用自家模型做,从创意到成片都走 AI 工作流。正文没披露用了多少算力、花了多少钱、做了多久,也没给可复现的步骤,所以目前只能当个概念展示看。 短评:概念片,没成本没步骤,先别当标杆。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
13:00
15d ago
AI HOT 精选· aihot-apiZH13:00 · 05·29
阶跃星辰 Step 3.7 Flash 开放权重,可在 Kilo Code 直接跑
阶跃星辰把 Step 3.7 Flash 的开放权重模型放到了 Kilo Code 上,开发者可以直接下载运行。正文没披露参数量、许可证条款、定价或部署要求,所以实际能跑多大、商用是否受限还不清楚。开放权重意味着你可以本地或自建服务器部署,不用每次都调 API,对需要离线或定制推理的场景比较友好。
#StepFun#Kilo Code#Product update#Open source
精选理由
HKR-K 通过,因为 Kilo Code 可用性对开发者是可操作的信息。HKR-H/R 偏弱:正文没提模型参数量、许可证、定价和基准对比,属于小产品/开放权重更新,不值得特别关注。
一句话点评
阶跃星辰把 Step 3.7 Flash 的开放权重模型放到了 Kilo Code 上,开发者可以直接下载运行。正文没披露参数量、许可证条款、定价或部署要求,所以实际能跑多大、商用是否受限还不清楚。开放权重意味着你可以本地或自建服务器部署,不用每次都调 API,对需要离线或定制推理的场景比较友好。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
12:57
15d ago
AI HOT 精选· aihot-apiZH12:57 · 05·29
阶跃星辰发布 Step 3.7 Flash,专为智能体工作流设计
阶跃星辰在 X 上宣布 Step 3.7 Flash 模型,主打让模型进业务流程干活(agent workflow)。他们提到 NousResearch 用户已经在 Hermes Agent 上基于该模型做开发。正文没披露模型参数量、定价、跑分或开放方式,目前信息有限,先别太激动。
#Agent#StepFun#NousResearch#Hermes Agent
精选理由
StepFun 发了 Step 3.7 Flash 的定位帖,说它专为智能体工作流打造,还提了 NousResearch 和 Hermes Agent 的用户。但正文没披露参数、价格或上线条件,也没有测试结果。信息缺口太大,只能当低信号的产品营销看。
一句话点评
阶跃星辰发了 Step 3.7 Flash,说是专为“让模型进业务流程干活”设计的。目前只有一条 X 帖子,没提参数量、定价、跑分,也没说怎么用。有 NousResearch 用户拿它做 Hermes Agent,算个信号,但信息缺口太大,先别激动。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R0
12:00
15d ago
AI HOT 精选· aihot-apiZH12:00 · 05·29
OpenRouter 推出 Guardrails:给智能体套上预算、隐私和安全的笼头
OpenRouter 上线了 Guardrails 功能,一套可配置的安全和治理工具,专门管那些跑在 API 上的智能体。核心功能有五项:预算控制(按日/周/月设限额,每人每 Key 独立计算,一个脚本跑冒了不会烧掉整月预算)、零数据留存(一键关掉所有会存你数据的接口)、模型/供应商限制(只允许用你审核过的模型或供应商)、提示注入防御(用 30 多条正...
#Agent#Safety#Tools#OpenRouter
精选理由
HKR-K和HKR-R通过:5类Guardrails功能给从业者提供了具体信号,对应成本和安全的痛点。但这仍是OpenRouter的常规产品更新,没有披露定价、效果数据或采用规模,所以分数维持在60–71区间。
一句话点评
OpenRouter 给 API 智能体上了五道安全锁:预算控制(每人每 Key 独立算,脚本跑冒了不会烧整月)、零数据留存、模型/供应商白名单、提示注入防御(30 多条正则,延迟可忽略)、数据防泄漏。亮点是预算按实体独立计算,比共享额度更精细。但正文没披露定价、上线时间和技术实现细节,目前只说是可配置规则层,不涉及模型内部安全。对跑生产 agent 的团队有用,但别指望它能防住高级越狱。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
10:37
15d ago
AI HOT 精选· aihot-apiZH10:37 · 05·29
Claude Code 源码里挖出的隐藏配置:钩子能改写命令、自动批准、注入上下文
一篇博客翻了一遍 Claude Code 的源码(npm 包 @anthropic-ai/claude-code@2.1.87),发现官方文档没写的几个可配置能力。核心是 hook 脚本的返回值:PreToolUse 钩子可以返回 updatedInput 字段,在命令执行前偷偷改掉它——比如把 git push 自动加上 --dry-run;Perm...
#Code#Tools#Claude Code#Commentary
精选理由
这篇文章本质上是一个指向页——标题画了饼,但正文没给任何可验证的配置项名称或机制。HKR 的 H 和 R 都成立,但 K 不成立,因为信息量不足以支撑实操价值。所以它只能留在低价值区间,重要性 48 合理。
一句话点评
Claude Code 源码里藏了一堆官方文档没写的配置,最实用的是 hook 脚本能返回 JSON 实时改命令——比如在 git push 前自动加 --dry-run。还有 YOLO Classifier 允许用大白话描述环境(比如“这是测试服务器,可以删东西”)来决定自动放行。这些功能来自 npm 包 v2.1.87,但作者没提模型版本、性能或定价,也没说这些隐藏字段会不会在下次更新里消失。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
10:21
15d ago
AI HOT 精选· aihot-apiZH10:21 · 05·29
四部门发文:全民AI素养要提升,人才要加快培养
中央网信办等四部门联合印发了《2026年提升全民数字素养与技能工作要点》,把“提升全民人工智能素养”单列为一项重点任务,具体包括用AI赋能教育、加快AI人才培育、深化AI普及应用。文件还提到要促进AI安全规范发展。不过正文没披露具体预算、落地时间表或考核指标,所以目前更像一个方向性信号,离实际执行还有距离。
#CAC#Policy
精选理由
K通过,因为2026年工作计划、四部门联合发文、6项任务都是具体新信息。H不通过,标题措辞平淡,没有让人想点开的意外点。R不通过,只说了要提升素养和培育人才,但没披露谁来执行、花多少钱、涉及哪些岗位,从业者没法判断对自己业务的实际影响。
一句话点评
四部门把“提升全民AI素养”单列为2026年重点任务,方向明确但正文没披露预算、时间表或考核指标,目前更像一个政策信号,离落地还有距离。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R0
09:00
15d ago
AI HOT 精选· aihot-apiZH09:00 · 05·29
Qwen-VLA:让模型不光能看能想,还能动手干活
阿里 Qwen 团队发布 Qwen-VLA,一个通用视觉-语言-动作模型。它把机器人操作、视觉导航等任务统一到一个框架里:给模型看画面、听指令,它直接输出下一步动作或轨迹。训练分四阶段,先纯文本学动作结构,再加视觉数据,最后用强化学习在仿真环境里优化闭环成功率。数据量不小:公开机器人数据超 1 万小时,内部真机数据超 1000 小时,合成仿真轨迹超 8...
#Multimodal#Vision#Tools#Qwen
精选理由
HKR 中 H/K 通过,因为 Qwen VLA 的定位和 Qwen Studio 的功能列表是实打实的信息。但正文没给参数、发布时间、评测或可跑 demo,所以只能算低优先级的产品更新,不构成行业震动。
一句话点评
阿里 Qwen 团队发布 Qwen-VLA,一个视觉-语言-动作模型,能直接看画面、听指令输出机器人动作。训练分四阶段,先纯文本学动作结构,再加视觉数据,最后用强化学习优化闭环成功率。数据量不小:公开机器人数据超 1 万小时,内部真机数据超 1000 小时,合成仿真轨迹超 800 万条。但正文没披露模型参数量、推理延迟和真机实测成功率,这些才是落地关键。短评:统一框架思路对,但数据堆砌不等于...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
07:15
15d ago
AI HOT 精选· aihot-apiZH07:15 · 05·29
阿里云把百炼能力打包成命令行工具,一行代码让 Agent 调用 150 多个模型
阿里云开源了百炼 CLI,一个专为 Agent 设计的命令行工具。开发者只需一行命令,就能让 Claude Code、Qoder 等主流 Agent 框架调用阿里云百炼平台上的 150 多款模型、十多款应用,以及知识库、记忆、联网搜索等全套能力。说白了,就是不用再手动写一堆 API 调用代码,Agent 可以直接通过命令行“插拔”阿里云的模型和服务。目...
#Agent#Tools#Alibaba Cloud#Open source
精选理由
触发硬排除-云厂商推广:阿里云百炼 CLI 平台公告,正文为空,未披露许可证、安装路径、版本或支持矩阵。HKR-K 保留,但 tier 被排除上限。
一句话点评
阿里云把百炼平台的能力打包成一个命令行工具(CLI)并开源,Agent 框架(如 Claude Code)一行命令就能调 150 多款模型、知识库、联网搜索等。好处是省去手动拼 API 的麻烦,但正文没披露性能基准、延迟或成本对比,也没说 CLI 是否支持离线或本地模型。对做 Agent 编排的团队是个便利,但实际效果得看跑起来才知道。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
02:18
15d ago
AI HOT 精选· aihot-apiZH02:18 · 05·29
PixVerse 分享15秒动画IP预告片制作流程
PixVerse 发了一个15秒动画IP预告片的案例,角色叫MILO和BUMBLE,设定是地下邮政骑手。但正文没披露具体用了什么工具链、模型设置或生成步骤,只说要转发关注才能私信拿到工作流和提示词。信息缺口明显,没法判断效果好坏或成本高低。
#Multimodal#Vision#Tools#PixVerse
精选理由
HKR-H靠短预告片工作流这个钩子勉强过关,但HKR-K因为没给任何可复现的工具或参数直接挂掉,HKR-R也缺成本、工作流或竞争层面的价值。整篇就是PixVerse的产品展示,归入低价值浏览档。
一句话点评
PixVerse 发了个15秒动画IP预告片,角色MILO和BUMBLE是地下邮政骑手。但正文没披露工具链、模型设置或生成步骤,只说转发关注才能私信拿工作流和提示词。信息缺口明显,没法判断效果好坏或成本高低。 短评:转发才给工作流,信息缺口大,没法判断效果。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
00:45
15d ago
AI HOT 精选· aihot-apiZH00:45 · 05·29
三星抢先出样 HBM4E 内存,单堆栈 48GB、带宽 3.6 TB/s
三星宣布向主要客户交付业界首批 12 层 HBM4E 样品,单堆栈容量 48GB,引脚速度 14Gbps(可扩至 16Gbps),带宽 3.6 TB/s,比 HBM4 再提升 20%。能效和散热也分别改善了 16% 和 14%。不过正文没披露具体客户是谁、量产时间表,以及样品是否已通过验证——所以“业界首批”更多是抢发布节奏,离真正落地还有距离。
#Samsung Electronics#Product update
精选理由
三星HBM4E出样对AI算力链有影响,所以HKR-H/R通过。但文章只有标题,没有规格、客户、量产时间或性能数据,HKR-K不通过,评分维持58。
一句话点评
三星抢发HBM4E样品,单堆栈48GB、带宽3.6 TB/s,比HBM4再提20%,能效和散热也改善了。但正文没披露客户是谁、量产时间,样品是否通过验证也不清楚——所以“业界首批”更多是抢发布节奏,离落地还有距离。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
00:07
15d ago
AI HOT 精选· aihot-apiZH00:07 · 05·29
阶跃星辰发布 198B 多模态模型 Step 3.7 Flash,英伟达说能跑在企业级 GPU 上
阶跃星辰(StepFun)的 Step 3.7 Flash 是一个 1980 亿参数的 MoE 多模态模型,每次推理只激活约 110 亿参数,所以虽然模型很大但实际算力消耗不算离谱。它支持图片、视频和文字输入,上下文窗口 256K,还提供了低、中、高三档推理深度可选。英伟达官方博客说这个模型可以在他们的 GPU 上跑,也支持 SGLang、Tensor...
#Multimodal#Vision#StepFun#NVIDIA
精选理由
HKR-K 通过是因为 198B 参数的多模态细节是实打实的信息。HKR-H 和 HKR-R 不通过:标题和正文都是英伟达开发者博客的部署宣传口吻,没有基准测试、定价或可复现的性能数据,所以既没有意外钩子,也刺激不到成本或竞争神经。
一句话点评
阶跃星辰的 Step 3.7 Flash,1980 亿参数 MoE 模型,每次推理只激活约 110 亿参数,所以虽然模型大但实际算力消耗不算离谱。支持图片、视频和文字输入,上下文 256K,还提供低、中、高三档推理深度可选。英伟达官方博客说可以在他们的 GPU 上跑,也支持 SGLang、TensorRT-LLM 等框架。但正文没披露跑一次需要多少张卡、延迟多少,也没给任何基准测试分数。对于...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R0

更多

频道

后台