AX 严选 · 2026-05-18

▸ 24 条 · updated 3m ago

2026年5月

一二三四五六日

1 2 3 4 5 6 736 819 921 1010 1132 1228 1335 1438 1528 1617 179 1824 1947 2026 2132 2236 237 246 257 2625 2729 2834 2936 308 316

2026年6月

一二三四五六日

138 235 332 422 532 610 78 829 944 1029 1129 1215 1371415161718192021222324252627282930

2026-05-18 · 星期一2026年5月18日

19:40

25d ago

FEATUREDAI HOT 精选· aihot-apiZH19:40 · 05·18

Claude Design 宣布所有套餐 Token 上限翻倍

Claude Design 宣布所有套餐的 token 限制直接翻倍，意味着你一次对话能塞进去的上下文和产出的内容量都大了不少。但正文没披露具体翻倍后的 token 数是多少、各套餐之间有没有差异、价格变没变、以及什么时候生效。我会先打个折：上限翻倍是好事，但没给数字就没法判断实际能多干多少活。

#Tools#Anthropic#Product update

精选理由

Anthropic 官方产品更新，只有一个硬事实：所有套餐 token 限制翻倍。HKR 三项都过，但正文没披露具体 token 数、价格变化和生效范围，所以只能放在 featured 低段。我会先打个折——翻倍听着爽，但不知道原来是多少，实际提升就不好算。

一句话点评

Claude Design 把套餐 Token 上限直接翻倍，但正文没写具体从多少涨到多少，也没说价格变不变。

锐评

这条消息最直接的价值是：用 Claude Design 做设计稿或前端代码时，单次能塞进去的上下文变大了，不用频繁拆项目。Token 翻倍意味着你可以把更完整的 PRD、设计系统规范甚至参考代码一次性丢进去，省掉很多分步解释的功夫。但信息缺口也很明显。正文只提了“全面升级创作能力”和“Token 限制翻倍”，没披露具体数字——是从 4K 涨到 8K，还是 100K 涨到 200K？不同起点对实际工作流的影响差很多。另外价格是否调整、是所有套餐都翻倍还是仅限高阶套餐，这些都没说。如果涨价幅度也翻倍，那“翻倍”的含金量就要打折。建议等官方更新定价页和具体限额表再评估。如果你现在正被 Token 限制卡脖子，这条消息值得追一下确认细节。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

19:18

25d ago

FEATUREDAI HOT 精选· aihot-apiZH19:18 · 05·18

Claude Code 快速模式默认切到 Opus 4.7，/fast 命令已可用

Claude Code 的快速模式现在默认跑在 Opus 4.7 上，输入 /fast 就能切过去。正文只提了调用方式，没写价格、上下文窗口多大、速率限制和灰度条件，这些实际用起来的关键信息都还缺着。

#Code#Claude#Product update

精选理由

HKR 三项都成立，因为 Claude Code 把快速模式的默认模型换成了 Opus 4.7，而且给了明确的 /fast 调用路径。但价格、上下文长度、调用限额这些关键信息正文全没提，所以分数压在 72–77 这个区间。我会先打个折：知道换了什么，但不知道换完要花多少钱、能用多久，这点先别太激动。

一句话点评

快速模式默认切到 Opus 4.7，但价格、上下文窗口、速率限制都没说，先别急着冲。

锐评

Claude Code 把快速模式默认模型换成了 Opus 4.7，输入 /fast 就能切过去。这等于给日常编码场景配了个更强的推理模型，对写复杂逻辑或长上下文任务可能有帮助。但正文只说了调用方式，关键信息全缺：价格没提（Opus 系列通常比 Sonnet 贵不少）、上下文窗口多大、速率限制有没有变化、灰度范围是什么。这些直接影响实际使用成本和体验，如果是全面开放且不加价，那算良心升级；如果只是小范围灰度或偷偷提价，就得打折看。建议等官方补全定价和限制说明再评估是否值得切。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:56

25d ago

AI HOT 精选· aihot-apiZH18:56 · 05·18

xAI 在 OpenRouter 上线三款 Grok 创意模型：图像、视频、语音

xAI 把 Grok 创意套件里的三款新模型放到了 OpenRouter 上，开发者可以直接调用。Grok Imagine Image Quality 主打照片级真实感的图像生成和编辑；Grok Imagine Video 能从文字、图片或参考素材生成短视频；Grok Voice TTS 1.0 支持 20 多种语言、5 种语音。目前正文没披露定价和生...

#Multimodal#Vision#Audio#xAI

精选理由

H 和 K 成立：xAI 三款 Grok 创意模型同时上线 OpenRouter，TTS 规格具体。R 不成立：缺定价、基准和限频，从业者没法评估落地成本，所以留在 upper all 层。

一句话点评

xAI 把 Grok 的三款新模型放到了 OpenRouter 上，开发者可以直接调用了。Grok Imagine Image Quality 主打照片级真实感的图像生成和编辑；Grok Imagine Video 能从文字、图片或参考素材生成短视频；Grok Voice TTS 1.0 支持 20 多种语言、5 种语音。目前正文没披露定价和生成速度，所以实际调用成本、延迟和效果都还是未知数...

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

18:31

25d ago

AI HOT 精选· aihot-apiZH18:31 · 05·18

Mac 跑 Codex，手机接着干

OpenAI 说 Codex 桌面版支持远程连接：Mac 开机、插电、不睡眠，就能在 ChatGPT 手机 App 上继续用 Codex 写代码。正文没提延迟和安全性，实际体验要看网络和权限配置。

#Agent#Code#Tools#OpenAI

精选理由

正文只给了设置条件，没提新模型能力、定价或更深层的自动化机制，属于一个小产品更新，所以分数压在 60–71 区间。

一句话点评

OpenAI 让 Codex 桌面版支持远程连接：Mac 开机插电不睡眠，就能在手机 ChatGPT 上继续写代码。正文没提延迟和安全性，实际体验要看网络和权限配置。短评：手机远程写代码，听起来方便，但延迟和安全是未知数。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:59

25d ago

FEATUREDAI HOT 精选· aihot-apiZH17:59 · 05·18

Claude 控制台能看缓存为什么没命中了

Anthropic 在 Claude 控制台加了个提示缓存诊断功能。现在请求没命中缓存时，你可以直接看到是提示里哪一段内容变了，以及这次变动多烧了多少 token。

#Tools#Anthropic#Claude#Product update

精选理由

Anthropic 给 Claude 控制台加了个缓存诊断，缓存没命中时会标出提示词里哪段变了，还告诉你因此多花了多少 token。对经常调提示词、抠成本的开发者来说，这比靠猜或翻日志快得多。我会先打个折：这只是个控制台功能，不是模型或 API 层面的改动，所以重要性到不了重大发布那档。但它的确把缓存调试从黑盒变成了可视化的东西，实用度够上 featured。

一句话点评

Claude 控制台能告诉你缓存为什么没命中、哪段提示变了、多烧了多少 token，调试成本直接可见。

锐评

Anthropic 给 Claude 控制台加了个很实用的缓存诊断功能。以前提示缓存没命中，开发者只能猜是哪段内容变了；现在请求失败时会直接标出变动段落，并告诉你这次多消耗了多少 token。这对频繁调用、依赖缓存省钱的场景帮助很大，调试效率会明显提升。不过正文只提了功能上线，没给具体界面截图或操作流程。也没说这个诊断是实时展示还是事后日志里查看，对 token 消耗的统计粒度也不清楚——是按段落算还是精确到字符级。另外，这个功能目前只在控制台可用，API 侧是否同步支持、会不会有对应的响应字段，正文都没披露。如果团队重度依赖 API 调用，这点要先确认。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:54

25d ago

FEATUREDAI HOT 精选· aihot-apiZH16:54 · 05·18

GitHub Copilot 现在能让你在手机或网页上接着 VS Code 里没干完的活

GitHub 给 Copilot 加了个远程控制会话功能。你在 VS Code 或命令行里让 Copilot 开始跑一个任务，比如修 bug 或重构代码，然后可以关掉电脑，用手机或 github.com 网页接着看进度、继续对话或者让它接着干。这相当于把本地开发环境里的 AI 助手会话搬到了云端，随时能接上。正文没提这个功能要不要额外付费，也没说手机端...

#Agent#Code#Tools#GitHub

精选理由

GitHub 让 Copilot 任务从 VS Code/命令行搬到网页和手机，跨设备、新机制、可控性三个点都踩中了，所以 HKR 全亮。不过正文只给了入口和场景描述，权限怎么设、要不要额外付费、支持哪些任务类型都没说，实际能用成什么样还得等上线看。

一句话点评

Copilot 的远程会话功能让你在电脑上开个任务头，关机上床后还能用手机接着指挥它干活，但正文没提手机端体验和是否额外收费。

锐评

GitHub 给 Copilot 加了个挺实用的能力：你在 VS Code 或命令行里让 Copilot 开始修 bug、重构代码，中途可以关掉电脑，用手机或网页接着看进度、继续对话，甚至让它接着干。这相当于把本地开发环境里的 AI 助手会话搬到了云端，随时能接上，不用守在电脑前等结果。正文只说了功能怎么用，没提要不要额外付费，也没说手机端操作体验怎么样——比如代码 diff 在手机上看得清吗，复杂任务中途断了怎么恢复。这些直接影响实际好不好用。另外，远程会话跑任务时，算力是在本地还是云端完成的，也没交代。如果是云端跑，那离线场景就废了；如果是本地跑，那关电脑后任务其实也停了，只是会话记录同步上去而已。这点先别太激动，等有人实测再说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:00

25d ago

AI HOT 精选· aihot-apiZH16:00 · 05·18

OpenRouter 发了一篇讲长期代理基础要素的文章

OpenRouter 分享了一个链接，标题是“构建长期代理的基础要素”，但正文只给了 URL，没披露代理架构、评估方法、记忆机制、工具接口、基准数据或实现限制。目前信息不足以判断这套方案是否靠谱，比如延迟多高、样本效率如何、验证是否充分，这些关键点都缺失。

#Agent#Memory#Tools#OpenRouter

精选理由

HKR三项全不触发：标题泛泛，正文只有链接，没有数据、机制、实验或具体案例。加上零信源，直接排除。

一句话点评

OpenRouter 扔了个链接，标题说“构建长期代理的基础要素”，但正文就一行 URL，没给任何架构、记忆机制、工具接口或评估数据。目前信息等于零，没法判断这套方案延迟多高、样本效率如何、验证是否充分。先别激动，等正文出来再聊。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

16:00

25d ago

FEATUREDAI HOT 精选· aihot-apiZH16:00 · 05·18

NVIDIA 用 LoRA/DoRA 微调 Cosmos Predict 2.5，让它能生成机器人第一视角视频

NVIDIA 发了一篇技术博客，教你怎么用 LoRA 和 DoRA 这两种轻量微调方法，去训练他们自家的 Cosmos Predict 2.5 视频模型。目标是让模型能根据文字指令，生成机器人看到的画面，比如机械臂在桌上抓东西。博客把训练数据准备、代码怎么改、训练命令都贴出来了，但没提用了多少数据、训练花了多少钱、也没给任何评测分数，所以效果到底怎么样...

#Vision#Robotics#Fine-tuning#NVIDIA

精选理由

我会先打个折：正文没给数据量、没给评测分数，所以没法判断效果到底多好。但这条信息本身挺实在——NVIDIA 把 Cosmos Predict 2.5 拿出来，用 LoRA 和 DoRA 两种轻量微调方法，教模型按文字指令生成机器人第一视角视频。LoRA 是只动一小部分参数来省钱省算力，DoRA 在 LoRA 基础上把权重拆成方向和大小分开调，理论上更稳。对做具身智能的人来说，这等于多了一条低成本造训练视频的路子，不用全量微调大模型也能试。不过正文没写用了多少条视频、什么机器人平台、生成质量怎么衡量，这些缺口让实用性打折扣。整体看，技术路线清楚、痛点...

一句话点评

NVIDIA 手把手教你怎么用 LoRA/DoRA 微调自家视频模型来生成机器人视角画面，但正文没给数据量、训练成本和评测分数，效果得自己试。

锐评

这篇博客本质上是一份操作手册，告诉你如何用 LoRA 和 DoRA 这两种省参数的微调方法，去训练 Cosmos Predict 2.5 模型，让它能根据文字指令生成机器人第一视角的视频，比如机械臂抓取物体的连续画面。LoRA 和 DoRA 的好处是只动模型的一小部分参数，训练起来比全量微调省钱省卡，适合团队拿自己的机器人数据做快速实验。但文章的信息缺口很明显：没提用了多少条视频做训练，没给任何定量评测指标（比如生成视频的 FVD 分数或人工评分），也没披露训练用了多少 GPU 小时、大概花多少钱。所以这更像一个技术可行性演示，而不是一个经过验证的解决方案。如果你打算在自己的机器人场景里复现，得做好自己标数据、自己跑消融实验的准备，别指望拿来就能用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:56

25d ago

AI HOT 精选· aihot-apiZH15:56 · 05·18

Claude Code 大代码库部署指南：百万行单体仓库实战经验

ClaudeDevs 发了一篇博客，讲怎么在大规模代码库（百万行单体仓库、遗留老系统、分布式微服务）里跑 Claude Code。正文没披露具体配置参数或基准测试结果，但提到了团队的实际经验。如果你在折腾大项目接入 AI 编程助手，这篇可以当个参考，不过具体效果还得自己试。

#Code#Agent#Tools#ClaudeDevs

精选理由

HKR-H 和 HKR-R 成立，因为大规模部署角度确实能吸引有类似痛点的团队；但 HKR-K 不成立，因为缺少可复现的参数、基准或步骤。整体属于'有趣'档的上沿，不到'精选'。

一句话点评

ClaudeDevs 发了篇博客，讲 Claude Code 在百万行单体仓库、遗留老系统和分布式微服务里的实战经验。正文没披露具体配置或基准测试，但团队踩过的坑有参考价值。短评：大项目接入 AI 编程助手，这篇可以当个起点，具体效果还得自己试。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

15:40

25d ago

FEATUREDAI HOT 精选· aihot-apiZH15:40 · 05·18

InsForge：给编程智能体配齐数据库、登录、存储和模型网关的一体化后端

InsForge 是一个开源后端平台，专门给 AI 编程智能体用。它把数据库、用户认证、文件存储、边缘函数和模型网关打包在一起，通过 MCP Server 和命令行工具（CLI+Skills）暴露给智能体调用。你可以用 Docker 在自己机器上部署，也能一键部署到 Railway 或 Zeabur 上。目前 GitHub 上有 10.3k star，...

#Agent#Code#Tools#InsForge

精选理由

选题踩在编程智能体的痛点上：能写代码但后端服务还得人搭。InsForge 把数据库、认证、存储、边缘函数和模型网关打包成 MCP Server 加 CLI+Skills，支持云托管、Docker 自托管和 Railway/Zeabur 一键部署，对想快速跑通 agent 流程的团队有吸引力。我会先打个折——正文没给出任何生产案例、性能数据或实际采用量，目前更像一个刚放出来的开源工具，能不能扛住真实负载还不清楚。所以分数压在 featured 门槛附近，等有落地验证再往上调。

一句话点评

给编程智能体用的开源后端“全家桶”，把数据库、认证、存储、函数和模型网关打包成工具，让 AI 直接调用。10.3k star 说明有需求，但正文没披露生产环境的稳定性数据。

锐评

InsForge 做的事很直接：把开发一个全栈应用需要的后端零件——数据库、用户登录、文件存储、边缘计算和模型调用——全部打包，然后通过 MCP 协议和命令行工具暴露给 AI 编程智能体。你可以理解成它给 AI 配了一个现成的后端工具箱，不用每次都从零搭架子。目前 GitHub 上有 10.3k star，说明不少开发者对这个思路感兴趣。部署方式也灵活，支持 Docker 自托管，也能一键推到 Railway 或 Zeabur 上跑。但正文主要展示的是功能列表和部署方式，没有给出任何关于并发处理能力、延迟表现、安全审计或实际项目中的故障率数据。这点先别太激动——一个后端平台能不能用在生产环境，关键看它扛不扛得住真实流量，而这篇 README 没回答这个问题。另外，它把模型网关也集成进去了，意味着智能体可以通过同一个入口调不同模型。这省事，但也把模型调用的成本和稳定性绑在了这个平台上。如果你已经在用别的网关方案，迁移成本需要自己评估。总的来说，概念验证阶段用起来应该顺手，但上生产前得自己压测一轮。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:02

25d ago

AI HOT 精选· aihot-apiZH15:02 · 05·18

Benedict Evans 2026春季报告：AI资本狂潮与部署瓶颈

Benedict Evans 发布79页报告，核心观点是AI正经历一场史无前例的资本投入和部署瓶颈。四大科技巨头2026年资本支出合计达7000亿美元，超过全球电信业（约3000亿）和油气行业（约1万亿）。英伟达收入已远超英特尔，但产能仍跟不上需求。美国数据中心建设支出已超过办公楼建设。OpenAI和Anthropic月收入增长迅猛，但商业模式远未稳定...

#Hacker News#Commentary

精选理由

H、K、R三项都不达标：只有一份PDF标题和HN热度，没有作者、方法或可验证的结论，直接排除。

一句话点评

Benedict Evans 的79页报告核心就一句话：AI 基建烧钱速度史无前例，但部署卡在瓶颈。四大巨头2026年资本支出合计7000亿美元，超过全球电信业（约3000亿）和油气（约1万亿）。英伟达收入已远超英特尔，但产能仍跟不上需求。美国数据中心建设支出已超过办公楼。OpenAI和Anthropic月收入增长迅猛，但商业模式远未稳定。报告数据详实，但来源主要是公开财报和新闻，缺少一手调...

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

14:30

25d ago

AI HOT 精选· aihot-apiZH14:30 · 05·18

Krea 2 全面开放，订阅用户可免费无限生成一周

Krea 2 今天向所有用户开放，订阅用户还能享受一整周的无限次生成。正文没披露模型参数、定价或免费试用额度，所以具体效果和成本还不清楚。

#Multimodal#Krea#Product update

精选理由

HKR-H和HKR-K靠开放和订阅福利通过，但HKR-R只限于Krea用户，没有硬伤但细节单薄，卡在60-71分区间。

一句话点评

Krea 2全面开放，订阅用户享一周无限生成。短评：无限生成一周，但没说模型参数和定价，先别急着冲。点评：Krea 2今天向所有用户开放，订阅用户还能享受一整周的无限次生成。这波操作挺大方，但正文没披露模型参数、定价或免费试用额度，所以具体效果和成本还不清楚。无限生成听起来爽，但如果是低质量输出，一周后可能就腻了。建议先观望，等实测或官方补全信息再决定是否订阅。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

14:12

26d ago

FEATUREDAI HOT 精选· aihot-apiZH14:12 · 05·18

IBM 在 Hugging Face 上线开放智能体排行榜，直接对比整套系统谁更省钱能干

IBM Research 做了一个开放排行榜，不只看模型本身，而是把智能体整套系统（模型、工具、规划、记忆、纠错）拉出来比。它用六个不同场景的基准测试来打分，同时公布质量和运行成本，让你知道哪个方案真值得部署。正文没披露具体模型分数、数据集大小和评测日期。

#Agent#Tools#Reasoning#IBM Research

精选理由

我会先打个折：信息量其实不多，更像一个预告。但“开放智能体排行榜”这个动作本身有话题性，因为 agent 评测一直缺公开基准，IBM 把它挂上 Hugging Face，至少让对比有了个起点。正文没披露分数和数据集规模，所以别急着拿它当权威结论，先当个信号看。

一句话点评

IBM把智能体整套系统拉出来比，不只比模型，还比工具、规划、记忆和纠错，同时公布运行成本，这点比单纯刷榜实用。但正文没给具体分数和数据集大小，先别急着拿它当采购清单。

锐评

IBM Research 在 Hugging Face 上发了一个开放排行榜，思路挺对：不只看模型本身，而是把智能体的整套系统——模型、工具、规划、记忆、纠错——打包一起测。它用六个不同场景的基准测试打分，同时公布质量和运行成本，让你知道哪个方案真值得部署，而不是只看谁分高。但正文没披露具体模型分数、数据集大小和评测日期，这些信息缺口让榜单的参考价值打了折扣。没分数就没法判断差距是显著还是误差范围内，没数据集大小就不知道结论稳不稳，没日期就不知道时效性。另外，评测框架叫 Exgentic，代码和方法论文都公开了，这点对想复现或自己跑一遍的人比较友好。目前看，这个榜单更像一个方法论示范，告诉你“应该这样比智能体”，而不是一份可以直接拿来选型的成熟报告。等他们把具体数据和更新节奏补上，实用性会高很多。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

14:05

26d ago

FEATUREDAI HOT 精选· aihot-apiZH14:05 · 05·18

百度核心 AI 业务 Q1 营收超 136 亿元，首次占通用业务收入过半

百度发了 2026 年 Q1 数据，核心 AI 驱动业务收入超过 136 亿元人民币，同比增长 49%，连续多个季度在涨。这个数字第一次超过百度通用业务收入的一半，说明 AI 相关收入已经从“添头”变成了主力。增长主要来自 AI 云基础设施、AI 应用和自动驾驶出行平台 Apollo Go。完整财报链接在原文里，正文没拆开各板块的具体数字，所以没法判断...

#Robotics#Baidu#Apollo Go#Product update

精选理由

这条是百度自己发的财报口径，只给了总收入数字和占比，没拆各块业务（比如智能云、Apollo Go）各自贡献多少，也没提利润率。所以“AI 收入过半”这个结论先打个折——它更像一个对外叙事信号，而不是一份能细拆的账本。对从业者来说，知道百度 AI 商业化在加速就够了，但别拿这个数字直接对标其他厂的收入结构。

一句话点评

百度AI业务收入首次过半，但原文没拆各板块具体数字，增长质量还看不清。

锐评

百度核心AI业务Q1收入超136亿元，同比增长49%，第一次超过通用业务收入的一半。这个转折点说明AI不再是烧钱的未来故事，开始真正扛收入了。增长来自AI云基础设施、AI应用和自动驾驶出行平台Apollo Go三块，但正文没披露各板块的具体数字和利润率，没法判断增长是靠高毛利的云服务还是重资产的自动驾驶。连续多季度增长这个表述也缺具体对比基数，我会先打个折。要看完整财报才能确认收入质量，比如有没有一次性项目、客户集中度如何。另外Apollo Go的运营成本和补贴力度也没提，这块的可持续性还存疑。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:32

26d ago

AI HOT 精选· aihot-apiZH08:32 · 05·18

阿里云 AgentScope Java 1.1 发布，主打企业级 Agent 的持久化与沙箱编排

阿里云发了 AgentScope Java 1.1，核心是让企业用 Java 搭 Agent 时能自动管理上下文、挂不同的文件系统，还能在安全沙箱里编排任务。说白了就是让 Agent 跑得更稳、更可控，适合放进生产环境。不过正文没披露定价和具体发布时间线，想上手的得自己去翻文档。

#Agent#Tools#Memory#Alibaba Cloud

精选理由

HKR-K和HKR-R通过，因为文章点名了具体的企业级Agent机制和生产痛点。HKR-H不通过；这是厂商版本更新，没有基准测试、采用数据、定价或路线图，所以分数落在60–71区间。

一句话点评

阿里云把 AgentScope Java 1.1 定位成企业级 Agent 框架，核心加了工作区持久化、可插拔文件系统和安全沙箱编排，说白了就是让 Java 搭的 Agent 能自动管上下文、挂不同存储、在沙箱里跑任务，更适合放进生产环境。但正文没披露定价和发布时间线，想评估成本或排期的得自己去翻文档。短评：企业 Java Agent 框架更新，主打稳和可控，但定价和时间线都没说。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

07:22

26d ago

FEATUREDAI HOT 精选· aihot-apiZH07:22 · 05·18

Grok 现在能直接看懂你上传的视频了

Grok 新增了视频理解功能，你可以把整个视频文件丢给它，让它实时分析画面、总结内容、做翻译、解释场景或提取关键上下文。它不只是看单张图片或读文字，而是能理解完整的视频。马斯克这条推文没提视频时长上限、支持哪些格式，也没说这个功能是全员推送还是灰度测试。

#Multimodal#Vision#Grok#X

精选理由

Grok 这次更新把视频理解加进来了，能上传整段视频做分析、总结、翻译和解释场景，对多模态产品来说是个实打实的进步。我会先打个折：正文没写支持多长的视频、什么格式、是不是全量上线，这些关键信息都缺着。所以虽然功能本身有看点，但只能按中等偏上的产品更新来处理，先别太激动。

一句话点评

马斯克发推说 Grok 能直接分析整个视频了，但没提时长、格式和推送范围，先当半官宣看。

锐评

Grok 现在支持上传完整视频，让它实时分析画面、总结内容、做翻译或提取上下文，不只是看单张图或读文字。这条消息来自马斯克自己的推文，属于半官宣，但正文没披露视频时长上限、支持哪些格式，也没说这个功能是全员推送还是灰度测试。我会先打个折：能“理解完整视频”听起来很强，但实际效果要看它对长视频的连贯推理和细节抓取稳不稳，尤其是超过几分钟的视频，模型容易丢前后文。另外，视频分析很吃算力，如果大规模开放，响应速度和成本都是未知数。这点先别太激动，等实测看它到底能处理多长、多复杂的视频，以及会不会像其他多模态功能一样先限区域或付费墙。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:43

26d ago

FEATUREDAI HOT 精选· aihot-apiZH02:43 · 05·18

腾讯把设计工具 Ardot 开放公测，说句话就能出可编辑的 UI 稿，还能直接转成代码

腾讯云上线了自家的 AI 设计工具 Ardot，定位是给产品、设计和开发用的协作平台。核心功能就两个：一是用一句话描述就能生成 App 页面、官网、海报这类可编辑的设计稿，支持调用团队自己的组件库来保证风格统一，也能直接导入 Figma 文件接着改；二是设计稿可以一键转成代码，把变量、组件、布局这些细节数据直接拉进 CodeBuddy 这类 IDE 里...

#Agent#Code#Tools#Tencent Cloud

精选理由

这条消息本身够具体，产品形态和输出物都交代清楚了，所以 H/K/R 全过。但正文没提模型能力、生成稿的还原度、代码质量、定价和实际用户反馈，这些缺口让它的重要性只能停在 73 分这个位置。我会先打个折，别因为“一键转代码”就过度激动，等有实测数据再调权重。

一句话点评

腾讯把设计稿生成和转代码打通了，但公测阶段没给任何效果数据和实际案例，先当个效率工具看看。

锐评

Ardot 想解决的是产品、设计、开发之间来回传图改稿的麻烦。它把两个环节串了起来：先用一句话生成可编辑的设计稿，再一键把设计稿连同变量、组件、布局数据丢进 CodeBuddy 这类开发工具里还原成代码。支持调用团队自己的组件库这点比较务实，能避免 AI 乱画出一堆没法落地的样式。也兼容 Figma 文件导入，算是给现有工作流留了个入口。但整篇公告没给出任何量化指标——生成稿的可用率是多少、转代码的还原度到几成、复杂页面的处理能力怎么样，这些全都没提。公测刚开，没有用户反馈和对比数据，现在只能说它把流程跑通了，至于省不省时间、能不能上生产环境，还得等真实项目跑过才知道。另外，多人在线评论、权限管理这些功能更像是协作平台的标配，算不上差异化。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:23

26d ago

AI HOT 精选· aihot-apiZH02:23 · 05·18

上传自拍一键生成韩国棒球视频，PixVerse模板火了

PixVerse 的 K-Baseball Sprint 模板让你上传一张自拍，点一下就能生成一段韩国棒球风格的 AI 视频，不需要写提示词也不需要剪辑。这个模板在 X 上被疯转，但正文没披露具体播放量、定价或模型参数，所以热度到底多大、成本多低还不清楚。

#Multimodal#Vision#PixVerse#Product update

精选理由

HKR-H 靠视频模板的病毒钩子过关，但 HKR-K 缺数据、定价和模型细节，HKR-R 没打到从业者痛点。这只是一个产品/模板小更新，所以留在较低的 all 档。

一句话点评

PixVerse 搞了个韩国棒球风 AI 视频模板，上传自拍一键生成，不用写提示词，在 X 上被疯转。这种“零门槛”玩法确实容易出圈，但正文没披露播放量、定价或模型参数，热度多大、成本多低还不清楚。短评：模板化降低使用门槛，但没数据支撑前先别太激动。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

01:16

26d ago

FEATUREDAI HOT 精选· aihot-apiZH01:16 · 05·18

阿里云上线 HappyHorse 视频模型，一条提示词直接出 1080p 多镜头视频

HappyHorse 现在可以在阿里云 Model Studio 上用了。它主打从文字描述一步生成 1080p 的多镜头视频，官方说法是“电影级”画质。目前有个限时 8 折活动，但正文没写原价是多少、模型参数量多大、可用区域和有效期，也没给技术细节或对比评测。我会先打个折：效果到底怎么样，得自己跑几条片子才知道。

#Multimodal#Vision#Alibaba Cloud#HappyHorse

精选理由

HKR 三项都过了：模型名字和 1080p 多镜头让标题有钩子，上线渠道、核心功能和折扣信息都给了，成本与竞争角度也踩中从业者关注点。但价格、参数量和评测都没披露，信息厚度一般，所以卡在 featured 门槛上。

一句话点评

阿里云上线视频生成模型 HappyHorse，文字直出 1080p 多镜头视频，但正文没给价格、参数量、可用区域和效果对比，限时 8 折的吸引力得先打个折。

锐评

HappyHorse 现在能在阿里云 Model Studio 上跑了，主打从一段文字直接生成 1080p 多镜头视频，官方叫它“电影级”画质。这个“一步到位”的流程听起来省事，但正文没披露任何技术细节：模型参数量多大、生成一条视频要多久、对提示词有什么要求，全都没提。更关键的是，限时 8 折活动没写原价，也没说优惠到哪天、哪些区域能用。没有定价和效果基准，这个折扣就没法判断是真省钱还是营销话术。另外，没有跟现有视频生成模型（比如 Runway、Pika、Sora 等）的横向对比，光靠“电影级”三个字撑不起说服力。对想试的人，建议先拿自己的场景跑几条片子，重点看画面一致性、镜头切换是否生硬、文字描述还原度怎么样。如果官方后续能放出系统卡、定价页和用户评测，这条新闻才值得认真对待。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:42

26d ago

FEATUREDAI HOT 精选· aihot-apiZH00:42 · 05·18

开源工具 api-relay-audit 能揪出 AI API 中转站有没有偷工减料

这个工具专门查中转站三类小动作：改写工具调用指令、用报错信息泄露模型身份、偷偷截断上下文。它给出的是可复现的三态结果（有/无/不确定），附带透明日志，比 hvoy.ai 和 cctest.ai 这类工具更可信。作者把检测方法、对比结果和速查表都公开了，工具本身也开源了。

#Tools#Safety#Benchmarking#api-relay-audit

精选理由

我会先打个折：信息源只有一条 X 推文，没有披露实际检出率、误报率或用户规模，所以分数压在低 featured 档。但工具本身思路很实用，把 API 中转站可能搞的小动作拆成三个可检测的维度，还给透明日志，从业者拿到就能跑。正文没提有没有配套的持续监控或告警，这点先别太激动。

一句话点评

这个开源工具能查中转站有没有偷改指令、泄露模型身份或截断上下文，结果分“有/无/不确定”并附日志，比同类工具透明。

锐评

api-relay-audit 做了一件挺实在的事：把 API 中转站常见的三类小动作——改写工具调用指令、通过报错信息泄露底层模型身份、偷偷截断上下文——变成可复现的检测项。它给出的不是模糊评分，而是“有/无/不确定”三态判定，附带透明日志，这点比 hvoy.ai 和 cctest.ai 更可信，因为你能看到它到底查了什么、怎么查的。作者把检测方法、对比结果和速查表都公开了，工具本身也开源，意味着你可以自己跑一遍验证。不过正文没披露它测了多少家中转站、样本量多大，也没说误判率。如果只测了少数几家，结论的覆盖面就有限。另外，检测逻辑依赖双论文锚定路线，但没说明这两篇论文的适用边界——万一中转站用了论文没覆盖的新手法，工具可能漏报。对用中转站接模型的人来说，这个工具能帮你快速排雷，但别把它当合规审计。它查的是技术层面的小动作，不涉及数据留存、隐私合规这些更棘手的问题。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:39

26d ago

AI HOT 精选· aihot-apiZH00:39 · 05·18

人机分拣直播：人类暂时领先，但机器人没掉链子

Figure 直播了一场机器人与人类比快递分拣的挑战，目前人类稍稍领先。正文没披露分拣件数、计时规则和机器人型号，所以这个“领先”有多大参考价值不好说。看点在于直播形式本身——敢把实时对比放出来，说明机器人至少能稳定跑完全流程，不会中途卡住或出错。

#Robotics#Figure#Benchmark

精选理由

HKR-H/R 通过：Figure 的人机分拣对决直播有竞争噱头，且触及仓库自动化焦虑。HKR-K 不通过：分拣件数、计时规则和机器人型号均未披露，信息缺口大，因此落在 60–71 分区间。

一句话点评

Figure 直播机器人和人类比快递分拣，目前人类稍稍领先。正文没披露分拣件数、计时规则和机器人型号，所以这个“领先”有多大参考价值不好说。看点在于直播形式本身——敢把实时对比放出来，说明机器人至少能稳定跑完全流程，不会中途卡住或出错。短评：直播比输赢，信息太少先打折。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

00:29

26d ago

AI HOT 精选· aihot-apiZH00:29 · 05·18

Hermes 一个指令切换国内外大模型，支持 GPT-5.5、Grok-4.3、DeepSeek V4 等七家

Hermes 是一个模型切换工具，支持 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini、DeepSeek V4、智谱 GLM-5、Kimi K2.6 和小米 Mimo V2.5-pro 共七家模型。用户需要自己有对应服务的订阅或 API 密钥，配置好后用 /model 指令就能切换，比如输入 /model gpt-5.5 -...

#Tools#Hermes#OpenAI#xAI

精选理由

这是一条轻量级的工具配置提示，包含了/model切换和7类模型等可用细节，但来源和正文内容单薄。HKR仅K通过，因此落在60分区间。

一句话点评

Hermes 是个模型切换工具，支持 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini、DeepSeek V4、智谱 GLM-5、Kimi K2.6 和小米 Mimo V2.5-pro 共七家。用户需自备订阅或 API 密钥，配置后用 /model 指令切换。好处是省去手动换平台，但正文没披露切换延迟、是否支持流式输出、以及各家 API 成本对比。如果只是命令行切模...

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

00:00

26d ago

● P1AI HOT 精选· aihot-apiZH00:00 · 05·18

Cursor 发布编程模型 Composer 2.5

Cursor 把代码助手 Composer 升级到了 2.5 版，底层还是基于月之暗面的 Kimi K2.5 开源模型。这次主要做了三件事：一是用“文字反馈强化学习”，在模型犯错的地方直接插一句提示（比如“提醒：可用工具有这些”），让模型在那个点上学会纠正，而不是靠最后的总分去猜哪里做错了；二是把合成训练数据的量提到了上一代的 25 倍，并且动态生成更...

#Agent#Code#Fine-tuning#Cursor

精选理由

HKR 三项都踩中了：Cursor 本身就是编程助手的核心入口，文章又给了 Moonshot 基座、25 倍合成数据、文本反馈 RL 和分片 Muon 这些实打实的训练细节。我会先打个折——正文没给基准测试、没提价格，也没说用户端能力边界，所以分数卡在 78–84 这个区间是合理的。

一句话点评

Cursor 把编程模型 Composer 2.5 放出来了，跑分涨了，还专门训了模型的沟通风格和“别瞎忙活”的节奏。

锐评

Cursor 这次更新 Composer 2.5，核心不是换了个更强的底座模型，而是把训练方法做了升级。它还是基于 Kimi K2.5 的开源检查点，但用了两个新招：一是“带文字反馈的定向强化学习”，说白了就是模型在干活过程中哪句话说错了、哪个工具用错了，直接在出错的地方插一句提示当老师，让模型只改那个点，而不是等整件事干完再给个模糊的总分。这对纠正代码风格、减少无效工具调用这类局部毛病很管用。二是用 25 倍于上一代的合成任务来练，动态挑更难的题，防止模型刷分刷到天花板。官方给的跑分表确实涨了，但更值得看的是他们放出的“努力曲线”图——模型在长任务里更稳，不会干到一半开始摸鱼或过度折腾。正文没披露具体延迟和成本变化，也没说这个模型在真实项目里的通过率比 2.0 高多少。另外，他们提到正和 SpaceXAI 用百万张 H100 级别的算力从头训一个更大的模型，那才是真正的下一代，2.5 更像是一次训练工程上的中期升级。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

26d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 05·18

Grok 上线“技能”功能，教它一次偏好就能跨对话记住

xAI 在 5 月 18 日给 Grok 加了个“技能”功能，覆盖网页、iOS 和安卓。你可以把格式偏好、工作流步骤或常用规则教给 Grok 一次，之后所有对话都会自动沿用，不用每次重复。内置了生成 Word 文档、PPT 幻灯片、Excel 表格和 PDF 的技能，开箱即用；不满意可以自己覆盖。还能通过对话或上传文件新建自定义技能，做完的格式和流程可...

#Agent#Tools#Memory#xAI

精选理由

xAI 给 Grok 加了一个“技能”功能，相当于你可以提前告诉它你的偏好、输出格式或一套固定流程，之后每次对话它都会照着来，不用反复交代。跨网页和手机端都能生效，这点对日常用的人挺省事。我会先打个折：正文没写这个功能是免费还是付费、能存多少条规则、会不会跟已有的系统指令冲突。目前看是个实用的更新，但实际好不好用还得看上线后的限制和稳定性。

一句话点评

Grok 上线“技能”功能，教它一次格式或流程，之后所有对话自动记住，不用反复说。内置了直接生成 Word、PPT、Excel 和 PDF 的能力，这点对日常办公挺实用。

锐评

xAI 给 Grok 加了一个“技能”系统，核心是让模型记住你的偏好和工作流，跨对话持续生效。这解决了聊天机器人每次都要重新交代背景的痛点。内置的文档生成技能覆盖了 Word、PPT、Excel 和 PDF，开箱即用，还能自己新建或覆盖官方版本，灵活性不错。不过，官方公告没提任何性能或成本数据。比如，生成一个带公式和格式的 Excel 文件，从指令到出文件要等多久？复杂排版会不会翻车？这些直接影响能不能真当生产力工具用。另外，“技能”的跨对话记忆具体怎么存、存多少、隐私怎么处理，正文也没展开。我会先打个折：这更像一个把常用指令打包成快捷方式的更新，而不是模型本身变聪明了。实际好不好用，得看它对模糊指令的容错率和生成文件的质量。如果只是套模板，那和现有插件差别不大。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

AX 严选 · 2026-05-18

更多

频道

后台