全部 · 2026-05-29

▸ 50 items · updated 3m ago

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 2573 26105 27120 28142 29116 3064 3162

2026年6月

一二三四五六日

1150 2157 3132 4117 5127 669 773 8141 9135 1084 1196 1288 1346 1434 1570 1682 1775 1886 1955 2027 2120 2274 2374 2468 2564 2640 2724 2837 2956 3083

2026年7月

一二三四五六日

156 271 347 421 527 664 758 865 975 1050 1134 1228 1345 1484 1582 1683 1745 1818 1938 2051 2170 2265 2340 24 25 26 27 28293031

2026-05-29 · 星期五2026年5月29日

23:58

59d ago

AI HOT 精选· aihot-apiZH23:58 · 05·29

ComfyUI 现在能直接调 OpenRouter 的 20 多个模型了

ComfyUI 新版本接入了 OpenRouter，你可以在同一个工作流里直接选 20 多个模型，不用再单独配置每个模型的 API。对做图生图、视频生成这类需要反复试模型的人来说，省了来回切换的麻烦。不过正文没提具体支持了哪些模型、有没有请求次数限制，也没说 ComfyUI 版本号，想用的话得自己去试。

#Tools#ComfyUI#OpenRouter#Product update

一句话点评

ComfyUI 直接调 OpenRouter，工作流里能选 20 多个模型，省去挨个配 API 的麻烦。对反复试模型做图、做视频的人挺方便。但正文没提具体支持哪些模型、有没有调用次数限制，也没说 ComfyUI 版本号，想用还得自己试。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H0·K1·R1

23:25

59d ago

Product Hunt · AI· rssEN23:25 · 05·29

Tabstack Web Research：一个 API 调用跑完网页调研，还带引用来源

Tabstack 新上线了一个叫 /research 的接口，传一个问题，它自己搜网页、读内容、综合答案、标好来源，一次 API 调用全搞定。正文说面向法律、金融、竞品分析这些“答错要担责”的场景，强调用的是实时网页而不是预索引库，每条回答都带可验证的 URL。团队来自 Mozilla。目前没披露用了什么模型、延迟多高、引用是怎么生成的，也没说定价——...

#Agent#Tools#Tabstack#Product update

一句话点评

Tabstack 新接口 /research，传一个问题，它自己搜网页、读内容、综合答案并标来源，一次 API 搞定。主打法律、金融等“答错要担责”的场景，强调用实时网页而非预索引库，每条回答都带可验证的 URL。团队来自 Mozilla。目前没披露用了什么模型、延迟多高、引用怎么生成的，也没说定价。短评：把“搜索+阅读+引用”打包成一个 API，对做合规类 agent 的团队挺实用。但...

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

61

SCORE

H0·K1·R1

22:31

59d ago

AI HOT 精选· aihot-apiZH22:31 · 05·29

DynoSim：用模拟跑一遍部署配置，省下大把GPU时间

NVIDIA 发了一个叫 DynoSim 的模拟器，专门用来调大模型推理服务的部署参数。调过的人都知道，模型后端、张量并行、调度策略、路由、KV 缓存这些变量互相影响，改一个可能把瓶颈挪到别处，而且跑一次真实实验就要占一堆 GPU。DynoSim 的思路是用离散事件模拟把整个 Dynamo 推理栈跑一遍，在虚拟时钟上模拟请求到达、调度、前向传播、KV ...

#Inference-opt#NVIDIA#Commentary

一句话点评

NVIDIA 发了个叫 DynoSim 的模拟器，专门用来调大模型推理服务的部署参数。调过的人都知道，模型后端、张量并行、调度策略、路由、KV 缓存这些变量互相影响，改一个可能把瓶颈挪到别处，而且跑一次真实实验就要占一堆 GPU。DynoSim 的思路是用离散事件模拟把整个 Dynamo 推理栈跑一遍，在虚拟时钟上模拟请求到达、调度、前向传播、KV 缓存等行为，而不是真的去跑 GPU。它用 ...

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

52

SCORE

H0·K1·R1

22:23

59d ago

AI HOT 精选· aihot-apiZH22:23 · 05·29

Claude Design Card：把文字一键转成公众号首图和小红书卡片，支持28种布局

这是一个专为中文内容创作者设计的开源工具，能把文字、链接或文章直接生成视觉卡片，比如公众号首图、小红书图文卡、教程步骤卡。它自动提炼重点、选版式、生成HTML再截图成PNG，省掉手动用Figma或Canva的步骤。支持28种布局和10种主题，核心价值是自动化“写完文章后最繁琐的排版流程”。开源，适合经常发内容的创作者试试。

#Tools#claude-design-card#Figma#Canva

一句话点评

这个开源工具能把文字/链接一键转成公众号首图、小红书卡片，支持28种布局和10种主题，省掉手动开Figma的步骤。核心是自动提炼重点→选版式→生成HTML→截图PNG。开源免费，适合高频发内容的创作者。不过正文没披露生成一张图要多久、截图质量是否稳定，实际体验可能打折扣。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

64

SCORE

H1·K1·R0

22:19

59d ago

FEATUREDAI HOT 精选· aihot-apiZH22:19 · 05·29

Codex 现在能自己管自己的聊天线程和并行任务了

OpenAI 的 Codex 界面新增了对话线程管理能力，可以自己创建、搜索、整理和固定聊天线程，还能为并行任务启动工作树。这条信息来自 X 上的用户分享，正文没披露具体实现方式、准确率或延迟数据，我会先打个折——目前看起来更像一个便利功能，而不是底层模型能力的升级。

#Agent#Code#Tools#Product update

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

Codex 能自己管聊天线程了，还能开并行工作树。但正文没给准确率或延迟，先当便利功能看。

锐评

这条更新让 Codex 能自己创建、搜索、整理和固定对话线程，还能为并行任务启动工作树——相当于给 AI 助手加了个自动整理聊天记录和任务面板的功能。来源是 X 上的用户分享，OpenAI 官方没发技术细节，所以准确率、延迟、能同时处理多少线程这些关键指标全是空白。从实用角度看，这解决了一个真实痛点：用 Codex 干活时对话一多就乱，手动管理线程很烦。但别把它当成模型推理能力的升级，更像界面层的自动化脚本。如果线程搜索是靠语义匹配而不是简单关键词，那还有点意思；如果只是按标题排序，价值就有限。还缺什么：正文没披露这个功能是本地运行还是依赖云端、会不会在复杂任务树里自己搞混、以及用户能不能纠正它的整理结果。这些缺口决定了它到底是真省事还是多一个需要盯着的半成品。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

22:14

59d ago

TechCrunch AI· rssEN22:14 · 05·29

程序员开始拒绝不用AI写代码——但可能反噬自己

TechCrunch报道，研究人员警告AI确实让程序员写代码更快，但不一定写得更好。正文没披露样本量、研究方法或具体工具，所以这点先别太激动。长期依赖AI可能让程序员基本功退化，出问题更难自己修。

#Code#TechCrunch#Commentary

一句话点评

短评：AI写代码快但未必好，长期依赖可能让基本功退化。正文没披露样本量和研究方法，结论先打个折。 TechCrunch这篇报道点出一个直觉上成立但证据不足的判断：AI让程序员写代码更快，但不一定写得更好。研究人员警告，长期依赖AI可能导致程序员基本功退化——出bug自己修不了、看不懂底层逻辑。但正文没披露样本量、研究方法或具体工具，所以这点先别太激动。如果真有大样本实验证明“AI辅助下代码...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

21:03

59d ago

AI HOT 精选· aihot-apiZH21:03 · 05·29

ChatGPT 对话目录功能上线

ChatGPT 现在给超过5条回复的对话加了个目录，方便你快速跳转到聊到哪了。正文没说是全平台推送还是灰度测试，也没提用户能不能手动开关。

#Tools#ChatGPT#OpenAI#Product update

一句话点评

ChatGPT 给长对话加了目录，超过5条回复自动生成，方便跳转。官方没说是不是全量推送，也没提能否关闭。小改进，但长聊场景挺实用。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H0·K1·R1

21:00

59d ago

彭博科技· rssEN21:00 · 05·29

三星AI奖金引发韩国科技财富分配争议

彭博社报道，三星因AI业务发放巨额奖金，在韩国引发了一场关于科技财富如何分配的争论。但正文只给出了标题和发布时间（2026年5月29日），没有披露具体奖金数额、涉及哪些公司或分配机制。信息缺口很大，无法判断这笔钱到底有多大、分给了谁、争议焦点是什么。

#Samsung#Bloomberg#Commentary

一句话点评

标题说三星AI发了巨额奖金，在韩国引发科技财富分配争议。但正文只给了导航栏和发布时间，没披露具体金额、涉及哪些公司、分配机制。信息缺口太大，没法判断这笔钱到底有多大、分给了谁、争议焦点是什么。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

58

SCORE

H1·K0·R1

20:42

59d ago

FEATUREDr/LocalLLaMA· rssEN20:42 · 05·29

网友实测 Gemma 4 和 Qwen 3.6 的 MTP 加速：vLLM 上推理速度提升 3.34 倍

一位老哥在 RTX PRO 6000 显卡上跑了 MTP（多 token 预测，一次猜好几个词来加速生成）的测试。他用 vLLM 跑 Gemma 4 31B 模型，开了 MTP 后速度从每秒 39.69 个 token 飙到 132.52 个，快了 3.34 倍。测试是跑 10 次、每次生成 1500 个 token 取的结果。不过帖子没提生成质量有没...

#Inference-opt#Benchmarking#vLLM#llama.cpp

精选理由

精选 · 重要度 73 · 吸引力 + 知识量 + 共鸣

一句话点评

老哥实测 MTP 在 RTX PRO 6000 上把 Gemma 4 31B 推理速度从 39.69 tok/s 拉到 132.52 tok/s，快了 3.34 倍，但没提生成质量有没有掉。

锐评

这条帖子最值钱的就是那个 3.34 倍的提速数字。测试环境是 RTX PRO 6000 这张 Blackwell 架构的新卡，用 vLLM 跑 Gemma 4 31B，开了 MTP（多 token 预测，一次猜好几个词来加速生成）后，每秒能吐 132.52 个 token，不开只有 39.69。测试跑了 10 次、每次生成 1500 个 token，样本量不算大但够看个趋势。不过得打几个折。第一，正文没披露生成质量有没有下降，MTP 猜错词的时候可能会让输出变味，这点他没测。第二，没提显存占用变化，开 MTP 通常要多占显存，对本地跑大模型的人来说这点很关键。第三，帖子只测了 Gemma 4，Qwen 3.6 的数据没放出来，标题里写了但内容缺失。另外原帖被 Reddit 的网络安全拦了，我们只能看到摘要，具体配置和参数细节拿不到。如果你也在本地跑大模型，这个提速幅度值得跟，但先别急着切生产——等有人补上质量对比和显存数据再说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

73

SCORE

H1·K1·R1

20:40

59d ago

AI HOT 精选· aihot-apiZH20:40 · 05·29

Luma Agents 上线：输入内容自动生成宣传图

Luma Labs 宣布 Luma Agents 可以根据用户输入的内容和定义的“钩子”自动生成宣传图，省去手动设计。但正文只给了 App 链接，没提模型细节、定价、输出数量限制或上线范围，实际效果和成本还不清楚。

#Agent#Tools#Multimodal#Luma Labs

一句话点评

Luma 出了个“宣传图自动生成”工具，你给内容和一句钩子，它就能出图。正文只扔了个 App 链接，没提用了什么模型、怎么收费、一次能出几张、哪些地区能用。效果和成本全是问号，先别激动。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

52

SCORE

H1·K0·R0

20:36

59d ago

r/LocalLLaMA· rssEN20:36 · 05·29

用两台本地服务器跑音乐生成模型，彻底扔掉订阅制

一位 Reddit 用户晒出他的自建方案：两台 DGX Spark 机器跑 Plex 做媒体管理，同时并行跑多个 Ace-Step 1.5 XL 模型来生成音乐。他声称这样可以完全替代音乐订阅服务。不过正文被 Reddit 屏蔽了，没披露具体延迟、音质对比或模型微调细节。硬件成本不低（DGX Spark 一台约 3000 美元），但长期看如果真能替代月...

#Audio#Fine-tuning#Reddit#Plex

一句话点评

有人用两台 DGX Spark（约 6000 美元）跑多个 Ace-Step 1.5 XL 模型并行生成音乐，声称能替代订阅服务。但正文被 Reddit 屏蔽，没披露生成一首歌要多久、音质能否比肩 Spotify，也没说模型是否微调过。硬件成本不低，长期看如果真能省月费，对发烧友可能划算，但普通用户别急着跟。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

20:16

59d ago

r/LocalLLaMA· rssEN20:16 · 05·29

8GB显存从零训了个25M小模型，作者自己挺高兴

作者tevlon在Reddit分享了一个GitHub项目，用8GB显存从零训练了一个25M参数的TinyStories模型。他试了几种技巧：MTP（多token预测）确实能跑，但会让训练变慢；BitNet（1比特量化）在训练阶段省不了显存；TurboQuant没必要用。模型很小，不是大语言模型，只是能讲简单故事的小模型。正文没披露训练速度或loss曲线...

#Fine-tuning#Inference-opt#tevlon#GitHub

一句话点评

8GB显存从零训了个25M参数的小模型，能讲简单故事。MTP（多token预测）能跑但拖慢训练，BitNet（1比特量化）训练时省不了显存，TurboQuant没必要。模型太小，不是大语言模型。正文没披露训练速度或loss曲线，实用性有限，但给低显存玩家开了个口子。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

71

SCORE

H1·K1·R1

20:10

59d ago

AI HOT 精选· aihot-apiZH20:10 · 05·29

Runway API 上新了五个模型，包括视频生成和图像放大

Runway API 新增了五个模型：Seedance 2.0（视频生成）、GPT Image 2（图像生成）、HappyHorse 1.0（未知用途）、Nano Banana Pro（可能是轻量模型）和 Magnific Precision Upscaler V2（图像放大）。官方说可以在一个接口里调用这些模型，但正文没披露价格、响应速度、调用次数限...

#Multimodal#Vision#Tools#Runway

一句话点评

Runway API 一口气加了五个模型，包括视频生成 Seedance 2.0、图像生成 GPT Image 2、放大工具 Magnific Precision Upscaler V2，还有两个用途不明的 HappyHorse 1.0 和 Nano Banana Pro。官方说一个接口就能调，但没披露价格、响应速度、调用次数限制和地区可用性。如果价格合理，对想快速集成多种生成能力的开发者挺...

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

67

SCORE

H0·K1·R1

20:03

59d ago

FEATUREDAI HOT 精选· aihot-apiZH20:03 · 05·29

OpenAI 放出一个实时翻译语音模型，70 多种语言输入，13 种语言输出

OpenAI 发了 gpt-realtime-translate，一个专门做语音翻译的模型。你对着它说 70 多种语言里的任意一种，它能直接用 13 种目标语言把语音播出来。OpenAI 说大模型虽然强，但特定任务还是得上专用模型。目前这个功能已经在智能眼镜上跑起来了，不过正文没披露延迟、准确率和具体硬件细节。

#Audio#Multimodal#Inference-opt#OpenAI

精选理由

精选 · 重要度 84 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenAI 出了个专做语音翻译的模型，说 70 多种语言进、13 种出，已经在智能眼镜上跑了。但延迟、准确率、具体哪款眼镜全没提，先当 demo 看。

锐评

OpenAI 这次没拿通用大模型硬套翻译，而是专门训了个 gpt-realtime-translate，思路是对的：实时语音翻译对延迟和稳定性要求极高，通用模型往往顾不过来。它支持 70 多种输入语言，但输出只覆盖 13 种，说明目前重点在主流语种上，小语种输出还没跟上。官方说已经在智能眼镜上跑起来了，这是个关键场景——眼镜是离嘴和耳朵最近的设备，翻译做好了确实顺手。但正文完全没披露端到端延迟、字错率、不同口音下的表现，也没说是哪款眼镜、本地跑还是云端跑。这些数据直接决定它能不能真用，而不是又一个酷炫 demo。另外，专用模型意味着它可能比通用模型更省算力，但 OpenAI 没给任何成本或推理速度的对比。如果延迟能压在 300 毫秒以内，准确率接近人工同传的 90% 左右，那才算有杀伤力。现在只能说方向对了，落地程度还得等实测。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

84

SCORE

H1·K1·R1

19:53

59d ago

r/LocalLLaMA· rssEN19:53 · 05·29

开发者对“氛围编程”忍无可忍，在代码里藏了条删数据的提示注入

一位开发者因为受够了那些靠感觉写代码、不仔细审查 AI 生成代码的“氛围程序员”，故意在代码里埋了一条提示注入指令，触发后会直接删除数据。正文没披露代码藏在哪、什么条件会触发、影响范围有多大，所以暂时没法验证这条注入的真实性和杀伤力。如果属实，这算是一次用极端方式提醒同行：别盲目信任 AI 写的代码，至少跑之前扫一眼。

#Code#Safety#Reddit#Ars Technica

一句话点评

一位开发者受够了“氛围程序员”（不审AI代码直接跑的人），在代码里埋了条提示注入，触发就删数据。正文没披露代码藏在哪、什么条件触发、影响多大，所以暂时没法验证真实性。如果属实，算是一次极端提醒：别盲目信AI写的代码，至少跑前扫一眼。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

19:44

59d ago

彭博科技· rssEN19:44 · 05·29

前 Shield AI 员工起诉高管“粗俗、恶劣”行为

一名前 Shield AI 员工起诉公司一位高管，指控其有“粗俗、恶劣”行为。但正文只返回了彭博社的机器人验证页面，没有披露具体指控内容、涉事高管身份、行为细节、索赔金额或法院文件信息。

#Shield AI#Bloomberg#Incident#Personnel

一句话点评

标题说前员工起诉Shield AI高管行为粗俗恶劣，但正文只有彭博社的机器人验证页面，没披露任何具体指控、涉事人、索赔金额或法院文件。信息缺口太大，无法判断事件严重性，建议等正式报道或法庭记录出来再跟进。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

48

SCORE

H1·K0·R1

19:33

59d ago

r/LocalLLaMA· rssEN19:33 · 05·29

Ostrich-27B：一个业余玩家用两年经验微调的 Qwen 3.6 模型，自称对齐率 75%

Reddit 用户 de4dee 上传了基于 Qwen 3.6 27B 的微调模型 Ostrich-27B-260526-GGUF。他用自己的评测说，这个模型的人类对齐率是 75%，比之前基于 Qwen 3.5 的微调模型（73%）高了两个点。注意这是个人跑的分，不是第三方评测，样本量和测试方法都没披露，所以这个 2% 的提升先别太激动。模型已经发了 ...

#Fine-tuning#Alignment#Benchmarking#Qwen

一句话点评

Reddit 用户 de4dee 基于 Qwen 3.6 27B 微调出 Ostrich-27B，自测人类对齐率 75%，比之前 Qwen 3.5 版高 2 个百分点。但这是个人评测，样本量和测试方法都没披露，2% 的提升先别太激动。模型已上传 Hugging Face，用 Unsloth 训练，正文没披露训练数据量和成本。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

62

SCORE

H1·K1·R1

19:28

59d ago

FEATURED彭博科技· rssEN19:28 · 05·29

OpenAI 在 IPO 承销银行名单里谈过要加花旗和摩根大通

彭博这条消息的正文被反爬页面挡住了，只从标题知道 OpenAI 跟花旗、摩根大通聊过，想把这两家加进自己的 IPO 承销团。至于聊到什么阶段、有没有正式给委托书、IPO 的估值和时间表，正文都没披露。这点先别太激动，目前能确认的信息就这么多。

#OpenAI#Citigroup#JPMorgan#Funding

精选理由

精选 · 重要度 78 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenAI 在跟花旗和摩根大通聊，想把这两家拉进 IPO 承销团，但正文被反爬挡了，估值、时间表、聊到什么阶段全没披露，先别太激动。

锐评

这条消息目前只有标题能确认：OpenAI 确实接触了花旗和摩根大通，讨论让它们加入 IPO 承销队伍。但彭博的正文被反爬页面挡住了，我们看不到任何实质细节——不知道这是初步试探还是已经接近签委托书，也不清楚两家银行会拿什么角色、IPO 的估值区间和大致时间窗口。对 AI 从业者来说，这事的信号意义大于信息量。OpenAI 之前已经选了摩根士丹利和高盛牵头，现在再加两家华尔街大行，通常意味着发行规模不小，需要更多分销能力。但没看到具体数字之前，这只能算一个方向性判断。还缺的东西很明确：IPO 目标估值、融资额、时间表、各家承销商的具体分工，以及 OpenAI 最新的营收和亏损数据。这些才是判断这笔 IPO 成色的关键，目前正文一个字都没给。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

78

SCORE

H1·K1·R1

19:28

59d ago

Hacker News 首页· rssEN19:28 · 05·29

CVE-Bench：测测大模型能不能修真实安全漏洞

作者用20个真实CVE（含Pillow、yt-dlp等18个Python项目）测了5个前沿模型（3个OpenAI、2个Poolside），发现没有一个能稳定修漏洞。最好的是gpt-5.5，整体修复率50%，在给全漏洞描述时也才60%。模型失败模式很固定：搜错文件、预算耗尽、只修一半。成本差异也大，同样效果下token花费能差4倍。如果只告诉模型文件位置...

#Agent#Code#Benchmarking#Benchmark

一句话点评

用20个真实CVE（Pillow、yt-dlp等18个Python项目）测了5个前沿模型，最好的是gpt-5.5，整体修复率仅50%，给全漏洞描述也才60%。模型失败模式很固定：搜错文件、预算耗尽、只修一半。成本差异也大，同样效果token花费能差4倍。但样本只有20个，且全是Python项目，没测C/C++或大型仓库。正文没披露模型具体版本号、每次运行的随机种子，也没说是否重复跑过取均值。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

19:16

59d ago

● P1Hacker News 首页· rssEN19:16 · 05·29

Shift 启动免费家务清洁服务用于机器人训练数据采集

一家叫 Shift 的初创公司提出免费帮人打扫房子，条件是允许它记录整个清洁过程，用来训练未来的家务机器人。正文没披露具体在哪些城市提供服务、怎么收集数据（比如用摄像头还是传感器），也没说机器人什么时候能落地。想法挺直接：用真人干活的数据喂模型，比在实验室里模拟更真实。但数据隐私、用户筛选这些关键细节都还没公开，先别太激动。

#Robotics#Shift#The Verge#Hacker News

精选理由

精选 · 重要度 88 · 吸引力 + 共鸣

一句话点评

用免费保洁换你家的动作数据来训机器人，隐私条款和采集范围正文没细说，先别急着报名。

锐评

Shift 这家公司搞了个很直接的交换：派人上门免费做家务，同时用摄像头和传感器记录整个清洁过程，拿这些数据去训练未来的家务机器人。商业模式上就是用劳动力换训练数据，比纯实验室采集更贴近真实家庭环境。但正文只给了标题和摘要，关键信息全是缺口：采集哪些数据、摄像头拍什么范围、数据怎么存储和授权、用户能不能要求删除，这些都没披露。免费保洁听着划算，但你家可能变成机器人公司的训练场，隐私代价得自己掂量。另外也没说目前采集了多少家庭、数据质量怎么样、模型训练效果有没有验证。对从业者来说，这种真实场景的动作数据确实稀缺，如果隐私和合规框架能跑通，采集成本会比实验室方案低很多。但在看到完整的隐私协议和数据处理流程之前，这个模式还停留在“想法有意思，落地待观察”的阶段。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

88

SCORE

H1·K0·R1

19:15

59d ago

AI HOT 精选· aihot-apiZH19:15 · 05·29

LlamaIndex 给 Google 新出的 Agents API 搭了个文档解析模板

LlamaIndex 团队基于 Google 刚发布的 Agents API 做了一个模板，让智能体能直接调用 LlamaParse 和 LiteParse 来解析非结构化文档。流程分四步：先配好 Git 仓库地址，把仓库克隆到智能体沙箱里，装上 LiteParse 命令行工具和 LlamaParse 的 SDK，最后用提示词驱动智能体干活。说白了就是...

#Agent#Tools#LlamaIndex#Google

一句话点评

LlamaIndex 给 Google Agents API 套了个模板，让智能体能直接调 LlamaParse 和 LiteParse 解析非结构化文档。流程四步：配 Git 仓库、克隆到沙箱、装 CLI 和 SDK、用提示词驱动。说白了就是把文档解析能力打包成智能体技能。亮点是省去自己写工具调用的麻烦，适合快速搭文档处理流水线。但正文没披露解析速度、成本、支持的文件类型上限，也没说沙...

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

63

SCORE

H0·K1·R0

19:00

60d ago

AI HOT 精选· aihot-apiZH19:00 · 05·29

Google 用 AI Studio 搞了个 I/O 2026 测验，全程“氛围编程”

Google 拿自家 AI Studio 工具，用“氛围编程”（就是靠自然语言描述需求让模型写代码，不手敲）做了个 I/O 2026 的在线测验。正文只说了工具和主题，没透露用了哪个模型、具体提示词怎么写、工作流怎么搭，也没说什么时候上线。想抄作业的从业者得自己试了。

#Code#Tools#Google#Product update

一句话点评

Google 用自家 AI Studio 搞了个 I/O 2026 在线测验，全程靠“氛围编程”——也就是用自然语言描述需求让模型写代码，不用手敲。正文只说了工具和主题，没透露用了哪个模型、具体提示词怎么写、工作流怎么搭，也没说什么时候上线。想抄作业的从业者得自己试了。短评：氛围编程做测验，噱头大于细节，缺模型和提示词，抄不了。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

28

SCORE

H0·K0·R0

18:59

60d ago

AI HOT 精选· aihot-apiZH18:59 · 05·29

Gemini Omni 演示：画个圆就能变视频

Gemini App 发了个演示：你上传一段画圆的视频，输入提示词“当我画完这个圆时，它变成了___”，模型就能把草图变成视频。效果看着挺酷，但正文没披露用了什么参数、什么时候开放、怎么收费。目前只是个 demo，离真正上手用还有距离。

#Multimodal#Vision#Gemini App#Gemini Omni

一句话点评

Gemini App 演示了 Omni 的草图转视频功能：上传画圆视频，输入提示词“当我画完这个圆时，它变成了___”，模型就能生成视频。效果酷，但正文没披露用了什么参数、何时开放、怎么收费。目前只是个 demo，离上手还有距离。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

18:40

60d ago

r/LocalLLaMA· rssEN18:40 · 05·29

把 Gemma 4 31B 稠密模型硬改成 MoE 混合专家版

Reddit 用户 SemaMod 发帖说，他参考了另一个开源项目 JDONE-Research/AIOne-Agent-52B-A36B-it，打算把 Google 的 Gemma 4 31B 稠密模型（所有参数都参与计算）改造成原生的 additive-MoE（加性混合专家）架构。做法是训练一个路由器和几个专家子网络，然后打开模型里的 enable...

#Fine-tuning#Inference-opt#Gemma#JDONE-Research

一句话点评

Reddit 用户想把 Gemma 4 31B 稠密模型改成 MoE（混合专家）架构，做法是训练路由器和专家子网络，再打开模型里的 MoE 开关。他参考了另一个开源项目，概念验证脚本预计在 B300 上跑 24 小时。想法有意思，但正文没披露改完后的效果、推理速度或精度变化，目前只是“能跑通”的阶段，离实用还远。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

67

SCORE

H1·K1·R1

18:30

60d ago

FEATUREDAI HOT 精选· aihot-apiZH18:30 · 05·29

Codex 现在能远程操控你的 Windows 电脑了，目前还是早期体验

OpenAI 给 Codex 加上了 Windows 支持，你可以在手机上用 ChatGPT 应用启动、查看和指挥 Codex 在你 Windows 电脑上干活。官方说这是早期体验，正文没披露收费方式和具体开放范围，我会先打个折——稳定性、权限控制和延迟都还没经过大规模验证，别急着把重要任务全交给它。

#Agent#Tools#OpenAI#Codex

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenAI 给 Codex 加了 Windows 支持，手机能遥控电脑干活了。但官方说是早期体验，没提收费和开放范围，稳定性、延迟都还没谱，先别急着把重要任务交给它。

锐评

OpenAI 宣布 Codex 的“计算机使用”功能现在支持 Windows 了。简单说，就是你可以在手机上的 ChatGPT 应用里启动、查看和指挥 Codex，让它在你 Windows 电脑上执行操作。官方举的场景是：工作还在电脑上跑着，你人走开了也能随时接管。这条更新目前只有一条推文，正文没披露收费方式、具体开放范围，也没给出任何性能或延迟数据。它被标为“早期体验”，意味着大规模验证还没做，权限控制、任务稳定性、跨设备同步这些关键点都是未知数。对从业者来说，这更像一个信号：OpenAI 在把 agent 能力往桌面操作系统里推，但离生产环境可用还有距离。还缺的信息包括：它支持哪些 Windows 版本、是否需要后台常驻程序、任务失败时怎么回滚，以及和 macOS 版的功能对齐程度。这些没补上之前，建议只拿非关键任务试试水。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

18:23

60d ago

Hacker News 首页· rssEN18:23 · 05·29

英国明年用AI给难民测年龄，靠照片估算

英国内政部签了一份三年32.2万英镑的合同，让一家IT公司开发AI年龄估算工具，明年先在边境测试，2027年中正式上线。做法是拍一张照片，AI直接判断这个人是不是成年。背景是过去一年有6400多个自称未成年人的难民被做了年龄评估，其中43%最后被认定为成年人。内政部说这能堵住“装小孩混进福利系统”的漏洞。但人权组织反对，说技术没经过充分验证，一旦判错，...

#BBC#Hacker News#Policy

一句话点评

英国内政部花32.2万英镑（三年）签了个AI年龄估算工具，明年先在边境试，2027年中上线。做法是拍张照片让AI判断是否成年。背景是过去一年6400多个自称未成年人的难民被评估，43%最后被认定是成年人。内政部说能堵漏洞，但人权组织反对，说技术没经过充分验证。正文没披露模型名称、训练数据、误判率，也没说有没有人工复核流程。这点先别太激动，成本虽低但一旦判错，真小孩被当成人遣返后果很严重。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

68

SCORE

H1·K0·R1

18:07

60d ago

r/LocalLLaMA· rssEN18:07 · 05·29

英伟达 Computex 前放风：要发笔记本芯片，但啥都没说

英伟达在 Computex（6月2日）前预告了一款笔记本芯片，目前只放出一个 X 链接和台北坐标，外界猜测是 ARM 架构的 PC 芯片。正文没披露规格、定价和出货时间，信息量约等于一张邀请函。

#Inference-opt#Nvidia#Qualcomm#Microsoft

一句话点评

英伟达在 Computex 前放了个烟雾弹：一张 X 链接加台北坐标，暗示要发笔记本芯片。外界猜是 ARM 架构 PC 芯片，对标高通和微软的 Copilot+ PC。但正文没披露规格、定价和出货时间，信息量约等于一张邀请函。短评：先别激动，等 6 月 2 日看真家伙。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

52

SCORE

H1·K0·R0

17:57

60d ago

FEATUREDAI HOT 精选· aihot-apiZH17:57 · 05·29

公司对 AI 上瘾过头，会发生什么？

Box 创始人 Aaron Levie 把一种现象叫“AI 精神病”：决定用 AI 替换员工的人，往往最不了解那些员工到底在干什么。ClickUp 最近为了部署 AI 智能体，裁掉了 22% 的人。2026 年还没过半，科技行业的裁员人数已经快赶上 2025 年全年了。

#Agent#Box#Aaron Levie#ClickUp

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

Box 创始人把“不懂员工在干嘛就拍板用 AI 换人”叫 AI 精神病，ClickUp 已经为此裁了 22% 的人。

锐评

Aaron Levie 给这种现象起了个很直白的名字——“AI 精神病”，指的就是管理层在根本不了解一线工作细节的情况下，就决定用 AI 把员工换掉。ClickUp 是个活生生的例子，为了部署 AI 智能体，直接裁了 22% 的员工。更值得警惕的是数字：2026 年还没过半，科技行业的裁员总数已经快赶上 2025 年全年了。这说明“用 AI 换人”正在从口号变成真实的裁员指标，而且速度在加快。不过，这篇报道本身是视频内容，正文没披露 ClickUp 裁掉的具体岗位类型，也没说替换上去的 AI 智能体实际接手了哪些工作、效果如何。所以“AI 精神病”这个判断虽然听着解气，但还缺最关键的一环：裁完之后，业务到底有没有变好？这点先别太激动，等后续的运营数据出来再看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

17:46

60d ago

● P1Hacker News 首页· rssEN17:46 · 05·29

Robinhood 允许 AI agent 交易股票

Robinhood 宣布开放接口，允许用户的 AI 代理直接进行股票交易。正文没披露具体怎么控制风险、权限边界划在哪、哪些用户能用、收不收费，也没说什么时候全面上线。目前只有 TechCrunch 一篇报道和 Hacker News 上 21 个赞、16 条讨论，信息量有限。让 AI 替你管钱听着刺激，但没看到风控细节前，我会先打个折。

#Agent#Tools#Robinhood#TechCrunch

精选理由

精选 · 重要度 94 · 吸引力 + 共鸣

一句话点评

Robinhood 开了个口子，让 AI 直接拿你的钱炒股。钱锁在独立钱包里，亏完拉倒，不会动你主账户。

锐评

Robinhood 正式允许用户创建独立账户，让 AI agent 直接买卖股票。这些 agent 能读取你的持仓、分析数据、生成策略，但只能动用你预先转入专用钱包的那笔钱，主账户资金不受影响。每笔交易都会推送通知，部分订单需要用户手动批准才能执行。这个设计相当于给 AI 划了个沙盒：你往里放一笔亏光了也不心疼的钱，让它自己跑。TechCrunch 的报道没披露 agent 的决策模型具体怎么运作、回测表现如何，也没提风控细节——比如市场剧烈波动时会不会自动熔断。Robinhood 同时推出了 agent 信用卡，但正文同样没解释信用额度由谁审批、责任怎么划分。目前最缺的是真实用户的盈亏数据和监管态度。让 AI 管钱听着酷，但如果只是把散户情绪化交易换成模型幻觉驱动，风险一点没少。这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

94

SCORE

H1·K0·R1

17:27

60d ago

FEATUREDTechCrunch AI· rssEN17:27 · 05·29

Nvidia 刚花 200 亿美元变相收购人才，AI 芯片公司 Groq 又传出要内部融资 6.5 亿，重心从硬件转向推理

Axios 的消息说，Groq 正在寻求 6.5 亿美元的内部融资，同时公司方向会从造芯片转向主攻 AI 推理，也就是优化模型接到指令后生成回答的那一步。这个动作发生在 Nvidia 被曝用 200 亿美元做了一笔“非收购式挖人”之后。正文没披露 Groq 现在的估值、投资人是谁、交易结构，也没说这轮融资的时间表。

#Inference-opt#Groq#Nvidia#Axios

精选理由

精选 · 重要度 72 · 吸引力 + 知识量 + 共鸣

一句话点评

Groq 要从造芯片转向做推理了，还顺手融 6.5 亿。但正文没给估值和投资人，这点先别太激动。

锐评

这条消息的核心是 Groq 在战略上大转弯：从一家芯片公司变成主攻 AI 推理的服务商。推理你可以理解成模型接到指令后生成回答的那一步，Groq 想优化这个环节的速度和成本。融资额是 6.5 亿美元，数字不小，但 Axios 的报道没披露估值、投资人、交易结构，也没说钱什么时候到账，所以没法判断这轮是溢价还是流血。背景是 Nvidia 刚被曝用 200 亿美元做了一笔“非收购式挖人”，直接掏钱把团队和人才吸走，但不买公司。Groq 在这个节点转向并融资，像是在硬件这条路上被挤得没空间了，只能往软件和服务方向找活路。目前缺的信息很关键：Groq 现有的芯片客户怎么办？推理业务的具体产品形态是什么？跟已有的云推理服务比，它的优势在哪？这些正文都没提，只能等后续披露。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

72

SCORE

H1·K1·R1

17:26

60d ago

● P1AI HOT 精选· aihot-apiZH17:26 · 05·29

Anthropic 估值冲到 9650 亿美元，首次超过 OpenAI

Anthropic 刚完成一轮 650 亿美元融资，投后估值达到 9650 亿美元，数字上压过了 OpenAI。这是两家公司估值排位第一次反转。不过正文没披露这轮融资的具体领投方、资金用途，也没提 OpenAI 当前的最新估值做对比，所以这个“超越”能持续多久还不好说。

#Anthropic#OpenAI#Funding

精选理由

精选 · 重要度 92 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 估值首次压过 OpenAI，但正文没披露领投方和 OpenAI 最新估值，这个“超越”能撑多久不好说。

锐评

Anthropic 刚完成一轮 650 亿美元融资，投后估值 9650 亿美元，数字上第一次超过了 OpenAI。这是两家公司估值排位的一次反转，但先别急着下结论。报道本身是 Bloomberg 的视频快讯，信息量很薄，没提这轮融资的具体领投方、资金用途，也没给出 OpenAI 当前的最新估值做对比。所以这个“超越”更像一个瞬时快照，而不是格局已定。 9650 亿这个数字本身大得有点抽象，它反映的是二级市场对 Anthropic 未来收入的极端乐观预期，而不是当下的营收规模。没有披露收入、利润率或用户增长数据，就很难判断这个估值是贵了还是合理。另外，650 亿的单轮融资额也创了纪录，说明资本还在疯狂往头部 AI 公司灌钱，但钱灌进去之后能不能换来对应的技术壁垒或市场份额，正文完全没提。还缺几个关键信息：OpenAI 同期估值到底是多少、Anthropic 这轮钱主要投向算力还是收购、以及两家在企业和开发者市场的实际份额对比。这些缺口填不上，估值排位就只是一条标题。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

92

SCORE

H1·K1·R1

17:14

60d ago

AI HOT 精选· aihot-apiZH17:14 · 05·29

Kog 把推理速度拉到 3000 token/s，是常规的 10-30 倍

Kog 团队在 8 块 AMD MI300X 上跑出单用户 3000 token/s，8 块 NVIDIA H200 上 2100 token/s，而常规推理只有 100-300 token/s。他们把 LLM 解码当成内存流问题来解，用 monokernel 设计、重建同步机制、针对性内存映射，以及一个叫 Laneformer 的模型架构（延迟张量并...

#Inference-opt#Kog#AMD#NVIDIA

一句话点评

Kog 在 8 块 AMD MI300X 上跑出单用户 3000 token/s，比常规推理快 10-30 倍。核心是把解码当内存流问题，用 monokernel 和 Laneformer 架构消除阻塞。但这是单用户场景，多用户并发下性能未知，且 Laneformer 是否通用、能否适配现有模型都没说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

16:28

60d ago

r/LocalLLaMA· rssEN16:28 · 05·29

15万美元预算，给300人搭本地推理服务器，Reddit 在吵该买什么

Reddit 用户 Porespellar 想用不到15万美元搭一台带故障切换的本地推理服务器，对标4卡 H100 的生产级机器。目标：跑 122B AWQ 模型、256K 上下文、vLLM 框架、TP=2，再加一个小 embedding 模型，服务约300人。帖子正文被 Reddit 屏蔽了，看不到具体讨论，但光这个配置需求就够硬件党吵一阵——122...

#Inference-opt#Embedding#Reddit#Porespellar

一句话点评

有人想用15万美元搭一台能服务300人的本地推理服务器，对标4卡H100，跑122B模型、256K上下文。这个预算买4张H100都不够，所以得靠AMD Instinct MI300X或Intel Gaudi 3这类性价比更高的卡，或者上二手H100。但正文被Reddit屏蔽了，看不到具体讨论，所以不知道社区推荐了什么方案。关键信息缺失：故障切换怎么实现、网络拓扑、散热和功耗都没提。如果是真打...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

16:26

60d ago

r/LocalLLaMA· rssEN16:26 · 05·29

llama.cpp 要出统一命令行工具和官网了

llama.cpp 项目在讨论一个叫 llama.app 的新网站和一个统一的 llama 二进制文件，以后可能不用记一堆子命令了。正文只给了链接，没透露发布时间、安装步骤或兼容哪些硬件，想尝鲜还得再等等。

#Inference-opt#Tools#ggml-org#llama.cpp

一句话点评

llama.cpp 要出统一二进制了，以后跑模型不用记一堆子命令，一个 llama 搞定。但正文只给了个链接，没提发布时间、安装步骤、兼容哪些硬件。想尝鲜还得再等等。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

16:19

60d ago

Hacker News 首页· rssEN16:19 · 05·29

Liquid AI 发布 8B 参数 MoE 模型，38T tokens 训练，主打端侧工具调用

Liquid AI 推出了 LFM2.5-8B-A1B，一个混合专家（MoE）模型，总参数量 8B，但每次推理只激活 1B 参数，所以能在普通笔记本上跑。相比去年 10 月的上一版，训练数据从 12T tokens 涨到 38T（多了两倍多），上下文窗口从 32K 扩展到 128K（能一次处理更长的文档），词表也翻倍到 128K，对印地语、泰语等非拉丁...

#Inference-opt#Benchmarking#Liquid AI#Research release

一句话点评

Liquid AI 发了新 MoE 小模型，总参数量 8B 但每次只激活 1B，能在普通笔记本上跑。训练数据从 12T 涨到 38T tokens，上下文从 32K 扩到 128K，词表翻倍到 128K 以改善非拉丁语系效率。正文没披露具体评测分数和定价，实际效果和性价比还得等第三方跑分。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

16:17

60d ago

FEATUREDAI HOT 精选· aihot-apiZH16:17 · 05·29

OpenRouter 加了个服务器端工具，让模型直接生成文件补丁

OpenRouter 在 Responses API 里上线了 apply_patch 工具，模型可以生成 V4A 格式的 diff 来创建、修改或删除文件。服务器端会先校验 diff 语法，不用客户端自己折腾。正文没披露这个校验具体能拦住哪些错误，也没说支持哪些模型。

#Tools#Code#OpenRouter#Product update

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenRouter 让模型能直接生成文件补丁了，服务器端会先验一下 diff 格式对不对，省得你自己折腾。但正文没提能拦住哪些错误，也没说支持哪些模型。

锐评

OpenRouter 在 Responses API 里加了个 apply_patch 工具，模型可以生成 V4A 格式的 diff 来创建、修改或删除文件。服务器端会先校验 diff 语法，不用客户端自己处理格式问题，这点对开发者来说省了一步脏活。但正文没披露两个关键信息：一是这个校验到底能拦住什么级别的错误——是只检查格式，还是能发现语义冲突？如果只是格式校验，那模型生成一个语法正确但逻辑错误的补丁照样会炸。二是没提支持哪些模型，是只有特定模型能用，还是所有接入 OpenRouter 的模型都能调这个工具。另外，V4A diff 格式本身对非代码文件（比如文档、配置）的适用性也没说明。如果模型改的是 YAML 缩进或者 JSON 结构，diff 校验能不能发现破坏性修改，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

16:13

60d ago

TechCrunch AI· rssEN16:13 · 05·29

Cognition 创始人说 AI 编程助手不该取代人类

Cognition 的 Scott Wu 表示，他们开发的 AI 编程助手 Devin 不是为了替代程序员。Devin 是目前最知名的 AI 编程 agent，但 Wu 强调它只是辅助工具。正文没披露 Devin 的用户数、客户案例或具体路线图，所以这点先别太激动——产品定位和实际效果之间还有距离。

#Agent#Code#Cognition#Scott Wu

一句话点评

短评：Devin 老板亲自降温：AI 编程 agent 不是来替代程序员的。但正文没给用户数或案例，定位和效果之间还有距离。点评：Cognition 的 Scott Wu 公开表态，自家明星产品 Devin 不是来替代程序员的，而是辅助工具。这算是给行业过热情绪泼了盆冷水——毕竟 Devin 是目前最出圈的 AI 编程 agent，外界很容易把它想象成“程序员终结者”。但正文只给了这个表...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

66

SCORE

H1·K0·R1

16:13

60d ago

AI HOT 精选· aihot-apiZH16:13 · 05·29

Cognition创始人说AI编程智能体不该取代人类

Cognition做了个叫Devin的AI编程智能体，号称是第一个也是最成功的。但创始人Scott Wu自己说，这东西不是用来替代程序员的。正文没披露Devin的用户量、定价或技术细节，所以这个表态更像是在安抚开发者情绪，而不是产品真有明确边界。

#Agent#Code#Cognition#Scott Wu

一句话点评

Cognition 创始人 Scott Wu 公开说 Devin 不是用来替代程序员的。正文没披露用户量、定价或技术细节，所以这个表态更像安抚开发者情绪，而不是产品真有明确边界。短评：老板亲自说“不取代人”，要么是产品边界真清楚，要么是怕开发者抵制。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

65

SCORE

H1·K0·R1

16:06

60d ago

FEATUREDAI HOT 精选· aihot-apiZH16:06 · 05·29

xAI 把 Grok Build 0.1 放出来公测了，主打帮 AI 写代码

xAI 通过 API 放出了 grok-build-0.1 的公测版，就是驱动 Grok Build CLI 的那个模型，定位是让 AI 去干编程的活儿。价格是输入每百万 token 1 美元，输出每百万 token 2 美元。官方说它便宜、聪明还快，但正文没给出具体的跑分、延迟数据或跟其他编程模型的对比，所以“极具成本效益”这点先别太激动，得自己上手...

#Agent#Code#xAI#Grok

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

xAI 把 Grok Build 的编程模型放出来公测了，输入 1 刀、输出 2 刀每百万 token，但没给跑分和延迟，便宜不便宜得自己跑一遍才知道。

锐评

xAI 这次把驱动 Grok Build CLI 的模型单独拿出来，通过 API 公测，定位就是让模型去干编程的活儿。定价输入每百万 token 1 美元、输出 2 美元，放在编程模型里确实算低的那档，但官方说“极具成本效益”这点先别太激动——正文没给出任何基准测试分数、延迟数据，也没跟 Claude Code 或 GPT-4o 这类同样能写代码的模型做对比。等于只给了价格标签，没给性能收据。这个模型之前藏在 Grok Build 命令行工具里，现在拆出来单独卖，说明 xAI 想直接切编程助手和 agent 编码这块市场。但公测阶段信息缺口很明显：它擅长哪种语言、什么规模的代码任务、上下文窗口多大、能不能接外挂资料库，这些全都没提。如果你要拿它做生产环境的 coding agent，建议先拿自己项目的代码跑一轮，重点看生成质量、响应速度和连续对话时的稳定性，别光看价格就切过去。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

16:05

60d ago

AI HOT 精选· aihot-apiZH16:05 · 05·29

Gemini架构师聊幕后：Jeff Dean等四人出镜，但没提参数、架构或发布时间

Google AI的播客节目请来四位Gemini架构师，包括Jeff Dean。他们聊了团队如何推动AI前沿，但正文没披露模型参数、架构变化或发布时间线。想听八卦可以看，想找技术细节的可以跳过。

#Google AI#Jeff Dean#Gemini#Commentary

一句话点评

Google AI 播客请来四位 Gemini 架构师（包括 Jeff Dean）聊幕后故事，但正文没披露任何模型参数、架构变化或发布时间线。想听八卦可以看，想找技术细节的可以跳过。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

52

SCORE

H1·K0·R0

16:00

60d ago

AI HOT 精选· aihot-apiZH16:00 · 05·29

NVIDIA 开源 MCG 工具包：一分钟自动生成模型说明书，应对加州和欧盟 AI 法规

NVIDIA 发布了一个叫 MCG 的工具包，能自动给 AI 模型写说明书（Model Card）。你给它一个 GitHub 链接或上传文件，它就能在不到一分钟内生成一份包含模型用途、训练数据、性能、偏见、隐私等字段的文档。背后用了 RAG（外挂资料库）和 GPT-OSS-120B 模型来提取代码和文档里的信息。测试下来，91% 的字段能填上，准确率 ...

#Safety#Tools#NVIDIA#Product update

一句话点评

NVIDIA 出了个自动写模型说明书的工具 MCG，给个 GitHub 链接就能在 1 分钟内生成 Model Card，91% 字段能填上，准确率 76%。背后用了 RAG（外挂资料库）和自家 GPT-OSS-120B 模型。主要为了应付加州 AB-2013 和欧盟 AI 法案的合规要求。Oracle 已经在用了。短评：填表自动化，合规省力，但准确率 76% 意味着近四分之一的字段可能...

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

63

SCORE

H0·K1·R1

15:58

60d ago

AI HOT 精选· aihot-apiZH15:58 · 05·29

Replit 直播预告：Canvas 新功能 + Clerk 自定义登录

Replit 发了一条推文，预告一场直播，主题是 Canvas 新功能和用 Clerk 做自定义登录。但正文只给了一个直播链接，没透露任何具体信息：新功能是什么、登录流程怎么改、价格或上线时间，一概没提。想了解细节只能自己去看直播回放。

#Tools#Clerk#Product update

一句话点评

Replit 预告直播讲 Canvas 新功能和 Clerk 自定义登录，但正文只甩了个直播链接，没提任何具体改动、价格或上线时间。想了解细节只能自己看回放，信息量约等于零。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

28

SCORE

H0·K0·R0

15:55

60d ago

AI HOT 精选· aihot-apiZH15:55 · 05·29

Gemini 本月更新：新界面 + 全天候智能体助手

Gemini 官方宣布了本月更新，核心是重新设计的界面和 Gemini Spark 的 24 小时智能体辅助。正文没披露具体功能细节、上线范围、支持平台、定价或性能变化，所以目前只能确认产品层面的标题信息。

#Agent#Gemini#Gemini Spark#Product update

一句话点评

Gemini 本月更新主要提了两个点：界面重设计，以及 Gemini Spark 的 24 小时智能体辅助。但正文没披露任何具体功能、上线范围、平台或定价，所以目前只能当产品预告看。短评：界面和全天候助手是亮点，但没细节前先别激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

15:22

60d ago

r/LocalLLaMA· rssEN15:22 · 05·29

给机器人接上实时语音大脑，Reachy Mini 能边聊边看边动

Opper AI 把 Hugging Face 的 Reachy Mini 机器人接上了 GPT Realtime 2，开放了 19 个动作和感知工具，让机器人能实时对话、调用摄像头看东西、转录语音、执行工具指令。代码支持 Python 3.12+，MIT 协议开源。正文没披露延迟数据，但实时语音+视觉+动作的链路对网络和模型响应速度要求很高，实际体验...

#Agent#Audio#Robotics#Opper AI

一句话点评

Opper AI 给 Reachy Mini 机器人接上了 GPT Realtime 2，开源了 19 个动作和感知工具，支持实时对话、摄像头看东西、语音转录和工具调用。代码用 MIT 协议，Python 3.12+ 就能跑。关键看点是“实时语音+视觉+动作”这条链路，对网络和模型响应速度要求很高，正文没披露延迟数据，实际体验可能要打折。另外，Reachy Mini 本身是教育级硬件，精...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

15:17

60d ago

r/LocalLLaMA· rssEN15:17 · 05·29

MarkItDown 文档转 Markdown 的 API 服务更新了

一个把 PDF、Word、Excel 等文件转成 Markdown 的 API 服务更新了依赖，顺便修了上游文档解析器的安全漏洞。接口和 Docker 部署方式没变，还是上传文件就能拿到 Markdown 结果，方便喂给外挂资料库（RAG）或大模型流程。正文没披露具体修了哪些漏洞，也没说性能变化。

#RAG#Tools#Microsoft#MarkItDown

一句话点评

MarkItDown API 更新了依赖，修了上游文档解析器的安全漏洞，接口和 Docker 部署没变。还是上传文件转 Markdown，方便喂给外挂资料库（RAG）或大模型流程。正文没披露具体修了哪些漏洞，也没说性能变化。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

45

SCORE

H0·K1·R0

15:00

60d ago

AI HOT 精选· aihot-apiZH15:00 · 05·29

Kling AI 在戛纳展示全 AI 电影《RAPHAEL》制作流程

Kling AI 在戛纳放出了一部叫《RAPHAEL》的短片，全程用自家模型做，从创意到成片都走 AI 工作流。正文没披露用了多少算力、花了多少钱、做了多久，也没给可复现的步骤，所以目前只能当个概念展示看。

#Multimodal#Vision#Tools#Kling AI

一句话点评

Kling AI 在戛纳放了一部叫《RAPHAEL》的短片，全程用自家模型做，从创意到成片都走 AI 工作流。正文没披露用了多少算力、花了多少钱、做了多久，也没给可复现的步骤，所以目前只能当个概念展示看。短评：概念片，没成本没步骤，先别当标杆。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

32

SCORE

H0·K0·R0

14:23

60d ago

彭博科技· rssEN14:23 · 05·29

市场疯狂押注AI，哈佛教授泼冷水

Bloomberg Odd Lots 采访了哈佛教授 Gita Gopinath，讨论了一个场景：AI 带来高生产率但没引发社会动荡。市场因为 AI 需求接近历史高点，但正文没披露具体投资规模、模型细节或时间线。教授的观点是别太激动，高生产率不一定能平稳落地。

#Bloomberg#Gita Gopinath#Harvard#Commentary

一句话点评

Bloomberg Odd Lots 请哈佛教授 Gita Gopinath 聊 AI 高生产率但没引发社会动荡的场景。市场因 AI 需求接近历史高点，但正文没披露具体投资规模、模型细节或时间线。教授观点是别太激动，高生产率不一定能平稳落地。短评：宏观泼冷水，缺数据支撑，当风险提示看就好。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

14:15

60d ago

Hacker News 首页· rssEN14:15 · 05·29

在线心理平台 Headway 强制患者刷脸才能继续看病

Headway 是一家流行的在线心理治疗平台，它通知用户和医生必须做面部扫描来验证身份，没有退出选项，只能离开平台。具体流程是拍一张政府证件照片，再用摄像头左右转头扫脸。平台声称面部图像只用于身份验证，但正文没披露数据存储时长、是否与第三方共享，也没有提供不扫脸的替代方案。对用户来说，这意味着要么交出生物识别数据，要么中断治疗——一个挺现实的两难选择。

#Vision#Safety#Headway Therapy#Incident

一句话点评

在线心理平台 Headway 强制用户扫脸验证身份，不扫就断治疗。流程是拍证件照+左右转头，平台说只用于验证，但没交代数据存多久、是否给第三方，也没有替代方案。对用户来说，要么交生物数据，要么中断治疗——一个挺现实的两难选择。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

68

SCORE

H1·K0·R1

14:00

60d ago

● P1TechCrunch AI· rssEN14:00 · 05·29

Box创始人Levie批评CEO对AI能力认知不足导致误判

Box创始人Aaron Levie说很多CEO搞不清AI到底能替代什么工作，他把这叫做“AI精神病”。他举例ClickUp最近裁了22%的员工，换成AI agent干活。2026年科技公司裁员人数已经快赶上2025全年了。Levie认为，最不懂你工作内容的人，恰恰是决定AI能不能取代你的人。正文没披露播客里完整的争论细节。

#Agent#Aaron Levie#Box#ClickUp

精选理由

精选 · 重要度 86 · 吸引力 + 知识量 + 共鸣

一句话点评

Box 创始人 Aaron Levie 把 CEO 们高估 AI 替代能力叫“AI 精神病”，因为拍板裁人的人往往最不懂一线岗位在干什么。

锐评

Aaron Levie 给这种现象起了个很直白的名字——“AI 精神病”，指的就是管理层对 AI 能力的判断已经脱离实际。核心矛盾在于：决定用 AI 替换岗位的人，恰恰是最不了解那些岗位具体做什么的人。文章举了 ClickUp 的例子，这家公司最近裁了 22% 的员工，直接让 AI 代理顶上。TechCrunch 还提到，2026 年刚过半，科技行业的裁员规模已经快赶上 2025 全年了。这些数字说明，用 AI 替代人力的冲动正在加速，但文章没给出任何数据来证明替代后的效率或产出是否真的持平。Levie 的观点更多是基于观察和行业直觉，而不是对照实验。我会先打个折：这更像一个警示，而不是一份诊断报告。还缺什么？缺被裁岗位的具体类型、AI 代理接手后的实际表现数据，以及这些公司后续的营收或客户满意度变化。没有这些，我们很难判断这到底是理性降本，还是管理层在拿组织做一场高风险实验。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

86

SCORE

H1·K1·R1

13:37

60d ago

Hacker News 首页· rssEN13:37 · 05·29

AISlop：一个本地 CLI 工具，专门抓 AI 写代码留下的“屎山”

Kenny 开源了 AISlop，一个跑在本地的命令行工具，能扫描 AI 生成的代码，找出空 catch 块、无意义注释、重复工具函数和死代码等 40 多种模式。支持 7 种语言，检测速度亚秒级，不用大模型，规则是确定性的。可以接入 CI 或 agent 的 hook，让 AI 每次写完代码自己先检查一遍。对于用 AI 写代码的团队来说，相当于给代码质...

#Agent#Code#Tools#Kenny

一句话点评

Kenny 开源了 AISlop，一个本地 CLI 工具，能扫出 AI 代码里 40 多种“屎味”模式：空 catch、无意义注释、重复工具函数、死代码。检测亚秒级，不用大模型，规则是确定性的，支持 7 种语言。可以接进 CI 或 agent 的 hook，让 AI 写完自己先查一遍。对于用 AI 写代码的团队，相当于给代码质量上了个低成本保险——不用跑大模型，不费钱，不泄露代码。但注意：它...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

更多

✕

频道

热点聚合每日 AI 日报全部播客·视频 AX 严选 X 监控收藏信源邮件订阅 Agent 接入

后台

用量系统订阅管理精选策略策略迭代用户