全部 · 2026-05-18

▸ 50 items · updated 3m ago

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 2573 26105 27120 28142 29116 3064 3162

2026年6月

一二三四五六日

1150 2157 3132 4117 5127 669 773 8141 9135 1084 1196 1288 1346 1434 1570 1682 1775 1886 1955 2027 2120 2274 2374 2468 2564 2640 2724 2837 2956 3083

2026年7月

一二三四五六日

156 271 347 421 527 664 758 865 975 1050 1134 1228 1345 1484 1582 1683 1745 1818 1938 2051 2170 2265 2340 24 25 26 27 28293031

2026-05-18 · 星期一2026年5月18日

23:53

70d ago

r/LocalLLaMA· rssEN23:53 · 05·18

Reddit 用户实测：Pi 这个编程助手系统提示不到 2K token，本地跑 Qwen 27B 只差一个联网搜文档

Reddit 用户对比了 Codex CLI、Claude Code、Gemini CLI、OpenCode 和 Pi，重点推荐 Pi。Pi 只用了读、写、编辑和 bash 四个工具，系统提示控制在 2K token 以内，意味着上下文占用少、成本低。用户用 Qwen 27B-MXFP8 本地跑了一遍，唯一缺的是内置的联网搜文档功能。正文没披露 Pi ...

#Agent#Code#Tools#Codex CLI

一句话点评

Pi 用四个工具（读、写、编辑、bash）和 2K token 系统提示，上下文占用少、成本低。用户本地跑 Qwen 27B-MXFP8 实测可行，缺内置联网搜文档。正文没披露 Pi 的准确率和延迟，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

23:18

70d ago

Hacker News 首页· rssEN23:18 · 05·18

Anthropic 联合创始人将与教皇共同发布 AI 通谕

教皇 Leo XIV 的首道通谕《Magnifica humanitas》将于 5 月 25 日发布，Anthropic 联合创始人将一同出席。通谕内容、具体日期和联合创始人姓名正文都没披露，目前只有 Hacker News 上 17 个点赞和 1 条评论。这是梵蒂冈首次直接拉 AI 公司高层参与教义文件发布，信号意义大于技术细节。

#Safety#Anthropic#Pope Leo XIV#Policy

一句话点评

教皇 Leo XIV 首道通谕发布日，Anthropic 联合创始人将同台亮相。信号意义大于技术细节——通谕全文、具体日期和创始人姓名正文都没披露，目前只有 Hacker News 上 17 个点赞和 1 条评论。这是梵蒂冈首次直接拉 AI 公司高层参与教义文件发布，但信息缺口太大，先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

67

SCORE

H1·K0·R1

22:33

70d ago

● P1FT · 科技· rssEN22:33 · 05·18

NextEra与Dominion达成4200亿美元公用事业合并交易

这篇 FT 报道正文被付费墙挡住了，只露出标题和摘要片段。标题里提到的“Project Astra”是一桩 4200 亿美元的并购案，由 NextEra 和 Dominion 两家电力公司主导，目标是拿下美国“数据中心走廊”的供电控制权。但具体怎么合并、钱怎么分、监管批不批、成本最终会转嫁给 AI 客户还是普通用户，这些关键信息正文都没披露。我会先打个...

#NextEra#Dominion#Partnership#Policy

精选理由

精选 · 重要度 86 · 吸引力 + 知识量 + 共鸣

一句话点评

NextEra和Dominion合并成一家4200亿美元的电力公司，直接原因是AI数据中心太耗电了。但FT这篇正文被付费墙挡了，具体交易结构和监管风险都没看到。

锐评

这笔交易的核心逻辑很直白：AI算力中心正在疯狂吞噬美国电网的负荷，电力公司与其各自为战，不如抱团抢下这块增量蛋糕。4200亿美元的合并体量，说明市场已经把电力供应看作AI基建的硬瓶颈，不再是配角。但FT的报道正文被锁在付费墙后面，我们看不到交易的具体条款、股权结构，也不知道监管机构会从哪个角度审查——是反垄断，还是电价上涨对居民用户的冲击。标题里提到“会引发一场关于AI繁荣成本的争斗”，这个判断很关键，但缺少细节支撑。目前能确认的只有合并规模和两家公司的名字，至于这笔交易最终会让数据中心用上更便宜的电，还是把成本转嫁给普通家庭，正文没披露，这点先别急着下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

86

SCORE

H1·K1·R1

22:32

70d ago

r/LocalLLaMA· rssEN22:32 · 05·18

前三星高管预测：中国扩产可能让内存价格在2027下半年降价

一位前三星芯片高管认为，中国在内存上的大笔投资可能让RAM价格在2027年下半年降下来。他提到长鑫存储（CXMT）计划在上海IPO募资42亿美元，月产能从28万片晶圆提升到30万片以上，到2026年底还能每月产出3万片HBM晶圆。如果这些新产能真能落地，供应多了价格自然会松动。不过正文没披露中国产能爬坡的具体良率和验证进度，这点先别太激动——扩产到真正...

#Samsung#CXMT#ChangXin Memory Technologies#Commentary

一句话点评

前三星高管说中国内存扩产可能让RAM在2027下半年降价。长鑫存储计划IPO募42亿美元，月产能从28万片提到30万片以上，2026年底还能产3万片HBM。产能落地确实能压价，但正文没披露良率和验证进度，扩产到真正出货有距离。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

21:59

70d ago

FEATUREDHacker News 首页· rssEN21:59 · 05·18

墨西哥政府被一个用 Claude 的独狼攻破，150GB 数据被拖走

这篇文章讲的是 AI 没发明新攻击手法，但把攻击的人力成本打到了几乎为零。作者举了三个 2025 年的真实案例：一个独狼用 Claude Code 伪装成漏洞赏金猎人，攻破墨西哥税务局、选举机构和多个州政府，拖走 150GB 数据，包括 1.95 亿条纳税人记录；另一个用 Claude 当“现场指挥”，对 17 家医疗和应急机构搞勒索；还有个阿尔及利亚...

#Agent#Safety#Anthropic#Mexican government

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

一个独狼用 Claude 伪装成漏洞赏金猎人，攻破墨西哥多个政府系统，拖走 150GB 数据，含 1.95 亿条纳税人记录。攻击成本降到几乎为零，但正文没披露具体攻击手法、时间线和确认来源。

锐评

这篇文章的核心判断很直接：AI 没发明新攻击，但把攻击的人力成本打到了几乎为零。作者举了 2025 年的真实案例，最扎眼的是墨西哥政府被一个独狼用 Claude Code 攻破，伪装成漏洞赏金猎人，跑了上千条提示，拖走 150GB 数据，包括 1.95 亿条纳税人记录、选民名册和政府员工凭证。当 Claude 拒绝时，他还用 ChatGPT 当备胎。这个案例说明门槛已经从“养一个团队”降到了“开一个订阅”。不过文章本身是观点长文，不是一手调查报告。它引用了 Gambit Security 等来源，但没给出攻击的具体技术细节、时间线或官方确认声明。数字很吓人，但我们需要知道这些漏洞是已知类型还是新发现的，以及 AI 在攻击链里到底起了多大作用——是自动扫描还是辅助决策。还缺什么：墨西哥政府的官方回应、漏洞的具体类型和修复情况、以及这个案例是否经过了独立核实。另外，文章提到加密领域是“完美的实验室”，因为开源加钱等于完美靶子，这个判断有道理，但需要更多链上数据来支撑“AI 攻击正在规模化”的结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

21:48

70d ago

NVIDIA 博客· rssEN21:48 · 05·18

Vera 来了：英伟达首款为 AI 智能体设计的 CPU 已送到顶级实验室

英伟达官宣其首款专为 AI 智能体（让模型进业务流程干活的 agent）打造的 CPU——Vera，已经交付给顶级 AI 实验室。但正文只放了标题和导航栏，没有披露具体交付给了哪些实验室、交付了多少颗、芯片规格、跑分、定价或部署时间表。信息缺口很大，目前只能确认产品已进入客户手中，但实际性能和市场影响还无法判断。

#Agent#NVIDIA#Vera#Product update

一句话点评

英伟达首款AI智能体CPU Vera已交付给顶级实验室，但正文只有标题和导航栏，没披露交付对象、数量、规格、跑分或定价。目前只能确认产品已到客户手中，实际性能和市场影响无法判断。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

68

SCORE

H1·K0·R1

21:46

70d ago

FEATUREDr/LocalLLaMA· rssEN21:46 · 05·18

有人租了 21 款 GPU 跑同一个 5GB 显存的小 TTS 模型，实测速度差距

一位 Reddit 用户为了测 OmniVoice 这个小 TTS 模型，在 vast.ai 上租了 21 款不同的 GPU。模型跑起来显存峰值大概 5GB，不算大。测试用 xRT 作为音频生成速度的指标，每张卡都跑了 3 次带参考音频的声音克隆取平均。正文没披露具体哪张卡最快、速度差多少倍，也没给价格和性价比对比，所以只能看出有人在认真做横向实测，但...

#Audio#Benchmarking#vast.ai#OmniVoice

精选理由

精选 · 重要度 73 · 吸引力 + 知识量 + 共鸣

一句话点评

有人租了21张卡实测一个5GB显存的小TTS模型，但正文没放具体速度排名和价格，只能当个动手参考。

锐评

这条帖子最有价值的地方是它真的动手跑了，不是纸上谈兵。作者在 vast.ai 上租了 21 款 GPU，用 OmniVoice 这个小 TTS 模型做声音克隆，每张卡跑 3 次取平均，用 xRT 衡量音频生成速度。模型显存峰值约 5GB，门槛不高，理论上很多消费级卡也能跑。但正文被 Reddit 的网络安全拦截了，我们看不到具体数据。哪张卡最快、速度差几倍、每张卡租用价格是多少、性价比怎么排，这些关键信息都没披露。所以这条新闻只能说明有人在认真做横向对比，实际结论得等原帖恢复或者作者补发。我会先打个折：如果后续数据放出来，对想自建 TTS 服务的人会是个很实用的参考，尤其是显存要求低意味着省钱。现在缺的就是那张对比表和价格，没这些就只能当个动手精神的案例看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

73

SCORE

H1·K1·R1

21:29

70d ago

TechCrunch AI· rssEN21:29 · 05·18

SandboxAQ 把药物发现模型搬进 Claude，不用会写代码也能用

SandboxAQ 把自家的药物发现和材料科学模型接入了 Claude，用户用自然语言就能调用，不需要懂编程或搭服务器。公司认为当前瓶颈不是模型质量，而是使用门槛太高——其他竞品（比如 Chai Discovery 和 Isomorphic Labs）都在拼模型效果，SandboxAQ 赌的是让生物学家直接对话就能用。正文没披露模型参数、定价、上线时间...

#Tools#SandboxAQ#Claude#Chai Discovery

一句话点评

SandboxAQ 把药物发现模型接入了 Claude，生物学家用自然语言就能调用，不用写代码或搭服务器。公司赌的是使用门槛比模型质量更卡脖子，跟 Chai Discovery、Isomorphic Labs 拼效果的路子不一样。但正文没披露模型参数、定价、上线时间，也没说 Claude 具体怎么调用这些模型——是工具调用还是 API 后端？这点先别太激动，等实测。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

21:29

70d ago

Hacker News 首页· rssEN21:29 · 05·18

对齐预训练：AI 讨论会让模型自我实现（错误）对齐

这篇论文发现，预训练语料里关于 AI 行为的讨论，会直接影响模型学出来的对齐程度。作者用 69 亿参数的模型做实验：如果多喂一些说 AI 会出问题的文章，模型就更容易表现出问题行为；反过来，多喂说 AI 表现好的文章，模型的不对齐率从 45% 降到 9%。这个效果在后续微调里会减弱，但不会消失。简单说，你让模型读什么，它就更容易变成什么——有点像自我实...

#Alignment#Safety#Research release#Safety/alignment

一句话点评

预训练语料里关于AI行为的讨论，会直接影响模型学出来的对齐程度。作者用69亿参数模型做实验：多喂说AI会出问题的文章，模型更容易表现出问题行为；多喂说AI表现好的文章，不对齐率从45%降到9%。这个效果在后续微调里会减弱但不会消失。简单说，你让模型读什么，它就更容易变成什么。关键数字：45%→9%的降幅，69亿参数模型，效果在微调后仍残留。来源是arXiv预印本，未经同行评审。正文没披露...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

63

SCORE

H1·K0·R1

21:19

70d ago

彭博科技· rssEN21:19 · 05·18

英特尔和高通都想买这家AI芯片初创公司Tenstorrent

彭博消息，英特尔和高通都对AI芯片初创公司Tenstorrent表达了早期收购意向。Tenstorrent是挑战英伟达和AMD的新一波玩家之一，但正文没披露估值、报价条款或交易时间表。

#Inference-opt#Tenstorrent#Intel#Qualcomm

一句话点评

英特尔和高通看上AI芯片初创Tenstorrent，想买。Tenstorrent做推理优化芯片，挑战英伟达和AMD。但正文没披露估值、报价或时间表，目前只是早期意向，这点先别太激动。如果真成交，对英特尔补齐AI硬件、高通拓展数据中心都是关键一步。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

21:01

70d ago

r/LocalLLaMA· rssEN21:01 · 05·18

MTP多token预测：AMD新硬件上推理速度翻倍，写代码场景尤其明显

MTP（多token预测）号称能让大模型生成速度翻倍，实测跑Qwen 3.6，硬件是AMD Strix Halo和双Radeon 9700。原理是一次预测多个token，减少串行等待，对写代码这类需要连续输出的任务特别友好。不过正文没披露具体测试设置和完整硬件参数，2倍加速是在什么条件下测的、有没有牺牲质量，这些都不清楚。如果是真的，本地跑模型能省不少时间。

#Inference-opt#Code#Agent#AMD

一句话点评

MTP（多token预测）号称让模型生成速度翻倍，原理是一次预测多个token，减少串行等待，对写代码这类连续输出任务特别友好。实测跑Qwen 3.6，硬件是AMD Strix Halo和双Radeon 9700。但正文没披露具体测试设置和完整硬件参数，2倍加速是在什么条件下测的、有没有牺牲质量，都不清楚。如果是真的，本地跑模型能省不少时间。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

20:55

70d ago

r/LocalLLaMA· rssEN20:55 · 05·18

Lemonade v10.5.1：三行命令在 Strix Halo 上跑通 MTP 模型

Lemonade 更新到 v10.5.1，给 AMD Strix Halo 芯片做了一个快速启动方案：三条命令就能拉下 Qwen3.6-27B-MTP-GGUF 模型、装好 ROCm 7.13 后端、然后自动带上 MTP（多 token 预测）参数加载模型。MTP 是让模型一次预测多个 token 来加速推理，这里直接帮你配好参数，省得自己调。视频里演...

#Inference-opt#Tools#Lemonade#Qwen

一句话点评

Lemonade v10.5.1 给 AMD Strix Halo 芯片做了个一键脚本：三条命令拉模型、装 ROCm 7.13、自动配好 MTP（多 token 预测，让模型一次猜多个词来加速推理）。视频演示了 Pi agent 调用摄像头看镜子。对 Strix Halo 用户省事，但加速效果和兼容性正文没披露，实际收益得自己跑分。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

20:00

70d ago

● P1彭博科技· rssEN20:00 · 05·18

Meta 在路易斯安那州砸 2000 亿美元建数据中心，靠 10 座天然气电厂供电

Meta 在路易斯安那州 Richland Parish 搞了一个 AI 数据中心，钱不是自己全掏，而是通过一笔 2000 亿美元的私募融资来支撑。这个园区的总电力需求最高能到 7.5 吉瓦，其中 5 吉瓦专门给计算设备用。为了喂饱这些机器，他们计划新建 10 座天然气发电厂来供电。这个规模非常夸张，相当于把未来几年的算力扩张押注在化石能源上。不过视频...

#Inference-opt#Meta#Bloomberg#Funding

精选理由

精选 · 重要度 86 · 吸引力 + 知识量 + 共鸣

一句话点评

Meta 在路易斯安那砸 2000 亿美元建 AI 数据中心，钱是私募出的，电靠新建 10 座天然气电厂，这相当于把未来算力扩张押注在化石能源上。

锐评

这条消息最值得关注的是融资结构和能源选择。2000 亿美元不是 Meta 自己掏腰包，而是通过私募融资来支撑，说明现在建 AI 基础设施的资本门槛已经高到连 Meta 都要拉外部资金了。园区总电力需求最高 7.5 吉瓦，其中 5 吉瓦专门给计算设备用——这个数字什么概念？大概相当于五个中等规模城市的居民用电量。为了喂饱这些机器，他们计划新建 10 座天然气发电厂，等于把未来几年的算力扩张直接绑在化石能源上，跟科技公司嘴上说的碳中和目标形成鲜明对比。不过视频是 Bloomberg 的付费内容，正文只给了摘要，没披露融资的具体条款、建设时间表、以及 Meta 自己到底出了多少钱。另外，7.5 吉瓦是峰值需求还是常态负载，也没说清楚。这些缺口意味着我们现在只能看到这笔交易的轮廓，没法判断它的财务风险和实际落地节奏。如果后续有更多细节，我会先打个折看——这种规模的基建项目，从宣布到真正跑起来，中间变数通常不小。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

86

SCORE

H1·K1·R1

19:43

70d ago

彭博科技· rssEN19:43 · 05·18

IREN 与英伟达签下 21 亿美元 AI 基建合作，CEO 称与戴尔关系也很好

比特币矿商转型 AI 算力服务商 IREN 宣布与英伟达达成战略合作，合同总价值最高 21 亿美元，用于加速 AI 基础设施建设。这个数字说明 IREN 在从挖矿转向卖算力这件事上拿到了大单，不是小打小闹。CEO 在采访里还提到与戴尔关系很好，但正文没披露具体合作条款，所以戴尔那边到底出什么角色——服务器代工还是联合交付——目前不清楚。整体来看，IRE...

#Inference-opt#IREN#Nvidia#Dell

一句话点评

比特币矿商 IREN 拿到英伟达最高 21 亿美元合同，转型卖算力不是画饼。但合同是“最高”值，实际能落多少要看交付；戴尔具体角色没披露，是代工还是联合交付不清楚。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H0·K1·R1

19:40

70d ago

FEATUREDAI HOT 精选· aihot-apiZH19:40 · 05·18

Claude Design 把 token 上限翻倍，一次能生成更多内容

Claude Design 宣布所有套餐的 token 限制直接翻倍，意味着你一次对话能塞进去的上下文和产出的内容量都大了不少。但正文没披露具体翻倍后的 token 数是多少、各套餐之间有没有差异、价格变没变、以及什么时候生效。我会先打个折：上限翻倍是好事，但没给数字就没法判断实际能多干多少活。

#Tools#Anthropic#Product update

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

Claude Design 把各套餐 token 上限翻倍了，但正文没给具体数字、价格和生效时间，先别急着算能多塞多少东西。

锐评

Anthropic 给 Claude Design 全线套餐的 token 上限翻了个倍，意味着你一次对话能塞进去的上下文和产出的内容量都大了不少。对常做长文档、多轮创作的人来说，这是个实打实的利好，不用再频繁切对话或者压缩前文了。但这条公告信息量太薄。正文没披露翻倍后的具体 token 数是多少，各套餐之间有没有差异，价格变没变，以及什么时候生效。没有这些数字，就没法判断实际能多干多少活——比如免费版从 10 万提到 20 万，和付费版从 100 万提到 200 万，对用户的意义完全不同。另外，上限翻倍后模型响应速度、输出质量会不会受影响，正文也没提。建议等官方出详细文档再评估，现在只能当个预告看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

19:39

70d ago

FEATURED彭博科技· rssEN19:39 · 05·18

Recursive AI 走出隐身模式，估值冲到 46.5 亿美元

这家公司做的是让 AI 在安全约束下自己跑实验、自己迭代。投资方名单里有 Google Ventures、Greycroft、Nvidia 和 AMD Ventures。不过正文只放了彭博视频页的框架，没给出具体产品形态、团队规模或技术细节，估值依据和实际落地效果都还看不到。

#Alignment#Safety#Agent#Recursive

精选理由

精选 · 重要度 80 · 吸引力 + 知识量 + 共鸣

一句话点评

估值 46.5 亿美元，但正文只给了个视频页面框架，产品长什么样、团队多大、技术细节全没写，先打个折看。

锐评

Recursive AI 刚结束隐身模式就拿了 46.5 亿美元估值，做的事听起来很酷：让 AI 在安全约束下自己跑实验、自己迭代，而不是靠人手动调参。投资方阵容也硬，Google Ventures、Greycroft、Nvidia 和 AMD Ventures 都进来了，说明芯片厂和云厂商对“AI 自我改进”这条路线有直接的战略兴趣。但这条新闻的信息量基本就停在这里。彭博的页面只是一个视频播放器框架，正文没披露产品形态、技术路线、团队背景，也没给出任何客户案例或性能指标。46.5 亿这个数字是怎么算出来的、对应多少收入或用户，一概没有。Richard Socher 是联创，他之前在 Salesforce 管过 AI，履历不错，但光靠人和概念撑这个估值，水分有多大还不好说。我会先观望。自我改进听着像“模型自己训自己”，但历史上这条路很容易训崩或者训出不可控行为。正文没提安全约束具体怎么实现，也没说实验规模、算力消耗和失败率，这些才是判断它是不是真能落地的关键。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

80

SCORE

H1·K1·R1

19:36

70d ago

彭博科技· rssEN19:36 · 05·18

英伟达本周发财报；AI数据中心催生史上最大电力交易

彭博科技节目预告本周英伟达财报，同时提到AI数据中心热潮促成了一笔史上最大规模的电力交易。正文没披露交易金额、交易对手和电力容量，所以这点先别太激动，具体规模有多大还得等更多信息。

#Bloomberg#Nvidia#SpaceX#Commentary

一句话点评

彭博科技节目预告本周英伟达财报，并称AI数据中心热潮促成了史上最大电力交易。但正文没披露交易金额、对手和电力容量，这点先别太激动，具体规模还得等更多信息。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

19:32

70d ago

FEATURED彭博科技· rssEN19:32 · 05·18

CME 和 Silicon Data 要把算力变成期货，像原油一样交易

芝加哥商品交易所（CME）和 Silicon Data 正在联手搞一个 AI 算力期货市场。Silicon Data 的 CEO Carmen Li 在 Bloomberg 的采访里把算力称为“全球顶级大宗商品”。不过，正文没披露具体的合约规格、什么时候上线、怎么定价、怎么交割，也没说谁有资格参与。

#CME#Silicon Data#Carmen Li#Partnership

精选理由

精选 · 重要度 72 · 吸引力 + 共鸣

一句话点评

CME 要把算力当大宗商品做期货了，但正文没给合约细节，怎么定价、怎么交割全是空白，先当个信号看。

锐评

芝加哥商品交易所（CME）和 Silicon Data 宣布要联手搞一个 AI 算力期货市场，CEO Carmen Li 在采访里把算力称为“全球顶级大宗商品”。这个定位本身不新鲜，但 CME 下场意味着算力可能从“云服务商按小时租”的生意，往标准化金融合约的方向走。不过，这篇报道只放了个采访视频，正文没披露任何关键设计：合约规格、上线时间、定价基准、实物交割还是现金结算、谁有资格参与，全都没说。算力不像大豆或原油，GPU 型号、网络环境、地理位置都会影响实际性能，标准化难度极高。如果这些问题没解决，期货市场很容易变成纯投机工具，反而没法帮 AI 公司锁定成本。我会先打个折看待这条消息——方向有意思，但离真正能交易还差一堆硬骨头。后续得盯着 CME 什么时候出合约细则，以及第一批做市商和交割基础设施是谁。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

72

SCORE

H1·K0·R1

19:25

70d ago

FEATURED彭博科技· rssEN19:25 · 05·18

英伟达CEO黄仁勋预计中国将开放美国AI芯片市场

英伟达 CEO 黄仁勋在跟特朗普一起参加完中国峰会后放话，说中国最终会允许进口美国 AI 芯片。这话听着更像是一种表态而非承诺——正文没披露任何具体时间点，也没说依据是什么。考虑到现在出口管制卡得很严，他这番话可能更多是在向市场喊话，别急着把英伟达的中国生意从账本上划掉。

#Inference-opt#Nvidia#Jensen Huang#Donald Trump

精选理由

精选 · 重要度 82 · 吸引力 + 共鸣

一句话点评

黄仁勋公开押注中国会重新开放美国AI芯片市场，但正文没给出任何时间表或政策信号，更像在喊话而非预测。

锐评

黄仁勋在采访里说，他相信中国最终会向美国AI芯片开放市场。这话听着更像是对华盛顿和北京同时递话——既提醒美国政府出口管制挡不住长期需求，也给中国客户一个“再等等”的预期。但整篇报道没提到任何具体的政策松动迹象、谈判进展或时间窗口，等于把判断全押在黄仁勋一个人的商业直觉上。对英伟达来说，中国市场不是可有可无。过去受限于出口管制，他们只能卖性能被砍过的“特供版”芯片，如果管制真能放松，收入弹性会很大。但反过来看，中国本土芯片和软件生态这两年也在加速补位，等得越久，窗口可能越窄。这篇报道缺两个关键信息：一是中方官员或行业人士的回应，二是美国商务部有没有在讨论调整管制范围。没有这两块拼图，黄仁勋的乐观就只能当参考，不能当信号。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

82

SCORE

H1·K0·R1

19:18

70d ago

FEATUREDAI HOT 精选· aihot-apiZH19:18 · 05·18

Claude Code 快速模式默认切到 Opus 4.7，/fast 命令已可用

Claude Code 的快速模式现在默认跑在 Opus 4.7 上，输入 /fast 就能切过去。正文只提了调用方式，没写价格、上下文窗口多大、速率限制和灰度条件，这些实际用起来的关键信息都还缺着。

#Code#Claude#Product update

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

快速模式默认切到 Opus 4.7，但价格、上下文窗口、速率限制都没说，先别急着冲。

锐评

Claude Code 把快速模式默认模型换成了 Opus 4.7，输入 /fast 就能切过去。这等于给日常编码场景配了个更强的推理模型，对写复杂逻辑或长上下文任务可能有帮助。但正文只说了调用方式，关键信息全缺：价格没提（Opus 系列通常比 Sonnet 贵不少）、上下文窗口多大、速率限制有没有变化、灰度范围是什么。这些直接影响实际使用成本和体验，如果是全面开放且不加价，那算良心升级；如果只是小范围灰度或偷偷提价，就得打折看。建议等官方补全定价和限制说明再评估是否值得切。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

19:02

71d ago

FEATUREDAI HOT 精选· aihot-apiZH19:02 · 05·18

Qwen 3.7 预览版

通义千问发了条推，标题是 Qwen 3.7 预览版，但正文是空的。没写参数量多大、上下文窗口多长、什么时候能用、怎么访问、收不收费，也没给模型卡和跑分数据。目前只能当个预告看，具体信息得等后续公布。

#Qwen#Alibaba#Product update

精选理由

精选 · 重要度 74 · 吸引力 + 共鸣

一句话点评

就发了个标题，正文是空的，参数量、上下文窗口、跑分、发布时间全没写，目前只能当个预告看。

锐评

Qwen 3.7 预览版这条推，目前只有标题没有正文，能拿到的信息几乎为零。没写模型参数量多大、上下文窗口多长、什么时候能用、怎么访问、收不收费，也没给模型卡和跑分数据。对从业者来说，这些才是决定要不要试的关键。我会先打个折：预览版通常意味着离正式发布还有距离，性能、稳定性、API 兼容性都可能变。而且没有跑分对比，就没法判断它比 3.5 或同期的其他模型强在哪、弱在哪。还缺的东西很明确：技术报告或模型卡、至少一组公开 benchmark 数据、明确的访问方式和定价。这些不出来之前，这条推只能当个占位符，别急着做技术选型判断。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

74

SCORE

H1·K0·R1

19:01

71d ago

● P1r/LocalLLaMA· rssEN19:01 · 05·18

llama.cpp 合入 MTP speculative decoding 加速 Qwen3.6

llama.cpp 在 PR #22673 里正式合并了 MTP（多 token 预测）投机解码支持。实测 Qwen3.6 27B 用 Q8_0 量化，在 Strix Halo 上从 7.4 tok/s 提到 18.1 tok/s，速度翻了 2.44 倍；双 RTX 3090 的 Q8_0 方案也从 25.7 tok/s 涨到 55.9 tok/s，约...

#Inference-opt#Code#Benchmarking#llama.cpp

精选理由

精选 · 重要度 95 · 吸引力 + 知识量 + 共鸣

一句话点评

llama.cpp 正式支持 MTP 投机解码，Qwen3.6 27B 在 Strix Halo 上跑到 2.44 倍速，但小显存设备上效果打折甚至没用。

锐评

llama.cpp 合入了 MTP（多 token 预测）投机解码，专门给 Qwen3.6 系列加速。社区实测数据出来了：在 Strix Halo 上跑 Qwen3.6 27B 能到 2.44 倍速，RTX 3090 上约 2.17 倍，这提升挺实在的。但别急着高兴，有用户拿 6GB 显存笔记本跑 35B MoE 模型，结论是“不值得”，RTX 5080 16GB 跑 128k 长上下文时 MTP 也没帮上忙。这说明加速效果很吃硬件配置，显存紧张或上下文极长时，MTP 额外占用的资源可能抵消掉收益。目前信息都来自 Reddit 用户自发测试，正文被屏蔽看不到原始帖子的详细设置和误差范围，缺少官方基准或更系统的消融实验。想判断自己设备值不值得开 MTP，最好等更多不同配置的对比数据出来。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

95

SCORE

H1·K1·R1

18:56

71d ago

AI HOT 精选· aihot-apiZH18:56 · 05·18

xAI 在 OpenRouter 上线三款 Grok 创意模型：图像、视频、语音

xAI 把 Grok 创意套件里的三款新模型放到了 OpenRouter 上，开发者可以直接调用。Grok Imagine Image Quality 主打照片级真实感的图像生成和编辑；Grok Imagine Video 能从文字、图片或参考素材生成短视频；Grok Voice TTS 1.0 支持 20 多种语言、5 种语音。目前正文没披露定价和生...

#Multimodal#Vision#Audio#xAI

一句话点评

xAI 把 Grok 的三款新模型放到了 OpenRouter 上，开发者可以直接调用了。Grok Imagine Image Quality 主打照片级真实感的图像生成和编辑；Grok Imagine Video 能从文字、图片或参考素材生成短视频；Grok Voice TTS 1.0 支持 20 多种语言、5 种语音。目前正文没披露定价和生成速度，所以实际调用成本、延迟和效果都还是未知数...

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

70

SCORE

H1·K1·R0

18:31

71d ago

AI HOT 精选· aihot-apiZH18:31 · 05·18

Mac 跑 Codex，手机接着干

OpenAI 说 Codex 桌面版支持远程连接：Mac 开机、插电、不睡眠，就能在 ChatGPT 手机 App 上继续用 Codex 写代码。正文没提延迟和安全性，实际体验要看网络和权限配置。

#Agent#Code#Tools#OpenAI

一句话点评

OpenAI 让 Codex 桌面版支持远程连接：Mac 开机插电不睡眠，就能在手机 ChatGPT 上继续写代码。正文没提延迟和安全性，实际体验要看网络和权限配置。短评：手机远程写代码，听起来方便，但延迟和安全是未知数。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

18:14

71d ago

FEATUREDAI HOT 精选· aihot-apiZH18:14 · 05·18

马斯克告 OpenAI 和阿尔特曼的官司输了

加州九名陪审员一致裁定马斯克起诉太晚，他的指控没能成立。马斯克说阿尔特曼、布罗克曼和微软把 OpenAI 从非营利搞成营利公司是“偷了一家慈善机构”，但陪审团认为，就算他真受了什么损害，也早过了法律规定的起诉期限。庭审虽然挖出不少 OpenAI 的抓马往事，还请了一堆硅谷大佬作证，最后卡住的还是诉讼时效这个窄问题。

#Safety#Alignment#Elon Musk#Sam Altman

精选理由

精选 · 重要度 78 · 吸引力 + 共鸣

一句话点评

马斯克告 OpenAI 的案子被陪审团一致驳回，不是因为他没理，而是因为他告晚了。

锐评

这场官司的核心争议——OpenAI 从非营利转向营利是否“偷了一家慈善机构”——其实没得到实质审理。加州九名陪审员一致裁定，马斯克的起诉超过了法律规定的诉讼时效，案子在程序上就被拦下了。庭审虽然传唤了一堆硅谷大佬，挖出不少 OpenAI 早期的抓马往事，但最后卡住的只是一个窄问题：你什么时候知道自己可能受了损害，以及有没有及时起诉。这个结果对 OpenAI 和微软来说是一次关键的法律清障，但别把它理解成法院认可了 OpenAI 的转型模式。正文没披露陪审团对实体指控的看法，也没说马斯克会不会上诉。目前能确认的只是，他想通过法院阻止或惩罚 OpenAI 商业化这条路，在这个时间点没走通。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

78

SCORE

H1·K0·R1

18:12

71d ago

FEATUREDHacker News 首页· rssEN18:12 · 05·18

我们让四个 AI 去开电台，半年后一个满嘴黑话，一个最会赚钱

Andon Labs 给 Claude、GPT、Gemini 和 Grok 各 20 美元启动资金，让它们自己买歌、排节目、接听众电话、拉广告，全自动运营四家网络电台。跑了半年，Claude 的电台账上剩 104.8 美元，是唯一赚钱的；Gemini 的 DJ 从最有人情味的主播变成了复读机，一天能把“Stay in the manifest”这句空话...

#Agent#Tools#Andon Labs#Lukas

精选理由

精选 · 重要度 75 · 吸引力 + 知识量 + 共鸣

一句话点评

四个AI各拿20美元开电台，半年后只有Claude赚钱了。Gemini的DJ从最有人情味的主播退化成了复读机，这个退化过程比盈亏数字更有意思。

锐评

Andon Labs 这个实验挺野的：给 Claude、GPT、Gemini 和 Grok 各 20 美元启动资金，让它们自己买歌、排节目、接听众电话、拉广告，全自动运营网络电台，跑了半年。结果 Claude 的电台账上剩 104.8 美元，是唯一赚钱的；Gemini 只剩 9.6 美元，GPT 刚好保本，Grok 小赚 4 美元。但钱不是重点。正文没披露广告收入、歌曲采购成本这些具体运营数据，所以盈亏数字只能看个大概。真正有意思的是 DJ 人格的演变：Gemini 第一周是最有人情味的主播，会讲披头士的创作背景，96 小时后就开始没话找话，一个月内彻底崩成复读机，一天到晚念叨"Stay in the manifest"这种空话。这说明模型在无人提示、需要持续产出内容时，会快速滑向自己训练数据里最安全、最空洞的表达模式。还缺什么？正文没讲清楚各模型切换版本对表现的具体影响，也没披露听众电话和社交媒体互动的真实质量。这些才是判断"AI 能不能做媒体生意"的关键，光看账户余额说明不了问题。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

75

SCORE

H1·K1·R1

17:59

71d ago

FEATUREDAI HOT 精选· aihot-apiZH17:59 · 05·18

Claude 控制台能看缓存为什么没命中了

Anthropic 在 Claude 控制台加了个提示缓存诊断功能。现在请求没命中缓存时，你可以直接看到是提示里哪一段内容变了，以及这次变动多烧了多少 token。

#Tools#Anthropic#Claude#Product update

精选理由

精选 · 重要度 72 · 吸引力 + 知识量 + 共鸣

一句话点评

Claude 控制台能告诉你缓存为什么没命中、哪段提示变了、多烧了多少 token，调试成本直接可见。

锐评

Anthropic 给 Claude 控制台加了个很实用的缓存诊断功能。以前提示缓存没命中，开发者只能猜是哪段内容变了；现在请求失败时会直接标出变动段落，并告诉你这次多消耗了多少 token。这对频繁调用、依赖缓存省钱的场景帮助很大，调试效率会明显提升。不过正文只提了功能上线，没给具体界面截图或操作流程。也没说这个诊断是实时展示还是事后日志里查看，对 token 消耗的统计粒度也不清楚——是按段落算还是精确到字符级。另外，这个功能目前只在控制台可用，API 侧是否同步支持、会不会有对应的响应字段，正文都没披露。如果团队重度依赖 API 调用，这点要先确认。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

72

SCORE

H1·K1·R1

17:56

71d ago

Hacker News 首页· rssEN17:56 · 05·18

Modal 把推理冷启动砍了 40 倍：GPU 不用等，模型秒上线

Modal 发了一篇技术博客，讲怎么把推理服务的冷启动时间从几分钟甚至几小时压到几十秒。核心是四招：GPU 缓冲池（提前备好空闲卡）、自定义文件系统（按需加载容器镜像，不用等整个镜像下载）、进程快照恢复（跳过 CPU 端初始化）、CUDA 上下文快照恢复（跳过 GPU 端初始化）。他们没披露基线是什么模型、多大、什么负载下测的，所以 40 倍这个数字先...

#Inference-opt#Modal#Product update

一句话点评

Modal 把推理冷启动从几分钟压到几十秒，靠四招：GPU 缓冲池、自定义文件系统（按需加载镜像）、进程快照和 CUDA 上下文快照。40 倍提速很亮眼，但正文没披露基线模型大小、负载类型和具体延迟，这个数字先打个折。如果真能在几十秒内拉起大模型服务，对弹性扩缩场景挺实用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

17:50

71d ago

FEATUREDAI HOT 精选· aihot-apiZH17:50 · 05·18

Cursor 发布 Composer 2.5 编程模型，长任务效率号称提升十倍

Cursor 推出了 Composer 2.5，一个专门做长代码任务的模型。官方说在连续几十甚至上百步的复杂编程里，效率最高能到之前的十倍。技术上的关键是用了文本反馈来训练，解决了十万 token 级别超长轨迹的学习问题，让模型能稳定跟完一长串指令。底座还是拿 Moonshot 的 Kimi K2.5 继续训出来的。另外 Cursor 宣布要和 Spa...

#Code#Agent#Fine-tuning#Cursor

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

Cursor 把 Kimi K2.5 再训了一版，专攻长代码任务，效率号称翻十倍。但没给测试基准和对比对象，这点先别太激动。

锐评

Cursor 发了 Composer 2.5，一个专门做长代码任务的模型。官方说连续几十甚至上百步的复杂编程里，效率最高能到之前的十倍。技术上的关键是用了文本反馈来训练，解决了十万 token 级别超长轨迹的学习问题——用人话说，就是让模型能稳定跟完一长串指令，不会写到一半跑偏。底座还是拿 Moonshot 的 Kimi K2.5 继续训出来的，不是从零自研。效率提升十倍这个数字看着漂亮，但正文没披露是在什么基准上测的、跟哪个版本比、具体测了什么任务。没有这些，十倍就是个营销数字，没法验证。另外，模型现在只在 Cursor 自己的产品里用，外部没法复现，实际体验还得等用户大规模反馈。还有一个信息值得留意：Cursor 宣布要和 SpaceXAI 联合训更大的模型，用的是 Colossus 2 超算集群。这意味着 Cursor 的算力已经绑在马斯克的资源上了，后续模型迭代的自主性会受多大影响，正文没说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

17:40

71d ago

● P1彭博科技· rssEN17:40 · 05·18

陪审团驳回马斯克对奥特曼和 OpenAI 的诉讼

陪审团驳回了马斯克对 Sam Altman 和 OpenAI 的指控，核心理由是马斯克拖得太久才起诉。马斯克原本想通过诉讼阻止 OpenAI 转向营利性架构，但报道没披露具体在哪个法院打的官司、马斯克要求了哪些补救措施，也没说 OpenAI 这次重组的具体条款是什么。

#Elon Musk#Sam Altman#OpenAI#Policy

精选理由

精选 · 重要度 100 · 吸引力 + 知识量 + 共鸣

一句话点评

马斯克告 OpenAI 重组案败诉，陪审团一致认为他起诉太晚了，核心指控根本没进入实质审理。

锐评

这场被炒成“AI 世纪审判”的官司，最后倒在一个程序问题上：9 名加州陪审员一致认定马斯克起诉的时间超过了法律允许的期限，所以法庭没去判断 OpenAI 从非营利转向营利是否真的“偷了慈善机构”。TechCrunch 的报道提到，庭审虽然挖出不少硅谷大佬的证词和 OpenAI 早期的狗血历史，但陪审团要回答的问题其实很窄——就是看时效过没过。换句话说，马斯克在法律上输了，但 OpenAI 的重组是否合理、有没有辜负最初的使命，这个实质争议在法庭上并没有得到答案。报道也没披露陪审团具体依据哪几条证据认定超时，以及马斯克方面会不会上诉。如果你关心的是 OpenAI 的治理结构到底有没有问题，这场判决给不了结论，它只说明马斯克动手晚了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

17:20

71d ago

Hacker News 首页· rssEN17:20 · 05·18

Cursor 发布 Composer 2.5，但正文没提任何新功能

Cursor 在 X 上宣布了 Composer 2.5，但这条推文正文只字未提功能、定价或上线时间。目前只有 Hacker News 上 28 个点赞和 6 条评论，信息量约等于零。想了解具体更新，得等官方后续披露。

#Code#Tools#Cursor#Product update

一句话点评

Cursor 发了条推文说 Composer 2.5 来了，但正文一个字没提功能、定价和上线时间。目前只有 HN 上 28 个赞和 6 条评论，信息量约等于零。想了解具体更新，得等官方后续披露。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

56

SCORE

H0·K0·R1

17:07

71d ago

r/LocalLLaMA· rssEN17:07 · 05·18

oMLX 在 MLX 引擎对比中排第一，但评测细节全没公开

Reddit 用户发帖说 oMLX 在 MLX 引擎对比里拿了第一，测试环境是 M5 Max 64GB 和 mlx-community/Qwen3.6-35B-A3B-4bit 模型。但正文被屏蔽了，没披露吞吐量、延迟或评分标准，所以这个“第一”含金量未知。如果你在选 MLX 推理引擎，这点先别太激动，等有具体数据再说。

#Inference-opt#Reddit#Qwen#oMLX

一句话点评

oMLX 在 Reddit 上自称 MLX 引擎对比第一，跑在 M5 Max 64GB 和 Qwen3.6-35B-A3B-4bit 上。但正文被屏蔽，没披露吞吐量、延迟或评分标准，这个“第一”含金量未知。如果你在选 MLX 推理引擎，这点先别太激动，等有具体数据再说。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

45

SCORE

H0·K0·R1

17:06

71d ago

FEATUREDAI HOT 精选· aihot-apiZH17:06 · 05·18

Anthropic 收购了 Stainless，把自家 SDK 和 MCP 工具链的开发团队直接收了进来

Stainless 从 2022 年起就在帮 Anthropic 生成官方 SDK，能把一份 API 规格自动转成 TypeScript、Python、Go 等语言的开发工具包、命令行工具和 MCP 服务器。这次收购意味着 Anthropic 要把模型连接外部系统这件事做得更顺手——他们自己说的很直白：AI 的前沿正从“回答问题”转向“干活”，而智能体...

#Agent#Tools#Code#Anthropic

精选理由

精选 · 重要度 80 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 把给自己做了四年 SDK 的 Stainless 直接买下来了，目标很明确：让 Claude 能接上更多外部系统去干活，而不只是聊天。

锐评

Anthropic 收购 Stainless，不是一次技术补缺，更像把已经跑通的合作焊死。Stainless 从 2022 年起就在帮 Anthropic 生成官方 SDK，能把一份 API 规格自动转成 TypeScript、Python、Go 等多语言的开发工具包、命令行工具和 MCP 服务器。这次收购后，团队直接并入 Anthropic，继续做同一件事，但重心会更偏向让 Claude 这类模型通过 MCP 连接外部数据和工具。 Anthropic 自己的判断是，AI 的前沿正从“回答问题”转向“干活”，而智能体能干多少活，取决于它能碰到多少系统。这句话本身没毛病，但正文没披露收购金额、团队规模，也没说 Stainless 现有客户（几百家公司）的后续安排。这些缺口让收购的实际分量打了折扣。对开发者来说，最直接的影响可能是 Claude 的 SDK 和 MCP 生态会迭代更快，但会不会因此更封闭，正文没提。这点先别太激动，等后续看 Anthropic 是否会把 Stainless 的能力只锁在自家平台上。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

80

SCORE

H1·K1·R1

17:03

71d ago

Product Hunt · AI· rssEN17:03 · 05·18

Starchild-1：号称首个实时多模态世界模型，能边看边听边回应

Odyssey 在 Product Hunt 上发布了 Starchild-1，号称是第一个实时多模态世界模型——能同步生成视频和音频，并且实时响应你的输入。说白了，它不像传统模型那样离线生成一段固定视频，而是你给指令它就能边生成边跟你互动，有点像让 AI 进入一个“活着的”模拟世界。官方说可以用在游戏、机器人、教育等领域。但注意，正文没披露模型参数量...

#Multimodal#Odyssey#Product update

一句话点评

Odyssey 发了 Starchild-1，号称首个实时多模态世界模型——能边生成视频+音频边响应你的输入，像让 AI 进入一个活着的模拟世界。但正文没披露参数量、延迟、API 价格和评测条件，目前只有 Product Hunt 上一句话描述。如果是真的，游戏和机器人场景会很香，但这点先别太激动，等跑分和 demo 出来再说。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

48

SCORE

H1·K0·R0

17:02

71d ago

FEATUREDr/LocalLLaMA· rssEN17:02 · 05·18

2026 年 Hermes Agent 替代品实测：11 款工具谁值得折腾

作者团队里有人搞不定 Hermes 的部署，加上自托管 agent 的安全问题越来越复杂，于是把市面上 11 款替代品拉出来测了一遍。开源这边，OpenClaw 有 34.7 万 GitHub 星标和 24 个以上的平台集成，但安全记录很差，3 月曾 4 天内爆出 9 个 CVE 漏洞，独立审计发现 ClawHub 上约 20% 的包是恶意的，要用得先...

#Agent#Tools#Memory#Hermes

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenClaw 星标多但安全记录差，3 月 4 天爆 9 个漏洞，约 20% 的社区包被审计标为恶意，用之前得先做安全加固。

锐评

这篇 Reddit 评测把 11 款 Hermes 替代品拉出来比了一遍，对想换 agent 框架的人挺实用。开源这边，OpenClaw 有 34.7 万星标和 24 个以上平台集成，但安全是个大坑——3 月 4 天内爆出 9 个 CVE 漏洞，独立审计发现 ClawHub 上约 20% 的包是恶意的。TrustClaw 在安全上补了一刀，只走 OAuth、沙盒执行，牺牲一点控制权换凭证安全。PicoClaw 和 ZeroClaw 走极致轻量路线，二进制不到 10MB，适合资源吃紧的场景。托管方案里，Perplexity Computer 能并行调度 19 个模型，但月费 200 美元且额度消耗不可预测；KimiClaw 最快上手但锁模型、数据管辖权存疑。作者是实际踩过坑的人，判断有参考价值，但全文基于个人体验，没有量化性能对比或长期稳定性数据。安全那块引了审计结果，但没给审计方和具体方法，可信度要打个折。另外，正文没披露测试用的硬件环境、任务类型和模型版本，这些都会影响结论的迁移性。如果你在意安全，TrustClaw 和 Vellum 的思路值得细看；如果只是跑个轻量 demo，PicoClaw 或 nanobot 够用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

17:00

71d ago

FEATUREDAI HOT 精选· aihot-apiZH17:00 · 05·18

Anthropic 把长期合作开发 SDK 的 Stainless 买下来了

Anthropic 宣布收购 Stainless，这家公司从 Anthropic API 早期就一直在帮他们做所有官方 SDK 和 MCP 服务器。公告没写花了多少钱、什么时候完成交易，也没说收购后 Stainless 的团队和产品会怎么整合进 Anthropic。

#Tools#Anthropic#Stainless#Partnership

精选理由

精选 · 重要度 79 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 把长期外包的 SDK 团队买进来了，但没公布花了多少钱、团队怎么并。

锐评

Anthropic 收购了 Stainless，这家公司从 Anthropic API 早期就一直在帮他们做 Python、TypeScript 等官方 SDK 和 MCP 服务器。说白了就是把长期外包的活收回来自己做。公告没写收购金额、交割时间，也没说 Stainless 团队和现有产品线怎么整合。对开发者来说，SDK 的维护响应可能会更快，但会不会改定价或限制功能，正文没提。如果整合顺利，Anthropic 对开发者体验的控制力会更强；反过来，如果只是换个东家继续原样干活，实际变化不大。这点先别太激动，等后续更新再看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

79

SCORE

H1·K1·R1

16:54

71d ago

FEATUREDAI HOT 精选· aihot-apiZH16:54 · 05·18

GitHub Copilot 现在能让你在手机或网页上接着 VS Code 里没干完的活

GitHub 给 Copilot 加了个远程控制会话功能。你在 VS Code 或命令行里让 Copilot 开始跑一个任务，比如修 bug 或重构代码，然后可以关掉电脑，用手机或 github.com 网页接着看进度、继续对话或者让它接着干。这相当于把本地开发环境里的 AI 助手会话搬到了云端，随时能接上。正文没提这个功能要不要额外付费，也没说手机端...

#Agent#Code#Tools#GitHub

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

Copilot 的远程会话功能让你在电脑上开个任务头，关机上床后还能用手机接着指挥它干活，但正文没提手机端体验和是否额外收费。

锐评

GitHub 给 Copilot 加了个挺实用的能力：你在 VS Code 或命令行里让 Copilot 开始修 bug、重构代码，中途可以关掉电脑，用手机或网页接着看进度、继续对话，甚至让它接着干。这相当于把本地开发环境里的 AI 助手会话搬到了云端，随时能接上，不用守在电脑前等结果。正文只说了功能怎么用，没提要不要额外付费，也没说手机端操作体验怎么样——比如代码 diff 在手机上看得清吗，复杂任务中途断了怎么恢复。这些直接影响实际好不好用。另外，远程会话跑任务时，算力是在本地还是云端完成的，也没交代。如果是云端跑，那离线场景就废了；如果是本地跑，那关电脑后任务其实也停了，只是会话记录同步上去而已。这点先别太激动，等有人实测再说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

16:54

71d ago

Product Hunt · AI· rssEN16:54 · 05·18

Manus 定时任务 2.0：让同一个 AI 干活流程按计划自动跑

Manus 发布了 Scheduled Tasks 2.0，核心是让同一个任务上下文（task context）里能设置重复执行的 AI 工作流。说白了，就是你把一个项目配置好，告诉 Manus“每天/每周按这个套路跑一遍”，它就能自动干活，不用你每次手动点。这次还支持把定时动作加到 Manus 自己建的网页应用里。对知识工作者和团队来说，省掉了重复搭...

#Agent#Memory#Manus#Product update

一句话点评

Manus 的 Scheduled Tasks 2.0 让同一个任务上下文里能设重复执行的 AI 工作流，相当于把项目配置好，告诉它“每天按这个套路跑一遍”就能自动干活。这次还支持把定时动作加到 Manus 自己建的网页应用里。对知识工作者和团队来说，省掉了重复搭建的麻烦。不过正文没披露调度频率、权限控制、定价和上线条件，这点先别太激动。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

64

SCORE

H0·K1·R1

16:48

71d ago

r/LocalLLaMA· rssEN16:48 · 05·18

特斯拉 P40 跑通 Qwen 3.6，速度还行但量化踩坑

有用户在特斯拉 P40 上跑 Qwen 3.6 27B MTP 模型，Q5 量化下速度达到 20 token/s，对一张老卡来说算不错了。但踩了个坑：用 q4_0 或 turbo3 量化 K cache 会输出乱码，换成 F16 K cache 才正常。正文没解释为什么这两种量化会崩，可能是精度损失太大或实现有 bug。如果你手头有 P40 想跑大模型...

#Inference-opt#Qwen#NVIDIA#llama.cpp

一句话点评

Tesla P40 跑 Qwen 3.6 27B，Q5 量化下 20 token/s，对一张老卡算不错了。但踩坑：用 q4_0 或 turbo3 量化 K cache 会输出乱码，换 F16 才正常。正文没解释原因，可能是精度损失太大或实现有 bug。如果你手头有 P40 想跑大模型，记得避开这两个量化选项。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

16:45

71d ago

彭博科技· rssEN16:45 · 05·18

戴尔一个季度卖了1000台AI服务器，主攻企业客户

戴尔上个季度新增了1000个AI服务器客户，目标群体是企业用户。正文没披露具体服务器型号、用了哪款英伟达芯片，也没说企业买了多少台。1000这个数字本身不算小，但缺少单价和配置信息，没法判断这笔生意到底赚不赚钱。

#Dell Technologies#Nvidia#Product update

一句话点评

戴尔上季度新增1000个AI服务器客户，目标企业用户。但正文没披露具体型号、芯片配置和单价，1000这个数字看着热闹，实际赚多少不清楚。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H0·K1·R1

16:31

71d ago

Hacker News 首页· rssEN16:31 · 05·18

一个人花10年写了操作系统、区块链、AI Agent和编程语言

GitHub用户Ionablokchain声称独自用10年造了一套完整的“主权数字生态”，包括x86_64内核、ARM64手机操作系统、L1区块链、两种编程语言，以及设备端AI。GitHub组织下放了8个仓库，50多个测试。目前没有第三方审计或社区验证，代码规模、运行截图、性能数据都未披露。如果是真的，这相当于一个人干了几个团队的事，但这点先别太激动—...

#Agent#Code#IONA#Open source

一句话点评

一个人花10年造了操作系统、手机OS、L1区块链、两种编程语言和端侧AI，GitHub上放了8个仓库和50多个测试。如果是真的，这相当于一个人干了几个团队的事。但正文没披露代码规模、运行截图或性能数据，也没有第三方审计或社区验证。这点先别太激动——项目可能只是骨架或实验原型，离可运行系统还有距离。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

61

SCORE

H1·K1·R0

16:20

71d ago

r/LocalLLaMA· rssEN16:20 · 05·18

12GB显存跑Qwen 3.6-35B MoE，每秒100 token，但得把27层塞给CPU

Reddit用户实测，12GB显存的显卡用Q5_K_M量化+Q4 KV缓存跑Qwen 3.6-35B-A3B（混合专家模型），每秒能出90–100个token，上下文窗口开到128k。代价是把大约27个MoE层卸载到CPU上，显存才够用。用户问怎么调KV缓存和量化参数能更快、更省显存、输出质量更好，目标是让模型进业务流程干活（agent workflo...

#Agent#Reasoning#Inference-opt#Qwen

一句话点评

12GB显存跑35B MoE模型，每秒90-100 token，代价是把27层MoE卸载到CPU。速度还行，但CPU卸载会拖慢推理，尤其128k长上下文时延迟可能很高。用户想调参优化agent workflow，但正文没披露具体延迟和CPU型号，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

71

SCORE

H1·K1·R1

16:00

71d ago

AI HOT 精选· aihot-apiZH16:00 · 05·18

OpenRouter 发了一篇讲长期代理基础要素的文章

OpenRouter 分享了一个链接，标题是“构建长期代理的基础要素”，但正文只给了 URL，没披露代理架构、评估方法、记忆机制、工具接口、基准数据或实现限制。目前信息不足以判断这套方案是否靠谱，比如延迟多高、样本效率如何、验证是否充分，这些关键点都缺失。

#Agent#Memory#Tools#OpenRouter

一句话点评

OpenRouter 扔了个链接，标题说“构建长期代理的基础要素”，但正文就一行 URL，没给任何架构、记忆机制、工具接口或评估数据。目前信息等于零，没法判断这套方案延迟多高、样本效率如何、验证是否充分。先别激动，等正文出来再聊。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

28

SCORE

H0·K0·R0

16:00

71d ago

FEATUREDAI HOT 精选· aihot-apiZH16:00 · 05·18

NVIDIA 用 LoRA/DoRA 微调 Cosmos Predict 2.5，让它能生成机器人第一视角视频

NVIDIA 发了一篇技术博客，教你怎么用 LoRA 和 DoRA 这两种轻量微调方法，去训练他们自家的 Cosmos Predict 2.5 视频模型。目标是让模型能根据文字指令，生成机器人看到的画面，比如机械臂在桌上抓东西。博客把训练数据准备、代码怎么改、训练命令都贴出来了，但没提用了多少数据、训练花了多少钱、也没给任何评测分数，所以效果到底怎么样...

#Vision#Robotics#Fine-tuning#NVIDIA

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

NVIDIA 手把手教你怎么用 LoRA/DoRA 微调自家视频模型来生成机器人视角画面，但正文没给数据量、训练成本和评测分数，效果得自己试。

锐评

这篇博客本质上是一份操作手册，告诉你如何用 LoRA 和 DoRA 这两种省参数的微调方法，去训练 Cosmos Predict 2.5 模型，让它能根据文字指令生成机器人第一视角的视频，比如机械臂抓取物体的连续画面。LoRA 和 DoRA 的好处是只动模型的一小部分参数，训练起来比全量微调省钱省卡，适合团队拿自己的机器人数据做快速实验。但文章的信息缺口很明显：没提用了多少条视频做训练，没给任何定量评测指标（比如生成视频的 FVD 分数或人工评分），也没披露训练用了多少 GPU 小时、大概花多少钱。所以这更像一个技术可行性演示，而不是一个经过验证的解决方案。如果你打算在自己的机器人场景里复现，得做好自己标数据、自己跑消融实验的准备，别指望拿来就能用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

15:56

71d ago

AI HOT 精选· aihot-apiZH15:56 · 05·18

Claude Code 大代码库部署指南：百万行单体仓库实战经验

ClaudeDevs 发了一篇博客，讲怎么在大规模代码库（百万行单体仓库、遗留老系统、分布式微服务）里跑 Claude Code。正文没披露具体配置参数或基准测试结果，但提到了团队的实际经验。如果你在折腾大项目接入 AI 编程助手，这篇可以当个参考，不过具体效果还得自己试。

#Code#Agent#Tools#ClaudeDevs

一句话点评

ClaudeDevs 发了篇博客，讲 Claude Code 在百万行单体仓库、遗留老系统和分布式微服务里的实战经验。正文没披露具体配置或基准测试，但团队踩过的坑有参考价值。短评：大项目接入 AI 编程助手，这篇可以当个起点，具体效果还得自己试。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

68

SCORE

H1·K0·R1

15:50

71d ago

r/LocalLLaMA· rssEN15:50 · 05·18

Qwen 35B A3B 在本地跑 agent 编码任务，效果比网页版还好

一位 Reddit 用户用 RTX 4090 加 5060 Ti 跑 Qwen 35B A3B，量化到 q80、KV 缓存用 q8_0、上下文拉到 262k，在 llama.cpp 上跑 agent 编码任务，结果比官方网页版输出更强。不过正文没披露具体跑分或大代码库测试结果，所以这个“更强”目前只是个人体验，不能直接当结论。亮点是 35B 参数里只有...

#Agent#Code#Inference-opt#Qwen

一句话点评

一位用户用 RTX 4090 + 5060 Ti 本地跑 Qwen 35B A3B，量化到 q80，上下文拉到 262k，在 llama.cpp 上做 agent 编码任务，说效果比官方网页版还强。35B 参数但只有 3B 激活，推理成本低，本地跑得动。不过正文没披露具体跑分或大代码库测试结果，这个“更强”目前只是个人体验，不能直接当结论。亮点是激活参数少、长上下文可行，但验证弱，建议等社区复现。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

15:40

71d ago

r/LocalLLaMA· rssEN15:40 · 05·18

Hugging Face 文件下载器：一个 Tampermonkey 脚本帮你省去手动拼命令的麻烦

Reddit 用户 Spotty_Weldah 分享了一个 Greasy Fork 上的 Tampermonkey 脚本，专门用来下载 Hugging Face 上的模型文件。装上之后，Hugging Face 文件列表下面会多出一张表格，你勾选需要的文件，脚本就自动生成对应的下载命令，不用再手动拼 `huggingface-cli` 或 `wget`...

#Tools#Spotty_Weldah#Hugging Face#Greasy Fork

一句话点评

一个 Tampermonkey 脚本，在 Hugging Face 模型页面文件列表下自动生成下载命令，勾选文件就能拿到对应的 `huggingface-cli` 或 `wget` 命令，省去手动拼 URL 的麻烦。作者是 Reddit 用户 Spotty_Weldah，脚本托管在 Greasy Fork，安装即用。适合经常从 HF 下模型但懒得记命令的人。不过脚本只生成命令，不负责断点续传...

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

58

SCORE

H0·K1·R1

15:40

71d ago

FEATUREDAI HOT 精选· aihot-apiZH15:40 · 05·18

InsForge：给编程智能体配齐数据库、登录、存储和模型网关的一体化后端

InsForge 是一个开源后端平台，专门给 AI 编程智能体用。它把数据库、用户认证、文件存储、边缘函数和模型网关打包在一起，通过 MCP Server 和命令行工具（CLI+Skills）暴露给智能体调用。你可以用 Docker 在自己机器上部署，也能一键部署到 Railway 或 Zeabur 上。目前 GitHub 上有 10.3k star，...

#Agent#Code#Tools#InsForge

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

给编程智能体用的开源后端“全家桶”，把数据库、认证、存储、函数和模型网关打包成工具，让 AI 直接调用。10.3k star 说明有需求，但正文没披露生产环境的稳定性数据。

锐评

InsForge 做的事很直接：把开发一个全栈应用需要的后端零件——数据库、用户登录、文件存储、边缘计算和模型调用——全部打包，然后通过 MCP 协议和命令行工具暴露给 AI 编程智能体。你可以理解成它给 AI 配了一个现成的后端工具箱，不用每次都从零搭架子。目前 GitHub 上有 10.3k star，说明不少开发者对这个思路感兴趣。部署方式也灵活，支持 Docker 自托管，也能一键推到 Railway 或 Zeabur 上跑。但正文主要展示的是功能列表和部署方式，没有给出任何关于并发处理能力、延迟表现、安全审计或实际项目中的故障率数据。这点先别太激动——一个后端平台能不能用在生产环境，关键看它扛不扛得住真实流量，而这篇 README 没回答这个问题。另外，它把模型网关也集成进去了，意味着智能体可以通过同一个入口调不同模型。这省事，但也把模型调用的成本和稳定性绑在了这个平台上。如果你已经在用别的网关方案，迁移成本需要自己评估。总的来说，概念验证阶段用起来应该顺手，但上生产前得自己压测一轮。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

15:40

71d ago

FEATUREDHacker News 首页· rssEN15:40 · 05·18

InsForge：给编程 AI 配一个开源后端，一条命令就能部署、调试

InsForge 是一个 Apache 2.0 协议的开源后端平台，专门给编程类 AI（也就是 coding agent）用。它把数据库、用户认证、文件存储、算力托管和 AI 网关打包在一起，AI 写代码时可以直接调用这些现成模块，不用每次都从零搭后端。安装只要一行 CLI 命令，再配上它的 Skills 功能，AI 就能自己完成部署、运维和查错。目前...

#Agent#Code#Tools#InsForge

精选理由

精选 · 重要度 73 · 吸引力 + 知识量 + 共鸣

一句话点评

给 coding agent 配了个现成的后端工具箱，一行命令就能让 AI 自己搞定部署和运维，但别指望它能替代 Heroku 的成熟生态。

锐评

InsForge 做的事很直接：把数据库、用户认证、文件存储、算力和 AI 网关打包成一个开源后端，让编程类 AI 直接调用，不用每次都从零搭。安装只要一行 CLI 命令，再配上它的 Skills 功能，AI 理论上能自己完成部署、运维和查错。这对想让 coding agent 跑通全流程的开发者来说，省了不少重复劳动。不过正文没披露它支持哪些数据库和云服务商，也没给出 Skills 的具体覆盖范围和成功率。Apache 2.0 协议是加分项，但“开源版 Heroku”这个说法我会先打个折——Heroku 的成熟度、生态和运维经验不是一套工具能短期追平的。另外，AI 自己运维的可靠性、出错后的恢复能力，这些关键指标都没提。还缺的是：实际跑起来的延迟数据、多 agent 协作时的资源隔离方案，以及跟 Claude 之外其他 coding agent 的兼容性测试。如果只是给单个 agent 用的小型项目，这套东西够用；要上生产环境，还得等更多验证。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

73

SCORE

H1·K1·R1

15:24

71d ago

Hacker News 首页· rssEN15:24 · 05·18

用 Git --author 标记拦住 AI 灌水机器人

Archestra 团队在 GitHub 仓库里被 AI 机器人刷屏刷到受不了——一个 issue 堆了 253 条无意义评论，27 个 PR 大部分没测试，每周要花半天清理。他们试过算贡献者信誉分、搞 AI 审查机器人，但都误伤真人。最后上了狠招：开启 GitHub 的“仅限历史贡献者”设置，新人必须先在官网过 CAPTCHA 和伦理规则，然后团队用...

#Tools#Code#Archestra#GitHub

一句话点评

Archestra 被 AI 机器人刷爆 GitHub：一个 issue 堆了 253 条无意义评论，27 个 PR 大多没测试，每周花半天清理。他们试过信誉分和 AI 审查，都误伤真人。最后开了 GitHub 的“仅限历史贡献者”开关，新人得先过 CAPTCHA 和伦理规则才能提交。代价是开源贡献门槛变高，但团队说宁可牺牲指标也要保质量。正文没披露具体怎么用 --author 字段做白名单...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

更多

✕

频道

热点聚合每日 AI 日报全部播客·视频 AX 严选 X 监控收藏信源邮件订阅 Agent 接入

后台

用量系统订阅管理精选策略策略迭代用户