全部 · 2026-05-04

▸ 50 items · updated 3m ago

2026年5月

一二三四五六日

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 2573 26105 27120 28142 29116 3064 3162

2026年6月

一二三四五六日

1150 2157 3132 4117 5127 669 773 8141 9135 1084 1196 1288 1346 1434 1570 1682 1775 1886 1955 2027 2120 2274 2374 2468 2564 2640 2724 2837 2956 3083

2026年7月

一二三四五六日

156 271 347 421 527 664 758 865 975 1050 1134 1228 1345 1484 1582 1683 1745 1818 1938 2051 2170 2265 2340 24 25 26 27 28293031

2026-05-04 · 星期一2026年5月4日

23:49

84d ago

The Verge · AI· rssEN23:49 · 05·04

OpenAI 总裁在法庭上什么都会，就是不会回答问题

The Verge 报道了 Greg Brockman 在马斯克诉 OpenAI 案中的证词，目前只公开了交叉询问片段。Brockman 在庭上反复要求对方提供上下文，还纠正对方漏掉的“a”或“the”这类小词。正文没有披露庭审结果，所以目前只能看个热闹，没法判断谁占上风。

#Safety#OpenAI#Elon Musk#Greg Brockman

一句话点评

Greg Brockman 在法庭上抠字眼，但没回答实质问题。

锐评

The Verge 报道了马斯克诉 OpenAI 案中 Greg Brockman 的交叉询问片段。Brockman 反复要求对方提供上下文，甚至纠正对方漏掉的“a”或“the”这类小词，但正文没有披露任何庭审结果或关键证词。目前只能看个热闹，无法判断谁占上风。信息缺口：没有公开 Brockman 是否回答了核心问题（如 OpenAI 是否背离非营利初衷），也没有法官或陪审团的即时反应。对于关注 AI 治理和 OpenAI 内部博弈的读者，这条新闻的价值在于观察 Brockman 的法庭策略——用程序细节拖延实质回答，但缺乏判决或后续进展，暂时只能当花絮看。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

23:29

84d ago

Latent Space· rssEN23:29 · 05·04

Claude 是“另一个存在”，GPT 是工具：AI 人格分裂的 2026 版

Latent Space 总结了 5 月 1-4 日的 AI 新闻，核心讨论是 OpenAI 员工 Roon 提出的观点：Claude 被用户当作有道德判断的“另一个存在”，而 GPT 更像一把没有灵魂的实用工具，用户不会担心被它评判。这延续了之前“Clippy vs Anton”的路线之争。另外，Sierra 以 150 亿美元估值融资约 10 亿美...

#Agent#Code#Benchmarking#Latent Space

一句话点评

OpenAI员工Roon公开夸Claude有道德人格，用户怕被它评判，反而把GPT当没灵魂的工具随便用。这个观察挺准，但正文没给用户调研数据，全靠推特截图撑。Sierra以150亿美元估值融了约10亿，ARR大概2亿，75倍PS——估值不低，但客户是客服场景，跟模型人格化讨论关系不大。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

23:01

84d ago

彭博科技· rssEN23:01 · 05·04

Alvarez & Marsal 计划到2028年靠AI业务赚35亿美元

咨询公司 Alvarez & Marsal 放话，到2028年AI业务要占到总收入的一半，换算下来是35亿美元。这个目标挺大，但正文没披露具体卖什么AI服务——是帮客户做流程自动化、搭外挂资料库，还是让模型进业务流程干活？都没说。35亿这个数字本身说明他们押注AI咨询会爆发，但缺少服务线和交付方式的细节，暂时只能当个营收目标看。

#Alvarez & Marsal#Commentary

一句话点评

咨询公司 A&M 喊出 2028 年 AI 业务营收 35 亿美元，占一半收入。目标很大，但没说是卖什么服务。

锐评

Alvarez & Marsal 放话，到 2028 年 AI 业务要占到总收入的一半，换算下来是 35 亿美元。这个目标挺大，但正文没披露具体卖什么 AI 服务——是帮客户做流程自动化、搭外挂资料库，还是让模型进业务流程干活？都没说。35 亿这个数字本身说明他们押注 AI 咨询会爆发，但缺少服务线和交付方式的细节，暂时只能当个营收目标看。另外，来源是彭博，可信度还行，但原文可能藏在付费墙后，RSS 摘要信息有限。如果 A&M 真能靠 AI 咨询做到这个体量，那说明企业级 AI 落地的需求比市场预期的要猛得多。不过，咨询公司画营收大饼是常态，关键要看他们实际签了多少单、交付了什么可复用的产品，而不是纯人天计费的项目。这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

23:00

84d ago

彭博科技· rssEN23:00 · 05·04

ServiceNow 放话 2030 年收入冲到 300 亿美元，靠 AI 产品拉动

ServiceNow 预测到 2030 年订阅收入能达到 300 亿美元，理由是 AI 产品（Now Assist）卖得不错。300 亿这个数字比现在高出一大截，但正文没披露 Now Assist 具体赚了多少、有多少客户、怎么定价。关键缺口是 AI 收入占比，不是 2030 年目标本身。

#ServiceNow#Product update

一句话点评

ServiceNow 说 AI 产品 Now Assist 能帮它 2030 年做到 300 亿美元订阅收入，但没披露 Now Assist 现在赚了多少。

锐评

ServiceNow 把 2030 年订阅收入目标定在 300 亿美元，比现在高出一大截，理由是 AI 产品 Now Assist 卖得好。但正文没披露 Now Assist 具体收入、客户数或定价方式，这个 300 亿目标本身参考价值有限。关键缺口是 AI 收入占比——如果 Now Assist 只贡献一小部分，那这个目标更多是传统业务增长，跟 AI 关系不大。另外，300 亿是 2030 年的远期预测，中间变数很多，不能当短期信号。对于关注 AI 变现的人，现在缺的是 Now Assist 的 ARR 或渗透率数据，而不是一个画饼数字。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

22:56

84d ago

FEATURED彭博科技· rssEN22:56 · 05·04

Meta 找摩根士丹利和摩根大通操盘，为得州 El Paso 数据中心融资

Meta 正在为一个位于得克萨斯州 El Paso 的数据中心项目安排融资，总盘子大约 130 亿美元。摩根士丹利和摩根大通已经进场。这笔钱具体怎么拆、期限多长、利率多少，正文都没披露。这件事本身说明大科技公司现在建 AI 基础设施，越来越靠举债而不是全用自有现金。

#Meta#Morgan Stanley#JPMorgan#Funding

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

Meta 建数据中心开始找银行借钱了，130 亿美元的大单子，说明 AI 烧钱已经烧到连大厂都要上杠杆。

锐评

Meta 在得州 El Paso 的数据中心项目要融资约 130 亿美元，摩根士丹利和摩根大通已经进场。这件事最值得看的不是项目本身，而是融资方式——以前大科技公司建基础设施大多直接掏现金，现在转向举债，说明 AI 基础设施的资本开支规模已经大到连 Meta 这种现金流大户都觉得肉疼。不过正文没披露这笔钱的具体结构：是发债还是银行贷款、期限多长、利率多少，这些关键信息都缺。没有这些数字，就没法判断 Meta 的融资成本到底划不划算，也没法跟它之前自己掏钱建的数据中心做对比。另外，El Paso 这个选址本身也值得留意，得州电价和土地成本相对低，但正文同样没展开讲。整体看，这条消息更像一个信号：AI 基建的烧钱竞赛正在把科技公司的财务策略往更传统的重资产模式推。但具体压力有多大，还得等后续披露利率和还款安排才能算账。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

22:52

84d ago

Hacker News 首页· rssEN22:52 · 05·04

SprintiQ：给 Claude Code 用的开源敏捷看板，想法直接变用户故事

#Agent#Code#Tools#SprintiQ

一句话点评

给 Claude Code 配了个开源敏捷看板，想法自动拆成需求卡片，进度双向同步。

锐评

SprintiQ 是一个开源工具，专门给 Claude Code 这类 AI 编程助手做敏捷项目管理。它能把你脑子里的大想法自动拆成用户故事（就是开发里常说的“需求卡片”），排好迭代，还能和 Claude Code 双向同步——你在 Claude 里改代码，SprintiQ 这边自动更新进度。单用户、自托管，Apache 2.0 协议。目前 GitHub 上只有标题和简介，正文没披露安装步骤、功能细节或实际效果，所以这点先别太激动。如果是真的，对用 Claude Code 做复杂项目的团队挺省钱，省了手动拆卡和同步的功夫。但单用户限制意味着它更适合个人或小团队，协作场景可能不够用。另外，AI 生成用户故事的质量和准确性还没验证，得看实际跑起来会不会出逻辑漏洞。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

22:42

84d ago

彭博科技· rssEN22:42 · 05·04

前 Citadel 首席技术官加入 Motive Partners 负责 AI 业务

前 Citadel 首席技术官 Umesh Subramanian 加入私募股权公司 Motive Partners，负责推动其 AI 战略。正文只披露了这一句话，没有说明他的具体职位、投资规模、团队配置或入职时间。

#Citadel#Umesh Subramanian#Motive Partners#Personnel

一句话点评

前 Citadel CTO 加入私募 Motive Partners 管 AI 战略，但正文只一句话，缺细节。

锐评

前 Citadel 首席技术官 Umesh Subramanian 加入私募股权公司 Motive Partners，负责推动 AI 战略。这条消息来自彭博，但正文只披露了这一句话，没有说明他的具体职位、投资规模、团队配置或入职时间。对于关注金融+AI 人才流动的读者来说，这算一个信号——量化巨头的高管开始往私募 AI 方向走。但信息缺口太大：Motive Partners 之前投过哪些 AI 项目？Subramanian 是带资进组还是纯顾问？这些都没说。建议先标记为“人事变动线索”，等后续披露再判断影响。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

21:58

84d ago

FEATUREDr/LocalLLaMA· rssEN21:58 · 05·04

本地跑 Qwen 给 Codex 当代码审查员、协作者和挑刺对手的实测

robert896r1 把 Qwen3.6 27B 的 GGUF 量化版放在 Codex 旁边当代码校验器，并放出了一套可复现的评测流程。测试覆盖了 Bartowski 和 Unsloth 两种量化来源、65k 和 128k 上下文窗口，以及 q8 和 f16 的 KV 缓存精度。三个 128k 上下文的配置并列最佳，在这个评测套件里没测出 q8 KV...

#Agent#Code#Benchmarking#Qwen

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

有人把本地跑的小模型当代码审查员用，还放出了可复现的评测流程，但正文被 Reddit 屏蔽了，具体细节看不到。

锐评

这条帖子的核心玩法是把 Qwen3.6 27B 的量化版（GGUF 格式）放在 Codex 旁边当“代码校验器”，专门抓漏掉的指令、过度开发、UI 判断失误和长上下文遗漏。作者 robert896r1 放出了一套可复现的评测流程，对比了 Bartowski 和 Unsloth 两种量化来源、65k 和 128k 上下文窗口，以及 q8 和 f16 的 KV 缓存精度。结果三个 128k 配置并列最佳，在这个套件里 q8 KV 缓存没测出精度损失。但这里有个硬伤：Reddit 原文返回了 403，正文内容被网络屏蔽，我们只能看到摘要。摘要里没提具体测试了多少个任务、每个任务跑了几次、Codex 本身的表现基线是多少。128k 并列最佳这个结论，也不知道是跑分接近还是真的没差别。另外，27B 模型在本地跑的实际延迟和显存占用也没给，这对想复现的人来说是个关键缺口。整体看，这个“旁路评测”的思路比通用排行榜更有参考价值，因为它直接模拟了一个真实工作流：大模型写代码，小模型在旁边挑刺。但信息缺口太大，结论先打个七折。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:53

84d ago

FEATUREDTechCrunch AI· rssEN21:53 · 05·04

Cerebras 准备上市，估值可能冲到 266 亿美元，背后是跟 OpenAI 的深度绑定

AI 芯片公司 Cerebras 正在推进 IPO，目标估值至少 266 亿美元。它的核心卖点不是通用芯片，而是跟 OpenAI 绑得很紧的供应链关系。文章没披露 OpenAI 有没有持股、具体贡献了多少收入，也没说上市时间表。所以这轮估值更多是在赌 OpenAI 的算力需求会持续砸在 Cerebras 身上，而不是单纯看芯片本身的技术指标。

#Inference-opt#Cerebras#OpenAI#Funding

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

Cerebras 的 IPO 估值至少 266 亿美元，核心赌的是 OpenAI 的算力订单会持续砸给它，而不是芯片本身的技术指标。

锐评

这条新闻最值得看的地方，是 Cerebras 的估值逻辑变了。它不再只是一家卖大芯片的硬件公司，更像 OpenAI 的专属算力供应商。文章说双方关系“深且紧密”，但正文没披露 OpenAI 有没有持股、贡献了 Cerebras 多少收入，也没给上市时间表。所以这 266 亿美元估值，很大程度是在赌 OpenAI 未来的推理和训练需求会长期绑在 Cerebras 上。这点先别太激动。单一客户依赖是双刃剑：订单稳的时候估值飞涨，一旦 OpenAI 分散供应链或者自研芯片，Cerebras 的故事就要重写。另外，文章没提它在英伟达生态外的软件兼容性到底怎么样，也没说晶圆级芯片的良率和功耗数据。这些缺口让估值看起来更像一张 OpenAI 的期权，而不是对芯片公司本身的定价。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:38

84d ago

FEATUREDr/LocalLLaMA· rssEN21:38 · 05·04

FastDMS 把 KV 缓存压到 1/5~1/8，跑得比 vLLM BF16/FP8 还快

FastDMS 放出了一个 MIT 许可的实现，核心是把模型推理时占显存的 KV 缓存压到原来的 1/5 到 1/8。在 8K 上下文长度下，Llama-3.2-1B 用 6.4 倍压缩后困惑度是 9.200；Qwen3-8B 在压缩系数 c=1 时，KV 缓存从 1.406 GiB 直接降到 0.184 GiB。和很多只算字节数的方案不同，它真的把淘...

#Inference-opt#NVIDIA#University of Warsaw#University of Edinburgh

精选理由

精选 · 重要度 80 · 吸引力 + 知识量 + 共鸣

一句话点评

FastDMS 把 KV 缓存压到 1/5 到 1/8，而且真的释放了显存，不是只算字节数。但正文被 Reddit 屏蔽了，看不到实测延迟和精度损失细节，先打个折。

锐评

这条消息的核心卖点是“真压缩”——很多方案只告诉你 KV 缓存的字节数变少了，但显存并没腾出来，FastDMS 声称它物理回收了被淘汰的缓存槽位。从摘要看，Llama-3.2-1B 在 6.4 倍压缩下困惑度 9.200，Qwen3-8B 的 KV 缓存从 1.4 GiB 直接降到 0.18 GiB，数字上挺省钱。但问题在于，我们拿到的正文被 Reddit 屏蔽了，只留了个摘要。这意味着几个关键信息全缺：压缩后的实际推理速度到底快了多少、长文本下的困惑度会不会崩、不同压缩系数对生成质量的影响曲线。另外，MIT 许可虽然友好，但代码质量和易用性也得等看到仓库才能判断。如果这些数据补不上，目前只能当个“看起来不错”的待验证方案，别急着往生产环境搬。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:17

84d ago

● P1FT · 科技· rssEN21:17 · 05·04

OpenAI 总裁为转营利辩护，自曝持有 300 亿美元股份

OpenAI 总裁公开回应了公司从非营利转向营利的争议，并透露自己在这家公司的持股价值高达 300 亿美元。马斯克之前起诉说高管们为了个人利益出卖了慈善使命。不过这篇报道正文被付费墙挡住了，没披露这位总裁具体是谁、股权结构怎么设计、以及重组的具体条款。

#OpenAI#Elon Musk#Policy#Incident

精选理由

精选 · 重要度 86 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenAI总裁自曝持股300亿美元，想证明转营利不是为了私利，但这数字反而让马斯克的指控更有画面感了。

锐评

OpenAI总裁亲自下场回应，说自己转营利的动机没问题，还顺带亮了一张底牌：他手里的股份值300亿美元。这个数字太具体了，很难不让人多想。马斯克之前起诉说高管们为了个人利益出卖了慈善使命，现在总裁自己报出这个身价，像是在用事实反驳，但效果可能适得其反——300亿这个量级，反而让“为私利”的指控显得更可信了。不过，这篇报道的正文被FT的付费墙挡得严严实实，我们看不到最关键的信息。比如这位总裁到底是谁，是Sam Altman还是其他人？这300亿的估值是怎么算出来的，是纸面富贵还是能落袋的？以及公司从非营利转向营利的重组方案里，具体条款怎么设计来平衡公共利益和股东回报？这些全都没披露。所以现在能做的判断很有限，只能说公关意图很明显，但信息缺口太大，先别急着下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

20:48

84d ago

r/LocalLLaMA· rssEN20:48 · 05·04

红迪用户吐槽：为什么没有第三方推理服务商托管小米 Mimo-2.5 模型？

一位 Reddit 用户发帖质问，为什么所有开放权重模型推理提供商都不托管小米的 Mimo-2.5 或 Mimo-2.5-pro。帖子只点名了 chutes 和小米自己，没有披露任何提供商覆盖范围、基准测试结果、许可条款或托管成本。正文信息缺口很大，无法判断是模型质量、许可限制还是商业策略导致无人托管。

#Inference-opt#Xiaomi#Kimi#DeepSeek

一句话点评

小米Mimo-2.5模型无人托管，原因不明。

锐评

一位Reddit用户发现，所有开放权重推理提供商都不托管小米的Mimo-2.5系列模型。帖子只点名了chutes和小米自己，没有披露任何提供商覆盖范围、基准测试结果、许可条款或托管成本。正文信息缺口很大，无法判断是模型质量、许可限制还是商业策略导致无人托管。如果模型本身不错但没人接，可能是许可条款卡住了商业部署；如果基准测试一般，那提供商不接也合理。目前缺关键信息：模型在标准评测上的表现、许可协议细节、以及小米是否主动限制了第三方托管。这点先别太激动，等更多数据出来再下结论。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

20:44

84d ago

r/LocalLLaMA· rssEN20:44 · 05·04

Qwen3.6-35B TurboQuant_Plus 实测：192K 上下文跑出 19.43 t/s，但标题的 30-35 t/s 没达到

Reddit 用户测了 Qwen3.6-35B 的 TurboQuant_Plus 量化版，192K 上下文下生成速度 19.43 tokens/秒，标准设置（40K 上下文）是 17.55 t/s、显存占用 7.0GB。TurboQuant 模式显存降到 6.8GB，处理 5,359 tokens 耗时 4 分 35 秒。具体配置是 K 用 q8_0...

#Inference-opt#Code#Reasoning#Qwen

一句话点评

Qwen3.6-35B 量化后跑 192K 上下文，速度 19.43 tokens/秒，显存只占 6.8GB，但标题说的 30-35 t/s 没达到。

锐评

Reddit 用户实测 Qwen3.6-35B 的 TurboQuant_Plus 量化方案，192K 超长上下文下生成速度 19.43 tokens/秒，显存占用仅 6.8GB。作为对比，标准设置（40K 上下文）是 17.55 t/s、7.0GB 显存。处理 5,359 tokens 耗时 4 分 35 秒，速度不算快但显存控制很出色。具体配置是 K 用 q8_0、V 用 turbo3、MoE 全跑在 CPU 上。注意标题写的 30-35 t/s 目标没达到，实际 19.43 t/s 是 192K 下的成绩。正文没披露量化后的质量损失，这点先别太激动。对于本地部署 35B 模型跑超长上下文的场景，这个显存占用确实挺省钱，但速度偏慢，适合离线批处理。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

20:41

84d ago

彭博科技· rssEN20:41 · 05·04

摩根士丹利联席总裁：AI 融资和并购正在回暖

摩根士丹利联席总裁 Dan Simkowitz 在米尔肯研究院全球会议上说，AI 融资和并购交易正在复苏。但这是一段视频简讯，没披露融资规模、交易数量或具体操作方式。想拿这个判断市场热度，信息还不够。

#Morgan Stanley#Dan Simkowitz#Bloomberg#Funding

一句话点评

摩根士丹利高管说AI融资和并购在回暖，但视频简讯没给任何数字。

锐评

摩根士丹利联席总裁Dan Simkowitz在米尔肯会议上放了个口风：AI融资和并购交易正在复苏。但这是一段Bloomberg视频简讯，正文没披露融资规模、交易数量或具体操作方式。想拿这个判断市场热度，信息还不够。目前能确认的只有一位投行高管的定性表态，没有交易金额、案例数量或时间线支撑。如果真在回暖，应该能看到至少几个标志性deal的金额或结构变化，这些正文都没给。建议先标记为“高管吹风”，等后续有具体数字再跟进。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

20:09

84d ago

彭博科技· rssEN20:09 · 05·04

Palantir 上调 2026 年收入预期，但商业销售未达标

Palantir 上调了 2026 年收入预期，并称业绩超出分析师预测，股价随之上涨。但标题里提到的“商业销售未达标”具体差了多少、哪个部门拖了后腿，正文都没披露。这家公司的核心争议一直在于它做数据、监控和 AI 驱动的军事业务，这次财报也没能绕开这个话题。

#Palantir Technologies#Product update#Commentary

一句话点评

Palantir上调2026年收入预期，股价涨了，但商业销售没达标。

锐评

Palantir 上调了2026年收入预期，股价应声上涨，但标题里写的“商业销售未达标”具体差了多少、哪个部门拖了后腿，正文都没披露。这家公司的核心争议一直在于它做数据、监控和AI驱动的军事业务，这次财报也没能绕开这个话题。关键数字和具体缺口都没给，投资者只能先信个方向。如果是真的，政府订单撑住基本盘，但商业客户增长乏力，说明AI产品在民用市场还没跑通。这点先别太激动，等具体数字出来再判断。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

19:52

84d ago

彭博科技· rssEN19:52 · 05·04

欧盟找Anthropic给银行做安全测试，Mythos漏洞到底多严重？

欧盟正在跟Anthropic谈，想用它的Mythos工具给银行和公司做安全测试。Mythos是Anthropic内部发现模型漏洞的一套方法，但正文没披露具体原理、测试范围和时间表。关键看点不是技术本身，而是监管机构会不会把模型厂商的检测结果直接变成银行业的合规流程——如果真落地，等于让AI公司替监管定安全标准。目前信息太少，先别急着下结论。

#Safety#Benchmarking#European Union#Anthropic

一句话点评

欧盟想让Anthropic用Mythos给银行做安全测试，但正文没披露Mythos的原理和测试范围。

锐评

欧盟正在跟Anthropic谈，想把它的内部漏洞检测工具Mythos用到银行和公司的安全测试上。关键看点不是Mythos技术多强——正文压根没披露它的原理、测试范围和时间表——而是监管机构会不会直接把模型厂商的检测结果变成银行业的合规流程。如果真落地，等于让一家AI公司替监管定安全标准，这比技术本身更值得关注。目前信息太少，先别急着下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

19:18

84d ago

FEATUREDHacker News 首页· rssEN19:18 · 05·04

白宫考虑在AI模型发布前进行审查

特朗普政府正在讨论一项行政令，打算成立一个由科技公司高管和政府官员组成的 AI 工作组，研究对新的 AI 模型做发布前的正式审查。这个政策转向的直接导火索是 Anthropic 推出了一个叫 Mythos 的强模型。目前已知的讨论方向包括参考英国的做法，让多个政府机构来确保模型达到安全标准，但具体审查什么标准、覆盖哪些模型、由哪个部门执行、什么时候落地...

#Safety#White House#Policy#Safety/alignment

精选理由

精选 · 重要度 84 · 吸引力 + 共鸣

一句话点评

特朗普政府从放手不管转向考虑给AI模型发布设卡，这个急转弯是因为Anthropic的新模型Mythos。但具体怎么审、谁来审，正文还没说清楚。

锐评

这条新闻最值得关注的是政策立场的180度掉头。特朗普之前把AI比作“漂亮宝宝”，说要让它自由生长，现在却开始讨论发布前审查，这个转变本身就说明Mythos模型可能展示出了让政府坐不住的能力。白宫上周已经跟Anthropic、Google和OpenAI通了气，计划搞一个工作组来研究监管流程，可能会参考英国那套让多个政府机构把关安全标准的做法。但正文没披露Mythos到底强在哪、踩到了哪条红线，也没说审查是强制还是自愿、会不会像拜登时期那样要求做安全评估。这些信息缺口让整件事的严重程度很难判断。另外，工作组里科技公司高管和政府官员各占多少话语权、审查会不会变成大厂卡小厂脖子的工具，目前也完全没提。我会先打个折：这更像是一次被某个具体模型吓出来的应激反应，离落地成正式制度还有很长距离。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

19:12

85d ago

TechCrunch AI· rssEN19:12 · 05·04

图像AI模型拉动App下载量，效果是聊天机器人升级的6.5倍

Appfigures的数据显示，应用推出图像生成模型后，下载量比单纯升级聊天模型高出6.5倍。ChatGPT和Gemini各自靠图像模型拉了几千万新用户。但正文没披露样本量、统计周期，也没说这些下载是否转化成了收入——下载涨了不等于赚钱，这点先别太激动。

#Vision#Appfigures#Benchmark#Commentary

一句话点评

图像模型拉新比聊天模型强6.5倍，但下载涨不等于赚钱。

锐评

Appfigures数据显示，应用推出图像生成模型后，下载量比单纯升级聊天模型高出6.5倍。ChatGPT和Gemini各自靠图像模型拉了几千万新用户。这确实说明视觉能力是当前获客的强杠杆——用户更愿意为“能画图”而不是“聊得更好”下载App。但正文没披露样本量、统计周期，也没说这些下载是否转化成了收入。下载涨了不等于赚钱，这点先别太激动。另外，数据来源Appfigures是第三方监测平台，其统计口径（仅限iOS/Google Play公开数据）可能漏掉大量网页端或API调用场景。缺的是留存率和付费转化数据，以及不同图像模型（如文生图 vs 图生图）之间的效果差异。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:37

85d ago

r/LocalLLaMA· rssEN18:37 · 05·04

求推荐轻量级代码库探索 SDK

Reddit 用户在 LocalLLaMA 版问：想从 GitHub 代码库里自动提取项目意图、框架和变量，有什么轻量 SDK 推荐？候选有 Cursor SDK 测试版、Gemini-CLI、OpenCode，或者自己写一个探索 agent。帖子正文被屏蔽了，没披露这些工具的基准测试、定价或能处理多大仓库。

#Agent#Code#Tools#Cursor

一句话点评

想自动读代码库，但候选工具都没公开基准和定价。

锐评

Reddit 用户在 LocalLLaMA 版问：有没有轻量 SDK 能自动从 GitHub 仓库提取项目意图、框架和变量？候选包括 Cursor SDK 测试版、Gemini-CLI、OpenCode，或者自己写一个探索 agent。帖子正文被屏蔽，没披露这些工具的基准测试、定价或能处理多大仓库。先给判断：这个需求很实在——开发者想快速理解陌生代码库，但候选方案都缺关键信息。Cursor SDK 测试版可能依赖云端推理，延迟和成本未知；Gemini-CLI 免费但上下文窗口有限，大仓库可能截断；OpenCode 开源但社区小，维护和文档可能跟不上。自己写 agent 灵活但开发成本高。缺什么：正文没披露这些工具在 10 万行以上仓库的实测表现、单次分析耗时、API 调用成本，以及是否支持私有仓库。如果只是小玩具，那自己写 agent 更可控；如果是生产级，得等基准数据。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

18:19

85d ago

彭博科技· rssEN18:19 · 05·04

加密风投 Haun 募了 10 亿美元，准备拿一部分投 AI

Haun Ventures 新募了 10 亿美元，CEO Katie Haun 说机会在“代理金融”（让 AI 代理替人做交易、管资产）。正文没披露这笔钱怎么分、单笔投多大、什么时候开始投。

#Agent#Haun Ventures#Katie Haun#Bloomberg

一句话点评

Haun Ventures 又募了 10 亿美元，这次要投 AI 代理做交易。

锐评

Katie Haun 说机会在“代理金融”——让 AI 代理替人做交易、管资产。10 亿美元规模不小，说明头部风投在赌 AI 代理会吃掉金融交易环节。但正文被 paywall 挡住，没披露这笔钱怎么分（新基金 vs 追加老基金）、单笔投多大、什么时候开始投。Haun 之前主投 crypto/web3，这次转向 AI 代理金融，方向跨度大，执行节奏和团队配置都是未知数。如果真按代理金融落地，需要解决合规、托管、责任归属等问题，这些正文都没提。信息缺口明显，先别太激动。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

18:08

85d ago

彭博科技· rssEN18:08 · 05·04

英伟达投了家做推理的云公司 DeepInfra，1.07 亿美元 B 轮

DeepInfra 拿了 1.07 亿美元 B 轮，英伟达和三星都跟了。它做的是云推理服务，说白了就是帮别人跑模型推理，不是训练。这笔钱说明大厂在押注推理侧的基础设施，毕竟模型越来越多，跑推理的算力瓶颈迟早要解决。不过正文没披露估值、定价策略或者融的钱能扩多少容量，所以实际性价比还不好判断。

#Inference-opt#DeepInfra#Nvidia#Samsung

一句话点评

英伟达和三星跟投1.07亿美元，押注推理云服务。

锐评

DeepInfra 拿了1.07亿美元B轮，英伟达和三星都跟了。它做的是云推理服务，说白了就是帮别人跑模型推理，不是训练。这笔钱说明大厂在押注推理侧的基础设施，毕竟模型越来越多，跑推理的算力瓶颈迟早要解决。不过正文没披露估值、定价策略或者融的钱能扩多少容量，所以实际性价比还不好判断。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:04

85d ago

Hacker News 首页· rssEN18:04 · 05·04

台积电前工程师泄露2纳米机密，被判10年

台积电一名前工程师因向设备供应商东京威力科创泄露2纳米制程的蚀刻设备机密，被台湾智慧财产及商业法院依《国家安全法》判刑10年。同案另有3名台积电员工被判2至6年，东京威力台湾分公司被罚1.5亿新台币（约合人民币3300万元）。这是《国家安全法》首度追究企业刑事责任。判决可上诉。正文未披露泄露的具体技术细节或是否已流向第三方。

#Taipei Times#TSMC#Policy#Incident

一句话点评

台积电前工程师泄密2纳米制程设备机密，判10年，同案3人2-6年，东京威力台湾被罚1.5亿新台币。

锐评

这是台湾《国安法》首次追究企业刑事责任，罚东京威力台湾1.5亿新台币（约3300万人民币），但可缓缴——前提是赔台积电1亿、缴国库5000万。主犯陈力铭从台积电跳槽到东京威力后，找老同事要2纳米蚀刻设备机密，拍照传给新东家评估设备性能。法院判10年，比检方求刑14年轻。正文没披露泄密的具体技术细节，也没说这些资料是否已流出到第三方。对AI从业者来说，这案子提醒：先进制程（2纳米）的设备参数本身就是核心资产，跨公司跳槽时的信息边界是法律红线。判决还可上诉，最终刑期可能有变。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:22

85d ago

r/LocalLLaMA· rssEN17:22 · 05·04

2026年买二手V100 32G跑本地AI还划算吗？

Reddit用户问：手头已有RTX 5060 Ti 16G和5070 Ti，再搞两张Tesla V100 32G组多卡，跑本地大模型和长上下文值不值？V100虽然显存大、二手便宜，但架构老（Volta，2017年），没有Tensor Core对LLM推理加速，实际吞吐可能不如新卡。帖子没透露具体价格、功耗和实测速度，所以没法直接算性价比。结论：如果价格...

#Inference-opt#Reddit#NVIDIA#Commentary

一句话点评

V100 32G显存大但架构老，跑推理可能不如新卡快。

锐评

Reddit用户问：已有RTX 5060 Ti 16G和5070 Ti，再买两张Tesla V100 32G组多卡跑本地大模型值不值？V100显存大（32G）、二手便宜，但架构是2017年的Volta，没有Tensor Core对LLM推理加速，实际吞吐可能不如新卡。帖子没透露具体价格、功耗和实测速度，所以没法直接算性价比。结论：如果价格极低（比如每张几百元）且只跑长上下文、不追求速度，可以一试；否则新卡更划算。正文没披露V100的具体二手价和功耗数据，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

17:16

85d ago

r/LocalLLaMA· rssEN17:16 · 05·04

手上有4张RTX 3090，该不该现在卖掉换新卡？

Reddit 用户问：手头4张 RTX 3090，现在 eBay 二手价约1100美元一张，四张能卖3500美元左右。纠结的点不只是回血，关键是3090不支持 FP8/FP4 精度——新模型跑低精度推理时，老卡速度吃亏、显存利用率也低。如果打算先卖卡用云 API 过渡，等 RTX PRO 6000 出来再买，那就要算清楚云服务跑推理的长期成本，以及新卡...

#Inference-opt#NVIDIA#Qwen#Gemma

一句话点评

四张3090卖不卖？关键不在回血，在新卡支持FP8/FP4精度，老卡跑新模型吃亏。

锐评

Reddit 用户纠结是否卖掉4张 RTX 3090（二手价约1100美元/张，四张共3500美元），核心矛盾不是回血，而是3090不支持 FP8/FP4 精度——新模型（如 Qwen、Gemma）低精度推理时，老卡速度慢、显存利用率低。计划是卖卡后用云 API 过渡，等 RTX PRO 6000 再买。但正文没披露云服务长期成本估算，也没说新卡具体上市时间和价格。如果云 API 跑推理的月费超过卖卡收益的利息，或者新卡延迟太久，这个方案就不划算。另外，四张3090跑 FP16 推理仍有性价比，尤其对显存需求大的模型。建议先算清云成本和新卡时间表，再决定。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:57

85d ago

TechCrunch AI· rssEN16:57 · 05·04

马斯克在OpenAI案中唯一的AI专家证人担心AGI军备竞赛

Stuart Russell是马斯克在OpenAI诉讼中唯一的AI专家证人，他认为政府应该限制前沿实验室。正文没有披露庭审日期、证词细节或具体机制。

#Safety#Alignment#Elon Musk#OpenAI

一句话点评

Stuart Russell 是马斯克在 OpenAI 案中唯一的 AI 专家证人，主张政府限制前沿实验室。

锐评

Stuart Russell（《人工智能：一种现代方法》作者）站马斯克这边，核心观点是政府应该管住前沿实验室，防止 AGI 军备竞赛。他的身份让这条新闻有分量——不是随便一个专家，而是 AI 安全领域最知名的学者之一。但正文没披露庭审日期、证词具体内容，也没说 Russell 到底提了什么监管机制（算力上限？训练审批？）。所以这条的价值在于“谁说了什么立场”，而不是“有什么新方案”。如果后续证词公开，可能影响监管讨论；目前信息量有限，先标记关注。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:53

85d ago

r/LocalLLaMA· rssEN16:53 · 05·04

埃及首个从头训练的 LLM 来了：Horus 1.5 目标 64K 上下文，但没放跑分

TokenAI 发布了 Horus 项目更新，号称这是埃及第一个完全从零训练的开源大模型。Horus 1.0 是 4B 参数、8K 上下文；1.5 Instruct 版本把上下文拉到 64K（8 倍），团队说“能力提升 5 倍”——但没给出任何官方跑分或评测数据。训练代码已放 GitHub，Hugging Face 上有模型权重。另外预告了一个网络安全...

#Reasoning#Code#TokenAI#Assem Sabry

一句话点评

埃及首个从零训练的开源模型，4B参数，1.5版宣称64K上下文和5倍提升，但没跑分。

锐评

TokenAI 发了 Horus 项目更新，号称埃及第一个完全从零训练的开源大模型。1.0 版是 4B 参数、8K 上下文；1.5 Instruct 把上下文拉到 64K（8 倍），团队说“能力提升 5 倍”——但没给任何官方跑分或评测数据。训练代码已放 GitHub，Hugging Face 上有模型权重。另外预告了一个网络安全专用模型，号称要训万亿级安全数据，但同样没细节。值得关注的点：这是埃及本土团队从零训练，不是微调，开源诚意足。但 4B 参数在当前环境下算小模型，64K 上下文对推理和显存要求高，实际效果未知。团队说“5 倍提升”没有基准线，这点先别太激动。正文没披露训练数据规模、硬件配置、评测方法，也没说 1.5 版何时发布。如果是个人或小团队项目，能跑通已不错，但离“改变埃及 AI 格局”还有距离。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:51

85d ago

The Verge · AI· rssEN16:51 · 05·04

Roomba 创始人带着毛茸茸的机器人回来了

Colin Angle 发布了新公司 Familiar Machines & Magic 的首款家用机器人 Familiar，定位是自主陪伴机器人，不是扫地。它大概狗那么大，外形混了熊、仓鸮和金毛的特征。Angle 之前卖过 5000 万台 Roomba，这次想做的是情感连接，不是干家务。正文没披露价格、上市时间和完整参数，所以离量产和实际体验还有距离。

#Robotics#Agent#Colin Angle#Familiar Machines & Magic

一句话点评

Roomba 创始人 Colin Angle 的新机器人公司做了一只毛茸茸的陪伴机器人，外形像狗，混了熊、猫头鹰和金毛的特征。

锐评

Colin Angle 之前卖过 5000 万台 Roomba，这次不做扫地，改做情感陪伴。新机器人叫 Familiar，大概狗那么大，外形混了熊、仓鸮和金毛的特征，目标是让用户产生情感连接，不是干家务。这个方向有意思，因为家用机器人一直卡在“有用但没感情”的阶段，Angle 想用毛茸茸的外观和自主行为补上这一块。但正文没披露价格、上市时间和完整参数，所以离量产和实际体验还有距离。另外，陪伴机器人赛道已经有不少玩家（比如 Lovot、Jibo 的前车之鉴），Familiar 能不能靠“毛茸茸+自主性”突围，得看实际交互体验和定价。目前信息还停留在概念阶段，建议观望。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

16:43

85d ago

r/LocalLLaMA· rssEN16:43 · 05·04

APEX 把 MoE 量化模型堆到 30 多个，还加了个更小的 I-Nano 档位

APEX 更新了 MoE 量化模型合集，从上次 Qwen 3.5 帖子之后又加了 25 个新模型，总数超过 30 个。新增的 I-Nano 档位把路由专家压到 2.06 bpw（比特/权重），比 I-Mini 再小约 20%，但必须用 imatrix 校准。具体目标是让 Qwen 3.5 35B-A3B 跑在 11GB 显存里——对消费级显卡来说挺省钱...

#Inference-opt#Code#Multimodal#APEX

一句话点评

APEX 把 MoE 量化模型堆到 30+ 个，新增 I-Nano 档位，目标让 Qwen 3.5 35B-A3B 跑在 11GB 显存。

锐评

APEX 更新了 MoE 量化模型合集，总数超过 30 个，新增 I-Nano 档位。I-Nano 把路由专家压到 2.06 bpw（比特/权重），比 I-Mini 再小约 20%，但必须用 imatrix 校准。具体目标是让 Qwen 3.5 35B-A3B 跑在 11GB 显存里——对消费级显卡来说挺省钱，比如 RTX 4090 24GB 能跑两个。不过 2.06 bpw 的精度损失没披露，实际推理质量未知。正文被 Reddit 屏蔽，来源不可靠，具体模型列表和基准测试缺失。如果真能 11GB 跑 35B MoE，本地部署门槛会降一截，但得等第三方验证。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:36

85d ago

TechCrunch AI· rssEN16:36 · 05·04

OpenAI 称马斯克发威胁短信：不和解就让你们成“全美最招人恨的人”

OpenAI 在周日提交的法庭文件中称，马斯克在开庭前两天给联合创始人 Greg Brockman 发短信，提议和解。Brockman 建议双方都撤诉，马斯克随即回复：“到本周末，你和 Sam 会成为全美最招人恨的人。如果你们坚持，那就这样吧。”文件没有附上短信截图，大部分内容是在说服法官采纳这段和解谈判记录，但法官当场裁定不可采信。正文没披露马斯克最...

#Elon Musk#OpenAI#Greg Brockman#Incident

一句话点评

马斯克发短信威胁奥特曼和布罗克曼，说他们将成为全美最招人恨的人。

锐评

OpenAI 在法庭文件中指控马斯克在开庭前两天主动找布罗克曼谈和解，布罗克曼建议双方撤诉，马斯克随即回复威胁短信，称奥特曼和布罗克曼“到本周末会成为全美最招人恨的人”。关键信息：短信内容来自 OpenAI 单方提交，文件未附截图，法官当场裁定该和解谈判记录不可采信。正文没披露马斯克最初诉讼的具体诉求、和解条件以及短信发送的具体日期。这件事目前只是 OpenAI 的一面之词，证据链缺截图和完整上下文，法律效力有限。对 AI 从业者来说，这更多是马斯克与 OpenAI 之间个人恩怨的延续，与技术路线或产品无关，暂时不值得投入关注。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

16:21

85d ago

Hacker News 首页· rssEN16:21 · 05·04

OpenAI、Google、微软联手资助学校“AI素养”课

美国参议员Adam Schiff和Mike Rounds提出一项两党法案，要给K-12学校拨款搞“AI素养”教育。OpenAI、Google、微软、美国教师联合会都公开支持。法案定义“AI素养”为：会用AI、能批判性看输出、在AI环境里解决问题、知道怎么规避风险。钱会通过国家科学基金会（NSF）以竞争性拨款发出去，但正文没披露具体金额和课程设计。注意：...

#OpenAI#Google#Microsoft#Policy

一句话点评

美国两党提案要给K-12学校拨款搞AI素养教育，OpenAI、Google、微软都公开支持。

锐评

这是一项政治信号大于实操细节的法案。参议员Adam Schiff和Mike Rounds提出LIFT AI Act，定义“AI素养”包括会用工具、批判性看输出、在AI环境里解决问题、规避风险。钱走NSF竞争性拨款，但正文没披露具体金额——考虑到NSF刚被特朗普政府砍了预算，实际能批多少钱要打折。课程设计、教师培训、评估方法全交给高校或非营利组织去“研究”，没有现成方案。支持方包括OpenAI、Google、微软和美国教师联合会，说明大厂想从基础教育阶段培养用户习惯和舆论好感。缺的信息：拨款总额、投票时间表、是否强制学校执行。如果是真的，这笔钱对AI公司来说比广告划算。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

15:59

85d ago

● P1TechCrunch AI· rssEN15:59 · 05·04

Anthropic 和 OpenAI 分别与资产管理公司成立合资企业推进企业级AI

两家公司都找了资产管理方合伙，成立合资公司来推企业级 AI 产品。具体是哪家资管、股权怎么分、定价多少、什么时候上线，正文都没披露。这种操作说明两家都在想办法把企业客户圈得更紧，但没看到实际条款之前，我会先打个折——合资公司到底是为了深度定制服务，还是换个渠道铺销售，现在还不好说。

#Anthropic#OpenAI#Partnership#Product update

精选理由

精选 · 重要度 96 · 吸引力 + 知识量 + 共鸣

一句话点评

两家模型公司不约而同找上管钱的人合伙卖企业服务，说明卖模型本身不够，得把落地和渠道绑在一起才有大单。

锐评

Anthropic 和 OpenAI 在同一天被曝出各自与资产管理公司成立合资企业，专门推企业级 AI 服务。这步棋很直白：模型能力卷到一定程度后，拼的是谁能把产品塞进大客户的业务流程里。找管钱的人合伙，看中的不是技术，是他们的客户关系和行业 know-how。 TechCrunch 的报道只说了合作方是“资产管理公司”，没披露具体是哪家、合资公司的股权结构、以及双方各出多少人。也没说这些合资企业是只做咨询和部署，还是会碰客户数据做定制训练。如果是后者，数据安全和合规会是大问题，但正文完全没提。另外，两家同时走这条路，侧面说明企业市场对“直接买 API”的接受度可能没想象中高，客户要的是有人帮他们搞清楚怎么用、怎么管。但合资公司这种重模式能不能跑通，还得看第一批签下了什么级别的客户、合同金额有多大——这些关键信息目前都缺。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:59

85d ago

r/LocalLLaMA· rssEN15:59 · 05·04

30个开源“爪子/助手”项目对比：提交量高不代表项目健康

Reddit 用户对比了 30 个开源 claw/assistant 项目，统计了提交次数和“巴士因子”（核心作者依赖度）。openclaw 四月份提交了 14586 次，但巴士因子只有 1——意味着项目完全依赖一个人，这个人一旦离开项目就危险了。picoclaw 总分 15，但它的头号作者只占 7.6%，更分散。关键信号是：别只看提交量，要看代码是不...

#Agent#Code#Claude#QwenPaw

一句话点评

开源 claw 项目提交量再高，核心作者只有一个人就危险。

锐评

Reddit 用户统计了 30 个开源 claw/assistant 项目的提交次数和“巴士因子”（核心作者依赖度）。openclaw 四月份提交了 14586 次，但巴士因子只有 1——项目完全依赖一个人，一旦这个人跑路项目就黄了。picoclaw 总分 15，头号作者只占 7.6%，更健康。关键信号：别只看提交量，要看代码是不是绑在一个人身上。正文没披露这些项目的具体功能差异和用户规模，所以“哪个更好用”还得自己试。对于选型来说，巴士因子比提交量更值得关注，尤其是团队要用到生产环境时。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:53

85d ago

Hacker News 首页· rssEN15:53 · 05·04

GitHub 挂了：Issues 和 Webhooks 出问题，波及 PR、Actions 等多个服务

GitHub 官方状态页确认，Issues 和 Webhooks 出现性能下降，随后 Pull Requests、Actions、Packages、Git Operations 也陆续报出延迟或超时。从第一条告警到现在大约 15 分钟，官方还在调查中，没给恢复时间。影响面挺广，但正文没披露具体有多少用户受影响、是否跟机房或代码部署有关。

#GitHub#Hacker News#Incident

一句话点评

GitHub 挂了，Issues、PR、Actions 全在报延迟，15 分钟了还没修好。

锐评

GitHub 官方状态页确认，Issues 和 Webhooks 先出问题，随后 Pull Requests、Actions、Packages、Git Operations 陆续报延迟或超时。从第一条告警到现在约 15 分钟，官方还在调查，没给恢复时间。影响面挺广，但正文没披露具体有多少用户受影响、是否跟机房或代码部署有关。对开发者来说，CI/CD 和代码协作基本停摆，得盯着状态页等更新。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

15:51

85d ago

● P1Hacker News 首页· rssEN15:51 · 05·04

Sierra以150亿美元估值融资9.5亿美元

Sierra 宣布拿到 9.5 亿美元新融资，由 Tiger Global 和 GV 领投，估值超过 150 亿美元。公司账上现金超过 10 亿，目标是把自家 AI 客服平台推成全球标准。Sierra 说现在财富 50 强里超过 40% 在用他们，平台上跑的 AI 客服已经处理了几十亿次对话，从房屋再融资、保险理赔到退货和筹款都有覆盖。他们观察到客户对...

#Agent#Sierra#Funding

精选理由

精选 · 重要度 92 · 吸引力 + 知识量 + 共鸣

一句话点评

Sierra 拿了 9.5 亿美元，估值冲到 150 亿，但通篇是客户案例和愿景，没提模型成本、毛利率和续费率，这些才是企业 AI 生意的命门。

锐评

Sierra 这轮融了 9.5 亿美元，估值超过 150 亿，领投方是 Tiger Global 和 GV。公司说现在账上有超过 10 亿美元现金，要砸钱把自己做成企业 AI 客服的标配。他们给出的增长数据挺猛：服务了超过 40% 的财富 50 强，平台上的 AI 客服处理了数十亿次交互，从房贷再融资、保险理赔到电商退货都在跑。去年 11 月他们刚宣布 ARR 过 1 亿美元，今年 2 月又说 ARR 超 1.5 亿，增速确实快。但整篇公告没讲清楚这门生意的单位经济模型。AI 客服每处理一次对话，Sierra 自己要付多少推理成本？大客户是签固定年费还是按用量计费？毛利率在什么水平？这些数字直接决定 150 亿估值是贵还是便宜。另外，文章里提到的客户部署速度——Nordstrom 五周上线语音客服、Singtel 十周上线且解决率超 70%——听起来不错，但没说明这些项目是定制化交付还是真的平台自服务，前者会拖累规模化利润。还缺一个关键信息：客户留存和扩张情况。正文只说了客户在把 AI 客服从售后支持扩展到销售、留客等环节，但没给净收入留存率。对于一家估值 150 亿、ARR 刚过 1.5 亿的公司，这个倍数需要极高的续费率和增购来支撑，否则就是在赌未来增长填坑。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:37

85d ago

r/LocalLLaMA· rssEN15:37 · 05·04

有人搭了个量化测试站，一个月测了268种量化方案

一个Reddit用户自己搭了个LLM量化测试站，第一个月就跑了268种量化方案。基准测试有6个套件，每个套件64道题，所以每种量化要跑384个case。结果发现Qwen 3.6 35B A3B用了更多token但效果没更好。正文没披露具体测试集和硬件配置，所以结论的泛化性要打个折。

#Benchmarking#Inference-opt#Vision#Qwen

一句话点评

268种量化方案跑了一个月，但测试集和硬件没披露，结论得打折。

锐评

一个Reddit用户自建LLM量化测试站，首月跑了268种量化方案。基准测试含6个套件，每套64题，每种量化跑384个case，工作量不小。结果发现Qwen 3.6 35B A3B用了更多token但效果没更好——这点值得关注，说明量化不是越细越好。但正文没披露具体测试集（比如是数学、代码还是通用问答）和硬件配置（GPU型号、内存带宽），所以结论的泛化性要打个折。另外，268种量化里包含不同精度和算法，但没说明哪些是主流方案（如GGUF、AWQ、GPTQ），社区参考价值有限。如果后续能公开测试集和硬件细节，这个站对本地部署选型会很有用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:22

85d ago

Hacker News 首页· rssEN15:22 · 05·04

1966年福特野马改装成特斯拉，还能用FSD

有人把一辆1966年福特野马改装成了电动车，而且装上了特斯拉的FSD（全自动驾驶）系统，据说能正常跑。但正文没披露具体用了哪些传感器、怎么控制油门刹车、安全机制是什么，所以这点先别太激动——很可能只是移植了特斯拉的电子控制单元和摄像头，能不能真的上路、有没有冗余安全设计都不清楚。HN上27个点、15条评论，讨论热度一般。

#Robotics#Tesla#Ford#Electrek

一句话点评

老野马装特斯拉FSD，但正文没披露传感器和安全机制，先别太激动。

锐评

Electrek 报道有人把 1966 年福特野马改成电动车，还跑通了特斯拉 FSD。但正文只给了链接和 HN 数据（27 点、15 条评论），没披露具体用了哪些传感器、怎么控制油门刹车、有没有冗余安全设计。所以这点先别太激动——很可能只是移植了特斯拉的电子控制单元和摄像头，能不能真的上路、有没有冗余安全设计都不清楚。HN 讨论热度一般，说明圈内人也在观望。缺的是改装细节和实测验证，比如是否保留了原车转向机构、FSD 在城市道路的表现如何。如果是 DIY 项目，成本可能比买辆二手 Model 3 还高，但情怀值拉满。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

15:00

85d ago

FT · 科技· rssEN15:00 · 05·04

Peter Thiel 投了 1.4 亿美元，把数据中心扔到海上用波浪发电

Peter Thiel 领投了 Panthalassa 的 1.4 亿美元融资，这家公司计划把数据中心建在海上，靠波浪能供电。标题里说的 10 亿美元估值是 startup 整体，不是这轮融了那么多。信号是 AI 的电力需求已经逼着基建往海里跑了。但正文没披露具体容量、选址、电网怎么接、有没有 AI 客户，所以这点先别太激动——钱到位了，工程细节还悬着。

#Peter Thiel#Panthalassa#Funding

一句话点评

Peter Thiel 投了 1.4 亿美元给海上数据中心，靠波浪能供电，但工程细节全悬着。

锐评

Peter Thiel 领投了 Panthalassa 的 1.4 亿美元融资，这家公司想把数据中心建在海上，用波浪能供电。标题说的 10 亿美元估值是整个 startup 的估值，不是这轮融了那么多。信号很清楚：AI 的电力需求已经逼着基建往海里跑了。但正文没披露具体容量、选址、电网怎么接、有没有 AI 客户，所以这点先别太激动——钱到位了，工程细节还悬着。如果是真的，波浪能理论上比风电更稳定，但海上运维成本高、腐蚀问题大，目前没有成熟案例。缺的是技术验证和客户背书，得等后续披露。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

14:17

85d ago

FEATUREDr/LocalLLaMA· rssEN14:17 · 05·04

M3 Ultra 加 DGX Spark，能拼出一台 M5 Ultra-lite 吗？

Reddit 有人拿 DGX Spark 和 M3 Ultra 在 llama.cpp 里跑分，统一用 pp16384 上下文。Spark 比 M3 Ultra 快 1.4 到 3.4 倍，看模型：Qwen 27B 跑到 778 token/秒，M3 Ultra 是 340；Mistral 128B 跑到 241，M3 Ultra 只有 72。有个调参...

#Inference-opt#Tools#NVIDIA#Apple

精选理由

精选 · 重要度 73 · 吸引力 + 知识量 + 共鸣

一句话点评

DGX Spark 跑 Qwen 27B 飙到 778 token/秒，是 M3 Ultra 的 2.3 倍，但别急着下单，正文没提功耗和价格。

锐评

这条 Reddit 跑分对比挺直接：DGX Spark 在 llama.cpp 里统一用 pp16384 上下文，比 M3 Ultra 快 1.4 到 3.4 倍。Qwen 27B 跑到 778 token/秒，M3 Ultra 是 340；Mistral 128B 跑到 241，M3 Ultra 只有 72。差距在大模型上拉得更开，说明 Spark 的显存带宽或算力在处理大参数量时优势更明显。有个调参细节值得留意：把 mmap 关掉后，模型加载时间从几分钟降到约 20 秒。这对频繁切换模型的本地玩家是实打实的体验提升。不过我会先打个折。正文没披露测试时的功耗、整机价格和散热噪音，也没说 Spark 跑的是不是 FP16 还是量化版本。M3 Ultra 是苹果的芯片，架构和 Spark 的 Grace-Hopper 完全不同，直接比 token/秒只能说明推理快，不代表训练或微调也强。另外 Reddit 帖子被屏蔽了，原始数据没法交叉验证，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:58

85d ago

FEATUREDFT · 科技· rssEN13:58 · 05·04

黑石和高盛等出资 15 亿美元，跟 Anthropic 成立合资公司帮华尔街用 AI

FT 这篇报道正文被付费墙挡住了，只能看到标题和摘要。已知信息是：黑石、高盛等机构参与了一个 15 亿美元的合资项目，合作方是 Anthropic。这家合资公司会以咨询形式，帮华尔街机构在投资组合里部署 AI。但正文没披露股权结构、具体产品形态、时间表，也没说 Anthropic 的 Claude 模型会以什么方式嵌入业务流程。15 亿这个数字不小，说...

#Agent#Blackstone#Goldman Sachs#Anthropic

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

黑石和高盛联手 Anthropic 搞了个 15 亿美元的合资公司，但正文被付费墙挡了，股权、产品、时间表一概不知，先别太激动。

锐评

这条消息的核心是，黑石、高盛这些华尔街老钱，愿意掏出 15 亿美元和 Anthropic 成立合资公司，专门给金融机构当 AI 顾问。这说明顶级资管方开始认真考虑把 Claude 这类大模型塞进投资组合管理流程里了，不是玩票。但关键信息全在付费墙后面。我们不知道这 15 亿是现金、算力资源还是服务承诺，也不知道 Anthropic 是出技术还是出人。更关键的是，正文没披露合资公司的股权结构——是 Anthropic 占小股当技术供应商，还是深度绑定？产品形态也没说，是直接卖咨询项目，还是做成标准化的软件工具？对从业者来说，这条新闻的价值在于确认了“让模型进业务流程干活”在金融圈有了大额买单信号。但在看到具体落地案例和效果数据之前，这 15 亿更像是一张入场券，而不是成绩单。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:40

85d ago

r/LocalLLaMA· rssEN13:40 · 05·04

Qwen 3.6 27B 抓到一个 GPT 5.5 和 Claude Opus 4.7 都没发现的 bug

一位 Reddit 用户说，Qwen 3.6 27B 帮他找出一个关键 bug，而 Codex GPT 5.5 和 Claude Opus 4.7 都漏了。GPT 5.5 跑得快，但准确度不如 Qwen。帖子没贴代码、复现步骤，也没说测试了多少样本，所以这个结论只能当个参考，不能直接信。

#Code#Reasoning#Benchmarking#Qwen

一句话点评

一个用户说 Qwen 3.6 27B 找到了 GPT 5.5 和 Claude Opus 4.7 漏掉的 bug，但没贴代码和复现步骤，结论只能当个参考。

锐评

这条 Reddit 帖子的核心信息是：Qwen 3.6 27B 在找 bug 上赢了 GPT 5.5 和 Claude Opus 4.7。但帖子没贴代码、没给复现步骤，也没说测试了多少样本，所以这个结论的验证强度很低，只能当个用户 anecdote 看。如果这是真的，说明 27B 参数的小模型在特定代码调试场景下可能比大模型更准，但正文没披露具体是什么类型的 bug、是否涉及特定框架或语言，所以没法判断这个优势是否通用。另外，GPT 5.5 跑得快但准确度不如 Qwen，这点也值得注意——速度与精度的 trade-off 在代码任务上一直存在，但缺少样本量就无法量化这个差距。整体上，这条信息对从业者的价值在于提醒：不要迷信大模型，小模型在特定任务上可能更靠谱，但需要更多可复现的测试才能下结论。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

13:26

85d ago

r/LocalLLaMA· rssEN13:26 · 05·04

LLMSearchIndex：开源本地网页搜索库，已索引2亿网页，压缩后仅2GB

开发者 zakerytclarke 发布了 LLMSearchIndex，一个本地运行的网页搜索库，目前索引了超过2亿个网页，数据来自 FineWeb 和 Wikipedia。整个索引压缩后只有2GB左右，对本地部署很友好。它提供了一个 Python 接口，每次搜索返回 top_k=5 的结果。不过正文没披露召回率、搜索延迟和索引更新频率，所以实际检索...

#RAG#Tools#LLMSearchIndex#zakerytclarke

一句话点评

2亿网页索引压缩到2GB，本地跑RAG搜索的门槛大幅降低。

锐评

LLMSearchIndex 把 2 亿网页（来自 FineWeb 和 Wikipedia）压缩到约 2GB，本地就能跑 RAG 搜索，不用再依赖外挂资料库的云服务。对个人开发者或小团队来说，这个存储成本很低，2GB 随便一台机器都能放下。每次搜索返回 top_k=5 的结果，接口是 Python 的，接入简单。但正文没披露召回率和搜索延迟，所以实际检索质量要打个问号。2 亿网页听起来多，但 FineWeb 是通用爬虫数据，质量参差不齐，对垂直领域（比如医疗、法律）的覆盖可能不够。索引更新频率也没说，如果是静态索引，新闻类场景很快会过时。如果是真的，本地搜索+小模型组合能省不少 API 调用费，但验证前先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:00

85d ago

TechCrunch AI· rssEN13:00 · 05·04

DoorDash 上线三款 AI 工具：帮商家快速入驻、修菜品图、自动建站

DoorDash 本周一给商家端加了三个 AI 功能：一是加速入驻流程，二是用 AI 修菜品照片（让菜看起来更好吃），三是拿商家已有内容自动生成网站。正文没披露用了什么模型、怎么收费、以及哪些地区先上线。对平台来说，这套工具能降低商家上线门槛，尤其是那些没精力自己拍照或做网站的小店。但对 AI 从业者而言，信息量有限——没有模型选型、成本或效果数据，暂...

#Multimodal#Vision#Tools#DoorDash

一句话点评

DoorDash 给商家上了三个 AI 工具：加速入驻、修菜品照片、自动建站。但没提模型、成本或上线范围，信息量有限。

锐评

DoorDash 本周一给商家端加了三个 AI 功能：一是加速入驻流程，二是用 AI 修菜品照片（让菜看起来更好吃），三是拿商家已有内容自动生成网站。对平台来说，这套工具能降低商家上线门槛，尤其是那些没精力自己拍照或做网站的小店。但对 AI 从业者而言，信息量有限——正文没披露用了什么模型、怎么收费、以及哪些地区先上线。没有模型选型、成本或效果数据，暂时只能当产品动态看，技术参考价值不高。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

12:54

85d ago

r/LocalLLaMA· rssEN12:54 · 05·04

llama.cpp 的 MTP 支持进入 Beta，先覆盖 Qwen3.5

llama.cpp 把 MTP（多 token 预测）功能推进到 Beta 阶段，目前只支持 Qwen3.5 的 MTP 头。MTP 能让模型一次预测多个 token，理论上推理更快。但正文没披露吞吐量、延迟或合并日期，所以实际提速多少还不清楚。值得关注的是，如果 MTP 配合 tensor parallel（张量并行）能缩小与 vLLM 的 toke...

#Inference-opt#llama.cpp#Qwen#vLLM

一句话点评

llama.cpp 的 MTP 进入 Beta，但实际提速未知。

锐评

llama.cpp 把多 token 预测（MTP）推进到 Beta，目前只支持 Qwen3.5 的 MTP 头。MTP 让模型一次预测多个 token，理论上能加快推理。但正文没披露吞吐量、延迟或合并日期，所以实际提速多少还不清楚。值得关注的是，如果 MTP 配合张量并行能缩小与 vLLM 的 token 生成速度差距，那对本地部署是好事。不过目前信息缺口大，建议等实测数据再下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:54

85d ago

r/LocalLLaMA· rssEN12:54 · 05·04

LocalVQE 发布实时音频降噪演示，模型仅 1M 参数

LocalVQE 在 Reddit 上放了一个实时回声和噪声消除的演示，模型只有约 100 万参数，非常小。演示链接指向 Hugging Face Space，但正文没披露延迟、采样率、训练数据或硬件条件，所以实际效果和部署门槛还不清楚。

#Audio#Inference-opt#LocalVQE#LocalAI

一句话点评

100万参数就能实时消回声和噪声，部署门槛很低，但延迟和硬件要求没提，先别太激动。

锐评

LocalVQE 放出了一个实时回声和噪声消除的演示，模型只有约 100 万参数，小到可以在低算力设备上跑。这个规模意味着部署成本极低，甚至可能塞进耳机或 IoT 芯片。但正文没披露关键指标：延迟是多少毫秒、采样率能否覆盖语音频段、训练数据是合成还是真实场景、跑在什么硬件上。如果延迟超过 20ms 或采样率只有 8kHz，实际通话场景就不好用。Hugging Face Space 的演示环境通常有 GPU，不能直接代表边缘设备表现。值得关注的是，这类小模型如果真能做到实时且质量可用，会大幅降低语音前处理的部署门槛，但信息缺口太大，目前只能算一个技术预告。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

12:49

85d ago

Sinocism · 比尔·毕晓普· rssEN12:49 · 05·04

三角关系与卡脖子：中国精英圈怎么聊AI安全与经济安全

Sinification 四月报告梳理了中美欧关系、资源安全与AI安全审查。AI部分提了三件事：复旦赵明浩谈中国AI公司面临的安全审查；蔡昉聊AI替代就业与全民基本收入（UBI）；曹和平提数据入股收入。核心信号是：AI在中国讨论里已经从产业政策变成了经济安全议题，不光是技术怎么追，而是怎么防风险、保就业、分收益。正文没披露具体审查案例或UBI试点细节。

#Safety#Sinification#Zhao Minghao#Cai Fang

一句话点评

AI在中国讨论里已经从产业政策变成了经济安全议题，不光是技术怎么追，而是怎么防风险、保就业、分收益。

锐评

Sinification 四月报告把 AI 放进了经济安全框架，而不是产业追赶。复旦赵明浩提了中国 AI 公司面临的安全审查，蔡昉聊 AI 替代就业和全民基本收入（UBI），曹和平说数据入股收入。核心信号：AI 讨论从“怎么追”转向“怎么防风险、保就业、分收益”。但正文没披露具体审查案例或 UBI 试点细节，这点先别太激动。报告来源是 Sinocism，属于政策评论类，不是一手调研，权威性中等。缺的是：审查到底卡在哪类公司（大模型还是应用层？），UBI 有没有地方试点，数据入股怎么分账。如果这些落地，才是真信号。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

12:32

85d ago

● P1Import AI· rssEN12:32 · 05·04

AI 研究即将全自动：Jack Clark 预测 2028 年底前，AI 自己造自己的概率超过六成

Jack Clark 根据公开数据做了一个判断：到 2028 年底，不需要人类插手的 AI 研发有超过 60% 的概率会出现。他主要拿两个指标说事。一个是 SWE-Bench，这个测试看 AI 能不能解决 GitHub 上的真实代码问题，Claude 2 当初得分大概 2%，现在 Claude Mythos Preview 已经干到 93.9%，基本把...

#Agent#Code#Benchmarking#Jack Clark

精选理由

精选 · 重要度 88 · 吸引力 + 知识量 + 共鸣

一句话点评

Jack Clark 用公开数据推演：到 2028 年底，AI 自己搞研发的概率超六成。他拿 SWE-Bench 和 METR 任务时长两条线交叉验证，趋势很硬，但前提是算力管够。

锐评

Jack Clark 这篇不是论文，是他自己看了一堆公开数据后做的推演。核心判断很直白：AI 自己搞研发，2028 年底前发生的概率超过 60%。他主要抓了两个指标。一个是 SWE-Bench，测 AI 解决 GitHub 真实代码问题的能力，Claude 2 当初得分约 2%，现在 Claude Mythos Preview 已经干到 93.9%，基本把题库刷穿了。另一个是 METR 的任务时长，看 AI 能稳定完成多复杂的活，从 2022 年 GPT-3.5 的 30 秒，一路涨到 2026 年 Opus 4.6 的约 12 小时，METR 的人甚至觉得年底摸到 100 小时不奇怪。这两个趋势合在一起，说明 AI 写代码和长时间干活的能力都在猛涨，工程层面的自动化拼图快齐了。但 Clark 自己也留了余地：前沿大模型的训练太贵，需要一堆人拼命调，短期内还很难完全甩开人类。正文没给出具体的成本模型或实验验证，更多是趋势外推。我会先打个折：代码能力饱和不等于研究能力到位，从“会写代码”到“能提出新研究方向”中间还隔着创造力这道坎。另外，METR 的任务时长测的是人类标注的通用任务，不是真实的 AI 研发流程，直接套用有水分。这篇最值钱的地方是把散落各处的公开数据点串成了一条清晰的趋势线，但结论本身还缺一次真正的端到端实验来撑腰。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

11:57

85d ago

r/LocalLLaMA· rssEN11:57 · 05·04

TinyMozart v2 85M：一个85M参数的音乐生成小模型，能写和弦和长曲了

LH-Tech_AI 发了 TinyMozart v2，85M 参数，比 v1 多了和弦、长度控制等功能。模型很小，本地跑得动，但正文没披露训练数据、许可证和评测结果，所以实际效果和合规性都不清楚。Hugging Face 链接给了，想试可以自己去看看。

#Audio#LH-Tech_AI#TinyMozart#Hugging Face

一句话点评

85M参数的音乐生成模型，本地能跑，但没披露训练数据和许可证。

锐评

TinyMozart v2 是一个85M参数的音乐生成模型，比v1多了和弦和长度控制。85M意味着它可以在普通消费级GPU上本地运行，对个人开发者友好。但正文没披露训练数据来源、许可证类型和任何评测结果，所以实际生成质量、版权合规性、是否跑调都不清楚。想尝鲜可以去Hugging Face链接自己试，但别直接商用。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

11:09

85d ago

FEATUREDr/LocalLLaMA· rssEN11:09 · 05·04

用 Hermes Agent 和 qwen3.6-35b 在本地跑深度研究，生成了 21 页报告

一位 Reddit 用户用 Hermes Agent 框架搭配 qwen3.6-35b-a3b 的 Q6_K 量化版，在单张 RTX 4060 上跑了 6 轮循环、超过 5 小时，生成了一份 21 页的研究报告。生成速度约每秒 28 个 token。仓库里放了提示词、脚本、中间产物和最终报告。正文没披露报告具体主题和结论质量，也没说这 5 小时里人工干...

#Agent#Tools#Code#Hermes Agent

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

单卡 4060 跑 5 小时生成 21 页报告，每秒 28 token，但正文没给报告主题和结论质量，先别太激动。

锐评

这条分享的价值在于把“本地跑深度研究”的成本和门槛摆出来了：一张 RTX 4060 消费级显卡，用 Hermes Agent 框架搭 qwen3.6-35b-a3b 的 Q6_K 量化版，6 轮循环、超过 5 小时，生成一份 21 页报告，速度约每秒 28 个 token。作者把提示词、脚本和中间产物都放进了仓库，对想复现的人比较友好。但正文没披露报告的具体主题，也没说结论靠不靠谱。5 小时里人工干了多少活、中间需不需要手动纠偏，这些都没提。每秒 28 token 的速度在本地跑 35B 模型算正常，但放到“深度研究”场景里，意味着出结果要等很久，实际用起来会有点磨人。还缺两个关键信息：一是报告质量有没有经过人工核对，二是这套流程能不能稳定复现。如果只是跑通了一次，参考价值就打折扣。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

10:12

85d ago

r/LocalLLaMA· rssEN10:12 · 05·04

Gemma 4 的 GGUF 聊天模板修了，赶紧更新你的模型文件

Reddit 用户提醒，Gemma 4 的 GGUF 聊天模板几天前修了一个 bug，现在需要重新下载。帖子列了 8 个 Hugging Face 链接，覆盖 31B、26B-A4B、E4B 和 E2B 这几个尺寸，来自 bartowski 和 unsloth。正文没披露具体修了什么、量化参数有没有变，所以如果你之前下载的版本对话格式不对，更新一下应该...

#Inference-opt#Google#Hugging Face#Unsloth

一句话点评

Gemma 4 的 GGUF 聊天模板修了个 bug，得重新下载。

锐评

Reddit 用户提醒，Gemma 4 的 GGUF 文件几天前修了聊天模板 bug，现在需要重新下载。帖子给了 8 个 Hugging Face 链接，覆盖 31B、26B-A4B、E4B 和 E2B 四个尺寸，来自 bartowski 和 unsloth 两个社区常用账号。关键信息：这是 GGUF 格式的 bug 修复，不是模型权重更新，所以只影响本地推理用户。如果你之前下载的版本对话格式不对（比如输出乱码或格式错乱），更新一下应该能解决。正文没披露具体修了什么、量化参数有没有变，也没说修复前后的差异。所以如果你之前用着没问题，可以等社区反馈再更新。如果是刚下载的，建议直接拿新版。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

10:10

85d ago

r/LocalLLaMA· rssEN10:10 · 05·04

NVFP4 模型往 CPU 卸载后速度暴跌：从 50 tok/s 掉到 14 tok/s

一个 Reddit 用户在 RTX 5070 上跑 Qwen3.6 35B A3B Q4_K_XL，纯 GPU 推理大约 50 tok/s。换成 Blackwell 架构的 NVFP4 格式并往 CPU 卸载后，速度掉到只有 14 tok/s，慢了将近四倍。帖子没交代具体卸载了多少层、用的什么后端、batch size 多大，所以这个差距到底是因为 N...

#Inference-opt#Qwen#NVIDIA#Reddit

一句话点评

NVFP4 卸载到 CPU 后速度掉到 14 tok/s，比纯 GPU 慢近四倍。

锐评

一个 Reddit 用户在 RTX 5070 上跑 Qwen3.6 35B A3B 的 Q4_K_XL 量化版，纯 GPU 推理约 50 tok/s。换成 Blackwell 架构的 NVFP4 格式并往 CPU 卸载后，速度掉到 14 tok/s，慢了将近四倍。NVFP4 是 NVIDIA 新推的 4 位浮点格式，理论上显存占用更低，但卸载到 CPU 后内存带宽瓶颈暴露无遗。帖子没交代卸载了多少层、用的什么后端、batch size 多大，所以这个差距到底是因为 NVFP4 本身效率差、还是卸载策略太粗糙，目前没法判断。如果是真的，说明 Blackwell 的 NVFP4 在显存不足时并不适合做 CPU 卸载，至少当前实现下性能损失太大。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

全部 · 2026-05-04

更多

频道

后台