ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-04-29 · 星期三2026年4月29日
12:43
46d ago
Hacker News 首页· rssEN12:43 · 04·29
让AI替我玩游戏:搭了个自动化测试架子
独立游戏开发者Jeff Schomay写了个测试工具,让AI替他跑游戏流程,省去手动反复试玩的功夫。思路是搭一个“智能测试架”,让AI像玩家一样操作游戏,自动发现bug或平衡性问题。不过正文没披露用了哪个模型、具体工具链,也没说评估效果如何——所以这个方案到底省不省事、靠不靠谱,目前还不好判断。
#Agent#Tools#Jeff Schomay#Hacker News
精选理由
HKR-H 和 HKR-R 通过:第一人称用 agent 做游戏试玩测试,跟 agent QA 场景直接相关。HKR-K 不通过:RSS 没披露模型、工具链、指标或复现细节,信息缺口太大。
一句话点评
让AI替自己跑游戏测试,想法不错,但正文没披露用了哪个模型、效果如何,先别太激动。
锐评
独立游戏开发者Jeff Schomay写了个智能测试架,让AI像玩家一样操作他的游戏,自动跑流程找bug和平衡性问题。思路很直接:省去手动反复试玩的功夫。但正文被Vercel挡了,关键信息全缺——没披露用了哪个模型、具体工具链,也没说评估效果。所以这个方案到底省不省事、靠不靠谱,目前不好判断。如果真能跑通,对独立开发者是个低成本测试手段;但AI在复杂游戏里容易卡壳、乱点,实际效果可能打折扣。缺实测数据前,建议当思路参考,别直接抄作业。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
12:38
46d ago
Hacker News 首页· rssEN12:38 · 04·29
让AI算碳水,问了27000次,每次答案都不一样
一位糖尿病患者让AI帮他估算每餐的碳水化合物含量,重复测试了27000次,结果没有两次答案是一样的。这意味着如果你靠AI算胰岛素剂量,每次得到的数字都可能不同,对需要精确控糖的人来说风险很大。文章没有披露用的是哪个模型、输入了什么食物图片或文字、误差具体有多大,也没说是否控制了温度、光线等变量。所以这个结论目前只能说明“AI在碳水估算上不稳定”,但到底...
#Vision#Benchmarking#Benchmark#Commentary
精选理由
H和R都成立:27000次重复测试且无重复答案,这个数字有传播力,也直接戳中AI在健康场景的可靠性痛点。K不成立是因为正文几乎没给技术细节——模型、输入、误差分布全没披露,只能当个现象看,没法做判断。整体在60-71区间合理。
一句话点评
测了27000次,AI算碳水没一次重复,控糖别信它。
锐评
一位糖尿病患者让AI帮他估算每餐的碳水化合物含量,重复测试了27000次,结果没有两次答案是一样的。这意味着如果你靠AI算胰岛素剂量,每次得到的数字都可能不同,对需要精确控糖的人来说风险很大。文章没有披露用的是哪个模型、输入了什么食物图片或文字、误差具体有多大,也没说是否控制了温度、光线等变量。所以这个结论目前只能说明“AI在碳水估算上不稳定”,但到底差多少、什么场景下更差,正文没披露。对AI从业者来说,这个测试的警示在于:视觉模型在定量任务上的重复性远低于分类任务,而医疗场景对重复性的要求极高。如果要做类似应用,必须先做重复性基准测试,并设计输出置信区间。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
12:27
46d ago
r/LocalLLaMA· rssEN12:27 · 04·29
llama.cpp 新版本在 RTX 5090 上让大模型预填充速度翻倍,但生成速度没变
Reddit 用户实测了 llama.cpp 两个版本(b8966 和 b8967)在 RTX 5090 上跑 Qwen3.6-27B-NVFP4 模型。新版本加了原生 NVFP4 支持,预填充(模型读入长提示词、处理上下文)速度提升了 43% 到 68%,平均约 57%。但生成速度(逐字输出)基本没变,稳定在 70–74 tokens/秒。这意味着如...
#Inference-opt#Benchmarking#RAG#llama.cpp
精选理由
一条 Reddit 用户发的单机 benchmark,只测了 RTX 5090 和 Qwen3.6-27B-NVFP4 在两个 llama.cpp 版本上的表现。预填充加速明显,但生成吞吐几乎没区别,说明 NVFP4 的价值主要在首 token 延迟,不是续写速度。对搞本地推理和 RAG 预处理的人有参考价值,但样本单一,行业影响有限。
一句话点评
预填充快了近六成,但生成速度没变,适合长文档和RAG场景。
锐评
Reddit 用户实测 llama.cpp 新版本 b8967 在 RTX 5090 上跑 Qwen3.6-27B-NVFP4,原生 NVFP4 支持让预填充(模型读入长提示词、处理上下文)速度提升 43% 到 68%,平均约 57%。但生成速度(逐字输出)基本没变,稳定在 70–74 tokens/秒。这意味着如果你做长文档分析、RAG(外挂资料库)或代码审查,首字延迟会明显降低;但日常聊天生成速度没区别。测试平台是 RTX 5090 + Ryzen 9 9950X3D + 128GB DDR5,单卡单用户场景,未披露多卡或服务端吞吐表现。上下文拉到 32K 时预填充加速仍达 43%,但生成速度仅下降 9%,说明 Blackwell 架构的长上下文稳定性不错。正文没披露功耗和显存占用变化,也没对比其他量化格式(如 FP8、INT4)。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
12:18
46d ago
r/LocalLLaMA· rssEN12:18 · 04·29
Qwen 发布 FlashQLA:线性注意力核,前向快 2-3 倍,专为边缘设备和长文本设计
Qwen 开源了 FlashQLA,一套基于 TileLang 的高性能线性注意力核。官方数据是前向推理快 2-3 倍,反向传播快 2 倍以上。核心思路是把原本一个完整的 GDN 流程拆成两个核,分别优化计算并行和反向效率。虽然大 batch 时会比全融合方案多读几次显存,但在边缘设备(比如手机、笔记本)和长文本场景下实际表现更好。反向传播是难点,他们...
#Inference-opt#Agent#Qwen#TileLang
精选理由
HKR全过:前向2-3倍加速和端侧代理是明确的点击钩子。评分留在all,因为来源是Reddit截图,正文没披露硬件、模型规模和完整基准。
一句话点评
Qwen 开源了 FlashQLA,一套针对边缘设备和长文本场景优化的线性注意力核,前向快 2-3 倍,反向快 2 倍以上。
锐评
Qwen 开源了 FlashQLA,一套基于 TileLang 的高性能线性注意力核。官方数据是前向推理快 2-3 倍,反向传播快 2 倍以上。核心思路是把原本一个完整的 GDN 流程拆成两个核,分别优化计算并行和反向效率。虽然大 batch 时会比全融合方案多读几次显存,但在边缘设备(比如手机、笔记本)和长文本场景下实际表现更好。反向传播是难点,他们用 16 级流水线在极紧的片上内存限制下做到了 2 倍加速。 不过正文没披露测试用的硬件、模型大小和完整 benchmark,所以 2-3 倍这个数字得先打个折——可能是在小模型或特定长序列下测的。对跑本地 agent 或小模型的人来说,这个方向是对的:长文本推理的瓶颈在注意力,FlashQLA 拆核策略在显存受限设备上比全融合更灵活。但如果你用大 batch 做服务端推理,这个方案反而可能因为多读显存而变慢。代码已开源,可以自己跑跑看。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
12:18
46d ago
彭博科技· rssEN12:18 · 04·29
寒武纪一季度营收翻倍,股价涨14%
寒武纪一季度营收翻倍,股价在A股涨了14%。背后是北京推芯片自主,国产AI芯片需求猛增。但正文没披露具体营收数字、卖的是哪款芯片、客户是谁,所以这个“翻倍”到底多大体量、利润如何,暂时没法判断。
#Inference-opt#Cambricon Technologies#Bloomberg#Beijing
精选理由
股价涨14%和一季度销售额翻倍以上是硬事实,市场反应和增长趋势都清楚。但正文没披露具体营收、芯片型号或客户名单,信息深度不够,所以不上精选。
一句话点评
寒武纪一季度营收翻倍,股价涨14%,但没披露具体数字和客户。
锐评
寒武纪一季度营收翻倍,股价在A股涨了14%,背后是北京推芯片自主,国产AI芯片需求猛增。但正文没披露具体营收数字、卖的是哪款芯片、客户是谁,所以这个“翻倍”到底多大体量、利润如何,暂时没法判断。如果基数低,翻倍也不代表规模。另外,寒武纪之前主要靠政府项目,这次增长是来自互联网客户还是继续吃政策饭,正文没说。对从业者来说,这条消息的信号是国产推理芯片确实有需求,但寒武纪能否持续放量、毛利率是否改善,还得等财报细节。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
11:42
46d ago
Hacker News 首页· rssEN11:42 · 04·29
HashiCorp 联合创始人:GitHub 已不适合正经干活
HashiCorp 联合创始人 Mitchell Hashimoto 公开批评 GitHub 频繁宕机,称其“不再适合正经工作”,并决定把自己的终端模拟器项目 Ghostty 迁出 GitHub。正文没披露具体迁移目标平台、受影响项目范围以及迁移时间表。对于依赖 GitHub 做 CI/CD 或代码托管的团队,这个表态值得留意——但 Hashimoto...
#Code#HashiCorp#GitHub#Mitchell Hashimoto
精选理由
H 和 R 都成立:一个行业里有影响力的人直接攻击 GitHub,而且平台信任是开发者的真实痛点。K 不成立,因为只有片段,没有证据或机制说明为什么不适合严肃工作,跟 AI 行业的关联也很弱。
一句话点评
HashiCorp 联合创始人 Mitchell Hashimoto 公开批评 GitHub 频繁宕机,决定把自己的终端模拟器项目 Ghostty 迁走。
锐评
Mitchell Hashimoto 说 GitHub '不再适合正经工作',理由是宕机太频繁。他决定把个人项目 Ghostty 迁出,但正文没披露具体迁移目标平台、受影响项目范围以及迁移时间表。对于依赖 GitHub 做 CI/CD 或代码托管的团队,这个表态值得留意——但 Hashimoto 的抱怨更多是个人体验,不代表 GitHub 对所有用户都不可靠。缺的是宕机频率的具体数据、对 Ghostty 开发流程的实际影响,以及他打算迁到哪。这点先别太激动,等更多细节出来再判断是否值得跟风。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
10:56
46d ago
r/LocalLLaMA· rssEN10:56 · 04·29
怎么客观判断自己写的 agent 工具好不好用?
一个 Reddit 用户在本地跑 Qwen3.6-35B-A3B 的 pi agent,发现同一个文件被 cat 读了 3-4 次。换了个工具后调用次数少了,体感更快。但正文没披露任何 benchmark、任务集或成功率,所以这还只是主观感受,不是客观结论。核心问题是:agent 工具好不好,不能靠一次感觉判断。
#Agent#Tools#Benchmarking#Qwen
精选理由
HKR-H 和 HKR-R 通过:帖子用本地 Qwen3.6-35B-A3B 和重复文件读取,抓住了 agent 工具评测的真实痛点。HKR-K 不通过:任务、对照组、延迟和成功率均未披露。
一句话点评
工具好不好,不能靠一次感觉判断。
锐评
一个 Reddit 用户在本地跑 Qwen3.6-35B-A3B 的 pi agent,发现同一个文件被 cat 读了 3-4 次。换了个工具后调用次数少了,体感更快。但正文没披露任何 benchmark、任务集或成功率,所以这还只是主观感受,不是客观结论。核心问题是:agent 工具好不好,不能靠一次感觉判断。缺少可复现的测试集和成功率对比,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
10:34
46d ago
r/LocalLLaMA· rssEN10:34 · 04·29
Qwen 9B/27B/35B 联网搜索总给错事实?一个 Reddit 用户分享的修复流程
一个 Reddit 用户分享了一套针对 Qwen 9B、27B 和 35B 模型的联网搜索工作流,核心是强制要求模型必须引用两个独立且发布于 2024 年之后的来源。流程里用了 searXNG 做聚合搜索,搭配 Firecrawl、Jina 或 fetch 抓取页面,同时把提示词控制在 1000 字符以内。发帖人说这样改完,单次查询的结果更稳定了。不过...
#Agent#RAG#Tools#Qwen
精选理由
HKR 三项都过:一个具体的 Qwen 联网搜索修正流程,但证据只有单次查询示例,没有对照组、任务集或重复次数。这属于 60–71 分区间,算一条有用的开源 RAG 工作流技巧。
一句话点评
一个 Reddit 用户分享的 Qwen 联网搜索工作流,强制引用两个 2024 年后独立来源,用 searXNG 聚合搜索加 Firecrawl 抓取,提示词控制在 1000 字符内。
锐评
这个工作流的核心是强制模型引用两个独立且较新的来源,避免 Qwen 在联网搜索时瞎编事实。发帖人说单次查询更稳定了,但没披露重复测试次数,这点先别太激动。用 searXNG 做聚合搜索、Firecrawl 或 Jina 抓页面,提示词压到 1000 字符以内——这些细节对跑本地模型的人有参考价值。不过正文被 Reddit 屏蔽了,具体提示词模板和失败案例都没看到。如果真能稳定减少幻觉,对 9B-35B 这种小模型挺实用,但验证强度不够,建议自己跑 50 次以上再信。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
09:00
46d ago
最佳拍档· atomZH09:00 · 04·29
罗福莉:两年内实现AGI,小米MiMo-V2和OpenClaw是关键
小米大模型负责人罗福莉在访谈中称AGI两年内可实现,并提及MiMo-V2和OpenClaw的颠覆性。但正文未披露任何证据、算力卡配置、团队模式或完整访谈细节,无法验证其判断依据。
#Reasoning#Code#Luo Fuli#Xiaomi
精选理由
HKR-H和HKR-R通过:罗福莉、小米模型和“两年内AGI”制造了紧张感。HKR-K不通过:正文为空,OpenClaw、MiMo-V2、算力配比和团队模式均无法核实。
一句话点评
罗福莉说AGI两年内能成,但正文一个字都没给,先打个折。
锐评
小米大模型负责人罗福莉在访谈中放话:AGI两年内可实现,并提到MiMo-V2和OpenClaw有颠覆性。但正文完全缺失,没有披露任何证据、算力卡配置、团队模式或完整访谈细节。关键数字为零——不知道用了多少卡、训练成本多低、样本多省、延迟多高。OpenClaw具体怎么颠覆?MiMo-V2的强泛化性靠什么验证?团队模式独特在哪?全没写。这条信息目前只有标题和标签,判断依据无法核实。建议等完整访谈或论文出来再认真看,现在只能当个观点听,别当事实用。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
08:31
46d ago
r/LocalLLaMA· rssEN08:31 · 04·29
llama.cpp 在 Blackwell 上原生支持 NVFP4 精度推理
llama.cpp 从 b8967 版本开始,原生支持 NVIDIA Blackwell 架构的 NVFP4 精度推理。NVFP4 是一种 4 位浮点格式,相比传统 4 位整数量化,能在保持更高精度的同时降低显存占用和带宽需求。不过,正文只贴了 GitHub 发布链接和截图,没有披露任何基准测试、支持哪些模型、以及需要什么编译选项。所以,目前只能确认代...
#Inference-opt#llama.cpp#NVIDIA#Product update
精选理由
HKR 三关都过,算一条有用的 llama.cpp 推理更新。正文只贴了 GitHub release 链接和截图,没有跑分、模型范围或复现条件,所以分数压在 60–71 区间。
一句话点评
llama.cpp 开始原生支持 Blackwell 的 NVFP4 精度推理,但正文没给任何跑分或模型列表。
锐评
llama.cpp 在 b8967 版本里直接支持了 NVIDIA Blackwell 的 NVFP4 精度推理。NVFP4 是一种 4 位浮点格式,相比常见的 4 位整数量化(如 INT4),理论上能在同等显存占用下保留更多精度,尤其适合大模型推理时减少带宽压力。但这条消息目前只有一张截图和一个 GitHub 发布链接,没有披露任何基准测试数据、支持哪些模型、需要什么编译选项。所以,能确认的只是代码层面已经合入,实际效果——比如速度、精度损失、显存节省——全是未知数。如果你手头有 Blackwell 卡,可以自己编译试试,否则先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
06:16
46d ago
r/LocalLLaMA· rssEN06:16 · 04·29
一个小模型自己写了个游戏,还自己玩了起来
Reddit 用户展示了一个超小本地模型,它自己写了一个游戏,然后自己玩了起来。帖子说它很快打到了 10 分,5 分后场地形状会变。但正文没披露模型名字、参数量、跑在什么硬件上,所以这个“小”到底多小、速度多快,目前只能打个问号。
#Agent#Code#DominusIniquitatis#LocalLLaMA
精选理由
HKR-H和HKR-R勉强成立,但HKR-K太弱:没有模型名、参数量、硬件或复现步骤。这是LocalLLaMA板块的展示帖,够不上精选线。
一句话点评
小模型自己写游戏自己玩,挺酷,但没披露模型名和硬件,先别太激动。
锐评
Reddit 用户 DominusIniquitatis 展示了一个超小本地模型,它自己写了一个游戏并自己玩了起来。帖子称它很快打到 10 分,5 分后场地形状会变。亮点是“自写自玩”的闭环能力,说明小模型在代码生成和自主执行上已有一定水平,对本地部署和低成本推理是个积极信号。但正文没披露模型名字、参数量、跑在什么硬件上,所以“小”到底多小、速度多快,目前只能打个问号。如果真是 1B 以下模型在普通笔记本上跑出这个效果,那对边缘设备很有价值;但如果是 7B 模型在高端 GPU 上跑,那就不算稀奇。另外,游戏逻辑简单,不能直接类比复杂任务。缺的是可复现的基准测试和对比数据,比如生成耗时、代码正确率、与同类模型的对比。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
05:40
46d ago
r/LocalLLaMA· rssEN05:40 · 04·29
Gemma 4 的聊天模板有个 bug,工具调用时参数类型字段会变空
Reddit 用户发现 Gemma 4 的聊天模板在处理 `anyOf: [$ref, null]` 这类工具参数时,会把 `type` 字段渲染成空字符串。同一个提示词和 MCP 工具在超过 3 个推理引擎上都报错,而 Qwen3.5 和 gpt-oss-20b 能正常跑。作者已经给 Hugging Face 提了 PR 修 `google/gemm...
#Agent#Tools#Code#Google
精选理由
HKR 三项都过,但波及面窄:一个 Reddit 来源的 Gemma 4 工具模板修复帖,有复现细节和 PR,不是上游发布或广泛事故。
一句话点评
Gemma 4 工具调用模板有 bug,修了就能用。
锐评
Reddit 用户发现 Gemma 4 的聊天模板在处理 `anyOf: [$ref, null]` 这类工具参数时,会把 `type` 字段渲染成空字符串,导致工具调用失败。同一个提示词和 MCP 工具在超过 3 个推理引擎上都报错,而 Qwen3.5 和 gpt-oss-20b 能正常跑——说明问题出在 Gemma 4 的模板实现,不是通用协议问题。作者已经给 Hugging Face 提了 PR 修 `google/gemma-4-31B-it`,并分享了一个临时 Jinja 模板。正文被 Reddit 屏蔽,没披露具体报错日志或测试用例,但用户能直接拿临时模板绕过。对用 Gemma 4 做 agent 或工具调用的团队,这是个低成本修复——改一行模板就行,不用重训模型。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:24
46d ago
r/LocalLLaMA· rssEN05:24 · 04·29
MiMo-V2.5-GGUF 预览版发布,Q4_K_M 的 NaN 问题已修
AesSedai 放出了 MiMo-V2.5 的 GGUF 量化预览版,同时给 llama.cpp 提了一个 PR,让这个项目能跑 V2.5 的纯文本推理。目前 Hugging Face 上已经有 Q8_0 和针对 MoE 优化的量化版本,之前 Q4_K_M 版本出现的 NaN 错误也标了已修复。正文没披露具体修复细节和性能对比,但至少社区能先上手试了。
#Inference-opt#AesSedai#llama.cpp#Hugging Face
精选理由
这条信息对本地推理用户有用:AesSedai 放出了 MiMo V2.5 的 GGUF 量化预览,同时给 llama.cpp 提了个 PR 支持文本推理。Hugging Face 上已经能下 Q8_0 和 MoE 优化版,之前 Q4_K_M 出 NAN 的问题也说修了。但来源是 Reddit 上的预览,信息量偏窄,没有跑分或实测对比,正文也没披露具体修复细节和性能提升幅度,所以不值得上推荐位。
一句话点评
MiMo-V2.5 的 GGUF 量化版来了,社区能先跑纯文本推理了。
锐评
AesSedai 放出了 MiMo-V2.5 的 GGUF 量化预览版,同时给 llama.cpp 提了一个 PR,让这个项目能跑 V2.5 的纯文本推理。目前 Hugging Face 上已经有 Q8_0 和针对 MoE 优化的量化版本,之前 Q4_K_M 版本出现的 NaN 错误也标了已修复。正文没披露具体修复细节和性能对比,但至少社区能先上手试了。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
05:04
46d ago
r/LocalLLaMA· rssEN05:04 · 04·29
Hipfire 开发更新:即将全面验证 AMD 架构(RDNA 1 到 4,含 Strix Halo 和 bc250)
Hipfire 本地开发实验室新增了 MS-S1 MAX 和 R9700 两台机器,用来做 AMD 显卡的兼容性验证。帖子列了六个 AMD 目标,按是否支持 dp4a、WMMA、iGPU+WMMA 以及 RDNA 4 分档。正文没披露任何推理性能数据,所以实际跑起来快不快、显存够不够用,目前都还不知道。
#Inference-opt#AMD#Hipfire#schuttdev
精选理由
HKR 三项都过:钩子是 AMD 全架构覆盖,信息点有具体设备列表和型号,相关性打在本地推理的 AMD 支持和 NVIDIA 成本痛点上。但正文没给 Hipfire 的速度、稳定性或复现结果,所以分数压在 60–71 区间。
一句话点评
Hipfire 开始认真测 AMD 全系显卡兼容性,但没给任何跑分,先别激动。
锐评
Hipfire 在本地实验室加了两台新机器(MS-S1 MAX 和 R9700),专门验证 AMD 显卡的兼容性。目标覆盖 RDNA 1 到 4,包括 Strix Halo 和 bc250,按是否支持 dp4a、WMMA、iGPU+WMMA 分档。这至少说明开发者愿意为 AMD 用户做适配,不是只盯着 NVIDIA。但正文没披露任何推理性能数据——跑得快不快、显存够不够用、跟同级别 NVIDIA 比差多少,全不知道。所以这条消息的价值在于“有人开始干活了”,而不是“AMD 已经能打了”。如果后续能放出延迟和吞吐量对比,才值得认真看。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
05:00
46d ago
FT · 科技· rssEN05:00 · 04·29
中国发改委与Meta就AI监管陷入僵局
FT报道称,中国国家发改委(一个源自毛泽东时代的机构)正在成为北京在AI领域的主要执法者,并与Meta形成对峙。文章标题直接点出这场僵局,但正文被付费墙挡住,没有披露具体规则、处罚措施、时间线或Meta的立场。信息缺口很明显:我们不知道发改委到底要管什么、怎么罚、Meta在争什么。
#National Development and Reform Commission#Meta#Financial Times#Policy
精选理由
H和R通过:FT把中国发改委和Meta的AI对峙框成政策风险事件,有传播价值。K不通过:只有摘要,没有规则原文、处罚细节、时间线或Meta立场,信息不够支撑判断。
一句话点评
FT爆料发改委成AI执法主力,但全文被付费墙挡住,具体规则和Meta立场都没披露。
锐评
FT这篇报道标题很猛——说中国发改委(一个源自毛泽东时代的机构)正在成为AI领域的主要执法者,并且和Meta形成了对峙。但正文被付费墙完全挡住,信息缺口非常明显:我们不知道发改委到底要管什么(模型备案?数据跨境?算力分配?),处罚措施是什么,时间线如何,Meta在争什么。 这点先别太激动。FT的报道通常有信源,但标题的“僵局”可能更多是外交辞令,不一定是实质性冲突。目前能确认的只有:发改委确实在AI监管中角色上升,Meta在中国有合规压力。但具体规则、处罚力度、Meta的应对策略,正文都没披露。 对从业者来说,这条新闻的价值在于信号:中国AI监管的执行主体可能正在从网信办向发改委倾斜,后者更懂产业和经济杠杆。但缺细节之前,别据此调整合规策略。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
04:49
46d ago
X · @dotey(宝玉)· x-apiZH04:49 · 04·29
真实模糊背景 + 霓虹线稿插画的提示词模板
Amira 分享了一套提示词模板,用来生成“真实模糊摄影背景 + 霓虹线稿主体”的混合风格图。模板里填了具体例子:主体是开心的兔子,拿着粉色气球,背景是清晨阳光下的植物园小径,周围有野花、绿叶、开花的树。效果是背景像真实照片(有阳光、虚化、自然元素),主体却是发白光的加粗霓虹线条简笔画,脚下发光鞋子还轻轻碰着地面,画面里还飘着星光、液滴等涂鸦装饰。这套...
#Multimodal#Amira#Commentary
精选理由
一条单图提示词模板,靠具体的风格配方和可替换字段满足了 HKR-H 和 HKR-K。正文没披露模型设置、对比效果或更广的行业神经点,所以 HKR-R 不触发。
一句话点评
一套提示词模板,能生成背景像实拍照片、主体是发光霓虹线稿的混合风格图。
锐评
这是一套提示词模板,不是模型或工具。它教你怎么写 prompt,让生成图同时有真实照片的背景和霓虹线稿风格的主体。模板里填了具体例子:主体是开心的兔子拿粉色气球,背景是清晨植物园小径。效果是背景像实拍(有阳光、虚化、自然元素),主体是发白光的加粗霓虹线条简笔画,脚下发光鞋子轻碰地面,画面还飘着星光、液滴等涂鸦装饰。 这套模板本身免费、可复用,适合做插画、海报或社交媒体视觉素材。但正文没披露用了哪个模型(Midjourney / DALL·E / Stable Diffusion 哪个版本?)、生成参数(采样步数、CFG scale、seed 等)以及是否经过后期筛选。不同模型对“真实摄影背景”和“霓虹线稿”的融合能力差异很大,实际效果可能不如例子稳定。如果你手头有能跑图的环境,可以直接拿模板试,但别指望一次出图就完美。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H1·K1·R0
04:00
46d ago
最佳拍档· atomZH04:00 · 04·29
李开复对话英矽智能CEO:AI如何推动生命科学下一波突破
这是一段李开复与英矽智能CEO Alex Zhavoronkov的对谈视频,讨论AI在生命科学领域的应用前景。正文没有披露具体模型、药物管线、实验数据或业务进展,所以信息量有限。如果你关注AI制药或英矽智能的动向,可以听听两位高层的观点碰撞,但别指望拿到硬核技术细节。
#Kai-Fu Lee#Insilico Medicine#Alex Zhavoronkov#Commentary
精选理由
硬排除零信息原则:仅有标题和嘉宾名单,无任何数据、案例或可验证的进展。HKR三项均不满足,评分低于40。
一句话点评
高层观点碰撞,但缺硬核信息。
锐评
这是一段李开复与英矽智能CEO Alex Zhavoronkov的对谈视频,讨论AI在生命科学领域的应用前景。正文没有披露具体模型、药物管线、实验数据或业务进展,所以信息量有限。如果你关注AI制药或英矽智能的动向,可以听听两位高层的观点碰撞,但别指望拿到硬核技术细节。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
04:00
46d ago
OpenAI 博客· rssEN04:00 · 04·29
OpenAI 发布网络安全行动计划,五根支柱但没写细节
OpenAI 发了一篇网络安全行动计划,核心是五根支柱:让更多人能用 AI 做防御、政府和企业要协同、保护前沿模型本身、部署时保持可见可控、帮用户自己保护自己。想法不坏,但正文只列了标题,没披露每根支柱的具体措施、时间表或预算。PDF 链接给了,但内容没展开。如果你关心的是“OpenAI 打算怎么落地”,这篇暂时给不了答案。
#Safety#OpenAI#Policy#Safety/alignment
精选理由
OpenAI 官方表态 AI 网络安全,行业相关性强,通过 HKR-R。但披露的事实止步于五部分计划和笼统目标,HKR-H/K 不满足,分数落在 60–71 区间。
一句话点评
OpenAI 发了五根支柱的网络安全计划,但正文只列了标题,具体措施、时间表、预算全在 PDF 里,等于没展开。
锐评
OpenAI 这篇网络安全行动计划,核心是五根支柱:让更多人能用 AI 做防御、政府和企业协同、保护前沿模型、部署时保持可见可控、帮用户自保。想法不坏,但正文只列了标题,没披露每根支柱的具体措施、时间表或预算。PDF 链接给了,但内容没展开。如果你关心的是“OpenAI 打算怎么落地”,这篇暂时给不了答案。关键数字和来源限制:正文未提及任何预算金额、时间节点或已部署案例,唯一可追踪的是 PDF 文件(链接有效但未公开摘要)。还缺什么:缺每根支柱的落地路径、成本分摊机制、以及如何验证“民主化防御”不是口号。对于从业者,这篇更像政策表态而非操作指南,建议等 PDF 全文或后续白皮书再评估。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K0·R1
03:09
46d ago
机器之心 · 公众号· rssZH03:09 · 04·29
不用训练也能提升黑箱VLM?CARPRT用类别感知调权重
墨尔本大学在TMLR上提出CARPRT,针对黑箱视觉语言模型(VLM)做零样本分类,不用微调,只靠调整提示词的权重来提升效果。核心思路是:先用模型自己算相似度,给无标签数据打伪标签,再按类别归一化每个提示词的权重。好处是不动模型、不花训练成本。但正文没披露具体涨了多少个点,效果到底多好得自己试。论文已被ICLR 2026接收。
#Vision#Multimodal#Inference-opt#University of Melbourne
精选理由
这篇讲的是墨尔本大学被ICLR 2026接收的工作,核心是用无训练的方式提升黑箱VLM的零样本分类能力。方法不复杂:只拿相似度分数生成伪标签,再按类别做提示词平均相似度归一化。亮点是“不用训练”和“只动黑箱接口”,对API调用的场景很实用。但正文没披露具体准确率、用了哪些数据集、跟什么基线比,信息缺口明显,所以分数压在60-71的研究更新区间。
一句话点评
不动模型、不花训练成本,靠调提示词权重提升黑箱VLM分类效果,但正文没披露具体涨了多少点。
锐评
墨尔本大学在TMLR上发的CARPRT,针对黑箱视觉语言模型(VLM)做零样本分类,核心是不动模型、不花训练成本。思路是:让模型自己算相似度,给无标签数据打伪标签,再按类别归一化每个提示词的权重。好处是黑箱也能用,适合不想或不能微调的场景。但正文没披露具体涨了多少个点,效果到底多好得自己试。论文已被ICLR 2026接收,学术认可度还行,但实际落地效果存疑。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
02:54
46d ago
r/LocalLLaMA· rssEN02:54 · 04·29
7B模型编程能力翻倍,没改代码也没改agent
Reddit用户发帖称,一项研究让7B模型的编程性能提升了两倍以上,而且没动coding agent。但正文只贴了一张图,没有公开benchmark、数据集、方法或可复现的设置。信息缺口很大,没法判断这个“翻倍”是来自更好的训练数据、推理策略还是别的trick。目前只能当个传闻看,别急着信。
#Code#Agent#Benchmarking#Reddit
精选理由
H和R通过,因为2倍编码性能提升的7B模型声明和本地Agent成本角度确实有吸引力。K不通过,因为基准、数据集、方法和复现条件都没披露,信息严重不足。
一句话点评
一张图说7B模型编程能力翻倍,但没公开方法,先当传闻看。
锐评
Reddit 用户贴了一张图,声称一项研究让 7B 模型的编程性能翻倍以上,且没改动 coding agent。但正文被屏蔽,只留下一个图片链接,没有公开 benchmark、数据集、方法或可复现的设置。信息缺口很大:这个“翻倍”是来自更好的训练数据、推理策略还是其他 trick?完全不清楚。目前只能当个传闻,别急着信。如果真有效,作者应该放出完整论文或代码,否则对从业者几乎没有参考价值。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
02:32
46d ago
r/LocalLLaMA· rssEN02:32 · 04·29
Xiami mimo-v2.5 pro 用 MIT 协议发布,Arena 编程榜排第 9 超过 Opus 4.5
Reddit 帖子称 Xiami mimo-v2.5 pro 在 Arena 编程榜(coding-no-style-control)排第 9,高于 Opus 4.5 的第 10 名。模型采用 MIT 开源协议。但帖子只贴了榜单链接,没给出具体分数、样本量或发布时间,所以这个排名到底有多稳还不好说。正文也打不开,更多细节(比如模型大小、训练数据、推理成...
#Code#Benchmarking#Xiami#Opus
精选理由
HKR 三个条件都满足,但证据链只有一条 Reddit 帖子加一个榜单链接。第 9 对第 10 的排名有用,不过正文没披露分数、评测样本量和发布时间,信息缺口明显,所以分数压在 60–71 区间合理。
一句话点评
编程榜排第9,比Opus 4.5高一名,但只有一张榜单截图,分数和样本量都没给。
锐评
Reddit 帖子称 Xiami mimo-v2.5 pro 在 Arena 编程榜(coding-no-style-control)排第 9,高于 Opus 4.5 的第 10 名,且采用 MIT 开源协议。但帖子只贴了榜单链接,正文打不开(403 错误),没有披露具体分数、样本量或发布时间,所以这个排名有多稳还不好说。模型大小、训练数据、推理成本等关键信息也全缺。如果排名基于少量投票,领先一个名次可能只是统计噪声。MIT 协议是亮点,但缺乏可复现的验证前,建议先观望。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
02:00
46d ago
彭博科技· rssEN02:00 · 04·29
AI 芯片热钱开始往供应链深处找小公司
彭博说亚洲的 AI 行情正在往供应链更深处扩散,投资者开始翻那些不太知名的组件厂商。文章标题说“新赢家”出现,但正文没披露具体公司名字、估值或订单数据,只有一个 770% 的涨幅数字——这大概率是某家小供应商的股价,但没说是谁。这点先别太激动,信息缺口很大,没法判断是基本面还是炒作。
#Bloomberg#Commentary
精选理由
HKR-H和HKR-R勉强过关:Bloomberg的供应链扩散角度有钩子,也触及AI基础设施投资话题。HKR-K不通过,因为正文没给公司名、估值变动、订单或产能数据。
一句话点评
彭博说亚洲AI行情往供应链深处扩散,但正文没披露具体公司名、估值或订单数据,只有一个770%的涨幅数字——大概率是某家小供应商的股价,但没说是谁。这点先别太激动,信息缺口很大,没法判断是基本面还是炒作。
锐评
彭博这篇报道的标题很抓人,说AI行情从芯片大厂扩散到供应链里那些不太知名的组件厂商,还举了一个涨了770%的例子。但正文里既没提这家公司叫什么,也没说它做什么产品、订单量多少、估值多少。770%这个数字看起来吓人,但如果是小盘股,流动性差、基数低,几天就能拉出这个涨幅,跟基本面关系不大。文章更多是在描述一种市场情绪——投资者在翻箱底找下一个受益者,而不是给出可验证的投资线索。如果你在关注供应链里的机会,这篇只能当风向标看,不能当决策依据。真正有价值的信息——具体公司、产品、订单、估值——全都没披露。想跟进的话,得自己去翻彭博终端或者找行业报告补细节。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
01:46
46d ago
Latent Space· rssEN01:46 · 04·29
今天AI圈没啥大事,但vLLM、Poolside和NVIDIA发了新东西
今天AI圈相对平静,但有几个值得关注的点:vLLM 0.20.0发布,主要改进是内存和MoE服务效率,比如TurboQuant 2-bit KV缓存让KV容量翻了4倍,还重新支持了FA4 MLA预填,以及一个融合RMSNorm让端到端延迟降了2.1%。DeepSeek V4 Pro在B300上比H200快8倍,但正文没披露具体测试条件。Poolside...
#Inference-opt#Multimodal#Agent#NVIDIA
精选理由
这是一篇AI日报,不是单一重磅发布,所以分数压在60-71区间。vLLM 0.20.0的4倍KV容量意味着显存更省、长上下文推理更便宜,这点值得关注。Poolside Laguna XS.2和NVIDIA Nemotron 3 Nano Omni都是开放模型,Mistral Workflows则是让模型进业务流程干活。三个方向在同一天有更新,说明推理成本、开放生态和agent落地都在加速。不过日报性质决定了信息密度高但深度有限,正文没披露具体benchmark或成本对比,所以不拔高。
一句话点评
vLLM 0.20 把 KV 缓存容量翻了 4 倍,端到端延迟降了 2.1%,对跑大模型推理的人算实打实的省钱更新。
锐评
vLLM 0.20.0 是今天最实在的更新:TurboQuant 2-bit KV 缓存让容量翻 4 倍,意味着同样显存能塞更多请求或更长上下文;融合 RMSNorm 让端到端延迟降 2.1%,虽然数字不大但白送。FA4 重新支持 MLA 预填(SM90+),对 DeepSeek V4 这类用 MLA 的模型是利好。DeepSeek V4 Pro 在 B300 上比 H200 快 8 倍——但正文没披露测试条件(batch size、精度、是否含预填),这个数字先打五折。Poolside 发了首个公开模型 Laguna XS.2(33B 总参/3B 激活 MoE),Apache 2.0,单卡可跑,性能接近 Qwen-3.5,但没给标准 benchmark 对比表,社区验证还不够。NVIDIA Nemotron 3 Nano Omni(30B/A3B MoE,256K 上下文,多模态)铺货速度惊人,OpenRouter/LM Studio/Ollama 等 10 家平台当天上线,但同样缺独立评测。整体看,今天没有突破性进展,更多是推理栈和开放模型的并行迭代。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
00:57
46d ago
Hacker News 首页· rssEN00:57 · 04·29
换用更贵的模型,总成本反而降了
Mendral 把 CI 日志分析从 Sonnet 4.0 换成了 Opus 4.6,总 LLM 费用反而更低。核心套路是三层分工:先用最便宜的 Haiku 做分流——80% 的失败是已知重复,Haiku 匹配到就直接跳过,不惊动大模型。剩下 20% 才交给 Opus 做诊断规划,Opus 只负责出假设和指令,具体翻日志、查数据库、跑 git log ...
#Mendral#Opus#Commentary
精选理由
HKR-H/R 通过:Opus 降成本这个角度反直觉,且成本压力是 AI 团队真实痛点。HKR-K 不通过:正文没披露降幅、流量级别、切换机制或可复现条件,信息不足无法验证。
一句话点评
用三层分工把大模型成本打下来,思路挺实在。
锐评
Mendral 把 CI 日志分析从 Sonnet 4.0 换成 Opus 4.6,总费用反而更低。核心是三层分工:先用最便宜的 Haiku 做分流——80% 的失败是已知重复,Haiku 匹配到就直接跳过,不惊动大模型。剩下 20% 才交给 Opus 做诊断规划,Opus 只负责出假设和指令,具体翻日志、查数据库、跑 git log 这些脏活再派 Haiku 子 agent 去干。一个 triager 匹配成本比完整调查低约 25 倍。 正文没披露绝对费用数字或节省百分比,也没说 Haiku 误判率。不过思路对做 agent workflow 的人有参考:让贵模型只做决策,便宜模型干执行,别一股脑把所有上下文塞进 prompt。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
00:00
46d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 04·29
知识容量的另一把尺子:IKP 用冷门事实测模型到底记住了多少
这篇论文导读介绍了一个叫 IKP 的测量框架,它不测模型有多少参数,而是测模型的有效知识容量——也就是它记住了多少没法靠推理猜出来的冷门事实。方法是用 1400 道刻意排除推理、必须靠记忆回答的问题,按稀有度分 7 档,答错扣分、拒答不扣,抑制模型瞎编。在 89 个已知参数的开源模型上校准后,IKP 准确率和参数量对数呈线性关系,R²=0.917,但预...
#Benchmarking#Reasoning#IKP#Research release
精选理由
这篇讲 IKP 用长尾事实探针测模型知识容量,把事实存储和推理能力拆开评估,思路有意思。但正文只给了机制方向,没披露用了什么模型、容量具体数字、基准怎么设——信息缺口明显。对做评测的人有启发,但缺成本、安全或竞争层面的直接关联,所以分数卡在 60–71 区间。
一句话点评
IKP 用 1400 道冷门题测模型记住了多少没法推理的事实,结果和参数量对数线性相关,但 90% 区间宽到 3 倍,别拿它当精确参数探测器。
锐评
IKP 把模型能力拆成推理和事实存储两个维度,后者仍强依赖参数量。方法上,1400 道题按稀有度分 7 档,答错扣分、拒答不扣,抑制瞎编。在 89 个开源模型上校准后,准确率与参数量对数呈线性关系(R²=0.917),但 90% 预测区间约 3 倍,意味着对闭源模型(如 GPT-5.5 估算 9.7T,区间 [3.2T, 28.7T])只能看数量级,不能精密排序。正文没披露具体模型名单和每档题数,且承认 API 安全对齐会导致低估(如 Claude Sonnet 4 拒答率从 54% 升到 88%),也无法排除检索增强干扰。MoE 的 total params 拟合度(R²=0.79)远好于 active params(R²=0.51),说明事实知识分布在全权重中,不是每 token 激活部分。小模型在推理题上追平大模型不意味着记住了同样多的冷门事实——这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
2026-04-28 · 星期二2026年4月28日
23:59
46d ago
Hacker News 首页· rssEN23:59 · 04·28
Claude Code 系统提示词 bug 导致用户多花钱、托管 agent 直接罢工
GitHub 上一个 issue 报告,Claude Code 的系统提示词存在回归 bug:每次执行 Read 操作都会弹一次恶意软件提醒,导致子 agent 反复拒绝执行任务。这个 bug 在 v2.1.92 修过一次,但 v2.1.111 又复发了。用户说这既浪费 token(多花钱),也让托管 agent 直接卡死。正文没披露复现步骤、影响范围...
#Agent#Code#Tools#Anthropic
精选理由
HKR-H 和 HKR-R 都成立:Claude Code 出 bug,用户多花钱、agent 挂掉,都是可讨论的痛点。HKR-K 不成立,因为复现步骤、影响范围和修复状态都没披露,信息不够支撑深度判断,所以保持 all 级别。
一句话点评
Claude Code 的 bug 让每次读文件都弹恶意软件警告,子 agent 反复拒绝干活,白烧 token 还卡死流程。
锐评
Anthropic 的 Claude Code 出了个回归 bug:系统提示词里写死了“每次 Read 操作都要提醒用户注意恶意软件”,结果子 agent 每次读到文件就触发警告,然后拒绝执行后续任务。这 bug 在 v2.1.92 修过一次,到 v2.1.111 又复发了。用户说这既浪费 token(多花钱),也让托管 agent 直接卡死。 问题在于系统提示词是硬编码的,改一次没锁住,下次更新又带回来了。正文没披露复现步骤、影响范围(是只影响特定文件类型还是全局)、以及 Anthropic 是否已确认修复时间。如果是高频 Read 场景(比如代码审查、批量文件处理),token 浪费会很快累积。这点先别太激动,因为 issue 只有 40 个 HN 点赞和 10 条评论,可能只是边缘案例。但回归 bug 本身说明测试流程有漏洞,尤其是这种影响成本的提示词逻辑,应该加自动化回归测试。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K0·R1
23:17
46d ago
The Verge · AI· rssEN23:17 · 04·28
马斯克庭审首日表现:准备不足,更像在闹脾气
马斯克诉奥特曼案开庭首日,The Verge 记者旁听后的评价是:马斯克表现平淡、缺乏准备,整场证词更像在发泄个人情绪,而不是在陈述有力证据。他反复强调自己早期对 OpenAI 的贡献,但正文没有披露他拿出了什么新证据或完整庭审记录。目前看,这场官司的走向还远没到能下判断的时候。
#Safety#Elon Musk#Sam Altman#OpenAI
精选理由
HKR-H 和 HKR-R 通过,因为 Musk 告 Altman 是能吸引点击的治理纠纷。HKR-K 不通过:文章只加了观察,没有新证据、裁决或庭审细节。
一句话点评
马斯克出庭像在发泄情绪,没拿出新证据,这场官司还早。
锐评
The Verge 记者旁听首日庭审后评价:马斯克表现平淡、缺乏准备,更像在发泄个人情绪而非陈述有力证据。他反复强调自己早期对 OpenAI 的贡献,但正文没披露他拿出了什么新证据或完整庭审记录。目前看,这场官司的走向还远没到能下判断的时候。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
23:01
46d ago
最佳拍档· atomZH23:01 · 04·28
扩散模型是怎么工作的:斯坦福CME296第一课
这是一节斯坦公开课,讲扩散模型的核心流程:从纯噪声一步步去噪生成图像。标题里列了高斯分布、方差调度、ELBO和KL散度这些数学工具,但正文没披露推导细节、讲师是谁、课时多长,也没有代码或课件链接。适合想理解扩散模型原理框架的人先看标题入个门。
#Multimodal#Stanford#Commentary
精选理由
这篇只有扩散模型的课程标题和关键词列表,ELBO/KL散度这种数学推导对多数读者没有入口,也没有具体成果或可复现的代码链接,信息密度低,可读性差,所以不推荐。
一句话点评
斯坦福公开课,讲扩散模型从噪声一步步去噪生成图像,适合入门框架。
锐评
这是一节斯坦福CME296公开课,标题直指扩散模型核心流程:从纯噪声去噪生成图像。列了高斯分布、方差调度、ELBO和KL散度这些数学工具,但正文没披露推导细节、讲师是谁、课时多长,也没有代码或课件链接。适合想理解扩散模型原理框架的人先看标题入个门,但别指望看完就能上手训练。信息缺口明显:没有实际案例或实验数据支撑,数学推导深度未知。如果后续课程能补上具体实现和调参经验,价值会更高。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K0·R0
21:00
47d ago
彭博科技· rssEN21:00 · 04·28
三星家族一年财富翻倍至450亿美元,AI热潮是主因
彭博报道,三星家族财富在一年内从约225亿美元翻倍至450亿美元,主要得益于AI硬件需求推高三星股价。报道提到李健熙2020年去世后的遗产税压力,以及李在镕2021年行贿定罪,但未披露具体哪些AI业务贡献了增长。正文被屏蔽,无法获取更多细节。
#Samsung Electronics#Lee Kun-hee#Jay Y. Lee#Commentary
精选理由
HKR-H 和 HKR-K 靠 450 亿美元一年翻倍这个数字通过。AI 关联停留在财富效应层面;正文缺少三星 AI 收入、HBM 订单或芯片业务拆分,所以只是低价值的财经周边。
一句话点评
三星家族财富一年翻倍到450亿美元,全靠AI硬件需求推高股价。
锐评
彭博这篇报道的核心事实很直接:三星股价涨了,李家财富跟着翻倍。但正文被屏蔽,我们看不到具体哪些AI业务贡献了增长——是HBM内存、代工订单还是设备?这点先别太激动。 关键数字:一年内从225亿到450亿美元,翻倍速度确实惊人。但彭博没披露遗产税实际缴纳了多少,也没说李在镕行贿定罪后对控制权的影响。如果遗产税压力大,李家可能被迫减持,这会稀释股价涨幅的实际收益。 还缺什么:三星AI业务的具体营收拆分、HBM产能利用率、以及李在镕的法律风险是否已解除。正文没披露这些,读者只能当个财富故事看,没法判断可持续性。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R0
20:50
47d ago
彭博科技· rssEN20:50 · 04·28
Kalshi执法负责人讨论预测市场内幕交易监管问题
Kalshi 执法主管 Robert Denault 在 Bloomberg Crypto 上聊了预测市场里的内幕交易指控。这个市场背后是华尔街投资的数十亿美元产业,但正文没披露具体案件数量或执法手段。
#Kalshi#Robert Denault#Bloomberg#Policy
精选理由
HKR 的 H 通过,但 K 和 R 不通过:正文没给案件数量、执法机制或 AI 产品关联。对 AI RADAR 来说这是偏离主线的金融监管话题,所以分数低于 40 且被排除。
一句话点评
Kalshi执法负责人谈预测市场内幕交易监管,称其监控系统已能识别可疑交易模式。但正文被Bloomberg paywall挡住,未披露具体监控手段、覆盖范围或历史案例。关键信息缺口:系统是规则引擎还是模型驱动?是否覆盖所有市场参与者?有没有抓到过实锤?如果只是声明式表态,参考价值有限。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
20:30
47d ago
The Verge · AI· rssEN20:30 · 04·28
泰勒·斯威夫特用商标围堵AI模仿者
泰勒·斯威夫特团队上周提交了两份商标申请,把两句录音里的短语注册成商标。目的是多一个法律工具来对付AI伪造的声音和形象。申请用的是专辑宣传音频,但正文没披露审查要多久、胜算有多大。
#Audio#Safety#Taylor Swift#TAS Rights Management
精选理由
文章只给了 2 项商标申请和短语来源,没披露审查周期和胜算依据。这是 AI 音频/IP 的增量事件,不是产品发布或监管落地,信息缺口明显,先别太激动。
一句话点评
泰勒·斯威夫特把录音里的两句短语注册成商标,用来告AI伪造声音和形象。
锐评
泰勒·斯威夫特团队上周提交了两份商标申请,把两句录音里的短语注册成商标,目的是多一个法律工具来对付AI伪造的声音和形象。申请用的是专辑宣传音频,但正文没披露审查要多久、胜算有多大。 这招挺聪明:商标比版权好维权,不用证明对方“复制”了你的作品,只要证明对方用了相似标识造成混淆就行。但商标注册本身要几个月到一年,而且必须证明这些短语在商业中已经具备“识别来源”的功能——光靠一句歌词可能不够。 目前看,这更像一个信号动作:告诉AI公司“我会追到底”。但实际威慑力取决于审查结果和法院对AI生成内容是否构成商标侵权的认定,这两点都还没落地。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
20:26
47d ago
Hacker News 首页· rssEN20:26 · 04·28
朋友和AI一起写了个SGI Indy模拟器,用Rust
这个项目叫iris,是一个用Rust写的SGI Indy工作站模拟器。亮点是标题说“朋友和他的AI兄弟们”一起写的——也就是作者用AI辅助生成了大量代码。目前GitHub上31颗星、2个issue,但正文没披露模拟精度、依赖库或测试覆盖,所以实际能跑多好还不清楚。如果是真的能模拟老硬件,对复古计算爱好者来说挺有意思,但这点先别太激动,得等更多验证。
#Code#techomancer#Hacker News#Open source
精选理由
H和R勉强过关:标题有怪异的钩子,也碰了AI写系统代码的能力点。K不通过,因为正文没披露任何模型、提示词、模拟精度或可复现测试,只有两个链接,信息量不够支撑判断。
一句话点评
AI 写了个老工作站模拟器,但精度和测试都没说,先别太激动。
锐评
标题说“朋友和他的AI兄弟们”用Rust写了个SGI Indy模拟器,这本身是个噱头——AI辅助生成复古硬件模拟代码,对复古计算圈有吸引力。但正文只给了GitHub链接,31颗星、2个issue,模拟精度、依赖库、测试覆盖全没披露。也就是说,目前只能确认项目存在,实际能不能跑、跑多快、指令集模拟完整度如何,全是未知数。如果真能模拟MIPS R4000和Indy的图形硬件,对怀旧玩家和系统研究都有价值,但这点先别太激动。作者没提用了什么AI模型、写了多少比例代码、有没有人工审查,信息缺口很大。建议等有人实际跑过、出个demo视频或测试报告再认真看。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
20:00
47d ago
Dwarkesh Patel 访谈· atomEN20:00 · 04·28
AI监管的威权主义问题
标题直接点出AI监管可能带来的威权主义风险,但正文完全空白,没有披露任何国家、政策条款或具体案例。从业者只能推测话题方向,无法判断问题机制——比如是监管被用来巩固权力、压制竞争,还是限制开源模型。信息缺口明显:缺国家、缺条款、缺案例。
#Safety#Policy#Commentary
精选理由
标题有判断但正文为空,属于硬性零来源:只有标题级主张,没有数据、案例或具名政策,因此分数上限卡在 39 以下。从业者只能确认议题方向,不能据此判断任何监管机制。
一句话点评
标题有观点,正文没内容,没法判断。
锐评
标题说AI监管有威权主义风险,但正文完全空白,没披露任何国家、政策条款或具体案例。从业者只能猜方向——是监管被用来巩固权力、压制竞争,还是限制开源模型?信息缺口明显:缺国家、缺条款、缺案例。这条只能当话题引子,没法做判断依据。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H1·K0·R1
20:00
47d ago
r/LocalLLaMA· rssEN20:00 · 04·28
Mistral 可能藏了个 128B 大模型,代号 Medium 3.5
Reddit 用户 tkon3 在 vLLM 的代码提交里发现了一行引用,指向一个叫 Mistral-Medium 3.5 的 128B 参数模型。目前只有这个线索——vLLM PR 41024——正文没披露架构、权重是否公开、发布时间,也没有任何跑分或复现测试。128B 参数属于中等偏大的规模,如果真发布,本地部署需要至少两张 A100 或一张 H1...
#Inference-opt#Mistral AI#vLLM#tkon3
精选理由
我会先打个折:正文就是个 RSS 片段,没参数结构、没权重、没发布时间、也没可复现的测试,所以这更像一条线索而不是一个结论。能让人盯住的点就一个——vLLM 的 PR 41024 里改了模型名,说明有人在适配这个尺寸的 Mistral-Medium 3.5。对从业者来说,128B 这个数字意味着本地部署的门槛和成本会是个大问题,但没见到权重和架构之前,这点先别太激动。整体信息量撑不起高分,放在 64 分合理。
一句话点评
一条代码提交引用,离真发布还差得远。
锐评
Reddit 用户 tkon3 在 vLLM 的代码提交(PR 41024)里发现了一行引用,指向一个叫 Mistral-Medium 3.5 的 128B 参数模型。目前只有这一个线索——正文没披露架构细节、权重是否公开、发布时间,也没有任何跑分或复现测试。128B 参数属于中等偏大的规模,如果真发布,本地部署需要至少两张 A100 或一张 H100,成本不低。这点先别太激动:vLLM 的 PR 可能只是预留命名空间,不代表模型已训练完成或即将开源。Mistral 之前有过 Medium 系列(如 2024 年的 Mistral Medium),但这次 3.5 版本号暗示可能是小版本升级。还缺什么:缺权重链接、缺基准测试、缺官方确认。在更多证据出现前,这更像一个占位符而非发布预告。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
19:37
47d ago
Product Hunt · AI· rssEN19:37 · 04·28
Tinfoil:一个声称对话完全私密的 AI 聊天和 API
Tinfoil 上线了一个 AI 聊天和 API,主打隐私:对话内容只有你和模型知道,其他人(包括 OpenAI?)都看不到。它用 NVIDIA GPU 的硬件安全功能做可验证的隐私保护,你可以自己检查对话是否真的端到端加密。听起来像本地 AI 但跑在云端。不过正文没披露具体用了什么加密方案、背后是什么模型、定价多少、API 有没有限流。隐私承诺很硬,...
#Tools#Tinfoil#Product update
精选理由
只有HKR-R通过:隐私角度有共鸣,但机制、模型来源和商业条款都缺失。这是一个低价值的产品更新,低于精选门槛。
一句话点评
用 NVIDIA 硬件加密跑云端 AI,号称对话只有你和模型知道,但没披露具体模型和定价。
锐评
Tinfoil 的核心卖点是隐私:对话内容用 NVIDIA GPU 的硬件安全功能加密,用户可自行验证是否端到端加密,相当于把本地 AI 的隐私感搬到云端。但正文没披露背后是什么模型、具体加密方案、定价和 API 限流情况。隐私承诺很硬,但验证门槛高——普通用户很难真的去检查加密实现。如果模型能力一般或价格偏高,这个卖点就只剩心理安慰。适合对数据主权极度敏感、愿意为隐私牺牲性能和便利的团队,但大规模商用前需要更多技术细节和第三方审计。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K0·R1
19:19
47d ago
彭博科技· rssEN19:19 · 04·28
OpenAI 回击增长担忧:我们火力全开
OpenAI 周二回应了《华尔街日报》关于其多项内部目标未达标的报道,称消费者、企业客户和刚起步的广告业务需求依然强劲。不过正文没披露具体营收数字、目标差距或客户增长数据,所以这点先别太激动。
#OpenAI#The Wall Street Journal#Glasswing Ventures#Commentary
精选理由
OpenAI 跳出来说 WSJ 的报道是标题党,自己正全速运转,但通篇没给任何具体数据来反驳。我会先打个折——这种回应更像公关防守,不是用数字说话。对关注 AI 行业景气度的人来说,这条信息能当个情绪指标看,但别太激动,毕竟没实锤。
一句话点评
OpenAI 否认增长放缓,但正文被墙,没披露具体数字。
锐评
OpenAI 回应《华尔街日报》称其多项内部目标未达标,表示消费者、企业客户和刚起步的广告业务需求依然强劲。但正文被 Bloomberg 反爬墙拦截,实际未披露任何营收数字、目标差距或客户增长数据。来源是 Bloomberg 视频报道,原始信息来自 OpenAI 官方回应,但缺乏独立验证。关键信息缺口:具体营收、目标差距、客户增长数据均未提供。所以这条消息更像公关回应,实际增长情况仍需看后续财报或第三方数据。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
19:08
47d ago
Hacker News 首页· rssEN19:08 · 04·28
有人在 ChatGPT 和 Claude 里跑起了《毁灭战士》
作者做了一个 MCP 应用,让 ChatGPT 和 Claude 能直接在内嵌视图里运行《毁灭战士》。核心思路是:用 Cloudflare 的 doom-wasm 把游戏搬到浏览器,再通过一个 MCP 服务器暴露两个工具——一个创建游戏会话并返回签名 URL,另一个直接返回启动链接。最难的部分不是让游戏跑起来,而是处理不同 AI 客户端对 iframe...
#Code#Tools#ChatGPT#Claude
精选理由
H 靠 DOOM 进聊天机器人这个钩子勉强过关,但 K 和 R 都挂了——正文没给任何机制或复现步骤,HN 热度也极低,分数只能压在低价值区间。
一句话点评
让 ChatGPT 和 Claude 直接玩《毁灭战士》,靠 MCP 协议把游戏塞进 AI 聊天框。
锐评
作者用 Cloudflare 的 doom-wasm 把《毁灭战士》搬到浏览器,再写一个 MCP 服务器暴露两个工具:一个创建游戏会话并返回签名 URL,另一个直接给启动链接。最难的不是让游戏跑起来,而是处理不同 AI 客户端对 iframe、CSP 和 UI 渲染的限制——嵌套 iframe 被浏览器安全策略卡住,最后改成让游戏画布直接在宿主 iframe 里运行才解决。 关键点:游戏用 Freedoom Phase 1 作为默认内容,保证可再分发;签名 token 让浏览器路由不依赖服务端会话持久化。但正文没披露实际帧率、操作方式(键盘/鼠标?)以及在不同客户端上的兼容性列表。Hacker News 上只有 3 分和 1 条评论,热度不高。如果是真的能流畅玩,那 MCP 协议的应用边界又拓宽了,但这点先别太激动——目前更像一个技术 demo,离实用还有距离。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
18:57
47d ago
X · @Yuchenj_UW· x-apiMULTI18:57 · 04·28
Claude Code 挂了
Anthropic 的编程助手 Claude Code 当前不可用。正文只说了这一句,没交代故障开始时间、影响范围、是否已确认或恢复进度。整个硅谷都在围观这条状态。
#Code#Claude Code#Incident
精选理由
一条 X 帖子说 Claude Code 挂了,但没写影响范围、状态页确认、恢复时间。HKR 里 H 和 R 通过,K 不通过,所以只是个低价值的事故信号。
一句话点评
Claude Code 挂了,整个硅谷都在围观。
锐评
Anthropic 的编程助手 Claude Code 当前不可用。正文只说了这一句,没交代故障开始时间、影响范围、是否已确认或恢复进度。整个硅谷都在围观这条状态。 关键信息缺口:故障何时开始、波及多少用户、Anthropic 是否已定位原因、预计恢复时间。目前只有一条状态,没有官方说明或后续更新。 对从业者来说,这条消息本身信息量极低,更像一个社交事件——大家在看 Anthropic 如何应对突发故障。如果后续有 RCA 或恢复报告,才值得深入分析。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
18:55
47d ago
X · @dotey(宝玉)· x-apiZH18:55 · 04·28
ByteByteGo 一张图对比 MCP 和 Agent Skills,比 AI 画的精致但门槛还在
ByteByteGo 发了一张对比 MCP(模型上下文协议)和 Agent Skills(智能体技能)的示意图,画得比 AI 生成的图精致很多。但作者也承认:懂的人一看就明白,不懂的人看了图还是不懂。正文没有展开两者的具体机制差异,比如 MCP 怎么让模型调用外部工具、Agent Skills 怎么封装子任务,图里也没标注关键区别。如果你对这两个概念不...
#Agent#Tools#ByteByteGo#Commentary
精选理由
ByteByteGo 的图比 AI 画的精致,但正文只有一句评论,没讲 MCP 和 Agent Skills 到底差在哪、怎么选。这是低信息量的社交评论,给 45 分合理——有话题性但没干货,适合泛读。
一句话点评
图好看,但没解释MCP和Agent Skills到底差在哪。
锐评
ByteByteGo这张对比图确实比AI生成的精致,但作者自己承认:懂的人一看就明白,不懂的人看了还是不懂。正文没披露MCP(模型上下文协议,让模型调用外部工具)和Agent Skills(智能体技能,封装子任务让模型执行)的具体机制差异,图里也没标注关键区别。如果你对这两个概念不熟,光看图学不到东西。信息缺口明显:缺两者在工具调用方式、任务编排、状态管理上的对比。建议读者先补基础概念再看图,否则只是看个热闹。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
18:49
47d ago
TechCrunch AI· rssEN18:49 · 04·28
亚马逊在商品页上线AI语音问答,问产品问题它用嘴回答
亚马逊在商品页上线了一个叫“Join the chat”的功能,用户可以直接问产品问题,AI会生成一段语音回答你。相当于每个商品配了一个能说话的导购,不用自己翻详情页和评论了。比如你可以问“这个锅能进洗碗机吗”,AI会综合产品参数和用户反馈来回答。正文没披露用了哪家的语音模型、延迟多高、覆盖哪些品类和地区,也没说要不要额外收费。如果延迟控制得好,对懒得...
#Audio#Amazon#Product update
精选理由
这是亚马逊一个中等体量的产品更新:HKR-H 和 HKR-K 靠音频问答的交互形式和“Join the chat”这个新流程通过。正文没提覆盖品类、用了哪个语音模型、延迟多少、上线地区或定价,也没有转化数据,所以分数压在 60–71 区间。
一句话点评
亚马逊给商品页加了个AI语音问答,懒得看详情可以直接问。
锐评
亚马逊在商品页上线了“Join the chat”功能,用户问“这锅能进洗碗机吗”,AI会综合参数和用户评论生成一段语音回答。相当于每个商品配了个能说话的导购,对懒得翻详情页和评论的人挺实用。正文没披露用了哪家语音模型、延迟多高、覆盖哪些品类和地区,也没说是否额外收费。如果延迟控制得好,这功能对转化率可能有帮助,但语音回答的准确性和对差评的过滤机制才是关键——用户问“这锅容易粘吗”,AI如果只挑好评说,反而会降低信任。目前信息缺口较大,建议等实测或更多细节再判断实际效果。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
18:30
47d ago
r/LocalLLaMA· rssEN18:30 · 04·28
给 Gemma 3 最小模型加个思考 LoRA,270M 参数就能想问题
Reddit 用户 Firstbober 给 Gemma 3 的 270M 版本训练了一个 LoRA,让它能像大模型一样输出思考过程。训练配置很轻量:rank 24、最大长度 768、batch 1、梯度累积 2,用的是一块 RTX 3050 4GB 移动版显卡。关键技巧是格式控制——如果标签写错,loss 权重会放大 20 倍,逼模型学会正确格式。正...
#Reasoning#Fine-tuning#Firstbober#Gemma
精选理由
H/K/R 都达标,但这是 Reddit 个人发布的 LoRA,没有基准分数、基线对比或可复现的评测。对 LocalLLaMA 社区有吸引力,不值得上首页推荐。
一句话点评
270M 参数跑出思考链,4GB 显卡就能玩。
锐评
Reddit 用户 Firstboer 给 Gemma 3 270M 挂了个 LoRA,让它学会输出思考过程。训练配置极轻:rank 24、最大长度 768、batch 1、梯度累积 2,只用一块 RTX 3050 4GB 移动版显卡。关键技巧是格式控制——标签写错时 loss 权重放大 20 倍,逼模型死记正确格式。 这可能是目前最小的 thinking model,但正文没披露训练数据来源和规模,也没给基准测试结果。270M 参数能学到多少有效推理值得怀疑,格式控制强于推理能力。优点是门槛极低,4GB 显存就能跑,适合在边缘设备或低算力场景试水。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
18:28
47d ago
● P1彭博科技· rssEN18:28 · 04·28
Google 与美国国防部达成协议允许 AI 用于机密军事工作
谷歌和美国国防部达成了一项协议,让谷歌的 AI 系统能进入机密军事工作流程。五角大楼官员确认了这笔交易,但正文没披露具体用了哪些系统、合同金额有多大,也没说使用上有什么限制。这件事发生在研究人员持续抗议谷歌参与军事项目的背景下,我会先打个折——目前公开信息太少,没法判断这到底是一次性试点还是深度绑定。
#Safety#Google#US Defense Department#Pentagon
精选理由
这条消息本身够硬:Google 和五角大楼的机密军事 AI 合作被确认了。我会先打个折,因为正文没写具体系统、金额和使用限制,没法判断规模。但 H、K、R 三点都踩中了——冲突感强、事实新、跟从业者的职业伦理直接相关,所以放在 featured 里没问题。
一句话点评
Google 跟五角大楼签了份机密 AI 合同,条款是“任何合法用途”都能用,而且 Google 没有否决权。
锐评
这事最值得注意的不是 Google 又接政府单,而是合同里那句“任何合法用途”——这意味着 Google 交出的 AI 模型,军方拿去用在机密军事工作里,Google 自己没法喊停。2018 年员工因为 Project Maven 无人机项目闹过一波,当时 Google 承诺不搞武器 AI,还退出了竞标。现在这份协议等于把当年的红线往后挪了一大截。 报道来自 The Verge 和 Bloomberg,都提到这是一份机密合同,具体金额、模型范围、军方到底会怎么用,正文全都没披露。Google 对内只说“感到自豪”,没解释怎么跟之前的 AI 原则兼容。 缺的关键信息太多了:合同有没有排除致命自主武器?模型是直接部署还是只提供 API?有没有第三方审计?这些不搞清楚,光一句“合法用途”太空了,合法跟合理之间差着十万八千里。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
18:26
47d ago
● P1彭博科技· rssEN18:26 · 04·28
Musk 在诉讼中作证称起诉 OpenAI 欲阻止 Altman 掠夺
马斯克周二在法庭上说,他起诉 OpenAI 和两位联合创始人,是因为 Sam Altman 把公司从非营利转向营利的行为,已经让当初的公共使命变成了笑话。他的律师直接用了“嘲弄”这个词。目前公开的报道片段没有披露具体的索赔金额、审理法院或马斯克要求法院采取什么补救措施。
#Safety#Alignment#Elon Musk#OpenAI
精选理由
马斯克出庭作证本身就有话题性,他用的“looting”这个词把矛盾拉到了个人恩怨和机构变质上,对关注 AI 治理和安全的人是个强信号。不过正文没写索赔金额、具体庭审地点和救济请求,信息有缺口,所以重要性我给 80 分,放在 featured 里。这点先别太激动,后续看有没有判决或和解细节出来。
一句话点评
马斯克出庭作证,把起诉 OpenAI 的目的直接说成是阻止 Altman“掠夺”。这话很重,但法庭上怎么证明“掠夺”才是关键,目前报道没给出具体证据。
锐评
马斯克在法庭上亲自作证,把这场官司的核心定性为阻止 Sam Altman 对 OpenAI 的“掠夺”。这个用词很重,直接把商业纠纷上升到了道德指控。从报道看,他试图把自己塑造成一个想“拯救人类”的理想主义者,但庭审第一周并不顺利,他过去的推文和财务承诺都被对方拿来反复质询,让他处于防守位置。 这场审判目前更像是一场旧日恩怨的公开重演,双方都在争夺“初心”的解释权。报道里没有披露任何能直接证明“掠夺”行为的内部文件或财务数据,所以这个指控目前还停留在个人叙事层面。接下来要看 OpenAI 一方如何回应,以及是否有实质性的证据来支撑或反驳“掠夺”的说法。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
18:20
47d ago
彭博科技· rssEN18:20 · 04·28
AI 算力需求让美国电力设备市场三年翻 25 倍,2030 年冲到 650 亿美元
咨询公司 Wood Mackenzie 预测,到 2030 年美国数据中心发电设备年支出将从去年的 26 亿美元涨到 650 亿美元,翻了 25 倍。这个数字说明 AI 带来的电力需求不是小打小闹,而是实打实的硬件采购潮。但正文没披露具体买什么设备(变压器、燃气轮机还是电池储能)、谁在买(云厂商还是电力公司)、以及钱花在哪些州,所以这个 650 亿更像...
#Wood Mackenzie#Commentary
精选理由
Bloomberg加Wood Mackenzie给出了一个具体的AI基础设施数字,所以HKR三项都过。这条新闻落在60–71分区间,因为它只披露了总支出,没提买什么设备、谁在买、钱花在哪个区域,信息缺口明显。
一句话点评
AI 电力需求不是小打小闹,但 650 亿是预测上限,实际落地要打折。
锐评
Wood Mackenzie 预测美国数据中心发电设备年支出到 2030 年达 650 亿美元,是去年 26 亿的 25 倍。这个数字说明 AI 带来的电力需求是实打实的硬件采购潮,不是概念炒作。但正文没披露具体买什么设备(变压器、燃气轮机还是电池储能)、谁在买(云厂商还是电力公司)、以及钱花在哪些州,所以 650 亿更像乐观情景的上限。另外,预测来自一家咨询公司,不是官方数据,且原文被 Bloomberg 反爬墙拦截,无法核实更多细节。建议关注后续是否有设备商或电力公司的实际订单来验证这个增速。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
18:08
47d ago
Hacker News 首页· rssEN18:08 · 04·28
Waymo 开到波特兰了,但今天只是人工开车认路
Waymo 宣布进入波特兰,但今天开始只是人工驾驶车辆跑一遍城市,让自动驾驶系统熟悉当地路况。正文没披露车队规模、运营时间或何时开放给乘客。市长和反酒驾组织出来站台,强调自动驾驶能减少交通事故——Waymo 引用数据说在已运营城市减少了 13 倍重伤事故。目前能做的只有去官网注册等通知,离真正坐上无人车还有一段距离。
#Robotics#Waymo#Hacker News#Product update
精选理由
H 和 R 通过:Waymo 进入新城市吸引自动驾驶关注,HN 讨论活跃。K 不通过:正文只有 RSS 片段,未披露上线范围、车队规模、运营时间或是否载客,信息缺口明显。
一句话点评
Waymo 进波特兰,但今天只是人开车跑地图,离真正运营还远。
锐评
Waymo 宣布进入波特兰,但今天开始的只是人工驾驶车辆跑一遍城市,让自动驾驶系统熟悉当地路况。正文没披露车队规模、运营时间或何时开放给乘客。市长和反酒驾组织出来站台,强调自动驾驶能减少交通事故——Waymo 引用数据说在已运营城市减少了 13 倍重伤事故。目前能做的只有去官网注册等通知,离真正坐上无人车还有一段距离。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
17:52
47d ago
r/LocalLLaMA· rssEN17:52 · 04·28
Mistral Medium 要来了,128B 参数,但细节几乎为零
Reddit 上有人发帖说 Mistral Medium 正在路上,参数规模 128B。目前只拿它跟自家 Mistral-Small-4-119B-2603 比了一下,没提发布时间、许可证和跑分。关键悬念是:它是纯稠密模型,还是比 Mistral Small 更不稀疏的 MoE?正文没披露任何实测数据或成本信息,所以这点先别太激动。
#Inference-opt#Mistral#Commentary
精选理由
HKR 三项都勉强过关:128B 的传闻有话题性,参数可验证,且紧扣开源模型竞争。但信源仅一条 Reddit 帖子,没有发布时间、许可证、架构或基准数据,所以分数压在 60–71 区间。
一句话点评
128B 参数,但没跑分没成本,先别激动。
锐评
Reddit 帖子说 Mistral 正在搞一个 128B 参数的 Medium 模型,只跟自家 119B 的 Small 比了一下,没提发布时间、许可证和跑分。关键悬念是:它是纯稠密模型,还是比 Small 更不稀疏的 MoE?如果是稠密 128B,推理成本会比同规模 MoE 高不少,本地部署门槛也更高。正文没披露任何实测数据或成本信息,所以这点先别太激动。另外,Mistral 的 Medium 上次发布还是 2023 年,这次重出江湖是补位还是换代,得等更多细节。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R1
17:41
47d ago
r/LocalLLaMA· rssEN17:41 · 04·28
llama.cpp 新增 Nemotron Nano 3 Omni 转换支持,一个模型搞定视频/音频/图像/文本
NVIDIA 的 Nemotron 3 Nano Omni 是一个多模态模型,能同时处理视频、音频、图像和文本,而且可以商用。llama.cpp 的 PR #22481 给它加上了模型转换支持,方便本地跑。训练时用了五个模型做数据,包括 Qwen3-VL-30B-A3B-Instruct、Qwen3.5-397B-A17B 和 gpt-oss-120b...
#Multimodal#Vision#Audio#ggml-org
精选理由
这是 llama.cpp 给 NVIDIA Nemotron 3 Nano Omni 加转换支持的 PR,模型本身统一了视频、音频、图像和文本理解,还允许商用。训练改进用了 Qwen3-VL-30B-A3B-Instruct 等 5 个模型,但正文没提具体效果提升多少。对本地部署玩家来说,llama.cpp 支持意味着能直接跑,挺实在。不过就是个工具链更新,不是模型首发,所以 H 不通过,K 和 R 都成立,总分 66 合理,没到 72 的精选线。
一句话点评
NVIDIA 的小模型能本地跑多模态了,但别急着激动,训练数据用了五个大模型,成本不低。
锐评
NVIDIA 的 Nemotron 3 Nano Omni 是一个能同时处理视频、音频、图像和文本的多模态小模型,而且可以商用。llama.cpp 的 PR #22481 给它加上了模型转换支持,意味着你可以在本地跑这个模型,不用依赖云端。训练时用了五个模型做数据,包括 Qwen3-VL-30B-A3B-Instruct、Qwen3.5-397B-A17B 和 gpt-oss-120b,说明数据生成成本不低,但模型本身参数规模小,推理成本应该可控。不过正文没披露模型参数量、推理延迟和具体精度,这点先别太激动。另外,来源是 Reddit 上的一个 PR 链接,正文被屏蔽了,信息主要靠标题和摘要,验证弱。如果真能本地流畅跑多模态,对边缘设备场景挺实用,但得等实测。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
17:22
47d ago
X · @dotey(宝玉)· x-apiZH17:22 · 04·28
让 ChatGPT 自己检查自己:一个提升输出质量的技巧
dotey 分享了一个 ChatGPT 使用技巧:利用会话内的 Agent 环境,让模型自己调用工具验证并迭代输出。以写画图提示词为例,先让 ChatGPT 自检、修改,再交给用户验收,结果通常更好。但原文没披露用了哪些工具、测试样本量或成功率,所以效果多好得自己试。
#Agent#Tools#dotey#ChatGPT
精选理由
HKR-K/R通过,因为它描述了一个具体的Agent自检工作流,并戳中了验收成本的痛点。HKR-H不通过;文章缺少具体工具、样本量或成功率,所以落在60–71的实用技巧区间。
一句话点评
让 ChatGPT 自己调用工具验证再迭代,写提示词效果更好。但没披露用了哪些工具、样本量,效果得自己试。
锐评
dotey 分享了一个实用技巧:利用 ChatGPT 会话内的 Agent 环境,让模型自己调用工具验证并迭代输出。以写画图提示词为例,先让 ChatGPT 自检、修改,再交给用户验收,结果通常更好。这个思路本质是把模型当“执行者+质检员”用,减少人工反复调参。但原文没披露用了哪些工具(比如是否调了代码解释器或浏览器)、测试样本量或成功率,所以效果多好得自己试。另外,这个技巧依赖会话内工具调用能力,如果模型工具调用不稳定或环境受限(比如免费版),可能效果打折。对 AI 从业者来说,这是一个低成本提升输出质量的 prompt 工程思路,但需要结合具体场景验证。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
16:23
47d ago
X · @dotey(宝玉)· x-apiZH16:23 · 04·28
开源项目试水AI生成UI,离Claude Design还有距离
作者试了一个开源项目,生成的是HTML雏形,交互和内容完整度都差一截;而Claude Design直接输出React组件,界面美观、交互流畅。正文没提项目名、提示词和复现环境,但作为开源起步已经不错,值得看看。
#Code#Tools#Claude Design#Open source
精选理由
HKR-R通过,因为AI生成UI的质量和交互完成度是产品与前端团队的真实痛点。HKR-H和K不通过:正文没披露项目名称、测试提示词和复现条件,信息缺口太大,只能算一条低信号的个人试用感受。
一句话点评
开源版Claude Design雏形,交互和完成度差一截,但起步不错。
锐评
作者对比了一个开源项目与Claude Design:后者直接输出React组件,界面美观、交互流畅;前者目前只生成HTML雏形,交互和内容完整度都差不少。正文没披露项目名、提示词和复现环境,信息缺口明显,没法直接复现或评估。但作为开源起步,能做到这个程度已经值得关注,尤其对想低成本搭建类似工具的人来说是个参考。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
16:17
47d ago
Hacker News 首页· rssEN16:17 · 04·28
Poolside 发布 Laguna XS.2 和 M.1 两款模型
poolside 放出了 Laguna 家族的头两个模型:M.1 和 XS.2。M.1 是个 225B 总参数、23B 激活的 MoE 模型,去年底完成预训练,在 SWE-bench Pro 上跑到 46.9%。XS.2 则小得多,33B 总参数、3B 激活,但 SWE-bench Pro 也有 44.5%,而且权重用 Apache 2.0 协议开源了...
#poolside#Product update
精选理由
HKR 三项全挂:这条 feed 只暴露了 poolside 两个模型名加 HN 互动数据,没有规格、定价、能力宣称或可复现的测试。0/3 的 HKR 分数直接把它归入 excluded。
一句话点评
Poolside 发了两个编程模型:Laguna M.1(225B参数,激活23B)和 XS.2(33B参数,激活3B,开源)。M.1 在 SWE-bench Pro 上 46.9%,XS.2 也有 44.5%,跟 Qwen3.5 差不多,但参数少很多,成本更低。不过 Terminal-Bench 2.0 上 XS.2 只有 30.1%,比 Qwen3.6 的 51.5% 差一截,说明复杂终...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R0
16:15
47d ago
X · @dotey(宝玉)· x-apiZH16:15 · 04·28
GPT 5.5 后作者更爱用 Codex 和 ChatGPT:写作变强、能画图、暂时不限量
dotey 说 GPT 5.5 之后他更常用 Codex 和 ChatGPT 了,理由是 GPT 的写作能力明显提升,还能直接画图,而且目前没有 token 焦虑(即暂时不限量或价格可控)。不过正文没披露 GPT 5.5 的具体规格、token 上限或定价,所以“没有焦虑”这点先别太激动,可能只是个人体验或早期阶段。
#Code#Multimodal#dotey#OpenAI
精选理由
dotey 说 GPT 5.5 后更常用 Codex 和 ChatGPT,理由是写作变强、能画图、没有 Token 焦虑。但正文只有一条 RSS 片段,没披露 GPT 5.5 的上下文窗口、价格或参数规模,信息缺口很大。H 和 R 通过是因为它点出了 Token 成本这个真实痛点,对开发者有共鸣;K 不通过,因为这是一条个人印象,没有可验证的细节。
一句话点评
GPT 5.5 写作和画图变强,但“没 token 焦虑”可能只是早期体验。
锐评
dotey 说 GPT 5.5 之后他更常用 Codex 和 ChatGPT 了,理由是写作能力明显提升,还能直接画图,而且目前没有 token 焦虑(即暂时不限量或价格可控)。这听起来像一次体验分享,不是官方公告。关键信息缺口:正文没披露 GPT 5.5 的具体规格、token 上限或定价,所以“没有焦虑”这点先别太激动——可能只是个人体验或早期阶段,也可能是 OpenAI 暂时放宽了限制来推广新模型。如果真能做到写作+画图且不限量,那对日常使用是好事,但需要更多用户反馈和官方数据来验证。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
16:12
47d ago
r/LocalLLaMA· rssEN16:12 · 04·28
Nemotron-3-Nano-Omni-30B-A3B-Reasoning:英伟达新多模态模型,30B参数但只激活3B
Reddit 用户发现了一个叫 Nemotron-3-Nano-Omni-30B-A3B-Reasoning 的模型,名字很长但信息量不小:30B 是总参数量,A3B 指每次推理只激活 3B 参数(类似 Mixture of Experts 的省算力设计)。它能处理音频、图片、视频和文本,统一输出文本,属于多模态模型。帖子附了 NVIDIA BF16 ...
#Multimodal#Audio#Reasoning#NVIDIA
精选理由
来源是 Reddit 用户爆料,不是官方发布,正文也没给训练数据、基准分数或许可证,信息缺口明显。但 30B/A3B 的 MoE 规格和多模态支持(音频/图像/视频/文本)对本地部署党有吸引力,unsloth 的 GGUF 链接也降低了试玩门槛。综合看是个值得跟踪的线索,但别急着当正式产品,分数压在 68 合理。
一句话点评
NVIDIA 出了一个 30B 总参数、每次只激活 3B 的多模态推理模型,能看、能听、能读,但还没公开跑分和训练数据。
锐评
这个模型名字很长但信息量不小:30B 是总参数量,A3B 指每次推理只激活 3B 参数(类似 MoE 的省算力设计),对本地部署友好。它能处理音频、图片、视频和文本,统一输出文本,属于多模态模型。帖子附了 NVIDIA BF16 和 unsloth 的 GGUF 量化版本,说明社区已经在做本地化适配。 但正文被 Reddit 屏蔽了,所以关键信息全缺:没有 benchmark 分数、没有训练数据来源、没有许可证说明。名字带“Reasoning”但不知道是 CoT 还是别的推理机制。如果是真开源且推理能力不错,那对本地多模态场景是个好消息;但这点先别太激动,等跑分和许可证出来再说。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:11
47d ago
X · @dotey(宝玉)· x-apiZH16:11 · 04·28
上下文窗口塞太满,再强的模型也会变笨
dotey 实测发现,不管模型多强,上下文窗口占用太满输出质量都会下降。固定格式的文档写作,Sonnet 和 Opus 差别不大;但对写作要求高的任务,Opus 明显更好。正文没披露具体样本量、窗口大小和评分标准,结论偏经验分享。
#Memory#dotey#Sonnet#Opus
精选理由
只有 R 通过:上下文衰减和 Opus 的成本权衡是真实痛点。H 和 K 不通过,因为正文没给样本量、窗口长度和评分方法,信息缺口太大,只能算低价值段子。
一句话点评
上下文塞太满,再强的模型也会变笨。
锐评
dotey 实测发现,上下文窗口占用过高时,所有模型输出质量都会下降。固定格式写作(如填表格)Sonnet 和 Opus 差距不大,但高要求写作 Opus 明显更好。正文没披露样本量、窗口大小和评分标准,结论偏经验分享,可参考但别当严谨评测。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H0·K0·R1
16:09
47d ago
TechCrunch AI· rssEN16:09 · 04·28
Lovable 的“氛围编程”App 上线 iOS 和 Android,手机也能写网页
Lovable 把它的 AI 无代码应用构建器搬到了手机上,现在 iOS 和 Android 都能下载。你对着手机说话或打字描述想法,AI 就能自动帮你生成网页应用,还能在电脑和手机之间同步进度,做完会推送通知。不过正文没披露背后用了什么模型、具体怎么收费、哪些地区能用、以及是否支持离线。另外苹果最近刚在 App Store 上对这类“氛围编程”App...
#Code#Lovable#Product update
精选理由
H和K都成立:Lovable上手机端是个具体的新动作,而且手机写代码生成网页这个角度有新鲜感。R不成立:正文没披露模型、定价、上线地区和工作流细节,从业者没法判断技术路线或性价比,只能当普通产品更新看。
一句话点评
Lovable 把无代码应用构建器搬到了手机上,对着手机说话就能生成网页应用,还支持电脑手机同步。
锐评
Lovable 把它的 AI 无代码应用构建器搬到了手机上,iOS 和 Android 都能用。你对着手机说话或打字描述想法,AI 就能自动生成网页应用,还能在电脑和手机之间同步进度,做完会推送通知。这相当于把“氛围编程”从桌面端带到了移动端,降低了随时随地的开发门槛。但正文没披露背后用了什么模型、具体怎么收费、哪些地区能用、以及是否支持离线。另外苹果最近刚在 App Store 上对这类“氛围编程”App 收紧审核,Lovable 能上架说明可能做了合规调整,这点值得关注。整体来看,产品方向对,但技术细节和商业化信息缺失,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
16:07
47d ago
Hacker News 首页· rssEN16:07 · 04·28
Anthropic 加入 Blender 开发基金,成为企业赞助方
Anthropic 以企业赞助方身份加入 Blender 开发基金,资金专门用于 Blender 核心开发,尤其是 Python API 的维护和改进——这个 API 让开发者和艺术家能自己写脚本扩展 Blender 功能。正文没披露赞助金额和期限,所以暂时没法判断这笔钱有多大。值得关注的是,Claude 会不会被整合进 Blender 工作流,比如用...
#Anthropic#Blender#Partnership#Funding
精选理由
Anthropic 加入 Blender 基金,级别是 Corporate Patron,但正文没给出资额、合作时长或技术整合细节。对从业者来说,真正该盯的是 Claude 能否进入 Blender 工作流,比如辅助建模或脚本生成,这点完全没提。所以这条消息更像一个信号,不是落地动作,暂时不值得上推荐位。
一句话点评
Anthropic 赞助 Blender,钱专门修 Python API,但没披露金额和期限。
锐评
Anthropic 以企业赞助方身份加入 Blender 开发基金,资金专门用于 Blender 核心开发,尤其是 Python API 的维护和改进——这个 API 让开发者和艺术家能自己写脚本扩展 Blender 功能。正文没披露赞助金额和期限,所以暂时没法判断这笔钱有多大。值得关注的是,Claude 会不会被整合进 Blender 工作流,比如用自然语言生成脚本或辅助建模,但官方声明只提了 API 维护,没提产品集成。Blender 是开源项目,赞助不买断控制权,Anthropic 更多是刷存在感、拉拢创作者社区。如果金额不大,这更像 PR 动作而非战略投资。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R0
16:06
47d ago
Hacker News 首页· rssEN16:06 · 04·28
AI 在最大开源医疗记录软件中发现 38 个漏洞
安全公司 AISLE 用自家 AI 分析器扫描了开源电子病历系统 OpenEMR,一个季度就挖出 38 个 CVE 漏洞,比 2018 年人类团队花大功夫找到的 23 个还多。OpenEMR 覆盖全球超 10 万医疗机构、2 亿患者,影响面很大。最严重的一个是 CVSS 10.0 的 SQL 注入,出在患者 REST API 的排序参数上——没做任何校...
#Agent#Code#Safety#AISLE
精选理由
38 个 CVE 和满分漏洞确实有冲击力,但文章主要堆漏洞编号和 CVSS 分数,没讲清楚 AI 审计比传统人工审计强在哪、误报率多少。医疗软件覆盖面广(10 万机构、2 亿患者),风险真实,但信息缺口明显——比如审计工具叫什么、怎么验证的都没提。评分 68 合理,不往上调是因为细节不够硬。
一句话点评
AI 挖漏洞比人快,但别急着全信。
锐评
安全公司 AISLE 用自家 AI 分析器扫了开源电子病历系统 OpenEMR,一个季度挖出 38 个 CVE 漏洞,比 2018 年人类团队花大功夫找到的 23 个还多。OpenEMR 覆盖全球超 10 万医疗机构、2 亿患者,影响面很大。最严重的一个是 CVSS 10.0 的 SQL 注入,出在患者 REST API 的排序参数上——没做任何校验,如果数据库用户有 FILE 权限就能远程执行命令。 不过这是 AISLE 自家的工具,不是第三方独立评测,结果可能有水分。正文没披露 AI 分析器的误报率,也没说这些漏洞在真实环境里被利用的概率。如果是真的,AI 辅助挖洞确实能大幅降低人力成本,但安全行业更缺的是修漏洞的人,不是发现漏洞的工具。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:00
47d ago
● P1NVIDIA 博客· rssEN16:00 · 04·28
英伟达发布 Nemotron 3 Nano Omni 多模态模型,支持图文音视频处理
英伟达在 2026 年 4 月 28 日开源了 Nemotron 3 Nano Omni,一个能同时处理文字、图片、音频、视频、文档、图表和屏幕界面的多模态模型。它用了 30B-A3B 的混合专家架构(MoE),实际激活的参数量是 3B,配合 Conv3D 和 EVS 技术来处理音视频,上下文窗口拉到 256K。官方说在保持交互延迟不变的前提下,跑 A...
#Agent#Multimodal#Vision#NVIDIA
精选理由
NVIDIA 这次把视觉、语音、文字塞进一个 30B-A3B 的混合专家模型里,还开放了权重和训练技术。我会先打个折:9 倍效率提升是跟谁比、测什么任务,正文没细说,这点先别太激动。但 256K 上下文、Conv3D 和 EVS 这些配置,加上直接上 Hugging Face 和 OpenRouter,对想用开源方案搭多模态 agent 的团队确实省事。单信源,信息够用但不算独家,所以放在 featured 里。
一句话点评
英伟达把视觉、语音、文字塞进一个8B小模型,跑在单张消费级显卡上,处理长文档和视频的性价比很高,但实际效果还得看落地测试。
锐评
英伟达这次发布的 Nemotron 3 Nano Omni 是个 80 亿参数的小模型,主打多模态,能同时看懂图片、听懂语音、读文字,还能处理长达 128K token 的上下文,相当于一次能啃完一本《三体》。它最大的卖点是效率:官方说在视频和文档理解任务上,比同类模型快了 9 倍,而且可以在单张 RTX 4090 这类消费级显卡上跑,不用非得堆昂贵的服务器。这对想在自己电脑上跑多模态应用的开发者来说,门槛降了不少。 不过,这篇博客主要讲的是架构和性能指标,比如用了“多模态混合专家”结构来省计算量,但没给出具体的训练数据来源和规模,也没提在中文场景下的表现。9 倍的效率提升听起来很诱人,但对比的基准模型是谁、测试条件是什么,正文没有详细展开。另外,模型虽然开源了权重,但商用许可的具体条款需要自己去查。 总的来说,这是一个在端侧部署上很有野心的模型,适合做需要同时处理多种信息流的智能体,比如会议纪要整理、视频内容分析。但如果你关心的是绝对精度而不是成本和速度,那还得等第三方评测出来再下结论。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
15:58
47d ago
● P1Hacker News 首页· rssEN15:58 · 04·28
Warp 开源终端工具客户端代码
Warp 终端客户端正式开源,仓库托管在 GitHub(warpdotdev/warp),OpenAI 是创始赞助商。最大看点不是代码本身,而是他们用自家 Agent 编排平台 Oz 来管理社区贡献——让 GPT 模型(具体版本未披露)负责写代码,人类只负责定需求和验收。Warp 团队认为“写代码不再是瓶颈,瓶颈是人工评审”,所以把实现交给 Agent...
#Code#Tools#Warp#Open source
精选理由
Warp 开源是个中量级产品更新,HKR 的 H 和 R 通过,但 K 信息太薄:只有开源声明和 HN 热度,缺关键细节。不够上精选。
一句话点评
Warp 把客户端代码开源了,用 AGPL 协议,OpenAI 是创始赞助商。亮点是他们想用 AI 代理管开源社区,但正文没披露代理具体怎么审核代码、出错谁兜底。
锐评
Warp 这次开源不是单纯放代码,而是押注一种新的开发模式:让外部贡献者通过他们自家的 AI 编排平台 Oz 来管一群编码代理干活。逻辑是,代码实现交给代理,人只负责提需求和验收,理论上能突破内部团队的人力瓶颈。这个想法挺大胆,但正文只讲了愿景,没给任何数据——比如代理生成的代码一次通过率多少、社区贡献者实际参与门槛多高、AGPL 协议下企业用户会不会有合规顾虑。OpenAI 作为创始赞助商,用的是 GPT 模型,但也没说清楚模型调用成本谁承担、代理出错时的责任边界在哪。开源仓库刚上线,现在还看不到社区活跃度和代码质量,所以“更快做出更好的 Warp”这个说法,得等几个月看实际合并记录才能验证。
HKR 分解
hook knowledge resonance
打开信源
89
SCORE
H1·K0·R1
15:43
47d ago
r/LocalLLaMA· rssEN15:43 · 04·28
Lemonade OmniRouter:一个路由把四个本地模型串起来干活
这个项目用 181 行 Python 代码,把 sd.cpp(画图/修图)、kokoros(文字转语音)、whisper.cpp(语音转文字)和 llama.cpp(看图说话)四个本地引擎串成一个服务,接口兼容 OpenAI 的 tool call 格式。好处是用户不用自己拼多模型流程,坏处是正文没披露路由延迟和并发能力——如果每个引擎都跑在本地 NP...
#Tools#Multimodal#Audio#Lemonade
精选理由
H/K/R 全过,有具体的本地后端和 181 行 Python 示例。扣分在信息来源是 Reddit,权威性一般,且场景偏窄,所以分数卡在 60–71 的工具更新区间。
一句话点评
181行代码把四个本地模型串成一条服务,接口兼容OpenAI,但延迟和并发都没说。
锐评
Lemonade OmniRouter 用 181 行 Python 把 sd.cpp(画图/修图)、kokoros(文字转语音)、whisper.cpp(语音转文字)和 llama.cpp(看图说话)四个本地引擎串成一个服务,接口兼容 OpenAI 的 tool call 格式。好处是用户不用自己拼多模型流程,直接调一个接口就能让模型“画图→转语音”或“听语音→看图回答”。代码量极低,适合快速原型。但正文没披露路由延迟和并发能力——如果每个引擎都跑在本地 NPU/GPU 上,串行调用时总延迟可能是单模型的 4 倍,且没有说明是否支持异步或批处理。另外,四个引擎的依赖和硬件要求不同(比如 sd.cpp 需要 GPU 显存,whisper.cpp 在 CPU 上也能跑),实际部署时资源冲突和调度策略才是难点,这点文章没提。适合想低成本搭多模态 demo 的开发者,但生产环境需要自己补负载测试和容错逻辑。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
15:16
47d ago
r/LocalLLaMA· rssEN15:16 · 04·28
非程序员用 Qwen 3.6 35B 写代码:关键不是模型,是让它自己跑测试
一个 Reddit 用户说自己不是程序员,但用 Qwen 3.6 35B 写代码效果不错。他分享的窍门是:让模型写代码后自动运行测试,根据报错反复修改,直到通过。他拿这个流程做了三个项目:一个 Python Discord 机器人、一个 Docker 化的 MCP 服务器、一个每周菜单规划器。重点不是 Qwen 3.6 这个模型有多强,而是“写代码→跑...
#Code#Agent#Tools#Qwen
精选理由
H/K/R 都够,但这是一条 Reddit 个人经验帖,没有成功率、耗时或代码质量数据。亮点是测试闭环这个实操细节,不是模型本身。分数卡在 60–71 之间合理,上不了精选。
一句话点评
非程序员用 Qwen 3.6 35B 写代码,靠自动跑测试循环改错,做了三个项目。
锐评
这条帖子的价值不在模型本身,而在工作流:让模型写代码→自动跑测试→根据报错反复改,直到通过。作者不是程序员,用这个流程做出了 Python Discord 机器人、Docker 化的 MCP 服务器和每周菜单规划器。这说明 35B 级别的本地模型在“测试驱动”的闭环里已经能产出可用的项目,对非开发者是个实用信号。但正文被 Reddit 屏蔽,看不到具体报错类型、迭代次数和最终代码质量。关键缺口:测试覆盖率多高?复杂逻辑(如数据库操作、异步任务)能否处理?如果只是简单脚本拼接,这个流程的泛化能力有限。另外,Qwen 3.6 35B 的推理成本(显存占用、速度)和商用模型(如 Claude)的对比也没提。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:14
47d ago
r/LocalLLaMA· rssEN15:14 · 04·28
Poolside 发布 33B MoE 模型 Laguna XS.2,agent 能力接近 Qwen 3.5
Poolside 放出了 Laguna XS.2 的权重,33B 参数、A3B MoE 架构,Apache 2.0 许可。官方说它在 agent 任务上的表现跟 Qwen 3.5 35B A3B 差不多,但不如 Qwen 3.6。训练细节在博客里,正文没披露用了什么数据集。
#Agent#Code#Poolside#Qwen
精选理由
HKR-K和R都通过:33B A3B MoE、Apache 2许可、Hugging Face权重、与Qwen 3.5/3.6的对比都是硬信息。H不通过,标题平淡。正文没披露训练数据集和完整细节,所以分数压在60-71区间。
一句话点评
Poolside 开源了 33B 的 Laguna XS.2,agent 任务跟 Qwen 3.5 35B 差不多,但不如 Qwen 3.6。Apache 2.0 许可,权重已放。
锐评
Poolside 这次开源诚意足,33B 参数、A3B MoE 架构,Apache 2.0 许可直接上 Hugging Face。官方说 agent 任务跟 Qwen 3.5 35B A3B 持平,但不如 Qwen 3.6——这点先别太激动,毕竟 Qwen 3.6 还没开源,对比基准不透明。训练细节在博客里,但正文没披露用了什么数据集,也没说微调数据量。对于想跑本地 agent 或代码任务的团队,33B 的 MoE 推理成本低,值得一试。不过验证偏弱:只有官方自报的 agent 分数,缺第三方评测和具体任务拆解。如果真能接近 Qwen 3.5 的水平,那对本地部署是个好消息,但建议等社区跑分再下结论。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
15:07
47d ago
● P1X · @claudeai· x-apiEN15:07 · 04·28
Claude 接入 Photoshop、Blender 和 Ableton 等创意工具
Claude 上线了 Blender 连接器,你可以在对话里让它帮你排查场景问题、写新工具,或者批量修改所有物体。正文没提这个功能是免费还是付费、支持哪些版本,也没说清楚 Claude 在 Blender 里的操作权限边界——它能改到什么程度、会不会误删东西,这些都得等实测才知道。
#Agent#Tools#Anthropic#Claude
精选理由
HKR 三项都过:Claude 接 Blender 是 Agent 往专业工具里伸了一只真能干活的手,不是概念图。正文没提版本、定价和上线范围,所以重要性停在 76,够 featured 但不到必写。我会先打个折——没看到实际跑起来的延迟和权限边界,这点先别太激动。
一句话点评
Claude 能直接操作 Photoshop、Blender 和 Ableton 了,不是生成内容,是替你点按钮、调参数。
锐评
Anthropic 给 Claude 装上了“创意连接器”,让它能直接操控 Photoshop、Blender、Ableton 这类专业软件。这跟之前让模型生成图片或音乐不一样——现在是模型去操作软件界面,帮你调图层、改节点、动音轨。对设计师和音乐人来说,省掉的是来回切换窗口和手动执行的步骤。 文章提到 Anthropic 同时给 Blender 基金会捐了一笔钱,目的是帮这个开源软件保持免费。这步棋挺聪明:先确保工具本身不被商业收购掐住脖子,再把自己的模型嵌进去。但正文没披露具体捐了多少,也没说连接器的延迟和错误率怎么样。创意工具对实时反馈要求很高,如果模型操作卡顿或者误触,体验会大打折扣。 现在还缺几个关键信息:连接器是本地运行还是走云端?支持哪些具体版本?对复杂工程文件(比如几百个图层的 PSD)的处理能力如何?这些直接决定它是真能进专业管线,还是只适合轻量演示。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
15:04
47d ago
Product Hunt · AI· rssEN15:04 · 04·28
ElevenLabs 推出客服与销售语音/聊天 Agent 模板
ElevenLabs 上线了预置的语音和聊天 Agent 模板,主打客服和销售场景。用户只需把模板指向自己的知识库或工作流,就能直接部署一个配置好的 Agent,不用从零搭建。正文没披露定价、底层模型、集成方式或具体上线时间,所以实际落地成本还不清楚。
#Agent#Audio#ElevenLabs#Product update
精选理由
小产品更新:HKR-K 靠产品存在和用例描述通过,但 HKR-H/R 偏弱。价格、模型、集成方式和上线时间都没说,所以分数压在 60 以下。
一句话点评
ElevenLabs 出 Agent 模板了,主打客服和销售,但定价和模型都没说。
锐评
ElevenLabs 把语音和聊天 Agent 做成了预置模板,用户只需指向自己的知识库或工作流就能部署,不用从零搭。场景明确:客服、AI销售、内部赋能。这对想快速试水语音 Agent 的团队来说,门槛确实降低了。但正文没披露定价、底层模型、集成方式或具体上线时间,所以实际落地成本还不清楚。如果按调用量计费,对高频客服场景可能不便宜;如果是固定月费,小团队才敢试。另外,模板的定制深度、能否对接现有CRM/工单系统,这些都没提。一句话:方向对,但信息缺口太大,先别急着上生产环境。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
14:35
47d ago
Hacker News 首页· rssEN14:35 · 04·28
Rocky:一个给数据仓库加分支、回放和列级血缘的Rust控制平面
Rocky是一个用Rust写的数据管道控制平面,不替代Databricks、Snowflake这些存储和计算引擎,而是在它们上面加一层治理层。核心功能包括:给SQL管道做分支(像Git一样)、SQL回放、编译时推导列级血缘、8字段审计、预算钩子,以及12种SQL方言的lint检查。亮点是把数据治理嵌进CI流程——从数据分类到脱敏检查都能自动化。项目刚发...
#Code#Tools#Rocky#Databricks
精选理由
Rocky 是一个数据与 SQL 治理工具,不是模型、智能体或重大 AI 产品发布。HKR 三项都通过,但属于小众开源工具,分数维持在 60–71 区间合理。
一句话点评
给数据管道加 Git 分支和回放,治理嵌进 CI,但刚发布,生态和稳定性待验证。
锐评
Rocky 用 Rust 写了一个数据管道控制平面,不替代 Databricks、Snowflake 等存储计算引擎,而是在上面加一层治理层。核心功能包括:给 SQL 管道做分支(像 Git 一样)、SQL 回放、编译时推导列级血缘、8 字段审计、预算钩子,以及 12 种 SQL 方言的 lint 检查。亮点是把数据治理嵌进 CI 流程——从数据分类到脱敏检查都能自动化。项目刚发布,正文没披露实际用户案例或性能基准,分支和回放功能在大型生产管道的稳定性、与现有调度器(如 Airflow)的集成成本都未知。如果团队正头疼数据血缘和审计合规,这个方向值得关注,但建议先在小范围试水。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
13:54
47d ago
● P1Ben's Bites· rssEN13:54 · 04·28
GPT-5.5 来了,价格翻倍但号称省 token,Cursor 跟 SpaceX 搞了个大单
OpenAI 发了 GPT-5.5,比上一代贵了一倍,单 token 价格甚至略高于 Claude Opus 4.7。但他们说新模型 token 效率提升了 40%,所以实际跑一个任务的成本没怎么变,Ramp 的测试也印证了这点。Ben 自己用下来觉得模型在“思考:低”模式下又快又聪明,已经把它设成默认了。另外 Claude 的托管代理记忆功能开始公测...
#Agent#Code#Memory#OpenAI
精选理由
这是一篇通讯汇总,不是一手发布,所以分数不会顶到 95 以上。但三条消息都够硬:GPT-5.5 的定价和效率数字能让人直接算账,Claude 记忆功能公测意味着外挂记忆开始进生产流程,Cursor 的收购选择权更是把编程工具的价值拉到一个新量级。我会先打个折,因为正文没展开技术细节,比如 40% 效率提升是在什么场景下测的、记忆功能有没有延迟数据,这些缺口让信息停留在“值得关注”而不是“可以立刻决策”的层面。整体对 AI 从业者来说,信息密度高、不水,给 89 分合理。
一句话点评
GPT-5.5 贵了一倍但 token 效率提升 40%,实际跑任务成本没怎么变,Ben 自己用下来觉得又快又聪明。
锐评
Ben 这期 newsletter 与其说是产品评测,不如说是一个 AI 投资人兼 builder 的自我定位。他聊 GPT-5.5 的方式很实在:价格翻倍,单 token 比 Claude Opus 4.7 还贵,但 OpenAI 说 token 效率提升了 40%,Ramp 的测试也印证了实际任务成本没怎么涨。Ben 自己把“思考:低”模式设成了默认,觉得又快又聪明——这个判断来自个人使用,不是跑分。 Claude 托管代理记忆功能开始公测,Cursor 跟 SpaceX/xAI 的交易里包含 2026 年 600 亿美元的购买选项,这两条正文只提了一嘴,没展开细节。 整篇真正花篇幅的是 Ben 对自己角色的反思:他卡在“非技术人觉得他技术、开发者不觉得”的中间地带,想带读者一起摸索怎么用 agent 干活,而不是卖课。这个视角对正在学用 AI 工具的从业者有用,但别指望从这里拿到模型对比的硬数据。
HKR 分解
hook knowledge resonance
打开信源
89
SCORE
H1·K1·R1
13:26
47d ago
Hacker News 首页· rssEN13:26 · 04·28
OpenAI CEO 的身份验证公司官宣与 Bruno Mars 合作,结果搞错了人
Sam Altman 旗下做虹膜扫描身份验证的公司 Tools For Humanity,4月17日宣布与 Bruno Mars 巡演合作,推出“Concert Kit”工具让“验证过的人类”优先买票。5天后 Bruno Mars 团队和 Live Nation 联合否认,说根本没被接触过。TFH 后来改口,说实际合作对象是 Thirty Second...
#Safety#Tools For Humanity#OpenAI#Sam Altman
精选理由
HKR 三项都达标,但这本质上是 Sam Altman 关联公司的 PR 事故,不是 AI 产品、模型或安全更新。属于有趣但不值得上头条的新闻。
一句话点评
Sam Altman 的虹膜扫描公司官宣了假合作,把 Bruno Mars 和 Thirty Seconds to Mars 搞混了。
锐评
Tools For Humanity 4月17日宣布与 Bruno Mars 巡演合作,推出“Concert Kit”让“验证过的人类”优先买票。5天后 Bruno Mars 团队和 Live Nation 联合否认,说根本没被接触过。TFH 后来改口,说实际合作对象是 Thirty Seconds to Mars 2027 欧洲巡演——两个乐队名字里都有“Mars”,但差了二十多年资历。 这件事暴露了两个问题:一是 TFH 的对外沟通流程可能没做交叉验证,官宣前连合作方都没确认;二是“人类验证”这个卖点本身,如果连合作伙伴都能搞错,用户凭什么相信它能准确区分人和 AI?正文没披露 TFH 内部是否有人为此担责,也没说 Concert Kit 的具体用户量。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
13:19
47d ago
TechCrunch AI· rssEN13:19 · 04·28
脑机接口公司Neurable想把“读心术”授权给消费级穿戴设备
Neurable计划对外授权其非侵入式“读心”技术,说白了就是通过脑电波采集神经数据,用在耳机、头戴设备这类消费品上。CEO认为应用场景很广,但正文没披露授权价格、硬件规格和落地时间。这点先别太激动——技术成熟度和隐私处理方式都还是未知数。
#Neurable#Product update
精选理由
HKR-H和HKR-R成立:消费级“读心”可穿戴确实有话题性和隐私张力。HKR-K不成立:授权条款、硬件规格、上市时间和可复现的技术细节都没披露,信息量撑不起一个“值得跟进”的判断。
一句话点评
Neurable 要把脑电波“读心”技术授权给耳机、头戴设备厂商,但没披露价格、硬件规格和落地时间。
锐评
Neurable 做的是非侵入式脑机接口,说白了就是靠脑电波采集神经信号,然后授权给消费硬件厂商,比如耳机、头戴设备。CEO 画了个大饼,说应用场景很广,但正文没披露授权价格、硬件规格和落地时间。这点先别太激动——技术成熟度和隐私处理方式都还是未知数。非侵入式方案虽然比开颅安全,但信号精度和抗干扰能力一直是瓶颈,用在消费级产品上效果能打几折不好说。另外,神经数据属于敏感生物信息,Neurable 怎么处理隐私合规、用户能否关闭采集,正文一个字没提。如果真能低成本集成到现有耳机里,对注意力监测、冥想辅助这类场景是个新入口,但前提是信号质量别太拉胯。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H1·K0·R1
13:00
47d ago
TechCrunch AI· rssEN13:00 · 04·28
Red Hat 工程师给 OpenClaw AI 智能体套了个容器,企业部署更安全了
Red Hat 的 OpenClaw 维护者 Sally O'Malley 发布了一个叫 Tank OS 的开源工具,把 OpenClaw AI 智能体(可以理解成能自主干活的 AI 程序)装进容器里跑。容器相当于一个隔离沙箱,能让智能体在运行时不乱动宿主系统,尤其适合同时跑几十上百个智能体的企业场景。不过正文没披露具体的隔离机制、版本号或定价,想评估...
#Agent#Safety#Red Hat#OpenClaw
精选理由
HKR-K 和 HKR-R 通过:Tank OS 有明确的“容器化 agent 批量部署”事实,且切中企业级 agent 集群运维安全这个角度。正文没披露隔离机制、版本号和价格,所以分数压在 60–71 区间。
一句话点评
Red Hat 给 OpenClaw 智能体套了个容器沙箱,跑大批量时更安全。
锐评
Red Hat 的 OpenClaw 维护者 Sally O'Malley 发布了一个叫 Tank OS 的开源工具,把 OpenClaw AI 智能体(能自主干活的 AI 程序)装进容器里跑。容器相当于一个隔离沙箱,能让智能体在运行时不乱动宿主系统,尤其适合同时跑几十上百个智能体的企业场景。不过正文没披露具体的隔离机制、版本号或定价,想评估实际安全性还得等更多细节。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
12:56
47d ago
● P1量子位 · 公众号· rssZH12:56 · 04·28
小米开源MiMo-V2.5系列模型及Pro代理框架
小米把 MiMo-V2.5 系列的权重放出来了,包含 Pro Agent、多模态基座、TTS 和 ASR 几个模型。MiMo-V2.5-Pro 在 4.3 小时内连续调用了 672 次工具,在 SysY 基准上拿了满分 233 分,全程没让人接手,直接跑通了一个带 54 个应用的类 macOS 桌面。对从业者来说,值得关注的是它支持 100 万 tok...
#Agent#Code#Audio#Xiaomi
精选理由
HKR 三项全中:小米把 MiMo-V2.5 系列权重直接放出来,Agent 和代码任务的数字够具体,4 小时无接管跑出完整桌面是个强钩子。作为国产旗舰模型开源,属于当天必须写的那类消息。
一句话点评
小米把MiMo-V2.5系列全开源了,Pro版能同时操作54个应用不崩,浏览器真能自己冲浪,但正文没披露具体任务成功率。
锐评
小米这次把MiMo-V2.5系列模型和Pro代理框架都开源了,最抓眼球的是Pro版在演示里同时开了54个应用、浏览器能自主操作网页,没中断。这相当于让模型直接进桌面环境干活,不是只聊天。但得先打个折:文章来自量子位,原始公众号页面环境异常,我们没看到一手技术报告,所有性能数字都来自二手转述。 关键信息缺了不少。54个应用同时开,到底完成了什么任务?成功率多少?延迟多大?这些正文都没给。Pro代理框架听起来像是个桌面级agent workflow,但具体怎么调度、容错机制是什么,也没展开。开源是好事,但光有模型权重不够,配套的评测基准和复现步骤如果没跟上,社区很难验证。 对从业者来说,这条值得关注的是小米在端侧多模态代理上的工程尝试,但别急着对标GPT-4V或Claude Computer Use。先等一手技术报告,看看真实任务完成率和硬件需求再说。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
12:56
47d ago
持续报道 · 49d量子位 · 公众号· rssZH12:56 · 04·28
量子位招聘编辑和作者,三个AI方向,北京中关村
量子位开放了三个内容岗位,分别覆盖AI基础设施、金融和产品方向,全部是北京中关村的坐班全职。岗位分编辑、资深作者和主编三个级别。正文没披露薪资范围,但提到截至2025年公众号订阅者超过240万、全平台用户700万。如果你在找AI媒体方向的工作,这是个直接的机会。
#QbitAI#Personnel
精选理由
HKR-K靠具体的招聘信息和用户数通过,但HKR-H和R都不达标。这是量子位自己的招聘广告,不是AI产品、模型、研究或行业事件,所以归入40分以下的噪音区。
一句话点评
量子位在招编辑作者,三个AI方向。正文被微信屏蔽了,看不到具体岗位要求和待遇。想投的可以直接去公众号找联系方式,但信息不全,建议先观望。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K0·R0
12:48
47d ago
彭博科技· rssEN12:48 · 04·28
英伟达供应商胜宏科技一季度营收增长28%,AI服务器PCB需求撑场
胜宏科技(Victory Giant)一季度营收同比增长28%,主要靠AI服务器用的PCB板(印刷电路板)拉动。28%这个增速在电子代工行业算不错,但正文没披露营收基数、利润率,也没说英伟达订单占多少比例,所以暂时没法判断这笔增长对利润的实际贡献。
#Nvidia#Victory Giant Technology#Commentary
精选理由
HKR-K通过:28%的销售增长是一个具体的AI服务器供应链信号。HKR-H和HKR-R较弱,因为正文未披露收入基数、利润率或英伟达订单占比,所以这条留在all层级。
一句话点评
英伟达供应商胜宏科技一季度营收增28%,靠AI服务器PCB板拉动,但利润和订单占比没披露。
锐评
胜宏科技一季度营收同比增长28%,主要靠AI服务器用的PCB板(印刷电路板)拉动。28%这个增速在电子代工行业算不错,说明AI硬件需求确实在往上游传导。但正文没披露营收基数、利润率,也没说英伟达订单占多少比例,所以暂时没法判断这笔增长对利润的实际贡献。另外,文章来自彭博,但正文被反爬墙拦截了,只有摘要和标题可用,信息缺口比较大。如果后续能补上毛利率变化和英伟达订单占比,才能判断胜宏是真正吃到了AI红利,还是靠低价冲量换来的营收。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
12:18
47d ago
r/LocalLLaMA· rssEN12:18 · 04·28
Qwen 3.6 27B 量化对比:Q4_K_M 用一半内存换 95% 的精度,本地部署首选
Reddit 用户实测了 Qwen 3.6 27B 的三种 GGUF 版本:BF16(原始精度)、Q4_K_M(4bit 量化)和 Q8_0(8bit 量化)。BF16 平均准确率 69.78%,Q4_K_M 和 Q8_0 分别掉到 66.54% 和 66.15%,差距不到 4 个百分点。但 Q4_K_M 峰值内存只要 28GB(BF16 是 54GB...
#Code#Reasoning#Tools#Qwen
精选理由
帖子有一个反直觉的量化结果(Q8_0 不如 Q4_K_M)和具体的本地运行指标,H/K/R 都通过。但来源是 Reddit 个人评测,基准细节有限,所以分数落在 60–71 区间。
一句话点评
Qwen 3.6 27B 量化到 Q4_K_M 后准确率只掉不到 4 个百分点,内存却从 54GB 降到 28GB,本地部署性价比很高。
锐评
Reddit 用户实测了 Qwen 3.6 27B 的三种 GGUF 版本:BF16(原始精度)、Q4_K_M(4bit 量化)和 Q8_0(8bit 量化)。BF16 平均准确率 69.78%,Q4_K_M 和 Q8_0 分别掉到 66.54% 和 66.15%,差距不到 4 个百分点。但 Q4_K_M 峰值内存只要 28GB(BF16 是 54GB),生成速度反而更快(22.5 tok/s vs 15.5),模型文件也从 53.8GB 缩到 16.8GB。Q8_0 表现有点尴尬:内存 42GB、速度 18 tok/s,准确率还略低于 Q4_K_M。 测试用了 HumanEval(代码)、HellaSwag(常识)和 BFCL(函数调用)三个基准,样本量不大(总共 664 条),且只跑了一次,没有多次取均值。正文没披露硬件配置和温度参数,量化对代码生成的影响(掉 5.5 个百分点)比常识推理和函数调用更明显。对于本地或 CPU 部署,Q4_K_M 确实是当前最实用的选择。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
12:00
47d ago
TechCrunch AI· rssEN12:00 · 04·28
Otter 新功能:一个搜索框查遍 Gmail、Notion、Jira 等 5 类企业工具
Otter 上线了企业搜索功能,用户可以把 Gmail、Google Drive、Notion、Jira、Salesforce 这 5 类账号连进来,跟已有的会议记录一起搜。说白了就是不用在几个应用之间来回切,一个搜索框搞定。后续还会支持 Outlook、Teams、SharePoint 和 Slack。不过正文没披露定价、权限控制细节和上线范围,所以...
#Tools#RAG#Otter#Google
精选理由
Otter 这次把搜索范围从会议记录扩展到 Gmail、Drive、Notion、Jira、Salesforce 五个常用工具,等于给企业用户一个统一搜索入口,省得在多个应用间来回切。痛点很明确——知识散落在不同系统里,找东西费劲。但正文没提价格、权限机制和上线范围,这点先别太激动:如果权限控制不到位,搜出来的结果可能不该看的人也能看到,合规风险不小。整体看是个务实的功能更新,但信息缺口让判断只能打七折。
一句话点评
Otter 把会议记录和 Gmail、Notion 等 5 个工具打通了,一个搜索框搞定跨应用查询。
锐评
Otter 这次做的是企业搜索,把 Gmail、Google Drive、Notion、Jira、Salesforce 这 5 类账号连进来,跟已有的会议记录一起搜。说白了就是不用在几个应用之间来回切,一个搜索框搞定。后续还会支持 Outlook、Teams、SharePoint 和 Slack。 对用户来说,这比单独搜每个工具方便,尤其适合开会后想找邮件里提到的附件或 Jira 里的任务。但正文没披露定价、权限控制细节和上线范围,所以企业采购前得自己问清楚:能不能按部门或项目隔离数据?管理员能不能控制谁搜什么?这些没讲,先别急着推全公司。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
11:56
47d ago
Hacker News 首页· rssEN11:56 · 04·28
微软开源语音 AI VibeVoice,GitHub 星数 4.3 万但技术细节几乎为零
微软在 GitHub 上发布了 VibeVoice 仓库,标题自称“开源前沿语音 AI”,目前拿到 4.3 万星和 4900 个 fork,热度很高。但正文只展示了仓库导航栏和页头,没有透露架构、许可证、训练数据或推理条件。星数可以作为关注度的参考,但实际能不能用、效果如何,得自己去翻代码和授权文件。目前信息缺口很大,建议先别急着下结论。
#Audio#Microsoft#GitHub#Open source
精选理由
HKR-H和HKR-R成立:微软开源语音仓库+43.9k star对从业者有吸引力。HKR-K不成立:正文缺许可证、架构、训练数据和推理细节,信息缺口明显。
一句话点评
微软开源语音 AI VibeVoice,4.3 万星但正文只露了仓库导航栏,架构、许可证、训练数据全没披露。星数只能说明关注度高,能不能用得自己翻代码。
锐评
微软在 GitHub 上扔了个 VibeVoice 仓库,标题自称“开源前沿语音 AI”,目前 4.3 万星、4900 fork,热度确实高。但正文只截到了仓库导航栏和页头,架构、许可证、训练数据、推理条件一概没披露。星数只能当关注度参考,实际能不能跑、效果如何,得自己去翻代码和授权文件。目前信息缺口很大——没提用了什么模型架构、训练数据规模、是否支持实时推理、延迟多少。建议先别急着下结论,等有人跑通再说。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
11:54
47d ago
X · @op7418(歸藏)· x-apiZH11:54 · 04·28
Codex 里做 PPT 现在能自动配图了,风格还挺多
作者优化了 Codex 里的 PPT Skills,现在生成 PPT 时会调用 GPT-Image-2 自动配图,支持人文纪实(类似胶片感)、信息图、流程图、对比图、关系图,还能把截图美化并调整比例。流程也改了:生成前会先问用户,不再直接跳过确认。正文没披露图片生成速度、成本或是否支持手动替换,这部分得自己试。
#Tools#Multimodal#Code#Codex
精选理由
正文没披露任何效果数据或用户反馈,就是一个个人工作流小改。亮点是 GPT-Image-2 调用和确认步骤,但没说明图片质量、生成速度或成本变化,信息缺口明显。
一句话点评
Codex 的 PPT 技能现在能自动配图了,但速度、成本、能否手动换图都没说。
锐评
作者在 Codex 里给 PPT Skills 加了个自动配图流程,调用 GPT-Image-2 生成图片,支持人文纪实(类似胶片感)、信息图、流程图、对比图、关系图,还能美化截图并调比例。生成前会先问用户,不再直接跳过确认。 亮点是图片风格有区分度,不是千篇一律的 AI 图。但正文没披露图片生成速度、每次调用成本、是否支持手动替换或编辑,这些对实际使用很关键。如果生成慢或贵,自动配图反而拖累效率。建议自己试一下再决定是否常用。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
11:29
47d ago
Hacker News 首页· rssEN11:29 · 04·28
新建燃气数据中心年排放量超过整个摩洛哥
WIRED 审查了 OpenAI、Meta、Microsoft、xAI 等公司关联的 11 个数据中心园区的燃气项目许可文件,发现这些项目每年可能排放超过 1.29 亿吨温室气体,比摩洛哥 2024 年全年排放还高。这些数据中心不走电网,自己建燃气发电(即“表后供电”),因为等电网接入太慢、公众又怕电费涨。正文没披露这些排放量具体怎么算的、基准国家选摩...
#Wired#Commentary
精选理由
HKR-H 和 HKR-R 通过:标题把 AI 数据中心的外部性能耗包装成可点击的对比。HKR-K 不通过:正文只有片段,没披露排放量、项目规模或方法论,信息不足以支撑判断。
一句话点评
OpenAI、Meta 等公司自建燃气发电站给数据中心供电,年排放1.29亿吨温室气体,比摩洛哥全国还高。
锐评
WIRED 审查了 OpenAI、Meta、Microsoft、xAI 等公司关联的 11 个数据中心园区的燃气项目许可文件,发现这些项目每年可能排放超过 1.29 亿吨温室气体,比摩洛哥 2024 年全年排放还高。这些数据中心不走电网,自己建燃气发电(即“表后供电”),因为等电网接入太慢、公众又怕电费涨。 关键数字:1.29 亿吨/年,相当于一个中等国家的排放量。但正文没披露这些排放量具体怎么算的、基准国家选摩洛哥是否刻意压低对比值,也没说这些项目是否包含碳捕集或抵消计划。对于 AI 从业者,这意味着算力选址的碳约束正在从政策讨论变成实际许可门槛——如果你在规划新集群,得把当地碳排放审批周期算进 timeline。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
11:24
47d ago
Hacker News 首页· rssEN11:24 · 04·28
Claude Code 写的代码,版权到底归谁?
Anthropic 意外泄露了 Claude Code 的 51 万行源码,结果发现这些代码大部分是 Claude 自己写的——那 Anthropic 自己还能主张版权吗?文章拆了三个关键点:第一,美国版权局和最高法院都确认,纯 AI 生成的内容不受版权保护,只有人类做了“有意义的创作决策”(比如选架构、改结构、决定删什么)才算数,光给一句 promp...
#Code#Commentary#Policy
精选理由
HKR-H 和 HKR-R 通过:Claude Code 代码权属是面向从业者的真实法律担忧。HKR-K 不通过:目前只有标题和 HN 上 37 分、35 条评论这些表层信息,没有法律结论或条款细节,无法支撑判断。
一句话点评
Anthropic 意外泄露了 Claude Code 的 51 万行源码,结果发现大部分是 Claude 自己写的——那 Anthropic 自己还能主张版权吗?
锐评
文章拆了三个关键点:第一,美国版权局和最高法院都确认,纯 AI 生成的内容不受版权保护,只有人类做了“有意义的创作决策”(比如选架构、改结构、决定删什么)才算数,光给一句 prompt 不够。第二,雇佣合同通常把工作成果自动归公司,但 AI 辅助写的东西算不算“工作成果”还没判例。第三,训练数据里如果混了 GPL 代码,AI 生成的代码可能“自带传染性”,你不知不觉就违反了开源协议。 文章用 Claude Code 泄露事件当引子,但核心是给所有用 AI 写代码的人提个醒:你写的代码可能根本不受版权保护,别人抄了你也告不了。正文没披露任何具体判例的判决书编号,也没给出“多少比例的人类修改才算够”的量化标准。如果你在商业产品里大量用 AI 生成代码,这篇文章的价值是让你意识到风险,但不会告诉你具体怎么合规。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
10:05
47d ago
Hacker News 首页· rssEN10:05 · 04·28
GitHub 发了一篇可用性更新,但正文几乎没透露任何细节
GitHub 博客发了一篇标题为“可用性更新”的文章,但正文只列出了导航菜单和页面结构,没有说明这次故障的范围、持续时间、影响了哪些产品以及如何修复。Hacker News 上有 67 个点赞和 29 条评论,说明社区在关注,但官方信息缺口很大。如果你想知道自己是否遇到了那次宕机、原因是什么,这篇博客给不了答案。
#GitHub#Hacker News#Incident
精选理由
GitHub 官方发了一条可用性更新,但正文几乎没内容——只有链接、67 个 Hacker News 分和 29 条评论。故障范围、持续多久、哪些服务受影响、怎么修的,全没写。对 AI 工程团队来说,这只能算一个待核实的依赖风险信号,不能直接当事故处理。
一句话点评
GitHub 发了篇故障更新,但正文只有导航菜单,没写任何实质内容。
锐评
标题说“可用性更新”,但正文只列了页面结构,没披露故障范围、持续时间、影响哪些产品以及修复措施。Hacker News 上 67 个点赞、29 条评论说明社区在关注,但官方信息缺口很大。如果你想知道自己是否遇到了那次宕机、原因是什么,这篇博客给不了答案。正文没披露任何故障细节,建议直接看 GitHub 状态页或等后续补充。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K0·R1
10:03
47d ago
X · @Khazix0918· x-apiZH10:03 · 04·28
内部AI工具三件套:Skill Hub、应用入口、一句话部署服务器
作者给公司全员做了内部分享,展示了三个自研AI工具。Skill Hub让员工上传、订阅和自动同步AI技能(Skill),解决版本混乱问题;应用入口统一存放内部应用,包括运营看板和小游戏;服务器部署助手把本地项目一键部署到公司服务器,非技术人员也能用。另外预告了一个免费AI热点监控网站AI Hot,但正文没披露上线时间。
#Agent#Code#Tools#AI Hot
精选理由
这是一条个人发的内部工具分享帖,工具本身具体(Skill Hub 支持上传/订阅/自动同步新版,部署助手一句指令上服务器),所以 HKR 三项都成立。但影响面窄:没有公开上线时间、没有代码、没有定价、没有可复现的部署方案,所以分数卡在 60–71 区间。正文没披露 AI Hot 监控网站何时免费公开,这点先别太激动。
一句话点评
三个内部工具,最实用的是服务器部署助手,非技术人员也能一键部署项目到公司服务器。
锐评
作者分享了三个自研AI工具:Skill Hub解决AI技能版本混乱问题,支持上传、订阅和自动同步;应用入口统一存放内部应用,包括运营看板和小游戏;服务器部署助手把本地项目一键部署到公司服务器,非技术人员也能用。另外预告了一个免费AI热点监控网站AI Hot,但正文没披露上线时间。 亮点是部署助手降低了部署门槛,让vibe coding产出的项目能真正分享使用。但这些都是内部工具,没有开源计划,外部无法验证实际效果。AI Hot网站功能描述比较模糊,只说“精选策略和监控流程”,具体怎么去噪、更新频率、覆盖哪些信源都没说。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
09:56
47d ago
r/LocalLLaMA· rssEN09:56 · 04·28
smolcluster:一个想把家里所有设备凑一起跑模型的工具
一个开发者在做 smolcluster,目标是把自己手头的电脑、Mac mini 全连起来做本地训练和推理。它从零用 Python 和原生 socket 实现了 FSDP、DP、MP、PP 这些分布式策略。演示里用三台 2024 款 16GB Mac mini 跑 GRPO,走同步参数服务器加 vllm-metal worker。效果先别太激动,16G...
#Inference-opt#Fine-tuning#Tools#smolcluster
精选理由
HKR 三项都过,但这是单个 Reddit 项目,只有实现笔记,没披露成熟度、基准测试或可复现日志,所以分数压在 60–71 区间。正文没提训练速度、收敛效果或稳定性,这点先别太激动。
一句话点评
把多台 Mac mini 串起来做分布式训练,想法不错,但 16GB 内存加同步参数服务器,性能瓶颈明显。
锐评
smolcluster 是一个开源项目,目标是把用户手头的多台设备(比如 Mac mini、PC)连起来做本地训练和推理。它从零用 Python 和原生 socket 实现了 FSDP、DP、MP、PP 等分布式策略,不依赖 MPI 或 NCCL。演示里用三台 2024 款 16GB Mac mini 跑 GRPO(一种强化学习微调方法),走同步参数服务器加 vllm-metal worker。 关键数字:三台 16GB 设备,内存总和 48GB,但同步参数服务器意味着每步都要等最慢的节点,通信开销大,实际可用算力远低于三倍。正文没披露训练速度、吞吐量或收敛效果,所以“能跑”和“跑得快”是两回事。 亮点是纯 Python 实现,降低了分布式训练的门槛,适合手头有多台闲置设备的个人开发者尝鲜。但 16GB 内存跑 GRPO 很容易 OOM,且同步模式在异构设备上效率低。如果后续支持异步或流水线并行,实用性会提升。目前更像一个技术验证,离生产级还有距离。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
09:53
47d ago
r/LocalLLaMA· rssEN09:53 · 04·28
RX 6900 XT 跑 Gemma 4 和 Qwen 3.5:Vulkan 比 ROCm 快一点
Reddit 用户 grumd 拿 RX 6900 XT 在 llama.cpp 上对比了 ROCm 6.4.2 和最新 Vulkan 的推理速度。跑 Gemma 4 E2B Q4_K 量化模型、batch 512 时,Vulkan 的预处理速度是 3950.71 tokens/秒,ROCm 是 3807.60,Vulkan 快约 4%。跑 Qwen ...
#Inference-opt#Benchmarking#AMD#llama.cpp
精选理由
单个 Reddit 用户的硬件跑分,覆盖的 GPU 和模型很窄,也没有其他来源交叉验证。对本地推理读者有参考价值,但不够格当头条。
一句话点评
Vulkan 在 RX 6900 XT 上跑 Gemma 4 比 ROCm 快 4%,但生成速度优势更明显。
锐评
Reddit 用户 grumd 实测 RX 6900 XT 在 llama.cpp 上跑 Gemma 4 E2B Q4_K 量化模型,batch 512 时 Vulkan 预处理速度 3950.71 tokens/秒,ROCm 是 3807.60,Vulkan 快约 4%。生成阶段差距更大:跑 Qwen 3.5 4B Q8_0 时,Vulkan 稳定在 88.5 tokens/秒,ROCm 只有 77.8,快了近 14%。这说明对 AMD 老卡(RDNA2 架构)来说,Vulkan 后端在生成场景下比官方 ROCm 更高效,可能因为 Vulkan 驱动优化更到位。不过测试只覆盖了单卡、两个模型和特定量化,没披露功耗和显存占用,也没对比更老的 ROCm 版本。如果你手头有 6900 XT 跑本地推理,可以优先切 Vulkan 后端,但大规模部署或混合精度场景仍需 ROCm 验证。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
09:00
47d ago
最佳拍档· atomZH09:00 · 04·28
Meta和微软同时优化近两万人:裁员、买断、AI基建投入,员工数据被用来训练模型
标题说Meta和微软合计优化近两万个岗位,涉及裁员、自愿买断计划和AI基础设施投入。正文没披露具体时间、哪些部门受影响、买断条件,也没说AI到底替代了哪些岗位。员工被当成AI训练数据这一点值得留意,但细节为零。
#Meta#Microsoft#Personnel#Commentary
精选理由
硬排除6适用:正文为空,只有标题级断言,没有来源、岗位、买断条款或AI替代机制。HKR-H/R通过,HKR-K不通过,所以重要性上限卡在40以下。
一句话点评
标题说裁两万人,但正文一个字都没有,先别信。
锐评
标题说Meta和微软合计优化近两万个岗位,涉及裁员、自愿买断和AI基建投入。但正文是空的,来源只有YouTube标题和RSS摘要,没有具体时间、部门、买断条件,也没说AI到底替代了哪些岗位。员工被当成AI训练数据这个点值得留意,但细节为零。如果是真的,两万人的规模说明大厂在用人上开始动真格,但没数据支撑前只能当传闻看。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H1·K0·R1
08:06
47d ago
r/LocalLLaMA· rssEN08:06 · 04·28
vLLM 负载不均:新 pod 空转,热 pod 排队,怎么破?
Reddit 用户反映,用 vLLM 生产栈自带的 KEDA 自动扩缩容(按等待请求数触发)时,突发 LLM 调用会打爆部分 pod。新 pod 虽然按规则扩容了,但因为没有请求转发机制,热 pod 继续排队,新 pod 却闲着。正文没披露集群规模、QPS 或网关配置,所以问题可能出在负载均衡层——KEDA 只管扩缩,不管把请求分给谁。目前社区建议要么...
#Inference-opt#vLLM#KEDA#Theboyscampus
精选理由
HKR-K/R 通过:KEDA 按等待请求数扩容,但新 pod 空闲,热 pod 队列未被重定向。一条 Reddit 求助帖,没有答案、QPS、网关或集群规模,价值偏低。
一句话点评
vLLM 自带的 KEDA 只管扩缩,不管请求分发,突发流量下热 pod 排队、新 pod 闲置。
锐评
问题很典型:KEDA 按等待请求数触发扩容,但新 pod 启动后没有负载均衡把请求分过去,导致热 pod 继续排队,新 pod 闲着。正文没披露集群规模、QPS 或网关配置,所以不清楚是缺 ingress 层(比如 Nginx/Envoy)还是用了简单的轮询策略。社区建议要么加一个真正的负载均衡器(如 Envoy 或 HAProxy),要么用 vLLM 的 router 组件做请求分发。这点先别太激动——KEDA 本身不是负载均衡器,它只负责扩缩容,问题出在架构上缺了一层。如果集群小(比如 2-3 个 pod),手动调一下 ingress 规则也能撑;大规模生产环境就得补网关。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K1·R1
07:46
47d ago
r/LocalLLaMA· rssEN07:46 · 04·28
MoE vs Dense 模型首次直接对比,论文链接在此
Reddit 用户发帖称这是首次把 MoE(混合专家)和 Dense(传统密集)模型放在同等条件下直接比较,并附了一篇 arXiv 论文链接。但帖子正文没披露模型参数量、训练配置、跑过哪些基准测试、以及具体结论。想复现或评估结论可靠性的从业者得自己去读论文。
#Benchmarking#Reddit#LocalLLaMA#arXiv
精选理由
H 和 R 通过,但 K 不通过——这本质上是一条 Reddit 链接转发帖,没有可复现的设置或结果摘要。对从业者来说,标题有钩子,但正文等于没写,只能算低价值的研究线索,不触发硬排除。
一句话点评
MoE vs Dense 首次同条件对比,但帖子只扔了个论文链接,正文啥都没说。
锐评
Reddit 用户声称这是首次把 MoE(混合专家,多个小模型分工干活)和 Dense(传统大模型一个网络全包)放在同等条件下直接比较,并附了一篇 arXiv 论文链接。但帖子正文没披露模型参数量、训练配置、跑过哪些基准测试、以及具体结论——信息缺口很大,想复现或评估结论可靠性的从业者得自己去读论文。如果论文真的控制了参数量、计算量和数据量,那结果对架构选型有参考价值;但来源是 Reddit 个人帖,未经同行评审,结论要打折。缺的是:论文是否开源、基准测试覆盖哪些任务、以及 MoE 的专家数量和路由策略。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
07:41
47d ago
机器之心 · 公众号· rssZH07:41 · 04·28
openJiuwen 发布「协作工程」规范,把多智能体团队的工作流写成可复用的 SKILL 文件
openJiuwen 社区发布了一套叫 Coordination Engineering 的工程栈,核心是把多个智能体(agent)组队干活的方式标准化。它定义了一个 Team Skill 概念,用 SKILL.md、roles、workflow.md 等文件描述一个团队该怎么做任务,然后通过 teamskill-creator 工具,从一句自然语言描...
#Agent#Tools#Memory#openJiuwen
精选理由
HKR 三项都过:角度有钩子、文件级机制够具体、切中编排与复用的痛点。重要性没到 featured 是因为正文没披露实际采用数据、性能对比或大厂背书,目前更像一个社区规范提案,落地效果待验证。
一句话点评
把多智能体协作流程写成标准化文件,方便复用和分享。
锐评
openJiuwen 社区发布的 Coordination Engineering 工程栈,核心是把多个智能体组队干活的方式标准化。它定义了一个 Team Skill 概念,用 SKILL.md、roles、workflow.md 等文件描述团队任务,然后通过 teamskill-creator 工具,从一句自然语言描述就能生成整套配置。这套东西的好处是让多智能体协作不再是手写脚本,而是可复用、可分享的标准化文件。但正文没披露实际效果数据,比如相比手写流程能省多少时间、任务成功率提升多少。另外,它依赖 JiuwenClaw 框架,目前社区生态还不大,实际落地案例有限。如果真能降低多智能体编排门槛,对中小团队挺实用,但这点先别太激动,等更多 benchmark 或用户反馈出来再说。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:34
47d ago
r/LocalLLaMA· rssEN07:34 · 04·28
7900XT 跑 Qwen3.6 27B 做代码生成,显存吃了 18.6GB
Reddit 用户 Mordimer86 在 7900XT 上跑 Qwen3.6 27B 做 OpenCode 代码任务。他用 llama-server 加载 IQ4_XS 量化版 GGUF 模型,上下文开到 65536,K/V 缓存用 q8_0,显存占用约 18.6/20GB。帖子提到 Qwen3.6 35B MoE 版本能上更高量化,但发帖人觉得 ...
#Code#Inference-opt#Qwen#OpenCode
精选理由
这是一个 Reddit 用户的单条配置求助帖,不是基准测试、横向对比或产品更新。它提供了具体的本地推理设置和显存占用数据,对同款显卡用户有参考价值,但信息量有限,正文没披露实际推理速度或生成质量对比。
一句话点评
7900XT 跑 Qwen3.6 27B 做代码任务,显存吃紧但能跑。
锐评
Reddit 用户 Mordimer86 在 7900XT(20GB 显存)上跑 Qwen3.6 27B 做 OpenCode 代码任务,用 IQ4_XS 量化版 GGUF,上下文开到 65536,K/V 缓存用 q8_0,显存占用约 18.6/20GB,几乎占满。这个配置说明 27B 模型在消费级显卡上勉强能跑长上下文代码生成,但余量很小,跑复杂任务可能爆显存。帖子提到 35B MoE 版本能上更高量化,但作者偏好 27B——MoE 虽然参数多但激活量少,理论上更省显存,但实际效果没对比。 正文没披露具体生成速度(token/s)和代码质量,也没说 OpenCode 任务的具体类型(补全/生成/修复)。如果只是跑通 demo,参考价值有限;如果是实际开发场景,延迟和稳定性才是关键。建议关注后续是否有 benchmark 或实测数据。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K1·R1
06:55
47d ago
r/LocalLLaMA· rssEN06:55 · 04·28
如何在笔记本上跑 Gemma 4 多模态?6GB 显存够用
Reddit 用户问怎么在笔记本上跑 Gemma 4 E4B 多模态模型,目标显存低于 6GB。llama.cpp 目前对这类模型的视觉和音频支持不完善,所以他的方案是:用 Unsloth 的 GGUF Q4 量化版做文本推理,再加一个全精度的 PyTorch 音频编码器,总显存占用约 5.5-6GB。正文没披露具体帧率或延迟,但至少证明 6GB 显存...
#Multimodal#Vision#Audio#Gemma
精选理由
这是一条Reddit上的实现笔记,不是模型或框架发布。有用信号是6GB显存路径和llama.cpp的缺口,适合放在所有频道但不用置顶。正文没披露音频编码器的具体延迟或精度损失,这点先别太激动。
一句话点评
6GB 显存就能跑 Gemma 4 多模态,但音频部分得自己搭编码器。
锐评
Reddit 用户分享了一个在笔记本上跑 Gemma 4 E4B 多模态模型的方案:用 Unsloth 的 GGUF Q4 量化版做文本推理,再外挂一个全精度的 PyTorch 音频编码器,总显存压在 5.5-6GB。这证明 6GB 显存确实能跑,但代价是视觉和音频支持不完整——llama.cpp 目前对这类模型的支持有缺口,用户得自己拼凑编码器。正文没披露具体帧率或延迟,所以实际体验可能打折扣。对想本地跑多模态的开发者来说,这个方案提供了一个低门槛入口,但音频部分的兼容性和性能还需要自己验证。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
06:27
47d ago
X · @op7418(歸藏)· x-apiZH06:27 · 04·28
OpenAI 一到周末就给 Codex 重置速率限制
有用户发现 OpenAI 的 Codex 产品每到周末就会重置速率限制,但推文没提具体是哪个套餐、哪个地区、重置逻辑是什么。如果这是免费或低档套餐的固定策略,那对周末赶活的开发者算个小福利——至少不用等额度恢复。不过正文没披露重置后额度是多少、是否影响付费用户,这点先别太激动。
#Code#OpenAI#Product update
精选理由
这是一条用户发的推文,不是 OpenAI 官方公告。H 和 R 勉强成立,因为确实戳中了重度用户和 coding agent 用户的痛点;但 K 不成立,正文没披露任何关键细节(额度、套餐、地区、重置逻辑),信息量极低,属于低价值的社交信号,没有硬伤但也不值得高优先级处理。
一句话点评
周末重置额度,对赶活的开发者算小福利,但具体规则没披露。
锐评
有用户发现 OpenAI 的 Codex 每到周末就重置速率限制,推文没提是哪个套餐、哪个地区、重置逻辑是什么。如果这是免费或低档套餐的固定策略,那对周末赶活的开发者算个小福利——至少不用等额度恢复。不过正文没披露重置后额度是多少、是否影响付费用户,这点先别太激动。另外,重置频率和额度上限直接影响开发者的实际使用体验,但信息缺口较大,无法判断这是临时 bug 还是有意设计。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
05:41
47d ago
新智元 · 公众号· rssZH05:41 · 04·28
易鑫用自研金融Agent跑通汽车贷款流程,黄仁勋说的100万亿市场有了一个落地样本
易鑫在汽车金融里上线了一套Agent系统,核心是他们自己训的30B参数模型XinMM-AM1,单卡推理每秒能跑370个token,延迟压在200毫秒以内,训练用了超过15万亿token。这套系统真正干活的地方是一个三层架构的Harness控制层,专门处理人工接管、策略合规、操作留痕和训练反馈。正文没披露具体业务指标和实际放款量,所以效果到底怎么样还不好...
#Agent#Multimodal#Safety#Yixin
精选理由
HKR-K和R都过了:模型规格和Harness治理细节对金融Agent落地有参考意义,K给了具体数字,R切中了合规痛点。H偏弱,标题蹭黄仁勋但正文没展开,主体也不是一线实验室,所以分数压在60-71区间。
一句话点评
易鑫用自研30B模型做汽车金融Agent,单卡推理370 token/s,延迟200ms以内,但没披露实际放款效果。
锐评
易鑫这套Agent系统核心是自研的30B参数模型XinMM-AM1,单卡推理每秒370个token,延迟压在200毫秒以内,训练用了超过15万亿token——这个数据量不小,但30B模型在金融场景里够不够用,得看具体业务复杂度。真正干活的是三层Harness控制层,专门处理人工接管、策略合规、操作留痕和训练反馈,这点比单纯堆模型更务实:金融Agent最难的不是推理快,而是出错后谁能兜底、怎么追溯。 正文没披露具体放款量和坏账率,所以“100万亿市场”更像黄仁勋画的大饼,易鑫只是在一个细分场景里先跑通了流程。如果后续能公开Agent替代了多少人工审核、审批通过率变化,才有参考价值。目前看,这套架构对做金融Agent的团队有启发,但效果还得等数据。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
05:38
47d ago
Latent Space· rssEN05:38 · 04·28
图像生成是通往AGI的必经之路
Latent Space 的周报认为,GPT-Image-2、Nano Banana 和 Grok Imagine 这类图像生成模型不是“副业”,而是实现 AGI 必须投入算力的核心工作。理由是:光靠文本、代码和结构化输出不够,多模态视觉生成(包括透明图)才能真正发挥“通用”中的“通用”二字。文章特别强调“图像生成 + Codex 循环”的价值——边写...
#Multimodal#Agent#Code#OpenAI
精选理由
这是一篇4月26-27日的AINews汇总,带有评论性质,不是一手发布。67.1%的分数和100万token上下文确实增加了信息量,但来源单一且是汇总文,所以没给到featured。
一句话点评
图像生成不是副业,是AGI必须砸算力的核心方向。
锐评
Latent Space 这篇周报的核心判断很直接:GPT-Image-2、Nano Banana、Grok Imagine 这类图像生成模型不是“做着玩的”,而是实现 AGI 必须投入算力的主干任务。理由是光靠文本、代码和结构化输出不够,多模态视觉生成(包括透明图)才能真正发挥“通用”中的“通用”。文章特别强调“图像生成 + Codex 循环”的价值——边写代码边生成素材,把开发闭环彻底打通。 但要注意,这篇文章是付费周报,观点性强,缺少具体成本或效率对比数据。比如“GPT-Image-2 + Codex”到底比纯文本编码快多少?没给数字。另外,文章引用的例子(乐高、教育图、信息图)都是展示性用例,没有说明在真实业务场景(如游戏资产管线、UI 批量生成)中的落地效果。 还缺什么:缺图像生成 vs 纯文本/代码在 AGI 路线上的算力分配对比,缺 GPT-Image-2 的 API 定价或推理成本,缺 Nano Banana 和 Grok Imagine 的具体评测基准。如果你在评估是否要把图像生成纳入核心路线,这篇可以作为论点参考,但决策还需要更硬的成本和效果数据。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
04:48
47d ago
r/LocalLLaMA· rssEN04:48 · 04·28
双卡3090跑Qwen3,功耗设到250W最划算
Reddit用户JC1DA实测了2张RTX 3090跑Qwen3.6-27B,用vLLM、TP=2、int4量化加fp8 KV缓存,喂了100条ShareGPT提示。结论是并发数为1时,功耗设到275W生成速度最快,但250W是功耗和速度的平衡点——再往上加电,速度提升就不明显了。正文没披露完整的功耗-速度曲线数值,所以没法精确算省了多少电。如果你自己...
#Inference-opt#Benchmarking#Qwen#vLLM
精选理由
一个 Reddit 用户实测 2×3090 跑 Qwen3.6-27B,发现 250W 是功耗和生成速度的折中点。配置列得挺全,但完整曲线没给,所以只能算个参考点,不是严谨评测。对想省电又不想太慢的本地玩家有参考价值,但别当权威结论。
一句话点评
实测2×3090跑Qwen3.6-27B,250W是功耗和速度的甜点。
锐评
Reddit用户JC1DA实测2张RTX 3090跑Qwen3.6-27B,用vLLM、TP=2、int4量化加fp8 KV缓存,喂了100条ShareGPT提示。结论很实用:并发数为1时,功耗设到275W生成速度最快,但250W是功耗和速度的平衡点——再往上加电,速度提升就不明显了。这意味着如果你自己搭推理服务,把功耗从默认的350W降到250W,能省近30%电,速度损失很小。不过正文没披露完整的功耗-速度曲线数值,所以没法精确算省了多少电。如果你自己跑,建议用类似方法测一下你的模型和卡,因为不同量化、批大小、并发数下甜点可能不同。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R1
04:32
47d ago
Hacker News 首页· rssEN04:32 · 04·28
旧金山:AI 之都,经济拖油瓶
《经济学人》给旧金山贴了个标签:全球 AI 之都,但经济表现却拖后腿。文章标题直接点出这个矛盾,但正文没披露具体的经济指标(比如 GDP 增速、就业率)、AI 公司数量,也没说跟谁比、怎么比的。所以这个“经济 laggard”到底有多差、差在哪,目前只能看个结论。HN 上 30 分、18 条评论,讨论热度一般。
#The Economist#Hacker News#San Francisco#Commentary
精选理由
H 和 R 过关:经济学人的标题自带反差,而且戳中 AI 从业者对旧金山的复杂情绪。K 不过关:正文只有一段摘要,没披露任何可验证的数据,比如 GDP 增速、AI 企业数量、对比城市是谁,所以分数压在 60–71 区间。
一句话点评
《经济学人》说旧金山是AI之都但经济拖后腿,正文没给具体数据,结论先打个折。
锐评
《经济学人》给旧金山贴了个标签:全球AI之都,但经济表现却拖后腿。标题直接点出这个矛盾,但正文没披露具体的经济指标(比如GDP增速、就业率)、AI公司数量,也没说跟谁比、怎么比的。所以这个“经济laggard”到底有多差、差在哪,目前只能看个结论。HN上30分、18条评论,讨论热度一般。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
04:00
47d ago
FT · 科技· rssEN04:00 · 04·28
美国数据中心大分裂:乡下人不想给AI盖电厂
美国农村社区正在抵制AI基础设施,跟白宫唱反调。正文被付费墙挡住,没披露具体地点、项目数量、用电需求或政策细节。
#White House#Financial Times#Policy
精选理由
FT来源有分量,HKR-H和HKR-R靠清晰的数据中心冲突过关。HKR-K不通过,因为RSS摘要里没有地点、项目数量、电力数据或政策机制,所以评分卡在中段全员可见。
一句话点评
美国农村社区跟白宫对着干,抵制AI数据中心建设。
锐评
FT这篇报道点出了一个关键矛盾:白宫在推AI基建,但农村社区不买账。正文被付费墙挡住,没披露具体地点、项目数量、用电需求或政策细节,信息量有限。但光看标题和摘要,这事值得关注——AI数据中心耗电、占地、噪音,农村居民直接受影响,而政策制定者往往忽略基层声音。如果这种抵制扩散,会拖慢美国AI基建落地速度。缺的是具体案例和规模数据,比如有多少项目被拒、涉及多少兆瓦电力。这点先别太激动,等全文出来再看细节。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
04:00
47d ago
AI 群聊日报· atomZH04:00 · 04·28
Claude Code Remote 连接故障、DeepSeek 不调用工具等多项问题
今天群聊信息量很大。Claude Code Remote 频繁 429 断连,有群友自己做了短线重连方案。猫仔复盘了用 AI 改编译器项目的教训:信息太多把 AI 淹了,50 多条需求只听进去不到 20%,0.5M 的 test case 编译出 10M 代码后报错信息又把 AI 刷傻。DeepSeek 在 OpenClaw 中完全不调用工具,群友直言...
#Code#Tools#Agent#Anthropic
精选理由
HKR-K/R通过,但这是群聊汇总,没有复现日志、影响范围或修复时间表。对从业者是实用信号,不够头条。
一句话点评
短评:群聊日报信息密度高,但来源匿名,每条消息需自行验证。 点评:这篇日报汇总了4月27日AI技术群聊的核心讨论,信息量很大但来源是匿名群友,每条消息的可靠性要打折扣。几个值得关注的点:opencode的subagent工作流用自然语言调度多任务并行,实测能跑一两天,效率提升明显,但这是个人经验,大规模复制需谨慎;Codex的“良性bug”让5小时额度用尽后任务仍继续运行,省钱但官方随时可...
锐评
这篇日报汇总了9条AI实践讨论,最有价值的是猫仔的编译器项目复盘:50多条需求AI只听进去不到20%,0.5M test case编译出10M代码后报错又把AI刷傻——这是典型的信息过载导致AI质量下降,正文没披露具体用了哪个模型和上下文窗口大小。Claude Code Remote 429断连问题,群友做了短线重连方案但没开源。DeepSeek在OpenClaw中完全不调用工具,群友直言“benchmark都是假的”,这点先别太激动——可能只是OpenClaw的tool prompt没适配DeepSeek。Anthropic“删库跑路”事件9秒删库,但正文没披露数据库配置和备份策略。一人AI SOC替代28人外包团队,技术上可行但商业化路径不清晰。整体来看,群聊日报的价值在于一线踩坑经验,但每条都缺原始链接和具体数据,无法独立验证。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
03:50
47d ago
r/LocalLLaMA· rssEN03:50 · 04·28
一个 Reddit 用户弃用本地大模型写代码:两轮 Docker 对话吃掉 25 万 token
Reddit 用户 /u/dtdisapointingresult 发帖说,他花了几周用 Qwen 27B 和 Gemma 4 31B 做 OS/Docker 任务,最后决定放弃本地大模型写代码。具体原因是两次 Docker 会话的输入 token 都飙到了 25 万,模型超时处理差,还得靠宿主机手动重试安装。帖子没透露硬件配置、量化设置和用的什么 a...
#Agent#Code#Tools#OpenRouter
精选理由
HKR三项全通过:一个具体的失败案例加上25万token的细节足够支撑。重要性压在60–71区间,因为这只是单个Reddit用户的经历,且帖文未披露硬件、量化配置和具体agent设置,信息缺口明显。
一句话点评
本地模型写代码,token 一多就崩,作者直接弃坑了。
锐评
Reddit 用户发帖说,用 Qwen 27B 和 Gemma 4 31B 做 OS/Docker 任务几周后,决定放弃本地大模型写代码。两次 Docker 会话输入 token 都飙到 25 万,模型超时处理差,还得靠宿主机手动重试安装。25 万 token 意味着上下文窗口几乎撑爆,对本地部署的推理速度和内存都是巨大考验。帖子没披露硬件配置、量化设置和用的什么 agent 应用,所以不能全怪模型——量化太低或 agent 框架本身就有 bug 也可能导致超时。 这条的价值在于:它暴露了本地模型做 agent 任务时的一个真实瓶颈——长上下文下的稳定性和超时处理。OpenRouter 等 API 服务可能更省心,但本地部署的性价比和可控性仍是很多人坚持的理由。缺的是具体硬件和量化信息,以及 agent 框架的对比测试。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
03:16
47d ago
r/LocalLLaMA· rssEN03:16 · 04·28
MiMo 2.5 号称不胡说,75% 无幻觉率,但没说是啥测试
Reddit 用户发帖说 MiMo 2.5 在某个未公开的测试集上达到 75% 和 68% 的无幻觉率,Pro 版只比 Opus 4.7 max 低 3 个点。模型是 316GB FP8 版本,体积不小。帖子没交代测试集是什么、样本量多少,所以这个数字先打个折。
#Benchmarking#Inference-opt#Beamsters#Open source
精选理由
这条信息来自一条 Reddit 帖子,来源单一,正文没披露评测集、样本量和复现实验设置,信息缺口明显。数字(75%、68%、3 分差距、316GB)有参考价值,但验证太弱,适合当社区讨论看,不适合当正式评测引用。
一句话点评
MiMo 2.5 号称无幻觉率 75%,但测试集和样本量都没说,先打个折。
锐评
Reddit 用户发帖称 MiMo 2.5 在某个未公开的测试集上达到 75% 和 68% 的无幻觉率,Pro 版只比 Opus 4.7 max 低 3 个点。模型是 316GB FP8 版本,体积不小。 关键问题是:帖子没交代测试集是什么、样本量多少,所以这个数字先打个折。如果测试集是自己挑的简单题,75% 含金量就低很多。316GB 的模型跑起来成本不低,这点先别太激动。 还缺什么:缺第三方复现、缺测试集细节、缺和同类模型的横向对比。正文没披露这些,建议等更多验证再下结论。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
02:45
47d ago
Hacker News 首页· rssEN02:45 · 04·28
等大模型输出太无聊?这个项目让你在等待时玩个小游戏
ftaip 在 GitHub 上开源了 waiting-game,核心思路很简单:用户等 LLM 返回结果时,与其让页面转圈,不如直接塞一个小游戏进去打发时间。项目目前在 HN 上有 7 个点赞和 4 条评论,热度不高。正文没有透露具体用什么框架、支持哪些模型,也没有说游戏是内置的还是可配置的。想法挺讨巧,但实现细节和实际效果都还看不到,这点先别太激动。
#Tools#ftaip#Hacker News#Open source
精选理由
我会先打个折:信息太少了,只有 RSS 摘要和 HN 上 7 分、4 条评论,连实现机制都没披露,所以别当成熟方案看。但它的点子值得提——把 LLM 返回前的等待时间变成小游戏,直接戳中 AI 应用里用户干等的烦躁感。这点先别太激动,毕竟没看到代码怎么落地、延迟能降多少,但思路本身对做产品的人有启发。
一句话点评
等 LLM 响应时塞个小游戏,想法讨巧但细节太少。
锐评
ftaip 在 GitHub 上开源了 waiting-game,核心思路是用户等 LLM 返回结果时,与其让页面转圈,不如直接塞一个小游戏进去打发时间。项目目前在 HN 上只有 7 个点赞和 4 条评论,热度不高。正文没披露具体用什么框架、支持哪些模型,也没说游戏是内置的还是可配置的。想法挺讨巧,但实现细节和实际效果都还看不到,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
01:54
47d ago
r/LocalLLaMA· rssEN01:54 · 04·28
给编程助手装上嘴:开源本地语音播报工具 Heard
Heard 是一个开源工具,能实时朗读 Claude Code、Codex 等编程助手的流式输出。它用 Python 守护进程加 macOS 应用实现,默认调用本地 Kokoro TTS,不需要 API Key 也不联网,协议是 Apache 2.0。可选 ElevenLabs 或 Anthropic Haiku 做语音模型。正文没披露延迟和音质数据,...
#Agent#Audio#Code#Heard
精选理由
HKR 三项都过:给编码 Agent 加本地语音层这个点算新,正文也给出了具体的架构事实。但范围小,没有延迟、采用率或工作流数据,所以留在 all 层级。
一句话点评
开源工具让编程助手开口说话,本地跑不联网,但延迟和音质未知。
锐评
Heard 是一个开源工具,能把 Claude Code、Codex 等编程助手的输出实时转成语音。默认用本地 Kokoro TTS,不需要 API Key 也不联网,协议 Apache 2.0。可选 ElevenLabs 或 Anthropic Haiku 做语音模型。 亮点是本地运行、零成本,适合不想把代码上下文传到云端的开发者。但正文没披露延迟和音质数据——Kokoro 在低端硬件上可能卡顿,这点先别太激动。另外只支持 macOS,Windows/Linux 用户得等。 缺的是性能基准和实际体验对比。如果延迟能控制在 200ms 内,对 coding agent 工作流是个实用补充;否则就是个玩具。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
01:54
47d ago
r/LocalLLaMA· rssEN01:54 · 04·28
搞了台 1.5TB 内存的 Mac Pro,准备跑大模型
Reddit 用户 habachilles 晒了一台 2019 款 Mac Pro,配置是 1.5TB 统一内存、128GB 显存(其实是共享内存)、28 核 CPU。他打算拿它跑 GLM 5.2,把专家模块卸载到显存里,正在问大家推荐跑什么 benchmark。帖子没提具体 GPU 型号、量化精度和实测结果,所以实际推理速度、能跑多大参数量的模型都还...
#Inference-opt#Benchmarking#habachilles#GLM
精选理由
HKR-H 和 HKR-R 成立:硬件配置本身就是个吸引点击的钩子,而且跟本地推理用户的痛点直接相关。HKR-K 弱是因为帖子只列了规格和计划,没给 GPU 型号、量化设置或 GLM 5.2 的跑分结果,信息量不足。
一句话点评
1.5TB 内存的 Mac Pro 跑 GLM 5.2,但没 GPU 型号和量化精度,先别太激动。
锐评
Reddit 用户 habachilles 晒了一台 2019 款 Mac Pro,配置 1.5TB 统一内存、128GB 显存(实际是共享内存)、28 核 CPU,打算跑 GLM 5.2 并把专家模块卸载到显存里。1.5TB 内存确实能装下超大模型,但关键信息缺失:帖子没提具体 GPU 型号、量化精度和实测结果。统一内存架构下,推理速度受内存带宽限制(2019 Mac Pro 带宽约 1.2TB/s),实际能跑多大参数量、每秒生成多少 token 都还是未知数。正文没披露 benchmark 结果和功耗,所以这条更像硬件晒单而非性能验证。如果后续有实测数据,对了解 Apple Silicon 之外的老 Mac Pro 在本地大模型上的表现才有参考价值。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
01:50
47d ago
● P1彭博科技· rssEN01:50 · 04·28
OpenAI未达成内部用户和销售增长目标
《华尔街日报》拿到内部消息,说 OpenAI 没完成自己设的新用户和销售额目标。公司内部开始担心在 AI 基础设施上砸的钱是不是太多了。不过这篇报道正文被 Bloomberg 的付费墙挡住了,具体目标数字、差了多少、时间范围和花了多少钱都没披露,所以没法判断缺口有多大。
#OpenAI#Wall Street Journal#Commentary
精选理由
我会先打个折,因为 WSJ 这篇正文没披露具体数字,缺口多大、哪个季度、花了多少钱全不清楚,所以信息密度其实偏薄。但选题本身够直接:OpenAI 自己定的增长目标没完成,内部已经在担心基础设施的高支出扛不住。对从业者来说,这不是公关稿里的增速放缓,而是实打实的成本焦虑——如果连 OpenAI 都踩刹车,整个行业靠烧钱换用户的逻辑就更值得怀疑了。这点先别太激动,等具体数据出来再下重注。
一句话点评
OpenAI 没达到自己定的用户和销售目标,连带着把甲骨文等关联股票拉下水。
锐评
这条消息的核心是 OpenAI 的实际增长跑输了内部预期,具体数字《华尔街日报》的报道里没披露,所以不知道差了多少。市场反应很直接,甲骨文这类靠 OpenAI 订单吃饭的公司股价跟着跌,说明投资人之前把预期打得太满。 不过得打个折:这是内部目标没达成,不是业务萎缩。正文没提是用户增长放缓、企业客户转化不行,还是单纯目标定太高。另外也没说这会不会影响 OpenAI 下一轮融资估值。 还缺两个关键信息:一是没达标的幅度有多大,二是 OpenAI 自己怎么解释原因。光看股价跌容易放大恐慌,先别急着下结论说 AI 需求见顶。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
01:14
47d ago
Hacker News 首页· rssEN01:14 · 04·28
AgentSwift:一个开源的 iOS 应用构建智能体
GitHub 上刚出现一个叫 AgentSwift 的项目,号称是开源的 iOS 构建智能体。不过目前仓库是 0 star、0 fork、0 issue,基本是个空壳。正文没披露架构、许可证、用哪个模型 API、以及运行环境要求,所以暂时没法判断它能不能用、好不好用。如果你在找 iOS 端的 AI 编程工具,这点先别太激动,等作者补上关键信息再说。
#Agent#Code#hpennington#GitHub
精选理由
H 靠标题的 iOS builder agent 钩子能过,但 K 和 R 都不过:仓库只有 0 star 和 0 fork,运行条件、模型 API、许可证全没写。这是一个低价值的开源线索,不值得推荐。
一句话点评
0 star 空壳项目,别激动。
锐评
AgentSwift 号称是开源的 iOS 构建智能体,但 GitHub 仓库目前 0 star、0 fork、0 issue,基本是个空壳。正文没披露架构、许可证、用哪个模型 API、以及运行环境要求,所以暂时没法判断它能不能用、好不好用。如果你在找 iOS 端的 AI 编程工具,这点先别太激动,等作者补上关键信息再说。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
00:32
47d ago
Hacker News 首页· rssEN00:32 · 04·28
Ted Nyman 出书讲 Git 高性能:从对象存储到 agent 循环里的延迟问题
Ted Nyman 发布了《High Performance Git》第一版,共 22 章加 3 个附录。书里从 Git 的底层数据模型讲起,覆盖对象、引用、包文件、部分克隆、协议 v2、reftable、诊断和修复。对 AI 团队来说,最尖锐的部分是 Git 在大仓库和 agent 循环下的延迟——当模型反复 clone、fetch、checkout...
#Code#Tools#Ted Nyman#Open source
精选理由
Ted Nyman 的《High Performance Git》第一版列出了 22 个章节和 3 个附录,覆盖 objects、refs、packfiles、partial clone、Protocol v2、reftable 以及诊断修复。对 AI 工程团队来说,真正值得盯的是 agent loop 下仓库规模变大后 Git 延迟可能成为瓶颈——比如频繁 clone 或 fetch 大仓库会拖慢 CI/CD 或 agent 的迭代速度。但正文没披露具体性能数据或对比基准,所以这点先别太激动。HKR-K 通过具体的 Git 性能层和目录细节通过,...
一句话点评
Git 在大仓库和 AI agent 循环下会变慢,这本书专治这个。
锐评
Ted Nyman 写了本《高性能 Git》,22 章加 3 个附录,从底层数据模型讲到诊断修复。对 AI 团队最扎心的是“Agent 循环”那章——当模型反复 clone、fetch、checkout,Git 延迟会直接卡住工作流。书里覆盖了部分克隆、协议 v2、reftable 这些提速手段,还给了配置手册和恢复方法。来源是个人技术书,权威性中等,但作者是资深工程师,内容偏实战。缺的是具体 benchmark 数据,比如“大仓库多大算大”“延迟能降多少”,正文没披露。如果是 monorepo 或跑 agent 的团队,值得翻翻 epilogue。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
00:27
47d ago
彭博科技· rssEN00:27 · 04·28
爱德万测试股价跌7%,AI芯片测试设备产能吃紧
爱德万测试(Advantest)股价一度跌6.9%,原因是其AI芯片测试设备的业绩展望低于预期。公司给出的理由是产能紧张。正文没披露具体营收指引、订单规模或扩产时间表,所以这轮下跌更多是市场对供给瓶颈的担忧,而非需求端出了问题。
#Advantest
精选理由
Bloomberg 报道了 Advantest 股价跌6.9%和测试设备产能受限,所以 HKR-K/R 通过。HKR-H 弱是因为正文没披露营收指引、订单规模或扩产时间表,信息缺口明显。
一句话点评
爱德万测试因产能瓶颈导致业绩展望不及预期,股价一度跌6.9%。
锐评
爱德万测试(Advantest)股价一度跌6.9%,原因是其AI芯片测试设备的业绩展望低于预期,公司给出的理由是产能紧张。这轮下跌更多是市场对供给瓶颈的担忧,而非需求端出了问题。正文没披露具体营收指引、订单规模或扩产时间表,所以信息缺口明显:我们不知道产能缺口有多大、何时能缓解。如果只是短期瓶颈,股价可能过度反应;但如果是长期产能受限,则会影响后续订单交付。对于关注半导体设备供应链的从业者,这条新闻提示了测试环节的产能风险,但缺乏关键数据支撑判断,建议等待公司后续的扩产计划或客户订单披露。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
00:17
47d ago
彭博科技· rssEN00:17 · 04·28
马斯克诉奥特曼案陪审团选定,九人来自湾区
周一联邦法院选出了九名陪审员,全部来自旧金山湾区居民,预计将听取三周证词。正文没披露具体诉讼主张,但这场马斯克与奥特曼的官司本身已够吸睛。
#Elon Musk#OpenAI#Sam Altman#Policy
精选理由
H 和 R 靠马斯克告奥特曼这个法庭戏撑起来,K 只加了几个程序性事实(9名陪审员、湾区候选池、三周证词)。没有披露实质性诉请、救济方案或证据,所以分数压在60-71区间。
一句话点评
陪审团选出来了,全是湾区居民,但正文被墙了,具体告什么没看到。
锐评
联邦法院选出了九名陪审员,全部来自旧金山湾区,预计审理三周。马斯克告奥特曼,核心应该是 OpenAI 从非营利转向营利以及 AGI 控制权之争,但 Bloomberg 正文被反爬墙了,具体诉讼主张没披露。陪审团全在湾区——奥特曼和 OpenAI 的大本营,这点对马斯克不算利好。三周审理说明案情不简单,但没看到起诉书原文前,先别急着站队。缺信息:马斯克具体索赔金额、OpenAI 的答辩策略、法官是否已驳回部分诉求。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:07
47d ago
Hacker News 首页· rssEN00:07 · 04·28
生成式AI素食主义:主动关掉Copilot、Gemini和苹果智能
Sean Boots 在2026年3月发文,把自己定位成“生成式AI素食者”——不是完全不吃(比如他仍用算法推荐歌单和OCR),但主动关掉微软Copilot、谷歌Gemini和苹果智能,也不消费别人用AI生成的文章、图片或音乐。他解释生成式AI就是“接口极简(聊天框)、数据惊人(爬了全网文本和数百万本书)、数学靠Transformer预测下一个词”。正...
#Tools#Sean Boots#Microsoft#Google
精选理由
HKR-H 和 HKR-R 通过:标签有记忆点,拒绝姿态能引发从业者讨论。HKR-K 弱,因为文章只给出个人边界清单,没有新数据、机制或实验。
一句话点评
作者把自己定位成“生成式AI素食者”——不是完全不用AI,而是主动关掉Copilot、Gemini和苹果智能,也不消费AI生成的内容。
锐评
Sean Boots 这篇2026年3月的文章提出了一个有意思的立场:生成式AI素食者。他不是完全拒绝AI——仍用算法推荐歌单和OCR——但主动关掉微软Copilot、谷歌Gemini和苹果智能,也不看别人用AI生成的文章、图片或音乐。他把生成式AI拆成三层:接口极简(聊天框)、数据惊人(爬了全网文本和数百万本书)、数学靠Transformer预测下一个词。这个框架本身不新,但“素食者”这个类比比“抵制者”更精确——不是全盘否定,而是有选择地避开。文章没有披露他具体怎么在工作和生活中执行这套规则,比如是否影响团队协作或政府项目。如果你在思考个人或团队对AI的接受边界,这篇提供了一个温和但坚定的参考样本。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
00:04
47d ago
彭博科技· rssEN00:04 · 04·28
激进投资者Starboard Value入股Dynatrace,推动AI战略转变
Bloomberg 报道称 Starboard Value 已买入 Dynatrace 股份,后者盘后涨超 6%。Starboard 正在推动 Dynatrace 加码 AI 战略,但报道未披露持股规模或具体计划细节。
#Dynatrace#Starboard Value#Funding
精选理由
这是一条典型的激进投资者入股带动股价的消息,AI 只是作为公司转型背景被顺带提了一句。正文既没披露持股规模,也没给出任何 AI 产品计划或技术细节,对 AI 从业者来说信息量几乎为零。
一句话点评
激进投资者Starboard Value入股Dynatrace,后者股价应声上涨。Starboard通常推动被投公司改革,这次目标可能是让Dynatrace加速转向AI业务。正文被彭博墙了,没披露入股比例和具体改革方案。关键看Dynatrace现有AI产品(如Davis AI)能否被重新包装成增长故事,以及Starboard是否会要求裁员或分拆。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H0·K0·R0
00:00
47d ago
● P1OpenAI 博客· rssEN00:00 · 04·28
OpenAI模型、Codex和托管代理接入AWS
OpenAI 和 AWS 扩大合作,把 GPT 模型(包括最新的 GPT-5.5)、代码助手 Codex 以及一个叫“Bedrock Managed Agents”的托管 Agent 服务放到了 AWS 上。企业可以在 AWS 环境里直接调用这些能力,不用再单独走 OpenAI 的 API,安全、合规、账单都走 AWS 那一套。Codex 目前每周有 ...
#Agent#Code#OpenAI#AWS
精选理由
触发了硬排除规则 cloud-vendor-promo:这是一条 AWS 上架/合作通知,没有披露定价、区域、模型清单或能力变化。H 和 R 通过,但排除规则把重要性上限卡在 39。
一句话点评
OpenAI 把模型和 Codex 搬上 AWS,最实在的变化是:企业不用为了用 GPT 而被迫迁到 Azure 了。但别急着激动,目前只是限量预览,实际交付和稳定性还没验证。
锐评
这次合作的核心是把 OpenAI 的模型、Codex 编程工具和所谓的“托管智能体”塞进 AWS 的 Bedrock 平台。说白了,就是让已经在 AWS 上跑业务的公司,可以直接在自己的云环境里调用 GPT 模型,不用再折腾数据搬家。这对 OpenAI 是补课——之前 Azure 独占期,很多企业因为不想离开 AWS 而选了 Anthropic,OpenAI 等于自己把客户往外推。现在微软松绑,OpenAI 立刻扑向 AWS,商业逻辑很直白。 值得留意的细节是“托管智能体”。按采访里的说法,这东西有点像把 Codex 的本地运行能力搬到企业级环境里,试图解决让模型进业务流程干活时碰到的安全和权限问题。但正文没披露具体的技术架构,也没给出延迟、并发或成本数据。限量预览意味着现在能用的客户很少,大规模跑起来会不会踩坑,还不知道。 另外,微软虽然放开了独占,但条款里写了“OpenAI 产品优先上 Azure,除非 Azure 不支持或选择不做”。这个例外条款有多宽,会不会在某些能力上卡一下,目前也没说清楚。所以整体判断是:方向对了,对 AWS 用户是实打实的好消息,但离“生产环境随便用”还有距离,先看限量预览的反馈再说。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K0·R1
00:00
47d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 04·28
开源模型推理采购指南:GLM-5.1、DeepSeek V4 Pro、Kimi K2.6 的 API、订阅和 Ollama Cloud 对比
yage.ai 对比了 GLM-5.1、DeepSeek V4 Pro 和 Kimi K2.6 三种买法:官方 API 按量付费、厂商包月订阅、Ollama Cloud 包月。轻量 agent 场景(每月 30M input + 6M output token)下,折扣期 DeepSeek API 只要 $18/月,但折扣 6 月到期后涨到 $73。重...
#Agent#Inference-opt#yage.ai#DeepSeek
精选理由
HKR三项都过,因为这是一篇实用的成本对比指南,有具体的省钱数字(5-20倍)和定价锚点($18/月、$80/月)。但来源yage.ai权威性有限,正文没给完整价格表、测试条件和延迟数据,所以分数压在60-71区间。
一句话点评
开源模型采购对比,轻量场景订阅划算,重度场景能省5-20倍。
锐评
yage.ai 这篇采购指南把 GLM-5.1、DeepSeek V4 Pro、Kimi K2.6 的三种买法(API 按量、厂商订阅、Ollama Cloud 包月)算得很清楚。轻量 agent 场景(每月 30M input + 6M output token)下,折扣期 DeepSeek API 只要 $18/月,但折扣 6 月到期后涨到 $73。重度场景(8 亿 token/月)纯 API 成本 $400-$1,601,而 z.ai Max 订阅 $80/月、Ollama Cloud Max $100/月,能省 5-20 倍。不过前提是你主要用同一家模型,跨模型用 Ollama 更灵活。隐私方面,Ollama 承诺不存数据、不训练,中国三家厂商政策模糊。正文没披露各订阅的实际 token 限额和延迟数据,重度用户需要实测。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
00:00
47d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 04·28
Manus 和 Cursor 凭什么值 20 亿和 600 亿美元
这篇文章说,Meta 花 20 亿美元买 Manus、Musk 给 Cursor 开 600 亿美元收购选项,不是冲动消费,而是买这两家团队的认知领先。Manus 做对了两件事:一是没让 AI 扮演产品经理、工程师这些人类角色(hat wearing),而是让每个 agent 保持完整能力、只在任务层面分工,这个思路后来被 OpenAI、Anthrop...
#Agent#Fine-tuning#Tools#Manus
精选理由
HKR-H和HKR-R通过:估值落差和agent护城河角度确实能聊。HKR-K不通过:没样本、没指标、没交易细节,属于低价值评论,正文信息量撑不起判断。
一句话点评
Meta 花 20 亿美元买 Manus,Musk 给 Cursor 开 600 亿美元收购选项,不是冲动消费,而是买这两家团队的认知领先。
锐评
这篇文章的核心判断是:Manus 和 Cursor 被高价收购,不是因为营销或运气,而是因为它们在技术路线上做出了领先行业的正确判断。 Manus 做对了两件事:一是没让 AI 扮演产品经理、工程师这些人类角色(hat wearing),而是让每个 agent 保持完整能力、只在任务层面分工,这个思路后来被 OpenAI、Anthropic、Cursor 等头部玩家采纳。二是把 AI 从“一次性任务工具”做成了“能生成可部署、可分发、自带智能的软件产品”,最早打通了创建+部署+智能注入的完整链路。8 个月做到 1 亿美元 ARR,处理 147 万亿 token,创建超 8000 万台虚拟计算机。 Cursor 则判断在编程场景下,依赖外部模型 API 在速度和成本上无法满足交互体验,必须自训模型。它把这件事做出来了,Composer 的体验验证了这个判断。 文章也回应了常见的“套壳”质疑:如果 Manus 真没核心技术,发改委不会动用五年来首次“禁止加撤销”来叫停 Meta 的收购。 不过原文没有披露对比评测的具体样本量、验证指标,也没有说明收购条款细节。这些信息缺口不影响核心论点,但读者可以留意。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
2026-04-27 · 星期一2026年4月27日
23:57
47d ago
Hacker News 首页· rssEN23:57 · 04·27
CS教授公开信:别为AI行业放弃底线
Hendrix学院计算机教授Brent A. Yorgey在4月27日发了一封给学生公开信,核心意思:软件行业已经疯了,你们出去找工作要守住道德边界。他列了几个具体问题:初级岗位稀缺、代码量比质量重要、IP被随意抄、模型用偏见数据训练、算力浪费在不确定收益的事情上、技术被用来监控和杀人。他本人2026年3月就声明过,拒绝使用任何LLM,理由是背后有人力...
#Safety#Alignment#Brent A. Yorgey#Hendrix College
精选理由
HKR-H 和 HKR-R 通过:一位教授的公开信本身有张力,且触及入门岗位焦虑。HKR-K 不通过:文章没有提供新数据、机制或可验证的案例,因此分数落在 60–71 区间。
一句话点评
一位CS教授劝学生:软件行业疯了,找工作要守住道德边界。
锐评
Hendrix学院教授Brent A. Yorgey在4月27日发公开信,核心观点:软件行业已疯,初级岗位稀缺、代码量比质量重要、IP被随意抄、模型用偏见数据训练、算力浪费在不确定收益的事上、技术被用来监控和杀人。他本人2026年3月就声明拒绝使用任何LLM,理由是背后有人力剥削和资源浪费。 这封信没有新数据或实验,纯粹是个人立场表达。关键信息缺口:他说的“初级岗位稀缺”没有具体数字支撑;“偏见数据”和“算力浪费”也没有引用具体案例。如果你在找行业道德讨论的素材,这封信是一个有代表性的声音,但别当事实依据用。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
23:00
47d ago
最佳拍档· atomZH23:00 · 04·27
Google Next '26 大会全盘点:1800亿美元投资、第八代TPU、企业Agent五层架构
视频标题盘点了Google Next '26大会的核心内容,包括1800亿美元投资、第八代TPU、企业Agent五层架构、可信上下文、跨云湖仓、安全防御和工作区智能。但正文未披露投资周期、TPU具体规格、可信上下文的设计细节、跨云湖仓的实现方式,以及五层架构各层的具体功能。
#Agent#Inference-opt#Safety#Google
精选理由
标题画了个大饼——1800亿美元、第八代TPU、Agent五层架构,但正文一个字都没有。H和R靠这个钩子能过,但K直接卡死:投资是分几年投?TPU算力比上一代翻几倍?Agent架构是概念图还是可部署方案?一概不知。硬规则要求信息不够就直说,所以这篇只能给39分,等有具体参数和周期再重新评估。
一句话点评
Google Next '26 画了张企业 AI 大饼,但细节太少,先别激动。
锐评
视频标题列了一堆概念:1800 亿美元投资、第八代 TPU、企业 Agent 五层架构、可信上下文、跨云湖仓。但正文几乎没给任何细节——投资是几年周期?TPU 算力提升多少倍?五层架构每层具体干什么?可信上下文是权限控制还是数据隔离?跨云湖仓怎么跨、延迟多高?全都没说。 对 AI 从业者来说,这些方向本身不新鲜:Google 在推自己的 Agent 框架和硬件绑定,1800 亿更像长期资本开支而非短期订单。真正有价值的信息——比如 TPU v8 的推理成本对比、五层架构里有没有开源组件、可信上下文是否兼容第三方云——全部缺失。建议等官方白皮书或实测数据再判断,目前只能当战略口号看。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K0·R1
23:00
47d ago
彭博科技· rssEN23:00 · 04·27
光计算公司Lightelligence港股首日暴涨408%
一家做光计算的中国公司Lightelligence在港股上市首日涨了408%。它给AI基建供零件,但正文没披露发行价、募资额和营收数据,这点先别太激动。
#Inference-opt#Lightelligence#Funding
精选理由
HKR三项都过,但正文只披露了首日涨408%和AI部件定位,IPO发行价、募资额、收入数据全缺。这是有用的市场信号,不是模型或可复现的技术更新。
一句话点评
光计算公司Lightelligence港股首日涨408%,但正文没披露发行价、募资额和营收,先别太激动。
锐评
Lightelligence做的是光计算,用光代替电来跑AI推理,理论上能大幅降低功耗和延迟。首日涨408%说明市场对AI基建上游的国产替代故事很买账。但Bloomberg正文被屏蔽,只拿到标题和摘要,关键数字全缺:发行价、募资额、营收、客户是谁、光计算方案是否已量产交付。408%的涨幅在港股小盘股里不算罕见,流动性差、筹码集中就能拉出这个数。如果后续财报显示营收只有几百万美元,那这个涨幅就是情绪溢价。目前能确认的信息只有“一家中国光计算公司上市了”,其他都是空白。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
22:55
47d ago
Sinocism · 比尔·毕晓普· rssEN22:55 · 04·27
发改委想叫停Manus交易;中美AI对话;疑似国安部黑客被引渡美国
Sinocism付费文章标题提到发改委想叫停Manus交易,并提及中美AI讨论。但RSS摘要只覆盖了假期安排和国务院议程,没有披露Manus交易的具体细节或AI讨论内容。正文被付费墙挡住,无法核实发改委反对这笔交易的原因、涉及哪家中国公司、以及中美AI对话的具体议题。
#NDRC#Manus#Sinocism#Policy
精选理由
HKR-H 通过,但 K 和 R 不通过:Manus 和中美 AI 讨论只在标题出现,正文没披露任何参与方、机制或议程。信号弱,不推荐展示。
一句话点评
发改委想叫停Manus交易,但正文被付费墙挡住,细节全无。
锐评
Sinocism标题说发改委想叫停Manus交易,还提到中美AI讨论,但RSS摘要只写了假期安排和国务院会议,正文被付费墙挡住。目前能确认的信息只有标题本身,发改委反对的具体原因、涉及哪家中国公司、交易金额、以及中美AI对话的议题全部缺失。标题里Manus是一家AI Agent公司,此前因“通用AI代理”概念引发关注,但这次交易细节和监管态度都无从核实。建议等付费用户流出更多信息再判断,目前这条新闻的价值仅限于“有监管信号”,但信号强度未知。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
21:38
47d ago
Product Hunt · AI· rssEN21:38 · 04·27
Devin 出了个终端版:合上电脑任务还在跑
Devin for Terminal 是一个命令行(CLI)智能体,你合上笔记本它也能继续干活。正文没披露运行时长、定价、权限范围和任务上限,所以实际能跑多久、能跑多复杂的事还不清楚。适合需要远程挂机跑脚本或调试的场景,但安全性和成本控制得自己掂量。
#Agent#Code#Tools#Devin
精选理由
Devin 出 CLI agent 本身是个信号:AI 编程助手从交互式 IDE 往后台自动化走。但正文只有 Product Hunt 摘要,没讲清楚怎么跑、多少钱、能干什么、权限怎么管。H 和 R 靠产品直觉过关,K 因为信息太少只能给低分。建议等详细文档再判断要不要跟进。
一句话点评
合上笔记本还能跑,适合远程挂脚本,但定价和时长都没说。
锐评
Devin 把智能体塞进了命令行,卖点是合上笔记本任务不中断,这对需要远程调试或跑长时间脚本的人挺实用。但正文只给了 Product Hunt 摘要,没披露运行时长上限、定价、权限范围和任务复杂度限制——所以实际能跑多久、能跑多复杂的活全是未知数。如果是真的,等于多了一台不用开机的远程机器,但安全性和成本控制得自己掂量。目前信息缺口太大,建议等官方文档再评估。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
20:47
48d ago
The Verge · AI· rssEN20:47 · 04·27
Canonical 给 Ubuntu 画了一份 AI 路线图:后台模型 + 智能体任务,但没说用哪个模型、什么时候上线
Canonical 计划在 2026 年内给 Ubuntu 加入 AI 功能,分两类:一类是后台模型增强(比如语音转文字、文字转语音),另一类是 AI 原生工作流(让模型进业务流程干活,比如智能体任务)。官方强调“Ubuntu 不会变成一个 AI 产品”,但正文没披露具体用哪个模型、默认开不开、以及确切上线时间。目前看更像一个方向性规划,细节还比较模糊。
#Agent#Audio#Tools#Canonical
精选理由
HKR-H 和 HKR-R 成立,因为 Ubuntu 级别的 AI 集成会影响桌面工作流。HKR-K 偏弱:文章给出了分类和例子,但没有模型、时间表或默认设置细节。
一句话点评
Ubuntu 要加 AI 功能,但没说用哪个模型、默认开不开、什么时候上线。
锐评
Canonical 计划在 2026 年内给 Ubuntu 加入 AI 功能,分两类:一类是后台模型增强,比如语音转文字、文字转语音;另一类是 AI 原生工作流,让模型进业务流程干活,比如智能体任务。官方强调“Ubuntu 不会变成一个 AI 产品”,但正文没披露具体用哪个模型、默认开不开、以及确切上线时间。目前看更像一个方向性规划,细节还比较模糊。对于 Linux 桌面用户来说,这可能是系统级 AI 集成的一个信号,但距离实际可用还有距离。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
20:08
48d ago
Dwarkesh Patel 访谈· atomEN20:08 · 04·27
为什么不该信五角大楼的AI承诺
标题直接说不要相信美国国防部在AI上的承诺,但正文没披露具体是什么承诺、谁说的、有什么证据或政策背景。信息缺口明显,无法判断这个警告是针对某个具体项目还是整体可信度。
#Safety#Pentagon#Policy#Commentary
精选理由
标题画了个大饼——五角大楼的AI承诺不可信,但正文一个字都没写。没有承诺内容、没有证据、没有人物、没有政策背景,等于只给了个空靶子。H和R靠标题的冲突感和话题敏感度勉强过关,但K因为零信息源直接触发了hard-exclusion-zero-sourcing规则,分数上限被压在40以下。如果正文补上具体承诺、质疑依据或至少一个案例,分数能往上走。
一句话点评
标题说别信五角大楼的AI承诺,但正文一个字都没给,没法判断是哪个承诺、谁说的。
锐评
标题很猛,但正文是空的,来源只有RSS摘要。没有披露具体是哪个承诺、谁做的承诺、有什么证据或政策背景。信息缺口太大,无法判断这个警告是针对某个具体项目(比如自主武器、数据共享)还是整体可信度。如果只看标题,容易变成情绪输出。建议等有正文或引用来源再判断。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H1·K0·R1
18:59
48d ago
彭博科技· rssEN18:59 · 04·27
Joby在纽约进行电动空中出租车测试演示
Joby Aviation 本周在纽约测试电动空中出租车,从 JFK 机场飞到曼哈顿。宣传点是更安静、零排放,但正文没披露航程、载客量、票价和具体上线时间。
#Robotics#Joby Aviation#Bloomberg#John F. Kennedy International Airport
精选理由
这篇讲的是Joby Aviation在JFK机场和曼哈顿之间测试电动空中出租车,跟AI完全无关。正文说飞机更安静、零排放,但没披露航程、载客量、票价或商业时间表。没有自主飞行栈、模型、发布日期、容量或定价信息,对AI雷达来说HKR三项全不满足,所以分数低于40。
一句话点评
Joby 在纽约完成了电动空中出租车从 JFK 到曼哈顿的首次演示飞行,全程约 15 分钟。这是 eVTOL 首次从纽约主要机场起飞,后续 10 天还会飞更多航线。合作方包括达美和 Uber,计划用于机场接驳、货运和医疗配送。不过目前只是演示,离真正商业运营还有距离——FAA 的 eIPP 试点计划覆盖 26 个州,但适航认证和基础设施(比如停机坪充电)都没完全落地。正文没披露具体票价和运营...
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K0·R0
18:32
48d ago
彭博科技· rssEN18:32 · 04·27
微软和Meta财报前再裁数千人,Lattice CEO说别光盯着裁员
微软和Meta在财报周前宣布新一轮裁员,规模可能达数千人。Lattice CEO Sarah Franklin认为,Tokenmaxxing、AI使用和大规模裁员都不是公司该关注的重点。正文没披露具体裁了哪些岗位、省多少钱,也没说Tokenmaxxing具体指什么。
#Microsoft#Meta#Sarah Franklin#Personnel
精选理由
Bloomberg这条消息靠微软和Meta财报前裁员数千人拿到HKR,但正文没交代裁哪些岗位、哪个部门、省多少钱,也没说AI是不是替代了人。属于行业常规报道,不够专题深度。
一句话点评
裁员消息本身不新,但Lattice CEO的批评角度值得看。
锐评
微软和Meta在财报周前宣布新一轮裁员,规模可能达数千人。但正文被Bloomberg paywall挡住,没披露具体裁了哪些岗位、省多少钱,也没说Tokenmaxxing具体指什么。Lattice CEO Sarah Franklin认为Tokenmaxxing、AI使用和大规模裁员都不是公司该关注的重点——这个批评角度比裁员数字本身更有意思,暗示科技公司可能用AI和裁员当公关牌,而不是真正优化业务。不过信息缺口明显:Tokenmaxxing是内部黑话还是行业新概念?裁员是砍AI重复岗还是传统业务?这些都没说。如果是真的,这波裁员可能不是成本驱动,而是向华尔街表决心。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
18:22
48d ago
● P1彭博科技· rssEN18:22 · 04·27
Musk与Altman围绕OpenAI未来的诉讼进入庭审阶段
马斯克和山姆·奥特曼关于 OpenAI 公司结构的案子进入陪审团遴选阶段。彭博社说这场官司可能影响 OpenAI 未来的走向,但正文被 Bloomberg 的反爬机制挡住了,具体指控内容、庭审时长和双方要求什么补救措施都没披露。
#Elon Musk#Sam Altman#OpenAI#Policy
精选理由
Bloomberg 报道了陪审团遴选启动,但正文没写具体诉求、审多久、可能怎么判。我会先打个折,信息缺口摆在那,别急着脑补结局。
一句话点评
选陪审团时冒出“大家都不喜欢他”,这场官司还没开打,Musk 的公众形象先成了麻烦。
锐评
Musk 诉 Altman 的案子进入陪审团遴选,The Verge 的报道抓到一个细节:候选陪审员里有人直言“大家都不喜欢他”。这说明 Musk 的公众形象已经成了庭审里的实际变量,不是花边,而是可能影响陪审员中立性的问题。报道没披露有多少人因此被排除,也没说双方律师在筛选时具体怎么利用这一点,但标题直接拿这句话当卖点,本身就暗示它成了遴选阶段的焦点。 目前公开的庭审文件还很少,我们只知道 Musk 一方主张自己被 OpenAI 欺骗,Altman 一方则要证明公司转型合理。这场官司的核心争议——OpenAI 是否背弃了非营利的初衷——反而被陪审员对 Musk 个人的好恶抢了风头。报道没提法官是否就此做过特别指示,也没说陪审团最终组成情况,这些信息缺口会让“形象影响判决”的判断打折扣。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
18:04
48d ago
Product Hunt · AI· rssEN18:04 · 04·27
Symphony:一个让 Codex 自动处理 GitHub Issue 的开源编排规范
Symphony 是一个开源规范,用来编排 OpenAI 的代码模型 Codex,核心想法是把任务追踪系统(比如 GitHub Issues)变成自动化的智能体工作流,人类只负责审核和给方向。正文没有披露规范的具体内容、许可证、版本号、维护方或使用示例,所以目前只能知道定位,没法评估实际效果或上手门槛。
#Agent#Code#Tools#OpenAI
精选理由
HKR-R 勉强通过,因为 Codex 编排对做编码 agent 的开发者确实重要。HKR-H 和 HKR-K 都不通过:正文没有给出可复现的机制、许可、版本号或实现细节。
一句话点评
把 GitHub Issues 变成自动化的 Codex 工作流,人类只负责审核。
锐评
Symphony 是一个开源规范,让 OpenAI 的代码模型 Codex 自动从任务追踪系统(比如 GitHub Issues)里领活干,人类只做审核和方向把控。想法挺直接:把 Issue 当指令,Codex 当执行者,省去手动分配和来回沟通。但正文没披露规范的具体内容、许可证、版本号、维护方或使用示例,所以目前只能知道定位,没法评估实际效果或上手门槛。如果是真的,对用 GitHub 做项目管理的团队可能省不少事,但开源项目好不好用关键看文档和社区,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
17:44
48d ago
Product Hunt · AI· rssEN17:44 · 04·27
doola MCP:在 Claude 和 Replit 里用 AI 注册美国 LLC
doola 把公司注册做成了一个 MCP 工具,你可以在 Claude 或 Replit 里让 AI 代理收集信息,然后 doola 帮你提交成立 Wyoming LLC。核心看点是公司注册这种线下流程开始进入 AI 代理的工具链,而不是模型本身有什么更新。正文没披露具体价格、支持哪些州、有哪些工具可用,也没说审核流程怎么走。
#Agent#Tools#doola#Claude
精选理由
一个偏小的 Product Hunt 产品更新,亮点是把公司注册流程做成 MCP 工具塞进 Agent 工作流,所以 HKR 三项勉强达标。但正文只有 RSS 摘要,没披露注册费用、支持州、工具列表和人工审核机制,信息缺口明显,只能落在 60-71 的小产品更新区间。
一句话点评
公司注册进AI代理工具链,但别急着激动,正文没披露价格和审核流程。
锐评
doola 把美国 LLC 公司注册做成了 MCP 工具,你可以在 Claude 或 Replit 里让 AI 代理收集信息,doola 负责提交成立 Wyoming LLC。核心看点是公司注册这种线下流程开始进入 AI 代理的工具链,而不是模型本身有什么更新。 关键信息缺口:正文没披露具体价格、支持哪些州、有哪些工具可用,也没说审核流程怎么走。这意味着你没法判断它比传统注册便宜多少、快多少,或者是否支持你所在的州。 一句话判断:方向对,但信息太少,先观望。如果价格合理且审核自动化程度高,确实能省不少事;否则可能只是个噱头。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
17:42
48d ago
Hacker News 首页· rssEN17:42 · 04·27
GitHub 搜索挂了,连带 Issues、Actions 和 Packages 一起崩
GitHub 官方状态页显示,搜索功能从 UTC 时间 4 月 27 日 16:31 开始降级,原因是 Elasticsearch 连接间歇性中断。受影响的还有 Issues、Actions、Packages 和 Pull Requests——Pull Requests 已经单独标记为事故。如果你团队在用 GitHub Actions 跑 CI/CD,...
#Code#Tools#GitHub#Atlassian
精选理由
HKR 全通过,因为这是正在发生的运营事故,且列出了具体受影响的服务。重要性定在 60–71 之间,因为这是 GitHub 的常规故障,不是 AI 模型或产品更新。
一句话点评
GitHub 搜索挂了,连带 Issues、Actions、Packages 和 PR 都受影响,原因是 Elasticsearch 连接间歇性中断。
锐评
GitHub 官方状态页确认,UTC 4 月 27 日 16:31 起搜索降级,根源是 Elasticsearch 连接间歇性中断。波及范围不小:Issues、Actions、Packages 均标记为降级,Pull Requests 已单独升级为事故。如果你的团队依赖 GitHub Actions 跑 CI/CD 或靠搜索找代码,今天下午到晚上可能频繁遇到超时或加载失败。正文没披露根因定位进度和预计恢复时间,只说了“仍在调查”。这点先别太激动——Elasticsearch 连接问题通常不会拖太久,但波及面广意味着修复后可能还有一段不稳定期。建议关注状态页更新,或临时切到本地仓库操作。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
17:38
48d ago
● P1彭博科技· rssEN17:38 · 04·27
中国施压Meta撤销已完成的Manus收购交易
彭博社报道,中国要求 Meta 撤销对 AI 初创公司 Manus 的收购,这笔交易价值 20 亿美元且已经完成。文章认为这是中国在延伸其域外交易审查的触角,但正文没披露具体的法律依据、时间表,也没提 Meta 的回应。
#Meta#Manus#Xi Jinping#Policy
精选理由
Bloomberg 这篇报道说中国要求 Meta 把已经完成的 Manus 收购撤掉,20 亿美元的交易被强行喊停,冲击力够强。我会先打个折:正文没披露监管依据、时间表,也没 Meta 的回应,所以信息有缺口。但光是“已完成交易被要求撤销”这个动作,就足够让做 AI 出海和投资的人紧张,分数给到 88 是合理的。
一句话点评
中国叫停了一笔已经完成的交易,Meta 花 20 亿美元买 Manus 的事被要求撤销,这在跨国 AI 收购里很少见。
锐评
这笔交易最不寻常的地方在于它是“事后推翻”——收购已经完成,中国监管部门经过数月审查后要求 Meta 撤资。20 亿美元的金额不小,但更值得关注的是时机和信号:在中美技术脱钩的大背景下,一个中国 AI 团队的模型和人才被直接叫停流向美国公司。Bloomberg 的报道直接说 Manus 的模型“官方死亡”,说明这次干预不只是钱的问题,而是对技术资产外流的红线画得很死。 目前公开报道主要来自 CNBC、FT、Bloomberg 这几家外媒,信息集中在监管动作本身。缺的是中国监管机构的具体审查理由、Manus 团队后续怎么处理模型和人员,以及 Meta 会不会走法律程序申诉。这些缺口让整件事看起来更像一个政治信号而非单纯的技术出口管制案例。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
16:30
48d ago
r/LocalLLaMA· rssEN16:30 · 04·27
用 Claude Code 技能 + 327 条带噪数据微调 Qwen3-1.7B,声称追上 GLM-5
Reddit 用户发帖说,他用 Claude Code 的一个技能(具体是什么技能正文没披露),只用了 327 条带噪声的 trace 数据就微调了 Qwen3-1.7B,效果对标 GLM-5。327 条数据量非常小,带噪意味着没做精细清洗,成本应该很低。但帖子正文被 403 挡住了,训练设置、评测基准、GLM-5 的匹配标准全都没公开。这个结果先别太...
#Code#Fine-tuning#Benchmarking#Reddit
精选理由
标题的钩子很猛:327条噪声轨迹就能追上GLM-5,数据量和结果的反差直接拉满关注。但正文被403封死,训练配置、评测集、对齐标准全没披露,关键信息缺失,没法判断真假。对从业者来说,低成本微调小模型追平大模型这个点确实戳中痛点——省样本省算力,谁看了都想试试。所以H和R通过,K因为信息缺口不通过。
一句话点评
327条带噪数据微调Qwen3-1.7B,号称对标GLM-5,但正文被403挡了,训练细节和评测标准全没公开。
锐评
Reddit用户声称用Claude Code的某个技能(具体技能未披露),仅用327条带噪声的trace数据微调Qwen3-1.7B,效果对标GLM-5。327条数据量极小,带噪意味着没做精细清洗,成本应该很低。但帖子正文被403屏蔽,训练设置、评测基准、GLM-5的匹配标准全未公开。这个结果先别太激动,信息缺口太大:没说明Claude Code技能是什么、微调方法(LoRA还是全参)、评测任务和指标、以及“对标”是单点持平还是全面超越。如果是真的,对低成本微调社区是好事,但缺乏可复现性,建议等作者补充细节或开源数据后再评估。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
16:29
48d ago
FT · 科技· rssEN16:29 · 04·27
Meta 在中国栽跟头,说明 AI 时代灰色地带越来越窄
FT 评论说 Meta 在中国碰壁,背后是 AI 正在改变过去几十年靠模糊地带获利的科技资本流动逻辑。文章没披露具体事件、金额或政策机制,但核心判断是:AI 让监管和地缘政治更倾向于划清界限,而不是容忍灰色空间。
#Meta#Financial Times#Commentary
精选理由
FT 的权威性加上 Meta/中国/AI 政策的视角,让这条内容在 H 和 R 上得分。K 不行是因为 RSS 摘要没提供任何具体事件、数字或机制,所以只能落在 60–71 的评论区间。正文没披露 Meta 具体做了什么、损失多少、政策怎么变的,这点先别太激动。
一句话点评
FT 评论说 Meta 在中国碰壁,背后是 AI 让监管和地缘政治更倾向于划清界限,而不是容忍灰色空间。
锐评
FT 这篇评论的核心判断是:过去几十年科技资本靠模糊地带获利,AI 改变了这个逻辑。文章没披露具体事件、金额或政策机制,所以这点先别太激动——它更像一个观察框架,不是实证报告。关键缺口是:Meta 到底在哪件事上碰了壁?是收购 Manus 被否(2 亿美元),还是模型合规问题?正文没给。另外,“灰色空间”具体指什么——数据跨境、模型权重出口、还是投资审查?也没展开。如果 FT 的判断成立,那对做跨境 AI 业务的人是个信号:以后合规成本会更高,靠“先做再说”的策略风险变大。但缺了具体案例和数字,这个判断暂时只能当背景音,不能直接用来做决策。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
16:13
48d ago
TechCrunch AI· rssEN16:13 · 04·27
iPhone 主屏幕 AI 应用 Skye 还没上线就拿到了投资
Skye 是一款还在内测的 iPhone 应用,想用 iOS 小组件做一个“AI 主屏幕”,让用户不用打开 App 或跟聊天机器人对话就能用 AI。开发商说还没正式发布就已经吸引了“数万”用户和投资人的兴趣。正文没披露融资金额、投资方、上线时间,也没说清楚 AI 具体怎么工作——比如是本地模型还是调 API、能做什么事。这点先别太激动,目前信息缺口挺大。
#Agent#Skye#Funding#Product update
精选理由
HKR-H 靠 iPhone AI 主屏这个钩子通过。HKR-K 和 HKR-R 不通过,因为缺少融资金额、投资方、上线时间和可验证的 AI 机制;没有硬性排除条件。
一句话点评
还没上线就拿到融资,但正文连融了多少钱、谁投的、怎么工作的都没说。
锐评
Skye 想做 iPhone 上的“AI 主屏幕”,用 iOS 小组件把 AI 能力推到桌面,用户不用打开 App 或跟聊天机器人对话就能用。开发商说内测阶段已吸引“数万”用户和投资人兴趣,但正文没披露融资金额、投资方、上线时间,也没说清楚 AI 具体怎么工作——是本地模型还是调 API、能做什么事。这点先别太激动,目前信息缺口挺大。如果真能实现“无感 AI 交互”,对用户习惯的颠覆可能比聊天机器人更直接,但验证还远不够。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
16:03
48d ago
● P1Hacker News 首页· rssEN16:03 · 04·27
GitHub Copilot 改用按量计费模式
GitHub 在 2026 年 4 月 27 日发了篇博文,标题就是 Copilot 要转向按用量计费。但正文只抓到了标题、发布时间和一堆导航栏,具体怎么个“按用量”法——比如按什么指标算钱、单价多少、有没有免费额度、超额怎么收费——全都没披露。所以现在只能知道计费模式要变,细节一概不清楚,先别急着算账。
#Code#Tools#GitHub#GitHub Copilot
精选理由
Copilot 改按量计费,对用它的团队来说,账单结构变了,得重新算账。我会先打个折——正文只给了标题和时间,没写什么时候生效、按什么单位算钱、单价多少、超额怎么收,这些才是采购真正要盯的。所以这条消息的钩子在于提醒大家盯用量口径,而不是现在就能做决策。
一句话点评
Copilot 订阅价没变,但改成按用量收费,重度用户的账单会变得不确定,先别急着高兴。
锐评
GitHub 把 Copilot 的计费模式从固定订阅改成了按实际用量算钱。官方说法是让收费更公平,但说白了,以前你一个月写多写少都是一个价,现在用得多就得多掏钱。这对偶尔用一下的轻度用户可能是好事,但对每天靠它写代码的重度用户,月底账单会变成未知数。 目前官方公告只说了计费规则要变,但没给出具体的单价——比如每接受一次代码补全收多少钱,或者每千次请求怎么算。这个信息缺口很大,没有单价就没法判断实际成本是涨是跌。另外,企业版和个人版的费率是否一样,正文也没提。 这条新闻值得关注的点在于,它可能改变团队采购 Copilot 的决策逻辑。以前按人头买,预算好算;以后按用量算,就得盯着使用量做成本控制了。建议等 GitHub 公布具体费率表再下结论,现在只能说方向定了,账本还没翻开。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
16:00
48d ago
● P1FT · 科技· rssEN16:00 · 04·27
560多名Google员工敦促CEO阻止美军使用其AI系统
超过 560 名 Google 员工给 Sundar Pichai 发了一封公开信,要求公司明确拒绝把 AI 技术用于美国军事用途。信里提到了五角大楼和 Anthropic 之间的冲突,但正文没披露员工的具体诉求、涉及哪些产品或合同金额。
#Safety#Google#Sundar Pichai#Anthropic
精选理由
我会先打个折:信里到底要求停用哪些产品、涉及多大合同,正文全都没写,所以没法判断实际业务冲击有多大。但 560 多人集体向 Pichai 施压这件事本身就有冲突感,加上 Pentagon 和 Anthropic 的背景,从业者很难不关心。信息缺口明显,先别太激动,但值得放进精选。
一句话点评
560多名Google员工联名要求CEO拒绝涉密军事AI项目,但FT正文被付费墙挡住,具体诉求和项目细节看不到。
锐评
Google员工又因为军事合同跟管理层杠上了。这次是560多人联名,直接找CEO Sundar Pichai,要求公司别碰美国军方的涉密AI项目。从标题看,这像是2018年“Maven项目”争议的延续——当时员工抗议公司用AI帮军方分析无人机影像,最后Google没续约,还出了套AI原则。现在这个新项目具体做什么、合同多大、涉及哪个军种,FT的报道被锁在付费墙后面,正文没披露。Bloomberg和The Verge的标题也都没给细节。 员工敢这么公开施压,说明内部反对声音不小,但这次能不能像2018年那样逼管理层让步,得看项目性质和钱有多少。目前信息缺口很大:不知道这是新签的合同还是续约,不知道是直接武器系统还是后勤分析,也不知道Google官方回应了什么。这些没补上之前,先别急着下判断。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
15:56
48d ago
X · @dotey(宝玉)· x-apiZH15:56 · 04·27
GPT Image 2 海报提示词:Elon Musk
dotey 分享了一个 GPT Image 2 的海报提示词,输入“Elon Musk”就能生成一张成品级概念字体海报。提示词要求标题文字必须巨大、可读、拼写准确,占视觉主导;如果标题是知名人物,还要加一张占画面 40–70% 的编辑肖像,肖像不能照搬现有照片或官方图,但得让人一眼认出是谁。配色限制在 4–6 色,风格走高端编辑海报路线,带丝网/石印/...
#Vision#Multimodal#dotey#xiaoxiaodong01
精选理由
HKR-K通过,因为帖子给出了可复用的GPT Image 2海报提示词约束。HKR-H/R不通过:没有产品新闻、基准测试或一手实测,所以价值较低。
一句话点评
一个提示词就能让 GPT Image 2 出成品级海报,但别指望每次都稳定。
锐评
dotey 分享的这条提示词,输入“Elon Musk”就能让 GPT Image 2 生成一张概念字体海报。核心要求:标题文字巨大、拼写准确、占视觉主导;如果是知名人物,还要加一张占画面 40–70% 的编辑肖像,但不能照搬现有照片。配色限制在 4–6 色,风格走高端编辑海报路线,带丝网/石印质感。 这条提示词的价值在于把“生成一张好海报”这个模糊需求拆成了可执行的规则:字体设计、人物识别、色彩系统、构图逻辑都给了具体约束。对于想用 AI 做视觉设计的人来说,这是一个可以直接套用的模板。 但正文没披露 GPT Image 2 对复杂提示词的遵循率有多高,也没说多次生成的一致性如何。实际效果可能时好时坏,尤其是“肖像不能照搬现有照片但又要让人一眼认出”这条,模型很可能翻车。另外,提示词里要求“自定义字体设计”,但当前图像生成模型对字母形状的精确控制还很弱,拼写错误或字体变形是常见问题。所以这条提示词值得收藏,但别指望每次都能稳定输出成品级海报。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H0·K1·R0
15:29
48d ago
Hacker News 首页· rssEN15:29 · 04·27
美国最高法院开审警方用手机位置数据抓嫌犯的合宪性
最高法院今天(4月27日)审理Chatrie案,核心问题是警方能不能不经个人搜查令,就向谷歌等公司批量调取案发地附近所有手机的位置数据。案子起因是2019年弗吉尼亚一家银行被抢,警方用“地理围栏搜查令”扫了案发前后30分钟内附近所有手机的位置,最终锁定并定罪了一名牙买加移民。对AI团队来说,这个案子划了一条线:你训练模型用的位置数据、用户轨迹,未来可能...
#US Supreme Court#Okello T. Chatrie#Alphabet#Policy
精选理由
HKR全过:钩子是最高法院审查地理围栏令,有具体30分钟位置数据事实。属于技术政策类,不是AI产品或模型新闻,所以不上精选。
一句话点评
最高法院今天审的案子,决定警方能不能不拿个人搜查令,就批量扫走案发地附近所有人的手机位置。
锐评
核心是2019年弗吉尼亚银行劫案:警方用“地理围栏搜查令”扫了案发前后30分钟内附近所有手机的位置数据,最终锁定并定罪了一名牙买加移民。被告上诉到最高法院,今天开庭。 对AI团队来说,这条线划在哪很关键。你训练模型用的位置数据、用户轨迹,未来可能受第四修正案约束——如果法院认定批量位置查询属于“搜查”,那谷歌这类数据提供方就得收紧API,你的训练数据获取成本和法律风险都会上升。 正文没披露谷歌具体提供了多少台设备的数据,也没说法院内部倾向。但2018年已有判例要求基站位置数据需搜查令,这次是更细粒度的GPS级数据。如果法院收紧,地理围栏类数据集(如SafeGraph)的合规成本会涨,开源位置数据也可能变少。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:28
48d ago
彭博科技· rssEN15:28 · 04·27
高通可能和 OpenAI 合作做 AI 手机
彭博发了一条视频简讯,说高通股价周一涨了,因为分析师称高通正在和 OpenAI 合作做智能手机。正文被屏蔽了,没披露用哪款芯片、什么模型、什么时候出、合作条款。关键看高通是想卖芯片,还是想借 AI 手机自己下场做入口。
#Qualcomm#OpenAI#Ed Ludlow#Commentary
精选理由
HKR-H 和 HKR-R 都成立:OpenAI 手机这个传闻本身就是一个很直接的渠道钩子,能让人立刻关注端侧 AI 的竞争格局。HKR-K 不成立是因为正文只转述了一位分析师的说法,机型、芯片、发布时间、合作条款一概没披露,信息缺口太大,所以分数落在 60–71 这个区间。
一句话点评
高通和OpenAI合作做手机?消息源只有分析师一句话,正文被屏蔽,细节全无。
锐评
彭博发了一条视频简讯,说高通股价周一涨了,因为分析师称高通正和OpenAI合作做智能手机。正文被屏蔽了,没披露用哪款芯片、什么模型、什么时候出、合作条款。关键看高通是想卖芯片,还是想借AI手机自己下场做入口。目前信息缺口太大:分析师是谁?消息来源是供应链还是内部人士?合作是深度定制还是简单预装?这些都没说。股价涨了说明市场先信了,但这点先别太激动,等彭博或高通自己出详细报道再判断。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
15:12
48d ago
Hacker News 首页· rssEN15:12 · 04·27
荷兰央行弃AWS,选了Lidl的云
荷兰央行(DNB)明天将和Schwarz Digits签大单,把云服务从AWS换成Lidl母公司旗下的Stackit,目的是减少对美国云厂商的依赖。Stackit主打“欧洲主权云”,数据受欧洲法律管辖,不像AWS、Azure那样可能被美国Cloud Act要求交数据。Schwarz Digits刚宣布投110亿欧元在吕伯瑙建数据中心,规模不小。但DNB...
#De Nederlandsche Bank#Schwarz Digits#Lidl#Partnership
精选理由
HKR 三项都过,但核心是主权云采购,不是 AI 模型、智能体或产品更新。属于有趣但不值得上头条的级别。
一句话点评
荷兰央行要把云从AWS换到Lidl的Stackit,主打欧洲主权,但性能可能打折。
锐评
荷兰央行(DNB)明天正式签约,把云服务从AWS换成Lidl母公司旗下的Stackit,核心诉求是摆脱对美国云厂商的依赖,避免数据被美国Cloud Act调取。Stackit主打“欧洲主权云”,数据受欧洲法律管辖,且Schwarz Digits刚宣布投110亿欧元在吕伯瑙建数据中心,规模不小。但DNB行长去年10月自己承认,欧洲云“不如美国云稳健、质量高”。这点先别太激动:Stackit目前主要客户是Lidl、Kaufland和德国铁路,金融监管机构级别的负载验证还很弱。正文没披露合同金额、迁移时间表、以及DNB哪些业务会先搬。对AI团队来说,如果手上项目涉及欧洲金融客户数据,这类主权云约束会直接影响模型训练数据的存储和推理部署选址,值得提前跟踪。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
14:33
48d ago
r/LocalLLaMA· rssEN14:33 · 04·27
用 Gemma 4 和 Pi 在本地跑一个编程助手
Patrick Loeber 发了个教程,教你怎么在本地用 Gemma 4 和 Pi 搭一个写代码的 agent。Reddit 上有人说自己用类似的方案(只是把 lmstudio 换成了 llama.cpp)。正文没披露具体硬件配置、模型大小和操作步骤,所以想照着做的话得自己去看原帖或视频补细节。
#Agent#Code#Patrick Loeber#Gemma
精选理由
HKR-H 和 HKR-R 通过:小硬件跑本地编码 Agent 符合 LocalLLaMA 社区兴趣。HKR-K 不通过:正文缺硬件规格、模型大小、命令和基准测试,无法验证可行性。
一句话点评
本地跑代码 agent 的教程,但缺硬件和步骤细节。
锐评
Patrick Loeber 发了个教程,教你在本地用 Gemma 4 和 Pi 搭一个写代码的 agent。Reddit 上有人说自己用类似方案(只是把 lmstudio 换成了 llama.cpp)。这条的价值在于:本地跑 coding agent 意味着代码数据不出本机,对隐私敏感场景(比如处理公司内部代码)有吸引力。但正文没披露具体硬件配置(比如需要多少显存)、模型大小(Gemma 4 哪个版本)和操作步骤,所以想照着做的话得自己去看原帖或视频补细节。如果是真的,对本地开发者和隐私敏感团队是个低成本方案,但验证门槛还在——你得先有块够大的显卡。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
14:26
48d ago
● P1彭博科技· rssEN14:26 · 04·27
前DeepMind研究员David Silver创办公司融资11亿美元估值51亿
David Silver 创立的 Ineffable Intelligence 拿了 11 亿美元融资,投后估值 51 亿美元,红杉和英伟达都参投了。正文没披露具体做什么产品、模型参数和发布时间,目前只能看到一笔大额融资和豪华投资方名单。这点先别太激动,产品没出来之前,估值更多反映的是团队背景和资源背书。
#Sequoia#Nvidia#David Silver#Funding
精选理由
我会先打个折——正文没提产品做什么、模型多大、什么时候发,所以信息密度其实不高。但 David Silver 这个名字加上红杉和英伟达的组合,在圈内就是硬通货,融资规模和估值本身已经是信号。HKR 三项都踩中了,不过因为产品细节完全空白,分数就停在 82,不给更高。
一句话点评
David Silver 刚成立几个月的公司拿了 11 亿美元,估值 51 亿,想靠不依赖人类数据的方式训练 AI。人很牛,钱很多,但还没看到任何产品。
锐评
前 DeepMind 研究员 David Silver 的新公司 Ineffable Intelligence 拿到了红杉和英伟达等投的 11 亿美元,估值 51 亿。Silver 是强化学习领域的大牛,AlphaGo 的核心人物,他想让 AI 不靠人类标注数据、自己通过环境交互来学习,这思路在游戏和数学证明里跑通过,但能不能泛化到通用任务上,正文没给出任何技术细节或验证结果。 公司才成立几个月,没有公开产品、没有论文、没有基准测试成绩,就凭创始人的履历和“不用人类数据”这个叙事融了这么大一笔钱。11 亿美元这个数字说明投资人赌的是路线之争——如果真能绕开昂贵的人工标注和版权数据,训练成本会大幅下降。但正文没披露团队规模、算力计划和阶段性目标,这些缺口让 51 亿估值看起来更像是对人的定价,而不是对事的。 现在还缺两个关键信息:一是他们打算在什么具体场景先落地,二是这种纯自博弈式的学习在复杂开放任务里会不会遇到瓶颈。如果是真的能跑通,确实省钱;但在看到 demo 之前,这笔融资的泡沫成分有多大,只能先打个问号。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
14:24
48d ago
Hacker News 首页· rssEN14:24 · 04·27
为什么不一定非要用 Lean 做数学形式化?
Lawrence Paulson 这篇文章是在给“数学形式化首选 Lean”这个默认选项泼冷水。他承认 Lean 工具好、库大、社区活跃,但提醒大家形式化数学的历史有快 60 年了,不是 Lean 才开始的。1968 年的 AUTOMATH 就已经能形式化实数的戴德金完备性,只是符号难读、没有自动化。1973 年的 Boyer-Moore 系统(后来的...
#Reasoning#Code#Lawrence Paulson#Lean
精选理由
文章主要是证明助手的历史回顾和社区评论,不是 AI 模型、产品或安全更新。HKR 三项都达标,但内容偏学术史,不适合上推荐位。
一句话点评
Paulson 直接泼冷水:别把 Lean 当数学形式化的默认答案。他翻出 1968 年的 AUTOMATH 和 1973 年的 Boyer-Moore,提醒大家这条路走了快 60 年,不是 Lean 才开始的。
锐评
这篇文章不是技术评测,而是一篇立场鲜明的历史提醒。Paulson 承认 Lean 工具好、库大、社区活跃,但他真正想说的是:数学形式化不是 Lean 发明出来的。他搬出 1968 年的 AUTOMATH,说它早在 1977 年就形式化了 Landau 的《分析基础》,从纯逻辑一路推到实数完备性,只是符号难读、没有自动化。1973 年的 Boyer-Moore 系统(后来的 ACL2)走的是代码验证路线,但也搞定了哥德尔不完备定理、巴拿赫-塔斯基悖论这些硬骨头。到 2014 年之前,四色定理、奇阶定理、开普勒猜想这些大结果已经被 HOL Light、Isabelle/HOL、Rocq 等系统形式化过了。 他的核心判断是:现在社区把 Lean 当默认选项,更多是路径依赖和从众,不是因为它有不可替代的能力边界。文章没给具体对比数据,也没说 Lean 在哪些数学领域确实更强,更像是一个老将的吐槽。如果你想知道 Lean 到底在哪些任务上比 Isabelle/HOL 或 Rocq 好,这篇文章给不了答案,得自己去看各系统的 benchmark 和实际项目。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:23
48d ago
r/LocalLLaMA· rssEN14:23 · 04·27
有人在手机上跑起了OpenAI的隐私过滤模型,内存吃掉约600MB
Reddit用户K4anan用ExecuTorch在手机上跑通了OpenAI的隐私过滤模型,内存占用约600MB。这个模型能扫描邮件、文档、聊天记录等文本,标记敏感内容,效果比预期好,不是简单的关键词匹配。好处是数据不用上传云端,适合处理草稿、内部文档这类用户最不想外传的内容。不过正文没披露跑在什么设备上、有没有做量化、延迟多少,也没给基准测试数据,所...
#Safety#Inference-opt#OpenAI#ExecuTorch
精选理由
Reddit 用户 K4anan 用 ExecuTorch 在手机上跑 OpenAI 的隐私过滤模型,桥接层是 react-native-executorch,内存占用约 600 MB。能处理邮件、文档、聊天记录和转录文本。亮点是本地推理,不用把数据传出去,对隐私敏感场景很实用。但正文没披露设备型号、延迟、量化方式和评测集,验证力度不够,所以不推 featured。
一句话点评
有人在手机上跑通了OpenAI的隐私过滤模型,内存600MB,数据不用上传。
锐评
Reddit用户K4anan用ExecuTorch在手机上跑通了OpenAI的隐私过滤模型,内存占用约600MB。这个模型能扫描邮件、文档、聊天记录等文本,标记敏感内容,效果比预期好,不是简单的关键词匹配。好处是数据不用上传云端,适合处理草稿、内部文档这类用户最不想外传的内容。不过正文没披露跑在什么设备上、有没有做量化、延迟多少,也没给基准测试数据,所以实际可用性要打个问号。600MB对手机来说不算小,如果没量化,中低端设备可能跑不动。另外,OpenAI这个模型本身是闭源的,能跑通说明有人做了转换,但后续更新和维护依赖社区,不是官方支持。这点先别太激动,等有人放出延迟和精度对比再说。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
14:14
48d ago
Product Hunt · AI· rssEN14:14 · 04·27
Thoth:Mac 上的本地隐私录音转文字工具
Thoth 是一款主打隐私的 Mac 端 AI 转录工具,所有录音转文字都在本地完成,不上传云端。正文没披露用了什么模型、价格多少、是否支持离线、支持哪些语言、以及转写准确率。从业者可以关注它的本地推理方案,但产品页信息太少,目前没法判断实际效果。
#Audio#Thoth#Product update
精选理由
一个 Product Hunt 上的小产品发布,只有本地私有转写这一个卖点。模型、准确率、语言支持、离线怎么实现全都没说。HKR 里的 R 勉强沾边,但证据不足,所以只能放在低价值区间。
一句话点评
Mac端本地转录工具,主打隐私,但产品页信息太少,没法判断实际效果。
锐评
Thoth 是一款 Mac 端的 AI 转录工具,核心卖点是所有录音转文字都在本地完成,不上传云端,对隐私敏感的用户有吸引力。但产品页信息严重不足:没披露用了什么模型、价格多少、是否支持离线、支持哪些语言、以及转写准确率。从业者可以关注它的本地推理方案,但这点先别太激动——正文没披露任何关键指标,目前没法判断实际效果。如果它真能做到本地实时转写且准确率接近云端方案,那对隐私合规场景(如医疗、法务)有价值,但产品页连个 demo 或 benchmark 都没有,建议等更多实测数据再评估。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
14:00
48d ago
OpenAI 博客· rssEN14:00 · 04·27
OpenAI 拿到美国政府云安全认证,联邦机构可以用 GPT-5.5 了
OpenAI 宣布 ChatGPT Enterprise 和 API 平台通过了 FedRAMP Moderate 认证,这是美国政府给云服务商的安全合规标签,相当于拿到了联邦机构的入场券。以后美国政府部门可以用 GPT-5.5 处理内部工作,比如写公文、做翻译、分析数据、加速软件开发。这次走的是 FedRAMP 20x 新流程,比传统认证快一些,但正...
#Safety#OpenAI#Product update#Policy
精选理由
HKR-K 和 HKR-R 通过:FedRAMP Moderate 授权改变了美国联邦采购和企业合规检查的准入条件。HKR-H 弱,因为正文只给了产品范围和授权级别,没有价格或部署路径。
一句话点评
OpenAI 拿到了美国政府的 FedRAMP Moderate 认证,联邦机构终于能用 GPT-5.5 处理内部工作了。
锐评
OpenAI 宣布 ChatGPT Enterprise 和 API 平台通过了 FedRAMP Moderate 认证,相当于拿到了美国联邦机构的入场券。以后政府部门可以用 GPT-5.5 写公文、做翻译、分析数据、加速软件开发。这次走的是 FedRAMP 20x 新流程,比传统认证快一些,但正文没披露具体快了多少,也没说部署在哪个区域、定价多少、采购渠道有哪些。对 AI 从业者来说,这条消息的信号是:OpenAI 正式进入政府合规市场,但实际落地速度还得看 agency 自己的审批节奏。目前只提到通过 Carahsoft 采购,其他路径语焉不详。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
13:47
48d ago
r/LocalLLaMA· rssEN13:47 · 04·27
中文小模型写故事为什么这么少?
Reddit 用户 kabachuha 发问:为什么中国公司不做 100B 以下、适合本地跑的中文创意写作或角色扮演模型?他承认 Qwen 3.6 的 35B/27B 很强,但觉得 Qwen 太干、偏 STEM,写东西不行。相比之下,西方社区有大量基于 LLaMA、Mistral、Gemma 4 的小模型微调版,覆盖各种题材。他认为中国在版权和内容审查...
#Fine-tuning#Qwen#LLaMA#Mistral
精选理由
H 成立:中文小模型在创写/RP 场景里选择少,Qwen 3.6 35B/27B 评测强但写作干涩,这个缺口本身值得关注。K 不成立:帖文只点名了 Qwen 3.6 35B/27B 和 LLaMA/Mistral 的对比,没有贴评测表格、输出样本或训练机制,信息缺口明显。R 成立:本地模型用户对成本敏感,预训练过滤和微调生态的焦虑是真实痛点,帖文直接戳中了这个群体。
一句话点评
中国公司不做小尺寸创意写作模型,用户只能拿Qwen写代码。
锐评
Reddit用户kabachuha抱怨:中国公司不做100B以下、适合本地跑的中文创意写作/角色扮演模型。他承认Qwen 3.6的35B/27B很强,但觉得Qwen太干、偏STEM,写东西不行。相比之下,西方社区有大量基于LLaMA、Mistral、Gemma 4的小模型微调版,覆盖各种题材。他认为中国在版权和内容审查上更宽松,本应做出更好的基座模型。 关键信息:帖子没有给出任何基准数据或具体评测,只是个人感受。Qwen系列在创意写作上的表现是否真的“糟糕”,缺乏客观验证。另外,中国公司不做小尺寸创意模型的原因可能包括:市场导向(更看重代码/数学等硬核能力)、合规风险(创意内容更难审核)、以及社区生态差异(西方有更活跃的微调社区)。正文没披露中国公司是否有相关内部项目或计划。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
13:34
48d ago
Hacker News 首页· rssEN13:34 · 04·27
Tendril:一个会自己造工具、自己注册工具的AI Agent
Tendril 是一个能自己写代码、生成新工具,并自动注册到可用列表里的 AI Agent。简单说,它不只是调用现成工具,而是遇到新需求时自己写一个出来,然后下次就能直接用。项目刚发布,GitHub 上 0 star、0 fork,正文没披露底层模型、部署方式,也没说清楚“注册工具”具体怎么实现。想法有意思,但现阶段更像一个概念验证,离生产还远。
#Agent#Tools#Code#serverless-dna
精选理由
HKR-H 和 HKR-R 通过:自扩展 agent 的钩子有吸引力,且涉及工具链自修改的安全控制问题。HKR-K 不通过:正文只暴露了一个 GitHub 空壳和 0 star,没有可复现的机制。
一句话点评
一个能自己写工具并注册的 Agent,想法有意思,但项目刚建,0 star,离落地还远。
锐评
Tendril 的核心卖点是“自扩展”:Agent 遇到现有工具解决不了的问题时,自己写代码生成新工具,然后自动注册到可用列表里,下次直接调用。这个思路在 Agent 工具链里算一个自然进化——从“调用固定工具集”走向“动态生成工具”。但项目目前 GitHub 上 0 star、0 fork、0 issue,正文没披露底层模型(GPT-4o 还是开源模型?)、部署方式(本地还是云端?),也没说清楚“注册工具”具体怎么实现(是写个函数注册到内存,还是持久化到文件系统?)。如果是真的,能省掉大量手动写工具的工作量,但现阶段更像一个概念验证,离生产环境还远。缺的东西太多:安全性(生成的工具会不会有漏洞?)、稳定性(生成失败怎么办?)、性能(生成一次工具要多久?)。建议先观望,等作者放出更多技术细节和 demo。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
11:00
48d ago
The Verge · AI· rssEN11:00 · 04·27
AI 设计的汽车正在成型
通用和日产正在用 AI 缩短汽车设计周期,传统流程从草图到油泥模型要五年以上。文章提到 AI 能加速前期草图迭代和 3D 建模,但没披露两家具体用了什么模型、工具链,也没说量产时间。核心信息是:车企在贸易战和需求不确定的背景下,想靠 AI 把开发时间砍下来,但具体能砍多少、效果如何,正文没给数据。
#Vision#Multimodal#Tools#The Verge
精选理由
HKR-H靠AI设计汽车这个跨行业钩子成立;HKR-R击中设计劳动自动化焦虑;HKR-K不成立:文章给了5年周期和旧流程,但没披露GM/Nissan的AI机制、模型细节或量产条件。
一句话点评
车企想用AI把五年开发周期砍半,但具体怎么砍、砍多少,正文没给数据。
锐评
通用和日产在尝试用AI缩短汽车设计周期,传统流程从草图到油泥模型要五年以上。文章提到AI能加速前期草图迭代和3D建模,但没披露两家具体用了什么模型、工具链,也没说量产时间。核心信息是:车企在贸易战和需求不确定的背景下,想靠AI把开发时间砍下来,但具体能砍多少、效果如何,正文没给数据。这点先别太激动,因为汽车设计涉及安全法规、供应链协同和工程验证,AI目前更多是辅助前期创意发散,离真正替代工程师还有距离。另外,文章也没提AI生成的设计是否通过了碰撞测试或风洞验证,这些才是量产的关键门槛。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
10:34
48d ago
Product Hunt · AI· rssEN10:34 · 04·27
Kōan:给 AI Agent 装个监控,看它每一步怎么推理、调了哪些工具
Kōan 是一个专门监控 AI Agent 的观测平台,能追踪模型的推理过程、工具调用和决策路径。对做 agent workflow 的团队来说,相当于给模型干活时装了个日志系统,方便调试和复盘。不过正文没披露支持哪些框架、是否采样、定价和部署方式,这些关键信息目前是缺失的。
#Agent#Reasoning#Tools#Kōan
精选理由
HKR-R 通过:tool call 追踪是 agent 调试的真实痛点。HKR-H/K 弱,因为 RSS 摘要没披露框架支持、采样、部署或定价,这只是一个低价值的产品更新。
一句话点评
Agent 可观测性平台,但信息太少,先观望。
锐评
Kōan 是一个专门监控 AI Agent 的观测平台,能追踪模型的推理过程、工具调用和决策路径。对做 agent workflow 的团队来说,相当于给模型干活时装了个日志系统,方便调试和复盘。不过正文没披露支持哪些框架、是否采样、定价和部署方式,这些关键信息目前是缺失的。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K0·R1
10:29
48d ago
Product Hunt · AI· rssEN10:29 · 04·27
Clipto:本地运行,用自然语言搜 TB 级视频和音频
Clipto 是一款完全本地的媒体搜索引擎,能让你像用 Google Photos 一样,用自然语言搜自己电脑里的视频、音频、会议记录和文件,而且不上传任何数据到云端。它自动识别人物、对话和场景,你只要描述要找的内容就能定位到具体片段。官方给了一个性能参考:在 MacBook Pro M5 上,24 小时索引完 2TB 视频——这个速度对于本地方案来说...
#Tools#Multimodal#Clipto#Product update
精选理由
HKR-H 靠本地 TB 级搜索钩子通过,但 HKR-K/R 不通过:产品页缺少机制、支持格式、定价或从业者能讨论的角度。
一句话点评
Clipto 是一个完全本地的媒体搜索引擎,像 Google Photos 但跑在你电脑上,不上传任何数据。官方称在 MacBook Pro M5 上 24 小时能索引完 2TB 视频,这个速度对于本地方案来说相当不错。但正文没披露支持哪些文件格式、索引方法、定价或硬件要求,这些信息缺口让实际可用性打了折扣。短评:本地搜视频挺实用,但细节太少,先别急着冲。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
10:14
48d ago
Hacker News 首页· rssEN10:14 · 04·27
法国 Mistral 靠“不是美国公司”撑起 140 亿美元估值
福布斯报道称 Mistral 估值 140 亿美元,但正文没披露估值依据、营收、融资轮次或客户数。Hacker News 上 27 个点赞、3 条评论,热度不高。这个估值数字挺大,但信息缺口明显——没有收入或用户数据支撑,先别太激动。
#Mistral#Forbes#Hacker News#Funding
精选理由
标题钩子强,但信息缺口大:140亿估值是投前还是投后?有没有收入?客户是谁?正文都没说。Hacker News只有27分3条评论,热度低。建议先打个折,等完整报道再判断。
一句话点评
Mistral 估值 140 亿美元,但正文没披露收入或客户数,先别太激动。
锐评
福布斯报道称法国 AI 公司 Mistral 估值 140 亿美元,主打“非美国”身份。但正文没披露估值依据、营收、融资轮次或客户数,Hacker News 上仅 27 个点赞、3 条评论,热度不高。这个数字挺大,但信息缺口明显——没有收入或用户数据支撑,先别太激动。缺的是:估值谁给的、上一轮融资额、实际客户案例。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
10:11
48d ago
● P1新智元 · 公众号· rssZH10:11 · 04·27
奥特曼喊完“红色警戒”五个月,GPT Image 2 在图像竞技场三项登顶,把谷歌甩开一大截
GPT Image 2 上线不到半天就在 Arena 图像榜拿了三个第一。文生图得分 1512,比第二名 Nano Banana 2 高出 241 分,Arena 说这是图像榜有史以来最大分差。盲测胜率 93%,文字渲染能力一口气涨了 316 分。核心变化是模型会“先想再画”:先规划构图、自己检查结果、能联网搜图,还能一次出 8 张风格统一的图。不过正...
#Multimodal#Vision#Reasoning#OpenAI
精选理由
GPT Image 2一上线就屠榜,分数和胜率都摆在那,1512分、93%盲测胜率、文字渲染涨316分,这些数字说明它确实把文生图拉到了新高度。我会先打个折:原生思考图像模型听起来很猛,但正文没披露具体架构和成本,这点先别太激动。不过一次生成8张连贯图、能联网搜图再画,对做设计和内容的人很实用。整体是近期多模态产品里最硬的一次更新,值得从业者盯一下。
一句话点评
GPT Image 2 在 Arena 图像榜拿了三个第一,文生图得分 1512,比第二名高出 241 分,盲测胜率 93%。核心变化是模型会“先想再画”,能自己规划构图、检查结果,还能联网搜图。不过正文没披露推理成本和延迟,这点先别太激动。
锐评
GPT Image 2 这次在 Arena 图像榜上确实猛,文生图得分 1512,比第二名 Nano Banana 2 高出 241 分,Arena 官方说这是图像榜有史以来最大分差。盲测胜率 93%,文字渲染能力一口气涨了 316 分,说明之前被诟病的“图上写字乱码”问题有了实质性改进。 技术上的关键变化是模型会“先想再画”——先规划构图、自己检查结果、能联网搜图,还能一次出 8 张风格统一的图。这相当于把推理能力嵌进了生图流程,不是简单的扩散模型升级。但正文没披露推理成本、生成延迟和并发限制,这些对实际使用影响很大。如果每张图要等十几秒、API 调用费翻倍,那“屠榜”的体验会打折扣。 另外,文章提到奥特曼五个月前发过“红色警戒”,但没展开说当时预警的具体风险和这次模型在安全对齐上做了什么。图像生成的安全边界比文本更模糊,这块信息缺口值得关注。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
10:11
48d ago
新智元 · 公众号· rssZH10:11 · 04·27
TRAE SOLO 加语音输入:动嘴就能干活,但别急着当主力
TRAE SOLO 上线了语音输入功能,不是简单的语音转文字,而是让你用嘴下指令,比如“清理这段录音”或“调出某个技能”。文章提到配套麦克风只有 7.9 克、48kHz 采样,但没披露语音识别的准确率和延迟——这点先别太激动。TRAE 注册用户超 600 万,月活 160 万,说明产品有一定基础,但语音作为 agent 指令入口到底好不好用,正文没给实...
#Agent#Audio#Tools#TRAE
精选理由
这是一次小产品更新加硬件捆绑,核心看点是语音从听写变成 Agent 指令入口,但正文没披露模型能力、定价或任务成功率,信息缺口明显。H/K/R 都过,因为语音转 Agent 指令这个 hook 够直接,设备参数和用户量数据都有,且踩中了低摩擦指令入口的竞争神经。
一句话点评
语音当指令入口,不是转文字,但准确率和延迟都没说。
锐评
TRAE SOLO 上线了语音输入功能,核心卖点是“动嘴办公”——不是语音转文字,而是直接下指令,比如“清理这段录音”或“调出某个技能”。配套麦克风只有 7.9 克、48kHz 采样,硬件参数不错。但正文没披露语音识别的准确率和延迟,这点先别太激动。如果是真的挺省钱,但 agent 指令入口好不好用,关键看识别速度和误触发率,目前信息缺口很大。TRAE 注册用户超 600 万,月活 160 万,说明产品有一定基础,但语音作为 agent 入口的体验验证还缺实测数据。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
09:57
48d ago
Hacker News 首页· rssEN09:57 · 04·27
4TB 语音样本泄露:4 万名 AI 外包人员的声纹和身份证一起被偷了
勒索组织 Lapsus$ 在 4 月 4 日公开了 Mercor 的 4TB 数据,涉及超过 4 万名 AI 数据标注外包人员。这批数据特殊在:每个人的录音(2-5 分钟,安静环境下朗读脚本)和身份证扫描件是绑在一起的。攻击者用 15 秒干净语音就能克隆声音,而这里每人有几分钟,配合身份证可以直接绕过银行声纹验证、冒充本人给公司 HR 打电话骗转账、甚...
#Audio#Safety#Mercor#ORAVYS
精选理由
ORAVYS声称Mercor泄露4TB语音样本,包含超4万名承包商的语音、身份证和自拍,Lapsus$在4月4日发布。15秒就能克隆声音,每人录音2-5分钟,这个量级足够训练高质量语音模型。但整篇只有ORAVYS单方面说法,没有独立验证,也没有Mercor的回应。信息缺口明显:泄露是否属实、数据是否已被滥用、Mercor是否通知受影响者,正文都没提。事件本身够严重,但证据链单薄,所以评分压在60-71的泄露事件区间。
一句话点评
4万人的录音+身份证一起被偷,声纹克隆门槛才15秒,这次是实打实的生物识别灾难。
锐评
勒索组织Lapsus$在4月4日公开了Mercor的4TB数据,涉及超过4万名AI数据标注外包人员。这批数据特殊在:每个人的录音(2-5分钟,安静环境下朗读脚本)和身份证扫描件是绑在一起的。攻击者用15秒干净语音就能克隆声音,而这里每人有几分钟,配合身份证可以直接绕过银行声纹验证、冒充本人给公司HR打电话骗转账、甚至做多人大模型视频诈骗(参考2024年Arup案损失2500万美元)。FBI报告2026年60岁以上受害者因冒充电话损失23亿美元,这类攻击正在快速上升。 不过要打两个折:第一,信息来源是ORAVYS——一家卖声纹检测服务的公司,有动机把事件说得更严重。正文没披露独立验证,比如是否有人实际用这批数据成功绕过银行。第二,5起诉讼已提交,但法律流程长,短期威慑有限。如果是真的,这比普通数据泄露严重得多——密码能改,声纹和身份证不能。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
09:19
48d ago
Hacker News 首页· rssEN09:19 · 04·27
Moleskine 的《指环王》联名款用了AI图,但没说是哪部分
Moleskine 出了《指环王》主题文具,部分宣传图上标了“由AI生成”。但4月15日的Instagram帖子8张图都没提AI,官网也没说哪些产品用了AI。问题在于披露粒度不够,不是画风本身。正文没披露AI具体用在哪些环节、有没有人工修改。
#Multimodal#Moleskine#The Lord of the Rings#Product update
精选理由
HKR 三项都勉强通过:钩子是 Moleskine 给《指环王》联名文具标了 AI 生成,品牌和 IP 情怀冲突;新事实是 Instagram 8 张图没提 AI,官网也没说清楚用了哪些环节。这本质是文具品牌的披露争议,不是 AI 产品、模型或政策更新,所以重要性不高,但话题性够。
一句话点评
Moleskine《指环王》联名文具宣传图标了AI生成,但Instagram帖子8张图都没提,官网也没说哪些产品用了AI。
锐评
Moleskine 出了《指环王》主题文具,部分宣传图角落标了“由AI生成”,但4月15日的Instagram帖子8张图全无AI披露,官网也没说明哪些产品用了AI、有没有人工修改。问题不在画风——扁平色块风格本身可以出自人类之手——而是披露粒度太粗。正文没披露AI具体用在哪些环节、是否经过人工修改。这点先别太激动,Moleskine 过去也用过“传奇笔记本”这种模糊营销,这次可能只是延续套路。但如果是真的,品牌信任会打折,尤其对IP粉丝来说,买的是“中土世界”的诚意,不是AI草图。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H1·K1·R1
09:00
48d ago
最佳拍档· atomZH09:00 · 04·27
霍华德·马克斯聊投资中最蠢的事:当前市场位置、买卖依据、成长vs价值、何时卖出
橡树资本创始人霍华德·马克斯在视频里聊了四个话题:投资中最常见的错误、当前市场处于什么位置、买入股票的依据是什么、成长投资和价值投资怎么选、什么时候该卖出或持有、以及“复利机器”为什么稀缺。正文没披露具体日期、价格或论点细节,所以没法判断他到底说了什么判断。如果你关心的是他对当前市场的具体看法,这点先别太激动——标题列了话题,但内容细节没给出来。
#Howard Marks#Oaktree Capital#Commentary
精选理由
排除,因为与AI几乎无关:这篇是投资访谈,只有标题级别的主题列表。HKR三项对AI从业者受众均不成立。
一句话点评
标题列了六个话题,但正文没给任何具体判断,别被标题骗了。
锐评
霍华德·马克斯聊投资常见错误、当前市场位置、买入依据、成长vs价值、卖出时机和复利机器稀缺性,六个话题全列在标题里。但正文是空的,没披露他到底说了什么判断、引了什么数据、举了什么例子。如果你关心的是他对当前市场是贵还是便宜、该买还是该卖,这点先别太激动——信息缺口太大,没法判断他有没有新观点。标题本身不构成信息,只能当话题预告看。
HKR 分解
hook knowledge resonance
打开信源
18
SCORE
H0·K0·R0
06:00
48d ago
● P1OpenAI 博客· rssEN06:00 · 04·27
Microsoft 与 OpenAI 修订合作协议进入新阶段
OpenAI 和微软宣布修改合作协议,核心变化是微软不再从 OpenAI 拿收入分成,但 OpenAI 仍需向微软支付分成直到 2030 年,且设有总额上限。微软继续是 OpenAI 的主要云伙伴,但 OpenAI 现在可以把产品部署到任何云上,不再绑定 Azure。微软对 OpenAI 模型和产品的授权延续到 2032 年,但不再是独家。正文没披露微...
#OpenAI#Microsoft#Partnership
精选理由
HKR-H/R通过,因为微软OpenAI改协议影响平台控制和算力政治。HKR-K不通过:正文没给股权、算力、收入分成或期限,所以分数卡在60-71。
一句话点评
微软和 OpenAI 把那个著名的“AGI 条款”给废了,OpenAI 不再被绑在 Azure 上,转头就跟亚马逊签了 500 亿的大单。
锐评
这次修订最核心的变化是:OpenAI 终于不用再被微软的云服务 Azure 独家绑定了。以前那份协议里有个著名的“AGI 条款”,大意是 OpenAI 一旦搞出通用人工智能,微软就不能再用它的技术,这被很多人看作微软给自己留的后路。现在这条款直接作废,取而代之的是更松散的排他性约定。 对 OpenAI 来说,松绑的代价是微软不再有法律上的优先权,但换来了实打实的商业自由。最直接的证据就是,协议一改,OpenAI 立刻扩大了跟亚马逊的合作,签了一笔 500 亿美元的云服务大单。这说明 OpenAI 对算力的胃口依然巨大,Azure 一家已经喂不饱了,它需要多家云厂商来分摊风险和成本。 不过,目前各家报道都没披露新协议里微软是否还保留优先购买权、利润分成比例有没有变,以及 OpenAI 为此付出了什么代价。这些关键财务细节的缺失,让我们没法判断这笔交易到底谁更划算。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K0·R1

更多

频道

后台