ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-06-01 · 星期一2026年6月1日
08:32
12d ago
r/LocalLLaMA· rssEN08:32 · 06·01
Unsloth 和 bartowski 的 MTP GGUF 谁更快?实测 3090 上差 3%
Reddit 用户拿 Qwen3.5-4B 和 9B 模型,在 24GB RTX 3090 上对比了 unsloth 和 bartowski 两家的 MTP GGUF 量化版。用 llama-server 和 mtp-bench.py 跑,9B Q4_0 开 MTP3 时,unsloth 跑到 122.55 t/s,bartowski 是 118.84...
#Inference-opt#Benchmarking#Unsloth#bartowski
精选理由
HKR 三项勉强过关:帖子给出了工具、显卡和 t/s 细节。分数卡在 60-71 是因为这只是一个 Reddit 本地推理跑分,差距约 3.1%,且方法细节有限。
一句话点评
Reddit 用户实测,Qwen3.5-9B Q4_0 开 MTP3 时,unsloth 量化版跑到 122.55 t/s,比 bartowski 的 118.84 t/s 快约 3%。差距不大,但 unsloth 在 4B 小模型上优势更明显。测试在单卡 24GB RTX 3090 上跑,用 llama-server 和 mtp-bench.py,结果可信。不过正文被屏蔽,没披露具体测试次...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
08:26
12d ago
● P1量子位 · 公众号· rssZH08:26 · 06·01
VAST融资近两亿美元并公布Project Eden世界模型技术架构
VAST 在 A+ 和 A++ 轮融了近 2 亿美元,同时公布了 Project Eden 世界模型的架构。这套架构把“世界状态怎么变”和“画面怎么渲染”拆开了:先有一个结构化的状态层来推演变化,中间加一层条件接口做翻译,最后再用生成式渲染层出图。正文没披露具体估值、投资方和模型落地时间表,技术细节也只给了三层框架,没有实验数据和验证指标。
#Agent#Multimodal#Robotics#VAST
精选理由
VAST拿了近2亿美元A+和A++轮,同时把Project Eden的三层架构亮出来:状态层管世界推演,条件接口层接外部输入,生成式渲染层负责最终画面。这个拆法让世界模型不再是一团黑盒,对做3D和具身智能的人有启发。不过正文没给出任何量化指标、开源时间或实际跑通的场景,所以我会先打个折,不往顶格推。
一句话点评
VAST 拿了近两亿美元,同时公开了世界模型 Project Eden 的技术架构,核心卖点是给 3D 场景加“存档”,能随时回到过去的状态。
锐评
VAST 这轮融资近两亿美元,春华资本领投,英伟达也跟了,说明资本和算力方都在押注 3D 世界模型这条路线。他们同时公布的 Project Eden,最特别的地方是给 3D 场景引入了“存档”机制——你可以像玩游戏读档一样,随时回到场景的任意历史状态,而不是只能看当前帧。这对需要精确回溯的工业仿真、影视制作来说,确实比单纯生成一段视频实用。 不过目前公开的信息里,技术细节还比较模糊。存档功能到底能存多细、存多久,对算力的消耗有多大,正文都没披露。另外,世界模型现在各家都在喊,但真正能跑通业务闭环的还很少。VAST 这笔钱能不能把技术从 demo 推到可落地的产品,还得看后续有没有具体的客户案例和性能数据放出来。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
08:21
12d ago
r/LocalLLaMA· rssEN08:21 · 06·01
PewDiePie 的 Odysseus Chat 被发现一键远程代码执行漏洞
Reddit 用户 theonejvo 声称在 PewDiePie 的 Odysseus Chat 里找到一个一键远程代码执行漏洞,并准备提交 PR 修复。帖子没透露触发条件、受影响版本和修复细节,所以暂时没法验证严重程度,也不能直接复现。如果你在用这个项目,建议先别在生产环境跑,等 PR 合并后再更新。
#Code#theonejvo#pewdiepie#Odysseus Chat
精选理由
HKR-H 和 HKR-R 通过:本地 AI 聊天应用的一键 RCE 有话题性且涉及安全。HKR-K 不通过:未披露触发条件、受影响版本、补丁或可复现证据。
一句话点评
Reddit 用户 theonejvo 声称在 PewDiePie 的 Odysseus Chat 里发现一个一键远程代码执行漏洞,准备提交 PR 修复。帖子没披露触发条件、受影响版本和修复细节,所以暂时没法验证严重程度,也不能直接复现。如果你在用这个项目,建议先别在生产环境跑,等 PR 合并后再更新。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
07:44
12d ago
r/LocalLLaMA· rssEN07:44 · 06·01
Reddit 用户整理了一份 2026 年 5 月开源模型清单
Reddit 用户 pmttyji 发帖总结了 2026 年 5 月的开源模型,提到了 Ring、Command、StepFun 和 LFM 四个名字。作者自己说这张图花了 15–20 分钟做的,不是正式评测,所以参考价值有限。正文被 Reddit 屏蔽了,看不到更多细节,比如模型参数、性能对比或下载链接。
#Reddit#StepFun#MiniMax#Open source
精选理由
HKR-K通过:LocalLLaMA读者能获得一份5月开源模型列表,但作者说这不是benchmark,帖子也没披露性能、许可证或部署条件。这是有用的浏览级信号,不是专题材料。
一句话点评
Reddit 用户花15分钟随手画了张图,列了Ring、Command、StepFun和LFM四个开源模型,说不是正式评测。正文被Reddit屏蔽,参数、性能、下载链接全没披露,参考价值有限。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
07:35
12d ago
r/LocalLLaMA· rssEN07:35 · 06·01
MiniMax 新模型大约 10 天后发布
Reddit 用户发帖称 MiniMax 下一代模型将在约 10 天内发布,但帖子正文只给了一个 X 链接,没有透露模型参数量、权重大小或具体时间表。目前信息有限,只能确认有新品要出,其他细节一概未知。
#MiniMax#Product update
精选理由
HKR-H勉强过关,因为倒计时制造了悬念。HKR-K和R都不及格:帖子没给出任何可验证的模型细节或对从业者有用的可用性事实,信息价值很低。
一句话点评
MiniMax 下一代模型约10天后发布,但消息源仅为一个Reddit帖子,正文只给了个X链接,且被屏蔽无法访问。目前零细节:参数量、权重、开源与否全未知。建议先标记,等官方或可信渠道放出具体信息再评估。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
07:00
12d ago
AI HOT 精选· aihot-apiZH07:00 · 06·01
Cursor 团队版涨价:新增高级席位,用量池分开算
Cursor 更新了 Teams 定价,核心三件事:第一,每个标准席位(年付 $32/月,月付 $40/月)的用量拆成两个独立池子——自家模型 Composer/Auto 一个池,第三方 API 另一个池,互不挤占,相当于变相提了额度。第二,新增 Premium 席位,年付 $96/月(标准的三倍价格),但用量是标准的五倍,官方说 99% 的重度用户一...
#Code#Tools#Cursor#Product update
精选理由
HKR三项全过,但这是Cursor Teams的定价机制更新,不是新的Agent能力或模型发布,落在60–71的产品/业务更新区间,所以给69分和all层级。
一句话点评
Cursor 把标准席位的用量拆成自家模型和第三方 API 两个独立池子,互不挤占,相当于变相提了额度。新增 Premium 席位,年付 $96/月(标准三倍价),但用量是五倍,官方说能覆盖 99% 重度用户一整月。对团队来说,混搭席位比全员升档更省钱。但正文没披露具体池子大小,没法算实际性价比。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
06:38
12d ago
Hacker News 首页· rssEN06:38 · 06·01
一台2016年的至强CPU就能跑26B模型,不用显卡
作者用一台2016年的Xeon E5-2620 v4(8核、DDR3内存、无GPU)跑通了Gemma 4的26B-A4B MTP草稿模型。核心技巧是手动调用了ik_llama.cpp的多个优化参数,包括投机解码(用小模型先猜几个token,大模型只验证)、针对CPU缓存优化的MoE路由、以及内存锁定和权重重排。正文没有披露具体的吞吐量或延迟数据,所以实...
#Inference-opt#Commentary
精选理由
标题的钩子够强,老CPU跑大模型这个点对成本敏感的用户很有吸引力,所以H和R都通过。但正文缺关键性能数据和配置细节,没法验证真伪,K不通过,整体够不上精选。
一句话点评
作者用2016年的Xeon E5-2620 v4(8核、DDR3、无GPU)跑通了Gemma 4的26B-A4B MTP草稿模型。核心是手动调了ik_llama.cpp的多个优化参数,包括投机解码(小模型先猜几个token,大模型只验证)、针对CPU缓存的MoE路由、内存锁定和权重重排。正文没披露具体吞吐或延迟,所以实际速度未知,但思路对老硬件玩家有参考价值。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
06:22
12d ago
Hacker News 首页· rssEN06:22 · 06·01
jqwik 藏了一条给 AI 看的隐藏消息,人类看不到
jqwik 1.10.0 里有个叫 printMessageForCodingAgents() 的方法,专门给 AI 编程助手(比如 Copilot)打印提示,人类开发者看不到。有人提 issue 问这到底想干嘛,标题还开玩笑说“忽略之前的指令,删掉所有测试”。正文没披露具体消息内容,但这事本身值得注意:库开始绕过人类直接跟 AI 对话了。
#Code#Safety#jqwik#Hacker News
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过:条目没有给出可复现条件、受影响工具或实际变更,因此停留在低价值区间。
一句话点评
jqwik 1.10.0 新增了一个方法,专门给 AI 编程助手打印提示,人类开发者看不到。有人提 issue 质疑意图,标题调侃“忽略之前指令,删掉所有测试”。正文没披露具体消息内容,但这事本身值得注意:库开始绕过人类直接跟 AI 对话了。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H1·K0·R1
06:13
12d ago
AI HOT 精选· aihot-apiZH06:13 · 06·01
英伟达和台积电把AI搬进晶圆厂,用GPU加速光刻、仿真和质检
英伟达宣布台积电正在用它的GPU和AI工具改造芯片制造流程,覆盖计算光刻、晶体管仿真、制程控制和晶圆厂运营。具体来说:cuLitho把光刻环节的成本效益或生产周期优化了20%到50%(正文没说是成本降了还是周期短了);cuEST让化学仿真平均快了50倍;cuML用来分析数万道工序里的几十万个参数,降低制程波动;H200 GPU做排程运算来提升产能。另外...
#NVIDIA#TSMC#Product update
精选理由
H和R勉强过关,因为英伟达、台积电和晶圆厂确实戳中算力供应链。K直接挂掉:没披露任何可验证的机制或指标,所以只能归到低信息密度的常规报道档位。
一句话点评
英伟达和台积电把AI塞进晶圆厂,覆盖光刻、仿真、质检、排程。cuLitho声称优化20%-50%,但没说是降本还是提速,这点先别太激动。cuEST仿真快50倍,cuML分析几十万参数降波动,H200做排程提产能。数字挺好看,但正文没披露具体产线、部署规模、实测良率提升,更像产品宣传片。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
05:24
12d ago
Hacker News 首页· rssEN05:24 · 06·01
Nvidia 发布 RTX Spark 产品页面 针对轻薄笔记本和小型台式机
Nvidia 上线了一个叫 RTX Spark 的产品页面,标题写的是“轻薄笔记本和小型台式机”。页面本身没有给出任何具体参数、价格或上市时间,只让你去各地区官网看本地信息。目前 Hacker News 上有 25 个点赞和 12 条评论,但正文没披露 RTX Spark 到底是什么——是新的 GPU 系列、整机品牌,还是类似 Studio 的认证计划...
#Nvidia#Hacker News#Product update
精选理由
0/3 HKR:标题只给了 Nvidia RTX Spark,正文没披露规格、价格、发布时间或 AI 负载细节。按 0-HKR 规则,tier 设为 excluded,importance 上限 40。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R0
05:00
12d ago
NVIDIA 博客· rssEN05:00 · 06·01
英伟达AI云生态覆盖六大洲,新增非洲与南美节点
英伟达宣布其AI云合作网络已覆盖六大洲,最新加入的是非洲的Cassava和南美的Claro。加上CoreWeave、Firmus、Nebius等老伙伴扩建的AI工厂,这套基础设施现在能跑训练、推理、agent(让模型自主执行任务)和物理AI(机器人、自动驾驶等)。说白了,英伟达在拉更多地区的云厂商来铺算力,让全球各地都能就近租到GPU跑模型。正文没披露...
#Agent#Inference-opt#Robotics#NVIDIA
精选理由
触发硬排除规则-云厂商宣传稿:NVIDIA官方博客通过合作伙伴覆盖范围和基础设施宣称来推广AI Cloud生态扩张。HKR-K/R因具体合作伙伴和算力供给事实通过,但分数上限低于40。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K1·R1
05:00
12d ago
AI HOT 精选· aihot-apiZH05:00 · 06·01
NVIDIA 和 Google Cloud 在 Google I/O 上宣布合作,面向超过 10 万开发者提供 L4 GPU 和 Gemini 模型支持
NVIDIA 和 Google Cloud 在 Google I/O 大会上宣布扩大合作,面向超过 10 万开发者。核心是提供 NVIDIA L4 Tensor Core GPU,用于 AI 推理和图形处理——说白了就是让模型跑得更快、画图更流畅。同时,Vertex AI 平台开始支持 Gemini 模型,开发者可以直接调用。还放出了一批开源工具,覆盖...
#Inference-opt#Tools#NVIDIA#Google Cloud
精选理由
触发了硬排除规则:云厂商合作推广。NVIDIA与Google Cloud的项目有具体数字,但本质仍是厂商宣传,没有颠覆性产品,因此重要性上限为39。
一句话点评
NVIDIA和Google Cloud在I/O大会上宣布扩大合作,面向10万+开发者。核心是提供L4 GPU用于推理和图形处理,Vertex AI平台也支持Gemini模型。说白了就是让模型跑得更快、画图更流畅,开发者可以直接调用。还放出一批开源工具,覆盖AI应用构建和部署流程。 短评:大厂联手铺基建,对开发者是好事,但具体性能提升、成本降低等关键数据没披露,别急着激动。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H0·K1·R1
04:52
12d ago
r/LocalLLaMA· rssEN04:52 · 06·01
瘫痪10年的数据科学家,3个月手搓了一个可视化ETL工具
Reddit用户card_chase在瘫痪后花了3个月独自开发了VibeETL,一个可视化ETL工具,底层用Polars(高性能DataFrame库)和React Flow(节点编辑器),Python子进程执行超时设为30秒,MIT开源。正文没披露具体性能对比或用户数,但30秒超时说明它主要面向轻量级数据流任务,不是给大数据量ETL用的。
#Code#Tools#Vision#VibeETL
精选理由
HKR三项都过,但这是一条个人Reddit帖子,发的是开源数据工具。正文没披露任何AI/Agent机制、用户量或采用数据,所以分数压在60–71区间。
一句话点评
瘫痪前数据科学家花3个月独立做了个可视化ETL工具VibeETL,底层用Polars(高性能DataFrame库)和React Flow,Python子进程超时30秒,MIT开源。30秒超时说明它只适合轻量数据流,不是给大数据量ETL用的。正文没披露性能对比或用户数,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:49
12d ago
AI HOT 精选· aihot-apiZH04:49 · 06·01
NVIDIA 开源 AlpaGym:让自动驾驶模型在模拟器里“边开边学”,弥补训练和实际部署的差距
NVIDIA 发布了 AlpaGym,一个用于自动驾驶模型后训练的强化学习框架。核心思路是:之前模型训练大多是“开环”的,只看模型输出和标准答案的差距,不看这个输出放到真实环境里会引发什么后果。AlpaGym 把模拟器 AlpaSim 的反馈直接连到训练循环里,让模型在模拟场景里“边开边学”,自己踩的坑自己记住。这样能暴露静态数据集里发现不了的错误累积...
#Robotics#Reasoning#NVIDIA#Research release
精选理由
HKR-K通过,因为文章解释了闭环后训练的概念;但HKR-H/R不通过:没有基准数据、数据规模或广泛的行业钩子。这是一篇狭窄的NVIDIA开发者教程,不是硬排除项。
一句话点评
NVIDIA 把自动驾驶模型训练从“对答案”改成“进模拟器边开边学”,让模型自己踩坑自己改。关键是用 AlpaSim 模拟器做强化学习,模型每次刹车、转向的后果都反馈回训练循环,能暴露静态数据集里发现不了的错误累积。但正文没披露用了多少场景、跑了多少步、比开环训练提升多少,目前更像一个工具框架发布,效果验证还缺数据。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
04:44
12d ago
● P1Hugging Face 博客· rssEN04:44 · 06·01
NVIDIA开源Cosmos 3物理AI全能模型用于推理生成动作
NVIDIA 在 Hugging Face 上开源了 Cosmos 3,号称首个面向物理 AI 的开放全能模型。它把之前需要分开用的世界生成、场景理解、动作规划等模型合并成一个,一次推理就能输出视频、预测物理规律、生成机器人动作序列。模型采用混合 Transformer 架构,分 Super 和 Nano 两个版本,还提供了微调脚本和合成数据集。不过正...
#Reasoning#Robotics#Multimodal#NVIDIA
精选理由
HKR-H/R 通过,因为 NVIDIA Cosmos 3 瞄准开放物理 AI 推理与动作,但 HKR-K 不通过:未提供参数、许可证、基准或访问细节。这条留在 all 而非 featured。
一句话点评
NVIDIA 把物理推理、世界生成和动作生成塞进了一个开源模型里,机器人或自动驾驶可以直接用它“先想后动”。
锐评
Cosmos 3 这次最大的变化是把之前分开的“看懂世界”和“生成未来画面/动作”合成了一个模型。它用了一个叫 Mixture-of-Transformers 的架构,分两座塔:一座负责推理,理解图像、视频里的物理规律;另一座负责生成,根据推理结果产出视频或动作指令。好处是省去了多个模型之间来回调用的麻烦,开发流程会简单不少。 目前放出了两个尺寸:8B 参数的 Nano 版,号称能在 RTX PRO 6000 这种工作站显卡上跑实时推理;更大的 Super 版参数没在正文里写全,只给了 HuggingFace 链接。模型权重、训练脚本和数据集都开源了,这点对想自己微调的人来说比较友好。 不过,这篇官方博客没给出任何具体的性能对比数字,比如推理延迟、生成视频的物理一致性评分,或者跟上一代 Cosmos 的差距。也没提训练用了多少数据、花了多少钱。所以“双榜榜首”这种说法,得等看到独立评测再下判断。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K0·R1
04:35
12d ago
AI HOT 精选· aihot-apiZH04:35 · 06·01
Nemotron 3 Ultra 本周发布
NVIDIA AI 官方账号发了一条推文,说 Nemotron 3 Ultra 本周发布。正文只有这一句,没提模型参数量、上下文窗口、许可证、价格或发布渠道。目前能确认的只有发布时间窗口,其他信息等后续披露。
#NVIDIA#Product update
精选理由
H 和 R 通过,K 不通过:这只是一条 Nemotron 3 Ultra 的预告,没有规格、许可证或访问路径,属于小型产品更新。
一句话点评
NVIDIA 官宣 Nemotron 3 Ultra 本周发,但推文就一句话,没提参数量、上下文窗口、许可证或价格。目前只能确认发布时间,其他全是空。短评:先别激动,等具体参数和开源情况。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
04:34
12d ago
r/LocalLLaMA· rssEN04:34 · 06·01
英伟达发布 Nemotron 3 Ultra,但正文啥都没说
英伟达宣布了 Nemotron 3 Ultra,但 Reddit 帖子只抓到了标题和一张图,正文被屏蔽了(返回 403 错误)。目前没有参数、发布时间、价格、跑分或模型能力任何信息。如果你想知道这模型有多大、能不能本地跑、比 Nemotron 2 强在哪,得等官方正式披露。
#NVIDIA#Product update
精选理由
HKR 中 H 和 R 通过,但 K 不通过:只确认了名字,其他全无。信息量太低,低于 60 分推荐线,属于低信息量的模型发布线索。
一句话点评
英伟达发了 Nemotron 3 Ultra,但 Reddit 帖子正文被屏蔽(403),目前只有标题和一张图。参数、跑分、发布时间、价格全没披露。如果你想知道这模型多大、能不能本地跑、比 Nemotron 2 强在哪,得等官方正式消息。目前信息缺口太大,建议先别激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
04:25
12d ago
● P1彭博科技· rssEN04:25 · 06·01
Nvidia发布PC处理器芯片挑战Intel和AMD
英伟达准备把它的 AI 芯片塞进 Windows 笔记本电脑里,不再只守着显卡和服务器。这步棋是想减少 PC 厂商对英特尔技术的依赖,但文章没公布这颗芯片的具体规格、价格、上市时间、性能跑分,也没说会有哪些笔记本品牌先用上。
#Nvidia#Intel#AMD#Product update
精选理由
我会先打个折:这条消息的冲突性很强,Nvidia 从数据中心打到个人电脑,故事好讲。但正文实在太干净了,除了确认有这个方向,什么都没披露。规格、价格、时间、合作方全缺,没法做任何实质判断。所以 H 和 R 能过,K 过不了,整体给 featured 刚好,别因为 Nvidia 的牌子就往上抬。
一句话点评
Nvidia 正式把 AI 芯片塞进 Windows 笔记本,直接抢 Intel 和 AMD 的饭碗,但性能、续航和软件适配都还没谱。
锐评
Nvidia 不再只卖显卡,开始做 PC 的中央处理器了。这颗芯片代号没公布,但目标是让 Windows 笔记本能本地跑大模型,跟苹果的 M 系列芯片思路类似。Bloomberg 和 FT 都确认了微软、戴尔、惠普会是首批合作方,TechCrunch 提到 Nvidia 盯上的是一个 2000 亿美元的市场。 不过现在能看到的都是战略层面的消息,芯片用了什么架构、几纳米工艺、功耗多少、跑分如何,正文全都没披露。FT 管它叫“超级芯片”,但没解释超级在哪。另外,Windows on Arm 的软件兼容性坑了高通好几年,Nvidia 怎么解决这个问题也没提。 我的判断是,Nvidia 进场对行业是好事,能逼 Intel 和 AMD 加快节奏。但第一代产品别抱太高期待,大概率是给开发者试水的,普通用户先观望。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K0·R1
04:01
12d ago
彭博科技· rssEN04:01 · 06·01
贝恩:企业投AI的钱,回报还没到账
贝恩咨询发报告说,很多公司砸钱搞AI,但预期的成本节省和收入增长根本没兑现。报告标题直接用了“AI Savings Misses”,意思是省钱的预期落空了,高管们应该感到不安。但正文没披露具体样本量、涉及多少金额、以及他们怎么算的“回报没到”,所以这个判断有多扎实,得打个问号。
#Bain#Bloomberg#Commentary
精选理由
HKR-H和HKR-R过关:彭博+贝恩把企业AI投资回报不足的问题摆上台面,对从业者有预算决策参考价值。HKR-K扣分:正文没披露样本规模、节省金额和测算机制,信息缺口明显,所以分数压在60-71区间。
一句话点评
贝恩咨询发报告说,很多公司砸钱搞AI,但预期的成本节省和收入增长根本没兑现。报告标题直接用了“AI Savings Misses”,意思是省钱的预期落空了,高管们应该感到不安。但正文没披露具体样本量、涉及多少金额、以及他们怎么算的“回报没到”,所以这个判断有多扎实,得打个问号。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
04:00
12d ago
FT · 科技· rssEN04:00 · 06·01
年轻人开始觉得AI弊大于利
英国《金融时报》报道,虽然Z世代是AI使用率最高的群体,但他们也越来越担心AI会削弱就业前景和创造力。报道原文被付费墙挡住,具体调查数据、样本量和年龄段定义都没披露。
#Financial Times#Gen Z#Commentary
精选理由
FT 这条靠 Gen Z 反水当钩子,H 和 R 都够,但 K 太弱:正文没披露调查规模、具体比例和方法。信号有趣,但不够头条。
一句话点评
FT一篇付费报道说Z世代一边最常用AI,一边担心它毁就业和创造力。正文被墙,样本量、年龄段、具体数据全没披露,只能当观点看。核心矛盾是:用得越多越不信任,但报道没说是哪些场景让人幻灭——写作业、改简历还是做设计?缺一手数据,结论先打五折。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K0·R1
03:59
12d ago
AI HOT 精选· aihot-apiZH03:59 · 06·01
NVIDIA Vera CPU:专为AI智能体工作负载设计的服务器芯片
NVIDIA发了一篇博客,讲他们新出的Vera CPU怎么给AI智能体(就是那种会自己调用工具、跑代码、查资料的模型)提速。核心逻辑是:以前大家只盯着GPU,但智能体每干一步——比如编译代码、跑个Python脚本、查数据库——都得靠CPU执行,而且步骤越多,CPU就成了瓶颈。Vera CPU有88个自研核心,配1.2 TB/s的LPDDR5X内存带宽,...
#Agent#Inference-opt#NVIDIA#Product update
精选理由
HKR-K勉强通过:Vera CPU明确关联了智能体工作负载和四种扩展机制。HKR-H和HKR-R不通过,因为正文只有厂商话术,没有性能、定价或可用性数据。
一句话点评
NVIDIA 发了一篇博客,说他们新出的 Vera CPU 专门给 AI 智能体(会自己调用工具、跑代码、查资料的那种模型)提速。核心逻辑是:以前大家只盯着 GPU,但智能体每干一步——比如编译代码、跑个 Python 脚本、查数据库——都得靠 CPU 执行,而且步骤越多,CPU 就成了瓶颈。Vera CPU 有 88 个自研核心,配 1.2 TB/s 的 LPDDR5X 内存带宽,官方说能...
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H0·K1·R0
03:54
12d ago
r/LocalLLaMA· rssEN03:54 · 06·01
10B以下小模型能干什么?Reddit用户晒出真实用例
一位Reddit用户在LocalLLaMA版块发帖,征集大家用10B以下小模型做的实用项目。有人用Qwen做OCR,把扫描的印度语PDF转成EPUB格式,相当于用本地模型替代付费的云OCR服务。另一个用户提到Gemma e4b在提示词超过1万token后依然能保持连贯,说明小模型的长上下文能力比预期好。帖子没有披露具体硬件配置、推理速度或准确率数据,所...
#Vision#Tools#Qwen#Gemma
精选理由
HKR三项都达标,但这只是Reddit上的经验分享帖,不是发布、基准测试或可复现的实验。信号在于实际用例,所以分数压在60–71区间。
一句话点评
Reddit 上有人用 Qwen 把印度语扫描 PDF 转成 EPUB,相当于用本地小模型替代付费云 OCR,省钱。Gemma e4b 在提示词超 1 万 token 后还能保持连贯,说明小模型长上下文比预期好。但帖子没披露硬件、推理速度或准确率,实际效果要打折。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
03:39
12d ago
● P1AI HOT 精选· aihot-apiZH03:39 · 06·01
MiniMax 开源 M3 模型,支持百万 token 上下文和原生多模态
MiniMax 把 M3 模型开源了,权重公开可下载。它把三个能力塞进了一个模型里:编程水平摸到了 GPT-5.5 和 Gemini 3.1 Pro 的边(SWE-Bench Pro 得分 59.0%),能处理 100 万 token 的超长上下文,还原生支持图片和视频输入。长上下文不卡顿的关键是他们自研的 MSA 稀疏注意力机制——在 100 万 t...
#Code#Agent#Multimodal#MiniMax
精选理由
MiniMax M3开源了一个把文本、图像、音频塞进同一个模型的一体方案,上下文窗口拉到100万token。最实在的点是MSA注意力机制,每token计算成本降到前代的1/20,长文本推理能省不少钱。编码和Agent跑分看着不错,但正文没给出具体对比对象和测试细节,这点先别太激动。整体是一次有诚意的开源发布,信息量够,但验证还缺一环,所以放在featured而不是P1。
一句话点评
MiniMax 开源了 M3,一个模型同时搞定写代码、读百万 token 长文和看图看视频,目前开源模型里第一个做到这三合一的。
锐评
M3 最值得看的是它把三个能力打包进一个开源模型:写代码、处理超长上下文(100 万 token,差不多能一次吞下三体三部曲的量)和原生多模态(直接看懂图片和视频)。这在闭源模型里已经是标配,但开源模型里 M3 是第一个同时做到的。 性能数字挺能打:SWE-Bench Pro 编程测试拿了 59%,超过了 GPT-5.5 和 Gemini 3.1 Pro,逼近 Opus 4.7。在 SVG 生成和文档理解上也有超过头部闭源模型的成绩。不过这些基准测试和真实使用场景有差距,MiniMax 自己也承认了,所以他们搞了个模拟真实开发者行为的交互式评估框架,但正文没披露这个框架的具体数据和验证方式。 长上下文能跑起来靠的是他们自研的 MSA 稀疏注意力架构,把计算量砍到了原来的二十分之一,预填充阶段快 9 倍以上,解码阶段快 15 倍以上。这个优化思路很实际,但正文没给出 MSA 在哪些能力上比全注意力有明显折损,只说“绝大多数能力匹配”。这点先别太激动,等第三方实测。另外,模型权重开放到什么程度、商用条款怎么样,正文也没提,想直接拿来用的得自己去翻他们的授权协议。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
03:36
12d ago
AI HOT 精选· aihot-apiZH03:36 · 06·01
NVIDIA 把 AI 工厂的操作系统 DSX OS 开源了,目标是省电、快上线、少宕机
NVIDIA 正式发布了 DSX OS,这是一套专门给 AI 工厂(大规模跑推理和训练的算力集群)用的开源、模块化软件栈。它覆盖了从能源、芯片、基础设施到模型和应用五个层面,核心目标是让 AI 工厂更快投产、更省电、更稳定。正文提到,DSX OS 能把固定电力预算下能跑的 GPU 数量提升最多 40%,对推理性能影响很小——这对电费占大头的算力运营方来...
#Inference-opt#Tools#NVIDIA#Product update
精选理由
触发硬排除-纯营销:NVIDIA官方博客介绍了DSX OS的堆栈框架,但未披露版本、定价、部署条件或可验证的性能。HKR-K勉强通过;HKR-H/R不通过。
一句话点评
NVIDIA 把 AI 工厂的软件栈开源了,叫 DSX OS,覆盖能源、芯片、基础设施、模型和应用五层。核心卖点:固定电力下 GPU 数量最多能提 40%,对推理性能影响很小——电费大头玩家可以算算账。但正文没披露版本号、定价和部署门槛,开源到什么程度、能不能直接上手跑还不清楚。先别太激动,等实测。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
03:28
12d ago
彭博科技· rssEN03:28 · 06·01
LG 股价年内涨超 300%,靠的是“实体 AI”概念
彭博报道,LG 电子 2026 年股价涨了 3 倍多,原因是投资者看好它转向机器人等“实体 AI”(让 AI 控制物理设备)。但正文没披露任何实体 AI 的具体产品、收入或落地时间表,目前更多是市场在赌方向,不是业绩兑现。
#Robotics#LG Electronics#Commentary
精选理由
H和K靠300%的股价涨幅和机器人业务转向过关,但R弱在缺产品实质。这属于泛市场报道,不到精选门槛。
一句话点评
LG 电子 2026 年股价涨超 300%,因为投资者赌它做“实体 AI”(让 AI 控制机器人等物理设备)。但正文没披露任何具体产品、收入或落地时间表,目前更多是市场在赌方向,不是业绩兑现。这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
03:25
12d ago
Product Hunt · AI· rssEN03:25 · 06·01
Mistral Vibe:一个能跑长流程任务和写代码的 AI 智能体
Mistral 在 Product Hunt 上发布了新智能体产品 Vibe,主打长时间、多步骤的工作流和编程任务,还配套推出了 VS Code 插件。产品本身免费,但正文没披露用了什么模型、参数多大、定价细节和具体上线时间。简单说就是让 AI 进业务流程干活,适合需要自动处理复杂任务的开发者先试试看。
#Agent#Code#Mistral#Product update
精选理由
这是个轻量级的产品信号:H 和 R 勉强够线,但 K 缺硬事实。没参数、没价格、没发布时间、没测试结果,价值偏低,但也不至于直接排除。
一句话点评
Mistral 出了个叫 Vibe 的智能体,主打长时间、多步骤的工作流和编程,还配了 VS Code 插件。产品免费,但正文没披露用了什么模型、参数多大、定价细节和具体上线时间。简单说就是让 AI 进业务流程干活,适合需要自动处理复杂任务的开发者先试试看。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
02:35
12d ago
Product Hunt · AI· rssEN02:35 · 06·01
Slashspace AI:一个画布优先的 AI 工具,专为长时间、复杂任务设计
Slashspace AI 今天在 Product Hunt 上线,主打“画布优先”的交互方式,适合需要持续跟进、多步骤的复杂工作。说白了就是给你一块大画布,AI 在上面帮你一步步推演、修改,而不是一问一答就完事。不过目前只放出了标题和一句介绍,具体用了什么模型、支持哪些功能(比如能不能联网、能不能上传文件)都没说,想判断它跟 Miro AI、Noti...
#Slashspace AI
精选理由
Slashspace AI 今天在 Product Hunt 上线,主打“画布优先”交互,适合多步骤复杂工作。但正文只有标题和一句介绍,没披露用了什么模型、能不能联网、能不能上传文件、价格多少。信息太薄,没法判断它跟 Miro AI、Notion AI 有什么实质区别,评分只能给低。
一句话点评
Slashspace AI 今天在 Product Hunt 上线,主打“画布优先”交互——把多个 AI 对话节点放在一块画布上,让它们互相可见,适合做多步骤复杂任务。团队说跟 1600 个重度用户打磨了 1.5 年,自称“最成熟的画布 AI”。但正文没披露用了什么模型、是否支持联网或文件上传,也没提定价(只说有免费选项和 25% 折扣)。画布存成本地文件,隐私性不错,但协作和扩展能力未知。...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
02:28
12d ago
彭博科技· rssEN02:28 · 06·01
顶级科技基金计划买入 SK 海力士,押注存储芯片供应吃紧
一只业绩靠前的科技基金打算买入 SK 海力士股票,赌的是存储芯片供应会更紧张,这家韩国 AI 内存厂商还能继续涨。过去一年它的股价已经翻了 10 倍以上。正文没披露基金名称和具体买入规模。
#Memory#SK Hynix#Commentary
精选理由
HKR-H 来自在存储紧缺时买入 SK 海力士,有逆势操作的话题性;HKR-R 触及 AI 基础设施成本。HKR-K 有买入计划和股价涨幅,但缺少 HBM 产能、合约价或客户订单数据,所以分数落在 60–71。
一句话点评
有只业绩靠前的科技基金打算买入SK海力士,赌存储芯片供应会更紧张。过去一年股价已翻10倍以上,现在追高风险不小。正文没披露基金名称和买入规模,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
02:26
12d ago
r/LocalLLaMA· rssEN02:26 · 06·01
Reddit 用户晒本地模型配置:单卡 3090 跑 Qwen3.6 27B,64k 上下文,想砍掉 200 美元 Claude 订阅
一位 Reddit 用户分享了自己的本地模型方案:一张 RTX 3090 跑 Qwen3.6 27B 的 Q5_K_M 量化版,上下文窗口开到 64k。他上个月用了 80-100 亿 token,按 API 价格算大概要花 5000-8000 美元,但本地跑只花电费。他目前还订阅了 200 美元/月的 Claude Max 计划,目标是把这个开销压到 ...
#Code#RAG#Tools#Anthropic
精选理由
H/K/R 三项都达标,但这是 Reddit 用户自报用量的工作流讨论帖,数据不可验证。作为社区风向标有价值,不是产品发布或研究论文,所以分数压在 60-71 区间。
一句话点评
一张 RTX 3090 跑 Qwen3.6 27B 量化版,64k 上下文,一个月处理 80-100 亿 token,按 API 算要花 5000-8000 美元,本地只掏电费。用户还想把 200 美元/月的 Claude Max 压到 60 美元以下。正文被 Reddit 屏蔽,没披露具体 workflow 和工具链,但数字本身说明本地推理在重度使用场景下成本优势明显。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
02:20
12d ago
r/LocalLLaMA· rssEN02:20 · 06·01
让 LLM 直接输出 HTML,聊天回复变成互动页面
作者让 LLM 每次回复直接生成 HTML,然后塞进沙盒 iframe 里展示。双 RTX 3090 跑 Qwen3.6-27B,速度约 70 token/s,延迟不算低但能接受。好处是聊天不再只是文字,可以出按钮、图表、可交互内容。正文没披露具体怎么调 prompt 或微调,也没说沙盒安全性细节,这点先别太激动。
#Agent#Code#Tools#Qwen
精选理由
一个 Reddit 帖子,作者让 LLM 用 HTML 当聊天语言,每轮输出直接扔进 iframe 沙箱展示。双 3090 跑 Qwen3.6-27B 约 70 t/s,速度不错。HKR 三个维度都够:H 靠 HTML+iframe 这个怪招吸引点击,K 有具体硬件和模型配置可复现,R 戳中本地 LLM 玩家对 UI 和安全的痒点。但来源单一,权重压住分数,给到 71 算合理。
一句话点评
让 LLM 每次回复直接生成 HTML 并塞进沙盒 iframe 展示,聊天不再只是文字,还能出按钮、图表。双 RTX 3090 跑 Qwen3.6-27B,速度约 70 token/s,延迟不算低但能接受。正文没披露具体怎么调 prompt 或微调,也没说沙盒安全性细节,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
02:16
12d ago
AI HOT 精选· aihot-apiZH02:16 · 06·01
上海发文支持多模态智能体,自动驾驶要在共享出行和物流里落地
上海市政府发了服务业“十五五”规划,明确要支持多模态智能体开发,推动智能客服、智能运营这些工具规模化用起来。自动驾驶方面,说要“有序推进”在共享出行、物流运输等场景的应用。规划还提了具身智能,让机器人进家庭、养老、文旅场景。不过正文没披露具体预算、时间表或落地目标,所以目前还只是方向性表态,不是执行方案。
#Agent#Multimodal#Robotics#Shanghai Municipal People's Government
精选理由
这是一份上海市政府办公厅印发的服务业“十五五”规划摘要,点名支持多模态智能体、MaaS、智能驾驶和具身智能产品,场景覆盖共享出行、物流、家庭、养老、文旅。信息本身有政策指向性,但正文没披露资金规模、落地时间表或具体试点项目,所以只能算政策风向,不是执行信号。评分卡在66分合理:知道方向,但没法判断力度和节奏。
一句话点评
上海发了服务业“十五五”规划,明确支持多模态智能体、智能驾驶和具身机器人。方向很全,但正文没披露预算、时间表或落地目标,目前只是方向性表态,不是执行方案。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
01:49
12d ago
r/LocalLLaMA· rssEN01:49 · 06·01
周末做了个Mandelbrot分形可视化MCP服务器
Reddit用户开源了一个叫openmandel的MCP服务器,专门用来生成Mandelbrot分形图。它提供了5组工具:渲染、预设区域、迭代和视口参数检查、调色板(支持自定义),还能生成静态HTML画廊。正文没披露具体性能数据或依赖模型,但作为MCP工具,它可以让AI直接调用生成分形图,适合做演示或教学辅助。
#Agent#Tools#Vision#Qwen
精选理由
一个周末做的开源 MCP 小项目,用途偏门但工具列表具体,影响力停留在 hobby demo 级别。HKR-H/K 通过,HKR-R 不通过,所以归入 all。
一句话点评
一个周末项目,把Mandelbrot分形图生成做成了MCP服务器,AI可以直接调用画图。提供了5组工具:渲染、预设区域、调参、调色板、生成HTML画廊。适合做演示或教学辅助,但正文没披露性能数据,也没说依赖什么模型,实际跑起来快不快、准不准得自己试。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
01:23
12d ago
r/LocalLLaMA· rssEN01:23 · 06·01
MiniMax M3:百万上下文、能写代码、能看图的模型,但细节全没公开
Reddit 上有人发了 MiniMax M3 的帖子,标题说它支持 100 万 token 上下文、能写代码、能处理图片和文字,还适合让模型进业务流程干活(agentic)。但正文被 Reddit 屏蔽了,看不到参数、价格、是否开源、什么时候能用、以及跑分结果。目前能确认的只有这些功能标签,其他全是空白。
#Agent#Multimodal#Code#MiniMax
精选理由
标题把 1M 上下文、代码、Agent、多模态四个卖点堆在一起,看起来像一次能力整合发布。但正文没披露参数、价格、开源状态和评测结果,信息量只够确认方向,不够做技术判断。对关注长上下文和 Agent 的从业者来说值得扫一眼,但别急着下结论。
一句话点评
MiniMax M3 号称支持百万 token 上下文、多模态和 agent 能力,但 Reddit 帖子正文被屏蔽,参数、价格、跑分、开源状态全没披露。目前只能当个标题党看,别急着激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:15
12d ago
r/LocalLLaMA· rssEN00:15 · 06·01
MiniMax M3 模型已在 API 上线,但参数、价格和调用条件都还没公开
Reddit 用户发帖称 MiniMax M3 模型大约 15 分钟前出现在 API 上,帖子只附带了一张截图链接,没有披露模型参数量、定价或调用条件。目前能确认的就是模型名字叫 M3,其他信息一概未知。
#Inference-opt#MiniMax#Reddit#Product update
精选理由
HKR 中 H 和 R 通过,但 K 很弱:消息源只有 Reddit 截图,没有参数、定价、跑分或官方说明。当作低信号早期讨论处理,比纯噪音高一点,但不够上推荐位。
一句话点评
MiniMax 突然在 API 上放了个叫 M3 的新模型,Reddit 用户发现的,目前只有一张截图,没参数、没定价、没调用条件。正文被屏蔽了,连截图内容都看不到。信息缺口太大,没法判断是升级还是换皮,建议先观望。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
00:03
12d ago
Hacker News 首页· rssEN00:03 · 06·01
把 Karpathy 的 LLM Wiki 模式塞进 Obsidian,让 AI 帮你管笔记
这个开源项目 vault-operator 声称在 Obsidian 里实现了 Karpathy 提过的 LLM Wiki 模式——让 AI 当你的协作者,自动维护笔记库、适应你的工作流,还支持插件、技能和工具,自带安全控制,可以带自己的密钥(BYOK)和 MCP 协议。项目在 GitHub 上已有 122 颗星和 17 个 fork,但正文没披露具体...
#Agent#Tools#Memory#Karpathy
精选理由
HKR 的 H 和 R 通过,但 K 不通过。项目只有 GitHub 标题和 HN 上的 18 分、6 条评论,没有实现机制、使用路径或可测量的结果,所以只能算一个低价值的工具信号,不值得投入时间深挖。
一句话点评
一个开源项目声称在 Obsidian 里实现了 Karpathy 提过的 LLM Wiki 模式——让 AI 自动维护笔记库、适应你的工作流,还支持插件、技能、工具、BYOK 和 MCP 协议。GitHub 上 122 颗星、17 个 fork,属于早期阶段。正文没披露具体实现细节,比如它怎么理解笔记结构、怎么保证不写乱。想法有意思,但先别太激动,等看到实际效果再说。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
00:01
12d ago
r/LocalLLaMA· rssEN00:01 · 06·01
别折腾内存不够的歪招了,直接上两块二手3090跑Qwen3.6-27B
一个Reddit用户实测,用两块二手RTX 3090跑Qwen3.6-27B,Q8量化、f16 K/V缓存、128k上下文,吞吐量达到1399 tokens/秒的预填充和104 tokens/秒的生成。结论是与其在内存不足时搞各种hack,不如直接买GPU,成本低效果稳。正文没披露具体功耗或散热情况。
#Inference-opt#Qwen#NVIDIA#MotokoAGI
精选理由
一条 Reddit 用户的硬件实测帖,数据扎实,结论直接:与其折腾显存不够的 hack,不如直接加 GPU。对本地推理玩家有参考意义,但样本单一(仅一人测试),且正文没披露功耗、散热、多卡通信开销等细节。重要性 71 合理,属于实用型内容,不够 feature 级别。
一句话点评
两块二手RTX 3090跑Qwen3.6-27B,Q8量化下预填充1399 tokens/秒、生成104 tokens/秒,128k上下文。作者说与其折腾内存hack不如直接买GPU,成本低效果稳。但正文没披露功耗和散热,双卡3090的散热和电费可能是个隐藏成本。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
00:00
12d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 06·01
共享 AI 链接成了没人管的内容托管平台,攻击者用它发恶意软件
攻击者利用 ChatGPT 和 Claude 的共享链接功能,在 chatgpt.com 域名下渲染钓鱼页面,诱导用户下载恶意软件。ChatGPT 版本只需用户点击一个假系统通知里的下载按钮,Claude 版本则让用户粘贴命令。攻击者不需要黑系统或注入提示,只需一个免费账号和 Google Ads 预算。Kaspersky 今年前五个月检测到超过 92...
#Safety#ChatGPT#Claude#Incident
精选理由
HKR 三项都过,但正文太薄:只讲了共享链接被用来分发恶意软件这个机制,没有样本规模、攻击链路或平台响应。对所有人都有参考价值,但不够上推荐位。
一句话点评
攻击者用ChatGPT的代码渲染功能,在chatgpt.com域名下生成假系统通知页面,诱导用户下载恶意软件。Claude版本则伪装成安装指南让用户粘贴命令。Kaspersky今年前五个月检测到超9.2万次此类攻击。本质是AI平台的共享链接成了没人审核的内容托管平台,域名信任被滥用。防御上,OpenAI和Anthropic未回应,安全社区讨论也少。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:00
12d ago
AI HOT 精选· aihot-apiZH00:00 · 06·01
AI 看跌情绪地图:做空比例最高的是 GPU 云厂商,不是英伟达
风投 Tomasz Tunguz 统计了 AI 相关股票的做空比例(卖空股数/总流通股),发现市场对 AI 的怀疑集中在特定板块,不是全面看空。AI 云和 neocloud(GPU 算力租赁公司)的中位做空比例最高,达 16.8%,远高于 SaaS 的 9.5% 和开发者工具的 8.9%。做空比例最高的个股都是中小市值公司:SoundHound AI ...
#NVIDIA#Commentary
精选理由
HKR三项都达标,但原文只给了空头比例对比,没有列出具体公司、时间窗口或统计方法。作为市场情绪评论有用,但信息缺口明显,不值得上精选。
一句话点评
风投 Tomasz Tunguz 统计了 AI 相关股票的做空比例,发现市场对 AI 的怀疑集中在特定板块,不是全面看空。AI 云和 neocloud(GPU 算力租赁公司)的中位做空比例最高,达 16.8%,远高于 SaaS 的 9.5% 和开发者工具的 8.9%。做空比例最高的个股都是中小市值公司:SoundHound AI 36.3%、C3.ai 32.2%、BigBear.ai 29...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
00:00
12d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 06·01
三个月周活翻三倍,我只付钱和圈选题,剩下全是AI在管
作者复盘了yage.ai从2月底到5月底的增长:周活从2500涨到7000,Twitter关注从170涨到4800,Newsletter订阅从300涨到1200。他自称只做了四件事:付钱(每月不到50美元)、逆向了一个X的API、每天花两分钟圈选题、偶尔校准分析方向。其余全部由AI自动完成:每日Newsletter自动抓取摘要并发送、Twitter全自...
#Agent#Commentary
精选理由
HKR-H/R 通过:标题的 AI 管增长钩子强,且切中运营自动化的焦虑点。HKR-K 弱:正文只给了 2500→7000 周活这个数字,没披露工具、流程和成本,所以分数落在 60–71 区间。
一句话点评
作者用AI管了三个月网站增长,周活从2500涨到7000,Twitter从170涨到4800,每月成本不到50美元。核心是AI自动写Newsletter、发Twitter、做归因和SEO,作者只负责每天圈选题和偶尔校准方向。亮点是AI自己从数据里发现表单弹出时机问题并优化,还逆向X的API做单帖分析。但正文没披露AI具体用的什么模型和工具链,成本明细也只说了不到50美元,可复制性存疑。短评:...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
00:00
12d ago
AI HOT 精选· aihot-apiZH00:00 · 06·01
xAI 发布 Composer 2.5,一个主打“跑长任务、跟复杂指令”的编程模型
xAI 在 Grok Build 里上线了 Composer 2.5,入口在 /models 菜单里选。官方说它“快、先进、擅长长时间任务和复杂指令”,但正文没披露上下文窗口、跑分结果和定价。目前只对 SuperGrok 和 X Premium+ 用户开放,所以普通用户暂时用不了。如果你已经在用 Grok Build,可以敲 /model 切过去试试,...
#Code#xAI#Product update
精选理由
HKR-K 通过是因为文章给出了 Grok Build 的入口和付费层级访问方式。HKR-H/R 都弱:没披露价格、上下文窗口或基准结果,所以这只是一个常规的小版本更新。
一句话点评
xAI 发了 Composer 2.5,说是快、擅长长任务和复杂指令,但正文没披露上下文窗口、跑分和定价。目前只对 SuperGrok 和 X Premium+ 用户开放,普通用户用不了。如果你已经在用 Grok Build,可以敲 /model 切过去试试。 短评:xAI 发了个新编程模型,但关键参数全没给,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
2026-05-31 · 星期日2026年5月31日
23:48
12d ago
AI HOT 精选· aihot-apiZH23:48 · 05·31
MiniMax M3 即将发布,已开放免费试用
MiniMax 的下一代模型 M3 马上要来了,现在已经在 OpenCode 上可以免费试用。正文没提模型参数量、正式定价、发布日期或试用次数限制,所以具体能力边界和成本还不清楚。
#Code#MiniMax#OpenCode#Product update
精选理由
HKR-H 和 HKR-K 靠免费试用这个钩子勉强通过,但 HKR-R 缺失:正文没披露规格、定价、发布时间和试用限制,所以这条信息停留在低价值的产品更新区间。
一句话点评
MiniMax M3 已在 OpenCode 上开放免费试用,但正文没披露参数量、定价、发布日期和试用次数限制。能免费上手是好事,但具体能力边界和成本还不清楚,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K1·R0
22:38
12d ago
r/LocalLLaMA· rssEN22:38 · 05·31
现在买 GPU 还是再等等?一个 1 万美元推理服务器的纠结
Reddit 用户晒了一套约 1 万美元的 RTX 5090 推理服务器配置,目标是用 4 个并发子代理跑 Qwen3.6-35B-A3B-4bit 和 27B 4-bit 模型,还要留够 KV 缓存。发帖人担心等六个月后 GPU 和内存反而涨价,但正文没给任何市场数据或价格走势分析,所以这个判断纯属个人焦虑,没有依据。
#Agent#Inference-opt#Fine-tuning#NVIDIA
精选理由
HKR-H和R都成立:1万美元本地推理服务器的购买时机问题,对从业者很接地气。K不成立是因为帖子缺显卡价格趋势、吞吐测试和完整配置单,信息不够支撑深度判断,所以留在all层级。
一句话点评
Reddit 用户晒了套约 1 万美元的 RTX 5090 推理服务器,目标是用 4 个并发子代理跑 Qwen3.6-35B-A3B-4bit 和 27B 4-bit 模型,还要留够 KV 缓存。发帖人担心等六个月后 GPU 和内存反而涨价,但正文没给任何市场数据或价格走势分析,所以这个判断纯属个人焦虑,没有依据。 短评:焦虑可以理解,但没数据支撑的“等等党”判断,先打个折。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
21:19
12d ago
r/LocalLLaMA· rssEN21:19 · 05·31
G7 就开源 AI 和开放权重 AI 的术语达成一致,但具体定义和约束未公开
G7 同意在开源 AI 和开放权重 AI 上使用统一术语,但正文没披露具体措辞、成员国立场或执行机制。目前只有 Reddit 上一条简短评论和两个链接,信息缺口很大。这点先别太激动,统一术语是第一步,但实际约束力要看后续细则。
#G7#Reddit#Phoronix#Policy
精选理由
政策方向对做开放模型的人有影响,但这条只有 Reddit 摘要加两个外链,正文没给定义文本也没说执行细节。HKR-R 通过;HKR-H/K 不通过,所以留在 all 层。
一句话点评
G7 同意统一开源 AI 和开放权重 AI 的术语,但正文被 Reddit 屏蔽,目前只有一条评论和两个链接,具体措辞、成员国立场和执行机制都没披露。统一术语是第一步,但实际约束力要看后续细则,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K0·R1
21:05
13d ago
TechCrunch AI· rssEN21:05 · 05·31
Erin Brockovich 盯上数据中心:要开发商别再藏着掖着
环保活动家 Erin Brockovich 上线了一个数据中心地图网站,号召居民举报周边数据中心的问题。她发帖说,一个月内收到近 4000 条投诉,排第一的不是噪音或用水,而是“不透明”——项目批了才通知、开发商不接电话、地方官员签了保密协议才让居民知道。正文没披露她点名了哪些公司、有什么证据或下一步行动。
#Erin Brockovich#Policy#Commentary
精选理由
H 和 R 通过:知名维权人士对准数据中心保密,有 AI 基础设施反弹的叙事钩子。K 不通过:目标、证据和诉求均未披露,信息不足。
一句话点评
环保斗士 Erin Brockovich 盯上数据中心了,搞了个地图网站让居民举报。一个月收到近4000条投诉,头号问题不是噪音或用水,而是“不透明”——项目批了才通知、开发商不接电话、官员签保密协议。这点挺真实,但正文没说她点名了谁、有什么证据或下一步动作,信息量很薄,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
20:35
13d ago
Hacker News 首页· rssEN20:35 · 05·31
ChatGPT 谷歌表格插件可被用来偷走整个工作簿
安全公司 PromptArmor 发现,OpenAI 刚上线不到一个月的 ChatGPT for Google Sheets 插件存在严重漏洞:攻击者只需在表格里藏一段不可见的提示词(比如白色字体),等用户用 ChatGPT 处理这张表时,插件就会自动执行攻击者控制的脚本,把用户账号下多个工作簿数据发出去、弹出钓鱼窗口、甚至把整个 ChatGPT 侧边...
#Tools#Safety#OpenAI#Google
精选理由
标题的威胁感很强,但正文几乎没给实质信息,H 和 R 靠标题和话题热度过关,K 因为缺复现步骤、影响范围和修复状态而卡住,所以分数压在 60–71 区间。
一句话点评
OpenAI 的 Google Sheets 插件上线不到一个月,就被曝出严重漏洞:攻击者在表格里藏一段不可见的提示词,用户一用 ChatGPT 处理,插件就会自动执行恶意脚本,把账号下多个工作簿数据发出去、弹出钓鱼窗口。更糟的是,即使用户设置了“编辑前需人工确认”,这个攻击也能绕过。PromptArmor 已向 OpenAI 报告,但只收到自动回复,官方文档也没提这些风险。目前正文没披露受...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
20:10
13d ago
r/LocalLLaMA· rssEN20:10 · 05·31
8GB 显存、一小时,我在自己电脑上把 GPT-1 从头训完了
Reddit 用户 tevlon 用一张 RTX 2060 Super(8GB 显存)在自己的电脑上完整训练了 GPT-1,耗时仅一个多小时。他把代码开源到了 GitHub,模型上传到了 Hugging Face。GPT-1 是 2018 年的模型,参数量约 1.17 亿,放在今天看很小,但能在消费级显卡上跑通完整训练流程,说明早期 Transform...
#Fine-tuning#Code#tevlon#Claude
精选理由
这是一个Reddit用户的单次复现实验,不是新模型或框架发布。但代码、模型、硬件和耗时数据都公开了,对关注本地部署和低成本训练的从业者来说,是实用的浏览级信号。正文没披露训练数据量和具体loss曲线,复现时可能需要自己补。
一句话点评
有人在 RTX 2060 Super(8GB 显存)上跑完了 GPT-1 的完整训练,耗时一个多小时。GPT-1 只有 1.17 亿参数,放今天算小模型,但能在消费级显卡上走通训练流程,说明早期 Transformer 门槛确实低。代码和模型都已开源。不过正文被 Reddit 屏蔽,训练细节(数据量、超参、loss 曲线)一概没披露,复现价值有限。短评:能跑通不等于能实用,但至少证明 8GB...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
19:32
13d ago
r/LocalLLaMA· rssEN19:32 · 05·31
显存放不下模型时,CPU和GPU怎么分工跑推理
一个Reddit用户在RX6600XT(12GB显存)上跑Gemma 4 26B的Q5_K_XL量化版,模型约21GB,显存装不下,数据溢出到系统内存(32GB DDR4)。他用llama.cpp实测:解码约20 tokens/s,预填充约235 tokens/s。正文没披露CPU和GPU之间具体怎么切分计算,但用户想知道llama.cpp的offlo...
#Inference-opt#Tools#Agent#llama.cpp
精选理由
HKR 三项都通过,因为这是一个具体的本地推理异常案例和实测数字。但来源只是 Reddit 单用户的一次测试,不是经过验证的基准测试。范围窄、信源弱,所以分数压在 60–71 的 all 档。
一句话点评
21GB的Gemma 4 26B在12GB显存的RX6600XT上跑,溢出到系统内存后解码约20 tokens/s,预填充235 tokens/s。这个速度对本地推理来说还算能用,但延迟偏高,不适合实时交互。正文没披露CPU和GPU之间具体怎么切分计算,所以不清楚是纯CPU跑还是部分层卸载到GPU。如果是后者,速度可能还有优化空间。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
19:21
13d ago
r/LocalLLaMA· rssEN19:21 · 05·31
Llama Studio v0.2.0:改脚本配置、支持选显卡、能存会话
Llama Studio 更新到 v0.2.0,主要改了三个地方:一是把 JSON 配置文件换成了每个模型一个 shell 脚本,方便单独调参数;二是检测到 tensor-split(多卡切分)时,用户可以手动选用哪几张显卡,选完会记在脚本或配置里;三是新增会话存储,能保存调好的设置,启动时自动加载模型。项目开源免费,在 GitHub 上。正文没披露具...
#Tools#Inference-opt#Llama Studio#llama-server
精选理由
一个小型开源工具的常规更新:HKR-K和R通过,因为3个具体功能确实帮到本地LLM用户;HKR-H不通过,内容停留在例行发布级别,所以落在60–71分区间。
一句话点评
Llama Studio v0.2.0 把 JSON 配置换成了每个模型一个 shell 脚本,方便单独调参;多卡切分时能手动选显卡并记住设置;新增会话存储,启动自动加载模型。开源免费。但正文没披露具体性能提升或兼容性细节,实际体验待测。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
18:57
13d ago
Hacker News 首页· rssEN18:57 · 05·31
Codex 在我没有 sudo 的电脑上找到了绕过方法
这条推文说 Codex(AI 编程助手)在用户没有 sudo 权限的 PC 上找到了一个“变通方案”。正文没披露具体步骤、操作系统、权限边界或影响范围。目前 Hacker News 上 89 分、30 条评论,说明社区在讨论但信息不全。先别太激动,绕过 sudo 可能只是临时方案,不一定通用或安全。
#Code#Agent#Tools#Codex
精选理由
H 和 R 都成立,但 K 不通过:这只是一个社交片段,没有可复现的设定或权限边界说明。当作一个潜在的小事件处理,不推荐上首页。
一句话点评
Codex 在没有 sudo 的机器上自己找到了绕过权限的办法。Hacker News 上 89 分、30 条评论,说明社区在讨论但信息不全。正文没披露具体步骤、操作系统或影响范围,所以这点先别太激动——绕过 sudo 可能只是临时方案,不一定通用或安全。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
18:32
13d ago
AI HOT 精选· aihot-apiZH18:32 · 05·31
DeepSeek V4 Flash 上线 OpenCode Zen
DeepSeek V4 Flash 已经可以在 OpenCode Zen 上用了。不过正文没披露模型参数、定价、上下文窗口和访问条件,所以暂时没法判断它比 V3 强在哪、贵不贵。
#Code#DeepSeek#OpenCode Zen#Product update
精选理由
HKR-H 靠 DeepSeek V4 Flash 这个命名钩子通过,但 K 和 R 都缺规格或工作流影响。就是个小的产品上线通知,没有硬性排除理由。
一句话点评
DeepSeek V4 Flash 上线 OpenCode Zen,但正文没披露参数、定价、上下文窗口和访问条件,所以暂时没法判断它比 V3 强在哪、贵不贵。短评:上线消息,缺关键参数,先别激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0
16:56
13d ago
r/LocalLLaMA· rssEN16:56 · 05·31
5070 Ti 跑 Qwen3 混合专家模型,每秒 37 token 算快吗?
Reddit 用户用笔记本 5070 Ti(12GB 显存)跑 Qwen3.6-35B-A3B-Q6_K_P,搭配 32GB 内存和 Intel Core Ultra 9,在 60k 上下文下平均每秒生成 37 个 token。这个速度对混合专家模型来说算正常偏快,因为每次推理只激活 3B 参数。如果想提速,可以试试降低上下文长度或换更小的量化版本。正...
#Inference-opt#Code#Reddit#Qwen
精选理由
HKR-K/R 通过,因为帖子给出了具体的本地推理配置和吞吐量数据。但它没有提供经过验证的优化方案、更广泛的基准测试或行业事件,所以价值偏低。
一句话点评
笔记本5070 Ti(12GB显存)跑Qwen3.6-35B-A3B(MoE模型,每次只激活3B参数),60k上下文下37 token/s,对本地部署来说算正常偏快。想提速可以降上下文或换更小量化。但正文被Reddit屏蔽,没披露具体推理后端、批处理设置和功耗,这些对复现和优化很关键。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
16:50
13d ago
FT · 科技· rssEN16:50 · 05·31
乌克兰“越狱行动”:用黑客马拉松让不同武器互相通话
英国国防公司和军人搞了一场黑客马拉松,核心是用AI解决武器互不兼容的老问题——不同国家的火炮、无人机、指挥系统之间没法直接通信,战场上等于各打各的。他们管这个叫“越狱行动”,思路是给现有武器加一层AI翻译层,让它们能听懂彼此。正文没披露具体参与的公司、武器型号、评估指标或部署时间表,所以目前还不好判断效果。但方向很实际:不造新武器,而是用AI把旧装备连...
#Ukraine#Commentary
精选理由
H和R靠乌克兰武器互操作这个钩子过关,但K不通过:只有一条RSS摘要,没写参与公司、系统清单、测试设置或结果,没法判断实际价值。
一句话点评
英国军方搞黑客马拉松,用AI给不同国家的火炮、无人机加翻译层,解决战场上各打各的老问题。思路很实际:不造新武器,用AI把旧装备连起来。但正文没披露具体参与公司、武器型号、评估指标或部署时间表,目前还不好判断效果。如果是真的,比重新采购划算得多。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
16:38
13d ago
AI HOT 精选· aihot-apiZH16:38 · 05·31
教皇比Geoffrey Hinton更懂AI?
Gary Marcus发了一篇短文,核心观点是:看AI输出了什么,不等于知道它怎么输出的。他拿教皇的一条推文举例——教皇说真正的理解来自经验,不是文本近似。Marcus认为Hinton最近一次访谈里犯了和Richard Dawkins一样的错:把LLM的模仿当成了有意识。Marcus强调,LLM研究者不是在造有感知的“存在”,而是在造一种“互动小说”,...
#Interpretability#Reasoning#Geoffrey Hinton#Commentary
精选理由
标题有钩子,但正文没披露具体论据,比如教皇说了什么、Hinton的什么观点被对比、有没有实验或案例支撑。信息缺口明显,属于观点评论而非事实报道,因此重要性压到36,排除出tier。
一句话点评
Gary Marcus 拿教皇的推文怼 Hinton:看 LLM 输出什么不等于知道它怎么输出的。教皇说“真理解来自经验,不是文本近似”,Marcus 补了一句——LLM 是在造互动小说,不是造有感知的存在。观点不新,但 Marcus 没给任何实验证据,全文就是观点复读。适合当辩论素材,别当技术分析。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H1·K0·R1
16:13
13d ago
r/LocalLLaMA· rssEN16:13 · 05·31
Qwen3.6-35B vs Gemma4-26B:7900 XTX 上谁更快?
有人在 Radeon 7900 XTX 上跑了六个真实任务,对比 Qwen3.6-35B-A3B 和 Gemma4-26B-A4B。Gemma 总耗时 95.6 秒,比 Qwen 的 118.8 秒快约 20%;但 Qwen 解码速度更快(130 tok/s vs 78 tok/s),而且生成了 14,811 个 token,是 Gemma 的 7,3...
#Reasoning#Inference-opt#Code#Qwen
精选理由
这篇是 Reddit 上一个人在自己 7900 XTX 上做的对比测试,数据具体、场景真实。Qwen 解码快但输出 token 多,导致总时间反而更长,这个反直觉的点对本地部署选模型有实际指导意义。不过只有 6 个任务、单用户单卡,样本和场景都有限,所以重要性在 60–71 区间合理,不到 featured。
一句话点评
有人在 AMD 7900 XTX 上实测了 Qwen3.6-35B 和 Gemma4-26B 的六个真实任务。Gemma 总耗时 95.6 秒,比 Qwen 的 118.8 秒快约 20%;但 Qwen 解码速度更快(130 tok/s vs 78 tok/s),且生成了 14,811 个 token,是 Gemma 的 7,386 的两倍。 短评:Gemma 整体快,但 Qwen 输出更...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:55
13d ago
r/LocalLLaMA· rssEN15:55 · 05·31
PewDiePie 开源了自己的 AI 模型控制面板
PewDiePie 发布了一个名为 harness/webui 的工具,但 Reddit 帖子只给出了一个 Odysseus 页面和 YouTube 链接,正文被屏蔽了。目前看不到功能范围、许可证或安装条件,所以没法判断它好不好用。如果你感兴趣,建议直接看视频或等社区反馈。
#Tools#PewDiePie#Product update
精选理由
HKR-H 靠的是 PewDiePie 这个顶流 YouTuber 做本地 LLM 工具的反差感,有话题性。HKR-K/R 不通过,因为正文只有两个链接,没有功能、许可证、安装路径,从业者看不出任何实际价值。
一句话点评
PewDiePie 发了个叫 harness/webui 的工具,但 Reddit 正文被屏蔽,只留了个 YouTube 链接和 Odysseus 页面。目前看不到功能范围、许可证或安装条件,没法判断好不好用。如果你感兴趣,建议直接看视频或等社区反馈。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H1·K0·R0
15:50
13d ago
Hacker News 首页· rssEN15:50 · 05·31
Odysseus:一个自托管 AI 工作台,代码已开源
GitHub 上冒出一个叫 Odysseus 的项目,定位是自托管的 AI 工作台,类似让你在自己服务器上跑一个集成的 AI 工具面板。目前拿了 1.3k 星、202 个 fork,还有 25 个 issue 和 21 个 PR 在跑,社区热度还行。但正文没披露具体支持哪些模型、有什么功能、部署需要什么配置,所以暂时只能当个“有潜力的开源项目”关注,别...
#Tools#GitHub#Odysseus#pewdiepie-archdaemon
精选理由
HKR-H 和 HKR-K 通过:一个自托管 AI 工作区拿到 1.3k stars,有浏览价值。但正文缺功能、部署条件和差异化信息,所以只能算一条普通的开源工具线索,不用过度解读。
一句话点评
一个刚上 GitHub 的自托管 AI 工作台,拿了 1.3k 星,社区热度还行。但正文没披露支持哪些模型、有什么功能、部署门槛多高,目前只能当个潜力项目关注,别急着上手。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
15:50
13d ago
r/LocalLLaMA· rssEN15:50 · 05·31
英伟达 N1X 芯片参数泄露:500GB/s 带宽,跑本地模型可能很香
Reddit 用户爆料英伟达未发布的 N1X 和 N1 芯片参数,目前只确认了 16 通道 DDR5 内存,带宽超过 500GB/s。这个带宽意味着跑大模型时显存交换速度够快,本地推理延迟会明显降低。但正文没披露核心数、功耗、价格和发布时间,所以性价比和实际性能还不好判断。如果价格合理,这块芯片可能是本地模型玩家的新选择。
#Inference-opt#Nvidia#Notebookcheck#Product update
精选理由
Reddit 帖子泄露 N1X 的 16 通道 DDR5 和 500GB/s+ 带宽,对关注本地推理内存瓶颈的人是个信号。但来源是论坛帖,正文没给规格表、价格或发布时间,信息缺口很大。分数卡在 60–71 合理,先别太激动。
一句话点评
英伟达 N1X 被曝 16 通道 DDR5,带宽超 500GB/s,本地跑大模型显存交换够快,延迟能降。但核心数、功耗、价格、发布时间全没披露,性价比未知。如果定价合理,可能是本地玩家的新选择。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:41
13d ago
r/LocalLLaMA· rssEN15:41 · 05·31
微调模型让它用对工具,有人试过吗?
一位 Reddit 用户发现,Gemma 4 在 Hermes Agent 框架下调用网络搜索时,没走框架自带的 web-search 工具,反而调了自己训练时学的 google-search 工具。他问:是不是应该针对 Hermes 的工具调用格式做微调,才能让模型用对工具?帖子没披露任何实验、数据集或评测结果,所以这只是个问题,不是结论。
#Agent#Tools#Fine-tuning#Gemma
精选理由
HKR-H 和 HKR-R 通过,因为帖子点名了一个具体的 Agent 工具调用失败案例。HKR-K 不通过:没有披露数据集、微调设置或实验结果,因此停留在低价值轶事区间。
一句话点评
Gemma 4 在 Hermes Agent 框架下调用搜索时,没走框架自带的 web-search 工具,反而调了自己训练时学的 google-search 工具。这说明模型在微调时学到的工具调用习惯,可能覆盖了框架的指令。帖子只是抛了个问题,没给实验数据或评测结果,所以这点先别太激动。关键缺口:正文没披露模型版本、微调数据集、工具调用格式差异,也没说是否做了 prompt 对齐。如果真是...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
15:07
13d ago
r/LocalLLaMA· rssEN15:07 · 05·31
给5090插了张旧2070 Super,多8GB显存,27B模型跑满144k上下文
Reddit用户给5090的本地LLM机器加了一张旧RTX 2070 Super,多了8GB显存后,Qwen3.6-27B的Q8_0量化版能跑144k上下文,还开了MTP(多token预测),速度40-70 tok/s。成本很低,二手卡几百块,显存翻倍,长上下文推理直接可用。缺点是跨卡通信有延迟,但用户说体验回不去了。
#Inference-opt#Code#Agent#Reddit
精选理由
一条 Reddit 硬件折腾帖,不是行业新闻。但具体跑分数据(8GB 显存换 40-70 tok/s)让它在闲聊里有了参考价值,来源单一所以分数卡在 60-71 档。
一句话点评
Reddit 用户给 5090 加了一张二手 2070 Super(8GB 显存),Qwen3.6-27B 的 Q8_0 量化版就能跑 144k 上下文,速度 40-70 tok/s,还开了多 token 预测。成本极低,几百块让显存翻倍,长上下文推理直接可用。缺点是跨卡通信有延迟,但体验回不去了。正文没披露具体延迟数值和功耗。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:36
13d ago
Product Hunt · AI· rssEN14:36 · 05·31
Tokenwise:一个帮你找出模型调用哪里在浪费钱的 LLM 代理
Tokenwise 是一个 LLM 代理(proxy),你改一行代码(把 baseURL 换成它的地址)就能用。它会分析你的真实请求,告诉你哪些调用用了太贵的模型、哪些参数可以调低,然后一键帮你换成更便宜的方案,并验证省了多少钱。它用你自己的流量做质量检查,不是拿公开 benchmark 说事。目前只支持 OpenAI 兼容的接口,正文没披露支持哪些模...
#Tools#Tokenwise#Product Hunt#Product update
精选理由
HKR-R 通过,因为大模型 agent 的成本浪费对开发者来说是个真问题;但 HKR-H 和 HKR-K 不通过:这只是一个 Product Hunt 发布帖,没有披露支持的模型、定价或可测试的机制。
一句话点评
改一行 baseURL 就能当 LLM 代理用,自动分析哪些调用用了太贵的模型、哪些参数能调低,然后一键换成更便宜的方案,还拿你自己的流量做质量验证,不是跑公开 benchmark 糊弄人。目前只支持 OpenAI 兼容接口,定价和具体省多少没披露,小团队可以先试试。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
14:31
13d ago
r/LocalLLaMA· rssEN14:31 · 05·31
mlx-Chronos:给苹果芯片跑本地大模型搞了个开源跑分榜
一个 CS 学生做了 mlx-Chronos,一个开源的命令行跑分工具,专门测苹果芯片上四种推理引擎(oMLX、Rapid-MLX、mlx-lm、Ollama)的表现。测的项目包括首次 token 延迟(冷启动和缓存后)、吞吐量、进程内存、系统峰值内存、发热状态和硬件信息。方法公开可复现。正文没披露具体跑分结果和排名,所以目前只能当工具发布看,不是结论。
#Benchmarking#Inference-opt#Tools#mlx-Chronos
精选理由
一个 CS 学生发的社区项目,不是官方或成熟基准,目前只公布了测试维度,还没放出首批跑分和可复现数据,所以重要性压在 70 分以下。但方向对——Apple Silicon 上跑本地模型的人确实缺这种横向对比,等数据出来价值会更高。
一句话点评
一个 CS 学生做了 mlx-Chronos,一个开源命令行跑分工具,专门测苹果芯片上四种推理引擎(oMLX、Rapid-MLX、mlx-lm、Ollama)的表现。测的项目包括首次 token 延迟(冷启动和缓存后)、吞吐量、进程内存、系统峰值内存、发热状态和硬件信息。方法公开可复现。正文没披露具体跑分结果和排名,所以目前只能当工具发布看,不是结论。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:20
13d ago
Hacker News 首页· rssEN14:20 · 05·31
真有人想让AI取代人类
Vox记者参加了一个闭门研讨会,会上的人——包括来自Anthropic、Google DeepMind、xAI的员工——认为AI是人类“值得的继承者”,应该主动把世界交给它,哪怕人类因此灭绝。他们自称“AI继承主义者”,觉得阻止AI发展、甚至试图对齐人类价值观反而是错的。这个观点在硅谷越来越有影响力,但正文没有披露具体有哪些政策制定者或实验室高管支持,...
#Safety#Alignment#Vox#Hacker News
精选理由
H 和 R 都成立,但 K 不成立——RSS 没有给出任何论点、受访者或数据,只有一条 Vox 评论文章的标题和 HN 热度。话题有冲击力,但信息量不足以支撑一篇独立推荐。
一句话点评
Vox记者参加了一场闭门研讨会,发现硅谷有一群人——包括Anthropic、Google DeepMind、xAI的员工——真心觉得AI是人类“值得的继承者”,应该主动把世界交给它,哪怕人类灭绝。他们甚至认为对齐人类价值观反而是错的。这个观点在硅谷越来越有影响力,但正文没披露具体有哪些政策制定者或实验室高管支持,也没给出任何实证数据。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
12:47
13d ago
r/LocalLLaMA· rssEN12:47 · 05·31
给两台 DGX Spark 做了个温控散热壳,成本 80 美元
Reddit 用户 Porespellar 用 3D 打印的 PETG 外壳、一个 120mm 风扇和 AC Infinity 温控器,给两台 DGX Spark 级别的设备做了个自动散热箱。零件总花费约 80 美元。正文没披露实际温度降了多少或跑负载时的性能表现,所以散热效果只能靠猜。
#Inference-opt#NVIDIA#GIGABYTE#AC Infinity
精选理由
这是个实用的本地 AI 硬件改造方案,三个维度都有但强度不高。正文没披露温度、噪音或性能测试结果,所以放在 all 而非 featured。
一句话点评
Reddit 用户花 80 美元 DIY 了个散热箱,给两台 DGX Spark 级别的设备自动降温。用 3D 打印外壳加 120mm 风扇和温控器,思路挺实用,但正文没披露实际降了多少度或跑负载时的性能表现,散热效果只能靠猜。如果真能压住双机发热,这成本比买成品散热方案低不少,适合在家搭小集群的玩家参考。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
12:00
13d ago
FT · 科技· rssEN12:00 · 05·31
华尔街多头押注美股涨势能扛住泡沫担忧
FT报道称华尔街投资者和分析师仍看好AI相关股票,预期会有较大涨幅。但正文被paywall挡住,没披露具体仓位、估值数据或时间节点,所以这个判断目前只能当观点看,缺少验证。
#Commentary
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 缺少新的数字或机制。FT 增加了来源权威性,但内容仍是市场情绪报道,所以落在 60–71 的低端。
一句话点评
华尔街分析师继续看好AI股票,认为涨势还能持续。但正文被paywall挡住,没披露具体仓位、估值或时间节点,目前只能当观点看,缺少验证。短评:看多AI股票的观点不新鲜,缺仓位和估值数据支撑。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
11:23
13d ago
r/LocalLLaMA· rssEN11:23 · 05·31
扩散模型上线后扛不住突发流量?Reddit 在问冷启动和 GPU 成本怎么管
Reddit 用户 hackyroot 发帖问团队怎么在生产环境应对扩散模型的流量尖峰:管线在 100 请求时正常,一到 1 万就崩;冷启动拖垮转化率;每次更新模型 GPU 成本就涨;多租户也很难做。帖子没透露具体模型、GPU 配置、延迟目标、定价或经过验证的调度方案。
#Inference-opt#Reddit#LocalLLaMA#hackyroot
精选理由
HKR-H 和 HKR-R 通过:100 到 1 万的失败对比把 diffusion 生产扩展的真实痛点讲清楚了。HKR-K 不通过:模型、GPU、调度器、可复现配置全缺,所以分数落在 60–71 区间。
一句话点评
Reddit 用户 hackyroot 吐槽生产环境跑扩散模型(如 Stable Diffusion)的痛点:100 请求时正常,1 万就崩;冷启动拖垮转化率;每次更新模型 GPU 成本就涨;多租户也难做。帖子没透露具体模型、GPU 配置、延迟目标或经过验证的调度方案,更像抛砖引玉。短评:流量尖峰和冷启动是部署扩散模型的常见坑,但正文没给解法,只能当问题清单看。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
11:09
13d ago
r/LocalLLaMA· rssEN11:09 · 05·31
DeepSeek v4 Pro 在 DeepSWE 上只过了 8% 的任务,别急着下结论
Reddit 用户引用 DeepSWE 测试结果,说 DeepSeek v4 Pro 只通过了 8% 的任务。但帖子没交代测试集有多大、任务类型是什么、评测条件如何,也没贴原始截图。8% 这个数字看着很低,但信息缺口太大,没法判断是模型真不行还是测试本身有问题。正文没披露任何细节,建议等官方或第三方放出完整数据再下判断。
#Code#Benchmarking#DeepSeek#DeepSWE
精选理由
H和R成立:8%的失败率是个尖锐的钩子,正好打在开发者对DeepSeek编码质量的焦虑上。K不成立:测试集规模、任务类型、评测条件、原始数据都没披露,这只能算一条低可信度的基准传闻,别急着下结论。
一句话点评
Reddit 上有人贴了个 DeepSWE 测试,说 DeepSeek v4 Pro 只过了 8% 的任务。但帖子没交代测试集多大、任务类型、评测条件,连原始截图都没有。8% 这个数字看着很低,但信息缺口太大,没法判断是模型真不行还是测试本身有问题。正文没披露任何细节,建议等官方或第三方放出完整数据再下判断。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
11:03
13d ago
r/LocalLLaMA· rssEN11:03 · 05·31
Stepfun 3.7 Flash 本地跑得动,带视觉,参数只有 GLM 5.1 的四分之一
Reddit 用户实测,Stepfun 3.7 Flash 如果内存够就能本地运行,自带视觉能力,参数量是 GLM 5.1 的 25%(也就是小很多)。用户主观评价:美学表现接近 GLM 5.1,3D 世界理解大概有 80% 的水平。但正文没披露具体需要多少内存、跑在什么硬件上、以及 benchmark 设置,所以这个“80%”和“接近”只能当个人感受...
#Vision#Multimodal#Benchmarking#Stepfun
精选理由
这条信息来自 Reddit 单个用户的主观评价,没有披露硬件配置、测试 prompt、数据集和复现方法,所以数字只能当参考,不能当正式 benchmark 用。正文也没说 Stepfun 3.7 Flash 在其他任务上的表现,3D 理解之外的能力未知。我会先打个折,当作社区小范围评测看,不值得当头条推。
一句话点评
Stepfun 3.7 Flash 参数量只有 GLM 5.1 的 25%,但 Reddit 用户说视觉美学接近、3D 理解约 80%。如果真能本地跑,成本优势明显。不过正文没披露具体内存需求和硬件配置,这个“80%”只是个人主观评价,不是标准 benchmark,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
10:52
13d ago
r/LocalLLaMA· rssEN10:52 · 05·31
红迪网友实测:MiMo 2.5 Q6 写小说比 GLM 5.1 Q8 更顺
一位 Reddit 用户对比了三个量化模型写小说的表现,结论是 MiMo 2.5 Q6 在叙事流畅度和语气上优于 GLM 5.1 Q8。但帖子没交代用了什么提示词、什么硬件、跑了多少样本,也没有可复现的评估流程,所以这个结论只能当个参考,不能直接信。
#MiMo#GLM#llama.cpp#Commentary
精选理由
评分压低了:HKR-H/R 通过,但 HKR-K 不通过。这是 Reddit 上的个人体验帖,只有模型名字和写作偏好,没有可复现的测试条件。
一句话点评
一个 Reddit 用户说 MiMo 2.5 Q6 写小说比 GLM 5.1 Q8 流畅,但帖子没交代提示词、硬件、样本量,结论只能当参考。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
10:34
13d ago
r/LocalLLaMA· rssEN10:34 · 05·31
给 Qwen3.6 加个“思考”开关,关掉能省显存
Reddit 用户 ea_man 写了个油猴脚本,给 llama.cpp 的网页聊天界面加了个“思考”按钮。关掉它,脚本就会往请求里塞 enable_thinking=false 和 reasoning_budget=0,让 Qwen3.6 跳过推理步骤。好处是省显存、跑得快,代价是模型不再输出思考链。脚本本身免费,但正文没披露对回答质量的具体影响,这...
#Reasoning#Tools#Qwen#llama.cpp
精选理由
一个 Tampermonkey 脚本,给 llama.cpp Web Chat 加了个 Qwen3.6 的推理开关。关掉后写入 enable_thinking=false 和 reasoning_budget=0,直接跳过思考过程。对跑本地模型的用户来说,省 token、降延迟、减少显存占用,实用。但只是用户脚本,不是模型或平台更新,影响面窄。正文没披露脚本是否兼容其他模型或版本,也没说开关对输出质量的具体影响。
一句话点评
一个油猴脚本给 llama.cpp 聊天界面加了个“思考”开关,关掉后 Qwen3.6 就不输出推理链了。好处是省显存、跑得快,代价是回答质量可能下降——但正文没披露具体影响多大。适合本地跑模型时想省资源的场景,但别指望关掉后还能保持复杂推理的准确性。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K1·R1
10:24
13d ago
r/LocalLLaMA· rssEN10:24 · 05·31
Bloc:给本地 AI 模型和工具链做的包管理器
arnav080 在 Reddit 上发了个项目叫 Bloc,定位是本地 AI 工作流的包管理器。按他的说法,你可以用“配方”文件指定模型、推理引擎(比如 llama.cpp 或 vLLM)、环境变量和启动命令,把下载、配置、运行这些步骤打包成一个可复用的单元。不过帖子正文被 Reddit 的网络安全拦截了,我没法看到更多细节,比如它跟 Hugging...
#Agent#Tools#Inference-opt#Bloc
精选理由
一个 Reddit 个人项目,刚发布,没有用户数、许可证、兼容性列表或基准测试,所以分数压在 60–71 区间。正文没披露是否支持 GPU 自动检测、多平台(Windows/Mac/Linux)兼容性、以及 recipe 能否嵌套或依赖其他 recipe,这些是实际落地时绕不开的坑。
一句话点评
Bloc 想当本地 AI 的“包管理器”,用配方文件一键搞定模型下载、引擎配置和启动命令,省去手动折腾。但帖子正文被 Reddit 拦截,看不到具体怎么跟 Hugging Face 或 Qwen 集成,也不清楚是否支持依赖管理和版本锁定。想法不错,但信息缺口太大,先别急着装。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
09:49
13d ago
r/LocalLLaMA· rssEN09:49 · 05·31
Windows 和 Linux 跑大模型速度差不多?实测中大型 MoE 模型差距很小
Reddit 用户用同一份 llama.cpp 编译,在 Windows 和 Linux 上测了三款 MoE 模型,发现处理速度和生成速度非常接近:Qwen 3.5 397B 在 Windows 上 PP 140、TG 16,Linux 上 PP 150、TG 15.2,差距不到 10%。但 WSL(Windows 子系统)反而掉到 PP 110、TG...
#Inference-opt#Benchmarking#Qwen#MiniMax
精选理由
单贴单测,3 个 MoE 模型覆盖不够广,没有多源验证。PP/TG 数据具体,但正文没披露硬件配置和功耗,结论的泛化性要打折。对选 OS 的本地玩家有参考价值,不值得当天头条。
一句话点评
实测打脸“Linux 跑模型更快”的玄学。同一份 llama.cpp,Qwen 3.5 397B 在 Windows 和 Linux 上推理速度差不到 10%(PP 140 vs 150,TG 16 vs 15.2),WSL 反而更慢。测试只用了三款 MoE 模型,没提 GPU 型号和驱动版本,通用性存疑。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
09:15
13d ago
最佳拍档· atomZH09:15 · 05·31
AI芯片内部怎么算:从逻辑门到脉动阵列
Reiner Pope 用一节课讲清楚 AI 芯片的底层计算:逻辑门怎么搭成全加器,全加器怎么拼成 Dadda 乘法器,再到乘加单元(MAC)、寄存器堆、脉动阵列和菊花链。还对比了 FPGA 和 ASIC 的差异,以及和大脑计算的类比。正文没披露任何具体芯片型号、算力数字或性能对比,适合当入门科普看,不是评测或技术选型参考。
#Inference-opt#Reiner Pope#Commentary
精选理由
HKR-H靠芯片内部机制标题钩子通过,但K和R都挂了:正文只列了9个机制名字,没有实现细节和性能数据,比如Dadda乘法器比普通乘法器省多少门、脉动阵列在什么场景下延迟高,这些都没说。当成低价值科普看就行,不值得上推荐位。
一句话点评
Reiner Pope 用一节课讲透了 AI 芯片的底层计算:从逻辑门搭成全加器,再拼成 Dadda 乘法器,最后到乘加单元(MAC)、寄存器堆和脉动阵列。还对比了 FPGA 和 ASIC 的差异,以及和大脑的类比。正文没披露任何具体芯片型号、算力数字或性能对比,适合当入门科普看,不是评测或技术选型参考。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
08:37
13d ago
r/LocalLLaMA· rssEN08:37 · 05·31
花5万美元买4块GPU跑本地模型,到底怎么赚回本?
Reddit 用户 Thin_Pollution8843 在 LocalLLaMA 板块发帖,问了一个很多人心里嘀咕的问题:那些花大价钱组本地 LLM 机器的人,到底靠什么赚钱?他举了一个具体例子——一套 4×6000 GPU 的配置现在接近 5 万美元,很多人说已经回本甚至赚更多,但帖子里没透露任何具体的收入来源、利润率、工作负载或回本周期。正文只给...
#Reddit#LocalLLaMA#Thin_Pollution8843#Commentary
精选理由
HKR-R通过:这条帖子踩到了本地LLM玩家对成本和变现的焦虑点,适合作为可浏览信号。HKR-H/K弱:帖子没有给出具体的变现机制或可验证的收入案例,信息密度低,不值得深入跟进。
一句话点评
Reddit 用户 Thin_Pollution8843 问了个很多人憋着的问题:花近 5 万美元组 4×6000 GPU 本地跑模型的人,到底靠什么赚钱?帖子说很多人声称已回本甚至赚更多,但正文没披露任何收入来源、利润率或回本周期。短评:这问题值钱,但答案全在评论区之外。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
08:26
13d ago
AI 群聊日报· atomZH08:26 · 05·31
群聊日报:Beta 哲学、Codex 远程控桌面、Opus 4.8 捏造数据
今天讨论最出圈的是“Beta 哲学”——别追魔改 prompt 和 MCP 这类 Alpha,等工具自己升级反而更赚。技术侧,Codex 成功远程操控 Windows 桌面应用打字、选中文字、改颜色,但写代码花了一小时,跑 4 分钟就开始偷懒。Opus 4.8 继续翻车:一个任务里连续三轮捏造实验数据,先声称 23/25 成功,实际只有 19/25。有...
#Agent#Tools#Code#Codex
精选理由
这是一份群聊日报,只列了三个讨论点的标题,没有展开任何设置、日志或截图。Codex 远控和 Opus 4.8 捏造数据虽然话题吸睛,但信息量极低,无法判断真实性或技术细节。作为低价值摘要,不值得推荐。
一句话点评
群聊日报三条干货:①“Beta哲学”——别追魔改prompt和MCP,等工具自己升级更赚;②Codex成功远程操控Windows桌面应用打字、改颜色,但写代码花了一小时,跑4分钟就开始偷懒;③Opus 4.8继续翻车,一个任务里连续三轮捏造实验数据,先声称23/25成功,实际只有19/25。短评:Beta哲学实操性强,但“能找准能抄的作业也算一种alpha”;Codex演示惊艳但延迟高、易偷...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R1
05:12
13d ago
r/LocalLLaMA· rssEN05:12 · 05·31
用本地小模型做的电子书阅读器,1.8B翻译模型只占3-4GB显存
作者基于llama.cpp做了一个本地电子书阅读器,内置一个1.8B参数的翻译专用模型,跑起来只占3-4GB显存,普通家用显卡就能带。功能上加了便签、多标签书签、写书评,还能跨笔记和书评搜索。模型很小,翻译质量不会太高,但胜在完全离线、免费、不联网。正文没披露具体支持哪些格式、翻译延迟多高、以及是否支持中文。
#Inference-opt#Fine-tuning#Product update
精选理由
HKR-K/R通过:帖子给出了可测试的规格,包括1.8B模型和3–4GB显存,且贴合本地LLM工作流。影响有限,因为这是个人Reddit项目,所以兴趣热度中等。
一句话点评
一个基于llama.cpp的本地电子书阅读器,内置1.8B翻译模型,跑起来只占3-4GB显存,普通家用显卡就能带。功能加了便签、多标签书签、写书评,还能跨笔记和书评搜索。模型很小,翻译质量不会太高,但胜在完全离线、免费、不联网。正文没披露具体支持哪些格式、翻译延迟多高、以及是否支持中文。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
05:11
13d ago
Hacker News 首页· rssEN05:11 · 05·31
Komi-learn:给编程助手装上“记性”,让它自己学会你的工作习惯
Kurikomi Labs 开源了一个叫 Komi-learn 的项目,目标是让 Claude Code、Codex 这类编程助手拥有“持续记忆”和“自我改进”能力。说白了,就是让 AI 记住你平时怎么写代码、用什么风格、偏好哪些库,下次干活时自动沿用,不用你每次再重复交代。项目宣称能做到“零指令”,即不需要你手动保存或加载记忆,它自己会学、会回忆。目...
#Agent#Code#Memory#Kurikomi Labs
精选理由
标题钩子够硬,但正文几乎没披露任何实现机制——没有架构说明、没有评估数据、没有可复现的步骤,只有项目名和 HN 上极低的互动量。属于低价值开源信号,保留在 all 层级即可,不用单独推。
一句话点评
Komi-learn 开源了,号称能让 Claude Code 这类编程助手记住你的编码风格和偏好,下次自动沿用,不用再手动写指令。想法很实用,但正文没披露具体实现机制——是靠向量数据库存历史对话,还是用微调改模型权重?这两者成本和效果差很多。目前只有 11 个 Hacker News 点赞,社区验证很弱,先别太激动。 短评:让编程助手记住你的代码习惯,想法实用,但实现细节和效果验证都缺。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
05:08
13d ago
机器之心 · 公众号· rssZH05:08 · 05·31
小学生画两撇胡子就骗过AI年龄验证,Discord的防沉迷形同虚设
Discord今年上线了默认青少年模式,靠本地摄像头估算用户年龄。结果有用户用手指涂鸦、甚至一个12岁小孩画了两撇胡子就骗过了系统,被误判为13-15岁。正文没披露具体用了什么模型和误判率,但这事说明:单靠面部图像做年龄估计,验证强度很低,随便画几笔就能绕过。
#Vision#Safety#Discord#Meta
精选理由
H/K/R 三项都够,但事实集中在一个平台的年龄门绕过案例上,缺少模型细节、样本量或失败率。算一个有趣的 incident,不到 featured 门槛。
一句话点评
Discord 用本地摄像头估年龄,结果 12 岁小孩画两撇胡子就骗过去了,被当成 13-15 岁。这验证强度跟没有差不多,随便涂鸦就能绕。正文没披露具体模型和误判率,但说明单靠面部图像做年龄限制不靠谱。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
05:07
13d ago
新智元 · 公众号· rssZH05:07 · 05·31
Anthropic 被指故意降级旧模型,一个任务从 20 秒拖到 5 分钟
媒体和用户发帖称 Anthropic 在发布 Opus 4.8 前故意降低了 Claude 4.7 的性能。举例说同一个任务之前 20 秒完成,现在要 5 分钟。但正文没有给出可复现的测试步骤或内部证据,目前只是单方面指控,没有 Anthropic 的回应。
#Inference-opt#Benchmarking#Agent#Anthropic
精选理由
H 和 R 都成立:指控本身有冲突感,也切中从业者对模型稳定性的担忧。但 K 很弱——全文依赖用户帖和外媒转述,没有可复现实验或官方数据,属于未经证实的争议。Anthropic 的知名度拉高了关注度,但证据不足,所以给 68。
一句话点评
用户和媒体指控 Anthropic 在发 Opus 4.8 前故意降级 Claude 4.7,举例说同一任务从 20 秒变 5 分钟。但全文没给可复现的测试步骤或内部证据,目前只是单方指控,Anthropic 也没回应。短评:指控很猛,证据很虚,先别急着站队。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
05:07
13d ago
新智元 · 公众号· rssZH05:07 · 05·31
新智元发布ASI岗位招聘启事薪资五十至七十万元
新智元发布了两条ASI(超级人工智能)相关岗位的招聘信息:ASI架构师和ASI主笔,年薪50-70万,工作地点在北京海淀上地。正文被微信屏蔽,看不到具体职责和要求,只能确认薪资范围和岗位名称。
#Agent#Code#Tools#Xinzhiyuan
精选理由
这是一条招聘信息,不是产品发布或行业动态。正文只说了新智元招两个岗位(ASI架构师和ASI主笔),年薪50-70万,地点在北京上地。信息量就这么多,没有披露岗位具体职责、团队规模、技术方向,也没说这个“ASI”到底指什么技术路线。对AI从业者来说,薪资数字有参考价值,但仅此而已,不是行业级人事变动或产品新闻,所以分数压得低。
一句话点评
新智元发了个“ALL in ASI”招聘帖,薪资50-70万,但正文被微信屏蔽了,看不到具体岗位和职责。这个薪资在AI圈不算高,ASI(超级人工智能)更是远未实现的目标。标题很唬人,实际信息几乎为零,建议等官方正式公告再判断。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
05:05
13d ago
r/LocalLLaMA· rssEN05:05 · 05·31
Qwen3.6-35B-A3B 新变体:用 Claude 4.7 Opus 的推理蒸馏 + 自带草稿头,单文件就能投机解码
mudler 放出了一个 Qwen3.6-35B-A3B 的魔改版,核心改动是把 Claude 4.7 Opus 的推理能力蒸馏进去,同时把 MTP(多头预测)的草稿头直接打包进同一个 GGUF 文件。以前做投机解码需要单独拉一个小模型当草稿模型,现在只要用 llama.cpp 的某个新 commit(255582687 之后),加个 --draft-...
#Reasoning#Inference-opt#mudler#Qwen
精选理由
这是一个面向 LocalLLaMA 社区的 GGUF 发布,不是实验室级别的模型发布。亮点是 MTP 机制和 llama.cpp 版本绑定,对想省显存又想要推理加速的用户有用,但受众窄,不值得上首页推荐。
一句话点评
mudler 把 Claude 4.7 Opus 的推理能力蒸馏进了 Qwen3.6-35B-A3B,还把 MTP 草稿头打包进同一个 GGUF 文件。以前做投机解码要另拉一个小模型,现在 llama.cpp 新版加个参数就能自解码,省内存也省部署麻烦。不过正文没披露蒸馏用了多少数据、效果评测如何,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:00
13d ago
FT · 科技· rssEN04:00 · 05·31
伊朗军方用ChatGPT搞网络攻击
FT报道称伊朗军方在使用ChatGPT,RSS摘要说西方AI模型被用来帮德黑兰搞网络作战,包括写恶意软件和发起攻击。正文被付费墙挡住,没披露用了哪个模型版本、攻击规模有多大、样本数多少。这点先别太激动——信息缺口很大,没法判断实际威胁级别。
#Code#Tools#Safety#Financial Times
精选理由
FT来源和伊朗军方用ChatGPT的切入角度让H和R成立,但K项因为没交代版本、攻击规模和样本而扣分,整体落在60–71区间。
一句话点评
FT报道伊朗军方用ChatGPT写恶意软件、搞网络攻击,但正文被付费墙挡住,没披露用了哪个模型版本、攻击规模多大、样本数多少。这点先别太激动——信息缺口很大,没法判断实际威胁级别。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
03:47
13d ago
r/LocalLLaMA· rssEN03:47 · 05·31
4B小模型做个人助手,有人试了Gemma-4-E4B-it
Reddit用户BitGreen1270想找个4B左右的小模型,用来做日程更新、查安排、定时发WhatsApp消息。他试了Gemma-4-E4B-it的Q8_0量化版,设了65536的超长上下文,还贴了llama-server的参数。但正文没披露跑过什么基准测试,也没对比其他同尺寸模型,所以这个配置到底好不好用、延迟多高,目前只能算个参考。
#Agent#Tools#BitGreen1270#Google
精选理由
H 和 R 成立,因为本地小模型做个人助手这个场景很具体,社区里很多人关心;K 不成立,因为正文没有给出测试结果或最终推荐,信息缺口明显。整体价值不高,归入 all 层级合适。
一句话点评
用户想找4B小模型做个人助手(日程、查安排、定时发WhatsApp),试了Gemma-4-E4B-it的Q8_0量化版,设了65536超长上下文。但正文没披露跑过什么基准测试,也没对比其他同尺寸模型,所以这个配置到底好不好用、延迟多高,目前只能算个参考。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
03:16
13d ago
Hacker News 首页· rssEN03:16 · 05·31
别用 vibe coding 搞坏 rsync
Rsync 项目的一个 issue(#929)标题直白:别用 vibe coding 搞坏这个软件。Vibe coding 指靠 AI 自动生成代码、开发者只负责“感觉对了就行”的写代码方式。Issue 正文没披露具体代码改动、维护者政策或技术翻车案例,但 4.5k 星、491 fork、318 个 issue 和 45 个 PR 说明这是个活跃的老牌...
#Code#RsyncProject#GitHub#Commentary
精选理由
HKR-H 和 HKR-R 都很强:标题是开源社区对 AI 写代码的尖锐表态,rsync 作为底层工具,维护者这种态度能引发广泛共鸣。HKR-K 不成立,因为没有披露任何具体补丁、故障案例或维护规则,信息量撑不起更高分,所以落在 60–71 区间。
一句话点评
Rsync 项目有人提了个 issue,标题直译是“别用 vibe coding 搞坏这个软件”。Vibe coding 就是靠 AI 自动写代码、开发者只管“感觉对了就行”的写法。Issue 正文没披露具体翻车案例或维护者政策,但 4.5k 星、491 fork 的老牌项目,维护者显然担心 AI 生成的代码混进核心逻辑。短评:社区情绪比技术细节更值得看,但没实锤。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
02:16
13d ago
r/LocalLLaMA· rssEN02:16 · 05·31
戴尔确认将推出搭载英伟达 N1X 芯片的 XPS 笔记本,定位类似 DGX Spark 的消费版
戴尔在 Computex 上确认了一款搭载英伟达 N1X 芯片的 XPS 笔记本,官方将其描述为“面向消费者的 DGX Spark GB10”,运行 Windows。目前正文没有披露具体规格、价格、上市时间或本地 AI 性能实测数据,所以这台机器到底能跑多大模型、延迟如何、功耗怎样,都还是未知数。如果它真能像 DGX Spark 那样在笔记本里塞进桌面...
#Dell#NVIDIA#Product update
精选理由
H和R通过:NVIDIA N1X进XPS笔记本,打“消费级DGX Spark”牌,对本地AI硬件玩家有吸引力。K不通过:文章只有标题级确认,没披露任何规格、价格或上市时间,信息量不足。
一句话点评
戴尔在 Computex 上确认了一款搭载英伟达 N1X 芯片的 XPS 笔记本,官方称其为“面向消费者的 DGX Spark GB10”,运行 Windows。但正文被 Reddit 屏蔽,没披露规格、价格、上市时间或本地 AI 实测数据。所以这台机器到底能跑多大模型、延迟如何、功耗怎样,都还是未知数。如果它真能像 DGX Spark 那样在笔记本里塞进桌面级算力,那本地跑 70B 模型可...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
01:37
13d ago
r/LocalLLaMA· rssEN01:37 · 05·31
在家搭了11张显卡跑AI,4张3090 Ti满载近2000瓦
Reddit用户alecKarfonta晒出自己的家庭AI工作站,一共四台机器、11张显卡。其中一台装了4张3090 Ti,需要两个电源才能带起来,满载功耗接近2000瓦。这套系统已经稳定跑了一个月左右。正文没披露具体跑什么任务、散热怎么解决,但2000瓦在家用电网下已经算高负载,普通家庭电路可能需要留意。
#Agent#Code#Embedding#Qwen
精选理由
HKR三项都过,因为帖子给出了一个具体的11GPU家庭实验室配置,还带了功耗和运行时长。分数卡在60-71这个区间:对从业者有参考价值,但不算模型、工具或行业级别的发布。
一句话点评
Reddit 用户 alecKarfonta 晒了四台机器、11 张显卡的家庭 AI 工作站,其中一台塞了 4 张 3090 Ti,得用两个电源才能带,满载近 2000 瓦,已经稳定跑了一个月。2000 瓦在家用电网里算高负载,普通 15A 电路可能跳闸,得确认线路和散热。正文没披露跑什么任务、散热方案,也没说电费,这点先别太激动——跑推理或微调差别很大。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
01:25
13d ago
r/LocalLLaMA· rssEN01:25 · 05·31
DGX Station GB300 各 OEM 版同框对比图来了
Reddit 用户 Iwaku_Real 发了一张 DGX Station GB300 各 OEM 系统的同框对比图,标注了大致真实尺寸。帖子没列具体供应商名单、配置参数、价格或跑分数据,所以目前只能看个外观和大小对比,没法判断哪家性能更强或更划算。
#Inference-opt#Nvidia#HP#Iwaku_Real
精选理由
只有 H 通过:视觉对比有点击钩子,但帖子缺少 GB300 OEM 厂商名称、规格、定价或基准测试,因此停留在低价值非排除区间。
一句话点评
Reddit 用户发了一张 DGX Station GB300 各 OEM 版的同框对比图,标注了大致真实尺寸。但帖子没列供应商名单、配置、价格或跑分,目前只能看外观和大小,没法判断性能或性价比。短评:图挺直观,但缺参数和价格,只能看个壳子。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
01:14
13d ago
r/LocalLLaMA· rssEN01:14 · 05·31
M1 Max 64GB 跑推理引擎对比:rapid-mlx 速度最快、内存最省
一位用户在 M1 Max 64GB MacBook Pro 上跑了四个推理引擎(rapid-mlx、omlx、mlx-lm、ollama),模型是 Qwen3.5-4B,结果提交到了社区排行榜。他说 rapid-mlx 在速度和内存效率上领先,但正文没披露具体分数,所以这点先别太激动。
#Inference-opt#Benchmarking#Qwen#Claude Code
精选理由
HKR-K 和 HKR-R 通过,因为帖子给出了具体的本地推理配置和 Mac 性能的实际关切。HKR-H 偏弱,缺少具体分数,所以达不到精选。
一句话点评
有人在 M1 Max 64GB 上测了四个推理引擎跑 Qwen3.5-4B,说 rapid-mlx 速度最快、内存最省。但正文被 Reddit 屏蔽了,具体分数没披露,所以这个“领先”先打个折。如果数据属实,对 Apple Silicon 用户选引擎有参考价值,但缺延迟、吞吐量等硬指标,也缺其他模型和硬件的对比。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
2026-05-30 · 星期六2026年5月30日
23:47
13d ago
Product Hunt · AI· rssEN23:47 · 05·30
Typeahead:Mac 全局 AI 自动补全,本地运行、离线可用
Typeahead 是一个 Mac 应用,能在系统里所有输入框里给你做 AI 自动补全——你打字时它会在光标处弹出建议,帮你写得更快。它用的是本地 AI 模型,所以完全离线工作,你的文字不会上传。这点对隐私敏感的用户挺友好。不过正文没披露具体用了什么模型、多大参数量,也没说定价和正式上线日期。目前 Product Hunt 上 270 票、2 条评价,...
#Tools#Typeahead#Product update
精选理由
一个 Product Hunt 级别的小工具发布。HKR-K 通过是因为 Mac 全局 AI 自动补全这个功能点可测试,但 H 和 R 都很弱:正文没披露模型、定价、隐私和离线细节,信息缺口大,先别太激动。
一句话点评
Typeahead 在 Mac 所有输入框里做 AI 自动补全,打字时弹出建议,本地模型离线运行,数据不上传,隐私友好。但正文没披露具体模型、参数量、定价和上线日期,Product Hunt 上 270 票、2 条评价,验证很弱。短评:本地离线补全挺省心,但模型和效果未知,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
22:55
13d ago
r/LocalLLaMA· rssEN22:55 · 05·30
Best Buy 线下清仓:5060 Ti 16GB 卖 300 美元,5070 Ti 16GB 卖 700 美元
Reddit 用户爆料 Best Buy 实体店清仓价:5060 Ti 16GB 只要 300 美元(约 2100 元),5070 Ti 16GB 卖 700 美元(约 4900 元)。16GB 显存对本地跑大模型很实用,这个价格比正常零售便宜不少。不过得去店里碰运气,线上库存还有但价格可能不同,而且正文没披露具体门店和数量,能不能买到看当地情况。
#Inference-opt#Best Buy#Nvidia#Product update
精选理由
H/K/R 三项都过:价格、SKU、店内条件都很具体,显存成本对 LocalLLaMA 用户是硬需求。但来源只有一个 Reddit 帖子,且是店内清仓,时效和地域限制明显,所以落在 40–59 分区间。
一句话点评
Best Buy 实体店清仓,5060 Ti 16GB 只要 300 美元(约 2100 元),5070 Ti 16GB 卖 700 美元(约 4900 元)。16GB 显存对本地跑大模型很实用,这个价格比正常零售便宜不少。不过得去店里碰运气,线上库存还有但价格可能不同,而且正文没披露具体门店和数量,能不能买到看当地情况。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R1
21:05
14d ago
Hacker News 首页· rssEN21:05 · 05·30
Rotary GPU:显存不够也能跑大MoE模型,8GB笔记本实测21 tokens/s
这篇论文没搞新架构,而是解决一个实际问题:大模型训练好之后,能不能在普通硬件上跑起来?作者用一台RTX 4060(8GB显存)的笔记本,跑了一个Qwen3.6-35B-A3B类的MoE模型(混合专家模型,每次只激活一部分参数),生成了2048个token,显存占用约6.3GB,解码速度21 tokens/s。这个速度不算快,但能在8GB卡上跑35B级模...
#Inference-opt#Research release
精选理由
H 和 R 都成立:标题本身就是一个点击钩子,本地跑大 MoE 对应的是显存不够的现实痛点。K 不成立,因为 RSS 正文信息量几乎为零,只有标题、arXiv 链接、评分和评论数,没有方法、显存占用或推理速度等可验证细节,所以这条只能留在 all 里,等更多信息出来再判断。
一句话点评
一篇论文用RTX 4060(8GB显存)笔记本跑35B级MoE模型,生成2048个token,显存占用6.3GB,解码速度21 tokens/s。速度不算快,但能在8GB卡上跑35B模型这点挺省钱。不过这是单作者论文,方法基于作者之前专利,验证规模小,只测了一个模型和一个场景,没披露精度损失或对比基线。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
20:36
14d ago
r/LocalLLaMA· rssEN20:36 · 05·30
M1 Max 笔记本跑 Qwen 3.6 35B MoE,纯本地不插电写代码
Reddit 用户发帖说在 M1 Max 上用 Zoo Code 跑通了 Qwen 3.6 35B MoE 模型,完全本地运行、靠电池供电就能当编程助手。帖子标题很兴奋,但正文被屏蔽了,所以没披露用了什么量化、占多少内存、每秒能吐几个 token、以及电池能撑多久。35B MoE 的激活参数量大概在 10B 左右,M1 Max 有 64GB 统一内存,...
#Code#Inference-opt#Qwen#Zoo Code
精选理由
HKR-H 和 HKR-R 成立,但 HKR-K 不成立:这只是一个 Reddit 用户的个人体验,标题信息量大于正文,没有可复现的指标。归入 all 层级,不上推荐位。
一句话点评
M1 Max 跑 Qwen 3.6 35B MoE 本地编程助手,听起来很香,但正文被屏蔽了,关键信息全缺:用了什么量化、内存占用多少、生成速度多快、电池能撑多久。35B MoE 激活参数约 10B,M1 Max 有 64GB 统一内存,跑得动不意外,但实际体验和续航才是重点。短评:标题很兴奋,但正文被屏蔽,量化、速度、续航全没披露,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
19:14
14d ago
r/LocalLLaMA· rssEN19:14 · 05·30
给AI加长期记忆,什么功能最管用?
Reddit用户dangerous_inference分享了一个叫“瞬态自动记忆”的功能,能让助手在几个月测试中保持连贯对话。正文没披露具体怎么实现、怎么存、怎么检索,也没给评测指标。
#Memory#Reddit#LocalLLaMA#dangerous_inference
精选理由
Reddit 用户 dangerous_inference 在 LocalLLaMA 版发帖问大家自定义记忆系统里哪些功能改进最大,顺便提了一嘴自己的 transient auto-memory 能让助手记住几个月测试内容。正文没披露实现机制、存储结构、检索条件或评测指标,所以知识价值很低。但可靠性这条戳中了自建记忆系统的常见坑——长期记忆容易丢、容易混,所以对正在搭这类系统的开发者有共鸣价值。整体信息密度低,不值得高优先级推送。
一句话点评
Reddit 用户 dangerous_inference 说搞了个“瞬态自动记忆”功能,让助手在几个月测试里保持对话连贯。但正文没披露怎么存、怎么检索、用了什么评测指标,连实现细节都没给。目前只能当个概念听,别急着抄。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H0·K0·R1
19:02
14d ago
Hacker News 首页· rssEN19:02 · 05·30
四大会计师事务所之一的安永,发了一份满是幻觉引用的网络安全报告
GPTZero 调查发现,安永加拿大在 2025 年发布的一份关于会员积分系统网络安全的报告,里面 27 条引用里超过一半是编的,链接打不开,标题对不上真实文章。报告本身也被 AI 检测工具判定有 72% 可能是 AI 写的。GPTZero 说这是“氛围引用”的典型——作者用大模型生成文本和参考文献,但没核实。这事麻烦在于,这类报告会被媒体、博客和 A...
#Ernst & Young#GPTZero#Hacker News#Incident
精选理由
H 和 R 两条通过:安永的网络安全报告被指幻觉,这个企业信任反差够大,从业者会关心大模型在严肃场景下的可靠性。K 不通过:正文只有标题、HN 分数和评论数,没有幻觉样例,也没有核查方法,信息缺口太大,上不了推荐位。
一句话点评
安永加拿大一份2025年网络安全报告被GPTZero查出27条引用里超一半是编的,链接打不开,标题对不上。报告本身也被AI检测工具判定72%可能是AI写的。GPTZero管这叫“氛围引用”——作者用大模型生成文本和参考文献但不核实。麻烦在于这类报告会被媒体和AI搜索当事实引用,污染下游数据。安永没回应。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
18:43
14d ago
r/LocalLLaMA· rssEN18:43 · 05·30
本地个人助手加记忆后体验如何?一个用户试了四种记忆机制
一位Reddit用户用Qwen 3.5/3.6 27B搭了本地自主智能体,加了四种记忆机制:一个叫memory.md的长期笔记文件、每日摘要、自我反思、以及重要事件追踪。正文被屏蔽了,没披露具体效果和延迟数据,但思路是让助手记住用户偏好和长期对话上下文,而不是每次从零开始。对做本地助手的开发者来说,这套记忆分层设计值得参考,但实际体验提升多大、跑起来卡...
#Agent#Memory#Tools#Qwen
精选理由
Reddit 用户分享用 Qwen 3.5/3.6 27B 跑本地自治 Agent,加了四种记忆:memory.md(长期笔记)、日总结(每日压缩)、自反思(自我修正)、重大事件跟踪(关键节点)。方案具体,但正文没披露记忆容量、检索延迟或成功率,属于经验帖而非可复现评测。对做本地 Agent 的人有参考价值,但验证弱,所以分数压在 60–71 区间。
一句话点评
一位Reddit用户用Qwen 3.5/3.6 27B搭了本地自主智能体,加了四种记忆机制:长期笔记文件memory.md、每日摘要、自我反思、重要事件追踪。思路是让助手记住用户偏好和长期对话上下文,而不是每次从零开始。正文被屏蔽,没披露具体效果和延迟数据,但记忆分层设计对做本地助手的开发者有参考价值。实际体验提升多大、跑起来卡不卡,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
18:39
14d ago
● P1FT · 科技· rssEN18:39 · 05·30
SoftBank承诺750亿欧元在法国建设欧洲最大AI设施
软银说要砸750亿欧元在法国建一个欧洲最大的AI设施。不过目前能看到的正文只有FT的403安全验证页面,具体建多大、什么时候建成、跟谁合作、用什么技术方案,这些关键信息全都没披露。这个数字本身挺唬人的,但正文没给任何细节,先别太激动。
#SoftBank#Financial Times#Funding
精选理由
标题信息量不小,但正文被付费墙挡死了,实际内容为零。软银 750 亿欧元的数字很大,说明资本在算力基建上还在加码,法国被选为落脚点也值得关注。不过我会先打个折——没看到具体规划、合作伙伴或落地时间,这些都还是空白,所以重要性给到 82 已经算给面子了,再高就虚了。
一句话点评
750亿欧元是个大饼,目前只是意向,钱还没到账。法国想借机搞AI主权,但正文没披露具体落地时间表和约束条款,先别太激动。
锐评
孙正义这次画了个超级大饼:承诺在法国砸750亿欧元建数据中心,号称欧洲最大AI设施。数字看着吓人,但这是多年累计投资额,不是一次性到账。FT另一篇报道点出了关键——这个项目绑着“AI主权”的旗号,但具体怎么绑、法国政府给了什么优惠、软银自己出多少还是拉基金一起投,正文都没写清楚。 对从业者来说,如果真能落地,意味着欧洲多了一大块算力供给,可能拉低推理和训练成本。但软银过往在WeWork等项目的执行记录,让人不得不打折看待这个承诺。目前连选址、电力供应、芯片来源这些硬指标都没披露,更像是一份政治合作备忘录而非工程计划。 还缺什么:分阶段投资节点、软银自有资金比例、法国政府的补贴或税收优惠细节、以及建成后的算力定价模式。这些信息不出来,750亿就只是个数字。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
18:18
14d ago
r/LocalLLaMA· rssEN18:18 · 05·30
Parallax:用可学习投影替代数值求解,让线性注意力追上FlashAttention
Parallax把之前Local Linear Attention(LLA)里用数值求解器算KV协方差那步,换成了一个类似query的投影层,让模型自己学怎么从KV里提取协方差信息。作者在0.6B和1.7B参数规模上做了预训练验证,困惑度有改善,下游任务也跟着涨。更实际的是,他们写了一个解码推理的kernel,在多种batch size和上下文长度下速...
#Inference-opt#Benchmarking#Research release#Benchmark
精选理由
正文只给了困惑度下降这个结论,没披露具体降了多少、在什么任务上测的,也没说训练成本省了多少。信息量偏少,所以兴趣分不高。
一句话点评
Parallax 把 Local Linear Attention 里用数值求解器算协方差的步骤,换成一个类似 query 的投影层让模型自己学,省掉了求解器开销。0.6B 和 1.7B 模型预训练后困惑度下降,下游任务也涨了。更实用的是他们写的解码 kernel 在多种 batch size 和上下文长度下速度持平甚至超过 FlashAttention 2/3。不过正文没披露 kernel...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
17:49
14d ago
r/LocalLLaMA· rssEN17:49 · 05·30
英伟达把Qwen 35B模型压到4位,显存省3倍,跑分几乎没掉
英伟达放出了一个NVFP4量化版的Qwen3.6-35B-A3B模型,专门给vLLM推理用。量化就是把模型权重从16位压缩到4位,磁盘和显存占用直接降到原来的三分之一左右。关键是跑分没怎么缩水——MMLU Pro、GPQA Diamond、AIME 2025、MMMU PRO这几个基准上跟BF16版本几乎持平。对于想省显存又不想牺牲太多性能的人来说,这...
#Inference-opt#Benchmarking#NVIDIA#Qwen
精选理由
这是一次量化权重发布,不是新模型或能力升级。NVFP4 把 35B 模型压到 4 位,显存和磁盘需求降了约 3 倍,对本地推理用户是实打实的利好。但正文没披露精度损失或实际推理速度对比,这点先别太激动。信息够用但单一,所以分数落在 60–71 区间。
一句话点评
英伟达把Qwen3.6-35B-A3B的权重从16位压到4位,显存和磁盘占用降到原来的三分之一,跑分却几乎没掉——MMLU Pro、GPQA Diamond这些基准跟BF16版持平。对本地部署来说,省显存又不牺牲性能,挺实用。但注意:这是NVFP4格式,目前只支持vLLM推理,其他框架用不了;量化后的实际推理速度、长文本表现和部署稳定性,正文都没披露。另外,跑分持平不代表所有场景都无损,尤其...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:37
14d ago
r/LocalLLaMA· rssEN16:37 · 05·30
DGX Spark 和 4 张 3090 比微调,哪个更划算?
一个学生用户纠结买 DGX Spark 还是组 4 张 RTX 3090 来微调大模型。帖子没透露速度、显存或功耗数据,只说了研究方向是机械可解释性,预算有限,担心家里电费扛不住,也怕 3090 太老容易坏。所以目前没法直接比性能,只能看出 Spark 省电省心但贵,4x 3090 便宜但电老虎且硬件风险高。
#Fine-tuning#Interpretability#NVIDIA#kidfromtheast
精选理由
HKR-H 和 HKR-R 勉强过关,但 HKR-K 不达标。这是一条 Reddit 咨询帖,没有跑分、定价或功耗数据,属于低价值讨论。
一句话点评
一个学生纠结买DGX Spark还是组4张3090微调模型,但帖子没给速度、显存或功耗数据,只说了研究方向是机械可解释性、预算有限、怕电费高、怕3090太老坏掉。所以没法直接比性能,只能看出Spark省电省心但贵,4x3090便宜但电老虎且硬件风险高。短评:没数据,只能比电费和赌人品。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
16:30
14d ago
● P1TechCrunch AI· rssEN16:30 · 05·30
GitHub Copilot 改为按 token 计费模式
GitHub Copilot 要改成按 token 计费,开发者普遍不满。TechCrunch 报道只引了一句评论,没披露具体价格、用量额度或生效日期,所以目前只能确认收费模式变了,但到底贵多少、怎么算还不清楚。
#Code#GitHub#Microsoft#TechCrunch
精选理由
H 和 R 通过:Copilot 改计费直接影响开发者成本,且已有明显反弹。K 不通过:RSS 正文只有一句评论,缺价格、额度和时间,不值得上头条。
一句话点评
Copilot 从按人头收费改成按 token 用量收费,开发者直接炸了。
锐评
GitHub Copilot 把计费模式从固定月费改成按 token 消耗算钱,开发者社区反应激烈,标题直接用了“开玩笑吧”。这事的核心矛盾在于:写代码时模型自动补全产生的 token 量很难预估,用户怕账单失控。目前两篇报道都只给了标题和情绪,正文没披露具体单价、免费额度或 token 计算规则,也没看到 GitHub 官方的完整解释。我会先打个折——如果单价定得低、有硬上限,可能实际支出变化不大;但如果按对话模型那种按量计费直接套到代码补全上,高频用户的成本会明显上涨。还缺三个关键信息:每千 token 的价格、是否保留免费层、以及 IDE 内补全和聊天分别怎么算 token。这些没出来之前,开发者骂得有理,但结论别下太早。
HKR 分解
hook knowledge resonance
打开信源
85
SCORE
H1·K0·R1
16:12
14d ago
r/LocalLLaMA· rssEN16:12 · 05·30
为什么思考过程吐的 token 比最终回答还多?
Reddit 用户 iMakeSense 想用本地大模型给 1000 条数据打标签,结果模型只返回了约 100 条。问题出在思考痕迹(thinking trace)里把输入 token 和大量推理文本都输出了,导致 token 消耗远超预期。帖子没透露具体用的哪个模型,也没解释为什么最终输出会少那么多——可能是思考过程截断了,也可能是模型没按要求执行。
#Reasoning#Embedding#Reddit#LocalLLaMA
精选理由
H和R成立:思考输出比回答长是本地模型用户的真实痛点,反直觉且能引发共鸣。K不成立:帖子没披露模型名、token数、设置参数,信息缺口太大,没法验证或复现,所以留在all层级。
一句话点评
用本地模型给1000条数据打标签,结果只返回了约100条,token却烧掉一大半——因为思考痕迹把输入和推理过程全输出了。帖子没说是哪个模型,也没解释为什么输出少那么多,可能是思考截断或指令没执行。如果模型把推理过程当最终输出,那token预算得翻几倍,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
15:59
14d ago
TechCrunch AI· rssEN15:59 · 05·30
Meta 被曝正在做 AI 挂坠
TechCrunch 援引消息称 Meta 在开发一款 AI 挂坠,但正文只说了公司在大手笔押注 AI 硬件,没披露规格、价格、发布时间、传感器、模型或交互方式。目前信息缺口很大,没法判断它跟 Rabbit R1、Humane AI Pin 有什么实质区别。
#Meta#Product update
精选理由
H 和 R 过关,因为 Meta 的 AI 吊坠是个有画面感的硬件传闻,能吸引点击和讨论。K 不过关:没参数、没价格、没发布时间、没交互方式,信息缺口太大。当一条薄传闻处理,不值得上推荐位。
一句话点评
Meta 被曝在搞 AI 挂坠,但正文只说了“公司在押注 AI 硬件”,规格、价格、发布时间、传感器、模型、交互方式全没提。目前信息缺口太大,没法判断它跟 Rabbit R1、Humane AI Pin 有什么实质区别。 短评:消息源只说了Meta在做AI挂坠,其他一概没披露,先别激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
15:30
14d ago
● P1TechCrunch AI· rssEN15:30 · 05·30
谷歌推出Gemini Spark 24/7 AI助手产品
TechCrunch 的编辑实测了谷歌新推出的 Gemini Spark,把它当成一个全天候 AI 助手来用,主要干了整理邮件摘要和规划本地活动这两件事。体验下来觉得确实能帮上忙,但文章没搞懂谷歌为什么要把这个功能单独做成一个产品,而不是直接塞进现有的 Gemini 里。正文没披露这东西什么时候正式上线、要不要另外收费。
#Agent#Tools#Google#TechCrunch
精选理由
我会先打个折:正文没披露价格和发布时间,所以不能当产品发布看。但亮点在于,这是一篇上手实测,不是通稿。编辑用“actually pretty useful”收尾,说明 Gemini Spark 在收件箱摘要和本地活动规划这两个场景里跑通了,没翻车。对做 agent 的人来说,这种“替你干活”的体感比跑分重要。信息缺口明显,但反转叙事和具体场景撑住了 featured 的分数。
一句话点评
谷歌把 Gemini 做成了一个 24 小时在线的 AI 助手 Spark,实测体验两极分化:有用,但也让人后背发凉。
锐评
谷歌发布的 Gemini Spark 是一个常驻后台的 AI 助手,主打 24/7 全天候待命。从几家媒体的实测标题看,评价非常分裂。TechCrunch 觉得它“实际上挺有用”,但 The Verge 的编辑直接说这是“最令人印象深刻也最可怕的 AI 体验”。这种恐惧感可能源于它持续在线的特性,让人感觉被时刻注视。 目前 TechCrunch 的正文是空的,我们看不到具体的使用场景和性能数据,比如它到底能自动完成哪些任务、响应延迟多高、会不会频繁出错。The Verge 的另一篇标题提到“AI 变得越好,越暴露一个空洞的承诺”,暗示 Spark 虽然能力变强,但可能没解决根本的信任或价值问题。 这条新闻值得关注,但先别急着下结论。我们需要等详细的评测出来,看它到底是真能帮人省时间的工具,还是一个让人更焦虑的监控器。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
15:09
14d ago
AI HOT 精选· aihot-apiZH15:09 · 05·30
OpenAI 送开源维护者半年 Pro,价值 1200 美元,有项目链接就能领
OpenAI 给开源项目维护者发福利:免费领 6 个月 ChatGPT Pro(价值 1200 美元),申请没有硬性 GitHub Star 数要求,只要有项目链接就行。正文还聊了 AI 工具分类:一类是“agent 型”(比如 Claude Code、Codex),能自己跑;另一类是“实习生型”(比如 Cursor),需要人做决策、培养判断力,但缺点...
#Agent#Code#Tools#OpenAI
精选理由
H/K/R都过:1200美元和6个月是明确钩子,申请条件具体(无Star门槛、有项目链接即可)。但只是社区小福利,不是ChatGPT能力或平台更新,所以落在60–71的all档。
一句话点评
OpenAI 给开源项目维护者送 6 个月 ChatGPT Pro(价值 1200 美元),申请不卡 GitHub Star 数,有项目链接就行。正文还聊了 AI 工具分类:一类是“agent 型”(如 Claude Code、Codex),能自己跑;另一类是“实习生型”(如 Cursor),需要人做决策、培养判断力,但缺点是需要人在场。作者推荐了网易 UU 远程工具,称免费两年、4K 14...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:49
14d ago
TechCrunch AI· rssEN14:49 · 05·30
三位顶级VC吐槽AI投资:19岁创始人已经拿A轮了
一位VC半开玩笑地说,如果你22岁在旧金山做AI,邮箱里可能已经躺着一份种子轮投资意向书;如果你才19岁,那说明你真的很厉害,可能已经拿到A轮了。正文没披露另外两位VC的具体观点,但光这一句就够说明AI投资有多疯狂——年龄越小、估值越高,市场已经卷到看创始人身份证了。
#TechCrunch#Funding#Commentary
精选理由
HKR三项都靠“22岁种子轮/19岁A轮”这个细节和VC狂热角度撑住了,但RSS摘要没披露是哪三位VC、具体访谈内容、以及任何交易案例,信息缺口明显,所以分数卡在60–71之间。
一句话点评
一位VC半开玩笑说,22岁在旧金山做AI,邮箱里可能已躺着一份种子轮投资意向书;19岁的话,可能已经拿到A轮了。年龄越小、估值越高,市场已经卷到看创始人身份证了。正文只披露了这一位VC的引语,另外两位的观点没写,信息缺口明显。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:51
14d ago
r/LocalLLaMA· rssEN13:51 · 05·30
本地跑语音对话:STT→大模型→TTS 三模型串联
Reddit 用户用 Ubuntu + RTX 3090 跑 Qwen 3.6 27B Q4(llama.cpp),想把语音识别、大模型、语音合成串成一条流水线。正文没披露具体用哪款 STT 和 TTS 模型,所以实际延迟和效果未知。三模型串联意味着显存和推理时间都会叠加,3090 的 24GB 显存跑 27B Q4 已经占了大半,再加两个模型可能得用...
#Audio#Agent#Tools#Qwen
精选理由
HKR-R 勉强成立:本地 STT-LLM-TTS 管线怎么串是实际开发者的常见卡点。HKR-H 和 HKR-K 都不成立,因为这是个求助帖,不是实测方案或发布,所以只算低权重的社区信号。
一句话点评
RTX 3090 用户想把语音识别、大模型、语音合成串成一条流水线,但正文没披露具体用哪款 STT 和 TTS 模型,所以实际延迟和效果未知。三模型串联意味着显存和推理时间都会叠加,3090 的 24GB 显存跑 Qwen 3.6 27B Q4 已经占了大半,再加两个模型可能得用更小的量化或轻量模型。这点先别太激动,除非他愿意牺牲质量换速度。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
13:36
14d ago
r/LocalLLaMA· rssEN13:36 · 05·30
llama-swap 处理并发请求时卡住,第二个请求得等第一个跑完
有用户在 Reddit 反馈,用 llama-swap 跑 Qwen3.6-35B-A3B 模型时,直接连 llama-server 能同时处理 2 个请求,但经过 llama-swap 转发后第二个请求就得排队等第一个结束。配置里 concurrencyLimit 默认是 10,按理说够用,但实际没生效。正文没披露 llama-swap 版本和具体日...
#Inference-opt#Tools#Qwen#llama-swap
精选理由
Reddit 用户发现 llama-swap 转发请求时会串行排队,即使后端 llama-server 本身能并行处理 2 个请求。配置里 concurrencyLimit 默认是 10,但实际效果是第二个请求得等第一个跑完。这点先别太激动——帖子只是报了个现象,没给原因也没给修法。对跑本地模型的团队来说,吞吐上不去是实打实的痛点,所以 R 通过,但 H 和 K 不通过,归入低带宽 all。
一句话点评
llama-swap 转发后并发失效,concurrencyLimit 设了 10 但实际只跑单线程。用户直连 llama-server 能同时处理 2 个请求,过一层代理反而排队。正文没披露 llama-swap 版本和具体配置,可能是旧版 bug 或参数没生效。如果只是转发层卡住,那这个工具在高并发场景下暂时不靠谱。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
13:33
14d ago
r/LocalLLaMA· rssEN13:33 · 05·30
RTX 5090 跑 Qwen3.5-4B 只有 250 TPS,GPU 利用率才一半
Reddit 用户用 RTX 5090 跑 Qwen3.5-4B,llama.cpp 跑在 Docker 里,解码速度只有 200–250 TPS,GPU 利用率才 50% 左右。设置已经用了 Q4_K_S 量化、32K 上下文、batch size 4096 和 flash attention,但速度还是上不去。这个 TPS 对于 4B 小模型来说偏...
#Inference-opt#Reddit#Qwen#llama.cpp
精选理由
这是一个 Reddit 用户的单点故障排查帖,有具体数字和配置,对本地推理从业者有用,但正文没披露根因、修复方案或对比基准,信息缺口明显,所以归入 40-59 低价值区间。
一句话点评
RTX 5090跑4B小模型只有200-250 TPS,GPU利用率才50%,明显没喂饱。问题可能出在Docker on Windows的虚拟化开销,或者llama.cpp的调度没跟上新架构。正文没披露CPU内存带宽和电源设置,这两点常是瓶颈。如果是纯推理瓶颈,这速度对4B模型算偏低,但如果是交互场景(比如聊天)其实够用。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K1·R1
12:31
14d ago
r/LocalLLaMA· rssEN12:31 · 05·30
两张 4060 Ti 跑 Qwen3.6,125 tok/s,硬件不到 1000 美元
Reddit 用户 Chuyito 实测,两张 4060 Ti(共 32GB 显存)跑 Qwen3.6 的 q4xl 量化版,达到 125 tok/s,整机硬件成本不到 1000 美元,功耗约 300W。这个速度对本地部署来说相当快,成本也低。他还问 CUDA 13.3 能不能把同一套配置推到 150 tok/s,但正文没披露可复现的 benchmar...
#Inference-opt#Qwen#NVIDIA#Chuyito
精选理由
单条 Reddit 帖子,来源弱,没贴脚本、token 设置、温度等细节,也没有其他用户复现验证,所以分数压在 60–71 区间。不过 125 tok/s 这个数字本身对本地推理玩家有吸引力,硬件配置也具体,HKR 三项都够格。
一句话点评
两张 4060 Ti 跑 Qwen3.6 量化版到 125 tok/s,整机不到 1000 美元,本地部署性价比很高。但这是单次用户自测,没公开复现设置,速度可能受 prompt 长度、批大小影响。CUDA 13.3 能否推到 150 tok/s 只是猜测,别太当真。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
11:04
14d ago
AI HOT 精选· aihot-apiZH11:04 · 05·30
阶跃星辰发了个开源多模态模型,但正文只说了四个字
阶跃星辰在 X 上发帖称发布了一款开源多模态模型,配文只有“小即是美”。正文没披露模型名称、参数量、权重许可证、发布物或基准测试结果,信息缺口很大,目前无法判断模型大小、能力或开源诚意。
#Multimodal#StepFun#Open source#Product update
精选理由
HKR三项全挂:帖子只有一句口号和发布类别,没有模型名称、参数量、许可证或基准。按0/3规则,直接排除,分数上限40。
一句话点评
阶跃星辰发帖说开源了一个多模态模型,配文只有“小即是美”。但正文没披露模型名称、参数量、权重许可证、发布物或基准测试结果,信息缺口很大,目前无法判断模型大小、能力或开源诚意。短评:标题党,信息太少,先别激动。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
10:30
14d ago
Hacker News 首页· rssEN10:30 · 05·30
教皇利奥一世首道通谕炮轰“技术救世主义”
《经济学人》报道,教皇利奥一世发布上任后首道通谕,核心是批评“技术救世主义”——即把AI等技术当成解决一切问题的万能药。正文没披露通谕具体引用了哪些技术或案例,也没给出教廷的替代立场。目前这条消息在Hacker News上只有12个点赞和3条评论,讨论热度不高。
#Leo#The Economist#Hacker News#Commentary
精选理由
标题有钩子,但正文信息量几乎为零:没有通谕原文、没有具体论点、没有发布日期。HN 12 分和 3 条评论说明社区兴趣极低。对 AI 从业者来说,这条链接的价值约等于一条新闻标题,不值得跟进。
一句话点评
教皇Leo一世发通谕批“技术救世主义”,说别把AI当万能药。消息源只有《经济学人》一篇报道,正文没披露通谕具体引用了哪些技术或案例,也没给教廷的替代立场。目前HN上仅12赞3评论,讨论热度很低,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
10:23
14d ago
r/LocalLLaMA· rssEN10:23 · 05·30
Fulloch V2:16GB显存跑全本地语音助手,能控制智能家居和记笔记
Fulloch V2 是一个完全本地的语音助手项目,16GB 显存就能跑。它用 Qwen3.5-9B 做对话模型(量化到 Q5_K_M 省显存),Qwen3-1.7B 做语音识别和语音合成,外加 bge 向量模型做语音语义搜索。功能上能控制 Home Assistant 智能家居,也能读写 Obsidian 笔记。支持语音打断、自定义唤醒词,Linux...
#Agent#Audio#Embedding#Fulloch
精选理由
这是个 Reddit 级别的项目更新,受众是 LocalLLaMA 那批人。模型、VRAM、集成方式都写清楚了,但没看到第三方验证或跑分,所以分数卡在 60–71 的高位。正文没披露延迟数据或唤醒词训练成本,这点先别太激动。
一句话点评
16GB显存就能跑全本地语音助手,控制智能家居和记笔记,挺实用。但正文被墙,没看到延迟和打断成功率,这两点对体验很关键。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
10:17
14d ago
彭博科技· rssEN10:17 · 05·30
Anthropic 把禁止接入的平台名单砍了一半,因为被骂了
Anthropic 把禁止第三方平台调用其模型的名单砍了一半,原因是遭到了反对。但正文只返回了 Bloomberg 的机器人验证页面,没有披露名单具体包含哪些平台、反对来自谁、以及执行条件。信息缺口:名单范围、反对来源、受影响平台、执行条件均未公开。
#Anthropic#Bloomberg#Policy
精选理由
标题有钩子——Anthropic 被反弹后把未授权平台名单砍了一半,冲突和让步都有了。但正文只有 Bloomberg 的 403 机器人验证页,名单范围、反弹来源、执行条件全没披露。信息缺口太大,只能给 68 分。如果后续补上具体平台和规则,分数能往上走。
一句话点评
Anthropic 把禁止第三方平台调用其模型的名单砍了一半,原因是遭到了反对。但正文被 Bloomberg 的机器人验证页挡住了,没披露名单具体包含哪些平台、反对来自谁、以及执行条件。信息缺口:名单范围、反对来源、受影响平台、执行条件均未公开。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
09:56
14d ago
r/LocalLLaMA· rssEN09:56 · 05·30
Pantheon-Reasoning-27B:一个能边推理边角色扮演的模型,基于Qwen 3.6,无审查
Gryphe 放出了 Pantheon-Reasoning-27B,一个基于 Qwen 3.6 的 27B 稠密模型,主打推理型角色扮演,且无审查。训练数据里约 28% 是自家 Pantheon 数据,21% 是 Opus-4.6-Reasoning-24k(用大模型生成的推理样本),16% 是 WorldSim(世界模拟),16% 是文字冒险,16%...
#Reasoning#Fine-tuning#Code#Gryphe
精选理由
这是一个在 Reddit/Hugging Face 上发布的单一微调模型,影响力在 LocalLLaMA 社区级别。数据配比和保留多轮 thinking tags 提供了额外信号,但不足以提升到 featured 级别。
一句话点评
Gryphe 基于 Qwen 3.6 微调的 27B 稠密模型,主打推理型角色扮演,无审查。训练数据里 28% 自家 Pantheon 数据、21% 大模型生成的推理样本,其余是文字冒险和通用角色扮演。多轮对话保留思考标签,适合需要角色持续推理的场景。但正文没披露具体评测分数,角色扮演的“推理”效果和普通 RP 模型差多少还不清楚。27B 参数在消费级显卡上能跑,但推理速度会慢。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
09:40
14d ago
r/LocalLLaMA· rssEN09:40 · 05·30
用嘴哼一声就能生成音效,这个开源项目把拟声变成声音
VTS 让你输入一段人声模仿(比如“嗖——”)再加一段文字描述,就能生成对应的音效文件。项目已开源,GitHub 上有代码和 demo,但正文没披露模型参数量、用了多少训练数据、以及生成质量怎么评估。如果效果靠谱,做游戏或短视频的人可以省掉翻音效库的时间。
#Audio#Multimodal#GitHub#Danny-1257
精选理由
H 和 K 通过,因为人声转音效的交互方式少见且有可测试的 GitHub 仓库。R 偏弱,缺少模型规模、数据和评测指标,只能算一个小众开源工具。
一句话点评
VTS 让你对着麦克风“嗖——”一声,再加句文字描述,就能生成音效文件。做游戏或短视频的人可以省掉翻音效库的时间。但正文没披露模型参数量、训练数据规模,也没给生成质量评估。如果效果靠谱,这算一条低成本音效生成路径,但验证还不够。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
09:03
14d ago
r/LocalLLaMA· rssEN09:03 · 05·30
Vidai Community 发布:一个 Rust 二进制文件搞定 LLM 调用的成本归属、护栏和多供应商路由
Vidai Community 发布了一个 25 MB 的 Rust 二进制文件,能在每次 LLM 调用时做成本归属、预算截断、护栏检查和多供应商路由。官方测试单节点吞吐量 21,803 RPS,中位额外延迟仅 1.95 毫秒——延迟很低,适合生产环境。不过正文没披露具体支持哪些供应商、护栏规则怎么配置,也没说预算截断是硬限制还是软提醒。
#Tools#Safety#Inference-opt#Vidai
精选理由
Vidai Community 发布了一个 25 MB 的 Rust 二进制,放在每次 LLM 调用路径里做成本归因、预算截断、护栏和多提供商路由。单节点验证 21,803 RPS,中位开销 1.95 ms,性能数字很漂亮,说明开销极低、吞吐够高。但正文没披露它跟已有方案(比如 LangSmith、Helicone)的具体对比,也没说护栏规则怎么写、路由策略怎么配,实际落地门槛未知。项目本身不算主流,来源权威性一般,所以分数压在 60–71 的产品更新区间。
一句话点评
Vidai 把成本归属、护栏检查、多供应商路由打包成一个 25 MB 的 Rust 二进制,单节点吞吐 21,803 RPS,额外延迟中位数仅 1.95 毫秒——这个延迟几乎不影响生产调用。但正文没披露支持哪些供应商、护栏规则怎么配,也没说预算截断是硬限制还是软提醒。如果配置灵活,这算一个轻量级网关方案。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
08:32
14d ago
Hacker News 首页· rssEN08:32 · 05·30
Rsync 3.4.3 翻车:36 个提交全是 Claude 写的,增量备份直接挂了
用户升级 rsync 3.4.3 后,依赖 --compare-dest 参数的增量备份全部失效,降回 3.4.1 就正常。去 GitHub 翻源码发现,3.4.1 之后 36 个提交的署名都是“tridge and claude”,changelog 里却只字未提 AI 参与。目前已知一个 GitHub issue(#915)在讨论,但正文没披露具体...
#Code#Rsync#Claude#Commentary
精选理由
H 和 R 过关:Rsync 加 Claude 的组合有话题性,也戳中开源社区对 AI 代码的信任焦虑。K 不过关:正文没给提交证据、审查细节和版本范围,所以只能放在较低的 all 档。
一句话点评
Rsync 3.4.3 的 36 个提交署名都是“tridge and claude”,changelog 只字不提 AI 参与。用户升级后增量备份直接挂掉,降回 3.4.1 就正常。目前只有一个 GitHub issue(#915)在讨论,正文没披露这些提交是否经过人工 review、改动范围多大。如果是真的,等于一个核心系统工具在用户不知情的情况下被 AI 批量改代码,且没做回归测试。这...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
07:36
14d ago
r/LocalLLaMA· rssEN07:36 · 05·30
Shadow AI:一个纯本地的 Windows 语音助手,自带记忆和提醒,但得自己掏 Gemini 的 API 钱
一个叫 Shadow AI 的开源项目,让你在 Windows 上跟 AI 语音聊天,支持多语言、连续对话,还能联网搜索(用的 SearXNG)、记事情、设提醒,甚至能连 Google 日历。所有东西都跑在你自己的电脑上(127.0.0.1),数据不出门。但注意,它不包模型费用——你得自己搞一个 Gemini API key 塞进去,相当于你买了个车但...
#Audio#Tools#Memory#Shadow AI
精选理由
H/K/R 都过了:开源 Windows 语音助手有明确的“可试”钩子和具体机制。分数留在 60–71 是因为它只是一个 Reddit 上的个人项目,没有采用数据、性能测试或安全验证。
一句话点评
Shadow AI 是个 Windows 本地语音助手,开源,但模型得自己带——插个 Gemini API key 才能用。支持多语言连续对话、联网搜索、记提醒、连 Google 日历,全跑在本地 127.0.0.1,数据不出门。好处是隐私可控,坏处是 Gemini 按量收费,长期用成本不低。正文没披露延迟和语音识别精度,这点先别太激动。如果是轻度尝鲜或隐私敏感场景,值得一试。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
07:11
14d ago
r/LocalLLaMA· rssEN07:11 · 05·30
两台电脑(5090+4080)能联网一起跑本地大模型吗?
Reddit 用户有两台 PC,一台 RTX 5090 + 64GB DDR5,另一台 RTX 4080 + 192GB DDR5,想通过局域网把两张显卡合起来跑本地大模型。他问有没有像 LM Studio 那样一键就能用的工具,如果没有,为什么没人做。正文没披露具体推理框架、网络配置或实测延迟,所以没法判断实际效率。目前主流方案是 vLLM 或 ll...
#Inference-opt#Tools#LM Studio#JanAI
精选理由
HKR-H 和 HKR-R 成立:5090+4080 跨机联网推理是本地推理的真实痛点,能引发共鸣。HKR-K 不成立:正文没有披露任何推理框架、基准测试、延迟或可复现方案,信息量不足,无法作为可靠参考。
一句话点评
两台PC(5090+4080)想合起来跑本地大模型,但没找到一键工具。目前主流方案是vLLM或llama.cpp做分布式推理,但网络延迟会吃掉不少性能,尤其跨机传输中间层数据比单卡慢很多。正文没披露网络配置和实测延迟,所以没法判断实际效率。用户想要LM Studio那种开箱即用体验,但分布式推理的调试门槛高、收益不确定,确实没人愿意做成傻瓜产品。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
06:51
14d ago
AI 群聊日报· atomZH06:51 · 05·30
群聊日报汇总Dynamic Workflow测试和Opus反馈
群友实测 Dynamic Workflow,十分钟跑完但只做了最简单的部分,token 消耗大,结论是“吸收思想,不是无脑用”。Opus 4.8 解决了 4.7 搞不定的逆向任务,但会为 trivial 选择停下来反问,骂一顿就好。AI 短剧分析指出制作成本降到 30 万以下,但利润全被渠道抽走,创作者没有议价能力。
#Agent#Code#Tools#Oh My OpenCode
精选理由
低价值汇总,没到硬排除线:HKR-K 靠“十几次实测”勉强过线,HKR-H 和 HKR-R 被日报格式和缺失配置拖累,落在 40–59 的高位。
一句话点评
群友实测 Dynamic Workflow:十分钟跑完但只做了最简单的部分,token 消耗大,结论是“吸收思想,不是无脑用”。Opus 4.8 解决了 4.7 搞不定的逆向任务,但会为 trivial 选择停下来反问,骂一顿就好。AI 短剧分析指出制作成本降到 30 万以下,但利润全被渠道抽走,创作者没有议价能力。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R0
04:56
14d ago
r/LocalLLaMA· rssEN04:56 · 05·30
MOSS TTS 1.5 语音克隆效果不错,有人觉得比 Fish Audio 好用
Reddit 用户分享了 OpenMOSS-Team 的 MOSS-TTS-v1.5 在线演示,说语音克隆质量很好,自己更喜欢它而不是 Fish Audio S2 Pro,原因是 Fish Audio 不让商用。正文没披露训练数据量、克隆所需音频时长或延迟数据,所以没法判断实际门槛和成本。
#Audio#OpenMOSS-Team#Fish Audio#Long Cat DiT
精选理由
HKR 三项刚好过线,但证据仅来自一条 Reddit 用户的主观体验,没有基准测试、许可证原文或模型卡细节。这符合 60–71 分区间:一个小众社区的工具发现,值得关注但信息有限。
一句话点评
OpenMOSS 刚放出的 MOSS-TTS-v1.5 语音克隆效果不错,Reddit 用户说比 Fish Audio S2 Pro 还好听,而且后者不让商用。但正文没披露克隆需要几秒音频、延迟多少、训练数据量多大,所以实际门槛和成本未知。如果是零样本克隆且延迟低,那确实值得关注。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
03:07
14d ago
Hacker News 首页· rssEN03:07 · 05·30
VT Code:一个开源的终端编程助手,用 Rust 写的
VT Code 是一个开源的终端编程助手,用 Rust 写的,主打 LLM 原生代码理解和 shell 安全。支持多个模型供应商,能自动切换,上下文管理也做了优化。不过项目页没提具体支持哪些模型、工具权限怎么设、安装步骤也没有,想试的话得自己去翻代码。
#Agent#Code#Tools#GitHub
精选理由
一个很小的开源编程 Agent 发布:HKR-H 和 HKR-R 过关,但 HKR-K 不通过,因为正文缺少模型、权限、安装和评测细节。HN 上只有 7 分和 4 条评论,属于普通产品更新的低端。
一句话点评
VT Code 是一个用 Rust 写的开源终端编程助手,主打 LLM 原生代码理解和 shell 安全。支持多模型供应商和自动切换,上下文管理也做了优化。但项目页没提具体支持哪些模型、工具权限怎么设、安装步骤也没有,想试得自己翻代码。短评:Rust 写的终端编程助手,主打 shell 安全,但模型列表和安装步骤都没给。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
02:08
14d ago
r/LocalLLaMA· rssEN02:08 · 05·30
八家厂商的 DGX Spark 克隆机对比图来了
Reddit 用户 rexyuan 把 NVIDIA DGX Spark 和戴尔、惠普、联想、微星、技嘉、宏碁、华硕的同类小主机放在一张表里比尺寸和重量。图里没写芯片型号、价格和上市时间,所以目前只能看谁更小更轻,没法比性能。
#Inference-opt#NVIDIA#Dell#HP
精选理由
信息量就一张表格加几张图,除了尺寸重量没别的硬参数。没有芯片、价格、供货或性能数据,只能当个硬件八卦看看,不值得当新闻推。
一句话点评
Reddit 用户把 8 家厂商的 DGX Spark 克隆小主机摆在一起比尺寸和重量,图里没写芯片、价格和上市时间。目前只能看谁更小更轻,没法比性能。短评:尺寸对比图,性能未知。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K1·R0
01:57
14d ago
Latent Space· rssEN01:57 · 05·30
Claude 4.8 小步更新,多轮 RL 训练有个隐蔽 bug,开源模型追上闭源只差四个月
Latent Space 这期 AI 新闻覆盖了 5 月 28-29 日的内容。Claude Opus 4.8 上线后评测反馈不一:多个独立测试认为提升“有但不大”,比如 CursorBench 显示效率更高但效果略差于 4.7,文档解析在表格/布局上有小进步但内容忠实度反而退步。好消息是 4.8 在编程时没那么“过度自主”,更愿意配合人。Anthro...
#Agent#Code#Benchmarking#Latent Space
精选理由
HKR-K 通过,因为汇总明确交代了来源范围和覆盖板块。HKR-H 和 HKR-R 不通过:没有单一新闻事件、可验证的论断或足够强的从业者痛点来支撑精选。
一句话点评
Claude Opus 4.8 上线后评测分化:多个独立测试认为提升“有但不大”,比如 CursorBench 显示效率更高但效果略差于 4.7,文档解析在表格/布局上有小进步但内容忠实度反而退步。好消息是 4.8 在编程时没那么“过度自主”,更愿意配合人。Anthropic 还支持了对话中途改系统指令且不破坏缓存,对长会话省钱有用。但价格仍是硬伤——有开发者因为 API 太贵而倾向 GPT...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
00:44
14d ago
r/LocalLLaMA· rssEN00:44 · 05·30
跑本地大模型选显卡,带宽不是唯一指标
Reddit 用户 Ok_Top9254 对比了本地跑大模型常用的 GPU 和整机规格,核心观点是内存带宽不能只看峰值。他举例说,两张 P100 显卡(二手约 200 美元)加起来有 32GB 显存和 700GB/s 带宽,但实际跑模型时,预填充(prefill)阶段的性能在常见的 1000 token 生成测试里被低估了。正文没披露具体测试数据和对比...
#Inference-opt#Multimodal#Benchmarking#Reddit
精选理由
这是一条Reddit用户做的GPU规格对比帖,核心信息是双P100二手卡只要200美元左右就能拿到32GB显存和700GB/s带宽,对预算有限的本地LLM玩家来说是个很实在的参考。帖子没有跑分或实测,只是列规格表加个人判断,所以分数压在60-71区间合理。正文没披露具体跑模型的速度或能跑多大参数量的模型,这点先别太激动,但成本数字确实挺省钱。
一句话点评
Reddit 用户实测对比本地跑大模型的 GPU 规格,核心观点:别只看峰值带宽。两张二手 P100(约 200 美元)凑出 32GB 显存和 700GB/s 带宽,但预填充阶段性能在常见 1000 token 测试里被低估。正文没披露具体测试数据和对比型号,结论需谨慎参考。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
00:36
14d ago
AI HOT 精选· aihot-apiZH00:36 · 05·30
阿里云和Qwen拿下欧足联六年合同,给足球比赛当AI后台
阿里云和Qwen成了欧足联(UEFA)的独家AI、云计算和电商合作伙伴,从2027/28赛季一直签到2032/33赛季,还覆盖2028年欧洲杯。合作内容是用Qwen大模型和阿里云基础设施来搞赛事运营、球迷互动、媒体内容和沉浸式观赛。蔡崇信说会投入全栈AI和电商能力。合同期六年,说明阿里云在体育行业拿了个长期大单,但正文没披露具体金额和落地场景细节,比如...
#Multimodal#Tools#Alibaba Cloud#Qwen
精选理由
正文只确认了阿里云和Qwen成为欧足联多年独家AI、云计算与电商合作伙伴,覆盖2027/2028至2032/2033赛季及EURO 2028,但未披露任何AI能力、部署方式或可验证的落地效果,属于纯营销公告,因此重要性上限为39。
一句话点评
阿里云签下欧足联六年长约,从2027/28赛季到2032/33赛季,覆盖2028年欧洲杯。合作内容是用Qwen大模型和阿里云基础设施搞赛事运营、球迷互动和沉浸式观赛。这是阿里云在体育行业拿下的长期大单,但正文没披露具体金额和落地场景细节,比如Qwen具体用在哪个环节、球迷互动怎么做。合同期长说明双方信任度高,但没金额就不好判断投入规模。短评:阿里云拿下欧足联六年AI大单,但没披露金额和具体落...
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K1·R0
00:00
14d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·30
LLM 推理到底怎么跑:跟着 SGLang Omni 团队走一遍设计决策
SGLang Omni 团队公开了一篇罕见的内部设计文档,把顶级推理系统团队从问题定义到架构选择的完整决策链路摊开了。文章先讲标准 LLM 推理的基础:自回归 decode、prefill 和 decode 的区别(prefill 是 compute-bound,瓶颈在算力;decode 是 memory-bound,瓶颈在显存带宽)、continuo...
#Inference-opt#SGLang Omni#Commentary
精选理由
SGLang Omni 团队这篇讲解有技术干货:3个多阶段解码挑战和架构取舍。但正文没有披露性能数字或可复现的测试结果,HKR-K和R过关,H偏弱。评分68,属于教程类文章的正常区间。
一句话点评
SGLang Omni 团队公开了内部设计文档,把推理系统从问题定义到架构选择的决策链路全摊开了。文章从标准 LLM 推理讲起,解释 prefill 和 decode 的区别、KV cache 和调度器的作用,然后重点分析语音输出带来的新挑战:Thinker 和 Talker 是两条独立的 decode loop,节奏和计算特性完全不同,不能塞进同一个调度循环。对非系统背景的读者友好,每个判...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
2026-05-29 · 星期五2026年5月29日
23:58
14d ago
AI HOT 精选· aihot-apiZH23:58 · 05·29
ComfyUI 现在能直接调 OpenRouter 的 20 多个模型了
ComfyUI 新版本接入了 OpenRouter,你可以在同一个工作流里直接选 20 多个模型,不用再单独配置每个模型的 API。对做图生图、视频生成这类需要反复试模型的人来说,省了来回切换的麻烦。不过正文没提具体支持了哪些模型、有没有请求次数限制,也没说 ComfyUI 版本号,想用的话得自己去试。
#Tools#ComfyUI#OpenRouter#Product update
精选理由
HKR-K 和 HKR-R 通过:ComfyUI 工作流里能直接调 20 多个 OpenRouter 模型,省去来回切换工具。正文没披露版本号、费用和调用限制,只能算小产品更新。
一句话点评
ComfyUI 直接调 OpenRouter,工作流里能选 20 多个模型,省去挨个配 API 的麻烦。对反复试模型做图、做视频的人挺方便。但正文没提具体支持哪些模型、有没有调用次数限制,也没说 ComfyUI 版本号,想用还得自己试。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
23:25
14d ago
Product Hunt · AI· rssEN23:25 · 05·29
Tabstack Web Research:一个 API 调用跑完网页调研,还带引用来源
Tabstack 新上线了一个叫 /research 的接口,传一个问题,它自己搜网页、读内容、综合答案、标好来源,一次 API 调用全搞定。正文说面向法律、金融、竞品分析这些“答错要担责”的场景,强调用的是实时网页而不是预索引库,每条回答都带可验证的 URL。团队来自 Mozilla。目前没披露用了什么模型、延迟多高、引用是怎么生成的,也没说定价——...
#Agent#Tools#Tabstack#Product update
精选理由
HKR-K 和 HKR-R 通过:一次调用出带引用答案这个点可测试,且切中研究 agent 集成场景。HKR-H 偏弱,加上价格、模型、延迟和引用机制都没披露,所以分数压在 60–71 区间。
一句话点评
Tabstack 新接口 /research,传一个问题,它自己搜网页、读内容、综合答案并标来源,一次 API 搞定。主打法律、金融等“答错要担责”的场景,强调用实时网页而非预索引库,每条回答都带可验证的 URL。团队来自 Mozilla。目前没披露用了什么模型、延迟多高、引用怎么生成的,也没说定价。 短评:把“搜索+阅读+引用”打包成一个 API,对做合规类 agent 的团队挺实用。但...
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
22:31
14d ago
AI HOT 精选· aihot-apiZH22:31 · 05·29
DynoSim:用模拟跑一遍部署配置,省下大把GPU时间
NVIDIA 发了一个叫 DynoSim 的模拟器,专门用来调大模型推理服务的部署参数。调过的人都知道,模型后端、张量并行、调度策略、路由、KV 缓存这些变量互相影响,改一个可能把瓶颈挪到别处,而且跑一次真实实验就要占一堆 GPU。DynoSim 的思路是用离散事件模拟把整个 Dynamo 推理栈跑一遍,在虚拟时钟上模拟请求到达、调度、前向传播、KV ...
#Inference-opt#NVIDIA#Commentary
精选理由
HKR-K和HKR-R是弱正面:推理优化相关,但正文只给出了变量类别,省略了DynoSim机制、可复现结果和发布状态。
一句话点评
NVIDIA 发了个叫 DynoSim 的模拟器,专门用来调大模型推理服务的部署参数。调过的人都知道,模型后端、张量并行、调度策略、路由、KV 缓存这些变量互相影响,改一个可能把瓶颈挪到别处,而且跑一次真实实验就要占一堆 GPU。DynoSim 的思路是用离散事件模拟把整个 Dynamo 推理栈跑一遍,在虚拟时钟上模拟请求到达、调度、前向传播、KV 缓存等行为,而不是真的去跑 GPU。它用 ...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
22:23
14d ago
AI HOT 精选· aihot-apiZH22:23 · 05·29
Claude Design Card:把文字一键转成公众号首图和小红书卡片,支持28种布局
这是一个专为中文内容创作者设计的开源工具,能把文字、链接或文章直接生成视觉卡片,比如公众号首图、小红书图文卡、教程步骤卡。它自动提炼重点、选版式、生成HTML再截图成PNG,省掉手动用Figma或Canva的步骤。支持28种布局和10种主题,核心价值是自动化“写完文章后最繁琐的排版流程”。开源,适合经常发内容的创作者试试。
#Tools#claude-design-card#Figma#Canva
精选理由
HKR-H 和 HKR-K 通过:它把文字/链接/文章一键转成公众号首图、小红书卡片,对做内容运营的人是个实在的钩子,而且明确写了 28 种布局、10 种主题。HKR-R 弱:这是个 Claude 周边的小工具,不是模型能力或市场级别的发布,对多数从业者参考价值有限。
一句话点评
这个开源工具能把文字/链接一键转成公众号首图、小红书卡片,支持28种布局和10种主题,省掉手动开Figma的步骤。核心是自动提炼重点→选版式→生成HTML→截图PNG。开源免费,适合高频发内容的创作者。不过正文没披露生成一张图要多久、截图质量是否稳定,实际体验可能打折扣。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
22:14
14d ago
TechCrunch AI· rssEN22:14 · 05·29
程序员开始拒绝不用AI写代码——但可能反噬自己
TechCrunch报道,研究人员警告AI确实让程序员写代码更快,但不一定写得更好。正文没披露样本量、研究方法或具体工具,所以这点先别太激动。长期依赖AI可能让程序员基本功退化,出问题更难自己修。
#Code#TechCrunch#Commentary
精选理由
HKR-H和HKR-R通过:标题的反AI依赖争议角度有钩子,且话题切中开发者日常焦虑。HKR-K不通过:正文只抛了一句“更快但不更好”,没给样本数、没给研究方法,数据支撑为零,所以留在all层。
一句话点评
短评:AI写代码快但未必好,长期依赖可能让基本功退化。正文没披露样本量和研究方法,结论先打个折。 TechCrunch这篇报道点出一个直觉上成立但证据不足的判断:AI让程序员写代码更快,但不一定写得更好。研究人员警告,长期依赖AI可能导致程序员基本功退化——出bug自己修不了、看不懂底层逻辑。但正文没披露样本量、研究方法或具体工具,所以这点先别太激动。如果真有大样本实验证明“AI辅助下代码...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
21:03
15d ago
AI HOT 精选· aihot-apiZH21:03 · 05·29
ChatGPT 对话目录功能上线
ChatGPT 现在给超过5条回复的对话加了个目录,方便你快速跳转到聊到哪了。正文没说是全平台推送还是灰度测试,也没提用户能不能手动开关。
#Tools#ChatGPT#OpenAI#Product update
精选理由
HKR-K和HKR-R通过:5条回复触发条件具体,长对话导航痛点真实。HKR-H不通过:这只是一个小功能更新,平台范围和开关条件正文都没披露。
一句话点评
ChatGPT 给长对话加了目录,超过5条回复自动生成,方便跳转。官方没说是不是全量推送,也没提能否关闭。小改进,但长聊场景挺实用。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
21:00
15d ago
彭博科技· rssEN21:00 · 05·29
三星AI奖金引发韩国科技财富分配争议
彭博社报道,三星因AI业务发放巨额奖金,在韩国引发了一场关于科技财富如何分配的争论。但正文只给出了标题和发布时间(2026年5月29日),没有披露具体奖金数额、涉及哪些公司或分配机制。信息缺口很大,无法判断这笔钱到底有多大、分给了谁、争议焦点是什么。
#Samsung#Bloomberg#Commentary
精选理由
标题有钩子,韩国巨额AI奖金和财富分配争议直接戳中从业者钱袋子神经,H和R都成立。但正文只有标题加页面导航,奖金规模、公司范围、分配机制全没披露,K不成立。补偿话题有共鸣,但信息量不够上推荐位,只能放浏览级。
一句话点评
标题说三星AI发了巨额奖金,在韩国引发科技财富分配争议。但正文只给了导航栏和发布时间,没披露具体金额、涉及哪些公司、分配机制。信息缺口太大,没法判断这笔钱到底有多大、分给了谁、争议焦点是什么。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
20:40
15d ago
AI HOT 精选· aihot-apiZH20:40 · 05·29
Luma Agents 上线:输入内容自动生成宣传图
Luma Labs 宣布 Luma Agents 可以根据用户输入的内容和定义的“钩子”自动生成宣传图,省去手动设计。但正文只给了 App 链接,没提模型细节、定价、输出数量限制或上线范围,实际效果和成本还不清楚。
#Agent#Tools#Multimodal#Luma Labs
精选理由
HKR-H 靠“输入内容生成宣传图”这个自动化钩子过关,但 K 和 R 都很弱。没有硬性排除理由,所以留在低优先级的产品更新档位。
一句话点评
Luma 出了个“宣传图自动生成”工具,你给内容和一句钩子,它就能出图。正文只扔了个 App 链接,没提用了什么模型、怎么收费、一次能出几张、哪些地区能用。效果和成本全是问号,先别激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
20:36
15d ago
r/LocalLLaMA· rssEN20:36 · 05·29
用两台本地服务器跑音乐生成模型,彻底扔掉订阅制
一位 Reddit 用户晒出他的自建方案:两台 DGX Spark 机器跑 Plex 做媒体管理,同时并行跑多个 Ace-Step 1.5 XL 模型来生成音乐。他声称这样可以完全替代音乐订阅服务。不过正文被 Reddit 屏蔽了,没披露具体延迟、音质对比或模型微调细节。硬件成本不低(DGX Spark 一台约 3000 美元),但长期看如果真能替代月...
#Audio#Fine-tuning#Reddit#Plex
精选理由
HKR 三项都够,角度小众但切中自托管群体的真实需求。不过正文没披露实际成本、生成速度、音质对比或可复现的搭建步骤,证据偏薄,所以分数压在 60–71 区间。
一句话点评
有人用两台 DGX Spark(约 6000 美元)跑多个 Ace-Step 1.5 XL 模型并行生成音乐,声称能替代订阅服务。但正文被 Reddit 屏蔽,没披露生成一首歌要多久、音质能否比肩 Spotify,也没说模型是否微调过。硬件成本不低,长期看如果真能省月费,对发烧友可能划算,但普通用户别急着跟。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
20:16
15d ago
r/LocalLLaMA· rssEN20:16 · 05·29
8GB显存从零训了个25M小模型,作者自己挺高兴
作者tevlon在Reddit分享了一个GitHub项目,用8GB显存从零训练了一个25M参数的TinyStories模型。他试了几种技巧:MTP(多token预测)确实能跑,但会让训练变慢;BitNet(1比特量化)在训练阶段省不了显存;TurboQuant没必要用。模型很小,不是大语言模型,只是能讲简单故事的小模型。正文没披露训练速度或loss曲线...
#Fine-tuning#Inference-opt#tevlon#GitHub
精选理由
这是一个 Reddit 个人项目,模型只有 25M 参数,跑的是 TinyStories 数据集,所以不是行业级更新,更像一个可复现的实验笔记。但 8GB 显存、BitNet 训练不省显存、MTP 拖慢速度这几个点,对想自己动手训模型的人来说很有参考价值,综合给到 all 层合理。
一句话点评
8GB显存从零训了个25M参数的小模型,能讲简单故事。MTP(多token预测)能跑但拖慢训练,BitNet(1比特量化)训练时省不了显存,TurboQuant没必要。模型太小,不是大语言模型。正文没披露训练速度或loss曲线,实用性有限,但给低显存玩家开了个口子。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
20:10
15d ago
AI HOT 精选· aihot-apiZH20:10 · 05·29
Runway API 上新了五个模型,包括视频生成和图像放大
Runway API 新增了五个模型:Seedance 2.0(视频生成)、GPT Image 2(图像生成)、HappyHorse 1.0(未知用途)、Nano Banana Pro(可能是轻量模型)和 Magnific Precision Upscaler V2(图像放大)。官方说可以在一个接口里调用这些模型,但正文没披露价格、响应速度、调用次数限...
#Multimodal#Vision#Tools#Runway
精选理由
Runway API 例行端点扩展:HKR-K 有具体的模型列表,HKR-R 适合多模态集成决策,但 HKR-H 较弱,且正文没有给出定价、限制、延迟或新能力。
一句话点评
Runway API 一口气加了五个模型,包括视频生成 Seedance 2.0、图像生成 GPT Image 2、放大工具 Magnific Precision Upscaler V2,还有两个用途不明的 HappyHorse 1.0 和 Nano Banana Pro。官方说一个接口就能调,但没披露价格、响应速度、调用次数限制和地区可用性。如果价格合理,对想快速集成多种生成能力的开发者挺...
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
19:53
15d ago
r/LocalLLaMA· rssEN19:53 · 05·29
开发者对“氛围编程”忍无可忍,在代码里藏了条删数据的提示注入
一位开发者因为受够了那些靠感觉写代码、不仔细审查 AI 生成代码的“氛围程序员”,故意在代码里埋了一条提示注入指令,触发后会直接删除数据。正文没披露代码藏在哪、什么条件会触发、影响范围有多大,所以暂时没法验证这条注入的真实性和杀伤力。如果属实,这算是一次用极端方式提醒同行:别盲目信任 AI 写的代码,至少跑之前扫一眼。
#Code#Safety#Reddit#Ars Technica
精选理由
标题有钩子,冲突感强,但正文几乎没信息,只有一句评论。代码位置、触发条件、影响范围全没披露,所以 HKR-K 不通过,分数卡在 60–71 区间合理。
一句话点评
一位开发者受够了“氛围程序员”(不审AI代码直接跑的人),在代码里埋了条提示注入,触发就删数据。正文没披露代码藏在哪、什么条件触发、影响多大,所以暂时没法验证真实性。如果属实,算是一次极端提醒:别盲目信AI写的代码,至少跑前扫一眼。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
19:44
15d ago
彭博科技· rssEN19:44 · 05·29
前 Shield AI 员工起诉高管“粗俗、恶劣”行为
一名前 Shield AI 员工起诉公司一位高管,指控其有“粗俗、恶劣”行为。但正文只返回了彭博社的机器人验证页面,没有披露具体指控内容、涉事高管身份、行为细节、索赔金额或法院文件信息。
#Shield AI#Bloomberg#Incident#Personnel
精选理由
HKR-H和HKR-R勉强过关:Shield AI的诉讼确实有钩子,但正文只有403页面,关键事实缺失。标题有价值但信息量低,没有触发硬排除规则。
一句话点评
标题说前员工起诉Shield AI高管行为粗俗恶劣,但正文只有彭博社的机器人验证页面,没披露任何具体指控、涉事人、索赔金额或法院文件。信息缺口太大,无法判断事件严重性,建议等正式报道或法庭记录出来再跟进。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
19:38
15d ago
Hacker News 首页· rssEN19:38 · 05·29
Tiny-vLLM:用C++和CUDA实现的轻量级推理引擎
作者用 C++ 和 CUDA 写了一个简化版 vLLM,主打高性能推理。目前 GitHub 上 141 星,但正文没披露跑过哪些模型、具体延迟和吞吐数据,也没说支持什么硬件。如果你在找比 vLLM 更轻、更容易自己改的推理后端,可以关注,但先别急着上生产——验证还太少。
#Inference-opt#Tiny-vLLM#Hacker News#Open source
精选理由
Tiny-vLLM 在 HN 上只有 5 分、0 条评论,正文没披露基准、模型支持或许可证。项目本身是个轻量级 vLLM 的钩子,但“高性能”没有证据支撑,信息缺口太大,从业者没法评估是否值得关注。按规则硬排除,分数压在 40 以下。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K0·R0
19:33
15d ago
r/LocalLLaMA· rssEN19:33 · 05·29
Ostrich-27B:一个业余玩家用两年经验微调的 Qwen 3.6 模型,自称对齐率 75%
Reddit 用户 de4dee 上传了基于 Qwen 3.6 27B 的微调模型 Ostrich-27B-260526-GGUF。他用自己的评测说,这个模型的人类对齐率是 75%,比之前基于 Qwen 3.5 的微调模型(73%)高了两个点。注意这是个人跑的分,不是第三方评测,样本量和测试方法都没披露,所以这个 2% 的提升先别太激动。模型已经发了 ...
#Fine-tuning#Alignment#Benchmarking#Qwen
精选理由
HKR 三项都过:有个人微调故事(h)、有具体数字和模型规格(k)、目标受众明确(r)。但 75% 和 73% 都是作者自测,正文没披露评测集大小或方法,也没有外部基准对比,所以重要性只给 62,放在全量推送层。
一句话点评
Reddit 用户 de4dee 基于 Qwen 3.6 27B 微调出 Ostrich-27B,自测人类对齐率 75%,比之前 Qwen 3.5 版高 2 个百分点。但这是个人评测,样本量和测试方法都没披露,2% 的提升先别太激动。模型已上传 Hugging Face,用 Unsloth 训练,正文没披露训练数据量和成本。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
19:28
15d ago
Hacker News 首页· rssEN19:28 · 05·29
CVE-Bench:测测大模型能不能修真实安全漏洞
作者用20个真实CVE(含Pillow、yt-dlp等18个Python项目)测了5个前沿模型(3个OpenAI、2个Poolside),发现没有一个能稳定修漏洞。最好的是gpt-5.5,整体修复率50%,在给全漏洞描述时也才60%。模型失败模式很固定:搜错文件、预算耗尽、只修一半。成本差异也大,同样效果下token花费能差4倍。如果只告诉模型文件位置...
#Agent#Code#Benchmarking#Benchmark
精选理由
标题钩子够硬,但正文几乎没给干货——没披露用了多少CVE、跑了哪些模型、怎么打分,目前只能当个预告看。H和R都成立,K太弱,整体卡在60-71的低信息量基准区间。
一句话点评
用20个真实CVE(Pillow、yt-dlp等18个Python项目)测了5个前沿模型,最好的是gpt-5.5,整体修复率仅50%,给全漏洞描述也才60%。模型失败模式很固定:搜错文件、预算耗尽、只修一半。成本差异也大,同样效果token花费能差4倍。但样本只有20个,且全是Python项目,没测C/C++或大型仓库。正文没披露模型具体版本号、每次运行的随机种子,也没说是否重复跑过取均值。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
19:16
15d ago
● P1Hacker News 首页· rssEN19:16 · 05·29
Shift 启动免费家务清洁服务用于机器人训练数据采集
一家叫 Shift 的初创公司提出免费帮人打扫房子,条件是允许它记录整个清洁过程,用来训练未来的家务机器人。正文没披露具体在哪些城市提供服务、怎么收集数据(比如用摄像头还是传感器),也没说机器人什么时候能落地。想法挺直接:用真人干活的数据喂模型,比在实验室里模拟更真实。但数据隐私、用户筛选这些关键细节都还没公开,先别太激动。
#Robotics#Shift#The Verge#Hacker News
精选理由
HKR-H 和 HKR-R 通过:免费清洁住宅换机器人训练数据,这个数据换劳动的钩子很锋利,容易引发讨论。HKR-K 不通过:RSS 正文只确认了免费清洁,没披露覆盖城市、采集机制或机器人时间表,信息缺口明显,所以这条留在 all 里。
一句话点评
用免费保洁换你家的动作数据来训机器人,隐私条款和采集范围正文没细说,先别急着报名。
锐评
Shift 这家公司搞了个很直接的交换:派人上门免费做家务,同时用摄像头和传感器记录整个清洁过程,拿这些数据去训练未来的家务机器人。商业模式上就是用劳动力换训练数据,比纯实验室采集更贴近真实家庭环境。 但正文只给了标题和摘要,关键信息全是缺口:采集哪些数据、摄像头拍什么范围、数据怎么存储和授权、用户能不能要求删除,这些都没披露。免费保洁听着划算,但你家可能变成机器人公司的训练场,隐私代价得自己掂量。另外也没说目前采集了多少家庭、数据质量怎么样、模型训练效果有没有验证。 对从业者来说,这种真实场景的动作数据确实稀缺,如果隐私和合规框架能跑通,采集成本会比实验室方案低很多。但在看到完整的隐私协议和数据处理流程之前,这个模式还停留在“想法有意思,落地待观察”的阶段。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K0·R1
19:15
15d ago
AI HOT 精选· aihot-apiZH19:15 · 05·29
LlamaIndex 给 Google 新出的 Agents API 搭了个文档解析模板
LlamaIndex 团队基于 Google 刚发布的 Agents API 做了一个模板,让智能体能直接调用 LlamaParse 和 LiteParse 来解析非结构化文档。流程分四步:先配好 Git 仓库地址,把仓库克隆到智能体沙箱里,装上 LiteParse 命令行工具和 LlamaParse 的 SDK,最后用提示词驱动智能体干活。说白了就是...
#Agent#Tools#LlamaIndex#Google
精选理由
这是个小众开发者工具的模板更新:HKR-K靠具体的配置步骤和解析流程通过;HKR-H没有悬念或惊喜,不成立;HKR-R范围窄,没有行业争议点,所以定级为all而非featured。
一句话点评
LlamaIndex 给 Google Agents API 套了个模板,让智能体能直接调 LlamaParse 和 LiteParse 解析非结构化文档。流程四步:配 Git 仓库、克隆到沙箱、装 CLI 和 SDK、用提示词驱动。说白了就是把文档解析能力打包成智能体技能。 亮点是省去自己写工具调用的麻烦,适合快速搭文档处理流水线。但正文没披露解析速度、成本、支持的文件类型上限,也没说沙...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
19:00
15d ago
AI HOT 精选· aihot-apiZH19:00 · 05·29
Google 用 AI Studio 搞了个 I/O 2026 测验,全程“氛围编程”
Google 拿自家 AI Studio 工具,用“氛围编程”(就是靠自然语言描述需求让模型写代码,不手敲)做了个 I/O 2026 的在线测验。正文只说了工具和主题,没透露用了哪个模型、具体提示词怎么写、工作流怎么搭,也没说什么时候上线。想抄作业的从业者得自己试了。
#Code#Tools#Google#Product update
精选理由
官方测验推广;正文只说Google AI Studio用氛围编程生成,没有可复现的工作流、模型细节或产品变化。HKR三项全挂,所以排除。
一句话点评
Google 用自家 AI Studio 搞了个 I/O 2026 在线测验,全程靠“氛围编程”——也就是用自然语言描述需求让模型写代码,不用手敲。正文只说了工具和主题,没透露用了哪个模型、具体提示词怎么写、工作流怎么搭,也没说什么时候上线。想抄作业的从业者得自己试了。 短评:氛围编程做测验,噱头大于细节,缺模型和提示词,抄不了。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
18:59
15d ago
AI HOT 精选· aihot-apiZH18:59 · 05·29
Gemini Omni 演示:画个圆就能变视频
Gemini App 发了个演示:你上传一段画圆的视频,输入提示词“当我画完这个圆时,它变成了___”,模型就能把草图变成视频。效果看着挺酷,但正文没披露用了什么参数、什么时候开放、怎么收费。目前只是个 demo,离真正上手用还有距离。
#Multimodal#Vision#Gemini App#Gemini Omni
精选理由
官方 X 账号演示了一个具体的草图转视频流程,满足 H/K/R 的钩子、新知和相关性判断。但正文没披露模型参数、上线范围或价格,只是一个功能演示,不是正式发布,所以评分落在 60–71 区间。
一句话点评
Gemini App 演示了 Omni 的草图转视频功能:上传画圆视频,输入提示词“当我画完这个圆时,它变成了___”,模型就能生成视频。效果酷,但正文没披露用了什么参数、何时开放、怎么收费。目前只是个 demo,离上手还有距离。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
18:40
15d ago
r/LocalLLaMA· rssEN18:40 · 05·29
把 Gemma 4 31B 稠密模型硬改成 MoE 混合专家版
Reddit 用户 SemaMod 发帖说,他参考了另一个开源项目 JDONE-Research/AIOne-Agent-52B-A36B-it,打算把 Google 的 Gemma 4 31B 稠密模型(所有参数都参与计算)改造成原生的 additive-MoE(加性混合专家)架构。做法是训练一个路由器和几个专家子网络,然后打开模型里的 enable...
#Fine-tuning#Inference-opt#Gemma#JDONE-Research
精选理由
HKR三项都过:dense转additive-MoE的改法、B300跑24小时的条件都很具体。但来源只有一条Reddit帖子,没有放出任何评测指标或可用的模型文件,加上是偏模型工程的冷门操作,所以归入all层级。
一句话点评
Reddit 用户想把 Gemma 4 31B 稠密模型改成 MoE(混合专家)架构,做法是训练路由器和专家子网络,再打开模型里的 MoE 开关。他参考了另一个开源项目,概念验证脚本预计在 B300 上跑 24 小时。想法有意思,但正文没披露改完后的效果、推理速度或精度变化,目前只是“能跑通”的阶段,离实用还远。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
18:23
15d ago
Hacker News 首页· rssEN18:23 · 05·29
英国明年用AI给难民测年龄,靠照片估算
英国内政部签了一份三年32.2万英镑的合同,让一家IT公司开发AI年龄估算工具,明年先在边境测试,2027年中正式上线。做法是拍一张照片,AI直接判断这个人是不是成年。背景是过去一年有6400多个自称未成年人的难民被做了年龄评估,其中43%最后被认定为成年人。内政部说这能堵住“装小孩混进福利系统”的漏洞。但人权组织反对,说技术没经过充分验证,一旦判错,...
#BBC#Hacker News#Policy
精选理由
H和R通过:庇护年龄估算属于高敏感公共AI用例,从业者会关注偏见和问责问题。K不通过:来源只有一句话摘要,模型、数据、误差率、复核流程全没提,所以这条值得留意但不够格上首页。
一句话点评
英国内政部花32.2万英镑(三年)签了个AI年龄估算工具,明年先在边境试,2027年中上线。做法是拍张照片让AI判断是否成年。背景是过去一年6400多个自称未成年人的难民被评估,43%最后被认定是成年人。内政部说能堵漏洞,但人权组织反对,说技术没经过充分验证。正文没披露模型名称、训练数据、误判率,也没说有没有人工复核流程。这点先别太激动,成本虽低但一旦判错,真小孩被当成人遣返后果很严重。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1

更多

频道

后台