ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-06-07

66 items · updated 3m ago
RSS live
2026-06-07 · 星期日2026年6月7日
23:09
5d ago
彭博科技· rssEN23:09 · 06·07
Naver 要用英伟达的模型建数据中心,巩固韩国 AI 市场地位
Naver 跟英伟达达成合作,计划基于英伟达的模型建数据中心,目的是在韩国 AI 市场稳住领先位置。正文没披露具体投多少钱、用哪款模型、什么时候落地,所以规模和时间线都不清楚。对 Naver 来说,这步棋是押注英伟达的生态,但代价和排他性风险也没提。
#Inference-opt#Naver#Nvidia#Partnership
精选理由
HKR-H 和 HKR-K 通过:这是 Naver 与英伟达在韩国 AI 基础设施上的合作,机制是数据中心。细节太少——没提投入、模型名称和落地时间——所以评分落在 60–71 的通用合作区间。
一句话点评
Naver 要用英伟达的模型建数据中心,想在韩国 AI 市场稳住领先。正文没披露投多少钱、用哪款模型、何时落地,规模和时间线都不清楚。对 Naver 来说,这是押注英伟达生态,但代价和排他性风险也没提。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
23:00
5d ago
NVIDIA 博客· rssEN23:00 · 06·07
英伟达与斗山集团扩展合作,推进物理人工智能和工厂基础设施
英伟达和韩国斗山集团(Doosan)扩大了合作,涉及四家子公司:斗山机器人、斗山山猫(工程机械)、斗山能源(发电设备)和斗山电子材料(PCB基板)。合作方向是“物理AI”——也就是让AI直接控制机器人、工厂设备,而不是只跑在云端。斗山机器人会用英伟达的仿真平台训练机器人,斗山能源则帮英伟达建AI工厂的电力基础设施。正文没披露具体金额或落地时间表,所以目...
#Robotics#Agent#Inference-opt#NVIDIA
精选理由
HKR-K 通过:英伟达-斗山的合作范围有具体业务线。来源是厂商博客,没有披露交易金额、部署指标或产品规格,因此落在营销偏重的 40-59 分区间,没有硬性排除项。
一句话点评
英伟达和韩国斗山集团签了个大合作,涉及四家子公司:机器人、工程机械、发电设备、PCB基板。核心是“物理AI”——让AI直接控制机器人和工厂设备,不只在云端跑。斗山机器人会用英伟达的仿真平台训练机器人,斗山能源帮建AI工厂的电力设施。但正文没披露具体金额或落地时间表,所以先别太激动。这更像一个生态占位:英伟达在拉拢传统工业巨头进自己的仿真和算力体系。对从业者来说,信号是“物理AI”的落地路径开...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R0
22:07
5d ago
r/LocalLLaMA· rssEN22:07 · 06·07
双3090跑Qwen3.6-27B,FP8版来了,官方说效果跟BF16差不多
club-3090项目给Qwen3.6-27B加上了实验性的FP8支持,两张RTX 3090就能跑。官方声称FP8版和BF16版表现几乎一样,但没贴具体跑分,这点先别太激动。FP8的好处是省显存、省带宽,双3090用户终于能塞下这个27B模型了,但实际推理速度和质量还得自己试。
#Inference-opt#club-3090#Qwen#NVIDIA
精选理由
这是一个Reddit级别的社区实验,没有跑分、吞吐量或显存数据,属于60-71分的小型产品更新。
一句话点评
双3090终于能跑Qwen3.6-27B了,FP8省显存省带宽,官方说和BF16表现几乎一样但没贴跑分,这点先别太激动。实际推理速度和质量得自己试,正文也没披露具体延迟或精度对比。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
21:30
5d ago
彭博科技· rssEN21:30 · 06·07
英国首相要在就业中心推AI工具,帮人找工作
英国首相斯塔默宣布将在就业中心部署AI工具,帮求职者找工作,应对AI对岗位的冲击。正文没披露具体用什么模型、怎么用、什么时候上线、覆盖多少就业中心。目前只知道是政府层面的AI落地尝试,但细节太少,没法判断效果。
#Tools#Keir Starmer#UK Government#Policy
精选理由
HKR-H和R通过,因为政策+就业角度能引起从业者共鸣;但K不通过:正文没披露任何机制、上线时间或覆盖范围,信息量不足以支撑更高评分,所以落在60–71区间。
一句话点评
英国首相斯塔默要在就业中心部署AI工具帮人找工作,应对AI抢饭碗。但正文没披露用什么模型、怎么用、什么时候上线、覆盖多少就业中心。目前只是政府层面的AI落地尝试,细节太少,没法判断效果。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
21:09
5d ago
r/LocalLLaMA· rssEN21:09 · 06·07
llama-server 路由:把模型绑到一张卡上,它还是会在每张卡上占显存
一位用户在 2×3090、2×4060 Ti 和 1×5060 Ti 的机器上跑 llama-server 路由,发现即使把 Gemma 4B 模型固定到一张 GPU,它仍然会在每张卡上分配 CUDA 上下文,每张卡吃掉 120–256 MiB。结果前面跑了一个 262K 上下文的编码模型后,3090 只剩约 200 MiB 空闲,再加载这个 4B 模...
#Inference-opt#Tools#llama-server#Gemma
精选理由
来源是Reddit求助帖,用户自己排查出llama-server路由器的行为:即使把Gemma 4B固定到一张GPU,它仍然会在每张卡上分配CUDA上下文,每张吃掉120–256 MiB。他5张卡(2×3090、2×4060 Ti、1×5060 Ti)跑了一个262K上下文的编码模型后,3090只剩约200 MiB,再加载这个4B模型就OOM了。正文没披露官方是否有修复或计划,也没有其他用户确认复现,所以信息缺口明显:这是一个单点报告,没有上游确认或更广的产品影响。分数卡在60–71合理,因为事实具体、痛点真实,但证据链弱。
一句话点评
llama-server 路由模式下,即使把模型固定到一张 GPU,它仍会在每张卡上占 120–256 MiB 的 CUDA 上下文。用户 2×3090 跑完 262K 上下文编码模型后只剩 200 MiB,再加载 4B 模型直接 OOM。这不是 bug,是 llama-server 当前的设计——路由需要每张卡都预留上下文。正文没提是否有 flag 能关掉这个行为,实测可以试试 --no-...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
20:24
5d ago
Hacker News 首页· rssEN20:24 · 06·07
Nightwatch:开源只读AI运维,本地猫头鹰连中心大脑,离线聚类告警风暴
Nightwatch 是一个开源、只读的 AI SRE(站点可靠性工程师)工具。每个本地节点(叫“猫头鹰”)只向外连中心大脑,告警风暴在离线端聚类,调用远程大模型前会自动脱敏真实密钥、IP、主机名和路径。它能在你的生产系统上做根因分析,然后给出需要人工确认的修复建议。核心思路是“只读”+“本地优先”,降低安全风险。不过正文没披露具体支持哪些大模型后端、...
#Agent#Tools#Safety#Nightwatch
精选理由
HKR三项都过,但这是Show HN新项目,没有采用量或生产环境证据。我把它归为小规模开源产品更新,不到推荐位门槛。
一句话点评
Nightwatch 是个开源 AI 运维工具,核心思路是“只读”+“本地优先”:每个节点(猫头鹰)只向外连中心大脑,告警风暴在本地聚类,调远程大模型前自动脱敏密钥、IP、路径。这能降低安全风险,适合不敢把生产数据直接丢给 API 的团队。但正文没披露支持哪些大模型后端、脱敏后根因分析准确率如何,也没说“只读”模式下能覆盖多少故障场景。如果只是聚类+脱敏+调 LLM 给建议,那门槛不高,关键...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
20:13
5d ago
r/LocalLLaMA· rssEN20:13 · 06·07
Qwen 3.6 27B 在 DeepSWE 上只跑了 1.79%,排名倒数第三
Qwen 3.6 27B 在 DeepSWE 评测上得了 1.79%,18 个模型里排第 18,只比 Haiku 4.5 和 Minimax M2.7 高。这次只跑了一次(one rollout),总共花了 70 小时,平均每个任务 32 分钟、输出 4.4 万 token。分数低可能跟只跑一次有关,多跑几次取平均通常会涨分,但正文没披露是否做了多次实验。
#Code#Reasoning#Benchmarking#Qwen
精选理由
分数低到 1.79% 且排名垫底,对 Qwen 这种知名开源模型来说是个意外,有话题性。数字完整,能支撑成本估算。但只跑了一次,没有多次取平均,也没有其他来源交叉验证,所以重要性压在 66 合理,不往上调。
一句话点评
Qwen 3.6 27B 在 DeepSWE 上只得了 1.79%,20 个模型里排第 18,仅高于 Haiku 4.5 和 Minimax M2.7。这次只跑了一次(one rollout),花了 70 小时,平均每个任务 32 分钟、输出 4.4 万 token。分数低可能跟单次运行有关,多跑几次取平均通常会涨分,但正文没披露是否做了多次实验。短评:单次跑分垫底,多跑几次可能涨,但成本不低。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
18:54
5d ago
Hacker News 首页· rssEN18:54 · 06·07
如果大模型有人类特质,那《帝国时代2》也有
这篇论文用一个简单实验来戳破一个流行说法:很多人说大模型涌现了人类特质(比如道德感、理解语言),作者不直接反驳,而是训练了一个简单的神经网络去玩《帝国时代2》,然后指出——如果大模型那种表现算“人类特质”,那《帝国时代2》里的任何实体(比如一个农民)也能算。核心论点是:这些所谓的人类属性在经验上不唯一,换一个载体(乐高、波士顿地图)也可能出现类似行为。...
#Age of Empires II#Research release#Commentary
精选理由
HKR-H和HKR-R通过,但HKR-K不通过:只有标题和链接,没有方法或证据披露。当作低信息量的arXiv讨论项处理,所以保持all层级。
一句话点评
这篇论文用一个简单实验戳破“大模型有人类特质”的说法:训练一个神经网络玩《帝国时代2》,然后指出——如果LLM那种表现算“人类特质”,那游戏里的农民也能算。核心论点是这些属性在经验上不唯一,换一个载体(乐高、波士顿地图)也可能出现类似行为。作者没做新实验,只是逻辑推演,但论证挺有力。短评:用游戏农民类比LLM“人性”,逻辑有趣但没新实验。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
17:56
5d ago
TechCrunch AI· rssEN17:56 · 06·07
Notion 恢复了对 Anthropic 的访问
Notion 产品负责人说被转发量“惊到了”,但正文没披露中断持续了多久、影响了多少用户、以及怎么恢复的。
#Notion#Anthropic#Incident#Product update
精选理由
HKR-R 通过,但 HKR-H/K 偏弱:这是一条 Notion 恢复 Anthropic 访问的轻量级事件通报,未披露中断范围、时长或恢复方式,所以归入轻量级 incident 档位。
一句话点评
Notion 恢复了 Anthropic 的访问,但正文只提了产品负责人被转发量“惊到”,没披露中断时长、影响用户数、恢复方式。信息缺口太大,没法判断严重性。短评:转发量高≠事故严重,缺关键数据。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K0·R1
17:30
5d ago
彭博科技· rssEN17:30 · 06·07
Kevin O'Leary要在加拿大建最大数据中心,但当地人不买账
Kevin O'Leary支持的一家公司提议在阿尔伯塔省西北部建加拿大最大的数据中心,但正文没披露投资额、算力规模、时间表或具体的审批条件。目前只知道项目面临公众质疑,具体质疑点(电力、水、噪音还是地价)也没展开。信息缺口很大,暂时只能判断:项目还在早期舆论阶段,离落地还远。
#Kevin O’Leary#Policy
精选理由
彭博社来源可信,HKR中H和R通过——AI基建扩张与当地阻力冲突是真实议题。K不通过是因为投资额、算力需求、电力消耗和时间表都没披露,信息缺口太大,只能卡在60–71分区间。
一句话点评
Kevin O'Leary(《创智赢家》明星)要在加拿大阿尔伯塔省建该国最大数据中心,但正文被墙,只拿到标题和摘要。目前信息缺口极大:投资额、算力规模、时间表、审批条件全没披露。公众质疑具体是电力、水、噪音还是地价也不清楚。项目还在早期舆论阶段,离落地还远。短评:明星背书+大项目画饼,但缺关键细节,先别当真。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
17:29
5d ago
r/LocalLLaMA· rssEN17:29 · 06·07
Gemma4 的 QAT 量化版翻车了:画棋盘 SVG 棋子乱飘,不如老版 Q4 稳
Reddit 用户实测了 Gemma4 26B A4B 的两个 QAT GGUF 版本(用 llama.cpp b9549),跑一个画棋盘 SVG 的 prompt。结果 QAT 版输出的棋子位置不稳定、乱飘,而老版 Q4_K_XL 在相同参数下多次运行都更可靠。QAT 本意是用量化感知训练减少精度损失,但这次实测效果反而更差。正文没披露具体量化参数和...
#Inference-opt#Vision#Benchmarking#Google
精选理由
一条 Reddit 实测:Gemma4 26B A4B 的 QAT GGUF 版本画棋盘 SVG 时棋子位置乱飘,而老版 Q4_K_XL 在相同参数下多次运行都更稳。QAT 本意是用量化感知训练减少精度损失,但这次反而更差。正文没披露具体量化参数和测试次数,证据只有这一个 SVG 任务,没有跑分或更多任务验证。所以重要性压在 55,属于低价值区间——有参考意义,但别急着下结论。
一句话点评
Reddit 用户实测 Gemma4 26B A4B 的 QAT 版(量化感知训练版),跑画棋盘 SVG 任务,结果棋子位置乱飘,不如老版 Q4_K_XL 稳定。QAT 本意是减少量化精度损失,但这次翻车了。正文没披露具体量化参数和测试次数,样本量小,结论先打个折。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R1
16:25
5d ago
r/LocalLLaMA· rssEN16:25 · 06·07
用一句话控制3D虚拟人做动作,不用按钮
yuntiandeng 发了一个演示:输入一句话,模型就把这句话编译成一段浏览器里能跑的本地动作程序,支持循环、保持和并行轨道。相当于用自然语言代替了手动拖拽动画时间轴。正文没披露用了什么模型、延迟多高、能不能跑在消费级显卡上,所以实用性要打个问号。但思路挺直接——把语言指令拆成可执行的原子动作,而不是让模型直接生成骨骼动画,这样控制更精确、可调试。
#Agent#Code#Tools#yuntiandeng
精选理由
HKR-H/K 通过:语言控制3D角色和本地程序编译都是新思路。HKR-R 弱:这是单个 Reddit 演示,没有仓库、指标或采用证据。
一句话点评
一句话让3D角色动起来,不用拖时间轴。yuntiandeng的演示把自然语言编译成浏览器可执行的原子动作序列,支持循环、保持和并行。思路聪明:拆成可调试的指令块,比直接生成骨骼动画更可控。但正文没披露用了什么模型、延迟多高、能否跑在消费级显卡上,实用性要打个问号。短评:思路直接,但缺关键参数,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
16:12
5d ago
r/LocalLLaMA· rssEN16:12 · 06·07
GMKtec EVO-X3 迷你主机:塞进 OCuLink、Wi-Fi 7 和双 PCIe 4.0,后续还有 192GB 内存的 Ryzen AI MAX...
GMKtec 的 EVO-X3 迷你主机在标题里列了一堆接口:OCuLink(外接显卡用)、Wi-Fi 7 和双 PCIe 4.0 插槽。硬件用的是 Ryzen AI MAX+ 495,但正文没披露价格和具体上市时间。后续会出一个 192GB 内存的版本,这个容量对本地跑大模型挺友好,但得等。
#Inference-opt#GMKtec#AMD#Reddit
精选理由
标题列了一堆硬核接口:OCuLink(外接显卡用)、Wi-Fi 7 和双 PCIe 4.0 插槽,硬件是 Ryzen AI MAX+ 495,后续还有 192GB 内存版本,这个容量对本地跑大模型挺友好。但正文没披露价格和具体上市时间,也没有跑分或功耗数据,所以只能算一个正常的产品更新,不值得上推荐位。
一句话点评
GMKtec EVO-X3 迷你主机主打接口堆料:OCuLink(外接显卡)、Wi-Fi 7、双 PCIe 4.0 插槽,硬件用 Ryzen AI MAX+ 495。后续还有 192GB 内存版,本地跑大模型挺香,但价格和上市时间都没说。 短评:接口全但价格未知,192GB 版值得等。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:31
5d ago
AI HOT 精选· aihot-apiZH15:31 · 06·07
AI 产出暴涨,但 GDP 没动:Gary Marcus 用一张图说清“产出繁荣,回报惨淡”
Gary Marcus 引用 FT 和华盛顿邮报的数据图指出:AI 确实让应用、书籍、音乐、论文的数量暴增,但销量、GDP、科学质量都没跟着涨。他管这叫“slop”(垃圾内容泛滥)。正文没披露具体图表数据、生产力指标或实测的 AI 影响,但核心判断很清楚——产出多不等于价值高,尤其 agentic coding 烧钱最狠,OpenAI 和 Anthro...
#Gary Marcus#John Burn-Murdoch#Financial Times#Commentary
精选理由
文章靠Gary Marcus的‘slop’概念和FT图表截图撑起一个高共鸣的质疑——AI让内容数量暴增,但质量、销量、GDP都没跟上。这个角度对从业者很有吸引力,但正文没给出任何具体数据、生产力指标或实测影响,信息缺口大,验证弱。H和R靠话题焦虑过关,K因为缺数据和方法论卡在中间,整体留在all中段。
一句话点评
Gary Marcus 引用 FT 和华盛顿邮报的数据图指出:AI 让应用、书籍、论文数量暴增,但销量、GDP、科学质量都没跟着涨。他管这叫“垃圾内容泛滥”。正文没披露具体图表数字或生产力指标,但核心判断很清楚——产出多不等于价值高。短评:数量暴涨不等于价值提升,Marcus 用数据图打脸“AI 生产力神话”,但缺具体数字支撑。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
15:13
5d ago
● P1r/LocalLLaMA· rssEN15:13 · 06·07
在消费级笔记本上成功运行Qwen3.6 35B-A3B大语言模型
一位 Reddit 用户分享了自己在笔记本上跑通 Qwen3.6 35B-A3B 的体验。他的机器是华硕 Zenbook Pro 14,配了 RTX 4060 8GB 显存和 64GB 内存。用 llama.cpp 加载 unsloth 的 IQ3_XXS 量化版模型,在 3.2 万 token 上下文时生成速度约 27 token/秒,拉到 25.6...
#Inference-opt#Code#Tools#Qwen
精选理由
这是单个用户的 Reddit 实测,不是官方发布或论文,但硬件、量化方式、上下文长度和速度都给得很具体,对想在自己机器上跑大模型的人有直接参考价值。我会先打个折,因为只有一台机器的数据,不代表普遍表现,但信息密度够上 featured,分数放在 72–77 这个区间合理。
一句话点评
消费级笔记本跑通35B模型,8GB显存+32GB内存就能玩,但速度别抱太高期待。
锐评
这条消息的核心是:有人用一台普通游戏本(RTX 4060 8GB显存、32GB内存)成功跑起了Qwen3.6 35B-A3B模型。这个模型本身是35B参数的大模型,但用了MoE(混合专家)架构,实际激活的参数量只有3B左右,所以对硬件的要求比看上去低很多。 发帖人提到一个有意思的点:开了推测解码(speculative decoding)之后,生成速度有明显提升。推测解码相当于让一个小模型先猜答案,大模型再批改,能省不少时间。不过正文被Reddit屏蔽了,具体每秒能生成多少个token、延迟多少、有没有量化、用了什么推理框架,这些关键细节都没披露。 如果你手头正好有类似配置的笔记本,想本地跑一个能力还不错的模型,这个组合值得试试。但别指望它能像ChatGPT那样秒回,也别拿它当生产环境用——消费级硬件的散热和稳定性都是硬伤。另外,35B参数里只有3B在干活,意味着知识密度可能不如同级别的稠密模型,这点在复杂任务上要打个问号。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
15:03
5d ago
r/LocalLLaMA· rssEN15:03 · 06·07
MCP 服务器一多,启动时怎么管?
Reddit 用户 vazma 发现,在 openCode 里加载多个 MCP 服务器时,还没输入任何提示词,就已经消耗了大量 token 并污染了上下文窗口。他问社区有没有好办法,提到了三种思路:用代理统一管理、用中心枢纽调度、或者只在会话层按需懒加载。但正文没披露他自己具体用了哪种方案,也没给出实测数据。
#Agent#Tools#Reddit#openCode
精选理由
H 和 R 通过:MCP 启动时的 token 浪费和上下文污染是具体且高频的实操痛点,能引起 agent 工具链从业者共鸣。K 不通过:帖子只抛出思路,没有给出可复现的配置、数字或工具对比,信息密度不足以支撑知识性评分,因此留在 all 层级。
一句话点评
MCP 服务器一启动就全加载,还没打字 token 先烧了一截,上下文也被污染。社区在聊三种解法:代理统一管、中心枢纽调度、会话层按需懒加载。但原帖没说自己用了哪套,也没给实测数据——这点先别太激动。懒加载最省 token,但延迟会高,正文没披露具体开销。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
14:16
5d ago
r/LocalLLaMA· rssEN14:16 · 06·07
start-llama:一个帮你管理 llama-server 配置的命令行小工具
Look_0ver_There 发了个叫 start-llama 的命令行工具,能让你更方便地启动 llama-server,支持多版本二进制文件、按模型单独配参数,还能在命令行里临时覆盖设置。正文没披露安装方式、许可证和具体支持哪些平台,想用的话得自己去 GitHub 仓库翻。
#Tools#Look_0ver_There#llama-server#start-llama
精选理由
HKR-K 和 HKR-R 通过:start-llama 有具体的配置机制(多二进制、按模型配参、CLI 覆盖),也贴合本地推理工作流的配置麻烦。但只是 Reddit 上一个单一项目的发布,受众窄,属于小型开源更新,所以重要性 61、tier all 合理。
一句话点评
一个叫 start-llama 的命令行工具,帮你省去每次手动敲参数启动 llama-server 的麻烦。支持多版本二进制、按模型单独存配置,还能在命令行临时覆盖设置。对本地跑模型的人来说挺实用,但正文没披露安装方式、许可证和具体支持哪些平台,想用还得自己去 GitHub 翻。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
14:04
5d ago
彭博科技· rssEN14:04 · 06·07
AI 搜索正在把互联网吸进“死亡螺旋”
彭博这条视频讲了一个正在发生的恶性循环:AI 搜索直接给答案,用户不再点进原始网站,导致网站流量下降。流量少了,网站要么关站要么把内容藏起来,AI 模型就缺新鲜数据训练,回答质量跟着变差。SparkToro 的 Rand Fishkin 管这叫“零点击搜索”——用户留在平台内,外部网站拿不到流量。People Inc. CEO Neil Vogel 说...
#RAG#Bloomberg#Rand Fishkin#People Inc.
精选理由
HKR-H和HKR-R比较强,HKR-K有具体的零点击机制和一个对冲案例。但正文没有给出流量下降的具体数字、交易金额或新数据,所以停留在普通报道的档次,不往上调。
一句话点评
彭博这条视频讲了一个正在发生的恶性循环:AI搜索直接给答案,用户不再点进原始网站,导致网站流量下降。流量少了,网站要么关站要么把内容藏起来,AI模型就缺新鲜数据训练,回答质量跟着变差。SparkToro的Rand Fishkin管这叫“零点击搜索”——用户留在平台内,外部网站拿不到流量。People Inc. CEO Neil Vogel说他们靠授权、社交分发和付费AI合作来对冲搜索流量下滑...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:56
5d ago
r/LocalLLaMA· rssEN13:56 · 06·07
求推荐比 OmniCoder v2 9B 更小的工具调用模型
一位 Reddit 用户在 LocalLLaMA 版发帖,想找一个比 OmniCoder v2 9B 更小的模型,要求能准确调用工具,并且能在 12GB RTX 3060 上更快热加载。帖子正文被 Reddit 屏蔽,没有透露候选模型或跑分结果。
#Agent#Tools#Code#OmniCoder
精选理由
HKR 中 H 和 R 通过,K 不通过。帖子提出了一个具体的本地模型选型需求,有明确的硬件约束(12GB 显存、热加载速度),但正文被屏蔽,没有给出任何候选方案、对比数据或可复现的测试,信息价值很低,不适合作为精选内容。
一句话点评
有人在Reddit上问有没有比OmniCoder v2 9B更小的模型能准确调用工具,还要能在12GB RTX 3060上更快热加载。帖子正文被屏蔽,没透露候选模型或跑分。9B在12GB卡上跑推理还行,但热加载速度主要看模型大小和框架优化,小模型确实有优势。目前Qwen2.5-7B-Instruct和Gemma 3-4B都支持工具调用,但具体准确率对比缺数据。如果追求更小,可以试试Qwen2...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
13:15
6d ago
彭博科技· rssEN13:15 · 06·07
黄仁勋确认英伟达新 Vera 芯片将用 SK 海力士内存
黄仁勋在公开场合说,英伟达下一代 Vera CPU 会搭载 SK 海力士的内存颗粒。两家公司还计划明年扩大合作规模。正文没披露 Vera 的具体架构、制程或量产时间,也没说用的是 HBM 还是其他类型的内存,所以这条消息目前更像一个供应商锁定信号,而不是产品发布预告。
#Inference-opt#Nvidia#Jensen Huang#SK Hynix
精选理由
HKR 的 K 和 R 通过:Vera 的内存供应商细节对 AI 算力供应链有实质影响。规格、产能和价格都没披露,所以这条消息停留在偏上游的行业报道区间,重要性 66 合理。
一句话点评
黄仁勋说英伟达下一代 Vera CPU 会用 SK 海力士的内存,但正文没提具体是 HBM 还是其他类型,也没说架构、制程和量产时间。目前更像一个供应商锁定信号,不是产品发布预告。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
13:00
6d ago
彭博科技· rssEN13:00 · 06·07
AI 公司大额增发可能让市场接不住
彭博报道,多家 AI 公司准备通过增发股票来筹集资金,这可能导致市场上股票供给突然增加。正文没披露具体是哪些公司、增发规模多大、时间表如何,所以风险到底有多大还不好说。但信号很清楚:AI 烧钱太快,公司开始靠卖股票续命,而买家可能不够多。
#Bloomberg#Wall Street#Funding#Commentary
精选理由
HKR-H 和 HKR-R 成立,但 HKR-K 不成立:全文只提到 AI 融资可能增加股票供给,没有具体金额、公司名单或时间表,所以只能放在低优先级全量推送。
一句话点评
彭博说AI公司要扎堆增发股票筹钱,但没点名、没规模、没时间表。信号本身值得看:AI烧钱太快,公司开始靠卖股票续命。但风险多大完全取决于具体数字,正文没披露,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
12:59
6d ago
AI HOT 精选· aihot-apiZH12:59 · 06·07
Symbolica 2.0 发布:可编程符号系统,支持 Python 和 Rust
Symbolica 2.0 是一个高性能符号计算框架,主要面向 Python 和 Rust 用户。这次更新的核心是“可编程符号”——用户可以自定义数学对象的行为,比如让它们像内置函数一样自动化简、求导、展开、打印和求值。新版本还改进了 Rust API,减少了导入和类型路径,支持更流畅的 builder 模式;输出方面增加了自动换行、彩色括号、HTML...
#Code#Tools#Symbolica#Hacker News
精选理由
Symbolica 2.0 是一个符号计算库的更新,主要面向数学和科学计算场景,跟 AI 产品、模型、智能体或安全没有直接关系。HKR 三项都不满足,属于排除内容。
一句话点评
Symbolica 2.0 是一个符号计算框架,让 Python 和 Rust 用户能自定义数学对象的行为(比如自动求导、化简)。上了 Hacker News 首页(100 分),但正文没披露性能基准、许可证变更或迁移细节。亮点是 JIT 编译和双精度浮点支持,对需要快速数值核的物理/工程场景有用。不过社区验证还弱,先别当 Mathematica 平替。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
12:00
6d ago
The Verge · AI· rssEN12:00 · 06·07
AI“网红”越来越难分辨了
The Verge 报道,AI 生成的虚拟网红(比如 Aitana Lopez 和 Lil Miquela)已经逼真到让社交平台都犯难。文章标题说“越来越难分辨”,但正文没披露任何检测方法、平台数据或具体判断标准——所以这点先别太激动,信息缺口很明显:到底难在哪、多难、谁在负责识别,全没讲。
#Multimodal#Vision#The Verge#Aitana Lopez
精选理由
HKR-H和HKR-R通过:AI创作者难以识别这个标题有吸引力,也跟平台信任问题挂钩。HKR-K不通过:正文只给了两个名字举例,没有数据、方法或可验证的结论。
一句话点评
The Verge 说 AI 虚拟网红(Aitana Lopez、Lil Miquela)已经逼真到平台都难分辨,但正文没给任何检测方法、平台数据或判断标准。标题说“越来越难分辨”,信息缺口很明显:到底难在哪、多难、谁在负责识别,全没讲。当个现象观察看可以,别当技术报告信。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
11:54
6d ago
r/LocalLLaMA· rssEN11:54 · 06·07
Qwen 3.6 27B 的 KV 缓存量化测试:75 组对比,覆盖 q8/q6/q5/q4
Anbeeld 放出了 Qwen 3.6 27B 的 KV 缓存量化基准测试,一共 75 组对比,涵盖 q8/q6/q5/q4 四种精度。测试用的是 BeeLlama.cpp,因为它支持 KVarN、q6_0、TurboQuant 和 TCQ 这些量化方法。正文没披露具体跑分和延迟数据,所以暂时没法判断哪种量化方案性价比最高。
#Inference-opt#Benchmarking#Qwen#BeeLlama.cpp
精选理由
HKR-K/R 通过:本地推理读者能拿到具体的量化测试条件,但完整结果数字没公开,只能知道有 75 组对比和四种精度。话题偏工程细节,所以分数落在 60–71 的 all 区间。
一句话点评
Anbeeld 测了 Qwen 3.6 27B 的 KV 缓存量化,75 组对比覆盖 q8 到 q4,用了 BeeLlama.cpp 支持 KVarN、TurboQuant 等方法。但正文没披露跑分和延迟,暂时没法判断哪种方案最划算。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
11:16
6d ago
Hacker News 首页· rssEN11:16 · 06·07
Lathe:用 LLM 生成技术教程,逼你亲手做一遍,而不是跳过学习
Lathe 是一个 Go 写的命令行工具加本地网页界面,核心思路是让 LLM 根据你指定的领域生成带练习、旁注和目录的多章节技术教程,然后你必须自己动手完成。作者只在 macOS 上测过 Claude Code,Hacker News 上目前 37 票、2 条评论,热度不高。亮点是它刻意不让你“跳过”学习过程——LLM 只负责出题和搭框架,动手的还是你...
#Agent#Code#Tools#Lathe
精选理由
H/K/R 三个维度都够,但这是个很小的开源学习工具:HN 上 37 票、2 条评论,没有采用数据、基准测试或模型层面的进展。放在中档位比精选更合适。
一句话点评
Lathe 是个 Go 写的命令行工具,让 LLM 帮你生成带练习和旁注的技术教程,但你必须自己动手做,不能跳过学习。作者只在 macOS 上测过 Claude Code,HN 上 37 票、2 条评论,热度很低。亮点是思路对——LLM 只出题搭框架,不替你写答案。但正文没披露生成一篇教程要多少 token、多快,也没说支持哪些模型。如果成本可控,对想系统学新领域的人挺实用,但这点先别太激动...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
11:02
6d ago
r/LocalLLaMA· rssEN11:02 · 06·07
把 Nemotron 3.5 ASR 塞进 Docker,CPU 跑语音识别比实时快 4.5 倍
有人把语音识别管线从 Parakeet 换成了 Nemotron 3.5 ASR,打包成 Docker 镜像。一个模型支持 40 多种语言,原生支持流式识别(不用等整段音频传完再出字),还附了流式和文件上传的客户端示例。CPU 上用 onnxruntime-genai 跑,速度是实时的 4.5 倍——也就是处理 1 秒音频只要 0.22 秒,延迟很低。...
#Audio#Tools#Inference-opt#Docker
精选理由
H/K/R 都过线,但这是 Reddit 用户打包的 Docker 工具更新,不是官方模型发布。4.5 倍 CPU 实时速度确实有用,所以落在 60–71 这个实用开源更新区间。
一句话点评
有人把语音识别管线从 Parakeet 换成了 Nemotron 3.5 ASR,打包成 Docker 镜像。一个模型支持 40 多种语言,原生支持流式识别(不用等整段音频传完再出字),还附了流式和文件上传的客户端示例。CPU 上用 onnxruntime-genai 跑,速度是实时的 4.5 倍——也就是处理 1 秒音频只要 0.22 秒,延迟很低。 短评:一个模型覆盖 40+ 语言,C...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
10:53
6d ago
Product Hunt · AI· rssEN10:53 · 06·07
AgentCAD:让代码型AI自己画3D零件图的开源工具
AgentCAD 是一个免费开源工具,专门给 Claude Code、Codex 这类编程智能体用的。你给它一段文字描述、一张草图或一张图片,它就能写出 build123d 或 CadQuery 脚本,然后自动检查代码有没有错、几何体是否封闭(水密)、尺寸对不对,最后从各个角度渲染出来。智能体在你看之前就把错误修好了。输出是交互式 3D 查看器,外加 ...
#Code#AgentCAD#Claude Code#Codex
精选理由
开源工具,给Claude Code、Codex这类编程智能体加CAD能力。方向有意思但受众窄。命中H和K,没命中R。分数在60-71区间,不推荐上首页。
一句话点评
AgentCAD 让 Claude Code 这类编程智能体直接写 3D 零件脚本,还能自动检查代码和几何体是否封闭(水密),修完错才给你看。免费开源,输出 STEP/STL/GLB 文件,可直接打印或编辑。但正文没披露支持哪些智能体框架,也没说复杂装配体表现如何,这点先别太激动。如果是真的,能省掉人工反复调脚本的功夫。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
10:13
6d ago
AI HOT 精选· aihot-apiZH10:13 · 06·07
Her · हेर:Claude Code 会话分析工具
Her 是一个开源的 Claude Code 会话分析工具,你只需上传 .jsonl 会话文件,它就能自动还原出整个操作过程,并用大白话告诉你:哪些轮次执行了高风险操作(比如部署、改配置、碰密钥),以及上下文预算到底花在了哪里。分析引擎是纯规则判断,不依赖任何第三方 AI API;只有生成英文报告和建议时才调用本地的 Nemotron-Mini-4B-...
#Agent#Tools#Safety#Claude Code
精选理由
HKR 三项都过,但这是 Hugging Face 黑客松级别的工具,正文没披露用户数、基准对比或深度集成,属于 60–71 分的小工具区间,所以 tier 设为 all。
一句话点评
开源工具,上传 Claude Code 的 .jsonl 日志就能自动还原操作过程,标出高风险动作(部署、改配置、碰密钥)和上下文预算花在哪。分析引擎纯规则判断,不调第三方 API;只有生成英文报告时才用本地的 Nemotron-Mini-4B 模型。数据只留在当前 Space 的私有空间,用完自动删。目前只支持 Claude Code 的日志格式,其他 agent 用不了。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
10:00
6d ago
FT · 科技· rssEN10:00 · 06·07
沃尔玛对员工说:AI 是来帮你干活,不是来抢饭碗的
沃尔玛向员工喊话,说引入 AI 是为了改善工作,不是取代人。正文没披露具体用了什么工具、影响了多少岗位、以及部署时间表,所以这更像一个安抚姿态,不是落地计划。目前信息缺口很大,没法判断实际影响。
#Walmart#Commentary
精选理由
FT的权威性给这条劳工故事加了点分量,H和R两个信号都在。但K不成立,因为工具、人数、时间表都没披露,所以够不上精选。
一句话点评
沃尔玛给员工发定心丸:AI 是来帮忙的,不是来抢饭碗的。但正文没披露具体用了什么工具、影响了多少岗位、以及部署时间表,所以这更像一个安抚姿态,不是落地计划。目前信息缺口很大,没法判断实际影响。 短评:安抚员工的话术,缺细节,先别当真。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
09:50
6d ago
r/LocalLLaMA· rssEN09:50 · 06·07
怎么提高大模型的提示处理速度?
一位用户在24GB显存的7900XTX显卡上跑Qwen模型,上下文拉到230k时,prefill速度从850 t/s掉到350 t/s(160k上下文时)。他提到用HIP(AMD的GPU加速库)能让提示处理快10%,但生成token更慢、显存占用更高。正文没披露具体优化方法,只说了现象和硬件限制。
#Inference-opt#Agent#Qwen#Reddit
精选理由
这是一条Reddit单用户排障帖,没有可复现的修复方案或新机制,属于低价值经验分享。HKR的K和R达标,但H不达标,整体保留在低分档。
一句话点评
7900XTX 跑 Qwen,上下文从 160k 拉到 230k,prefill 速度从 850 t/s 掉到 350 t/s,降了快 60%。用户说用 HIP 能让提示处理快 10%,但生成更慢、显存更高——这优化有点拆东墙补西墙。正文没披露具体怎么调的,只说现象和硬件限制。对本地跑长上下文的用户是个参考:显存 24GB 是瓶颈,长文预填充掉速明显,HIP 的收益有限且副作用大。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K1·R1
09:45
6d ago
r/LocalLLaMA· rssEN09:45 · 06·07
三块 Jetson Orin Nano Super 组集群跑大模型
Reddit 用户 East-Muffin-6472 发帖分享如何把三块 Jetson Orin Nano Super 拼成一个集群,每块有 1024 个 CUDA 核心、8GB 统一内存和 6 个 Cortex-A78 CPU 核心。帖子只讲了搭建步骤,说后续会做分布式推理和训练演示,但没给任何跑分或延迟数据。三块加起来也就 24GB 显存,跑 7B...
#Inference-opt#NVIDIA#Reddit#East-Muffin-6472
精选理由
HKR 三项都沾边但都很浅:帖子只给了硬件规格和搭建步骤,没有跑分、功耗、延迟或可复现的测试结果,信息缺口明显。三块拼起来显存才 24GB,跑 7B 模型勉强够用,但实际推理速度、通信开销、能效比都没说,别急着当性能方案。
一句话点评
三块 Jetson Orin Nano Super 拼集群,总显存才 24GB,跑 7B 模型都勉强。帖子只讲了怎么接线装驱动,没给任何跑分或延迟数据,分布式推理到底快不快完全未知。动手党可以看看,但别指望性能翻倍。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
09:43
6d ago
Hacker News 首页· rssEN09:43 · 06·07
不用训练的单图扩散模型,一张图就能生成百万像素新图
这篇 CVPR 2026 论文提出了一种不需要训练的单图扩散模型。传统方法要拿一张图反复训练几小时,它直接拿这张图在不同尺度上切出的小块(patch)当数据集,因为小块维度低、数量有限,可以用一个数学闭式解(最优去噪器)来算得分函数,完全跳过神经网络训练。效果上,它声称生成质量和多样性都超过了需要训练的单图扩散模型,还能做文字风格迁移、图像对称化、重定...
#Vision#Inference-opt#Research release
精选理由
HKR-H 靠“免训练”这个反直觉钩子通过。HKR-K/R 不通过,因为这条 feed 只丢了个链接,方法、指标、代码、对从业者的实际影响一概没提。
一句话点评
CVPR 2026 这篇提出不用训练的单图扩散模型:把原图切成不同尺度的小块当数据集,因为小块维度低、数量有限,直接用数学闭式解算去噪器,跳过神经网络训练。声称生成质量和多样性超过需要训练的方法,还能做文字风格迁移、图像对称化。亮点是快——宣称百万像素图一秒生成,十亿像素几分钟。但正文没披露与训练方法的具体对比基准、运行时间实测数据,也没说代码是否开源。这点先别太激动,等看到消融实验和复现结...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
09:09
6d ago
FT · 科技· rssEN09:09 · 06·07
英国对Palantir的依赖值得警惕
FT这篇标题直接点出英国政府过度依赖Palantir的风险。正文没披露合同金额、系统范围、时间表或替代方案,信息缺口明显。核心警告是:政府应该选最好的技术,而不是被一家供应商锁死。对AI从业者来说,这提醒了政企合作中vendor lock-in的现实问题——即使技术再强,单一依赖也会让议价权和灵活性打折。
#Palantir#UK Government#Financial Times#Policy
精选理由
HKR-H和HKR-R通过,因为Palantir与英国政府绑定是活生生的政策和竞争议题。HKR-K不通过:没有合同金额、系统范围或新文件披露,所以只能归入泛评论档。
一句话点评
FT这篇评论警告英国政府过度依赖Palantir,核心风险是vendor lock-in——一家供应商锁死,议价权和灵活性都会打折。正文没披露合同金额、系统范围或替代方案,信息缺口明显。对AI从业者来说,这是政企合作的现实提醒:技术再强,单一依赖也会让政府失去选择权。短评:单一供应商依赖风险,FT点出但缺细节。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
09:00
6d ago
最佳拍档· atomZH09:00 · 06·07
李飞飞团队发布GPIC图像数据集:1亿张图,想做下一代ImageNet
斯坦福李飞飞团队放出GPIC数据集,号称1亿张图片,目标是接替ImageNet成为新一代图像基准。但正文没披露数据来源、版权处理方式、具体评测结果以及开放下载条件。1亿张图规模确实大,但没说明有多少是私有数据、多少来自公开爬取,版权风险未知。也没给FID等指标对比现有数据集,所以暂时没法判断它比ImageNet或DINOv2好多少。如果后续开源且版权干...
#Vision#Benchmarking#Fei-Fei Li#Stanford
精选理由
HKR三项都过:李飞飞+1亿图是天然钩子;正文只给了标题级信息,来源、版权、基线、下载条件全缺,知识缺口明显;基准饱和、版权争议、私有数据都是从业者日常痛点。分数卡在60-71区间合理,因为正文没给出能提分的实质评测或开放细节。
一句话点评
李飞飞团队放出GPIC数据集,号称1亿张图,目标是接替ImageNet。规模确实大,但正文没披露数据来源、版权处理方式和评测指标,也没说开放下载条件。暂时没法判断它比ImageNet或DINOv2好多少,版权风险未知。如果后续开源且版权干净,会是视觉基准的重要补充,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
08:58
6d ago
彭博科技· rssEN08:58 · 06·07
英国政府要直接买本土AI芯片,留住自家公司别跑
据《每日电讯报》报道,英国政府打算直接向本土科技公司采购AI芯片,用订单把企业留在英国。正文没披露采购金额、具体公司名单和时间表。这招相当于政府当大客户,给本土芯片公司一个稳定收入,降低它们搬去美国或亚洲的动力。如果真落地,对英国AI硬件创业公司是个直接利好,但规模多大、能不能执行到位,目前信息不够判断。
#Inference-opt#The Telegraph#Policy
精选理由
HKR-K和HKR-R通过:英国政府直接采购本土AI芯片,属于AI基础设施政策信号。正文没披露采购金额、供应商名单和时间表,信息缺口大,所以重要性压到64,不上精选。
一句话点评
英国政府打算直接掏钱买本土AI芯片,用订单把公司留在英国。这招比补贴更直接——政府当大客户,给创业公司一个稳定收入。但正文没披露采购金额、具体公司名单和时间表,规模多大、能不能执行到位,目前信息不够判断。如果真落地,对英国AI硬件创业公司是个直接利好,但先别太激动,等细节出来再说。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
07:24
6d ago
r/LocalLLaMA· rssEN07:24 · 06·07
没显卡也能跑 Gemma 4,一台旧电脑就够了
Reddit 用户用一台 i5-8500、32GB 内存、无独显的旧 Linux 台式机,跑起了 Gemma 4 的 26B-A4B 模型,速度约 7 tokens/s。这台机器二手价才 150 美元,说明大模型推理的门槛比想象中低。不过这个速度只适合跑跑小任务或测试,离实时对话还差得远。正文没披露具体量化精度和上下文长度,这点先别太激动。
#Inference-opt#Gemma#Koboldcpp#Reddit
精选理由
HKR三项全过:旧CPU跑26B模型的反差够吸引人,配置、工具和速度数据都给了,而且精准命中本地AI用户对硬件成本的焦虑。但来源是单条Reddit帖子,没披露量化精度和上下文长度,可复现性存疑,所以分数压在60-71区间。
一句话点评
一台150美元的旧台式机(i5-8500,32GB内存,无独显)就能跑Gemma 4的26B-A4B模型,速度约7 tokens/s。这个速度做实时对话太慢,但跑跑小任务或测试完全够用,说明大模型推理门槛比想象中低。不过正文没披露量化精度和上下文长度,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
07:09
6d ago
AI 群聊日报· atomZH07:09 · 06·07
群聊日报:AI 提效不等于搞钱,Vite 1.3 亿周下载却难变现
今天群里最热的讨论是“AI 提效到底能不能搞到钱”。结论很清醒:提效是手段,但跟搞钱没有必然联系——效率高了,钱可能被老板拿走,或者大家都在提效,你也没多赚。真正能打通通道的是自己创业,用 AI 降低生产成本。Vite 周下载 1.3 亿次,但全部价值在本地完成,没有计费点,最终被 Cloudflare 收购。AI agent 在系统提示词里硬编码“P...
#Agent#Code#VoidZero#Vite
精选理由
这是群聊日报,标题太泛,不是一手消息。但 1.3 亿周下载和 agent 硬编码案例有信息量,对关注 AI 编程和开源变现的人有用,不到头条级别。
一句话点评
群聊日报的核心讨论:AI提效不等于搞钱。Vite周下载1.3亿次但变现难,因为价值全在本地完成,最终被Cloudflare收购。AI agent在系统提示词里硬编码“Prefer Vite”,间接控制了生态。另一个看点:Opus 4.7/4.8继续偷懒说日语,GPT 5.5在长任务中稳定上位。短评:提效是手段,搞钱得自己创业,用AI降成本。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:00
6d ago
NVIDIA 博客· rssEN07:00 · 06·07
英伟达在韩国网吧展示RTX Spark芯片,1440p游戏超百帧
英伟达拉着《绝地求生》开发商 KRAFTON、NCsoft 和《英雄联盟》冠军战队 T1,在韩国 PC bang(网吧)里展示了 RTX Spark 超级芯片。官方说这玩意跑 1440p 分辨率下的 3A 大作能超过 100 帧,支持 DLSS 4.5 和 Reflex 低延迟技术,还能在本地跑 AI 任务。对开发者来说,这意味着以后网吧机器不仅能打游...
#Agent#Inference-opt#Tools#NVIDIA
精选理由
触发硬排除-5:英伟达这篇主要是合作伙伴庆祝和RTX Spark展示,AI只是附带功能。HKR三项全不满足,因此上限为excluded。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H0·K0·R0
06:14
6d ago
AI HOT 精选· aihot-apiZH06:14 · 06·07
Opus 4.8 缓存命中率和实际价格现在能实时看了
OpenRouter 在定价页面新增了 Claude Opus 4.8 的实时缓存命中率和历史流量数据,方便你对比不同供应商的实际花费。缓存命中率高意味着重复请求能打折,有效价格更低。不过正文没披露各家具体差价,想省钱还得自己点进去看。
#Inference-opt#OpenRouter#Anthropic#Claude Opus 4.8
精选理由
这是一个 OpenRouter 定价可见性的小更新,不是模型能力或协议变化,适合放在 60–71 的产品更新区间。HKR 三项都过,但信息量有限,不涉及模型本身。
一句话点评
OpenRouter 给 Opus 4.8 加了实时缓存命中率看板,缓存命中高等于重复请求打折,有效价格更低。但正文没披露各家具体差价,想省钱还得自己点进去比。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:58
6d ago
彭博科技· rssEN05:58 · 06·07
韩国总统提名科技部长韩成淑任总理,主推AI增长
韩国总统李在明提名中小风险企业部长韩成淑为总理,她此前负责科技创业政策。正文被彭博社的机器人检测墙挡住,没有披露具体的AI增长计划、任期或国会确认流程细节。
#Lee Jae Myung#Han Seong-sook#Policy#Personnel
精选理由
H和R通过,因为技术官员与韩国AI增长议程挂钩。K不通过:没有披露政策机制、预算或时间表,所以这条只适合放普通推送。
一句话点评
李在明提名中小风险企业部长韩成淑当总理,标签是“科技专家”,想用她推AI增长。但正文被彭博机器人墙挡住,具体AI计划、任期、国会确认流程全没披露。目前只能确认人事动作,政策细节为零。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
05:57
6d ago
r/LocalLLaMA· rssEN05:57 · 06·07
Dense 模型比 MoE 更扛量化压缩,Gemma4 26B 在 4-bit 下 45k 上下文会循环
Reddit 用户实测发现,Dense 架构(如 Qwen 3.5 4B)在 4-bit 量化下表现稳定,而 MoE 架构的 Gemma4 26B(A4B)在 45k 上下文长度时出现输出循环,换成 6-bit 量化才解决。这说明 MoE 对低比特量化更敏感,压缩后容易丢路由逻辑。不过测试用的是 llama.cpp 默认采样,没调参数,所以循环问题可能...
#Inference-opt#Gemma#Qwen#llama.cpp
精选理由
一条 Reddit 实测帖,核心发现是 MoE 架构在 4-bit 量化下长上下文会循环,6-bit 才解决,而 Dense 模型同样量化下稳定。这个对比对本地部署用户有参考价值,但测试用的是 llama.cpp 默认采样,没调参数,循环问题可能跟采样也有关系,正文没披露具体采样设置。另外只测了一个 MoE 模型和一个 Dense 模型,样本量小,结论不能直接推广。整体信息密度中等,适合推给所有关注量化部署的从业者。
一句话点评
短评:MoE 对低比特量化更敏感,长上下文容易崩,但测试条件有点糙。 点评:Reddit 用户实测发现,MoE 架构的 Gemma4 26B(A4B)在 4-bit 量化下跑到 45k 上下文长度时输出开始循环,换成 6-bit 才稳住;而 Dense 架构的 Qwen 3.5 4B 全程稳定。这说明 MoE 的路由逻辑在低比特压缩下更容易丢信息,长上下文时问题更明显。不过测试用的是 ll...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
05:53
6d ago
彭博科技· rssEN05:53 · 06·07
中国首个预制化算力枢纽投运,数据中心供电像搭积木
央视报道,中国首个预制化算力枢纽已投运,把数据中心供电系统做成标准模块,现场拼装就能用,比传统建设方式更快、更便宜。正文没披露具体位置、总算力规模和省了多少钱,所以实际降本效果还不清楚。
#China Central Television#Product update
精选理由
HKR-H 和 HKR-R 过关,但 HKR-K 偏弱:确认了一个预制化算力枢纽在运行,但没披露位置、容量和成本降幅。跟 AI 基础设施相关,但证据密度只够泛行业报道。
一句话点评
央视报道中国首个预制化算力枢纽投运,把数据中心供电系统做成标准模块,现场拼装。优点是快、便宜,但正文没披露具体位置、总算力规模和实际省了多少钱,所以降本效果还不清楚。短评:预制化供电模块,省工期省成本,但缺具体数字,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
04:30
6d ago
r/LocalLLaMA· rssEN04:30 · 06·07
ChromaDB 免费版半年没做混合搜索,有人问 200 页以上长文档 RAG 用什么替代
Reddit 用户 FrozenBuffalo25 在 LocalLLaMA 版问:ChromaDB 免费单节点版用了半年,发现它没有内置混合搜索和 BM25(传统关键词匹配),所以想找开源、能本地部署的替代方案,用来做 200 页以上长文档的 RAG(外挂资料库检索)。需求包括语义搜索、重排序、精确字符串匹配,以及按页码或 ULID(唯一 ID)直接...
#RAG#Embedding#ChromaDB#FrozenBuffalo25
精选理由
HKR-R 通过是因为 RAG 检索的痛点确实存在,但 HKR-H 和 HKR-K 不通过:这只是一条 LocalLLaMA 版的需求帖,没有对比测试、发布或可验证的结论。
一句话点评
ChromaDB 免费版缺混合搜索和 BM25,用户找替代方案做 200 页以上长文档 RAG。需求包括语义搜索、重排序、精确字符串匹配。正文没披露具体替代品推荐,信息缺口明显。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H0·K0·R1
04:00
6d ago
● P1FT · 科技· rssEN04:00 · 06·07
OpenAI 计划对 ChatGPT 进行自发布以来最大规模改版
FT 这篇报道的正文被付费墙和安全验证挡住了,只拿到了一个摘要片段。里面提到 OpenAI 正在筹划 ChatGPT 自发布以来最大规模的一次改版,想把聊天机器人重新定位成通往更高利润产品的入口,为可能的 IPO 铺路。公司估值写的是 8500 亿美元。至于这次改版到底会加什么功能、什么时候上线、怎么收费、产品机制是什么,正文都没披露,这些关键信息目前...
#OpenAI#ChatGPT#Product update#Funding
精选理由
FT 这篇报道的正文被付费墙和安全验证挡住了,只拿到一个摘要片段。里面提到 OpenAI 正在筹划 ChatGPT 自发布以来最大规模的一次改版,想把聊天机器人重新定位成通往更高利润产品的入口,为可能的 IPO 铺路。公司估值写的是 8500 亿美元。至于这次改版到底会加什么功能、什么时候上线、怎么收费、产品机制是什么,正文都没披露,这些关键信息目前是空的。所以这条消息的新闻价值在于信号本身——OpenAI 在认真考虑把 ChatGPT 从免费流量池变成付费产品管道——但具体怎么落地、靠不靠谱,现在完全没法判断。我会先打个折,等有功能细节和定价策略...
一句话点评
FT 原文被付费墙挡了,只能看到标题,具体改版细节和验证方式都看不到。
锐评
这条消息目前只有标题能看,FT 的报道正文被 403 挡在付费墙后面,等于我们手里只有“OpenAI 要对 ChatGPT 做发布以来最大改版”这个判断,以及另一个来源给的“要变 AgentGPT”的概括。 从标题推测,这次改版可能让 ChatGPT 更像一个能自主执行任务的 agent,而不是现在一问一答的聊天模式。但具体是加了工具调用、长期记忆、还是能自己拆解多步任务,正文没披露就没法确认。 我会先打个折:标题里的“最大”是 OpenAI 自己说的还是 FT 的判断,这点不清楚。另外改版是已经上线了还是还在计划阶段、有没有用户测试数据、对成本和延迟的影响多大,这些关键信息都缺。等能看到完整报道或者 OpenAI 自己发公告再下判断会更稳。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
03:38
6d ago
r/LocalLLaMA· rssEN03:38 · 06·07
GraphKV:用图嵌入给 KV 缓存瘦身,压缩 3.36 倍还能保住精度
GraphKV 把大模型推理时的 KV 缓存压缩了 3.36 倍,测试用的是 Qwen2.5-7B 的 NF4 量化版,32K token 场景下缓存从 1.88GB 降到 0.56GB。压缩后的余弦相似度 0.9903,top-10 命中率 1.00,argmax 匹配也全对——说明关键信息基本没丢。方法是用图嵌入模型给缓存里的 key-value ...
#Inference-opt#Embedding#GraphKV#Qwen
精选理由
H/K/R 三项都过:文章给出了具体的 KV 缓存压缩倍数和测试数据。但来源只有一条 Reddit 帖子,没有论文、仓库或第三方复现,所以分数压在 60–71 区间。
一句话点评
GraphKV 用图嵌入把 KV 缓存压缩了 3.36 倍,Qwen2.5-7B 在 32K token 场景下缓存从 1.88GB 降到 0.56GB,余弦相似度 0.99,关键信息几乎没丢。但正文被屏蔽,没披露图嵌入模型大小、压缩耗时和长上下文(比如 128K)表现。如果图嵌入本身开销小,这招对本地部署挺实用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
03:32
6d ago
AI HOT 精选· aihot-apiZH03:32 · 06·07
宝玉实测:Opus 4.8 设计效果远好于 GPT-5.5
宝玉对比了 GPT-5.5 和 Opus 4.8 的设计输出,结论是 Opus 4.8 明显更强。他用了一个叫 baoyu-design 的本地工具,装好之后描述屏幕需求就能生成 HTML,点击预览里的任意元素还能直接发修改指令。官方推荐搭配 Opus 4.8 用。工具在 GitHub 上,但正文没披露具体测试任务和评价标准,所以这个“远优于”目前还是...
#Code#Tools#Baoyu#GPT-5.5
精选理由
HKR 三项都过,但来源是单条 X 对比,没披露样本量、任务设置和测量结果。属于实用评论的上限,不到精选。
一句话点评
宝玉拿 GPT-5.5 和 Opus 4.8 比设计输出,结论是 Opus 4.8 明显更强。他用的 baoyu-design 工具挺有意思:装好后描述需求就能生成 HTML,点预览里的元素还能直接发修改指令。官方推荐搭配 Opus 4.8 用。不过正文没披露具体测试任务和评价标准,这个“远优于”目前还是个人体验,得自己试了再信。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
03:30
6d ago
机器之心 · 公众号· rssZH03:30 · 06·07
RoboScience 团队 10 篇论文入选 ICRA 2026,双机械臂泛化方案拿下最佳论文提名
邵林团队在 ICRA 2026 上投中 10 篇论文,其中 Bi-Adapt 被评为最佳论文决赛作品。这篇论文解决的是双机械臂在没见过的新任务上怎么泛化——比如让机器人学会开瓶盖后,也能开没见过的罐子。他们在 5 类新任务上模拟成功率 59%–70%,这个数字不算惊艳,但胜在任务类型跨度大,说明方法有一定通用性。正文没披露真实机器人上的结果,这点先别太激动。
#Robotics#Vision#Multimodal#RoboScience
精选理由
HKR-H和HKR-K靠ICRA 2026论文数量和双机械臂泛化成功率达标。HKR-R偏弱,因为这篇更像是团队研究报道,缺少产品落地或市场影响,所以分数落在60–71区间。
一句话点评
邵林团队在ICRA 2026投中10篇论文,Bi-Adapt获最佳论文决赛。核心是双机械臂在新任务上泛化,比如会开瓶盖后也能开没见过的罐子。5类新任务模拟成功率59%–70%,数字不算惊艳,但任务跨度大,说明方法有一定通用性。正文没披露真实机器人结果,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
03:24
6d ago
r/LocalLLaMA· rssEN03:24 · 06·07
open-deepthink 更新:知识蒸馏模式正式上线,195 项测试全过
开源项目 open-deepthink 发布 beta-0.0.3,新增固定 7 层 QNN 的知识蒸馏模式。作者称修复了 11 个 bug,195 项测试全部通过,运行结果可导出结构化 JSON 和拓扑存档。正文没披露蒸馏效果的具体指标,比如学生模型在什么任务上提了多少分,所以这点先别太激动。
#Agent#Fine-tuning#Tools#open-deepthink
精选理由
HKR-K和HKR-R靠7层QNN蒸馏模式与195/195测试通过,但HKR-H偏弱。单一Reddit来源加上项目知名度有限,落在60–71的小型开源更新区间;没有硬排除规则适用。
一句话点评
open-deepthink 发了 beta-0.0.3,新增固定 7 层 QNN 的知识蒸馏模式,说白了就是让大模型教小模型学推理。作者说修了 11 个 bug,195 项测试全过,结果能导出结构化 JSON。但正文没披露蒸馏效果的具体指标,比如学生模型在什么任务上提了多少分,所以这点先别太激动。项目依赖 Gemini 和 OpenRouter,不是纯本地方案,部署时注意 API 成本和延迟。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
03:17
6d ago
Product Hunt · AI· rssEN03:17 · 06·07
agmsg:让 Claude Code、Codex 等 AI 编程助手直接互发消息,不用再手动复制粘贴
agmsg 是个开源小工具,作者是 Koichi Fujikawa,上线当天冲到了 Product Hunt 第 5 名。它解决了一个很实际的痛点:你同时用 Claude Code、OpenAI Codex CLI、Gemini CLI 或 Copilot CLI 写代码时,得不停在它们之间复制粘贴。agmsg 让这些不同厂商的 AI 编程助手通过一个...
#agmsg#Claude Code#OpenAI Codex CLI#Open source
精选理由
痛点抓得准,Product Hunt 冲到第 5 也说明有人买单,但文章没给任何实现细节,所以分数卡在 62。
一句话点评
agmsg 是个开源小工具,让 Claude Code、Codex CLI 等不同厂商的 AI 编程助手通过一个共享的 SQLite 数据库直接通信,不用再人工复制粘贴。它只依赖 bash 和 sqlite3,无需守护进程或网络,安装成一个 Agent Skill 就行。上线当天冲上 Product Hunt 第 5 名,说明开发者确实被多工具切换搞烦了。但正文没披露性能数据或已知限制,比如...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
01:37
6d ago
Hacker News 首页· rssEN01:37 · 06·07
Tokenomics:量化AI编程智能体把token花在了哪里
这篇论文拆解了用大模型多智能体系统(LLM-MA)做软件开发时,token到底消耗在哪些环节。作者用ChatDev框架跑了30个开发任务,模型用的是GPT-5推理模型,把流程拆成设计、编码、补全、代码审查、测试和文档六个阶段。核心发现:代码审查(Code Review)这个反复迭代的环节吞掉了平均59.4%的token,而且输入token占了总消耗的5...
#Agent#Code#Research release
精选理由
HKR-H和HKR-R通过,因为标题直接指向编码智能体的token成本问题。HKR-K不通过:RSS条目没有给出方法、样本或发现,所以只能放在较低的“有趣”档位。
一句话点评
这篇论文拆了多智能体写代码的 token 账本:用 GPT-5 跑 30 个开发任务,发现代码审查(反复改代码)吞掉 59.4% 的 token,而且输入 token 占 53.9%,说明大部分钱花在喂上下文而不是生成新内容。结论挺直观——写代码不贵,改代码贵。但样本只有 30 个任务,全用 ChatDev 框架,没披露任务复杂度分布,通用性要打折。对做 agent 成本优化的人有参考价值。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
01:09
6d ago
最佳拍档· atomZH01:09 · 06·07
苹果新图像压缩技术PICO:体积砍掉三分之二,肉眼几乎看不出区别
苹果发了个叫PICO的图像压缩方法,号称能把图片文件大小减少约三分之二,同时人眼看不出画质损失。它属于“学习型编解码器”——就是用神经网络来压缩和解压图片,不是传统JPEG那套算法。标题里提到用了“一次性上下文模型”和“创新损失函数”,但正文没披露具体模型结构、训练数据集、压缩时的比特率设置,也没说主观评测是怎么做的(比如找了多少人、在什么屏幕上看的)...
#Vision#Apple#Research release
精选理由
苹果PICO这条信息,标题有苹果品牌和“体积减少三分之二”的硬数字,钩子够强,所以H和K都过了。但正文只停留在标题级描述,没给模型结构、训练数据集、比特率设置、主观评测方法(比如多少人、什么屏幕),信息缺口大,R过不了。整体判断维持原评分不变。
一句话点评
苹果发了PICO图像压缩,号称文件体积能砍掉三分之二,人眼看不出差别。它用神经网络替代传统JPEG算法,属于学习型编解码器。但正文没披露模型结构、训练数据集、比特率设置,也没说主观评测找了多少人、用什么屏幕看。结论先打个折:效果可能不错,但验证条件不明,离落地还有距离。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
01:00
6d ago
量子位 · 公众号· rssZH01:00 · 06·07
华尔街投行花17万上一节AI课,教的是怎么用AI干活
一家叫Wall Street Prompt的公司给花旗、美银等金融机构开AI培训课,一节课收费2.5万美元(约17万人民币),还计划推出面向个人的1500美元在线课。正文没披露课程具体教什么,但从定价看,华尔街愿意为“怎么把AI塞进金融业务流程”付高价。
#Agent#Tools#Wall Street Prompt#Citi
精选理由
核心信息是华尔街机构愿意为AI培训课付高价,但正文没披露课程具体教什么,所以判断主要靠定价和客户名单。属于课程变现类新闻,不是模型或技术更新,重要性在60-71区间合理。
一句话点评
华尔街一家叫 Wall Street Prompt 的公司给花旗、美银开 AI 培训课,一节课收 2.5 万美元(约 17 万人民币),还计划推 1500 美元的在线课。正文没披露课程具体教什么,但从定价看,华尔街愿意为“怎么把 AI 塞进金融业务流程”付高价。短评:17 万一节课,华尔街抢着付,但正文没写教什么,先别急着跟风。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
00:00
6d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 06·07
ChatGPT Dreaming V3 的合规死结
OpenAI 的 Dreaming V3 自动记忆功能,每次聊天后后台自动合成用户画像,效率提升五倍并首次向免费用户开放。但作者指出,这种“不问、不让你看、自己在后台跑”的设计,与欧盟 AI 法案和 GDPR 的透明度、知情权、反对权等要求直接冲突。三家大模型(OpenAI、Google、Anthropic)的自动记忆功能均未对欧洲开放,不是某一家的问...
#Memory#Safety#OpenAI#Policy
精选理由
HKR三项都过,但这是一篇评论性文章,讲的是Dreaming V3记忆功能与欧盟法规的冲突,正文没有披露官方正式上线、执法案例或量化影响(比如罚款金额、用户投诉量),所以分数压在60–71区间。
一句话点评
短评:自动记忆的合规死结:越自动越难合规,不是取舍是绑定。 点评:OpenAI Dreaming V3 自动记忆升级为后台静默合成用户画像,效率提5倍且首次向免费用户开放。但文章点出核心矛盾:自动记忆的三大设计——不问你、后台跑、持续演化——恰好撞上欧盟AI法案和GDPR的透明度、知情权、反对权等全套义务。三家大模型(OpenAI、Google、Anthropic)的自动记忆均未对欧洲开放...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1

更多

频道

后台