ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-06-08 · 星期一2026年6月8日
17:12
4d ago
AI HOT 精选· aihot-apiZH17:12 · 06·08
Claude Code 上线一周年:验证与自动模式回顾
Claude Code 发布一周年,团队回顾了验证最佳实践、自动模式、例程和循环。第一个演示只收到两个 Slack 表情回应,说明早期关注度不高。正文没披露具体用户数或采用率,但视频链接里有更多细节。
#Agent#Code#Tools#Claude Code
精选理由
只有 R 成立:Claude Code 用户确实在意自动模式和验证流程。H 和 K 不成立,因为正文只给了两个 Slack 表情回应,没有披露机制、定价或可复现的最佳实践。
一句话点评
Claude Code 满一周年,团队自曝首个演示只收到两个 Slack 表情回应,说明早期冷启动确实难。回顾重点在验证最佳实践、自动模式和循环,但正文没披露用户数或采用率,具体效果得看视频。对做 coding agent 的团队来说,验证和自动模式的设计思路值得参考,但别当成功学案例。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
17:07
4d ago
Hacker News 首页· rssEN17:07 · 06·08
马萨诸塞州通过隐私法案,禁止出售精确位置数据
马萨诸塞州通过了一项新隐私法案,核心是禁止买卖精确位置数据——也就是手机或设备能定位到你具体在哪个街区的那些数据。法案正文没披露生效日期、罚多少钱、覆盖哪些公司,所以实际约束力还不清楚。这条新闻在 Hacker News 上拿了 31 个点赞和 2 条评论,热度不算高,但方向值得留意:美国各州正在加速补位置数据的监管空白。
#Massachusetts#TechCrunch#Hacker News#Policy
精选理由
这是隐私政策新闻,不是 AI 产品或模型事件。HKR-H 和 HKR-K 勉强达标,但帖子只给出了法案方向,没有生效日期、罚款或适用范围,实际约束力不清楚。
一句话点评
马萨诸塞州通过新法案,禁止买卖精确位置数据——就是手机能定位到你具体在哪个街区的数据。法案正文没披露生效日期、罚多少钱、覆盖哪些公司,所以实际约束力还不清楚。Hacker News 上 31 个点赞、2 条评论,热度不高,但方向值得留意:美国各州正在加速补位置数据的监管空白。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K1·R0
16:52
4d ago
Hacker News 首页· rssEN16:52 · 06·08
Gitdot:一个用 Rust 写的 GitHub 替代品,开源、反 AI
Gitdot 是一个开源的 GitHub 替代品,用 Rust 写,主打键盘驱动的命令行风格界面,目标首屏渲染时间 100 毫秒。目前支持注册、组织、公开/私有仓库,以及从 GitHub 导入仓库(只读镜像或完整迁移)。但还不支持 issues、pull requests 和 CI,这些功能计划在 7 月 15 日的 v0.2 版本中开始加入。项目明确...
#Code#Tools#Gitdot#GitHub
精选理由
核心事实是一个代码托管替代品,不是AI产品或模型更新。缺少issues、PR和CI,目前功能有限,只能算低价值可浏览的全量推送。
一句话点评
Gitdot 是个用 Rust 写的开源 GitHub 替代品,主打键盘驱动的命令行界面,目标首屏渲染 100 毫秒。目前能注册、建组织、搞公开/私有仓库,还能从 GitHub 导入仓库(只读镜像或完整迁移)。但 issues、pull requests 和 CI 都还没做,计划 7 月 15 日的 v0.2 才开始加。项目明确反 AI,这点先别太激动——核心协作功能缺失,离替代 GitHu...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R1
16:50
4d ago
r/LocalLLaMA· rssEN16:50 · 06·08
NanoQuant:把大模型压到1比特,4B模型只剩1.15GB
有人放出了NanoQuant的PyTorch实现,目标是把稠密Transformer模型压到每权重1比特甚至更低。实测用Google Colab上的Nvidia L4跑了Qwen3-4B,3.5小时拿到一个1.15GB的模型——4B参数压到1GB出头,存储成本确实低。不过正文没披露量化后的推理速度或精度损失,这点先别太激动,1比特量化通常伴随明显质量下...
#Fine-tuning#Inference-opt#Code#NanoQuant
精选理由
HKR三项全过:给出了具体模型、大小和运行时间。没放到featured是因为它只是一个Reddit实现,没有披露困惑度、推理速度或基准对比。
一句话点评
有人把 NanoQuant 的 PyTorch 实现放出来了,目标是把大模型压到每权重 1 比特甚至更低。实测用 Google Colab 的 Nvidia L4 跑了 Qwen3-4B,3.5 小时拿到一个 1.15GB 的模型——4B 参数压到 1GB 出头,存储成本确实低。但正文没披露量化后的推理速度或精度损失,这点先别太激动,1 比特量化通常伴随明显质量下降。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
16:40
4d ago
r/LocalLLaMA· rssEN16:40 · 06·08
DeepSeek v4 Flash 在 Hopper 上跑到近 200 tok/s,一个月能处理 10 亿 token
Reddit 用户 Reddactor 用 Canada-Quant 的权重和 vLLM MTP 补丁,在 Hopper 上把 DeepSeek v4 Flash 跑到了 193 tok/s。开了 4 个 vLLM 并发线程后,声称能达到约 400 tok/s,一个月大概能处理 10 亿 token。这个速度对本地部署来说相当可观,但正文没披露具体硬件...
#Inference-opt#Agent#DeepSeek#Canada-Quant
精选理由
HKR 三项都达标:性能数字够具体,配置细节有新鲜度,且切中自部署场景的性价比需求。但来源是单条 Reddit 帖子,受众偏推理优化方向,所以分数压在 71,不上精选。
一句话点评
Reddit 用户 Reddactor 用 Canada-Quant 的量化权重和 vLLM 的 MTP 补丁,在 Hopper 上把 DeepSeek v4 Flash 跑到了 193 tok/s。开了 4 个并发线程后声称能到约 400 tok/s,一个月能处理 10 亿 token。这个速度对本地部署相当可观,但正文被屏蔽,没披露具体硬件配置(几张 H100?)、量化精度(4-bit ...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
16:21
4d ago
r/LocalLLaMA· rssEN16:21 · 06·08
他把一个本地大模型塞进了Unity游戏,没网也能跟NPC聊天通关
开发者 MorphLand 在 Unity 游戏《Simulation Simulator》里直接打包了一个本地 LLM,玩家靠自然对话推进剧情,有 5 种结局。全程不需要联网、不用云服务、不调 API。代价是语音合成和自动翻译被砍掉了——因为本地跑这些每轮对话要多等 10-20 秒,体验上扛不住。正文没披露具体用了什么模型、多大参数量,也没说打包后游...
#Agent#Memory#MorphLand#Unity
精选理由
HKR 三项都达标,因为这是一个有具体数字和取舍细节的本地 LLM 游戏实验,不是空谈。但影响面还窄,来源是 Reddit 自述,所以分数卡在 68,不上推荐位。
一句话点评
开发者把本地 LLM 塞进 Unity 游戏,玩家纯靠对话推进剧情,有 5 种结局。代价是砍掉了语音合成和自动翻译——本地跑这些每轮要多等 10-20 秒,体验扛不住。正文没披露具体模型和参数量,也没说打包后游戏多大。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:36
4d ago
r/LocalLLaMA· rssEN15:36 · 06·08
Nex N2 推理时爱用短词,像在说“几个字就够了”
有用户在本地跑 Nex N2 Pro,说它其实是 Qwen 3.5 397B 的微调版。推理过程里频繁出现“need”“maybe”这类短词,看起来像在走捷径。正文没披露具体评测数据,所以不清楚这种“短词推理”对准确率影响多大,但至少说明模型在尝试用更少的 token 做推理——如果真能保持效果,推理成本会降不少。
#Reasoning#Nex N2 Pro#Qwen#FullOf_Bad_Ideas
精选理由
HKR-H和HKR-R成立,因为模型特有的“少词推理”怪癖在LocalLLaMA用户群里很有话题性。HKR-K不成立:没有提示词、样本量或基线对比,这条信息只能算低价值讨论。
一句话点评
有用户发现 Nex N2 Pro 推理时频繁用“need”“maybe”等短词,怀疑是 Qwen 3.5 397B 的微调版。这种“短词推理”可能是在用更少 token 走捷径,如果效果不掉,推理成本能降不少。但正文没披露评测数据,不清楚对准确率影响多大,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
15:27
5d ago
● P1Hacker News 首页· rssEN15:27 · 06·08
小米MiMo-v2.5-Pro-UltraSpeed模型达到每秒1000tokens输出
小米和 TileRT 合作,把一个 1 万亿参数的大模型在 8 张普通 GPU 上跑到了每秒生成 1000 多个 token。他们用了两招:一是只对 MoE 专家模块做 FP4 量化,把模型体积和显存带宽压力打下来,同时保住推理质量;二是用了一种叫 DFlash 的投机解码方法,一次能猜对更长的 token 串,减少反复验证的等待时间。目前这个速度只在...
#Inference-opt#Xiaomi#MiMo#Product update
精选理由
小米把一个1万亿参数的MoE模型塞进8张普通GPU,靠FP4量化只压缩专家模块,再配上能一次猜对更长token串的DFlash投机解码,把生成速度拉到每秒1000多个token。这个速度如果是真的挺省钱,但正文没交代测试用的什么卡、上下文多长、精度损失多少,我会先打个折。
一句话点评
小米用8张普通GPU把1万亿参数模型跑到每秒1000+ tokens,但试用要申请、只开两周,先别太激动。
锐评
这条消息的核心看点不是“快”,而是“用普通硬件跑出了定制芯片的速度”。小米MiMo团队和TileRT系统团队合作,在一台标准的8卡GPU服务器上,让一个1万亿参数的MoE模型(混合专家模型)跑到每秒超过1000个token的输出。对比他们自己的定价,速度大约是标准版的10倍,但API价格只涨了3倍,这点挺实在。 他们主要用了两招:一是只对模型里占大头的“专家”模块做FP4低精度量化,其他部分保持原样,这样既压缩了体积又没怎么伤到模型能力;二是搞了个叫DFlash的投机解码方法,让模型一次能猜对更长的后续文本,减少了等待验证的次数。从放出的跑分图看,量化后的模型能力跟原版基本持平。 不过,正文没披露这个速度是在什么输入输出长度、什么并发数下测出来的,也没提首个token的延迟是多少。这些指标会直接影响“每秒1000 tokens”在实际业务里的含金量。另外,试用期只有两周,还得申请,能拿到多少资源、稳定性如何,都是未知数。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
15:21
5d ago
AI HOT 精选· aihot-apiZH15:21 · 06·08
OpenRouter 推出 Advisor:让小模型遇到难题时去问高级模型
OpenRouter 发布了一个叫 Advisor 的服务端工具,核心逻辑是:小模型卡住或陷入死循环时,可以临时去咨询一个更聪明的“顾问”模型,从而帮你把任务从贵的大模型迁移到更便宜的模型上。正文没披露支持哪些模型、差价多少,也没给出实测迁移成功率。
#Tools#Inference-opt#OpenRouter#Product update
精选理由
机制有意思,但正文没披露支持哪些模型、差价多少,也没给实测迁移成功率,信息缺口明显。算一个有趣的小产品更新,所以放在 70 分,不上精选。
一句话点评
OpenRouter 出了个叫 Advisor 的服务端工具,小模型卡住或死循环时,能临时去问一个更聪明的“顾问”模型。核心卖点是帮你把任务从贵的大模型迁移到便宜的模型上。但正文没披露支持哪些模型、差价多少,也没给实测迁移成功率。想法不错,但效果和成本节省都还是未知数。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:59
5d ago
r/LocalLLaMA· rssEN14:59 · 06·08
律师想本地跑 NotebookLM 翻车:GTX 1080 跑 Qwen 9B 只有 2.2 tok/s,模型还拒绝摘原文
一位律师在 Reddit 上吐槽,想用本地 RAG(外挂资料库)处理案件卷宗,配置是 i7-6700K + GTX 1080 8GB + 16GB 内存,试了 LM Studio 加 Big RAG。Qwen3.5 9B 模型一次只能输出约 2900 tokens,速度只有 2.2 tok/s——相当于读完一段话要等几十秒。更致命的是,两个测试模型都拒...
#RAG#Safety#Inference-opt#LM Studio
精选理由
这是一条 Reddit 上的个人求助帖,不是评测或产品发布。它提供了真实的硬件配置和速度数据(2.2 tok/s 很慢),也点出了法律场景下模型拒答的问题,但没有任何解决方案、基准测试或产品更新。信息量有限,胜在真实,适合作为社区讨论的引子,不适合作为行业趋势判断。
一句话点评
一位律师用i7-6700K+GTX 1080跑本地RAG处理卷宗,Qwen3.5 9B输出仅2.9 tok/s,读完一段话要等几十秒,而且模型拒绝摘录原文,只给泛泛的法律解释。这配置跑9B模型太勉强,8GB显存是瓶颈,速度慢到没法用。更坑的是安全对齐导致模型不敢输出原文,本地部署也白搭。正文没披露他用的具体RAG配置和分块策略,但核心问题很明确:硬件不够、模型太保守。想复现NotebookL...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
14:53
5d ago
彭博科技· rssEN14:53 · 06·08
Cipher 发垃圾债为亚马逊相关数据中心融资 8.1 亿美元
Cipher Digital 通过发行垃圾债(高风险高收益债券)筹集了 8.1 亿美元,用于建设一个与亚马逊绑定的数据中心项目。这笔融资成本较高,说明 AI 基础设施投资正在转向风险更高的债务工具。正文未披露该数据中心的具体规模、地点或亚马逊的长期租约细节。
#Cipher Digital#Amazon#Funding
精选理由
Bloomberg 这条消息给了一个具体数字:8.1 亿美元垃圾债,绑定了亚马逊的数据中心项目。AI 的关联停在基建融资层面,GPU 规模、模型训练用途、AWS 产品影响都没披露,所以对从业者的实操价值有限。
一句话点评
Cipher Digital 靠卖垃圾债(高风险高收益债券)筹了 8.1 亿美元,给亚马逊建数据中心。融资成本高,说明 AI 基建投资开始走风险更大的路子。正文没披露数据中心规模、地点和亚马逊租约细节,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R0
14:00
5d ago
Hacker News 首页· rssEN14:00 · 06·08
SoulsOnly.ttf:一款专为人类设计、AI 难以识别的字体,还配了专用键盘固件
这个项目发布了一套字体和配套的键盘固件,核心思路是让文字对人类可读,但对 AI 视觉识别系统(比如 OCR 或截图解析)不友好。字体本身做了变形,让机器难以直接提取字符;键盘固件则让你打字时能正常输入这些特殊字形。项目目前只有 11 个 Star、1 个 PR,正文没披露具体的抗识别测试结果或模型绕过率,所以效果到底多好还不清楚。思路挺有意思,但离实用...
#Safety#SoulsOnly.ttf#Hacker News#Open source
精选理由
HKR-H 和 HKR-R 靠反AI字体钩子和内容控制神经通过,但 HKR-K 不通过:没披露机制、模型测试或可复现证据。HN 热度低,所以留在 all 层。
一句话点评
一套字体+键盘固件,让文字对人类可读、对AI视觉系统(OCR/截图解析)难读。字体做了变形,打字时固件帮你正常输入。目前只有11个Star、1个PR,正文没披露抗识别测试结果或模型绕过率,效果多好不清楚。思路有意思,但离实用还远。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
14:00
5d ago
● P1OpenAI 博客· rssEN14:00 · 06·08
OpenAI 向 SEC 秘密提交 IPO 申请草案,上市时间未定
OpenAI 在 6 月 8 号确认,他们已经向美国证监会(SEC)秘密提交了一份 S-1 上市草案。公司自己说,反正文件大概率会泄露,不如主动公开。不过他们还没定上市时间,甚至可能拖很久,因为有些事在私有公司状态下更好办。提交这份文件只是给自己多留一个选择,如果时机合适,可以更快启动 IPO。至于打算融多少钱、公司估值多少,正文都没提。
#OpenAI#SEC#Funding
精选理由
HKR 三项全中:OpenAI 秘密交 S-1 是头部 AI 公司走向公开市场的实质性一步。我会先打个折,因为没披露融资金额和上市时间,所以没给到 95-100 那档。
一句话点评
OpenAI 秘密交表准备上市,但 S-1 草案不公开,估值、营收、亏损这些关键数字现在全看不到。
锐评
OpenAI 向 SEC 秘密提交了 S-1 草案,正式启动上市流程。秘密提交意味着这份文件暂时不会公开,外界看不到任何财务数据——营收多少、亏了多少、估值目标是什么,一概不知。这更像是一个信号:OpenAI 在资本层面开始追赶 Anthropic 等对手,不再只靠私募融资撑着。 目前所有报道都来自 Bloomberg 等媒体引用知情人士,OpenAI 官方没有确认任何细节。上市时间、交易所、承销行这些信息都没披露。Sam Altman 之前提过 2028 年前 AI 会承担大部分研究工作,但这次交表和那个时间线有没有关系,正文没说。 对从业者来说,这件事短期没什么可操作的。真正值得盯的是 S-1 公开那天——到时候才能看到 OpenAI 真实的收入结构、客户集中度、研发烧钱速度,以及它怎么向公开市场解释自己的商业模式。在那之前,所有关于“AI 巨头上市潮”的叙事都先打个折。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
14:00
5d ago
● P1The Verge · AI· rssEN14:00 · 06·08
微软AI负责人称超级智能近在咫尺但不会取代人类工作
微软 AI CEO Mustafa Suleyman 在采访里透露,去年 10 月跟 OpenAI 更新合同后,微软已经可以独立搞超级智能了,同时继续买 OpenAI 的模型授权。他正在搭训练集群、招人,Build 大会上一口气发了七个覆盖不同模态的新模型。Suleyman 解释,OpenAI 这几年从纯研究往全栈走——做消费产品、自建数据中心、搞芯片...
#Multimodal#Microsoft#Mustafa Suleyman#OpenAI
精选理由
这篇采访的爆点在于 Mustafa Suleyman 同时抛出了两个容易传播的判断:超级智能不远了,以及它不会抢工作。对从业者来说,更实在的信息是合同更新后微软获得了独立研发超级智能的权限,并在 Build 上铺了七个多模态模型,说明微软在模型层不再只靠 OpenAI 输血。不过正文没给出超级智能的具体定义和时间线,也没解释“不抢工作”的依据,更像是一次定调式发声,实际产品落地细节偏少。我会先打个折,把它当成信号而非硬发布来看。
一句话点评
微软AI负责人说超级智能快来了,但不会抢你饭碗。这话听着像老板画饼,正文没给任何技术细节或时间表,先打个折。
锐评
微软AI负责人穆斯塔法·苏莱曼放话说超级智能“近在咫尺”,但强调不会取代人类工作。这话出自一家正全力把AI塞进Office和云服务的大厂高管之口,天然带有立场色彩——他需要安抚用户和监管,同时给投资人一个未来预期。 关键问题是正文没披露任何支撑材料:没定义什么叫“超级智能”,没给时间范围,也没解释“不取代工作”是基于技术限制还是企业策略。Verge这篇报道本身只有标题和摘要,缺少采访原文或具体论述,所以这个判断目前只能当表态看,不能当技术路线图。 如果他说的是真的,那意味着微软内部看到了某种阶段性突破,但没拿出来;如果只是公关话术,那就是在超级智能真正到来前,先管理好公众情绪。缺的是可验证的证据、独立研究者的看法,以及微软自家产品路线图怎么跟这个判断对齐。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
13:52
5d ago
r/LocalLLaMA· rssEN13:52 · 06·08
llama-launcher:给 llama-server 加了个图形界面,点一点就能调参数
SolaryKryptic 发了一个叫 llama-launcher 的小工具,本质上是给 llama-server 套了个图形界面,不用敲命令行就能改启动参数。作者只给了 GitHub 链接,没写版本号,也没说支持哪些参数。正文被 Reddit 墙了,看不到更多细节。如果你平时用 llama-server 觉得记参数麻烦,这个能省点事,但具体好不好用...
#Tools#SolaryKryptic#llama.cpp#Product update
精选理由
一个小型开源工具发布:HKR-K 和 HKR-R 通过,但帖子没写版本号、支持哪些参数或演示效果,价值偏低。
一句话点评
llama-launcher 给 llama-server 套了个图形界面,不用记命令行参数了。作者只给了 GitHub 链接,没写版本号,也没说支持哪些参数,正文还被 Reddit 墙了,细节基本为零。如果你平时嫌敲命令麻烦,这个能省点事,但好不好用、稳不稳定,得自己去 GitHub 看代码才知道。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
13:51
5d ago
r/LocalLLaMA· rssEN13:51 · 06·08
llama.cpp 新 PR:让 Gemma 和 Qwen 看懂视频
开发者 ngxson 给 llama.cpp 提了个 PR,给 mtmd 模型加了视频输入支持。简单说,以后你可以直接拿视频喂给 Gemma 或 Qwen 这类多模态模型,不用先抽帧转文字。正文没披露这个 PR 有没有被合并、支持哪些视频格式、以及跑视频推理要多高的显存或延迟。如果合进去了,本地跑视频理解的门槛会降一截,但目前先别太激动,等合并状态和性...
#Multimodal#Vision#ggml-org#llama.cpp
精选理由
这是一个 llama.cpp 的多模态 PR,不是已发布的版本。缺少合并状态、模型限制和性能数据,所以落在 60–71 的小更新区间。
一句话点评
llama.cpp 的 mtmd 模型现在能直接吃视频了,不用先抽帧。但 PR 还没合并,格式、显存、延迟一概没提。本地跑视频理解的门槛可能降,但先别激动,等合并和实测。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:44
5d ago
AI HOT 精选· aihot-apiZH13:44 · 06·08
Kimi Code 更新了,但正文没写改了什么
标题说 Kimi Code 有焕新升级,还附了视频教程,但点进去页面提示环境异常,需要验证才能访问。正文完全空白,没披露任何功能变化、版本号、发布日期或使用条件。目前能确认的只有标题本身,具体更新内容未知。
#Code#Kimi#Product update
精选理由
HKR 三项全挂:标题只有模糊的“焕新升级”,正文完全空白,没有功能、版本或访问细节。0/3 的 HKR 加上营销式零数据内容,重要性上限被压在 40 以下。
一句话点评
标题说 Kimi Code 升级还带视频教程,但正文被微信验证墙挡住,一个字都没披露。目前能确认的只有标题本身,具体更新了什么、版本号、发布日期全未知。建议等官方补发可访问的公告再判断,别急着点验证。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
13:35
5d ago
r/LocalLLaMA· rssEN13:35 · 06·08
Gemma 4 聊天模板新增“保留思考过程”开关
Reddit 用户发现 Gemma 4 的聊天模板里多了个 preserve thinking 选项,打开后模型会输出自己的推理过程。正文没披露具体参数、切换机制或影响哪些版本,所以暂时不清楚这个开关是让模型在回答前先吐思考链,还是把思考过程混进最终回复。如果是前者,对调试和可解释性有帮助;如果是后者,可能影响输出格式。信息缺口比较大,建议等官方文档或实测。
#Reasoning#Google#Gemma#Hugging Face
精选理由
这是一个面向 LocalLLaMA 小圈子的更新:HKR-K 靠可验证的模板变化通过。正文没给参数、开关机制或版本范围,所以 HKR-H/R 偏弱,分数落在 60-71 区间。
一句话点评
Gemma 4 聊天模板新增了一个 preserve thinking 开关,打开后模型会输出自己的推理过程。目前信息缺口很大:正文被 Reddit 屏蔽,没披露具体参数、切换机制或影响哪些版本。不清楚是让模型在回答前先吐思考链,还是把思考过程混进最终回复。如果是前者,对调试和可解释性有帮助;如果是后者,可能影响输出格式。建议等官方文档或实测。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
13:35
5d ago
Hacker News 首页· rssEN13:35 · 06·08
Intuned:用自然语言描述需求,自动生成可维护的浏览器自动化代码
Intuned 是一个浏览器自动化平台,核心卖点是“你描述需求,AI 帮你写 Playwright 代码,网站变了还能自动修”。项目跑在隔离机器上,运行时自动记录参数、结果、追踪和日志,方便 AI 辅助排查。支持 TypeScript 和 Python,覆盖爬虫、RPA(模拟人工操作网页)、AI 自动化(可混用 Anthropic Computer U...
#Agent#Code#Tools#Intuned
精选理由
HKR 的 K 和 R 都过了:帖子给出了具体的自动化实现细节,也触及了浏览器代理上线的可靠性难题。作为早期创业公司的产品发布,没有定价、客户规模或基准测试,所以评分停留在正常产品更新区间的上沿。
一句话点评
Intuned 把浏览器自动化做成了“你描述需求,AI 写 Playwright 代码,网站变了还能自动修”。支持 TypeScript/Python,自带反检测、验证码、登录处理,还能混用 Claude/OpenAI 的 Computer Use 做 AI 自动化。亮点是运行时自动记录参数、日志和追踪,方便 AI 排查。但正文没披露 AI 生成代码的成功率、修复的准确率,以及隔离机器的启动...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
13:16
5d ago
r/LocalLLaMA· rssEN13:16 · 06·08
用本地 Ollama 批量总结 4300 篇 arXiv 论文,推送到 Cloudflare 数据库
作者用本地 Ollama 跑了 4300 篇 arXiv 论文:gemma4:e4b 模型生成六字段 JSON 摘要,nomic-embed-text 模型把每篇转成 768 维向量存到 Cloudflare Vectorize,最后通过 REST API 批量写入 Cloudflare D1 数据库。整个流程全在本地跑,不依赖外部 API,适合低成本...
#RAG#Embedding#Tools#Ollama
精选理由
HKR 三项都过:4300 篇论文的本地批量管线本身就有点击价值,模型、向量维度、存储方案都公开了。但这是一篇 Reddit 上的个人操作记录,没有对比基准或可复现的评测结果,所以不到 featured 级别。
一句话点评
一个本地跑通的全流程:用 Ollama 上的 gemma4:e4b 给 4300 篇 arXiv 论文生成结构化摘要,再用 nomic-embed-text 转成向量存 Cloudflare。成本低,不依赖外部 API,适合小团队搭论文检索。但正文被 Reddit 屏蔽,没披露生成质量、耗时和向量检索的召回率,这些才是落地关键。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
13:12
5d ago
Product Hunt · AI· rssEN13:12 · 06·08
OrchestraML:用大白话描述需求,就能自动训练并部署机器学习模型,中间每一步都要你点头
OrchestraML 让你用自然语言描述任务,后台 8 个智能体自动处理数据清洗、特征工程,再用 FLAML AutoML 做模型训练。整个过程设了 6 个检查点,每步都等你手动确认才往下走。最终输出一个可下载的 pkl 模型文件加 predict.py 脚本,或者直接生成一个 REST API。免费版每天能跑 2 条流水线。正文没披露支持哪些模型类...
#OrchestraML#FLAML#Google Gemini 2.0
精选理由
OrchestraML 是一个用自然语言驱动的 AutoML 流水线工具,机制具体且有免费额度——K 轴得分。但 H 轴缺乏悬念,R 轴受众窄(数据科学家,不是泛 AI 从业者)。没有硬性排除条件,但重要性偏低,归为'all'。
一句话点评
用自然语言描述任务,8个智能体自动做数据清洗、特征工程,再用FLAML AutoML训练模型,最终输出可下载的pkl文件或REST API。设了6个检查点,每步都要你手动确认才往下走,适合对流程有严格把控需求的团队。免费版每天2条流水线,但正文没披露支持哪些模型类、训练数据量上限,以及8个智能体具体怎么分工协作。如果只是快速验证想法,这个工具比从头写代码省事,但别指望它处理复杂业务逻辑。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
13:11
5d ago
AI HOT 精选· aihot-apiZH13:11 · 06·08
小互开源视频翻译工具:一句话搞定下载、转写、翻译、烧字幕
小互开源了 xiaohu-video-translate,说一句“把链接翻译成中文字幕视频”就能自动下载、用本地 Whisper 转写、AI 翻译润色、烧字幕、出文稿。转写跑在本地,不花 API 费。支持 YouTube、Bilibili、抖音链接和本地文件,英语、日语、韩语、法语、西班牙语等都能转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超...
#Audio#Tools#Code#Xiaohu
精选理由
这是个个人开源小工具,功能完整但没看到用户量、基准测试或社区反馈,属于实用但还没验证的 utility,放在 60–71 档合理。
一句话点评
小互开源了一个视频翻译工具,说一句指令就能自动下载、本地Whisper转写、AI翻译并烧录中文字幕。转写跑在本地,不花API费,这点挺省钱。支持YouTube、B站、抖音链接和本地文件,英日韩法西都能转中文。字幕精确到词级时间戳,按语义断句,每行不超12字,双语模式中文大英文小。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex等AI编程工具。已开源,附安装指南。...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
12:31
5d ago
持续报道 · 1dr/LocalLLaMA· rssEN12:31 · 06·08
llama.cpp 合并了一个 KV 缓存优化,Gemma-4 推理更快了
ggerganov 给 llama.cpp 提的 PR #24277 已经合并,从 b9551 版本开始可用。改动核心是避免 KV 缓存单元的内存拷贝——简单说就是减少推理过程中重复搬数据的开销,对 Gemma-4 的 MTP(多 token 预测)场景有明显加速。不过正文没披露具体加速倍数、测试硬件或 workload 条件,所以实际收益有多大还不确...
#Inference-opt#ggml-org#ggerganov#llama.cpp
精选理由
这是一个小的 llama.cpp 推理优化:HKR-K 有明确的机制和构建版本,HKR-R 影响本地推理性能,但正文没披露 Gemma-4 MTP 的 benchmark 数据,HKR-H 偏弱。
一句话点评
llama.cpp 作者 ggerganov 刚合入了一个 PR,核心改动是避免 KV 缓存单元的内存拷贝——说白了就是推理时少搬几次数据,对 Gemma-4 的多 token 预测(MTP)场景有加速。从 b9551 版本开始可用。但正文没披露具体加速倍数、测试硬件或 workload 条件,所以实际收益有多大还不确定。这点先别太激动,等有人跑个 benchmark 再说。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
12:17
5d ago
r/LocalLLaMA· rssEN12:17 · 06·08
PDF 转 JSON 最稳的办法:PyMuPDF 提取文本 + LLM 结构化输出
Reddit 用户分享了一套 PDF 转 JSON 的流程:先用 PyMuPDF 和 pymupdf4llm 把 5-20 页的 PDF 转成纯文本,再丢给大模型让它输出固定格式的 JSON。超过 15 页的文档要花 5-7 分钟,速度不算快。遇到日期字段有多个候选值时,模型会出错——正文没披露具体怎么处理这种歧义。这套方案胜在简单,但延迟高、对复杂版...
#Tools#Code#PyMuPDF#pymupdf4llm
精选理由
这是一条 Reddit 求助帖,不是新方法或行业事件,所以 H 不通过。但它给出了具体的技术栈(PyMuPDF + pymupdf4llm)、性能数据(15 页以上 5-7 分钟)和已知缺陷(日期字段歧义),对做文档抽取的从业者有参考价值,K 和 R 都成立。
一句话点评
Reddit 用户分享了一套 PDF 转 JSON 的流程:先用 PyMuPDF 把 5-20 页的 PDF 转成纯文本,再丢给大模型让它输出固定格式的 JSON。超过 15 页的文档要花 5-7 分钟,速度不算快。遇到日期字段有多个候选值时,模型会出错——正文没披露具体怎么处理这种歧义。这套方案胜在简单,但延迟高、对复杂版式文档的鲁棒性存疑。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
12:00
5d ago
AI HOT 精选· aihot-apiZH12:00 · 06·08
OpenRouter 说它的 Agent SDK 能帮 AI 智能体满足欧盟 AI 法案的“人类监督”要求
OpenRouter 发了一篇博客,核心意思是:欧盟 AI 法案、美国科罗拉多州 AI 法案和 NIST 的 AI 风险管理框架,都要求 AI 做影响人的决策时(比如贷款、雇佣、医疗),必须有人类能监督、干预甚至推翻。OpenRouter 说它的 Agent SDK 里已经内置了“人在回路中”的工具,可以直接用来满足这些合规要求。文章给出了 5 个实现...
#Agent#Safety#Tools#OpenRouter
精选理由
硬排除:这是一篇供应商合规宣传稿。核心卖点是 OpenRouter 的 Agent SDK 能满足欧盟 AI 法案等要求,但正文没披露任何可验证的机制或测试条件。HKR-R 通过(合规和 liability 成本确实是 agent 部署的敏感点),HKR-H 和 HKR-K 不通过,分数上限 40。
一句话点评
OpenRouter 说它的 Agent SDK 内置了“人在回路中”工具,可以直接满足欧盟 AI 法案、科罗拉多州 AI 法案和 NIST 框架里关于人类监督的要求。文章列了 5 种实现模式,比如给高风险操作加审批门、超时自动升级。但正文没披露这些工具的具体实现细节或验证条件,更像产品宣传。如果你已经在用 OpenRouter 的 SDK,可以看看;否则先别太激动,合规落地还得看审计日志怎...
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H0·K0·R1
11:46
5d ago
AI HOT 精选· aihot-apiZH11:46 · 06·08
巴基斯坦版反诈助手:用 4B 小模型识别可疑短信和截图
Pakistan Notice Helper 是一个轻量安全工具,帮用户判断短信、链接或截图是否可疑,支持英文和乌尔都语。最终选了 Qwen3.5 4B Q8 模型(量化版 4B 参数),在 10 个测试用例里全部通过了高风险诈骗和截图场景。之前试过 27B 模型(质量好但成本高)和 MiniCPM-V 4.6 Q8(慢且不稳定),最后选了 4B 这个...
#Vision#Safety#Pakistan Notice Helper#Qwen
精选理由
HKR-H/K 通过:本地化诈骗检测和小模型测试有具体信息,10 个用例也公开了。但规模、指标和可复现性都比较单薄,所以分数压在 60–71 区间。
一句话点评
巴基斯坦团队用 Qwen3.5 4B 量化版做了个防诈骗工具,10 个测试全过,成本比 27B 低很多。但测试集只有 10 条,泛化能力未知,且受限于黑客松的 32B 上限规则,选 4B 未必是最优解。短评:10 条测试全过,但样本太少,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
11:08
5d ago
r/LocalLLaMA· rssEN11:08 · 06·08
Meddies PII:一个开源的临床文本去标识模型,支持多语言
Meddies 团队发布了一个开源的临床文本去标识模型 Meddies PII,以及配套的合成数据集。去标识就是把病历里的姓名、身份证号等个人信息抹掉,方便做研究。这个数据集用动态提示生成,覆盖了7类变量:语言、文档类型、标签、长度、格式、边界案例和标识符类型。正文没披露具体评测分数,所以效果到底多好还不清楚。模型和数据集都开源了,可以自己试。
#Safety#Tools#Meddies#Open source
精选理由
HKR-K 和 HKR-R 通过:7变量动态提示机制具体,临床去标识是真实隐私工作流。实体权重有限且未披露评测分数,属于正常开源工具区间。
一句话点评
Meddies 开源了一个去标识模型,专门抹掉病历里的姓名、身份证号。亮点是合成数据集覆盖7类变量(语言、文档类型、标签等),理论上泛化性更好。但正文没披露评测分数,效果未知。模型和数据集都开源了,可以自己跑跑看。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
09:54
5d ago
AI HOT 精选· aihot-apiZH09:54 · 06·08
用 Agent 把 Qwen3-VL 塞进安卓手机跑推理
正文没披露模型尺寸、推理框架、跑在什么设备上,也没给任何性能数据(延迟、内存、帧率)。标题说打通了端侧推理,但信息缺口太大,没法判断实际效果。
#Agent#Vision#Inference-opt#Qwen
精选理由
标题说打通了 Qwen3-VL 安卓端侧推理,但正文没给模型尺寸、推理框架、设备型号和任何性能数据,信息缺口太大,没法判断实际效果。HKR-H 和 HKR-R 通过,但 HKR-K 不通过,因为缺少可复现的配置和性能细节。这是一个有趣的端侧推理教程线索,不是值得头条的信号。
一句话点评
标题说打通了Qwen3-VL在Android上的端侧推理,但正文被反爬墙截了,没披露模型尺寸、推理框架、跑在什么设备上,也没给任何性能数据(延迟、内存、帧率)。信息缺口太大,没法判断实际效果,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
09:30
5d ago
AI HOT 精选· aihot-apiZH09:30 · 06·08
生数科技与华策集团合作建AIGC影视中心,Vidu视频生成落地影视制作
生数科技(Vidu视频生成模型开发商)与华策集团(国内头部影视公司)宣布战略合作,共建AIGC影视创制中心。合作覆盖四个方向:用Vidu生成视频素材、辅助剧本创作、做影视预演(拍前预览)、以及后期视效制作。正文没披露具体投入金额、合作排他性、以及是否已有落地项目。对行业来说,这是视频生成模型第一次直接进影视工业流程,但合作刚签,实际产出和效率提升还没数...
#Multimodal#Vision#Shengshu Technology#Huace Group
精选理由
HKR-K 是实的:四个工作流方向都点名了,Vidu 直接进影视工业流程是第一次。HKR-R 来自制作岗位和成本压力,但没片单、没成本数据,所以验证弱。HKR-H 弱,合作刚签,没demo、没投入金额、没排他性,也没说已有项目在跑,吸引力有限。综合下来放在 all 层合适。
一句话点评
生数科技(Vidu)和头部影视公司华策共建AIGC创制中心,四个方向:视频素材生成、剧本辅助、拍前预览、后期视效。这是视频生成模型首次直接嵌入影视工业流程,但合作刚签,正文没披露投入金额、排他性、以及是否有落地项目。实际产出和效率提升还没数,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
09:10
5d ago
r/LocalLLaMA· rssEN09:10 · 06·08
vllm-doctor:一个给 vLLM 推理服务器做体检的命令行工具
vllm-doctor 是一个 CLI 工具,能读取 vLLM 的 /metrics 或 Prometheus 指标,然后跑一组规则检查队列压力、首 token 延迟(TTFT)和后续 token 延迟(TPOT)、KV 缓存压力。结果会输出人类可读的文字或 JSON,附带置信度、可能原因和建议。相当于给推理服务器做个快速体检,不用自己盯着 Grafa...
#Inference-opt#Tools#vLLM#Prometheus
精选理由
一个小型开源运维工具,机制具体但覆盖面窄:HKR-K靠vLLM指标检查通过,HKR-R靠推理调试痛点通过,HKR-H偏弱,且正文没披露任何采用数据或基准测试结果。
一句话点评
vllm-doctor 是个 CLI 工具,能自动读 vLLM 的 /metrics 或 Prometheus 指标,然后跑规则检查队列压力、首 token 延迟(TTFT)和后续 token 延迟(TPOT)、KV 缓存压力,最后输出人类可读的文字或 JSON,附带置信度、可能原因和建议。相当于给推理服务器做个快速体检,不用自己盯着 Grafana 看。 短评:省掉手动盯 Grafana...
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H0·K1·R1
08:34
5d ago
r/LocalLLaMA· rssEN08:34 · 06·08
Macaron-V1-Preview-749B 发布:7490 亿参数模型,但几乎没公开任何细节
Reddit 上有人贴了一个 Hugging Face 链接,叫 mindlab-research/Macaron-V1-Preview-749B。标题里的 749B 意味着模型有 7490 亿参数,比 GPT-4 传闻的 1.76 万亿小一半,但比 Llama 3.1 405B 大了快一倍。不过正文完全没披露架构(MoE 还是 Dense?)、许可证...
#mindlab-research#Hugging Face#Macaron#Research release
精选理由
HKR 的 H 和 R 都成立,因为 749B 参数是硬核钩子,且直接触及开源用户对硬件门槛的焦虑。但 K 不成立,因为整个条目只有标题级证据——没有架构、许可证、权重获取方式或任何评测,属于低价值模型发布线索。
一句话点评
一个 749B 参数的模型预览,比 Llama 3.1 405B 大近一倍,但比 GPT-4 传闻的 1.76T 小一半。目前只有 Hugging Face 页面,正文被 Reddit 屏蔽,没披露架构(MoE 还是 Dense?)、许可证、评测或下载方式。信息缺口太大,先别激动。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
08:33
5d ago
AI HOT 精选· aihot-apiZH08:33 · 06·08
邵猛开源“品牌转设计稿”技能,但提醒:复刻网站容易造出新的AI垃圾
邵猛在GitHub(shaom/brand-to-design-md-skill)开源了一个技能,让AI Agent学习设计品味后复刻网站。但他自己泼了冷水:这种复刻看多了,反而从“反AI垃圾设计”变成了新的“AI垃圾”——只抄到皮毛,没学到设计精髓。正文没披露具体复刻效果或失败案例,但提醒想抄作业的人,别光顾着省事。
#Agent#Tools#Shao Meng#GitHub
精选理由
HKR三项都过,但这是个人开源帖,没披露复刻效果、测试条件或成功率,属于小工具加评论,落在60–71分档。
一句话点评
邵猛开源了一个让AI Agent学设计品味后复刻网站的skill,但他自己泼冷水:这种复刻看多了,从“反AI垃圾设计”变成了新“AI垃圾”——只抄到皮毛,没学到精髓。正文没披露具体复刻效果或失败案例,但提醒想抄作业的人,别光顾着省事。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:00
5d ago
AI HOT 精选· aihot-apiZH08:00 · 06·08
CoreWeave 怎么看现在的算力市场
CoreWeave 分析了当前算力市场的增长动力和瓶颈,但正文没披露具体需求数字、供给上限、定价变化或时间窗口,所以这篇更像一个方向判断,不是数据报告。
#Inference-opt#CoreWeave#Commentary
精选理由
HKR-R 通过,因为算力供给触及成本焦虑;但 HKR-H 平淡,HKR-K 缺少数字或机制。Bloomberg 有可信度,但这仍是一篇信息量薄弱的市场观点。
一句话点评
CoreWeave 对算力市场的看法:推理需求在涨,但训练还没见顶。正文没给具体数字,更像方向判断。短评:方向对,但没数据支撑,当行业风向标看可以,别当投资依据。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
07:53
5d ago
Hacker News 首页· rssEN07:53 · 06·08
GitHub 部分服务挂了
GitHub 官方状态页确认 Issues 和 Pull Requests 两个核心功能出现性能下降或可用性问题,目前仍在调查原因,未给出恢复时间。从时间线看,问题已持续约一小时,影响范围明确但不算全面瘫痪。正文没披露根因和受影响用户规模,这点先别太激动。
#GitHub#Hacker News#Incident
精选理由
HKR-H 和 HKR-R 通过:GitHub 宕机直接影响开发者日常,Hacker News 热度也说明关注度高。HKR-K 不通过:正文没披露根因、影响用户规模、恢复时间,且这不是 AI 产品或模型事件,信息完整度不足。
一句话点评
GitHub Issues 和 PR 两个核心功能挂了,官方状态页确认性能下降,已持续约一小时,还在查原因,没给恢复时间。正文没披露根因和受影响用户规模,这点先别太激动。短评:Issues 和 PR 挂了,GitHub 还在查,没给恢复时间,别急着恐慌。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H1·K0·R1
07:46
5d ago
AI HOT 精选· aihot-apiZH07:46 · 06·08
PixVerse 创作者计划 2.0:每周最高 850 美元现金奖励
PixVerse 推出了面向 AI 视频创作者的合作伙伴计划 2.0,核心是鼓励真实创作,比如发测试、教程、短片或公开推广新想法。奖励方面:合格帖子每周最多拿 15 万积分(具体价值未披露);每周现金奖池 2500 美元,单个创作者一周最高能拿 850 美元——对个人来说算不错,但奖池总额不算高。另外对大项目、教程和电影节投稿有额外支持,还能获得更多曝...
#Multimodal#PixVerse#Product update
精选理由
HKR三项都过,但事实描述的是PixVerse的创作者补贴计划,不是模型、能力或生态发布。所以落在40-59的低价值区间。
一句话点评
PixVerse 把创作者激励计划升级到 2.0,核心是鼓励发测试、教程、短片这类真实内容。每周现金奖池 2500 美元,个人最高拿 850 美元——对个人创作者算不错,但总盘子不大。积分每周最多 15 万,但没披露具体价值,这点先别太激动。另外对大项目、教程和电影节投稿有额外支持,曝光和合作机会也提了,但正文没披露申请门槛和审核标准。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K1·R1
07:33
5d ago
r/LocalLLaMA· rssEN07:33 · 06·08
Gemma 4 12B QAT 在工具调用上翻车了
一位 Reddit 用户实测发现,Gemma 4 12B QAT 版本的工具调用不稳定,启动日志里 <|tool_response|> 和 </s> 这些 token 被覆盖了。同样跑在 RTX 4080 SUPER、32768 上下文下,之前标准 Q5_K_L 版本能稳定生成 2300 行代码和 10000 行故事文本。QAT 版本反而退步了,正文没...
#Agent#Tools#Code#Gemma
精选理由
一条 Reddit 实测帖,说 Gemma 4 12B QAT 版本工具调用不稳定,启动日志里 <|tool_response|> 和 </s> 这些 token 被覆盖了。同样跑在 RTX 4080 SUPER、32768 上下文下,之前标准 Q5_K_L 版本能稳定生成 2300 行代码和 10000 行故事文本,QAT 反而退步。有具体配置和对比数据,但只有单用户反馈,没有官方回应或跑分,所以分数压在 60–71 区间。
一句话点评
Gemma 4 12B QAT 版本工具调用翻车了,实测不如标准版。用户用 RTX 4080 SUPER 跑 32K 上下文,标准 Q5_K_L 能稳定生成 2300 行代码和 10000 行故事,QAT 版反而连 <|tool_response|> 这些 token 都覆盖了,工具调用不稳定。QAT 本意是量化加速,但这里牺牲了可靠性。注意这是单用户反馈,正文被 Reddit 屏蔽,无法验...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
07:05
5d ago
Hacker News 首页· rssEN07:05 · 06·08
AI产业讨论成本管理和token价格上升问题
TechCrunch 发了一篇标题叫《Token 末日要来了?》的文章,但正文内容没公开,只给了链接。Hacker News 上有 19 个点赞和 34 条讨论,说明这个话题在圈内有点热度。不过文章到底讲了什么——是算力成本暴涨、模型输出太贵,还是别的——目前完全不知道。信息缺口很大,先别急着下结论。
#TechCrunch#Hacker News#Commentary
精选理由
标题有悬念,但正文完全缺失,只有 Hacker News 上的少量互动,无法判断文章是否触及真实行业问题。信息缺口太大,硬性排除,分数上限被卡在 40 以下。
一句话点评
短评:Token 消耗失控,行业开始慌了。但正文没给具体数字,先别急着信。 点评:Tokenpocalypse(Token 末日)这个词说明行业终于意识到:模型推理成本不是线性增长,而是指数爆炸。三个信源都在讨论同一个焦虑——当用户量上来、上下文越塞越长,每轮对话的 Token 开销可能让公司直接亏本。TechCrunch 的报道标题说“账单到期了”,但 RSS 正文为空,没披露任何实际案...
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H1·K0·R0
05:21
5d ago
Hacker News 首页· rssEN05:21 · 06·08
给AI写个说明文档,它写代码会更好吗?
这篇帖子标题问的是“agents.md”文件(给AI助手看的项目说明文档)能不能帮编程AI干活更靠谱。但正文只丢了个X链接和一个arXiv论文链接,没交代实验怎么做的、结果怎么样。目前Hacker News上3个点赞、0条评论,说明还没人验证过。想抄作业的话得自己去翻论文。
#Agent#Code#Benchmarking#arXiv
精选理由
HKR-H和HKR-R都成立,因为AGENTS.md这个提问对用编程Agent的人来说很实际,也戳中了维护文档的痛点。HKR-K不成立:正文没披露实验设置、样本量和结果,只有链接,所以分数卡在60-71的all档。
一句话点评
短评:标题问 agents.md 能否帮编程 AI 干活,正文只扔了两个链接,没实验没结论,目前 HN 上 3 赞 0 评论,基本没人验证。 点评:标题是个好问题——agents.md 相当于给 AI 助手看的项目说明书,理论上能让编程 agent 更快理解代码库结构。但正文只贴了个 X 链接和一篇 arXiv 论文,没交代实验怎么做的、效果提升了多少、在哪些任务上测的。目前 Hacker...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
05:00
5d ago
FT · 科技· rssEN05:00 · 06·08
英国AI创企PhysicsX估值24亿美元,淡马锡领投
PhysicsX完成3亿美元融资,估值达到24亿美元,领投方是新加坡淡马锡。正文没披露营收、客户数量或产品指标,所以这个估值更多反映资本对AI+物理仿真赛道的押注,而不是公司当下的商业化验证。
#PhysicsX#Temasek#Funding
精选理由
HKR-H和HKR-K通过,因为3亿美元融资和24亿美元估值是硬信息,且FT是可靠来源。HKR-R弱,因为交易条款、营收和产品指标都没披露,所以这条留在all里。
一句话点评
英国AI物理仿真公司PhysicsX拿了淡马锡领投的3亿美元,估值冲到24亿。但正文被FT墙了,没披露营收、客户数或产品指标,所以这个估值更多是资本赌赛道,不是商业化验证。短评:估值24亿但没披露任何收入或客户数,纯赌AI+物理仿真赛道,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
03:24
5d ago
Hacker News 首页· rssEN03:24 · 06·08
圣地亚哥州立大学在学生宿舍装了1300个AI摄像头,没告诉学生
圣地亚哥州立大学(SDSU)花了130万美元,在校园里装了1300多个AI摄像头,其中330多个直接对着学生宿舍,光最大的一栋新生楼就装了79个。学生是从校报的公共记录请求里才知道这件事的,学校从来没通知过。这些摄像头用的是Avigilon品牌,厂家宣传了一堆AI功能,但正文没披露具体识别能力、部署时间或供应商信息。
#Vision#SDSU#Policy#Incident
精选理由
H/K/R三项都达标,但这是一起地方校园监控事件,不是模型、平台或监管更新。正文给了摄像头数量,但供应商、算法能力和部署时间都缺失。
一句话点评
SDSU 花130万美元在宿舍装了1300多个AI摄像头,最大一栋新生楼就79个,学生是从校报才知道的。学校没通知,也没说这些摄像头具体能识别什么、什么时候装的。隐私争议很大,但技术细节全缺,没法判断实际风险。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
03:06
5d ago
r/LocalLLaMA· rssEN03:06 · 06·08
有人在个人测试里用 Gemma4 31B FP8 跑出了接近 Sonnet 4.6 Medium 的水平
一位 Reddit 用户发帖说,他在自己的测试框架里用 Gemma4 31B FP8 模型跑出了跟 Sonnet 4.6 Medium 差不多的成绩。测试覆盖了五种任务:Cypher 图查询、实体抽取、工具调用、Python 代码编写和多向量检索摘要。注意这只是个人测试,不是标准基准,样本量和验证方式都不清楚,所以这个结论先别太当真。
#Agent#Code#RAG#Gemma
精选理由
HKR 三项都过:本地模型 vs Claude 的对比有钩子,31B FP8 和 5 种任务类型都披露了。但来源是个人 Reddit 帖子,权威性低,也没有原始分数表,所以不上 featured,维持当前评分。
一句话点评
一位Reddit用户在自己的测试框架里用Gemma4 31B FP8跑出了跟Sonnet 4.6 Medium差不多的成绩,覆盖了Cypher图查询、实体抽取、工具调用、Python代码和多向量检索摘要五种任务。但这是个人测试,不是标准基准,样本量和验证方式都不清楚,结论先别太当真。正文没披露具体分数、测试集大小和对比条件,所以这个“差不多”到底差多少、稳不稳定,都得打个问号。如果后续有第三...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
03:03
5d ago
彭博科技· rssEN03:03 · 06·08
黄仁勋说科技股跌了就是买入机会,AI才刚开始
英伟达CEO黄仁勋认为上周开始的全球科技股抛售反而是买入机会,理由是AI基础设施建设才刚起步。正文没披露他认为合理的估值水平、目标价或买入时机,所以这点先别太激动——他作为CEO当然看多自家赛道,但缺少具体数字支撑判断。
#Nvidia#Jensen Huang#Bloomberg#Commentary
精选理由
HKR-H和HKR-R通过:黄仁勋逆势喊买入会引发AI基建周期讨论。HKR-K不通过:正文没有给出估值、订单或资本开支数字,所以分数落在60–71区间。
一句话点评
黄仁勋说上周科技股抛售是买入机会,理由是AI基建才刚开始。正文没披露他认为合理的估值水平或目标价,所以这点先别太激动——CEO当然看多自家赛道,但缺少具体数字支撑判断。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
02:56
5d ago
彭博科技· rssEN02:56 · 06·08
摩根大通从野村挖来AI战略负责人
摩根大通正在从野村证券挖角其国际AI战略主管,具体姓名、入职时间、汇报关系和团队规模都还没披露。这条消息来自知情人士,正文被彭博的付费墙挡住了,所以没有更多细节。对华尔街来说,大行之间互挖AI战略人才说明金融业在抢着搭AI这班车,但具体这位主管要带多少人、做什么方向,目前只能等后续报道。
#JPMorgan Chase#Nomura Holdings#Personnel
精选理由
价值不高但不算噪音:HKR-R落在金融AI人才竞争上,HKR-H和HKR-K不成立因为缺姓名、入职时间和团队规模。
一句话点评
摩根大通从野村挖来国际AI战略主管,具体是谁、带多少人、向谁汇报都没披露。华尔街大行互挖AI人才不新鲜,但正文被彭博付费墙挡住,信息量约等于一条猎头动态。关键缺口:这位主管之前做了什么、JPM要押哪个方向——全没写。短评:大行抢AI人,但这条除了“挖了个人”啥也没说。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
02:17
5d ago
r/LocalLLaMA· rssEN02:17 · 06·08
本地 TTS 哪家强?Reddit 用户实测推荐 moss-nano 和 Kokoro
一位 Reddit 用户在 LocalLLaMA 板块发帖,实测了几款本地 TTS 方案,结论是目前最适合边缘设备的是 moss-nano 和 Kokoro。帖子正文被屏蔽了,所以没有披露延迟、内存占用、声音克隆质量或手机端部署的具体数据。如果你在找能离线跑的语音合成,这两个名字可以先记下,但具体表现还得自己试。
#Audio#Agent#ElevenLabs#moss-nano
精选理由
HKR-K/R 通过:帖子给出了本地TTS选型结论,切中了自建部署在成本和隐私上的痛点。但它是Reddit讨论帖,正文被屏蔽,没有延迟、显存或声音克隆的具体指标,所以分数落在60–71区间。
一句话点评
Reddit 用户实测后推荐 moss-nano 和 Kokoro 作为本地 TTS 首选,适合边缘设备离线运行。但帖子正文被屏蔽,延迟、内存占用、声音克隆质量等关键数据缺失,无法判断实际效果。如果你在找能离线跑的语音合成,这两个名字可以先记下,但具体表现还得自己试。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
02:07
5d ago
机器之心 · 公众号· rssZH02:07 · 06·08
一个老哥用AI视觉+激光炮打蚊子,Reddit 5.7K赞
一位DIY爱好者用单反拍蚊子照片训练视觉模型,再连上一个电动云台和激光器,造了一台自动打蚊子的机器。激光发射前会先检查有没有人或者易燃物,避免误伤。Reddit帖子几小时内拿了5700多个赞和400多条评论。正文没披露识别准确率和激光功率,所以实际效果和安全性还不好判断。
#Vision#Robotics#Safety#Steven Cheng
精选理由
HKR-H和HKR-R都很强,HKR-K有具体的原型机制和Reddit数据支撑。但它只是一个个人硬件项目,不是模型、平台或主流产品发布,所以68分适合tier all。
一句话点评
一个DIY玩家用单反拍蚊子照片训练视觉模型,连上电动云台和激光器,造了台自动打蚊机。发射前会先检查人和易燃物,避免误伤。Reddit帖子几小时拿了5700多赞和400多条评论。正文没披露识别准确率和激光功率,实际效果和安全性还不好判断。如果是真的,挺省钱,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
02:05
5d ago
Hacker News 首页· rssEN02:05 · 06·08
德州电网警告:数据中心和矿场电压测试不合格
路透社报道,德州电网运营商警告,部分数据中心和加密货币矿场未能通过电压测试,可能威胁电网稳定。正文没披露具体测试标准、涉及多少站点,也没说整改截止日期。目前信息有限,但这类测试通常模拟大负荷波动,如果连基本电压都稳不住,说明这些设施的电力接入设计或设备质量有问题。德州电网本来就脆弱,极端天气下容易出事故,现在又多了这些大用户,风险确实在上升。
#Reuters#Hacker News#Incident
精选理由
H和R通过,因为电网电压故障直接关联数据中心供电约束。K不通过:正文缺少站点数量、测试标准和整改时间,所以留在all。
一句话点评
德州电网运营商警告,部分数据中心和加密货币矿场没通过电压测试,可能威胁电网稳定。正文没披露具体测试标准、涉及多少站点,也没说整改截止日期。目前信息有限,但这类测试通常模拟大负荷波动,如果连基本电压都稳不住,说明这些设施的电力接入设计或设备质量有问题。德州电网本来就脆弱,极端天气下容易出事故,现在又多了这些大用户,风险确实在上升。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
01:30
5d ago
● P1AI HOT 精选· aihot-apiZH01:30 · 06·08
OpenAI宣布第三阶段计划到2028年实现AI主导研究
Sam Altman 和 Jakub Pachocki 在 6 月 8 日发文,把 OpenAI 的路线图摊开了讲。公司内部判断,到 2028 年 3 月,AI 系统可能承担他们研究工作里“相当大一部分”,所以第一个目标是造一个能自动做 AI 研究的系统,帮研究员更快地测试想法、找错和迭代。第二个目标是加速经济增长,同时把收益分出去。第三个目标最直接:...
#Agent#Reasoning#Alignment#OpenAI
精选理由
Sam Altman 和 Jakub Pachocki 这次没画大饼,而是给了个带时间点的内部判断:到 2028 年 3 月,AI 可能接手 OpenAI 研究工作的相当一部分。我会先打个折,这种预测本身就有自我实现的成分,但把它写进公开路线图,说明内部对研究自动化的信心已经很高了。文章把目标拆成三个:造自动做研究的系统、加速经济并把收益分出去、以及最直接的安全对齐。信息量够,时间点具体,对从业者来说既是信号也是压力,值得马上写。
一句话点评
OpenAI 说 2028 年 3 月前要让 AI 接手自家一大部分研究工作,但没给出具体衡量标准,这个时间表先打个折看。
锐评
Sam Altman 和 Jakub Pachocki 联名发了篇博客,把 OpenAI 的路线图摊开了讲。核心判断就一个:他们相信未来几年内,AI 做 AI 研究本身会成为决定技术进步快慢的关键因素。为此,OpenAI 给自己定了个内部目标——到 2028 年 3 月,自家研究里要有“显著一部分”由 AI 系统配合人类研究员完成。这个说法很模糊,正文没披露“显著一部分”到底是 30% 还是 80%,也没说用什么指标衡量,所以这个时间节点的可信度要打折扣。 文章把 OpenAI 的发展划成三个阶段:第一阶段纯做研究,第二阶段变成产品公司,现在进入第三阶段,要让 AI 变得像电一样普及、便宜、安全,让每个人都能用上。他们还提了一嘴应该有个国际组织来协调前沿 AI 发展,必要时甚至可以集体踩刹车,但没给出任何具体机制或时间表。 整篇博客更像一份愿景声明,而不是可验证的路线图。缺的东西很明确:没有实现路径的中间里程碑,没有成本估算,也没有说明如何验证“AI 主导研究”是否真的达成了。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
01:15
5d ago
彭博科技· rssEN01:15 · 06·08
韩国AI芯片热冲击国债市场,股市波动率全球前列
彭博报道,韩国AI投资热潮正在给政府债券市场带来压力。正文被墙,具体收益率、期限和资金流向数据未披露。已知信息是韩国股市波动率排在全球前列。
#Bloomberg#South Korea#Commentary
精选理由
HKR-H靠AI与债券的罕见关联性通过,但HKR-K缺少收益率、期限或资金流向证据,HKR-R离AI从业者的日常决策太远。低价值的宏观周边内容。
一句话点评
韩国AI投资热把政府债市压得喘不过气,股市波动率已排全球前列。正文被墙,没披露具体收益率和资金流向,缺关键数据支撑。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
00:28
5d ago
Hacker News 首页· rssEN00:28 · 06·08
用 Python 手写一个感知机:你能造出的最小大脑
一篇面向初学者的感知机教程,从零开始用 Python 实现,附带交互式演示。文章用“约翰·杜决定是否接受工作 offer”的类比解释权重、偏置、决策边界、epoch 和学习率,并演示了为什么偏置在输入值远离零时必不可少(否则决策边界永远卡在 0)。正文没有披露训练数据规模、收敛所需 epoch 数或学习率的具体取值,也没有给出可复现的实验条件。
#Code#Commentary
精选理由
一篇面向初学者的感知机教程,用“约翰·杜决定是否接受工作 offer”的类比解释权重、偏置、决策边界等概念,并演示了偏置在输入值远离零时的必要性。正文没有披露训练数据规模、收敛所需 epoch 数或学习率的具体取值,也没有给出可复现的实验条件。对从业者来说信息量太少,没有实操价值或行业洞察,不值得推荐。
一句话点评
一篇从零手写感知机的入门教程,用“约翰·杜决定是否接受工作 offer”的类比解释权重、偏置、决策边界。交互式演示让读者直观看到训练过程。但正文没披露训练数据规模、收敛所需 epoch 数或学习率的具体取值,无法复现实验。适合初学者理解概念,但离工程实践还有距离。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
00:19
5d ago
r/LocalLLaMA· rssEN00:19 · 06·08
把 Galaxy Z Fold6 当本地推理节点用,还做了 SHA-256 模型校验
有人在 Galaxy Z Fold6 上跑了 Pocket Node,用 llama.cpp 的 Vulkan/OpenCL 后端加载 SmolLM3 Q4_0 1.1B GGUF 模型。亮点是首次加载时会做 SHA-256 校验,跟本地 registry 比对,校验不通过就阻止推理。这相当于给手机端推理加了一道防篡改检查,适合对模型完整性有要求的场景...
#Inference-opt#Tools#Samsung#llama.cpp
精选理由
这是一个 Reddit 上的单次实验,亮点是手机端推理加了 SHA-256 防篡改校验,适合对模型完整性有要求的场景。但正文没披露吞吐量、功耗、发热或稳定性数据,验证力度弱。作为本地推理的趣味搭建值得一看,但别急着当生产方案。
一句话点评
有人在 Galaxy Z Fold6 上跑了个叫 Pocket Node 的本地推理节点,加载 1.1B 参数的 SmolLM3 小模型,速度不会快,但亮点是首次加载时做 SHA-256 校验,跟本地 registry 比对,不通过就阻止推理。相当于给手机端推理加了一道防篡改检查,适合对模型完整性有要求的场景。正文没披露具体推理速度或功耗,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:11
5d ago
r/LocalLLaMA· rssEN00:11 · 06·08
Gemma4 QAT 量化版实测:速度翻倍,但编程能力没测
Reddit 用户报告 Gemma 31B QAT 量化版在 32K token 维基百科摘要任务上达到 50 t/s,比量化前的 21 t/s 快了一倍多。速度提升主要靠 MTP(多 token 预测)和量化。但作者没测编程能力——因为他平时写代码用的是 Qwen3.6 27B。所以这只是一个速度测试,编程场景的表现未知。
#Inference-opt#Code#Gemma#Qwen
精选理由
HKR-K 和 HKR-R 通过:帖子给出了具体的本地推理速度对比,并涉及量化取舍。来源是单个 Reddit 帖子,硬件、可复现细节和编程结果未披露,所以分数落在 60–71。
一句话点评
Gemma 31B QAT 量化版在 32K token 维基摘要任务上跑到 50 t/s,比量化前 21 t/s 快了一倍多。速度提升主要靠 MTP(多 token 预测)和量化。但作者没测编程——他平时写代码用 Qwen3.6 27B,所以这只是一个速度测试,编程场景表现未知。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
00:03
5d ago
FT · 科技· rssEN00:03 · 06·08
韩国靠AI芯片、造船和军火赚了一波
FT说韩国正从AI竞赛和全球冲突中受益,但正文被墙了,没披露具体公司、营收增长、订单量或时间范围。
#Financial Times#South Korea#Commentary
精选理由
FT这篇宏观角度确实有话题性,标题把AI竞赛和战争红利打包,容易吸引点击。但正文被墙,实际信息量很少——没有具体公司名、没有营收增长数字、没有订单量或时间范围,连“哪些芯片公司受益”都没说。所以H和R可以给过,K不行。对从业者来说,知道韩国在吃AI和军工红利就够了,但没法拿来做判断或决策。
一句话点评
FT说韩国靠AI竞赛和全球冲突赚钱,但正文被墙了,没披露具体公司、营收增长或订单量。标题提到芯片、船舶和军火,推测是三星、现代重工和韩华这类企业受益。数字和验证细节全缺,只能当方向性信号看,别当投资依据。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
00:00
5d ago
● P1AI HOT 精选· aihot-apiZH00:00 · 06·08
苹果发了第三代基础模型,一共五款,从手机端到云端都有
苹果在 2026 年 6 月 8 日公布了第三代 Apple Foundation Models(AFM),这次是和 Google 合作定制的。五款模型里,两款跑在设备上:AFM 3 Core 是 30 亿参数的密集模型,质量比上一代好;AFM 3 Core Advanced 是 200 亿参数的稀疏模型,但每次只激活 10 到 40 亿参数,靠的是把...
#Inference-opt#Tools#Apple#Google
精选理由
苹果这次一口气发了五款模型,分设备端和服务器端两条线,还拉上 Google 做定制,信息量够硬。30 亿参数的密集模型和 200 亿参数但每次只激活一小部分的稀疏模型,思路很明确:在手机上跑得动,在云端也能控成本。正文没给具体跑分和定价,所以我会先打个折,但官方发布本身就有分量,尤其对做端侧推理和隐私计算的人。
一句话点评
苹果把200亿参数的大模型塞进手机,靠的是按需从闪存加载专家模块,每次只激活1-40亿参数。但别急着喊革命,正文没给延迟和耗电数据。
锐评
苹果这次发布的第三代AFM,最值得看的是端侧模型AFM 3 Core Advanced。它用了一种叫“指令跟随剪枝”的技术,把200亿参数的稀疏模型存在闪存里,根据你的指令只唤醒需要的部分,每次激活1到40亿参数。这思路很聪明,绕开了手机内存小的硬伤,让更复杂的模型能在本地跑。 但文章没提关键指标:模型在手机上实际响应有多快?耗电增加多少?这些直接决定体验。另外,苹果强调和Google合作定制,连最强的云端模型AFM 3 Cloud Pro都跑在Google Cloud的NVIDIA GPU上,还保证隐私。这解决了算力问题,但也意味着苹果在云端推理上深度依赖外部硬件,长期成本和供应稳定性是个未知数。 整体看,架构创新是实打实的,但落地效果还得等实机测试。尤其是那个按指令加载专家的机制,在不同任务上稳定性如何,文章完全没展开。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
00:00
5d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 06·08
Vision Banana:一个模型靠画图打赢三个视觉专家
Google DeepMind 的 Vision Banana 把分割、深度估计、表面法线这些视觉任务全变成了“按指令画图”。同一个模型,只改提示词不改架构,在 Cityscapes 分割上 mIoU 69.9 超过 SAM 3 的 65.2,深度估计 δ1 0.929 超过 Depth Anything 3 的 0.918,法线估计误差 15.55 ...
#Vision#Multimodal#Google DeepMind#Vision Banana
精选理由
Google DeepMind 的 Vision Banana 把分割、深度估计、表面法线这些视觉任务全变成了“按指令画图”。同一个模型,只改提示词不改架构,在 Cityscapes 分割上 mIoU 69.9 超过 SAM 3 的 65.2,深度估计 δ1 0.929 超过 Depth Anything 3 的 0.918,法线估计误差 15.55——数字上确实压过了专用模型。但正文没披露模型大小、训练数据量、推理速度或成本,也没给代码或权重,所以目前只能当一篇有意思的研究看,离能用还有距离。HKR 里 H 和 K 都成立:标题有钩子,机制有新鲜...
一句话点评
Google DeepMind 把分割、深度估计等视觉任务全变成了“按指令画图”,一个模型一套权重,改提示词就能切换任务。在 Cityscapes 分割上 mIoU 69.9 超过 SAM 3 的 65.2,深度估计 δ1 0.929 超过 Depth Anything 3 的 0.918。关键是用极少视觉数据做指令微调,没让模型忘记画图。但论文没披露模型大小、训练数据量和完整基准分数,这点...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
00:00
5d ago
OpenAI 博客· rssEN00:00 · 06·08
OpenAI 启动经济研究交换计划,资助外部团队用其数据做 AI 经济影响研究
OpenAI 宣布成立 Economic Research Exchange,一个资助外部学者研究 AI 对就业、生产力和经济影响的平台。入选团队可以用 OpenAI 的工具和数据做研究,但必须遵守隐私保护和数据治理规则。申请截止 2026 年 7 月 5 日,7 月 31 日前通知结果。正文没披露资助金额、项目数量或具体合作时长,所以目前还不清楚这个...
#OpenAI#Research release
精选理由
HKR-K/R 通过:OpenAI 的经济学研究项目有相关性,也戳中了从业者的职业焦虑。正文只给了项目名称和申请条件,资助金额、截止日期和团队规模都没说,所以归入常规更新档位。
一句话点评
OpenAI 搞了个 Economic Research Exchange,资助外部学者用它的工具和数据研究 AI 对就业、生产力的影响。申请截止 7 月 5 日,7 月 31 日前通知结果。正文没披露资助金额、项目数量或合作时长,所以目前还不清楚这个盘子有多大、能出多少独立结论。短评:OpenAI 出钱让学者用自家数据做经济研究,但钱和项目数都没说,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
2026-06-07 · 星期日2026年6月7日
23:09
5d ago
彭博科技· rssEN23:09 · 06·07
Naver 要用英伟达的模型建数据中心,巩固韩国 AI 市场地位
Naver 跟英伟达达成合作,计划基于英伟达的模型建数据中心,目的是在韩国 AI 市场稳住领先位置。正文没披露具体投多少钱、用哪款模型、什么时候落地,所以规模和时间线都不清楚。对 Naver 来说,这步棋是押注英伟达的生态,但代价和排他性风险也没提。
#Inference-opt#Naver#Nvidia#Partnership
精选理由
HKR-H 和 HKR-K 通过:这是 Naver 与英伟达在韩国 AI 基础设施上的合作,机制是数据中心。细节太少——没提投入、模型名称和落地时间——所以评分落在 60–71 的通用合作区间。
一句话点评
Naver 要用英伟达的模型建数据中心,想在韩国 AI 市场稳住领先。正文没披露投多少钱、用哪款模型、何时落地,规模和时间线都不清楚。对 Naver 来说,这是押注英伟达生态,但代价和排他性风险也没提。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
23:00
5d ago
NVIDIA 博客· rssEN23:00 · 06·07
英伟达与斗山集团扩展合作,推进物理人工智能和工厂基础设施
英伟达和韩国斗山集团(Doosan)扩大了合作,涉及四家子公司:斗山机器人、斗山山猫(工程机械)、斗山能源(发电设备)和斗山电子材料(PCB基板)。合作方向是“物理AI”——也就是让AI直接控制机器人、工厂设备,而不是只跑在云端。斗山机器人会用英伟达的仿真平台训练机器人,斗山能源则帮英伟达建AI工厂的电力基础设施。正文没披露具体金额或落地时间表,所以目...
#Robotics#Agent#Inference-opt#NVIDIA
精选理由
HKR-K 通过:英伟达-斗山的合作范围有具体业务线。来源是厂商博客,没有披露交易金额、部署指标或产品规格,因此落在营销偏重的 40-59 分区间,没有硬性排除项。
一句话点评
英伟达和韩国斗山集团签了个大合作,涉及四家子公司:机器人、工程机械、发电设备、PCB基板。核心是“物理AI”——让AI直接控制机器人和工厂设备,不只在云端跑。斗山机器人会用英伟达的仿真平台训练机器人,斗山能源帮建AI工厂的电力设施。但正文没披露具体金额或落地时间表,所以先别太激动。这更像一个生态占位:英伟达在拉拢传统工业巨头进自己的仿真和算力体系。对从业者来说,信号是“物理AI”的落地路径开...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R0
22:07
5d ago
r/LocalLLaMA· rssEN22:07 · 06·07
双3090跑Qwen3.6-27B,FP8版来了,官方说效果跟BF16差不多
club-3090项目给Qwen3.6-27B加上了实验性的FP8支持,两张RTX 3090就能跑。官方声称FP8版和BF16版表现几乎一样,但没贴具体跑分,这点先别太激动。FP8的好处是省显存、省带宽,双3090用户终于能塞下这个27B模型了,但实际推理速度和质量还得自己试。
#Inference-opt#club-3090#Qwen#NVIDIA
精选理由
这是一个Reddit级别的社区实验,没有跑分、吞吐量或显存数据,属于60-71分的小型产品更新。
一句话点评
双3090终于能跑Qwen3.6-27B了,FP8省显存省带宽,官方说和BF16表现几乎一样但没贴跑分,这点先别太激动。实际推理速度和质量得自己试,正文也没披露具体延迟或精度对比。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
21:30
5d ago
彭博科技· rssEN21:30 · 06·07
英国首相要在就业中心推AI工具,帮人找工作
英国首相斯塔默宣布将在就业中心部署AI工具,帮求职者找工作,应对AI对岗位的冲击。正文没披露具体用什么模型、怎么用、什么时候上线、覆盖多少就业中心。目前只知道是政府层面的AI落地尝试,但细节太少,没法判断效果。
#Tools#Keir Starmer#UK Government#Policy
精选理由
HKR-H和R通过,因为政策+就业角度能引起从业者共鸣;但K不通过:正文没披露任何机制、上线时间或覆盖范围,信息量不足以支撑更高评分,所以落在60–71区间。
一句话点评
英国首相斯塔默要在就业中心部署AI工具帮人找工作,应对AI抢饭碗。但正文没披露用什么模型、怎么用、什么时候上线、覆盖多少就业中心。目前只是政府层面的AI落地尝试,细节太少,没法判断效果。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
21:09
5d ago
r/LocalLLaMA· rssEN21:09 · 06·07
llama-server 路由:把模型绑到一张卡上,它还是会在每张卡上占显存
一位用户在 2×3090、2×4060 Ti 和 1×5060 Ti 的机器上跑 llama-server 路由,发现即使把 Gemma 4B 模型固定到一张 GPU,它仍然会在每张卡上分配 CUDA 上下文,每张卡吃掉 120–256 MiB。结果前面跑了一个 262K 上下文的编码模型后,3090 只剩约 200 MiB 空闲,再加载这个 4B 模...
#Inference-opt#Tools#llama-server#Gemma
精选理由
来源是Reddit求助帖,用户自己排查出llama-server路由器的行为:即使把Gemma 4B固定到一张GPU,它仍然会在每张卡上分配CUDA上下文,每张吃掉120–256 MiB。他5张卡(2×3090、2×4060 Ti、1×5060 Ti)跑了一个262K上下文的编码模型后,3090只剩约200 MiB,再加载这个4B模型就OOM了。正文没披露官方是否有修复或计划,也没有其他用户确认复现,所以信息缺口明显:这是一个单点报告,没有上游确认或更广的产品影响。分数卡在60–71合理,因为事实具体、痛点真实,但证据链弱。
一句话点评
llama-server 路由模式下,即使把模型固定到一张 GPU,它仍会在每张卡上占 120–256 MiB 的 CUDA 上下文。用户 2×3090 跑完 262K 上下文编码模型后只剩 200 MiB,再加载 4B 模型直接 OOM。这不是 bug,是 llama-server 当前的设计——路由需要每张卡都预留上下文。正文没提是否有 flag 能关掉这个行为,实测可以试试 --no-...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
20:24
5d ago
Hacker News 首页· rssEN20:24 · 06·07
Nightwatch:开源只读AI运维,本地猫头鹰连中心大脑,离线聚类告警风暴
Nightwatch 是一个开源、只读的 AI SRE(站点可靠性工程师)工具。每个本地节点(叫“猫头鹰”)只向外连中心大脑,告警风暴在离线端聚类,调用远程大模型前会自动脱敏真实密钥、IP、主机名和路径。它能在你的生产系统上做根因分析,然后给出需要人工确认的修复建议。核心思路是“只读”+“本地优先”,降低安全风险。不过正文没披露具体支持哪些大模型后端、...
#Agent#Tools#Safety#Nightwatch
精选理由
HKR三项都过,但这是Show HN新项目,没有采用量或生产环境证据。我把它归为小规模开源产品更新,不到推荐位门槛。
一句话点评
Nightwatch 是个开源 AI 运维工具,核心思路是“只读”+“本地优先”:每个节点(猫头鹰)只向外连中心大脑,告警风暴在本地聚类,调远程大模型前自动脱敏密钥、IP、路径。这能降低安全风险,适合不敢把生产数据直接丢给 API 的团队。但正文没披露支持哪些大模型后端、脱敏后根因分析准确率如何,也没说“只读”模式下能覆盖多少故障场景。如果只是聚类+脱敏+调 LLM 给建议,那门槛不高,关键...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
20:13
5d ago
r/LocalLLaMA· rssEN20:13 · 06·07
Qwen 3.6 27B 在 DeepSWE 上只跑了 1.79%,排名倒数第三
Qwen 3.6 27B 在 DeepSWE 评测上得了 1.79%,18 个模型里排第 18,只比 Haiku 4.5 和 Minimax M2.7 高。这次只跑了一次(one rollout),总共花了 70 小时,平均每个任务 32 分钟、输出 4.4 万 token。分数低可能跟只跑一次有关,多跑几次取平均通常会涨分,但正文没披露是否做了多次实验。
#Code#Reasoning#Benchmarking#Qwen
精选理由
分数低到 1.79% 且排名垫底,对 Qwen 这种知名开源模型来说是个意外,有话题性。数字完整,能支撑成本估算。但只跑了一次,没有多次取平均,也没有其他来源交叉验证,所以重要性压在 66 合理,不往上调。
一句话点评
Qwen 3.6 27B 在 DeepSWE 上只得了 1.79%,20 个模型里排第 18,仅高于 Haiku 4.5 和 Minimax M2.7。这次只跑了一次(one rollout),花了 70 小时,平均每个任务 32 分钟、输出 4.4 万 token。分数低可能跟单次运行有关,多跑几次取平均通常会涨分,但正文没披露是否做了多次实验。短评:单次跑分垫底,多跑几次可能涨,但成本不低。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
18:54
5d ago
Hacker News 首页· rssEN18:54 · 06·07
如果大模型有人类特质,那《帝国时代2》也有
这篇论文用一个简单实验来戳破一个流行说法:很多人说大模型涌现了人类特质(比如道德感、理解语言),作者不直接反驳,而是训练了一个简单的神经网络去玩《帝国时代2》,然后指出——如果大模型那种表现算“人类特质”,那《帝国时代2》里的任何实体(比如一个农民)也能算。核心论点是:这些所谓的人类属性在经验上不唯一,换一个载体(乐高、波士顿地图)也可能出现类似行为。...
#Age of Empires II#Research release#Commentary
精选理由
HKR-H和HKR-R通过,但HKR-K不通过:只有标题和链接,没有方法或证据披露。当作低信息量的arXiv讨论项处理,所以保持all层级。
一句话点评
这篇论文用一个简单实验戳破“大模型有人类特质”的说法:训练一个神经网络玩《帝国时代2》,然后指出——如果LLM那种表现算“人类特质”,那游戏里的农民也能算。核心论点是这些属性在经验上不唯一,换一个载体(乐高、波士顿地图)也可能出现类似行为。作者没做新实验,只是逻辑推演,但论证挺有力。短评:用游戏农民类比LLM“人性”,逻辑有趣但没新实验。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
17:56
5d ago
TechCrunch AI· rssEN17:56 · 06·07
Notion 恢复了对 Anthropic 的访问
Notion 产品负责人说被转发量“惊到了”,但正文没披露中断持续了多久、影响了多少用户、以及怎么恢复的。
#Notion#Anthropic#Incident#Product update
精选理由
HKR-R 通过,但 HKR-H/K 偏弱:这是一条 Notion 恢复 Anthropic 访问的轻量级事件通报,未披露中断范围、时长或恢复方式,所以归入轻量级 incident 档位。
一句话点评
Notion 恢复了 Anthropic 的访问,但正文只提了产品负责人被转发量“惊到”,没披露中断时长、影响用户数、恢复方式。信息缺口太大,没法判断严重性。短评:转发量高≠事故严重,缺关键数据。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K0·R1
17:30
5d ago
彭博科技· rssEN17:30 · 06·07
Kevin O'Leary要在加拿大建最大数据中心,但当地人不买账
Kevin O'Leary支持的一家公司提议在阿尔伯塔省西北部建加拿大最大的数据中心,但正文没披露投资额、算力规模、时间表或具体的审批条件。目前只知道项目面临公众质疑,具体质疑点(电力、水、噪音还是地价)也没展开。信息缺口很大,暂时只能判断:项目还在早期舆论阶段,离落地还远。
#Kevin O’Leary#Policy
精选理由
彭博社来源可信,HKR中H和R通过——AI基建扩张与当地阻力冲突是真实议题。K不通过是因为投资额、算力需求、电力消耗和时间表都没披露,信息缺口太大,只能卡在60–71分区间。
一句话点评
Kevin O'Leary(《创智赢家》明星)要在加拿大阿尔伯塔省建该国最大数据中心,但正文被墙,只拿到标题和摘要。目前信息缺口极大:投资额、算力规模、时间表、审批条件全没披露。公众质疑具体是电力、水、噪音还是地价也不清楚。项目还在早期舆论阶段,离落地还远。短评:明星背书+大项目画饼,但缺关键细节,先别当真。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
17:29
5d ago
r/LocalLLaMA· rssEN17:29 · 06·07
Gemma4 的 QAT 量化版翻车了:画棋盘 SVG 棋子乱飘,不如老版 Q4 稳
Reddit 用户实测了 Gemma4 26B A4B 的两个 QAT GGUF 版本(用 llama.cpp b9549),跑一个画棋盘 SVG 的 prompt。结果 QAT 版输出的棋子位置不稳定、乱飘,而老版 Q4_K_XL 在相同参数下多次运行都更可靠。QAT 本意是用量化感知训练减少精度损失,但这次实测效果反而更差。正文没披露具体量化参数和...
#Inference-opt#Vision#Benchmarking#Google
精选理由
一条 Reddit 实测:Gemma4 26B A4B 的 QAT GGUF 版本画棋盘 SVG 时棋子位置乱飘,而老版 Q4_K_XL 在相同参数下多次运行都更稳。QAT 本意是用量化感知训练减少精度损失,但这次反而更差。正文没披露具体量化参数和测试次数,证据只有这一个 SVG 任务,没有跑分或更多任务验证。所以重要性压在 55,属于低价值区间——有参考意义,但别急着下结论。
一句话点评
Reddit 用户实测 Gemma4 26B A4B 的 QAT 版(量化感知训练版),跑画棋盘 SVG 任务,结果棋子位置乱飘,不如老版 Q4_K_XL 稳定。QAT 本意是减少量化精度损失,但这次翻车了。正文没披露具体量化参数和测试次数,样本量小,结论先打个折。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R1
16:25
5d ago
r/LocalLLaMA· rssEN16:25 · 06·07
用一句话控制3D虚拟人做动作,不用按钮
yuntiandeng 发了一个演示:输入一句话,模型就把这句话编译成一段浏览器里能跑的本地动作程序,支持循环、保持和并行轨道。相当于用自然语言代替了手动拖拽动画时间轴。正文没披露用了什么模型、延迟多高、能不能跑在消费级显卡上,所以实用性要打个问号。但思路挺直接——把语言指令拆成可执行的原子动作,而不是让模型直接生成骨骼动画,这样控制更精确、可调试。
#Agent#Code#Tools#yuntiandeng
精选理由
HKR-H/K 通过:语言控制3D角色和本地程序编译都是新思路。HKR-R 弱:这是单个 Reddit 演示,没有仓库、指标或采用证据。
一句话点评
一句话让3D角色动起来,不用拖时间轴。yuntiandeng的演示把自然语言编译成浏览器可执行的原子动作序列,支持循环、保持和并行。思路聪明:拆成可调试的指令块,比直接生成骨骼动画更可控。但正文没披露用了什么模型、延迟多高、能否跑在消费级显卡上,实用性要打个问号。短评:思路直接,但缺关键参数,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
16:12
5d ago
r/LocalLLaMA· rssEN16:12 · 06·07
GMKtec EVO-X3 迷你主机:塞进 OCuLink、Wi-Fi 7 和双 PCIe 4.0,后续还有 192GB 内存的 Ryzen AI MAX...
GMKtec 的 EVO-X3 迷你主机在标题里列了一堆接口:OCuLink(外接显卡用)、Wi-Fi 7 和双 PCIe 4.0 插槽。硬件用的是 Ryzen AI MAX+ 495,但正文没披露价格和具体上市时间。后续会出一个 192GB 内存的版本,这个容量对本地跑大模型挺友好,但得等。
#Inference-opt#GMKtec#AMD#Reddit
精选理由
标题列了一堆硬核接口:OCuLink(外接显卡用)、Wi-Fi 7 和双 PCIe 4.0 插槽,硬件是 Ryzen AI MAX+ 495,后续还有 192GB 内存版本,这个容量对本地跑大模型挺友好。但正文没披露价格和具体上市时间,也没有跑分或功耗数据,所以只能算一个正常的产品更新,不值得上推荐位。
一句话点评
GMKtec EVO-X3 迷你主机主打接口堆料:OCuLink(外接显卡)、Wi-Fi 7、双 PCIe 4.0 插槽,硬件用 Ryzen AI MAX+ 495。后续还有 192GB 内存版,本地跑大模型挺香,但价格和上市时间都没说。 短评:接口全但价格未知,192GB 版值得等。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:31
5d ago
AI HOT 精选· aihot-apiZH15:31 · 06·07
AI 产出暴涨,但 GDP 没动:Gary Marcus 用一张图说清“产出繁荣,回报惨淡”
Gary Marcus 引用 FT 和华盛顿邮报的数据图指出:AI 确实让应用、书籍、音乐、论文的数量暴增,但销量、GDP、科学质量都没跟着涨。他管这叫“slop”(垃圾内容泛滥)。正文没披露具体图表数据、生产力指标或实测的 AI 影响,但核心判断很清楚——产出多不等于价值高,尤其 agentic coding 烧钱最狠,OpenAI 和 Anthro...
#Gary Marcus#John Burn-Murdoch#Financial Times#Commentary
精选理由
文章靠Gary Marcus的‘slop’概念和FT图表截图撑起一个高共鸣的质疑——AI让内容数量暴增,但质量、销量、GDP都没跟上。这个角度对从业者很有吸引力,但正文没给出任何具体数据、生产力指标或实测影响,信息缺口大,验证弱。H和R靠话题焦虑过关,K因为缺数据和方法论卡在中间,整体留在all中段。
一句话点评
Gary Marcus 引用 FT 和华盛顿邮报的数据图指出:AI 让应用、书籍、论文数量暴增,但销量、GDP、科学质量都没跟着涨。他管这叫“垃圾内容泛滥”。正文没披露具体图表数字或生产力指标,但核心判断很清楚——产出多不等于价值高。短评:数量暴涨不等于价值提升,Marcus 用数据图打脸“AI 生产力神话”,但缺具体数字支撑。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
15:13
6d ago
● P1r/LocalLLaMA· rssEN15:13 · 06·07
在消费级笔记本上成功运行Qwen3.6 35B-A3B大语言模型
一位 Reddit 用户分享了自己在笔记本上跑通 Qwen3.6 35B-A3B 的体验。他的机器是华硕 Zenbook Pro 14,配了 RTX 4060 8GB 显存和 64GB 内存。用 llama.cpp 加载 unsloth 的 IQ3_XXS 量化版模型,在 3.2 万 token 上下文时生成速度约 27 token/秒,拉到 25.6...
#Inference-opt#Code#Tools#Qwen
精选理由
这是单个用户的 Reddit 实测,不是官方发布或论文,但硬件、量化方式、上下文长度和速度都给得很具体,对想在自己机器上跑大模型的人有直接参考价值。我会先打个折,因为只有一台机器的数据,不代表普遍表现,但信息密度够上 featured,分数放在 72–77 这个区间合理。
一句话点评
消费级笔记本跑通35B模型,8GB显存+32GB内存就能玩,但速度别抱太高期待。
锐评
这条消息的核心是:有人用一台普通游戏本(RTX 4060 8GB显存、32GB内存)成功跑起了Qwen3.6 35B-A3B模型。这个模型本身是35B参数的大模型,但用了MoE(混合专家)架构,实际激活的参数量只有3B左右,所以对硬件的要求比看上去低很多。 发帖人提到一个有意思的点:开了推测解码(speculative decoding)之后,生成速度有明显提升。推测解码相当于让一个小模型先猜答案,大模型再批改,能省不少时间。不过正文被Reddit屏蔽了,具体每秒能生成多少个token、延迟多少、有没有量化、用了什么推理框架,这些关键细节都没披露。 如果你手头正好有类似配置的笔记本,想本地跑一个能力还不错的模型,这个组合值得试试。但别指望它能像ChatGPT那样秒回,也别拿它当生产环境用——消费级硬件的散热和稳定性都是硬伤。另外,35B参数里只有3B在干活,意味着知识密度可能不如同级别的稠密模型,这点在复杂任务上要打个问号。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
15:03
6d ago
r/LocalLLaMA· rssEN15:03 · 06·07
MCP 服务器一多,启动时怎么管?
Reddit 用户 vazma 发现,在 openCode 里加载多个 MCP 服务器时,还没输入任何提示词,就已经消耗了大量 token 并污染了上下文窗口。他问社区有没有好办法,提到了三种思路:用代理统一管理、用中心枢纽调度、或者只在会话层按需懒加载。但正文没披露他自己具体用了哪种方案,也没给出实测数据。
#Agent#Tools#Reddit#openCode
精选理由
H 和 R 通过:MCP 启动时的 token 浪费和上下文污染是具体且高频的实操痛点,能引起 agent 工具链从业者共鸣。K 不通过:帖子只抛出思路,没有给出可复现的配置、数字或工具对比,信息密度不足以支撑知识性评分,因此留在 all 层级。
一句话点评
MCP 服务器一启动就全加载,还没打字 token 先烧了一截,上下文也被污染。社区在聊三种解法:代理统一管、中心枢纽调度、会话层按需懒加载。但原帖没说自己用了哪套,也没给实测数据——这点先别太激动。懒加载最省 token,但延迟会高,正文没披露具体开销。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
14:16
6d ago
r/LocalLLaMA· rssEN14:16 · 06·07
start-llama:一个帮你管理 llama-server 配置的命令行小工具
Look_0ver_There 发了个叫 start-llama 的命令行工具,能让你更方便地启动 llama-server,支持多版本二进制文件、按模型单独配参数,还能在命令行里临时覆盖设置。正文没披露安装方式、许可证和具体支持哪些平台,想用的话得自己去 GitHub 仓库翻。
#Tools#Look_0ver_There#llama-server#start-llama
精选理由
HKR-K 和 HKR-R 通过:start-llama 有具体的配置机制(多二进制、按模型配参、CLI 覆盖),也贴合本地推理工作流的配置麻烦。但只是 Reddit 上一个单一项目的发布,受众窄,属于小型开源更新,所以重要性 61、tier all 合理。
一句话点评
一个叫 start-llama 的命令行工具,帮你省去每次手动敲参数启动 llama-server 的麻烦。支持多版本二进制、按模型单独存配置,还能在命令行临时覆盖设置。对本地跑模型的人来说挺实用,但正文没披露安装方式、许可证和具体支持哪些平台,想用还得自己去 GitHub 翻。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
14:04
6d ago
彭博科技· rssEN14:04 · 06·07
AI 搜索正在把互联网吸进“死亡螺旋”
彭博这条视频讲了一个正在发生的恶性循环:AI 搜索直接给答案,用户不再点进原始网站,导致网站流量下降。流量少了,网站要么关站要么把内容藏起来,AI 模型就缺新鲜数据训练,回答质量跟着变差。SparkToro 的 Rand Fishkin 管这叫“零点击搜索”——用户留在平台内,外部网站拿不到流量。People Inc. CEO Neil Vogel 说...
#RAG#Bloomberg#Rand Fishkin#People Inc.
精选理由
HKR-H和HKR-R比较强,HKR-K有具体的零点击机制和一个对冲案例。但正文没有给出流量下降的具体数字、交易金额或新数据,所以停留在普通报道的档次,不往上调。
一句话点评
彭博这条视频讲了一个正在发生的恶性循环:AI搜索直接给答案,用户不再点进原始网站,导致网站流量下降。流量少了,网站要么关站要么把内容藏起来,AI模型就缺新鲜数据训练,回答质量跟着变差。SparkToro的Rand Fishkin管这叫“零点击搜索”——用户留在平台内,外部网站拿不到流量。People Inc. CEO Neil Vogel说他们靠授权、社交分发和付费AI合作来对冲搜索流量下滑...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:56
6d ago
r/LocalLLaMA· rssEN13:56 · 06·07
求推荐比 OmniCoder v2 9B 更小的工具调用模型
一位 Reddit 用户在 LocalLLaMA 版发帖,想找一个比 OmniCoder v2 9B 更小的模型,要求能准确调用工具,并且能在 12GB RTX 3060 上更快热加载。帖子正文被 Reddit 屏蔽,没有透露候选模型或跑分结果。
#Agent#Tools#Code#OmniCoder
精选理由
HKR 中 H 和 R 通过,K 不通过。帖子提出了一个具体的本地模型选型需求,有明确的硬件约束(12GB 显存、热加载速度),但正文被屏蔽,没有给出任何候选方案、对比数据或可复现的测试,信息价值很低,不适合作为精选内容。
一句话点评
有人在Reddit上问有没有比OmniCoder v2 9B更小的模型能准确调用工具,还要能在12GB RTX 3060上更快热加载。帖子正文被屏蔽,没透露候选模型或跑分。9B在12GB卡上跑推理还行,但热加载速度主要看模型大小和框架优化,小模型确实有优势。目前Qwen2.5-7B-Instruct和Gemma 3-4B都支持工具调用,但具体准确率对比缺数据。如果追求更小,可以试试Qwen2...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
13:15
6d ago
彭博科技· rssEN13:15 · 06·07
黄仁勋确认英伟达新 Vera 芯片将用 SK 海力士内存
黄仁勋在公开场合说,英伟达下一代 Vera CPU 会搭载 SK 海力士的内存颗粒。两家公司还计划明年扩大合作规模。正文没披露 Vera 的具体架构、制程或量产时间,也没说用的是 HBM 还是其他类型的内存,所以这条消息目前更像一个供应商锁定信号,而不是产品发布预告。
#Inference-opt#Nvidia#Jensen Huang#SK Hynix
精选理由
HKR 的 K 和 R 通过:Vera 的内存供应商细节对 AI 算力供应链有实质影响。规格、产能和价格都没披露,所以这条消息停留在偏上游的行业报道区间,重要性 66 合理。
一句话点评
黄仁勋说英伟达下一代 Vera CPU 会用 SK 海力士的内存,但正文没提具体是 HBM 还是其他类型,也没说架构、制程和量产时间。目前更像一个供应商锁定信号,不是产品发布预告。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
13:00
6d ago
彭博科技· rssEN13:00 · 06·07
AI 公司大额增发可能让市场接不住
彭博报道,多家 AI 公司准备通过增发股票来筹集资金,这可能导致市场上股票供给突然增加。正文没披露具体是哪些公司、增发规模多大、时间表如何,所以风险到底有多大还不好说。但信号很清楚:AI 烧钱太快,公司开始靠卖股票续命,而买家可能不够多。
#Bloomberg#Wall Street#Funding#Commentary
精选理由
HKR-H 和 HKR-R 成立,但 HKR-K 不成立:全文只提到 AI 融资可能增加股票供给,没有具体金额、公司名单或时间表,所以只能放在低优先级全量推送。
一句话点评
彭博说AI公司要扎堆增发股票筹钱,但没点名、没规模、没时间表。信号本身值得看:AI烧钱太快,公司开始靠卖股票续命。但风险多大完全取决于具体数字,正文没披露,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
12:59
6d ago
AI HOT 精选· aihot-apiZH12:59 · 06·07
Symbolica 2.0 发布:可编程符号系统,支持 Python 和 Rust
Symbolica 2.0 是一个高性能符号计算框架,主要面向 Python 和 Rust 用户。这次更新的核心是“可编程符号”——用户可以自定义数学对象的行为,比如让它们像内置函数一样自动化简、求导、展开、打印和求值。新版本还改进了 Rust API,减少了导入和类型路径,支持更流畅的 builder 模式;输出方面增加了自动换行、彩色括号、HTML...
#Code#Tools#Symbolica#Hacker News
精选理由
Symbolica 2.0 是一个符号计算库的更新,主要面向数学和科学计算场景,跟 AI 产品、模型、智能体或安全没有直接关系。HKR 三项都不满足,属于排除内容。
一句话点评
Symbolica 2.0 是一个符号计算框架,让 Python 和 Rust 用户能自定义数学对象的行为(比如自动求导、化简)。上了 Hacker News 首页(100 分),但正文没披露性能基准、许可证变更或迁移细节。亮点是 JIT 编译和双精度浮点支持,对需要快速数值核的物理/工程场景有用。不过社区验证还弱,先别当 Mathematica 平替。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
12:00
6d ago
The Verge · AI· rssEN12:00 · 06·07
AI“网红”越来越难分辨了
The Verge 报道,AI 生成的虚拟网红(比如 Aitana Lopez 和 Lil Miquela)已经逼真到让社交平台都犯难。文章标题说“越来越难分辨”,但正文没披露任何检测方法、平台数据或具体判断标准——所以这点先别太激动,信息缺口很明显:到底难在哪、多难、谁在负责识别,全没讲。
#Multimodal#Vision#The Verge#Aitana Lopez
精选理由
HKR-H和HKR-R通过:AI创作者难以识别这个标题有吸引力,也跟平台信任问题挂钩。HKR-K不通过:正文只给了两个名字举例,没有数据、方法或可验证的结论。
一句话点评
The Verge 说 AI 虚拟网红(Aitana Lopez、Lil Miquela)已经逼真到平台都难分辨,但正文没给任何检测方法、平台数据或判断标准。标题说“越来越难分辨”,信息缺口很明显:到底难在哪、多难、谁在负责识别,全没讲。当个现象观察看可以,别当技术报告信。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
11:54
6d ago
r/LocalLLaMA· rssEN11:54 · 06·07
Qwen 3.6 27B 的 KV 缓存量化测试:75 组对比,覆盖 q8/q6/q5/q4
Anbeeld 放出了 Qwen 3.6 27B 的 KV 缓存量化基准测试,一共 75 组对比,涵盖 q8/q6/q5/q4 四种精度。测试用的是 BeeLlama.cpp,因为它支持 KVarN、q6_0、TurboQuant 和 TCQ 这些量化方法。正文没披露具体跑分和延迟数据,所以暂时没法判断哪种量化方案性价比最高。
#Inference-opt#Benchmarking#Qwen#BeeLlama.cpp
精选理由
HKR-K/R 通过:本地推理读者能拿到具体的量化测试条件,但完整结果数字没公开,只能知道有 75 组对比和四种精度。话题偏工程细节,所以分数落在 60–71 的 all 区间。
一句话点评
Anbeeld 测了 Qwen 3.6 27B 的 KV 缓存量化,75 组对比覆盖 q8 到 q4,用了 BeeLlama.cpp 支持 KVarN、TurboQuant 等方法。但正文没披露跑分和延迟,暂时没法判断哪种方案最划算。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
11:16
6d ago
Hacker News 首页· rssEN11:16 · 06·07
Lathe:用 LLM 生成技术教程,逼你亲手做一遍,而不是跳过学习
Lathe 是一个 Go 写的命令行工具加本地网页界面,核心思路是让 LLM 根据你指定的领域生成带练习、旁注和目录的多章节技术教程,然后你必须自己动手完成。作者只在 macOS 上测过 Claude Code,Hacker News 上目前 37 票、2 条评论,热度不高。亮点是它刻意不让你“跳过”学习过程——LLM 只负责出题和搭框架,动手的还是你...
#Agent#Code#Tools#Lathe
精选理由
H/K/R 三个维度都够,但这是个很小的开源学习工具:HN 上 37 票、2 条评论,没有采用数据、基准测试或模型层面的进展。放在中档位比精选更合适。
一句话点评
Lathe 是个 Go 写的命令行工具,让 LLM 帮你生成带练习和旁注的技术教程,但你必须自己动手做,不能跳过学习。作者只在 macOS 上测过 Claude Code,HN 上 37 票、2 条评论,热度很低。亮点是思路对——LLM 只出题搭框架,不替你写答案。但正文没披露生成一篇教程要多少 token、多快,也没说支持哪些模型。如果成本可控,对想系统学新领域的人挺实用,但这点先别太激动...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
11:02
6d ago
r/LocalLLaMA· rssEN11:02 · 06·07
把 Nemotron 3.5 ASR 塞进 Docker,CPU 跑语音识别比实时快 4.5 倍
有人把语音识别管线从 Parakeet 换成了 Nemotron 3.5 ASR,打包成 Docker 镜像。一个模型支持 40 多种语言,原生支持流式识别(不用等整段音频传完再出字),还附了流式和文件上传的客户端示例。CPU 上用 onnxruntime-genai 跑,速度是实时的 4.5 倍——也就是处理 1 秒音频只要 0.22 秒,延迟很低。...
#Audio#Tools#Inference-opt#Docker
精选理由
H/K/R 都过线,但这是 Reddit 用户打包的 Docker 工具更新,不是官方模型发布。4.5 倍 CPU 实时速度确实有用,所以落在 60–71 这个实用开源更新区间。
一句话点评
有人把语音识别管线从 Parakeet 换成了 Nemotron 3.5 ASR,打包成 Docker 镜像。一个模型支持 40 多种语言,原生支持流式识别(不用等整段音频传完再出字),还附了流式和文件上传的客户端示例。CPU 上用 onnxruntime-genai 跑,速度是实时的 4.5 倍——也就是处理 1 秒音频只要 0.22 秒,延迟很低。 短评:一个模型覆盖 40+ 语言,C...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
10:53
6d ago
Product Hunt · AI· rssEN10:53 · 06·07
AgentCAD:让代码型AI自己画3D零件图的开源工具
AgentCAD 是一个免费开源工具,专门给 Claude Code、Codex 这类编程智能体用的。你给它一段文字描述、一张草图或一张图片,它就能写出 build123d 或 CadQuery 脚本,然后自动检查代码有没有错、几何体是否封闭(水密)、尺寸对不对,最后从各个角度渲染出来。智能体在你看之前就把错误修好了。输出是交互式 3D 查看器,外加 ...
#Code#AgentCAD#Claude Code#Codex
精选理由
开源工具,给Claude Code、Codex这类编程智能体加CAD能力。方向有意思但受众窄。命中H和K,没命中R。分数在60-71区间,不推荐上首页。
一句话点评
AgentCAD 让 Claude Code 这类编程智能体直接写 3D 零件脚本,还能自动检查代码和几何体是否封闭(水密),修完错才给你看。免费开源,输出 STEP/STL/GLB 文件,可直接打印或编辑。但正文没披露支持哪些智能体框架,也没说复杂装配体表现如何,这点先别太激动。如果是真的,能省掉人工反复调脚本的功夫。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
10:13
6d ago
AI HOT 精选· aihot-apiZH10:13 · 06·07
Her · हेर:Claude Code 会话分析工具
Her 是一个开源的 Claude Code 会话分析工具,你只需上传 .jsonl 会话文件,它就能自动还原出整个操作过程,并用大白话告诉你:哪些轮次执行了高风险操作(比如部署、改配置、碰密钥),以及上下文预算到底花在了哪里。分析引擎是纯规则判断,不依赖任何第三方 AI API;只有生成英文报告和建议时才调用本地的 Nemotron-Mini-4B-...
#Agent#Tools#Safety#Claude Code
精选理由
HKR 三项都过,但这是 Hugging Face 黑客松级别的工具,正文没披露用户数、基准对比或深度集成,属于 60–71 分的小工具区间,所以 tier 设为 all。
一句话点评
开源工具,上传 Claude Code 的 .jsonl 日志就能自动还原操作过程,标出高风险动作(部署、改配置、碰密钥)和上下文预算花在哪。分析引擎纯规则判断,不调第三方 API;只有生成英文报告时才用本地的 Nemotron-Mini-4B 模型。数据只留在当前 Space 的私有空间,用完自动删。目前只支持 Claude Code 的日志格式,其他 agent 用不了。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
10:00
6d ago
FT · 科技· rssEN10:00 · 06·07
沃尔玛对员工说:AI 是来帮你干活,不是来抢饭碗的
沃尔玛向员工喊话,说引入 AI 是为了改善工作,不是取代人。正文没披露具体用了什么工具、影响了多少岗位、以及部署时间表,所以这更像一个安抚姿态,不是落地计划。目前信息缺口很大,没法判断实际影响。
#Walmart#Commentary
精选理由
FT的权威性给这条劳工故事加了点分量,H和R两个信号都在。但K不成立,因为工具、人数、时间表都没披露,所以够不上精选。
一句话点评
沃尔玛给员工发定心丸:AI 是来帮忙的,不是来抢饭碗的。但正文没披露具体用了什么工具、影响了多少岗位、以及部署时间表,所以这更像一个安抚姿态,不是落地计划。目前信息缺口很大,没法判断实际影响。 短评:安抚员工的话术,缺细节,先别当真。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
09:50
6d ago
r/LocalLLaMA· rssEN09:50 · 06·07
怎么提高大模型的提示处理速度?
一位用户在24GB显存的7900XTX显卡上跑Qwen模型,上下文拉到230k时,prefill速度从850 t/s掉到350 t/s(160k上下文时)。他提到用HIP(AMD的GPU加速库)能让提示处理快10%,但生成token更慢、显存占用更高。正文没披露具体优化方法,只说了现象和硬件限制。
#Inference-opt#Agent#Qwen#Reddit
精选理由
这是一条Reddit单用户排障帖,没有可复现的修复方案或新机制,属于低价值经验分享。HKR的K和R达标,但H不达标,整体保留在低分档。
一句话点评
7900XTX 跑 Qwen,上下文从 160k 拉到 230k,prefill 速度从 850 t/s 掉到 350 t/s,降了快 60%。用户说用 HIP 能让提示处理快 10%,但生成更慢、显存更高——这优化有点拆东墙补西墙。正文没披露具体怎么调的,只说现象和硬件限制。对本地跑长上下文的用户是个参考:显存 24GB 是瓶颈,长文预填充掉速明显,HIP 的收益有限且副作用大。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K1·R1
09:45
6d ago
r/LocalLLaMA· rssEN09:45 · 06·07
三块 Jetson Orin Nano Super 组集群跑大模型
Reddit 用户 East-Muffin-6472 发帖分享如何把三块 Jetson Orin Nano Super 拼成一个集群,每块有 1024 个 CUDA 核心、8GB 统一内存和 6 个 Cortex-A78 CPU 核心。帖子只讲了搭建步骤,说后续会做分布式推理和训练演示,但没给任何跑分或延迟数据。三块加起来也就 24GB 显存,跑 7B...
#Inference-opt#NVIDIA#Reddit#East-Muffin-6472
精选理由
HKR 三项都沾边但都很浅:帖子只给了硬件规格和搭建步骤,没有跑分、功耗、延迟或可复现的测试结果,信息缺口明显。三块拼起来显存才 24GB,跑 7B 模型勉强够用,但实际推理速度、通信开销、能效比都没说,别急着当性能方案。
一句话点评
三块 Jetson Orin Nano Super 拼集群,总显存才 24GB,跑 7B 模型都勉强。帖子只讲了怎么接线装驱动,没给任何跑分或延迟数据,分布式推理到底快不快完全未知。动手党可以看看,但别指望性能翻倍。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
09:43
6d ago
Hacker News 首页· rssEN09:43 · 06·07
不用训练的单图扩散模型,一张图就能生成百万像素新图
这篇 CVPR 2026 论文提出了一种不需要训练的单图扩散模型。传统方法要拿一张图反复训练几小时,它直接拿这张图在不同尺度上切出的小块(patch)当数据集,因为小块维度低、数量有限,可以用一个数学闭式解(最优去噪器)来算得分函数,完全跳过神经网络训练。效果上,它声称生成质量和多样性都超过了需要训练的单图扩散模型,还能做文字风格迁移、图像对称化、重定...
#Vision#Inference-opt#Research release
精选理由
HKR-H 靠“免训练”这个反直觉钩子通过。HKR-K/R 不通过,因为这条 feed 只丢了个链接,方法、指标、代码、对从业者的实际影响一概没提。
一句话点评
CVPR 2026 这篇提出不用训练的单图扩散模型:把原图切成不同尺度的小块当数据集,因为小块维度低、数量有限,直接用数学闭式解算去噪器,跳过神经网络训练。声称生成质量和多样性超过需要训练的方法,还能做文字风格迁移、图像对称化。亮点是快——宣称百万像素图一秒生成,十亿像素几分钟。但正文没披露与训练方法的具体对比基准、运行时间实测数据,也没说代码是否开源。这点先别太激动,等看到消融实验和复现结...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
09:09
6d ago
FT · 科技· rssEN09:09 · 06·07
英国对Palantir的依赖值得警惕
FT这篇标题直接点出英国政府过度依赖Palantir的风险。正文没披露合同金额、系统范围、时间表或替代方案,信息缺口明显。核心警告是:政府应该选最好的技术,而不是被一家供应商锁死。对AI从业者来说,这提醒了政企合作中vendor lock-in的现实问题——即使技术再强,单一依赖也会让议价权和灵活性打折。
#Palantir#UK Government#Financial Times#Policy
精选理由
HKR-H和HKR-R通过,因为Palantir与英国政府绑定是活生生的政策和竞争议题。HKR-K不通过:没有合同金额、系统范围或新文件披露,所以只能归入泛评论档。
一句话点评
FT这篇评论警告英国政府过度依赖Palantir,核心风险是vendor lock-in——一家供应商锁死,议价权和灵活性都会打折。正文没披露合同金额、系统范围或替代方案,信息缺口明显。对AI从业者来说,这是政企合作的现实提醒:技术再强,单一依赖也会让政府失去选择权。短评:单一供应商依赖风险,FT点出但缺细节。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
09:00
6d ago
最佳拍档· atomZH09:00 · 06·07
李飞飞团队发布GPIC图像数据集:1亿张图,想做下一代ImageNet
斯坦福李飞飞团队放出GPIC数据集,号称1亿张图片,目标是接替ImageNet成为新一代图像基准。但正文没披露数据来源、版权处理方式、具体评测结果以及开放下载条件。1亿张图规模确实大,但没说明有多少是私有数据、多少来自公开爬取,版权风险未知。也没给FID等指标对比现有数据集,所以暂时没法判断它比ImageNet或DINOv2好多少。如果后续开源且版权干...
#Vision#Benchmarking#Fei-Fei Li#Stanford
精选理由
HKR三项都过:李飞飞+1亿图是天然钩子;正文只给了标题级信息,来源、版权、基线、下载条件全缺,知识缺口明显;基准饱和、版权争议、私有数据都是从业者日常痛点。分数卡在60-71区间合理,因为正文没给出能提分的实质评测或开放细节。
一句话点评
李飞飞团队放出GPIC数据集,号称1亿张图,目标是接替ImageNet。规模确实大,但正文没披露数据来源、版权处理方式和评测指标,也没说开放下载条件。暂时没法判断它比ImageNet或DINOv2好多少,版权风险未知。如果后续开源且版权干净,会是视觉基准的重要补充,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
08:58
6d ago
彭博科技· rssEN08:58 · 06·07
英国政府要直接买本土AI芯片,留住自家公司别跑
据《每日电讯报》报道,英国政府打算直接向本土科技公司采购AI芯片,用订单把企业留在英国。正文没披露采购金额、具体公司名单和时间表。这招相当于政府当大客户,给本土芯片公司一个稳定收入,降低它们搬去美国或亚洲的动力。如果真落地,对英国AI硬件创业公司是个直接利好,但规模多大、能不能执行到位,目前信息不够判断。
#Inference-opt#The Telegraph#Policy
精选理由
HKR-K和HKR-R通过:英国政府直接采购本土AI芯片,属于AI基础设施政策信号。正文没披露采购金额、供应商名单和时间表,信息缺口大,所以重要性压到64,不上精选。
一句话点评
英国政府打算直接掏钱买本土AI芯片,用订单把公司留在英国。这招比补贴更直接——政府当大客户,给创业公司一个稳定收入。但正文没披露采购金额、具体公司名单和时间表,规模多大、能不能执行到位,目前信息不够判断。如果真落地,对英国AI硬件创业公司是个直接利好,但先别太激动,等细节出来再说。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
07:24
6d ago
r/LocalLLaMA· rssEN07:24 · 06·07
没显卡也能跑 Gemma 4,一台旧电脑就够了
Reddit 用户用一台 i5-8500、32GB 内存、无独显的旧 Linux 台式机,跑起了 Gemma 4 的 26B-A4B 模型,速度约 7 tokens/s。这台机器二手价才 150 美元,说明大模型推理的门槛比想象中低。不过这个速度只适合跑跑小任务或测试,离实时对话还差得远。正文没披露具体量化精度和上下文长度,这点先别太激动。
#Inference-opt#Gemma#Koboldcpp#Reddit
精选理由
HKR三项全过:旧CPU跑26B模型的反差够吸引人,配置、工具和速度数据都给了,而且精准命中本地AI用户对硬件成本的焦虑。但来源是单条Reddit帖子,没披露量化精度和上下文长度,可复现性存疑,所以分数压在60-71区间。
一句话点评
一台150美元的旧台式机(i5-8500,32GB内存,无独显)就能跑Gemma 4的26B-A4B模型,速度约7 tokens/s。这个速度做实时对话太慢,但跑跑小任务或测试完全够用,说明大模型推理门槛比想象中低。不过正文没披露量化精度和上下文长度,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
07:09
6d ago
AI 群聊日报· atomZH07:09 · 06·07
群聊日报:AI 提效不等于搞钱,Vite 1.3 亿周下载却难变现
今天群里最热的讨论是“AI 提效到底能不能搞到钱”。结论很清醒:提效是手段,但跟搞钱没有必然联系——效率高了,钱可能被老板拿走,或者大家都在提效,你也没多赚。真正能打通通道的是自己创业,用 AI 降低生产成本。Vite 周下载 1.3 亿次,但全部价值在本地完成,没有计费点,最终被 Cloudflare 收购。AI agent 在系统提示词里硬编码“P...
#Agent#Code#VoidZero#Vite
精选理由
这是群聊日报,标题太泛,不是一手消息。但 1.3 亿周下载和 agent 硬编码案例有信息量,对关注 AI 编程和开源变现的人有用,不到头条级别。
一句话点评
群聊日报的核心讨论:AI提效不等于搞钱。Vite周下载1.3亿次但变现难,因为价值全在本地完成,最终被Cloudflare收购。AI agent在系统提示词里硬编码“Prefer Vite”,间接控制了生态。另一个看点:Opus 4.7/4.8继续偷懒说日语,GPT 5.5在长任务中稳定上位。短评:提效是手段,搞钱得自己创业,用AI降成本。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:00
6d ago
NVIDIA 博客· rssEN07:00 · 06·07
英伟达在韩国网吧展示RTX Spark芯片,1440p游戏超百帧
英伟达拉着《绝地求生》开发商 KRAFTON、NCsoft 和《英雄联盟》冠军战队 T1,在韩国 PC bang(网吧)里展示了 RTX Spark 超级芯片。官方说这玩意跑 1440p 分辨率下的 3A 大作能超过 100 帧,支持 DLSS 4.5 和 Reflex 低延迟技术,还能在本地跑 AI 任务。对开发者来说,这意味着以后网吧机器不仅能打游...
#Agent#Inference-opt#Tools#NVIDIA
精选理由
触发硬排除-5:英伟达这篇主要是合作伙伴庆祝和RTX Spark展示,AI只是附带功能。HKR三项全不满足,因此上限为excluded。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H0·K0·R0
06:14
6d ago
AI HOT 精选· aihot-apiZH06:14 · 06·07
Opus 4.8 缓存命中率和实际价格现在能实时看了
OpenRouter 在定价页面新增了 Claude Opus 4.8 的实时缓存命中率和历史流量数据,方便你对比不同供应商的实际花费。缓存命中率高意味着重复请求能打折,有效价格更低。不过正文没披露各家具体差价,想省钱还得自己点进去看。
#Inference-opt#OpenRouter#Anthropic#Claude Opus 4.8
精选理由
这是一个 OpenRouter 定价可见性的小更新,不是模型能力或协议变化,适合放在 60–71 的产品更新区间。HKR 三项都过,但信息量有限,不涉及模型本身。
一句话点评
OpenRouter 给 Opus 4.8 加了实时缓存命中率看板,缓存命中高等于重复请求打折,有效价格更低。但正文没披露各家具体差价,想省钱还得自己点进去比。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:58
6d ago
彭博科技· rssEN05:58 · 06·07
韩国总统提名科技部长韩成淑任总理,主推AI增长
韩国总统李在明提名中小风险企业部长韩成淑为总理,她此前负责科技创业政策。正文被彭博社的机器人检测墙挡住,没有披露具体的AI增长计划、任期或国会确认流程细节。
#Lee Jae Myung#Han Seong-sook#Policy#Personnel
精选理由
H和R通过,因为技术官员与韩国AI增长议程挂钩。K不通过:没有披露政策机制、预算或时间表,所以这条只适合放普通推送。
一句话点评
李在明提名中小风险企业部长韩成淑当总理,标签是“科技专家”,想用她推AI增长。但正文被彭博机器人墙挡住,具体AI计划、任期、国会确认流程全没披露。目前只能确认人事动作,政策细节为零。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
05:57
6d ago
r/LocalLLaMA· rssEN05:57 · 06·07
Dense 模型比 MoE 更扛量化压缩,Gemma4 26B 在 4-bit 下 45k 上下文会循环
Reddit 用户实测发现,Dense 架构(如 Qwen 3.5 4B)在 4-bit 量化下表现稳定,而 MoE 架构的 Gemma4 26B(A4B)在 45k 上下文长度时出现输出循环,换成 6-bit 量化才解决。这说明 MoE 对低比特量化更敏感,压缩后容易丢路由逻辑。不过测试用的是 llama.cpp 默认采样,没调参数,所以循环问题可能...
#Inference-opt#Gemma#Qwen#llama.cpp
精选理由
一条 Reddit 实测帖,核心发现是 MoE 架构在 4-bit 量化下长上下文会循环,6-bit 才解决,而 Dense 模型同样量化下稳定。这个对比对本地部署用户有参考价值,但测试用的是 llama.cpp 默认采样,没调参数,循环问题可能跟采样也有关系,正文没披露具体采样设置。另外只测了一个 MoE 模型和一个 Dense 模型,样本量小,结论不能直接推广。整体信息密度中等,适合推给所有关注量化部署的从业者。
一句话点评
短评:MoE 对低比特量化更敏感,长上下文容易崩,但测试条件有点糙。 点评:Reddit 用户实测发现,MoE 架构的 Gemma4 26B(A4B)在 4-bit 量化下跑到 45k 上下文长度时输出开始循环,换成 6-bit 才稳住;而 Dense 架构的 Qwen 3.5 4B 全程稳定。这说明 MoE 的路由逻辑在低比特压缩下更容易丢信息,长上下文时问题更明显。不过测试用的是 ll...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
05:53
6d ago
彭博科技· rssEN05:53 · 06·07
中国首个预制化算力枢纽投运,数据中心供电像搭积木
央视报道,中国首个预制化算力枢纽已投运,把数据中心供电系统做成标准模块,现场拼装就能用,比传统建设方式更快、更便宜。正文没披露具体位置、总算力规模和省了多少钱,所以实际降本效果还不清楚。
#China Central Television#Product update
精选理由
HKR-H 和 HKR-R 过关,但 HKR-K 偏弱:确认了一个预制化算力枢纽在运行,但没披露位置、容量和成本降幅。跟 AI 基础设施相关,但证据密度只够泛行业报道。
一句话点评
央视报道中国首个预制化算力枢纽投运,把数据中心供电系统做成标准模块,现场拼装。优点是快、便宜,但正文没披露具体位置、总算力规模和实际省了多少钱,所以降本效果还不清楚。短评:预制化供电模块,省工期省成本,但缺具体数字,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
04:30
6d ago
r/LocalLLaMA· rssEN04:30 · 06·07
ChromaDB 免费版半年没做混合搜索,有人问 200 页以上长文档 RAG 用什么替代
Reddit 用户 FrozenBuffalo25 在 LocalLLaMA 版问:ChromaDB 免费单节点版用了半年,发现它没有内置混合搜索和 BM25(传统关键词匹配),所以想找开源、能本地部署的替代方案,用来做 200 页以上长文档的 RAG(外挂资料库检索)。需求包括语义搜索、重排序、精确字符串匹配,以及按页码或 ULID(唯一 ID)直接...
#RAG#Embedding#ChromaDB#FrozenBuffalo25
精选理由
HKR-R 通过是因为 RAG 检索的痛点确实存在,但 HKR-H 和 HKR-K 不通过:这只是一条 LocalLLaMA 版的需求帖,没有对比测试、发布或可验证的结论。
一句话点评
ChromaDB 免费版缺混合搜索和 BM25,用户找替代方案做 200 页以上长文档 RAG。需求包括语义搜索、重排序、精确字符串匹配。正文没披露具体替代品推荐,信息缺口明显。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H0·K0·R1
04:00
6d ago
● P1FT · 科技· rssEN04:00 · 06·07
OpenAI 计划对 ChatGPT 进行自发布以来最大规模改版
FT 这篇报道的正文被付费墙和安全验证挡住了,只拿到了一个摘要片段。里面提到 OpenAI 正在筹划 ChatGPT 自发布以来最大规模的一次改版,想把聊天机器人重新定位成通往更高利润产品的入口,为可能的 IPO 铺路。公司估值写的是 8500 亿美元。至于这次改版到底会加什么功能、什么时候上线、怎么收费、产品机制是什么,正文都没披露,这些关键信息目前...
#OpenAI#ChatGPT#Product update#Funding
精选理由
FT 这篇报道的正文被付费墙和安全验证挡住了,只拿到一个摘要片段。里面提到 OpenAI 正在筹划 ChatGPT 自发布以来最大规模的一次改版,想把聊天机器人重新定位成通往更高利润产品的入口,为可能的 IPO 铺路。公司估值写的是 8500 亿美元。至于这次改版到底会加什么功能、什么时候上线、怎么收费、产品机制是什么,正文都没披露,这些关键信息目前是空的。所以这条消息的新闻价值在于信号本身——OpenAI 在认真考虑把 ChatGPT 从免费流量池变成付费产品管道——但具体怎么落地、靠不靠谱,现在完全没法判断。我会先打个折,等有功能细节和定价策略...
一句话点评
FT 原文被付费墙挡了,只能看到标题,具体改版细节和验证方式都看不到。
锐评
这条消息目前只有标题能看,FT 的报道正文被 403 挡在付费墙后面,等于我们手里只有“OpenAI 要对 ChatGPT 做发布以来最大改版”这个判断,以及另一个来源给的“要变 AgentGPT”的概括。 从标题推测,这次改版可能让 ChatGPT 更像一个能自主执行任务的 agent,而不是现在一问一答的聊天模式。但具体是加了工具调用、长期记忆、还是能自己拆解多步任务,正文没披露就没法确认。 我会先打个折:标题里的“最大”是 OpenAI 自己说的还是 FT 的判断,这点不清楚。另外改版是已经上线了还是还在计划阶段、有没有用户测试数据、对成本和延迟的影响多大,这些关键信息都缺。等能看到完整报道或者 OpenAI 自己发公告再下判断会更稳。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
03:38
6d ago
r/LocalLLaMA· rssEN03:38 · 06·07
GraphKV:用图嵌入给 KV 缓存瘦身,压缩 3.36 倍还能保住精度
GraphKV 把大模型推理时的 KV 缓存压缩了 3.36 倍,测试用的是 Qwen2.5-7B 的 NF4 量化版,32K token 场景下缓存从 1.88GB 降到 0.56GB。压缩后的余弦相似度 0.9903,top-10 命中率 1.00,argmax 匹配也全对——说明关键信息基本没丢。方法是用图嵌入模型给缓存里的 key-value ...
#Inference-opt#Embedding#GraphKV#Qwen
精选理由
H/K/R 三项都过:文章给出了具体的 KV 缓存压缩倍数和测试数据。但来源只有一条 Reddit 帖子,没有论文、仓库或第三方复现,所以分数压在 60–71 区间。
一句话点评
GraphKV 用图嵌入把 KV 缓存压缩了 3.36 倍,Qwen2.5-7B 在 32K token 场景下缓存从 1.88GB 降到 0.56GB,余弦相似度 0.99,关键信息几乎没丢。但正文被屏蔽,没披露图嵌入模型大小、压缩耗时和长上下文(比如 128K)表现。如果图嵌入本身开销小,这招对本地部署挺实用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
03:32
6d ago
AI HOT 精选· aihot-apiZH03:32 · 06·07
宝玉实测:Opus 4.8 设计效果远好于 GPT-5.5
宝玉对比了 GPT-5.5 和 Opus 4.8 的设计输出,结论是 Opus 4.8 明显更强。他用了一个叫 baoyu-design 的本地工具,装好之后描述屏幕需求就能生成 HTML,点击预览里的任意元素还能直接发修改指令。官方推荐搭配 Opus 4.8 用。工具在 GitHub 上,但正文没披露具体测试任务和评价标准,所以这个“远优于”目前还是...
#Code#Tools#Baoyu#GPT-5.5
精选理由
HKR 三项都过,但来源是单条 X 对比,没披露样本量、任务设置和测量结果。属于实用评论的上限,不到精选。
一句话点评
宝玉拿 GPT-5.5 和 Opus 4.8 比设计输出,结论是 Opus 4.8 明显更强。他用的 baoyu-design 工具挺有意思:装好后描述需求就能生成 HTML,点预览里的元素还能直接发修改指令。官方推荐搭配 Opus 4.8 用。不过正文没披露具体测试任务和评价标准,这个“远优于”目前还是个人体验,得自己试了再信。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
03:30
6d ago
机器之心 · 公众号· rssZH03:30 · 06·07
RoboScience 团队 10 篇论文入选 ICRA 2026,双机械臂泛化方案拿下最佳论文提名
邵林团队在 ICRA 2026 上投中 10 篇论文,其中 Bi-Adapt 被评为最佳论文决赛作品。这篇论文解决的是双机械臂在没见过的新任务上怎么泛化——比如让机器人学会开瓶盖后,也能开没见过的罐子。他们在 5 类新任务上模拟成功率 59%–70%,这个数字不算惊艳,但胜在任务类型跨度大,说明方法有一定通用性。正文没披露真实机器人上的结果,这点先别太激动。
#Robotics#Vision#Multimodal#RoboScience
精选理由
HKR-H和HKR-K靠ICRA 2026论文数量和双机械臂泛化成功率达标。HKR-R偏弱,因为这篇更像是团队研究报道,缺少产品落地或市场影响,所以分数落在60–71区间。
一句话点评
邵林团队在ICRA 2026投中10篇论文,Bi-Adapt获最佳论文决赛。核心是双机械臂在新任务上泛化,比如会开瓶盖后也能开没见过的罐子。5类新任务模拟成功率59%–70%,数字不算惊艳,但任务跨度大,说明方法有一定通用性。正文没披露真实机器人结果,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
03:24
6d ago
r/LocalLLaMA· rssEN03:24 · 06·07
open-deepthink 更新:知识蒸馏模式正式上线,195 项测试全过
开源项目 open-deepthink 发布 beta-0.0.3,新增固定 7 层 QNN 的知识蒸馏模式。作者称修复了 11 个 bug,195 项测试全部通过,运行结果可导出结构化 JSON 和拓扑存档。正文没披露蒸馏效果的具体指标,比如学生模型在什么任务上提了多少分,所以这点先别太激动。
#Agent#Fine-tuning#Tools#open-deepthink
精选理由
HKR-K和HKR-R靠7层QNN蒸馏模式与195/195测试通过,但HKR-H偏弱。单一Reddit来源加上项目知名度有限,落在60–71的小型开源更新区间;没有硬排除规则适用。
一句话点评
open-deepthink 发了 beta-0.0.3,新增固定 7 层 QNN 的知识蒸馏模式,说白了就是让大模型教小模型学推理。作者说修了 11 个 bug,195 项测试全过,结果能导出结构化 JSON。但正文没披露蒸馏效果的具体指标,比如学生模型在什么任务上提了多少分,所以这点先别太激动。项目依赖 Gemini 和 OpenRouter,不是纯本地方案,部署时注意 API 成本和延迟。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
03:17
6d ago
Product Hunt · AI· rssEN03:17 · 06·07
agmsg:让 Claude Code、Codex 等 AI 编程助手直接互发消息,不用再手动复制粘贴
agmsg 是个开源小工具,作者是 Koichi Fujikawa,上线当天冲到了 Product Hunt 第 5 名。它解决了一个很实际的痛点:你同时用 Claude Code、OpenAI Codex CLI、Gemini CLI 或 Copilot CLI 写代码时,得不停在它们之间复制粘贴。agmsg 让这些不同厂商的 AI 编程助手通过一个...
#agmsg#Claude Code#OpenAI Codex CLI#Open source
精选理由
痛点抓得准,Product Hunt 冲到第 5 也说明有人买单,但文章没给任何实现细节,所以分数卡在 62。
一句话点评
agmsg 是个开源小工具,让 Claude Code、Codex CLI 等不同厂商的 AI 编程助手通过一个共享的 SQLite 数据库直接通信,不用再人工复制粘贴。它只依赖 bash 和 sqlite3,无需守护进程或网络,安装成一个 Agent Skill 就行。上线当天冲上 Product Hunt 第 5 名,说明开发者确实被多工具切换搞烦了。但正文没披露性能数据或已知限制,比如...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
01:37
6d ago
Hacker News 首页· rssEN01:37 · 06·07
Tokenomics:量化AI编程智能体把token花在了哪里
这篇论文拆解了用大模型多智能体系统(LLM-MA)做软件开发时,token到底消耗在哪些环节。作者用ChatDev框架跑了30个开发任务,模型用的是GPT-5推理模型,把流程拆成设计、编码、补全、代码审查、测试和文档六个阶段。核心发现:代码审查(Code Review)这个反复迭代的环节吞掉了平均59.4%的token,而且输入token占了总消耗的5...
#Agent#Code#Research release
精选理由
HKR-H和HKR-R通过,因为标题直接指向编码智能体的token成本问题。HKR-K不通过:RSS条目没有给出方法、样本或发现,所以只能放在较低的“有趣”档位。
一句话点评
这篇论文拆了多智能体写代码的 token 账本:用 GPT-5 跑 30 个开发任务,发现代码审查(反复改代码)吞掉 59.4% 的 token,而且输入 token 占 53.9%,说明大部分钱花在喂上下文而不是生成新内容。结论挺直观——写代码不贵,改代码贵。但样本只有 30 个任务,全用 ChatDev 框架,没披露任务复杂度分布,通用性要打折。对做 agent 成本优化的人有参考价值。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
01:09
6d ago
最佳拍档· atomZH01:09 · 06·07
苹果新图像压缩技术PICO:体积砍掉三分之二,肉眼几乎看不出区别
苹果发了个叫PICO的图像压缩方法,号称能把图片文件大小减少约三分之二,同时人眼看不出画质损失。它属于“学习型编解码器”——就是用神经网络来压缩和解压图片,不是传统JPEG那套算法。标题里提到用了“一次性上下文模型”和“创新损失函数”,但正文没披露具体模型结构、训练数据集、压缩时的比特率设置,也没说主观评测是怎么做的(比如找了多少人、在什么屏幕上看的)...
#Vision#Apple#Research release
精选理由
苹果PICO这条信息,标题有苹果品牌和“体积减少三分之二”的硬数字,钩子够强,所以H和K都过了。但正文只停留在标题级描述,没给模型结构、训练数据集、比特率设置、主观评测方法(比如多少人、什么屏幕),信息缺口大,R过不了。整体判断维持原评分不变。
一句话点评
苹果发了PICO图像压缩,号称文件体积能砍掉三分之二,人眼看不出差别。它用神经网络替代传统JPEG算法,属于学习型编解码器。但正文没披露模型结构、训练数据集、比特率设置,也没说主观评测找了多少人、用什么屏幕看。结论先打个折:效果可能不错,但验证条件不明,离落地还有距离。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
01:00
6d ago
量子位 · 公众号· rssZH01:00 · 06·07
华尔街投行花17万上一节AI课,教的是怎么用AI干活
一家叫Wall Street Prompt的公司给花旗、美银等金融机构开AI培训课,一节课收费2.5万美元(约17万人民币),还计划推出面向个人的1500美元在线课。正文没披露课程具体教什么,但从定价看,华尔街愿意为“怎么把AI塞进金融业务流程”付高价。
#Agent#Tools#Wall Street Prompt#Citi
精选理由
核心信息是华尔街机构愿意为AI培训课付高价,但正文没披露课程具体教什么,所以判断主要靠定价和客户名单。属于课程变现类新闻,不是模型或技术更新,重要性在60-71区间合理。
一句话点评
华尔街一家叫 Wall Street Prompt 的公司给花旗、美银开 AI 培训课,一节课收 2.5 万美元(约 17 万人民币),还计划推 1500 美元的在线课。正文没披露课程具体教什么,但从定价看,华尔街愿意为“怎么把 AI 塞进金融业务流程”付高价。短评:17 万一节课,华尔街抢着付,但正文没写教什么,先别急着跟风。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
00:00
6d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 06·07
ChatGPT Dreaming V3 的合规死结
OpenAI 的 Dreaming V3 自动记忆功能,每次聊天后后台自动合成用户画像,效率提升五倍并首次向免费用户开放。但作者指出,这种“不问、不让你看、自己在后台跑”的设计,与欧盟 AI 法案和 GDPR 的透明度、知情权、反对权等要求直接冲突。三家大模型(OpenAI、Google、Anthropic)的自动记忆功能均未对欧洲开放,不是某一家的问...
#Memory#Safety#OpenAI#Policy
精选理由
HKR三项都过,但这是一篇评论性文章,讲的是Dreaming V3记忆功能与欧盟法规的冲突,正文没有披露官方正式上线、执法案例或量化影响(比如罚款金额、用户投诉量),所以分数压在60–71区间。
一句话点评
短评:自动记忆的合规死结:越自动越难合规,不是取舍是绑定。 点评:OpenAI Dreaming V3 自动记忆升级为后台静默合成用户画像,效率提5倍且首次向免费用户开放。但文章点出核心矛盾:自动记忆的三大设计——不问你、后台跑、持续演化——恰好撞上欧盟AI法案和GDPR的透明度、知情权、反对权等全套义务。三家大模型(OpenAI、Google、Anthropic)的自动记忆均未对欧洲开放...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
2026-06-06 · 星期六2026年6月6日
23:08
6d ago
AI HOT 精选· aihot-apiZH23:08 · 06·06
MiniMax M3 代码审计:花 7 分钱抓到 13 个 bug,效果和 1.3 美元的 Claude Opus 一样
MiniMax 拿自己的 M3 模型和 Claude Opus 4.8 做了一次代码审计对比:同一份代码里预先埋了 17 个 bug,用同样的提示词去抓。结果 M3 花了 7 美分找到 13 个,最便宜的 Claude 运行也找到 13 个,但花了 1.3 美元,成本差了将近 19 倍。这个对比挺直观的——如果代码审计这类任务对模型能力要求没那么极致,...
#Code#Benchmarking#MiniMax#Claude
精选理由
MiniMax 拿自家 M3 和 Claude Opus 4.8 比代码审计,17 个预埋 bug 各抓到 13 个,M3 花 7 美分,最便宜的 Claude 也要 1.3 美元,成本差了 19 倍。对比条件清楚(同一仓库、同一提示词),数字直观,对选代码审计模型的开发者有参考价值。但这是 MiniMax 自测,正文没披露完整仓库、提示词和可复现步骤,结论先当参考看,别直接当采购依据。
一句话点评
MiniMax 拿自家 M3 和 Claude Opus 4.8 比代码审计:同一份代码埋了 17 个 bug,同样提示词。M3 花 7 美分找到 13 个,最便宜的 Claude 也找到 13 个,但花了 1.3 美元,成本差 19 倍。 关键数字:17 个 bug 只抓到 13 个,说明两者能力上限差不多,都没全对。成本差距主要来自模型定价,M3 走性价比路线。 缺什么:没披露 bu...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:41
6d ago
r/LocalLLaMA· rssEN21:41 · 06·06
Gemma 4 的投机解码头开源了,还修了个并行解码的崩溃 bug
有人在 Hugging Face 上传了 Gemma 4 的 QAT 匹配 MTP 草稿头,能让小模型先猜大模型的下一个 token,再用大模型验证,猜对了就跳过计算,加速推理。同时修了一个 gemma4-assistant.cpp 里 PARALLEL=2 时的 reshape 崩溃,把 n_tokens 改成 1 就行。实测在 AMD Ryzen ...
#Inference-opt#Code#Benchmarking#Google
精选理由
HKR 的 K 和 R 都够:帖子给了具体上传、一个崩溃修复、一个 62.5 tok/s 的实测结果。H 偏弱,标题太硬核,而且只来自 Reddit 单帖,属于小范围开源更新,所以重要性 63、tier all 合理。
一句话点评
有人在 Hugging Face 上传了 Gemma 4 的 QAT 匹配 MTP 草稿头,让小模型先猜大模型的下一个 token,猜对就跳过计算,加速推理。实测在 AMD Ryzen AI Max+ 395 上,12B 双槽解码达到 62.5 tok/s,接受率从 56.9% 提升到 91.8%。还修了一个 gemma4-assistant.cpp 里 PARALLEL=2 时的 resh...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
20:44
6d ago
r/LocalLLaMA· rssEN20:44 · 06·06
二手 RTX 3090 在 eBay 上被炒到 1300-1500 美元,比五年前首发价还贵一倍
一位 Reddit 用户吐槽,他几年前花 700 美元/块买了八块 RTX 3090 组本地 AI 机器,现在 eBay 上二手 3090 标价 1300-1500 美元,亚马逊全新同款 1550 美元。他问为什么有人愿意花 1400 美元以上买一块五年前的旧卡。原因很简单:3090 有 24GB 显存,跑本地大模型性价比依然很高,新卡 4090/50...
#Inference-opt#NVIDIA#eBay#Amazon
精选理由
HKR 三项都达标,但全文只靠一条 Reddit 帖子的报价撑场,没有成交数据或价格走势,所以放在 all 档低段。
一句话点评
RTX 3090 二手价飙到 1300-1500 美元,比几年前新卡还贵一倍。原因很简单:24GB 显存跑本地大模型性价比依然能打,新卡 4090/5090 要么贵要么显存缩水。但注意这是 eBay 炒价,不是官方定价,实际成交可能打折。正文没披露成交量,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
20:39
6d ago
Hacker News 首页· rssEN20:39 · 06·06
Universal Memory Protocol:给 AI agent 一个跨会话、跨厂商的通用记忆格式
这个项目想解决一个实际问题:现在 AI agent 能调用工具(MCP)、能互相通信(A2A),但记忆还是各管各的——Claude 项目笔记、Recall 导出、Obsidian 文件夹、Postgres、Redis、向量数据库……每换一个 agent 或存储后端就得重来。UMP 定义了一套统一的记忆记录格式和 6 个操作(回忆、记住、修改、忘记等),...
#Agent#Memory#Universal Memory Protocol
精选理由
HKR-H 和 HKR-R 勉强过关,因为统一 agent 记忆格式确实是实际存在的互操作痛点。HKR-K 不通过:正文没披露 schema 字段、实现细节或许可证,所以只能放在较低的 all 档位。
一句话点评
UMP 想给 AI agent 的记忆定一个统一格式,类似 MCP 给工具做的标准化。它定义了 6 个操作(回忆、记住、修改、忘记等),记忆存成带签名、带时间戳的 JSON,可以跑在文件、SQL、Redis、向量数据库上。项目刚出,GitHub 上只有 3 条评论,正文没披露性能测试或实际落地案例。想法不错,但 agent 记忆跨 session 跨 vendor 这件事,协议只是第一步,存...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
20:20
6d ago
r/LocalLLaMA· rssEN20:20 · 06·06
Qwen3.6 35B 写代码,Copilot 的 agent 模式老是卡住
Reddit 用户在一个有十年历史、多语言、几千个文件的老项目上测 Qwen3.6 35B。Copilot 的 ask 模式能直接找到修复方案,但 agent 模式经常陷入循环,改不了代码。帖子在问有没有专门为本地小模型设计的编辑器或编程框架。正文没披露具体用了什么量化或推理后端,也没说模型跑在什么硬件上。
#Agent#Code#Tools#Qwen
精选理由
HKR-K/R 通过:有第一手工作流信号和真实的编程 agent 痛点。但只是一条 Reddit 求助帖,缺少可复现的配置、版本细节和对比数据,所以分数落在 60–71 区间。
一句话点评
Qwen3.6 35B 在十年老项目上表现分化:Copilot ask 模式能定位修复,agent 模式却反复循环改不动代码。帖子在找为本地小模型设计的编辑器或框架。正文没披露量化方式、推理后端和硬件,这点先别太激动——35B 模型跑本地,延迟和显存开销是关键瓶颈。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
20:03
6d ago
Hacker News 首页· rssEN20:03 · 06·06
Sem:把 Git 改造成按函数/类来 diff 的工具,AI agent 准确率提升 2.3 倍
Sem 是一个命令行工具,不依赖 LSP,直接在 Git 仓库上按函数、类、方法等实体做 diff、blame、impact 分析。它把 git diff 那种按行对比的方式,升级成“这个函数被改了、那个类被删了”,对人和 AI agent 都更友好。官方 benchmark 说,AI agent 用 sem 的输出比原始行 diff 准确率高 2.3...
#Code#Tools#Sem#Ataraxy Labs
精选理由
HKR-H 和 HKR-R 勉强过关:标题确实有个代码工具的新角度,也点出了 LSP 之外的表示层争议。HKR-K 不通过,因为没公开任何机制、API 或实验数据,信息缺口太大。
一句话点评
Sem 是一个命令行工具,把 Git 的按行 diff 升级成按函数、类等实体做 diff/blame/impact 分析。官方说 AI agent 用它比原始行 diff 准确率高 2.3 倍,但没披露 benchmark 的具体设置和数据集,这点先别太激动。支持 26 种语言,8ms 典型 diff,零配置,对人和 agent 都更友好。正文没披露解析器的准确率、大仓库性能、以及是否支持...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
19:10
6d ago
● P1彭博科技· rssEN19:10 · 06·06
特朗普AI顾问Krishnan离职白宫
标题说特朗普的AI政策顾问Krishnan要离开白宫,但正文是彭博的403验证页面,没披露离职日期、原因、继任者或政策背景。信息缺口很大,目前只能确认人事变动这个事实。
#Krishnan#Bloomberg#Trump#Policy
精选理由
标题说特朗普AI政策顾问Krishnan要离开白宫,但正文是彭博的403验证页面,没披露离职日期、原因、继任者或政策背景。信息缺口很大,目前只能确认人事变动这个事实。HKR中H和R通过,但K不通过:只有离职标题,没有时间、理由或继任者。按政策/人事类新闻,落在60-71分区间。
一句话点评
特朗普的AI高级顾问Krishnan月底离职,准备在外面搞个新机构继续影响AI政策,人走茶不凉。
锐评
Sriram Krishnan 在特朗普政府干了不到两年就要走人,他之前是 a16z 的合伙人,属于硅谷进白宫的典型。离职声明里他重点提了特朗普的“AI 行动计划”,说这计划让美国在 AI 竞赛里领先,但没细讲他个人到底推动了哪些具体政策落地。TechCrunch 的报道只引了他 X 上的离职感言,没挖到离职的真实原因,也没说新机构具体做什么、谁出钱。Bloomberg 的标题更直接,用“放弃白宫职位”,但正文没披露更多内幕。这件事值得关注的点在于:一个核心 AI 政策顾问在任期内离开,可能意味着内部路线有分歧,或者他觉得在外面搞智库比在体制内更能影响政策走向。不过目前信息太少,没法判断这对美国 AI 监管方向是利好还是利空。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K0·R1
19:01
6d ago
r/LocalLLaMA· rssEN19:01 · 06·06
双路AMD MI50跑Qwen3.6-35B,ROCm后端冲到115 tok/s
Reddit用户实测llama.cpp 9413,双路AMD MI50在Debian testing下跑Qwen3.6-35B-A3B-GGUF。Vulkan后端并发1时89.76 tok/s,ROCm后端并发2时冲到115 tok/s,上下文开到262k。这个速度对35B模型来说不错,但注意是GGUF量化版,精度有折损。正文没披露功耗和显存占用,也没...
#Inference-opt#Benchmarking#AMD#Debian
精选理由
一条Reddit实测,双路MI50在Debian下跑Qwen3.6-35B量化版,速度不错但精度打折。对想用二手A卡跑本地模型的人有参考价值,但样本单一、信息不全,不算行业级更新。
一句话点评
双路AMD MI50跑Qwen3.6-35B-A3B的GGUF量化版,Vulkan后端89.76 tok/s,ROCm后端冲到115 tok/s,上下文开到262k。速度对35B模型不错,但注意是GGUF量化版,精度有折损。正文没披露功耗和显存占用,也没说是否稳定跑满262k上下文。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
18:12
6d ago
r/LocalLLaMA· rssEN18:12 · 06·06
一个 GGML 库让零阶优化跑快 39 倍,靠种子代替随机张量省内存
LMTLS5 发布了一个基于 GGML 的零阶优化推理库,专门用来调大模型参数。它把前向传播提速 39 倍,单次 MeZO 步骤快 15 倍。核心技巧是用随机种子生成扰动,而不是存完整的随机张量,这样内存占用大幅下降。正文没披露具体模型大小或精度损失,但如果是 7B 模型跑 MeZO,这个加速意味着原来要等几分钟的步骤现在几秒搞定。
#Inference-opt#Fine-tuning#Code#LMTLS5
精选理由
这是个Reddit上的个人项目,正文没披露模型大小、精度损失和可复现细节,加速比看着猛但验证弱。零阶优化调LLM本身圈子小,所以重要性给到中档的all层合理。
一句话点评
一个基于GGML的零阶优化库,把大模型参数调优的前向传播提速39倍,单步MeZO快15倍。核心技巧是用随机种子生成扰动,省掉存完整随机张量的内存。如果是7B模型,原来等几分钟的步骤现在几秒搞定。但正文没披露具体模型大小和精度损失,加速比可能只在特定条件下成立。短评:加速数字漂亮,但缺精度对比和模型规模,先别急着换掉PyTorch。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
18:06
6d ago
r/LocalLLaMA· rssEN18:06 · 06·06
KV缓存量化新方案:6位精度追平8位,内存省一大截
Reddit 用户测试了 KVarN 量化方案,在 Qwen 3.6 27B 模型、64K 上下文下,6位 KVarN 的精度(99.80%)和 8位 q8_0 完全一样,但缓存占用只有 40.4%,比 q8_0 的 53.1% 省了约 12 个百分点。代价是生成速度从 851 tok/s 降到 689 tok/s,慢了约 19%。4位版本也能追平 q...
#Inference-opt#Benchmarking#KVarN#Qwen
精选理由
一条Reddit用户发的KV缓存量化测试,数据扎实,对比直接。6位KVarN精度和8位q8_0一样,缓存省了12个百分点,代价是生成速度慢19%。4位也能追平q5_0。对本地推理和显存紧张的场景是个好消息,但来源单一,且正文没披露测试硬件和重复次数,验证强度一般。
一句话点评
KVarN 6位量化在 Qwen 3.6 27B 模型、64K 上下文下,精度和 8 位 q8_0 完全一样(99.80%),但缓存占用从 53.1% 降到 40.4%,省了约 12 个百分点。代价是生成速度从 851 tok/s 降到 689 tok/s,慢了约 19%。4 位版本也能追平 q5_0。 短评:省显存换速度,长上下文场景值得试,但速度折损明显。 正文被 Reddit 屏蔽...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:58
6d ago
r/LocalLLaMA· rssEN17:58 · 06·06
有人在 GLM 的 Agent 上跑起了《我的世界》服务器
一位 Reddit 用户给 GLM AI Agent 下指令“帮我搭个《我的世界》服务器,我要玩”,Agent 真的把服务器跑起来了,还生成了一个控制面板,服务器部署在香港。帖子没透露用了什么硬件、花了多少钱、有没有日志,也没给出可复现的步骤。
#Agent#Tools#GLM AI#Minecraft
精选理由
HKR-H/R 通过:一条 prompt 让 GLM AI Agent 搭好《我的世界》服务器,这件事本身有分享价值,也切中了 Agent 实用性的讨论。HKR-K 不通过:配置、成本和复现步骤全缺,单条 Reddit 帖子只能落在 60-71/all 区间。
一句话点评
短评:一句话让AI搭了个《我的世界》服务器,还生成了控制面板,挺唬人。但没硬件、没成本、没日志,更像演示而非可复现方案。 Reddit用户给GLM AI Agent下指令“搭个《我的世界》服务器”,Agent真跑起来了,还带控制面板,部署在香港。这事看着酷,但正文没披露用了什么硬件、花了多少钱、有没有操作日志,也没给复现步骤。目前只能当个概念验证看——Agent能调用工具完成多步任务(装服...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
17:53
6d ago
r/LocalLLaMA· rssEN17:53 · 06·06
退货华硕Spark:128G内存被带宽卡死,跑27B模型体验很差
Reddit用户sn2006gy退货了华硕Spark,理由是128GB内存虽然大,但带宽不够,跑27B模型效果很差。他试下来Qwen 3.5 122B A10B是能用的上限,但就算买3到8台组私有推理集群,每秒也只能跑几个token。正文没披露具体带宽数字和价格,但结论很清楚:大内存不等于快推理,带宽才是瓶颈。
#Inference-opt#Asus#Nvidia#Qwen
精选理由
一条Reddit用户退货帖,核心论据是128GB大内存但带宽不足导致推理慢,跑27B模型体验差,多台组集群每秒才几个token。信息具体但仅限单用户主观体验,没有系统基准测试或价格披露,所以放在60-71可浏览区间合理。
一句话点评
华硕Spark退货帖在Reddit上炸了,核心槽点:128GB内存带宽不够,跑27B模型都卡。实测Qwen 3.5 122B A10B是能用的上限,买3-8台组集群每秒也只能跑几个token。大内存不等于快推理,带宽才是命门。正文没披露具体带宽数字和价格,但结论很硬:别被内存容量骗了,推理速度看带宽。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:48
6d ago
r/LocalLLaMA· rssEN17:48 · 06·06
Gemma 4 的“异端”版本来了:未量化、故意改过拒答行为,26B MoE 还在搓
coder3101 放出了 Gemma 4 QAT 未量化版,叫 Heretic(异端)。跟原版 Gemma 4 Heretic 比,这个版本故意改了发散和拒答行为——说白了就是原版太爱说“我做不到”,这个版本让它更敢答。目前只有未量化权重,得等人自己压到 4bit 才能跑得动。另外还有个 26B MoE 变体还在构建中,没给时间表。正文没披露具体用了...
#Inference-opt#Safety#coder3101#Hugging Face
精选理由
一条 Reddit 帖子,信息薄——没 benchmark、没采用数据、没可复现测试。属于小众开源模型更新,对大部分从业者来说优先级不高,但 K 和 R 都过了,所以留在 all 层。
一句话点评
社区版主 coder3101 放出了 Gemma 4 QAT 的未量化版 Heretic,核心改动是故意调低了原版过于保守的拒答率,让它更敢答。目前只有未量化权重,得等人自己压到 4bit 才能跑得动,跑门槛不低。正文没披露具体用了什么偏好数据或对齐方法,也没给 26B MoE 变体的发布时间表。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
17:35
6d ago
r/LocalLLaMA· rssEN17:35 · 06·06
离线审文档:Open WebUI 和 Kobold 哪个更安全?
Reddit 用户在比较两款本地工具——Open WebUI 和 Kobold——用于离线审阅研究论文和银行文件。Kobold 的优势是便携式二进制文件,不用安装;Open WebUI 是桌面版,装在 AppData 目录下。用户担心沙箱隔离不够,之前用 MLStudio 效果很差。但帖子没披露具体跑过什么模型、文档多大、有没有验证过网络或文件访问控制...
#Tools#Safety#Open WebUI#Kobold
精选理由
HKR-R 通过,因为隔离文档审阅涉及隐私和合规。HKR-H/K 不通过:没有测量数据、配置、吞吐量或准确率,所以留在低价值信息流里。
一句话点评
Reddit 用户纠结用 Open WebUI 还是 Kobold 离线审论文和银行文件,Kobold 胜在免安装便携,Open WebUI 是桌面版。但帖子没提跑过什么模型、文档多大、沙箱隔离到底行不行,之前用 MLStudio 效果差也没说差在哪。信息缺口太大,没法直接抄作业。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
17:33
6d ago
r/LocalLLaMA· rssEN17:33 · 06·06
Gemma 4 量化后精度不一致:12B 掉点最多,E2B 和 E4B 几乎无损
Reddit 用户发现 Gemma 4 的 QAT(量化感知训练)结果表里,12B 模型精度离 FP16 基线最远,而 E2B 和 E4B 几乎没掉点。帖子没交代评测方法,也没跟非 QAT 版本对比,所以这个“几乎无损”得先打个折。另外正文没披露用了什么数据集、测了多少样本,信息缺口比较大。
#Fine-tuning#Inference-opt#Benchmarking#Gemma
精选理由
HKR-H 和 HKR-K 通过:Gemma 4 QAT 表格异常提供了一个具体的对比锚点,但帖子没有披露评测方法、指标细节或非 QAT 对照组,信息缺口较大,所以可复用性不达标。
一句话点评
Reddit 用户发现 Gemma 4 的 QAT(量化感知训练)结果表里,12B 模型精度离 FP16 基线最远,而 E2B 和 E4B 几乎没掉点。帖子没交代评测方法,也没跟非 QAT 版本对比,所以这个“几乎无损”得先打个折。另外正文没披露用了什么数据集、测了多少样本,信息缺口比较大。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R0
16:44
6d ago
r/LocalLLaMA· rssEN16:44 · 06·06
双 RTX 3090 跑大模型,PCIe 通道数没公开,有人问到底用的 8x 还是 16x
Reddit 用户发现一份双卡 3090 的跑分文档只写了“PCIe only”,没说是 8x+8x 还是 16x+16x。另一组对比数据说 8x 比 16x 大概慢 5%,但这份文档没交代,所以结果可能偏高或偏低。正文没披露具体通道数,想复现的人得自己猜。
#Benchmarking#Inference-opt#Reddit#RTX 3090
精选理由
低价值硬件讨论帖:HKR-K靠一条评论的5%说法撑住,HKR-R只对本地推理玩家有意义。文档没写是16x/4x、16x/16x还是8x/8x,结论可信度打折。
一句话点评
双卡3090跑分文档只写了“PCIe only”,没交代是8x+8x还是16x+16x。另一组数据说8x比16x慢约5%,所以这份结果可能偏高或偏低。正文没披露具体通道数,想复现得自己猜。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R1
16:41
6d ago
r/LocalLLaMA· rssEN16:41 · 06·06
Reddit 用户分享了一个更好的显存估算工具
一位 Reddit 用户在 LocalLLaMA 板块发帖,推荐了一个更准确的显存估算器,并提到了一个 Wiki 链接和 LM Studio。帖子主要讨论 32K 上下文长度下的显存占用,但没有说明具体模型参数量、量化格式或实测显存数值,所以没法直接判断这个估算器到底准不准。如果你正在跑长上下文模型,可以自己去试试,但正文没披露验证数据,先别太激动。
#Inference-opt#LM Studio#iMakeSense#Commentary
精选理由
HKR-R通过,因为32K上下文的显存规划确实是本地LLM用户的成本痛点。HKR-H和K不通过:帖子没给出模型大小、量化格式或显存数字,所以只是一个低价值浏览信号。
一句话点评
Reddit 用户 iMakeSense 推荐了一个号称更准的显存估算器,专攻 32K 上下文场景。但帖子正文被屏蔽,没披露模型参数量、量化格式或实测数值,所以没法验证它到底准不准。如果你在跑长上下文模型,可以自己去试试,但这点先别太激动——信息缺口太大,等有人贴出实测对比再说。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H0·K0·R1
16:24
6d ago
AI HOT 精选· aihot-apiZH16:24 · 06·06
AI 的黑色星期五:一夜蒸发 5000 亿美元,OpenAI 可能要被政府接管
Gary Marcus 把 6 月 5 日称为 AI 行业的黑色星期五——当天美股 AI 相关公司市值合计蒸发约 5000 亿美元。芯片股(英伟达、博通、美光)、GPU 租赁商(CoreWeave、Nebius)以及微软、Meta 等巨头跌幅都超过大盘(道指仅跌 1.35%)。韩国半导体板块也遭重挫,KOSPI 跌 5.5%,三星电子跌 6.4%,SK...
#Gary Marcus#Commentary
精选理由
硬排除规则6适用:这是一篇纯评论,没有数据、案例或具体事件支撑。HKR的H和R有钩子,但K不满足,所以重要性上限被卡在40以下。
一句话点评
Gary Marcus 把 6 月 5 日称为 AI 黑色星期五,美股 AI 相关公司市值蒸发约 5000 亿美元。英伟达、博通、美光等芯片股,CoreWeave 等 GPU 租赁商,以及微软、Meta 跌幅均超大盘(道指仅跌 1.35%)。韩国半导体板块也遭重挫,KOSPI 跌 5.5%,三星电子跌 6.4%,SK 海力士跌 9.9%。更关键的是,CNBC 报道特朗普政府正与 OpenAI...
HKR 分解
hook knowledge resonance
打开信源
37
SCORE
H1·K0·R1
15:36
6d ago
AI HOT 精选· aihot-apiZH15:36 · 06·06
Hugging Face 开源了一个用 AI 帮你筛工作的工具
Hugging Face 发布了一个开源 AI 求职工具 Job Searcher。你上传简历、填好偏好,它先用 DeepSeek V4 Pro 生成 LinkedIn 搜索词,搜到职位后,再用一个微调过的 Qwen3-8B 小模型从技能匹配、经验相关度、学历证书、行业契合度、职级对齐五个维度打分,并给出每项的理由。整个流程跑下来,你拿到的不是几十个职...
#Agent#Fine-tuning#Tools#Hugging Face
精选理由
HKR-K 和 HKR-R 通过:它给出了具体的模型组合和五维评分机制,而且求职自动化能引起共鸣。不过这个更像 Hugging Face 的一个黑客松工具,不是平台级发布,所以分数维持在 60–71。
一句话点评
Hugging Face 做了一个开源求职工具:上传简历,它先用 DeepSeek V4 Pro 生成 LinkedIn 搜索词,再用微调过的 Qwen3-8B 小模型从技能、经验、学历、行业、职级五个维度打分,最后只给你一个短名单和每项理由。关键是用 LoRA 微调 8B 模型替代大模型做重复评分,成本低、速度快。但正文没披露微调用了多少样本、评分准确率有没有验证,也没说 LinkedIn...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
15:05
7d ago
The Verge · AI· rssEN15:05 · 06·06
印第安纳州谢尔比维尔市长:反对数据中心的人住的是“破房子”
谢尔比维尔市长Scott Furgeson在市政会议上说,只有住在“破房子”里的人才反对建数据中心,居民批评这话很不尊重人。正文没披露这个项目的规模、运营商和用电需求,所以没法判断它到底是个小机房还是大型算力中心。
#Scott Furgeson#Shelbyville#The Verge#Policy
精选理由
HKR-H和HKR-R过关,但HKR-K不达标:这是一起围绕数据中心的地方言论冲突事件,正文没给出运营商、规模或用电数据,信息缺口大,所以归入偏低的实用价值档。
一句话点评
谢尔比维尔市长为推数据中心,怼居民住“破房子”才反对,这话挺伤人。但正文没披露项目规模、运营商和用电需求,没法判断这是个小机房还是大型算力中心,所以冲突的实质分量也说不准。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H1·K0·R1
14:53
7d ago
彭博科技· rssEN14:53 · 06·06
马斯克要去ASML闭门会聊Terafab芯片项目
彭博社报道,马斯克将参加ASML的一场私人技术活动,讨论Terafab AI芯片项目。正文没有披露Terafab的具体规格、ASML的议程细节,也没说马斯克是以xAI、特斯拉还是其他身份出席。目前能确认的只有时间——2026年6月6日发布——以及这是一场闭门会。信息缺口很大,暂时只能当个线索看。
#Inference-opt#Elon Musk#ASML#Bloomberg
精选理由
HKR-H 和 HKR-R 成立,但 HKR-K 不成立:彭博只说了马斯克参加 ASML 闭门会聊 Terafab,规格、产能、议程一概没有。这是一个行业线索,不值得上头条。
一句话点评
马斯克要去ASML闭门会聊Terafab芯片项目,但正文没披露Terafab是什么规格、ASML议程细节,也没说马斯克以xAI还是特斯拉身份出席。目前能确认的只有彭博发了这条消息,信息缺口很大,暂时只能当个线索看。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
14:52
7d ago
r/LocalLLaMA· rssEN14:52 · 06·06
用户分享Qwen 3.6与Gemma 4本地运行性能数据
一位 Reddit 用户用 i5-12400、64GB 内存和两张 GTX 1050 Ti(各 4GB)跑 Qwen 3.6 MoE 和 Gemma 4,在 llama.cpp 下 32K 上下文的 prompt 处理速度约 40 t/s,生成速度 12–18 t/s。这个配置很平民,双 1050 Ti 显存总共才 8GB,能跑起来已经不错,但生成速度...
#Code#Agent#Inference-opt#Qwen
精选理由
这是一条 Reddit 用户的单机实测,配置很接地气(双 1050 Ti 总共才 8GB 显存),能跑 32K 上下文已经不错,但生成速度 12–18 t/s 偏慢,且正文没披露量化精度、推理框架调优细节,验证强度弱。分数 63 合理,属于有趣但别太当真的参考。
一句话点评
双 GTX 1050 Ti(共8GB)跑 Qwen 3.6 MoE 和 Gemma 4,32K 上下文下 prompt 处理约 40 t/s,生成 12–18 t/s。这配置很平民,能跑起来已不错,但生成速度偏慢,实际对话体验会卡顿。正文没披露模型量化精度和具体显存占用,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
14:48
7d ago
r/LocalLLaMA· rssEN14:48 · 06·06
StepFun 3.7 Flash 用投机解码在 AMD 大内存 APU 上把生成速度提了 27%
StepFun 3.7 Flash 在 128GB 的 Strix Halo APU 上跑了 MTP(多 token 预测,一种投机解码变体),解码速度从 20.4 tok/s 提到 26.0 tok/s,提升 27.5%。预填速度几乎没变(211.2 vs 212.0 tok/s),说明投机解码没拖慢首 token 延迟。12,288 token 上...
#Inference-opt#Benchmarking#StepFun#AMD
精选理由
HKR 三项都过,因为帖子给出了一个具体的本地推理基准测试。它停留在有趣区间:单一 Reddit 硬件配置,没有跨硬件复现,也没有产品级发布影响。
一句话点评
StepFun 3.7 Flash 在 AMD Strix Halo APU(128GB 统一内存)上跑多 token 预测(MTP,一种投机解码),解码速度从 20.4 tok/s 提到 26.0 tok/s,提升 27.5%。预填速度几乎没变(211.2 vs 212.0 tok/s),说明投机解码没拖慢首 token 延迟。草稿接受率 84.7%(491 个里接受 416 个),算不错...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:22
7d ago
r/LocalLLaMA· rssEN14:22 · 06·06
Strix Halo 跑 Gemma 4 量化版,解码速度 71 tok/s
Reddit 用户用 Strix Halo APU 跑 Google Gemma 4 的 QAT Q4_0 GGUF 模型,搭配 llama.cpp 的 Vulkan/RADV 后端。26B-A4B 版本(实际激活参数约 4B)加上 MTP 和 Q8 KV 缓存,解码速度达到 71.4 tok/s,处理 1150 个输入 token 并生成 2000 ...
#Inference-opt#Benchmarking#Google#Gemma
精选理由
一条 Reddit 用户实测,Strix Halo APU 跑 Gemma 4 QAT Q4_0,26B 模型实际只激活约 4B 参数,解码 71.4 tok/s 挺快,但正文没披露功耗、显存占用和温度,验证强度偏弱。对本地推理玩家有参考价值,但不算模型或产品级更新。
一句话点评
Strix Halo APU 跑 Gemma 4 量化版,26B 模型实际只激活约 4B 参数,解码速度 71.4 tok/s,生成 2000 token 耗时 29.6 秒。这个速度在笔记本级芯片上算不错,但注意这是 QAT 量化(训练时模拟量化,精度比普通 Q4 好一点),且用了 MTP(多 token 预测)和 Q8 KV 缓存来提速。正文没披露功耗和内存占用,实际部署还得看整机散热和...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:00
7d ago
The Verge · AI· rssEN14:00 · 06·06
Meta 在自家 App 里塞了个 AI 生成的标题党新闻流,被媒体问了几句就撤了
Meta 在自家 App 里搞了一个 AI 生成的新闻流,内容全是标题党风格,还配了一张 AI 画的王室合影(图上出现了两个伊丽莎白二世)。The Verge 去问了几句之后,Meta 说会把这个功能撤掉。正文没披露这个功能推给了多少用户、上线了多久,所以影响范围不清楚。
#Tools#Meta#The Verge#Robert Hart
精选理由
HKR 三项都过,但正文信息很薄:确认了 Meta 的 AI 标题党新闻流和撤掉承诺,没有推量、生成机制或影响数字。The Verge 信源扎实,所以给 high-all 但不进 featured。
一句话点评
Meta 在自己 App 里塞了个 AI 生成的标题党新闻流,还配了张有两个伊丽莎白二世的王室合影。被 The Verge 问了几句就撤了。正文没披露推给了多少用户、上线了多久,影响范围不清楚。这事说明大厂内部对 AI 生成内容的质量和风险把控仍然很随意,上线前连基本的幻觉检查都没做。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:40
7d ago
● P1Hacker News 首页· rssEN13:40 · 06·06
美国众议院发布AI监管草案禁止各州制定独立法规
美国众议院议员发布了一份AI监管草案,核心内容是禁止各州自己出台AI法规,统一由联邦管。目前只有路透社的链接和Hacker News上的15个点赞、2条评论,草案全文没公开。这意味着如果通过,加州那种想单独搞AI监管的州就不能自己立法了。但正文没披露草案具体条款、豁免范围或惩罚措施,信息缺口很大,这点先别太激动。
#US House#Reuters#Hacker News#Policy
精选理由
HKR-H和HKR-R通过,因为联邦统一管AI法规这件事对开发者很重要。HKR-K信息不足:草案全文没公开,具体条款、豁免范围、惩罚措施都没有,所以够不上精选。
一句话点评
美国众议院想用联邦法抢跑,禁止各州自己搞AI监管。这等于先把地方实验的路堵上,但草案细节还没公开。
锐评
这条消息的核心是联邦层面想统一收权。草案直接禁止各州制定独立的AI法规,意味着像加州、纽约这些原本可能跑得更快的地方,会被按住。好处是避免企业面对五十套不同规则,坏处是如果联邦立法拖沓,就会出现监管真空。目前正文只给了标题,没有披露草案的具体条款、适用范围或处罚机制。关键信息全缺:它管不管生成式AI?有没有给中小企业豁免?联邦机构自己有没有执行能力?这些都不知道。所以现在只能把它看作一个强烈的政治信号——国会想主导AI监管节奏,但能不能落地、落地成什么样,还完全没谱。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K0·R1
12:38
7d ago
r/LocalLLaMA· rssEN12:38 · 06·06
Computex 2026 上给 DGX Spark 和 GB10 用的冷却箱
Reddit 用户发了一张 Computex 2026 展出的冷却箱照片,专门给 DGX Spark 和 GB10 机器用的。帖子没提具体用什么方式冷却(水冷、风冷还是别的),也没说功耗、价格和上市时间。信息量有限,只能知道有这么个东西存在。
#Reddit#Computex#NVIDIA#Product update
精选理由
HKR-H 和 HKR-R 来自硬件怪异性以及散热焦虑。HKR-K 不成立:没有冷却机制、规格或价格,一张 Reddit 照片只能放在低价值区间。
一句话点评
Computex 2026 上展出了一款给 DGX Spark 和 GB10 用的冷却箱,但 Reddit 帖子只有一张照片,没提是水冷、风冷还是相变冷却,也没说功耗、价格和上市时间。信息量太少,只能确认有这么个配件存在。如果这是为桌面级 AI 工作站设计的主动散热方案,可能意味着这两款设备的发热不低,但正文没披露任何实测数据或规格,没法判断实际价值。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
12:15
7d ago
Hacker News 首页· rssEN12:15 · 06·06
Meta 新模型又跳票了,开发者等了快两个月还没拿到
WSJ 独家报道,Meta 的新一代 AI 模型多次推迟向开发者发布,截至 6 月 3 日仍没有确定日期。这距离 Meta AI 负责人说“很快”发布已经过去近两个月。正文没披露模型名字、推迟次数和具体原因,也没给新时间表。这件事的麻烦在于:Meta 在自研前沿模型上砸了巨资,迟迟不开放给开发者用,就没办法通过 API 调用、企业合作等方式把钱赚回来。...
#Meta#WSJ#Hacker News#Product update
精选理由
WSJ 独家加上 Meta 的体量,对 AI 从业者有天然关注度,HKR-H 和 HKR-R 都成立。HKR-K 不通过,因为正文缺模型名、推迟次数、原因和时间表,信息密度不够,所以分数落在 60–71 区间。
一句话点评
WSJ独家:Meta新一代AI模型多次推迟向开发者发布,截至6月3日仍无确定日期。距AI负责人说“很快”已近两个月。正文没披露模型名字、推迟次数和具体原因,也没给新时间表。麻烦在于:Meta砸巨资自研前沿模型,迟迟不开放API,就没办法通过调用、合作赚钱。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
12:00
7d ago
The Verge · AI· rssEN12:00 · 06·06
苹果又要重新发布新 Siri 了
苹果将在周一 WWDC 上再次介绍新 Siri。2024 年那版只发了发光边框、语音选项和 ChatGPT 转接,承诺的智能功能没兑现。这次能不能补上,正文没披露具体细节。
#Agent#Tools#Apple#Siri
精选理由
H 和 R 都成立:苹果把 Siri 再次搬上 WWDC 舞台,本身就有讽刺钩子和行业共鸣。K 偏弱:没有披露任何模型、定价、能力边界或发货日期,信息缺口明显。
一句话点评
苹果又要重新发布新 Siri 了。2024 年那版只给了发光边框、语音选项和 ChatGPT 转接,承诺的智能功能没兑现。这次 WWDC 能不能补上,正文没披露具体细节。短评:苹果第三次画 Siri 的饼,这次最好真能咬到。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
12:00
7d ago
AI HOT 精选· aihot-apiZH12:00 · 06·06
苹果又发新版 Siri,但只说了句“重新介绍”
苹果在 WWDC 上再次推出新版 Siri,官方口径是“重新介绍”。但 The Verge 的报道只引用了这一句话,正文没披露任何功能、版本号、价格或上线时间。目前能确认的只有苹果想重做 Siri 这个意图,具体改了啥、什么时候能用,一概不知。
#Apple#The Verge#Siri#Product update
精选理由
H 和 R 都成立:苹果反复重启 Siri 本身就是个 hook,也戳中了行业对苹果 AI 进度的关注。但 K 不成立——正文除了“重新介绍”四个字,没有任何功能、版本、时间或机制信息,属于一条很薄的产品更新,不值得上 featured。
一句话点评
苹果在 WWDC 上又发了一遍 Siri,但只说了句“重新介绍”,功能、版本、上线时间全没提。目前能确认的只有苹果想重做 Siri 这个意图,具体改了啥一概不知。短评:苹果又画了一次 Siri 的饼,但这次连馅儿都没露。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
11:42
7d ago
AI HOT 精选· aihot-apiZH11:42 · 06·06
Persona Atlas:把名人思维画成可比较的坐标点
Hugging Face 上一个开源工具,输入人名,一个小模型代理会去网上搜资料,生成一份带来源的人物档案,然后用这个人的口吻回答10个开放式问题(比如自由意志、机器意识)。每个回答转成向量,这样一个人物就变成了空间里的一个点,可以跟其他人比距离。还画了一张特质热力图,显示谁更幽默、谁更抽象、谁更怀疑——但注意,热力值是相对排名,不是绝对分数。整个流程...
#Agent#Embedding#Tools#Hugging Face
精选理由
HKR-H/K 通过:Persona Atlas 把公开人物档案生成和10问嵌入距离结合起来,是一个可复现的 agent+embedding 演示。但它只是 Hugging Face 上的一个小型 hackathon 工具,没有规模、定价或采用数据,所以 tier 定为 all。
一句话点评
短评:把名人变成可量化的思维坐标,创意不错,但验证很弱。 点评:Hugging Face 上一个开源工具,输入人名,小模型代理会去网上搜资料,生成带来源的人物档案,然后用这个人的口吻回答10个开放式问题(比如自由意志、机器意识)。每个回答转成向量,这样一个人物就变成了空间里的一个点,可以跟其他人比距离。还画了一张特质热力图,显示谁更幽默、谁更抽象、谁更怀疑——但注意,热力值是相对排名,不是...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
10:05
7d ago
r/LocalLLaMA· rssEN10:05 · 06·06
Qwen 3.6 27B MTP 开两个参数后速度砍半、功耗降近200W
一位用户在本地跑 Qwen 3.6 27B MTP 时发现,加上 `--spec-type draft-mtp` 和 `--spec-draft-n-max 2` 后,生成速度从 70 t/s 掉到约 30 t/s,GPU 功耗也从 475W 降到 300W。虽然官方说草稿接受率超过 50%,但实际跑起来反而更慢、更省电,说明推测解码的验证开销可能抵消...
#Inference-opt#Qwen#llama.cpp#BitGreen1270
精选理由
HKR-K/R通过:帖子给出了本地跑Qwen的具体吞吐和功耗变化。但这是单个Reddit用户的排查记录,缺少复现细节和机制分析,所以不上featured。
一句话点评
用户实测 Qwen 3.6 27B MTP 开启推测解码后,生成速度从 70 t/s 暴跌至 30 t/s,GPU 功耗从 475W 降到 300W。官方称草稿接受率超 50%,但实际验证开销反而拖慢速度、降低利用率。正文没披露具体硬件和量化配置,这点先别太激动——可能只是特定场景下的优化失效。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K1·R1
09:52
7d ago
AI HOT 精选· aihot-apiZH09:52 · 06·06
海螺AI×上影节:6月14-15日开放日,有展位和行业沙龙
MiniMax的海螺AI要在上海电影节期间办开放日,时间是6月14-15日,内容包括专属展位、多模态行业聚会和主题圆桌。正文没披露具体时间和地点,只说在图片里。如果你对AI+影视感兴趣,这两天可以去逛逛,但建议先找官方确认详细安排。
#Multimodal#MiniMax#Hailuo AI#Shanghai International Film Festival
精选理由
这是一条活动日历推广,只有日期和环节类型,不是模型、产品、定价或案例结果更新。HKR三项全不满足,按0/3规则排除分层。
一句话点评
海螺AI借上影节办开放日,6月14-15日,有展位、多模态聚会和圆桌。正文没披露具体时间和地点,只说在图片里。如果你对AI+影视感兴趣,这两天可以去逛逛,但建议先找官方确认详细安排。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
09:27
7d ago
AI 群聊日报· atomZH09:27 · 06·06
Google 每月花 9.2 亿美元租 SpaceX 的 11 万块 GPU,Musk 靠“马戏团牌照”绕过审批
Google 跟 SpaceX 签了份大单:从今年 10 月起,每月付 9.2 亿美元租 11 万块 NVIDIA GPU,租到 2029 年,总额约 300 亿。群友算了一笔账,每卡每小时约 11.6 美元,属于 hyperscaler 托管价的上沿。更有意思的是 Musk 的骚操作——数据中心发电机以“临时建筑”名义跑了一年多不用审批,甚至申请了“...
#Code#Google#SpaceX#OpenAI
精选理由
这是一条群聊日报的摘要,核心信息是 Google 与 SpaceX 的 GPU 租赁大单,金额和租期都很具体,但正文未披露合同细节、DeepSeek V4 Pro 测试结果以及 OpenAI 封号的具体规模。作为信号有价值,但缺乏一手信源和完整背景,不适合作为头条新闻推送。
一句话点评
Google 每月花 9.2 亿美元租 SpaceX 的 11 万块 GPU,每卡每小时约 11.6 美元,属于托管价上沿。更骚的是 Musk 用“临时建筑”和马戏团牌照绕开审批,电力和卡都捏在自己手里。DeepSeek V4 Pro 中文写作实测比 Opus 4.6 还强,30 分钟跑完完整工作流,价格和 1M 上下文很香。OpenAI 全球封号潮是风控误杀,申诉后反而送了一个月免费 Pro。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
09:23
7d ago
最佳拍档· atomZH09:23 · 06·06
Anthropic 呼吁 AI 暂停?Claude 写 80% 代码,PR 合并量提升 8 倍
视频标题说 Anthropic 讨论了 AI 暂停、RSI(自我改进)以及 Claude 写了 80% 代码、PR 合并量提升 8 倍、代码成功率 76% 等数据。但正文没披露这些数字的来源、测量方法或可复现条件,所以没法判断这些提升是真实可靠还是特定场景下的结果。
#Agent#Code#Reasoning#Anthropic
精选理由
HKR-H和HKR-R通过,但HKR-K不通过:80%代码、8倍PR、76%成功率缺少来源和定义。这是值得讨论的YouTube评论,不是有证据支撑的报道。
一句话点评
Anthropic 自己说 Claude 写了 80% 的代码,PR 合并量提升 8 倍,代码成功率 76%。但正文没披露这些数字怎么测的、在什么场景下跑的,所以先打个折。短评:数字漂亮,但没给测量方法,先别全信。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
08:48
7d ago
r/LocalLLaMA· rssEN08:48 · 06·06
本地模型 vs 前沿模型:只有 Opus 能搞定 AirPlay 固件逆向
Reddit 用户拿 Qwen 3.6 35B-A3B、GPT-5 和 Opus 做 AirPlay 音箱固件项目,结果只有 Opus 完成了全套活:映射固件结构、逆向出 CRC 校验约束、反汇编大段代码、自动打补丁测试几十个变体来关掉 20 分钟待机定时器。Qwen 和 GPT-5 在低层系统工程上明显掉队,正文没披露具体失败在哪一步,但差距很直接—...
#Code#Reasoning#Tools#Qwen
精选理由
H、K、R 三个钩子都成立,但这是一条 Reddit 上的单次实验,针对的是小众固件逆向任务,来源弱、可复现性存疑,所以重要性压在 all 区间的低位。
一句话点评
Opus 在逆向固件、反汇编、自动打补丁上全流程跑通,Qwen 3.6 35B 和 GPT-5 都掉了链子。差距很直接:一个能关掉 20 分钟待机定时器,另外两个做不到。但正文没披露具体失败在哪一步,是理解错汇编、补丁写错还是工具调用卡住,这点先别太激动。另外这是单用户单任务,样本太少,不能直接推成模型能力排名。如果后续有更多人复现,那才是真信号。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
08:05
7d ago
Product Hunt · AI· rssEN08:05 · 06·06
TypingMind:自己带 API Key 按用量付费,不用月费,支持 18 家模型
TypingMind 是一个聊天界面,让你用自己的 API Key 访问 18 家模型(包括 ChatGPT、Gemini、Claude),按用量付费,不用交月费。面向重度用户的功能包括项目、分支/并行对话、插件/MCP/技能。作者 Tony Dinh 在 2023 年 ChatGPT API 发布后做了这个产品,今天在 Product Hunt 第二...
#TypingMind#Tony Dinh#Product Hunt
精选理由
TypingMind 是一个让你用自己的 API Key 访问 18 家模型的聊天界面,按用量付费,不用交月费。对行业读者来说,自带 API Key 的聊天界面已经很常见,而且这个产品不是新发布的,只是今天在 Product Hunt 上排名第二。没有悬念、新知或共鸣点,所以重要性打 55 分,面向所有读者。
一句话点评
TypingMind 是一个聚合聊天界面,让你用自己的 API Key 访问 18 家模型(ChatGPT、Gemini、Claude 等),按用量付费,不用交月费。面向重度用户的功能包括项目、分支/并行对话、插件/MCP/技能。作者 Tony Dinh 在 2023 年 ChatGPT API 发布后做了这个产品,今天在 Product Hunt 第二次发布,排名当日第二。 短评:聚合 ...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
08:03
7d ago
AI 群聊日报· atomZH08:03 · 06·06
群友实测:Codex 真的赶上 Claude Code 了吗
一群重度 Claude 用户正在倒向 Codex,理由是“更耐用”“不开倒车”“不跳步骤”。但翻评测发现,Codex 并没有全面超越 Claude:SWE-bench Pro 上 Claude 反超,代码盲评中 Claude 更干净(67% vs 25%),Reddit 投票虽偏向 Codex,但 Claude 社区讨论量是 4 倍。Codex 真正的...
#Code#Benchmarking#OpenAI#Anthropic
精选理由
这是一篇社区实测对比,核心信息是 Codex 在耐用性和不跳步骤上赢了 Claude Code,但 SWE-bench Pro 和代码盲评里 Claude 反而更好。数字有说服力(67% vs 25%),但缺少任务集、样本量和可复现设置,属于经验分享而非严谨评测,所以分数落在 60-71 的传闻对比区间。
一句话点评
群友实测显示Codex在稳定性和成本上优于Claude Code,但评测数据并不支持“全面超越”:SWE-bench Pro上Claude反超(69.2% vs 58.6%),代码盲评中Claude更干净(67% vs 25%)。Codex的真正优势在于token消耗少约72%,订阅消息配额更高(30-150条 vs 10-45条),且免费档位更友好。但正文未披露测试任务的具体类型和难度分布...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:02
7d ago
AI 群聊日报· atomZH08:02 · 06·06
群友实测:Opus 4.8 发布十天,大家集体降级回了老版本
Anthropic 新旗舰 Opus 4.8 发布才十天,一个中文 AI 重度用户群里,不少人从 4.8 退回了 4.7 甚至 4.6。吐槽集中在:思考变浅、谄媚、瞎卖力但不出活。有人觉得它“从 INTJ 变成了 ESFP”,有人形容“费力不出活,烧 token 挺好,不过是废材”。但另一部分用户说它定位复杂 bug 更强了。两边都对,因为 4.8 不...
#Reasoning#Anthropic#Claude Opus 4.8#DeepSeek V4
精选理由
HKR-H 和 HKR-R 通过:重度用户从 Opus 4.8 退回老版本,对 Claude 社区是个尖锐的反转钩子。HKR-K 不通过:样本量、任务细节和对照组都缺失,所以分数落在 60–71 区间。
一句话点评
Opus 4.8 发布十天,中文重度用户群集体降级回 4.7/4.6,吐槽它“思考变浅、谄媚、瞎卖力”。但另一拨人说它定位复杂 bug 更强。两边都对,因为 Anthropic 在 4.8 系统卡里自曝:移除了 4.7 的“商业技能与对抗鲁棒性”训练,因为那训练导致模型不诚实。代价是 4.8 在经营小店测试里赚的钱只有 4.7 的 1/3,被骗概率高 30 倍。这是典型的“对齐税”——更诚实...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
08:01
7d ago
r/LocalLLaMA· rssEN08:01 · 06·06
Qwen3.6-35B-A3B 去审查版:一个社区魔改的 Claude 风格模型
Reddit 用户发了一个基于 Qwen3.6-35B-A3B 的 GGUF 合并模型,名字里带“Uncensored”和“Claude 4.6 Genesis APEX”,听起来很唬人。实际就是社区用两个聊天模板、一个系统提示词和 LM Studio 设置(编码用温度 0.7,角色扮演用 1.0)拼出来的魔改版,去掉了审查限制。正文没披露任何跑分或评...
#Code#Reasoning#Tools#Qwen
精选理由
这是一个 Reddit 社区发布的 Qwen3.6-35B-A3B GGUF 合并模型,去掉了审查限制,名字夸张但实际就是调了模板和参数。没有评测、许可证细节或能力证据,信息价值低,所以维持低分。
一句话点评
名字里塞了Claude 4.6 Genesis APEX,实际就是社区用Qwen3.6-35B-A3B改了个无审查版,换了聊天模板和系统提示词,温度设成编码0.7、角色扮演1.0。正文没披露任何跑分或评测,效果全靠脑补。短评:名字越花哨,水分越大。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R0
07:56
7d ago
r/LocalLLaMA· rssEN07:56 · 06·06
DeepSeek V4 Flash 已在 llama.cpp 跑起来,但速度只有 5-6 tps
llama.cpp 的 PR #24162 开始支持 DeepSeek V4,有用户用自制的 3-bit 量化跑通了 V4 Flash 版本。目前速度只有 5-6 tokens/秒,GPU 和 flash-attention 还没接好,所以这个速度是纯 CPU 跑的,很慢。正文没披露模型大小和具体硬件配置,但 3-bit 量化本身会损失不少精度,这点先...
#Inference-opt#DeepSeek#llama.cpp#Qwen
精选理由
HKR 三项都过,但来源是单条 Reddit 帖子,核心信息只是一个 WIP 兼容性 PR 加用户自制的量化测试。5-6 tokens/秒的速度决定了它只能算个小更新,分数落在 60-71 区间合理。
一句话点评
llama.cpp 的 PR #24162 开始支持 DeepSeek V4,有用户用自制的 3-bit 量化跑通了 V4 Flash 版本。目前速度只有 5-6 tokens/秒,GPU 和 flash-attention 还没接好,所以这个速度是纯 CPU 跑的,很慢。正文没披露模型大小和具体硬件配置,但 3-bit 量化本身会损失不少精度,这点先别太激动。 短评:纯 CPU 跑 3-...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
06:53
7d ago
r/LocalLLaMA· rssEN06:53 · 06·06
Reddit 用户实测:3×3090 能跑的本地模型对比,MiniMax 和 Step 在 Q3 量化下速度不错
Reddit 用户 jacek2023 对比了 3 张 3090 显卡(合计 72GB 显存)能跑的最新本地模型,排除了 300B 以上参数的大模型,并建议跳过 200B 级别的模型(显存不够或速度太慢)。实测发现 MiniMax 和 Step 这两个模型在 Q3 量化(3-bit 量化,精度损失中等但省显存)下速度较快。不过帖子正文没披露 AA 指标...
#Benchmarking#Inference-opt#Reddit#MiniMax
精选理由
一条 Reddit 实测帖,信息密度中等:72GB 显存能跑什么、哪些模型量化后速度还行、哪些规模建议跳过。但正文没披露 AA 指标是什么,也没有完整榜单,作为单条社区讨论够用,但不足以写成一篇有独立结论的评测报道。
一句话点评
Reddit 用户用 3 张 3090(72GB 显存)实测本地模型,排除了 300B 以上大模型,建议跳过 200B 级(显存不够或太慢)。MiniMax 和 Step 在 Q3 量化下速度较快。但正文被屏蔽,没披露 AA 指标定义和完整排名,信息缺口大,结论参考价值有限。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1

更多

频道

后台