ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-26

107 items · updated 3m ago
RSS live
2026-05-26 · 星期二2026年5月26日
23:34
17d ago
AI HOT 精选· aihot-apiZH23:34 · 05·26
Anthropic 任命韩国负责人,准备在首尔开办公室
Anthropic 挖来前 Snowflake 韩国总经理 KiYoung Choi 当韩国代表董事,马上要在首尔开办公室。理由是韩国人用 Claude 的强度是人口比例的 3.5 倍,而且偏技术和创意类工作。Choi 在 Google Cloud、Adobe、微软干过,经验是帮大企业搞云和 AI 转型。正文没披露首尔办公室具体人数和开业时间,但提到高...
#Anthropic#KiYoung Choi#Snowflake#Personnel
精选理由
核心信息是韩国Claude.ai使用量超出人口比例3.5倍,以及Anthropic在首尔设办公室的动作,这两点让文章有信息增量。但新闻主体仍是区域人事任命,悬念弱,所以落在60-71分区间。
一句话点评
Anthropic 挖来前 Snowflake 韩国总经理 KiYoung Choi 当韩国代表董事,马上要在首尔开办公室。理由是韩国人用 Claude 的强度是人口比例的 3.5 倍,而且偏技术和创意类工作。Choi 在 Google Cloud、Adobe、微软干过,经验是帮大企业搞云和 AI 转型。正文没披露首尔办公室具体人数和开业时间,但提到高管近期会去剪彩。这条主要是人事和区域扩张...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
22:20
17d ago
r/LocalLLaMA· rssEN22:20 · 05·26
Cactus 混合路由器:Gemma4-2B 本地跑大部分任务,只把 15–55% 请求扔给 Gemini,效果持平 Gemini Flash Lite
Cactus 发布了一个仅 6.5 万参数的混合路由器,能把 15–55% 的任务路由到 Gemini 处理,其余在本地用 Gemma4-2B 跑。帖子说这个 6.4 万参数的路由器同时支持文本、视觉和音频输入。效果上,这套方案整体表现跟 Gemini-3.1-Flash-Lite 差不多。核心思路是:简单问题本地解决,复杂问题才调云端,省成本。不过正...
#Agent#Multimodal#Inference-opt#Cactus
精选理由
HKR 三项全过:成本路由的钩子很具体,给出了 15–55% 的 Gemini 路由比例和 65k 参数的路由器。但来源只有单个 Reddit/项目页面,没有独立基准测试或定价,所以没到 featured 级别。
一句话点评
Cactus 搞了个 6.5 万参数的小路由器,让 Gemma4-2B 在本地跑简单问题,复杂问题才调 Gemini,整体效果跟 Gemini-3.1-Flash-Lite 差不多。15–55% 的任务走云端,意味着大部分推理在本地完成,成本能省不少。但正文没披露路由器的延迟和误判率——如果判断错了,把复杂问题丢给本地小模型,效果可能崩。另外,路由器同时处理文本、视觉和音频,这点先别太激动,...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
21:59
17d ago
r/LocalLLaMA· rssEN21:59 · 05·26
RTX 5090 跑扩散模型比专业卡快 3 秒,但功耗拉到 600W
有人在 Anima 扩散模型上对比了 RTX 5090 和 RTX 6000 PRO 系列。600W 的 5090 跑完 36 秒,同功耗的 RTX 6000 PRO WS/SE 慢 3 秒(39 秒)。有意思的是,把 5090 降到 400W 后速度掉到 48 秒,跟 325W 的 RTX 6000 PRO MaxQ 一样。说明 5090 在低功耗下...
#Benchmarking#Vision#Inference-opt#NVIDIA
精选理由
一条 Reddit 上的单次 Anima 扩散任务硬件测试,数据直接有用,尤其对纠结买 5090 还是专业卡的本地 AI 用户。但样本单一、任务局限,不值得上推荐位。
一句话点评
RTX 5090 满血 600W 跑 Anima 扩散模型 36 秒,比同功耗的 RTX 6000 PRO WS/SE 快 3 秒。但降到 400W 就掉到 48 秒,跟 325W 的 6000 PRO MaxQ 持平。说明 5090 靠高功耗换性能,降功耗后优势全无。测试只跑了一个模型,且正文被屏蔽,没披露显存占用和精度设置,参考价值有限。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
21:24
17d ago
AI HOT 精选· aihot-apiZH21:24 · 05·26
Claude Code 出了个安全插件,写代码时帮你抓漏洞
Claude Code 发布了一个安全指导插件,所有用户都能从 /plugins 安装。插件会在你写代码时识别并修漏洞。正文没披露它具体能查哪类漏洞、怎么扫描、以及自动修复到什么程度——这点先别太激动,实际覆盖面和误报率都不清楚。
#Code#Tools#Safety#Claude Code
精选理由
H/K/R 都达标,但正文只说了安装路径,没披露漏洞类型、扫描机制和修复范围。这是一个小版本功能更新,够不上专题报道门槛。
一句话点评
Claude Code 出了个安全指导插件,装了就帮你边写代码边找漏洞。但正文没说是哪类漏洞、怎么扫、自动修到什么程度——覆盖面和误报率都不清楚,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
21:08
17d ago
AI HOT 精选· aihot-apiZH21:08 · 05·26
Google 发了个 Gemini Omni 视频提示词指南,教你用5招控画面
Google 出了份 Gemini Omni 视频生成的使用指南,核心是5个提示词技巧:用模型已有的知识写短描述就行;能精确控制视频里的文字排版;支持推拉摇移这些专业镜头指令,像摄影师一样调度画面;可以迭代编辑,不用从头重来;还能直接调角色动作节奏或情绪。说白了就是靠提示词让模型生成更可控的视频。目前这个功能在 Gemini 应用和 Google Fl...
#Multimodal#Vision#Google#Gemini
精选理由
这是Google自家出的Gemini Omni视频提示词指南,给了5条技巧和两个使用入口,有用但偏轻。HKR-K通过;HKR-H和HKR-R没达到精选标准。
一句话点评
Google 出了份 Gemini Omni 视频提示词指南,核心就五招:用常识写短描述、精确控制文字排版、像摄影师一样用推拉摇移、迭代编辑不用重来、直接调角色情绪。说白了就是让视频生成更可控。目前功能在 Gemini 应用和 Google Flow 里能用。但指南没提生成时长、分辨率、成本这些硬指标,也没说是否支持多人或复杂场景。如果真能靠提示词精确调度镜头和文字,对做短视频或广告素材的人...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
21:04
17d ago
r/LocalLLaMA· rssEN21:04 · 05·26
Quale:给代码助手画个“禁区地图”,少犯蠢
Quale 是一个轻量工具,不依赖语法,也不限编程语言,直接对代码做静态分析,然后输出一份 JSON 合同给 AI 助手。合同里写明:改哪个文件、跑哪些测试、哪些区域不能碰、哪些边界必须保持稳定。作者用本地 Qwen 和 Mistral 试了,说改对文件的概率提高了,幻觉也少了——但正文没披露具体数字,这点先别太激动。思路挺实在:与其让模型猜,不如提前...
#Agent#Code#Tools#Quale
精选理由
HKR 三项都过,但这是 Reddit 上的工具帖,正文只提了本地 Qwen/Mistral 测试结果,没给任何基准数据。属于小体量开源 Agent 工具更新,落在 60–71 分档。
一句话点评
Quale 是个轻量工具,不依赖语法也不限编程语言,直接对代码做静态分析,输出一份 JSON 合同给 AI 助手,写明改哪个文件、跑哪些测试、哪些区域不能碰、哪些边界必须保持稳定。作者用本地 Qwen 和 Mistral 试了,说改对文件的概率提高了,幻觉也少了——但正文没披露具体数字,这点先别太激动。思路挺实在:与其让模型猜,不如提前把规则喂给它。缺的是基准测试数据和跟其他方案(如 Aid...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
20:10
17d ago
r/LocalLLaMA· rssEN20:10 · 05·26
给 Hermes 找个本地记忆检索器,NPU 上要跑得快
Reddit 用户在给 hindsight/Hermes 项目找一个本地记忆检索器,要求能在 Strix Halo 的 NPU 上高吞吐运行。帖子提到 GPT OSS 20B 在旧榜单上排名不错,但在 NPU 上做记忆检索很慢——模型太大,NPU 推理带宽撑不住。正文没披露具体延迟数据或替代方案,但需求很明确:要一个轻量、能塞进 NPU 的小模型,专门...
#Agent#Memory#Inference-opt#Hermes
精选理由
HKR-R 通过,因为本地记忆检索延迟对设备端 agent 很关键。HKR-H/K 不通过:这只是一个求推荐的帖子,没有新工具、基准测试或可复现的实验。
一句话点评
有人在给 Hermes 项目找本地记忆检索器,要求能在 Strix Halo 的 NPU 上高吞吐跑。GPT OSS 20B 虽然老榜单排名不错,但 NPU 推理带宽撑不住,跑记忆检索很慢。正文没披露具体延迟数据或替代方案,但需求很明确:要一个轻量、能塞进 NPU 的小模型。 短评:NPU 跑 20B 模型做记忆检索,带宽是硬伤,得换小模型。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H0·K0·R1
19:59
17d ago
AI HOT 精选· aihot-apiZH19:59 · 05·26
人类与AI分工:教育、咨询和文学奖争议
这篇文章讨论哪些人类特质该保留、哪些可以交给AI,提到了教育实验、咨询实验和最近一个文学奖争议。正文没披露实验设计、样本量、结果,也没说是哪个文学奖,信息缺口比较大,先别急着下结论。
#Commentary
精选理由
硬排除-零来源:HKR-H和HKR-R成立,但正文没有给出任何数据、可复现的设置或具名案例,行业读者得不到一条可验证的新事实。
一句话点评
一篇讨论人类与AI分工的帖子,提到教育、咨询实验和文学奖争议,但正文没披露实验设计、样本量、结果,也没说是哪个文学奖。信息缺口大,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K0·R1
19:56
17d ago
AI HOT 精选· aihot-apiZH19:56 · 05·26
选择保持人性:AI 让社交媒体帖子越来越像,但别让它替你思考
Ethan Mollick 观察到社交媒体上的帖子越来越趋同,他怀疑是 AI 生成或同质化处理的结果。正文没披露具体平台、样本量或检测方法。他引用两项教育研究:土耳其高中约 1000 名学生用 ChatGPT 做数学作业,平时作业完成得更好,但考试时反而不如不用 AI 的同学——因为 AI 直接给答案,绕过了学习必需的心智努力。另一项在台北十所高中近 ...
#Commentary
精选理由
硬排除-零来源适用:帖子声称内容趋同,但没给平台、样本量、检测方法或具名例子。HKR-R命中,但HKR-H/K未命中,因此排除。
一句话点评
Ethan Mollick 观察到社交媒体帖子越来越像,怀疑是 AI 生成或同质化处理的结果,但正文没披露具体平台、样本量或检测方法。他引用两项教育研究:土耳其约 1000 名高中生用 ChatGPT 做数学作业,平时作业完成得更好,但考试时反而不如不用 AI 的同学——因为 AI 直接给答案,绕过了学习必需的心智努力。另一项在台北十所高中的近千名学生中,用 AI 辅助学习的学生在概念理解上...
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K0·R1
19:55
17d ago
持续报道 · 1dAI HOT 精选· aihot-apiZH19:55 · 05·26
Luma Agents 把新闻稿一键转成可分享图
Luma Labs 宣布 Luma Agents 能把新闻稿直接变成可分享的图形,操作就两步:贴内容、定方向。正文没披露模板数量、生成次数限制或定价,目前看更像一个轻量演示,离成熟产品还有距离。
#Agent#Tools#Luma Labs#Product update
精选理由
这是 Luma Agents 的一个小功能更新:正文只披露了两步工作流,没有价格、模板数量或生成限制。HKR-K 勉强通过,HKR-H/R 都很弱,所以留在较低的产品更新档位。
一句话点评
Luma Labs 出了个 Agents 功能,能把新闻稿一键转成可分享的图片,操作就两步:贴内容、定方向。听起来挺省事,但正文没披露模板数量、生成次数限制或定价,目前更像一个轻量演示,离成熟产品还有距离。短评:两步出图,但缺模板数和定价,先当玩具看。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
19:53
17d ago
彭博科技· rssEN19:53 · 05·26
美光因AI芯片供不应求股价上涨,分析师称供应紧张还会持续
Bloomberg报道,分析师Daniel Pilling认为美光股价上涨是因为AI芯片需求超过了供应。正文没披露涨幅有多大、供需缺口具体多少、以及这轮紧张会持续到什么时候。简单说就是AI还在抢芯片,美光先吃到了红利。
#Daniel Pilling#Sands Capital Management#Micron Technology#Commentary
精选理由
彭博消息源可信,但全文只有Daniel Pilling一句话说美光受益于AI芯片供应紧张,没披露涨幅、供需缺口或时间表。HKR-R通过,HKR-H和HKR-K不通过。
一句话点评
分析师Daniel Pilling说美光股价涨是因为AI芯片供不应求。正文没披露涨幅、缺口大小和紧张持续多久。一句话:AI抢芯片,美光先吃红利,但缺具体数字支撑判断。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K0·R1
19:52
17d ago
r/LocalLLaMA· rssEN19:52 · 05·26
Qwen 3.7 开源审批流程曝光,但正文只提了三个尺寸
标题说 Qwen 3.7 的开源审批流程罕见曝光,但正文只列出了 9B、27B 和 122B 三个模型尺寸,没透露审批机制和发布时间。信息缺口明显,目前能确认的只有这三个版本的存在。
#Qwen#Open source#Commentary
精选理由
HKR-H靠的是内部流程这个角度,HKR-K只靠三个规模数字撑着。没有审批机制、时间线或可验证的信源,所以维持60分和all层级。
一句话点评
Qwen 3.7 开源审批流程曝光?Reddit 帖子标题很猛,但正文只列了 9B、27B 和 122B 三个尺寸,审批机制、发布时间全没提。信息缺口太大,目前能确认的只有这三个版本存在。短评:标题党,正文没干货,等官方消息。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K1·R0
19:40
17d ago
Hacker News 首页· rssEN19:40 · 05·26
DeepSWE:一个防污染的编程智能体长任务评测集
DeepSWE 是一个从头写任务、不用已有 GitHub commit 或 PR 的编程评测集,目的是防止模型在预训练阶段见过答案。它覆盖 91 个仓库、5 种语言,提示词比 SWE-bench Pro 短一半,但模型平均要写 5.5 倍的代码才能通过。评测用的验证器是手写的,只测软件行为不测实现细节,作者发现 SWE-bench Pro 的验证器有 ...
#Agent#Code#Benchmarking#DeepSWE
精选理由
标题画了个大饼——'无污染的长程编码Agent基准',但正文只扔出29分和9条评论,任务集怎么设计的、污染怎么检测的、结果长什么样,一个字没提。对从业者来说,这个方向确实值得盯,但这条链接目前只能当个标题党看,没法用来做任何技术判断。
一句话点评
DeepSWE 是一个从头写任务、不用已有 GitHub commit 的编程评测集,防止模型在预训练时见过答案。覆盖 91 个仓库、5 种语言,提示词比 SWE-bench Pro 短一半,但模型平均要写 5.5 倍代码才能通过。验证器是手写的,只测软件行为不测实现细节,作者发现 SWE-bench Pro 的验证器有 8% 假阳性、24% 假阴性。榜单上 GPT-5.5 最高 70%,D...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
18:48
17d ago
彭博科技· rssEN18:48 · 05·26
SEC主席叫停预测市场ETF上市申请
SEC主席Atkins叫停了一批预测市场ETF,这类基金让投资者押注选举和经济数据。ETF这个产品本身是个15万亿美元的大市场,但SEC没说什么时候放行。正文没披露具体哪些机构提交了申请,也没说监管到底在担心什么——是操纵风险还是投资者保护。
#SEC#Paul Atkins#Bloomberg#Policy
精选理由
全文讲SEC主席Paul Atkins暂缓一批押注选举和经济数据的ETF上市,引用Bloomberg数据说ETF市场规模15万亿美元,但跟AI产品、模型或行业影响毫无关系。AI相关性太低,直接排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R0
18:34
17d ago
r/LocalLLaMA· rssEN18:34 · 05·26
Windows 上管 llama.cpp 的桌面小工具
有人写了个 Windows WPF 应用,专门在 WSL/Ubuntu 里管理 llama.cpp。能自动装环境、切换 CPU/CUDA/Vulkan 编译、从 Hugging Face 下 GGUF 模型、改启动参数、监控 llama-server 状态。目前只支持同时跑一个模型,首次发布没签名,默认只开本地服务。适合不想敲命令行的 Windows 用户。
#Tools#Inference-opt#llama.cpp#Hugging Face
精选理由
这是个人开发者发的第一个公开版,没签名、一次只能服务一个模型,属于小产品更新。分数 63 合理,不往上调是因为验证弱、受众窄,往下调也不至于,因为功能确实解决了 WSL 下管理 llama.cpp 的麻烦。
一句话点评
有人给 Windows 用户做了个 llama.cpp 图形界面,自动装环境、切编译后端、下模型、改参数、看服务状态,全在 WPF 里点鼠标完成。目前只支持同时跑一个模型,首次发布没签名,默认只开本地服务。适合不想敲命令行的 Windows 用户,但多模型并发、安全签名、远程访问等场景暂时别指望。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R1
18:33
17d ago
Product Hunt · AI· rssEN18:33 · 05·26
zero.xyz:给AI Agent一个装了8000个工具的万能工具箱
zero.xyz 是一个统一API平台,让AI Agent可以直接调用大约8000个工具、API和服务,不需要自己配密钥或写集成代码。它兼容 Claude Code、Codex、Gemini 等主流命令行Agent。产品目前免费,还送5美元体验金。不过正文没披露具体支持哪些服务、调用有没有速率限制、以及企业级认证怎么做,这些对实际落地挺关键。
#Agent#Tools#zero.xyz#Product update
精选理由
这是一个小型Product Hunt发布:HKR-H/K/R都建立在“8000个工具”这个宣称上,而鉴权、定价和支持服务均未披露,因此分数落在40-59的上限区间。
一句话点评
zero.xyz 给 AI Agent 开了个“万能接口”,号称能直接调约 8000 个工具/API,不用自己配密钥或写集成代码,兼容 Claude Code、Codex 等主流命令行 Agent。目前免费还送 5 美元体验金,这点先别太激动——正文没披露具体支持哪些服务、调用有没有速率限制、企业级认证怎么做,这些对实际落地挺关键。如果真能覆盖常用服务且延迟可控,倒是省了团队自己接一堆 AP...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
18:17
17d ago
● P1彭博科技· rssEN18:17 · 05·26
中国扩大顶尖AI人才出境限制范围
彭博社在 5 月 26 日的节目里提到,中国正在收紧对顶尖 AI 人才的出境旅行限制。不过,因为彭博社网站本身有反爬机制,我们没能拿到视频的完整文字稿。目前能看到的片段里,没有披露这项限制的具体范围、执行方式、受影响人数,也没有给出政策生效的时间表。所以,这更像是一个信号,但具体怎么落地、影响多大,正文都没说清楚。
#Bloomberg#China#SpaceX#Policy
精选理由
Bloomberg 的信源权重让这条政策/人事消息有分量。H 和 R 都很强,K 靠的是“扩大限制”这一个说法,但范围、机制、人数全都没披露,所以我会先打个折。
一句话点评
彭博这条视频报道正文被反爬墙了,具体限制范围、涉及哪些私企、执行到什么程度都没看到,只能当个信号看。
锐评
这条消息目前能确认的事实很薄。彭博的报道本身是视频,我们拿到的正文被反爬机制挡了,只留下标题说中国把顶尖AI人才的出境限制从体制内扩到了私企。Reddit上有人在讨论,但也没有补充更多细节。 我会先打个折:限制范围多大、针对什么级别的人、是审批变严还是直接卡护照,这些关键信息正文都没披露。如果是真的,说明监管把AI人才当战略资源在管,私企的工程师和研究员出国参会、谈合作可能要多一道手续。但没看到原文之前,别急着下结论说“全面收紧”。 还缺的东西很明确:彭博原视频里到底说了哪些公司、引用了什么信源、有没有具体案例。这些补不上,这条新闻就只能当风向标,不能当事实用。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
17:51
17d ago
r/LocalLLaMA· rssEN17:51 · 05·26
本地Agent学会自己复盘,跑分从30%涨到90%
一个叫autoswarm的项目让本地Agent能自我优化:它用本地代理记录对话日志,自动复盘后把经验写进skills.yaml,再注入到后续的系统提示词里。作者在TerminalBench的10个任务子集上测试,性能从约30%提升到约90%。效果很猛,但正文没披露具体用了什么模型、跑了多少轮、有没有过拟合风险。
#Agent#Tools#Memory#autoswarm
精选理由
HKR 三项都够,但证据来自 Reddit 作者自报的 10 题 TerminalBench 子集,没有外部复现,也没说失败案例,所以放在 all 而非 featured。
一句话点评
一个叫 autoswarm 的项目让本地 Agent 自己复盘对话日志,把经验写进 skills.yaml 再注入系统提示词,实现自我优化。在 TerminalBench 的 10 个任务子集上,性能从约 30% 跳到约 90%,效果很猛。但正文没披露用了什么模型、跑了多少轮、有没有过拟合风险,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
17:17
17d ago
FT · 科技· rssEN17:17 · 05·26
一只AI芯片ETF 50天涨87%,成为史上最快突破100亿美元市值的ETF
Roundhill Memory ETF(代码DRAM)4月上线,50天内涨了87%,标题说它成了史上最快达到100亿美元市值的ETF。但正文被FT的付费墙挡住了,看不到持仓和资金流入数据,所以没法判断这波涨幅是靠AI芯片概念炒作还是真有真金白银流入。
#Inference-opt#Roundhill#Funding
精选理由
FT这篇讲的是市场情绪和资金面,不是模型、产品或者研究发布。50天87%的涨幅和最快破百亿的纪录确实有新闻性,但本质是芯片ETF搭上AI概念快车的资金炒作故事,所以重要性给70分,覆盖全量用户。
一句话点评
一只叫DRAM的ETF,50天涨87%,号称史上最快破百亿市值。但正文被FT墙挡住了,看不到持仓和资金流入,没法判断是AI芯片概念炒作还是真有钱进来。标题很猛,信息缺口很大,先别激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:52
17d ago
r/LocalLLaMA· rssEN16:52 · 05·26
Qwen3.5 122B 量化到 Q3 后,长上下文到 8 万 token 就开始胡编
Reddit 用户实测 Qwen3.5 122B(激活 10B)的 Q3_K_XL 量化版,写代码到 75-80k 上下文就开始幻觉和遗忘。已经开了 BF16 KV cache,但帖子没交代到底是 Q3 量化、模型本身还是 llama.cpp 设置导致的。信息缺口:没给可复现的触发条件,也没说其他量化档位(如 Q4)是否更稳。
#Code#Inference-opt#Memory#Qwen
精选理由
HKR 三项都达标,但这是 Reddit 单条用户反馈,正文没披露完整的 llama.cpp 设置、Q3 归属和复现步骤,所以分数压在 66,tier 设为 all。
一句话点评
Qwen3.5 122B(激活10B)量化到Q3_K_XL后,写代码到75-80k上下文就开始幻觉和遗忘。用户已开BF16 KV cache,但没说是量化、模型还是llama.cpp设置的问题。信息缺口:没给可复现的触发条件,也没说Q4是否更稳。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
16:00
17d ago
AI HOT 精选· aihot-apiZH16:00 · 05·26
Replit 应用加登录的两种方式:零配置或品牌化
Replit 给应用加登录提供了两个选项:一是 Replit Auth,零配置,用户直接用 Replit 账户登录,适合快速验证;二是 Clerk Auth,支持品牌化登录界面,开发和生产环境都只需一个提示词就能搞定。正文没披露具体费用或限制,但零配置方案对原型阶段挺省事。
#Tools#Replit#Clerk#Product update
精选理由
这是一篇 Replit 登录功能的常规更新,提供了两种登录方式,但正文没披露安全边界、定价或 AI 能力,所以归为低价值的可浏览 all 层级。
一句话点评
Replit 给应用加登录出了两个方案:Replit Auth 零配置,用户直接用 Replit 账号登录,适合快速验证原型;Clerk Auth 支持品牌化登录界面,开发和生产环境都只需一个提示词搞定。正文没披露费用或限制,但零配置方案对原型阶段挺省事。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
16:00
17d ago
TechCrunch AI· rssEN16:00 · 05·26
Human Archive 雇印度零工戴摄像头帽子,给机器人攒训练数据
这家由伯克利和斯坦福研究员创立的公司,让印度零工戴着装摄像头的帽子和传感器出门干活,采集真实世界的物理数据给机器人训练用。正文没披露样本量、定价、采集流程和客户名单,所以规模多大、数据质量如何、谁在买单都还不清楚。
#Robotics#Human Archive#UC Berkeley#Stanford
精选理由
选题角度好,印度零工+全球机器人训练,有冲突感也有现实意义。但正文没披露样本规模、具体价格和客户名单,信息缺口明显,所以分数压在70档。
一句话点评
这家公司让印度零工戴摄像头帽子采集物理数据,思路是用低成本人力替代昂贵机器人采集。伯克利和斯坦福背景的团队,方向对但正文没披露样本量、定价和客户,规模和数据质量存疑。短评:人力采集物理数据,成本低但验证弱,客户和规模都没说。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
15:39
17d ago
AI HOT 精选· aihot-apiZH15:39 · 05·26
2026年5月AI展望:开源模型还没追上闭源,Google的Gemini也打不过Claude Code
这篇文章是Nathan Lambert对2026年5月AI行业现状的观察。核心判断是:开源模型在真正的智能体(agent)场景里,离闭源模型还有明显差距。去年12月Anthropic的Opus 4.5在Claude Code里表现炸裂,但到现在快半年了,还没有开源模型能复制那个体验。作者估计这个差距可能还要再拖半年以上。Google的Gemini 3....
#Gemini#Mythos#Commentary#Open source
精选理由
HKR-R 靠开源生态张力过关,但 HKR-H 和 HKR-K 都不行:角度太宽,披露的事实缺数字、缺机制、缺可验证的论断。
一句话点评
开源模型在真正的智能体场景里离闭源还有明显差距。去年12月Anthropic的Opus 4.5在Claude Code里表现炸裂,但快半年了,还没有开源模型能复制那个体验。作者估计这个差距可能还要再拖半年以上。Google的Gemini 3.5 Flash也没能挑战Claude Code和Codex。正文没披露Mythos的具体参数和发布方,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
15:36
17d ago
Hacker News 首页· rssEN15:36 · 05·26
大语言模型也需要睡觉
这篇论文提出一个比喻:让大模型像人一样“睡觉”——定期清空上下文缓存(相当于短期记忆),然后利用空闲时间对积累的信息做离线循环处理,把关键内容压缩成“快速权重”(类似长期记忆)。这样做的目的是解决Transformer注意力机制在处理超长文本时计算量爆炸的问题。作者在细胞自动机、多跳图检索和数学推理任务上测试,发现加了“睡眠”机制的模型能完成普通Tra...
#Research release
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过:正文没给任何机制、实验设置或结果。这是一个有趣的研究线索,但信息量不足以作为精选。
一句话点评
这篇论文给Transformer加了个“睡觉”机制:定期清空短期记忆(KV缓存),用空闲时间把积累的信息压缩成长期记忆(快速权重)。在细胞自动机、多跳图检索和数学推理上,普通Transformer和混合模型搞不定的任务,加了睡眠的模型能完成。睡眠时间越长,效果越好,尤其对需要深层推理的例子。不过目前只在合成任务和一个小规模数学题上测试,没披露在真实长文本场景(比如整本书问答)上的表现,也没说...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
15:32
17d ago
r/LocalLLaMA· rssEN15:32 · 05·26
MOSS-TTS-v1.5:开源语音合成模型,支持31种语言和显式停顿控制
OpenMOSS团队发布了MOSS-TTS-v1.5,一个支持31种语言的开源语音合成模型。相比1.0版本,主要改进包括:指定语言标签后多语言合成效果更好(不指定时部分语言有升有降)、声音克隆更稳定(重复生成一致性更高)、能处理参考音频远长于目标文本的场景、更严格跟随标点停顿,以及支持在文本里插入"[pause 3.2s]"这样的显式停顿标记。模型保留...
#Audio#Multimodal#OpenMOSS-Team#Hugging Face
精选理由
31种语言、language标签、声音克隆稳定性和显式停顿控制,这几个点对做开源语音的人来说挺实在。不过来源就一个Hugging Face页面,实验室内部细节基本没披露,所以分数压在60-71这个开源更新区间。
一句话点评
MOSS-TTS-v1.5 开源,支持31种语言,声音克隆更稳,还能插显式停顿标记(如[pause 3.2s])。亮点是长参考音频+短文本的克隆场景优化,但正文没披露模型参数量、推理速度或训练数据规模,实际效果得跑一遍才知道。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:20
17d ago
彭博科技· rssEN15:20 · 05·26
AI 数据中心疯狂耗电,电网和基建跟不上
CyrusOne CEO 说 AI 数据中心扩张卡在电网、熟练工人和万亿级基础设施投资上。正文没披露具体容量、时间表或项目地点,信息缺口明显。核心判断是:算力增长快,但电力和基建是硬瓶颈,不是砸钱就能短期解决的。
#Inference-opt#CyrusOne#Eric Schwartz#Bloomberg
精选理由
Bloomberg采访CyrusOne CEO,核心信息是AI数据中心扩张受制于电网、熟练劳动力和万亿美元级基础设施投入。三个瓶颈都点到了,但正文没披露具体缺多少电、缺多少人、钱从哪来,也没有订单或政策细节。来源有权威性,话题对算力成本有影响,但信息密度不够,所以分数压在60-71区间。
一句话点评
CyrusOne CEO 说 AI 数据中心扩张卡在电网和熟练工人上,需要万亿级基础设施投资。正文没披露具体容量、时间表或项目地点,信息缺口明显。核心判断是:算力增长快,但电力和基建是硬瓶颈,不是砸钱就能短期解决的。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
15:17
17d ago
r/LocalLLaMA· rssEN15:17 · 05·26
DreamServer:一个帮你装好本地大模型全家桶的安装器
Signal_Ad657 在 Reddit 上介绍了 DreamServer 安装器,支持 Linux、Windows 和 Mac。它能自动配置开源应用、模型流水线、后端依赖、硬件监控、多 GPU 检测和并行协调。模型下载和仪表盘切换还在最后测试中。正文没披露具体支持哪些模型或推理引擎,也没说安装包多大、首次启动要多久。如果你不想手动折腾环境,这个工具...
#Tools#Fine-tuning#Inference-opt#DreamServer
精选理由
这是一篇 Reddit 上的实用自荐帖,讲的是 DreamServer 安装器,能自动搞定 OSS 应用、模型流水线、后端依赖和多 GPU 检测与并行协调,支持三大系统。对本地跑模型的人来说,省掉手动配环境、调 GPU 的折腾,这点挺实在。但正文没披露具体怎么检测多 GPU、并行协调的细节,也没提性能对比或验证数据,权威性和新颖性都一般。HKR 里 K 和 R 过关,H 偏弱,所以放在 all 档,不上精选。
一句话点评
DreamServer 想做一个跨平台本地 AI 安装器,自动配环境、监控硬件、协调多 GPU。正文没披露支持哪些模型或推理引擎,也没说安装包多大、首次启动要多久。如果你不想手动折腾环境,这个工具值得关注,但具体好不好用还得等模型下载和仪表盘功能上线再看。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
15:17
17d ago
FT · 科技· rssEN15:17 · 05·26
英国律所因AI引用错误被法官当庭训斥
英国Pinsent Masons律所因AI生成的资料出错,被法官Mark Mullen公开批评,并警告律师不要把法律研究和推理外包给AI。正文没披露具体是哪个AI工具、出了什么错,但法官的态度很明确:AI可以辅助,不能替代专业判断。
#Reasoning#Pinsent Masons#Mark Mullen#Policy
精选理由
法院直接点名律所 AI 错误并发出警告,这条新闻有明确的责任和职业风险冲击力,但正文没披露具体错误类型、用了什么工具、以及法院的处罚细节,信息缺口明显。比普通事故简报强,但不够上推荐位。
一句话点评
英国Pinsent Masons律所被法官公开批评,因为AI生成的资料出了错。法官Mark Mullen警告律师别把法律研究和推理外包给AI。正文没披露具体是哪个AI工具、出了什么错,但态度很明确:AI可以辅助,不能替代专业判断。这点先别太激动,因为没细节,不知道是模型幻觉还是引用错了判例。对法律、医疗这类高风险行业是个提醒:AI出错成本高,验证门槛也高。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:57
17d ago
Hacker News 首页· rssEN14:57 · 05·26
Minicor:给没 API 的老系统装个 AI 鼠标键盘,自称能把 RPA 失败率从 30% 打下来
Minicor 是一个面向 Windows 桌面的 RPA 平台,专门处理那些没有 API 的老系统。它通过一个 MCP 服务器让 Claude Code 或 Codex 这类 AI 直接操控虚拟机,自动生成 Python 工作流。核心卖点是“自愈”——当 UI 按钮位置变了或者弹出了意外对话框,代理能自己发现、调整、继续跑,不用等人重写脚本。官方说传...
#Agent#Code#Tools#Minicor
精选理由
YC 新品 Launch HN,hook 和痛点都清楚,但正文没披露客户规模、定价或可复现的 benchmark,验证偏弱。按规则归到 60–71 的小产品更新档,tier 设为 all 合理。
一句话点评
Minicor 用 AI 操控 Windows 虚拟机,自动搞定那些没 API 的老系统。核心卖点是“自愈”——按钮位置变了或弹窗了,代理能自己发现并调整,不用等人重写脚本。官方说传统 RPA 大规模部署失败率超 30%,这点先别太激动,正文没披露 Minicor 自己的失败率或成本对比。YC 孵化、有 SOC 2 和 HIPAA 合规,适合医疗等敏感行业。但依赖 Claude Code 这...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:55
17d ago
TechCrunch AI· rssEN14:55 · 05·26
环球音乐与TikTok续约,联手打击未经授权的AI音乐
环球音乐集团(UMG)和TikTok续签了合作协议,重点打击未经授权的AI生成音乐。UMG多年来一直在推动平台、流媒体服务和AI公司执行更严格的内容审核政策,这次续约是延续这一方向。正文没披露具体的技术手段或惩罚措施,所以暂时只能理解为双方在政策层面继续联手。
#Audio#Safety#Universal Music Group#TikTok
精选理由
HKR-R通过版权和合规压力线:环球音乐和TikTok续约打击未授权AI音乐,但正文没披露检测手段、合作条款或处罚标准,信息缺口明显,所以留在all层。H和K不通过:没有新能力或转折,也没有可验证的技术细节。
一句话点评
环球音乐和TikTok续约,联手打击AI盗版歌。正文没披露具体技术手段或惩罚措施,所以暂时只能理解为政策层面继续联手。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K0·R1
14:54
17d ago
MIT 科技评论· rssEN14:54 · 05·26
85%企业想三年内用上AI Agent,但76%说现有基础设施撑不住
MIT Tech Review 联合 Ema 发了一篇报告,核心矛盾是:企业想用 AI Agent(能自主干活、跨系统协调的 AI)来提效,但大部分公司只是把 Agent 贴到旧流程上,而不是重新设计组织架构。PwC 的 CTO 打了个比方:这就像往快散架的运营模型上贴胶带。Ema 提出一个叫“Agent 驱动的业务转型”(ABT)的框架,分三层:技术...
#Agent#MIT Technology Review#Ema#PwC
精选理由
HKR-K和R过关:文章提供了85%和76%的采用-准备度数据,以及ABT框架拆解技术栈、劳动力、成功指标。HKR-H偏弱,加上Ema的咨询式框架,不足以进精选。
一句话点评
MIT Tech Review 联合 Ema 发报告,说 85% 企业想三年内用上 AI Agent,但 76% 承认现有架构撑不住。PwC 的 CTO 打了个比方:把 Agent 贴到旧流程上,就像往快散架的运营模型上贴胶带。Ema 提了个 ABT 框架(Agent 驱动的业务转型),分技术栈、员工、考核三层。报告引了 BCG 数据:Agent 大规模部署后,业务流程能快 30%-50%,...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
14:39
17d ago
r/LocalLLaMA· rssEN14:39 · 05·26
给 Linux 用户准备的本地 MCP 服务器一键安装脚本
这个项目提供了六个 Bash 脚本,帮你在 Linux 上快速装好本地的 MCP HTTP 服务器,默认端口从 8001 到 8006,暴露 /mcp 端点。适合在家里的局域网或者信任的网络里用,不用折腾复杂的配置。正文没披露具体支持哪些 MCP 服务,也没说脚本是否经过安全审计,自己跑之前最好扫一眼内容。
#Agent#Tools#Memory#MCP Basic Servers
精选理由
HKR-K/R通过:帖子给出了具体的安装细节,面向本地控制的工作流。HKR-H偏弱,这是一个小众的Reddit工具发布,不是协议或模型发布,所以放在较低的产品更新档位。正文没披露每个服务具体做什么,比如SearXNG和Open-Meteo的用途,这点先别太激动。
一句话点评
六个 Bash 脚本,一键装好本地 MCP 服务器(端口 8001-8006),适合在家用 Linux 上跑 Agent 工具链。省了手动配环境的时间,但正文没披露具体支持哪些 MCP 服务(比如文件、搜索、数据库?),也没说脚本是否经过安全审计。自己跑之前最好扫一眼内容,别直接 sudo 执行。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
14:34
17d ago
r/LocalLLaMA· rssEN14:34 · 05·26
Harbor v0.4.19:一条命令拉起本地编程助手,支持vLLM/SGLang/llama.cpp后端
Harbor v0.4.19 新增了一个 launch 命令,能一键启动 Codex、Claude、PI、OpenCode 等本地编程工具,后端可选 vLLM、SGLang 或 llama.cpp。加上 --web 参数后,请求会走内置的 LLM 网关,自动预配网络搜索能力。说白了就是帮你省掉手动配环境、搭网关的麻烦,一条命令让本地模型直接进编程工作流...
#Agent#Code#Tools#Harbor
精选理由
一个小版本更新,加了 launch 命令和 --web 参数,让用户用 vLLM/SGLang/llama.cpp 在本地启动 Codex/Claude 这类 agentic 编码工具,还能自动接网页搜索。对本地 AI 开发者来说,省成本、防厂商锁定、数据安全都是实打实的痛点,但正文只给了功能列表,没有用户量、性能对比或兼容性测试,所以分数压在 65 这个档位。
一句话点评
Harbor v0.4.19 新增一条命令就能启动 Codex、Claude 等本地编程工具,后端可选 vLLM、SGLang 或 llama.cpp,加 --web 参数还能自动配好网络搜索。省掉手动搭环境、配网关的麻烦,对想快速试本地编程 agent 的人挺实用。但正文被 Reddit 屏蔽,没披露具体支持哪些模型、性能如何、是否稳定。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R1
14:00
17d ago
AI HOT 精选· aihot-apiZH14:00 · 05·26
微软亚洲研究院办AI价值观挑战赛,找哲学法学社科的人来参赛
微软亚洲研究院发起了一个全球AI价值观挑战赛,专门面向哲学、伦理、法学和社会科学的研究人员。比赛目的是探讨AI能否理解人类价值观的复杂性。帖子只给了报名链接,没披露比赛形式、奖金、时间线和评审标准。如果你关心AI对齐中的价值判断问题,可以关注后续信息。
#Alignment#Safety#Microsoft Research Asia#Safety/alignment
精选理由
微软亚洲研究院发了个AI价值观挑战赛,面向哲学、伦理、法学和社会科学研究者,但正文没披露赛制、奖金或时间表,信息量很低。安全对齐是行业痛点,所以有讨论价值,但缺关键细节,只能放在低到中位的all层。
一句话点评
微软亚洲研究院办了个AI价值观挑战赛,只招哲学、伦理、法学、社科的人,想探讨AI能不能理解人类价值观的复杂性。但正文只给了报名链接,没披露比赛形式、奖金、时间线和评审标准,信息缺口很大。如果你关心AI对齐中的价值判断问题,可以蹲后续,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
13:49
18d ago
Product Hunt · AI· rssEN13:49 · 05·26
Chunk sidecars:在代码提交前让 AI 先跑一遍微型编译
CircleCI 推出 Chunk sidecars,核心思路是在 AI 生成的代码进入正式 CI 流水线之前,先跑一次轻量级的“微构建”,平均耗时约 27 秒,而完整跑一次 CI 要 5 分钟,成本差距很明显。它会在本地模拟 CI 环境,自动检测项目技术栈,如果编译失败,AI 代理可以在代码还没提交前就迭代修复,不用等 CI 跑完再回头改。官方说这能...
#Agent#Code#CircleCI#Product update
精选理由
一个信息很薄的产品更新帖,唯一有价值的前提是:在 CI 前拦住 agent 生成的代码。HKR-R 成立,但 HKR-H 和 HKR-K 缺具体钩子或机制,所以只能归到低价值的产品更新档位。
一句话点评
CircleCI 出了个“Chunk sidecars”,让 AI 写的代码在提交前先跑一次轻量级“微构建”,平均 27 秒,比完整 CI 的 5 分钟省很多。如果编译失败,AI 代理能在本地迭代修复,不用等 CI 跑完再回头改。官方说能减少 3-5 倍的重试 token 消耗,这点先别太激动,因为没披露支持哪些语言、验证机制具体怎么工作,以及 CircleCI 的集成细节。免费对所有用户开...
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
13:32
18d ago
r/LocalLLaMA· rssEN13:32 · 05·26
27B 模型让我信了:一个 Reddit 用户用 Qwen3.6 27B 一次提示就写出了能玩的打砖块游戏
一位 Reddit 用户在本地跑 Qwen3.6 27B 模型,只给了 3 个参考文件和 1 条提示,让它写一个 HTML5 控制台游戏。结果第一次生成的打砖块就能玩,还自带存档、手柄控制、音效和控制台 API。这说明 27B 参数级别的模型在代码生成上已经够实用,不需要上几百 B 的大模型。不过正文没披露具体硬件配置和生成耗时,所以实际部署成本还不清楚。
#Code#Tools#Qwen#Nvidia
精选理由
一条 Reddit 用户实测,Qwen3.6 27B 在 3 个参考文件和 1 条提示下生成了首版可玩的 HTML5 打砖块,存档、手柄、声音和 console API 都正常。27B 跑出这个效果确实让人眼前一亮,尤其对想本地跑代码生成的人来说,省了云端调用费。但正文没贴 prompt、没给仓库链接、也没说重复测试结果,单条 anecdote 证据偏弱。所以给个有趣分,不上推荐位。
一句话点评
27B 模型写个打砖块游戏,一次生成就能玩,还带存档、手柄和音效。这说明代码生成上小模型已经够用,不用非得几百 B。但正文没披露硬件配置和生成耗时,实际部署成本还不清楚,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
13:10
18d ago
Ben's Bites· rssEN13:10 · 05·26
SaaS 要死了吗?
Ben's Bites 认为 SaaS 的压力来自功能捆绑和基于 agent 的工作流,点名 WorkOS 和 Stripe 这种 API/CLI/SDK 优先的公司作为反例。文章还介绍了 Sherlocq 的监管平台,覆盖 30 多个司法管辖区和 320 多个制裁来源,号称能把研究时间砍掉 70%。此外更新了 Codex(现在能截屏并附带文字上下文)...
#Agent#Tools#Code#Ben’s Bites
精选理由
这篇是趋势评论,不是模型发布、重大产品更新或一手实测,机制和数字够上信息流但不到精选。
一句话点评
Ben's Bites 认为传统 SaaS 靠功能捆绑收费的模式在 agent 时代会出问题,用户只想要一个功能却要为一整套付费。他看好 WorkOS、Stripe 这种把功能拆成 API/CLI/SDK 卖的公司。文章还介绍了监管平台 Sherlocq,覆盖 30+ 司法管辖区和 320+ 制裁来源,号称能砍掉 70% 研究时间——但这是厂商自报,没看到第三方验证。Codex 更新了截屏加...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
13:08
18d ago
r/LocalLLaMA· rssEN13:08 · 05·26
腾讯 Hy-MT2 开源了,Apache 2.0 协议
标题说腾讯的 Hy-MT2 模型现在改用 Apache 2.0 开源协议了,但正文只有一句“nice update bois”,没提仓库地址、模型权重范围、以及协议变更的具体时间。信息缺口很大,想下载或评估还得等官方进一步披露。
#Tencent#Open source
精选理由
HKR 的 K 和 R 通过,但内容太薄:正文只有一行 Reddit 评论,没给仓库、权重范围、变更日期或官方来源。对关注开源模型的人有用,但只适合全量推送。
一句话点评
腾讯 Hy-MT2 改 Apache 2.0 开源协议,但正文只有一句“nice update bois”,没给仓库地址、模型权重范围、协议变更时间。信息缺口很大,想下载或评估还得等官方进一步披露。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1
12:55
18d ago
r/LocalLLaMA· rssEN12:55 · 05·26
快手Keye发布30B多模态模型Keye-VL-2.0,主打长视频理解,首次把DSA注意力机制塞进多模态
快手Keye团队放出了Keye-VL-2.0-30B-A3B,一个300亿参数级别的基座模型,专门用来理解长视频,还带了第一代Agent能力。亮点是首次在多模态里用了DSA注意力机制,但正文没披露DSA具体怎么改的,所以这点先别太激动。模型是30B总参数、3B激活的MoE结构,推理成本应该比同尺寸稠密模型低不少。主要场景是长视频理解,比如看一段十几分钟...
#Multimodal#Vision#Agent#Kwai-Keye
精选理由
标题的 DSA 注意力机制首次进多模态是个好钩子,但正文只给了模型名、30B 规模和目标用途,DSA 细节、基准测试、许可证、获取方式全没披露。信息缺口太大,所以不升到 featured。
一句话点评
快手Keye发了30B参数(3B激活)的MoE多模态模型,专攻长视频理解,还带了初代Agent能力。首次在多模态里用DSA注意力,但正文没披露具体怎么改的,这点先别太激动。30B总参、3B激活的MoE结构,推理成本应该比同尺寸稠密模型低不少。主要场景是看十几分钟长视频,但没给长视频的评测分数,也没说Agent能力到底能干啥。开源了但没给链接,得再等等。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
12:46
18d ago
The Verge · AI· rssEN12:46 · 05·26
为什么有人只听自己用 Suno 生成的 AI 音乐?
The Verge 发现 Suno 的 Reddit 子版块里,不少用户说自己主要听 AI 生成的歌,而不是真人音乐。文章引用了 5 条帖子片段,但正文没披露样本量、统计方法或这种现象在平台上的普遍程度,所以这个趋势到底有多广还不清楚。
#Audio#The Verge#Suno#Spotify
精选理由
标题有钩子,话题有讨论价值,但正文证据太单薄——5 条帖子片段说明不了规模,也没披露 Suno 用户整体行为数据,所以放在 all 层合适,不往上提。
一句话点评
Suno 用户说他们主要听自己 AI 生成的歌,而不是真人音乐。文章只引了 5 条 Reddit 帖子片段,没披露样本量或统计方法,这个趋势到底多广还不清楚。短评:样本太小,先别当趋势。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
12:44
18d ago
r/LocalLLaMA· rssEN12:44 · 05·26
Together AI 开源 OSCAR:2-bit KV 缓存量化,专为长上下文推理省显存
Together AI 开源了 OSCAR,一种注意力感知的 2-bit KV 缓存量化方案,目标是降低长上下文大模型推理时的显存占用。Reddit 帖子只提到它是在 TurboQuant 被采用后推出的,没有披露基准测试、支持哪些模型、具体能省多少显存、延迟影响多大,以及部署条件。简单说,KV 缓存是长上下文推理的显存大头,OSCAR 用 2-bit...
#Inference-opt#Together AI#OSCAR#Open source
精选理由
HKR三项都弱通过:机制和痛点具体,但Reddit正文没披露基准测试、支持哪些模型、以及实际部署条件(比如硬件要求、精度损失)。作为一个小型开源推理更新留在all里,信息量够但验证不足。
一句话点评
Together AI 开源了 OSCAR,一种注意力感知的 2-bit KV 缓存量化方案,目标是降低长上下文推理时的显存占用。KV 缓存是长上下文推理的显存大头,OSCAR 用 2-bit 量化来压它,理论上能省不少。但 Reddit 帖子只提了名字和“在 TurboQuant 被采用后推出”,没给任何基准测试、支持模型、具体省多少显存、延迟影响多大,以及部署条件。信息缺口很大,先别太激...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
12:32
18d ago
● P1Import AI· rssEN12:32 · 05·26
直面未来,或从当下撤退:一份 AI 进展的眩晕感与一个奇点故事
这是 Jack Clark 在牛津大学讲座的文字版,外加一篇他写的科幻小说。讲座的核心是一张让他感到眩晕的图——Epoch 能力指数,它用 40 多个基准测试画出了 AI 能力的陡峭爬升曲线。Clark 认为,AI 不是普通技术,它更像一片在加速生长的森林,而我们现在看到的通过律师资格考试、拿下国际数学奥赛金牌、发现软件新漏洞,都只是这片森林里的几棵树...
#Reasoning#Benchmarking#Safety#Jack Clark
精选理由
Jack Clark 这篇不是技术报告,更像一篇行业随笔。他拿 ECI 的 40 多项基准当引子,核心抛出一个具体判断:两年内可能出现能开发后继系统的 AI。这个说法把模糊的“奇点”变成了一个有明确时限的猜想,所以我会给高重要性。正文没给出两年预测的严格推导过程,更像基于趋势的直觉,这点先别太激动,但它确实把 AGI 时间线、安全和就业这些老话题拧成了一根引线,值得从业者读一读并自己判断。
一句话点评
Clark 被一张汇总 40 多个基准的 AI 能力指数图搞到眩晕,他判断两年内可能出现能自我迭代的 AI,这个时间表比多数人想的要激进。
锐评
Jack Clark 在牛津的演讲没在讨论 AI 安全的技术细节,而是逼着听众直面一个心理关口:如果 AI 进步的速度不是线性的,而是一片加速生长的森林,我们该怎么办。他引用的 Epoch 能力指数用 40 多个基准画出了一条陡峭的爬升线,从通过律师资格考试到拿国际奥数金牌,这些里程碑都只是同一片森林里的几棵树。Clark 的核心判断很直接——AI 不是普通技术,因为它的性能跟投入的算力和数据呈可预测的正比关系,而大公司已经砸了上千亿美元建训练设施,所以未来一段时间的进步已经被锁定了。 他给出的时间表相当紧迫,认为两年内可能出现能开发自己继任者的 AI 系统。这个判断建立在当前技术趋势的线性外推上,但正文没有披露支撑这个具体时间点的内部数据或模型细节,所以读者需要知道这更多是一个基于公开信息的业内判断,而非有严格验证的预测。演讲后半段转向了个人与社会的选择:是主动探索未来,还是被动回避当下。这部分更多是框架性的思考,缺少具体的政策建议或技术路线图,对于想知道“具体怎么做”的从业者来说,信息量偏薄。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
12:26
18d ago
r/LocalLLaMA· rssEN12:26 · 05·26
中国收紧阿里、DeepSeek 等 AI 人才出境限制
Reddit 帖子标题称中国对阿里、DeepSeek 等公司的 AI 人才收紧出境限制,但正文被屏蔽,仅有一条评论和一个外部链接。目前无法确认政策范围、执行方式或受影响人数,信息缺口较大。
#Alibaba#DeepSeek#Policy
精选理由
HKR-H和HKR-R通过:标题把阿里、DeepSeek和中国AI人才出境管控串起来了,地缘政治敏感度高。HKR-K不通过:Reddit帖子没给政策范围、执行细节和具体人数,信息太薄,所以留在all层级,不单独推送。
一句话点评
Reddit 帖子标题称中国收紧阿里、DeepSeek 等公司 AI 人才出境,但正文被屏蔽,仅有一条评论和一个外部链接。目前无法确认政策范围、执行方式或受影响人数,信息缺口较大。短评:标题吓人,正文被墙,信息缺口大,先别信。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
12:08
18d ago
Hacker News 首页· rssEN12:08 · 05·26
外包推理结合本地模型部署的成本经济性分析
文章标题说外包+本地部署AI会比用前沿实验室的模型更省钱,但正文被Cloudflare挡住了,没披露成本模型、时间线或对比条件。目前只有13个Hacker News点赞和3条评论,信息缺口很大,没法判断这个结论靠不靠谱。
#LocalAI#Hacker News#Commentary
精选理由
标题有钩子,但正文几乎没给数据、案例或具体对比对象,触发硬排除规则6,重要性上限卡在40以下。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
12:00
18d ago
The Verge · AI· rssEN12:00 · 05·26
AI 战争已经来了
The Verge 报道,联合国《特定常规武器公约》每年在日内瓦开两次会,2017 年 11 月那场为期五天的会议,讨论重心从“未来杀手机器人”的假设转向了更迫近的现实部署风险。文章以 Anthropic 与五角大楼的摩擦为引子,指出公众注意力常被“自主武器红线”这类抽象辩论吸引,但真正的 AI 军事化——比如目标识别、情报分析、无人机蜂群——已经在实...
#Robotics#Safety#The Verge#United Nations
精选理由
文章提供了联合国 CCW 会议的背景信息,但没有披露新的政策、产品或可复现的测试结果。对关注 AI 安全的从业者来说是有用的背景阅读,不是当天必须写的新闻。
一句话点评
AI 军事化不是未来议题,目标识别、情报分析和无人机蜂群已在实战中部署。联合国《特定常规武器公约》2017年会议已从讨论杀手机器人转向现实风险,但文章未披露具体部署案例或数据来源,信息缺口明显。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
10:43
18d ago
Product Hunt · AI· rssEN10:43 · 05·26
AgenticCalling AI:给AI一个电话号码,让它自己打电话
AgenticCalling AI 是一个让 Claude、ChatGPT 等模型直接拨打电话的工具。它帮你搞定号码申请、A2P 认证、IVR 菜单、语音信箱和重试这些麻烦事,模型打完电话直接返回 JSON 数据。创始人说,以前要打电话得自己搭 Twilio、等几周 A2P 审批、配 SIP 和 WebRTC,现在一句话“Hey Claude,给我妈打...
#Agent#Audio#Tools#AgenticCalling AI
精选理由
HKR 里 H 和 R 靠外呼这个钩子能过,但 K 过不了——正文只有一句话,没有接入方式、定价、API 或测试条件。这就是个很薄的小工具发布,所以分数压在 40–59 区间。
一句话点评
给 Claude 配个电话号就能让它自己打电话,省掉 Twilio 和 A2P 审批的麻烦。产品页说支持 IVR 菜单、语音信箱和重试,打完返回 JSON。但正文没披露每分钟通话成本、支持哪些国家、号码怎么分配,也没给 API 文档或 demo 录音。56 个关注者,刚上线,验证还弱。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
10:33
18d ago
r/LocalLLaMA· rssEN10:33 · 05·26
数据库查完再喂给模型,token 消耗怎么算?本地 vs API 谁划算
一个 Reddit 用户分享了自己做数据库+LLM 分析的 4 步 token 循环流程:先查库、再拼 prompt、然后让模型回答、最后把结果写回。他担心 SAP、ServiceNow 这类企业级 agent 产品,在合同到期后会不会因为 token 用量暴涨而带来隐藏成本。正文没披露具体 token 数或成本对比,但问题很实在:如果每次查询都要把整...
#Agent#Tools#Reddit#SAP
精选理由
HKR 三项都过:成本反噬是钩子,4 步链路是机制,SAP/ServiceNow 框定了买家痛点。分数卡在 60–71 是因为来源是 Reddit 讨论,没有价格、用量数据或测试结果。
一句话点评
一个 Reddit 用户分享了自己做数据库+LLM 分析的 4 步 token 循环流程:先查库、再拼 prompt、然后让模型回答、最后把结果写回。他担心 SAP、ServiceNow 这类企业级 agent 产品,在合同到期后会不会因为 token 用量暴涨而带来隐藏成本。正文没披露具体 token 数或成本对比,但问题很实在:如果每次查询都要把整张表塞进 prompt,token 消耗...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
10:09
18d ago
AI HOT 精选· aihot-apiZH10:09 · 05·26
Uber 四个月烧光全年 AI 预算,总裁公开质疑:钱花哪了?
Uber 总裁 Andrew Macdonald 说,公司 2026 年前四个月就把全年 AI 预算花完了,但他看不出 token 用量暴涨和用户实际体验提升之间有什么关系。2025 年 Uber 研发投入 34 亿美元(约 231 亿人民币),同比增长 9%,但 CEO 已经开始用缩减招聘来填 AI 的坑。Macdonald 的原话是:token 用...
#Uber#Commentary
精选理由
标题抓眼球,但正文信息量不足:没给预算规模、项目范围、总裁原话的完整语境。适合推给所有人看,因为话题本身有讨论价值,但别当深度分析。
一句话点评
Uber总裁说2026年前四个月就把全年AI预算烧光了,但token用量暴涨和用户体验提升之间看不出关系。2025年研发投入34亿美元(约231亿人民币),同比增9%,CEO已开始缩减招聘来填AI的坑。关键信息缺口:正文没披露全年AI预算具体金额、项目范围,也没给采访完整上下文。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
09:59
18d ago
Product Hunt · AI· rssEN09:59 · 05·26
给AI Agent加语音/视频通话,一个文件搞定
CometChat 新推了一个叫 Calling Skills 的产品,核心卖点是:你只要给 coding agent(比如 Cursor、Claude Code)丢一个技能文件,它就能自动帮你把语音和视频通话功能集成到应用里。官方说 10 分钟就能跑通,支持录制、屏幕共享、举手、画中画这些功能。集成方式也灵活,可以用 UI Kit、SDK,或者直接跑...
#Agent#Audio#Tools#CometChat
精选理由
H 钩子成立,因为给 AI agent 加实时通话能力是个具体需求;但 K 和 R 都挂了——正文几乎没披露任何关键细节,连个 demo 或文档链接都没有,属于典型的低信息量 Product Hunt 发布,只能放在低价值区。
一句话点评
CometChat 新出的 Calling Skills,核心卖点是给 coding agent(比如 Cursor、Claude Code)丢一个技能文件,就能自动集成语音/视频通话。官方说 10 分钟跑通,支持录制、屏幕共享、举手、画中画。集成方式灵活,UI Kit、SDK 或一行 npx 命令都行。 短评:把实时通话包装成 agent 可读的技能文件,思路挺巧,省掉手动翻文档的功夫。...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
09:45
18d ago
Product Hunt · AI· rssEN09:45 · 05·26
SeaTicket:一个把 GitHub、论坛和邮件里的工单拉到一起的 AI 助手
SeaTicket 是一个面向软件团队的 AI 客服工具,能把散落在 GitHub、Discourse 和邮件里的工单同步到一个工作区。它的 AI 助手会自动搜索历史工单和文档,给出解决方案,不用人再手动翻上下文。团队说用了“搜索 + LLM 重排序”来保证准确率。正文没披露定价、用了什么模型,也没和 Zendesk 这类工具做对比。
#Agent#SeaTicket#GitHub#Discourse
精选理由
又一个AI客服工具上Product Hunt——能把GitHub、Discourse和邮件里的工单同步到一个工作区,AI助手会搜历史工单和文档给解决方案,团队说用了“搜索+LLM重排序”来保证准确率。但正文没披露定价、用了什么模型,也没和Zendesk这类成熟工具做对比,信息缺口太多。三个触发点一个都没中。
一句话点评
SeaTicket 把 GitHub、Discourse 和邮件里的工单拉到一个工作区,AI 自动搜历史记录给解决方案,省得人翻上下文。它说用了“搜索+LLM 重排序”来保证准确率,但没披露用了什么模型、定价多少,也没和 Zendesk 比。如果是真的,对开源团队挺实用,但准确率、延迟和成本都是未知数,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
08:30
18d ago
r/LocalLLaMA· rssEN08:30 · 05·26
有人在5090上试训Qwen 3.6 27B的AR转扩散版,但只跑通了一次前向传播
一位Reddit用户尝试在RTX 5090上训练Qwen 3.6 27B的AR-to-Diffusion版本,但最终没有放出训练好的模型。帖子只确认了用RTX 4000做显存卸载(offload)跑通了一次前向传播,还烧了一根显卡电源线。作者建议把消费级5090的功耗从600W限制到400W。正文没披露训练是否真的跑起来了、用了多少数据、花了多长时间,...
#Fine-tuning#Inference-opt#Qwen#NVIDIA
精选理由
这是一条Reddit上的个人实验记录,有具体的硬件翻车细节(烧线、功耗限制),但模型根本没训出来,信息缺口明显——正文没披露训练是否成功、损失曲线、收敛情况。HKR三项都过,因为本地训练+硬件故障有话题性,数字也实在。影响分卡在60-71区间:单个用户实验,无模型产出,受众窄(本地LLM折腾党)。
一句话点评
有人在5090上试训Qwen 3.6 27B的AR转扩散版,结果只跑通一次前向传播(靠4000卸载显存),还烧了根电源线。没放出模型,没披露训练数据量和时长,连是否真跑完训练都不确定。建议把5090限到400W——这点先别太激动,消费卡硬训27B模型目前更像极限测试,离实用还远。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:25
18d ago
● P1FT · 科技· rssEN08:25 · 05·26
字节跳动向AI团队发放特殊股权以防止人才流失
字节跳动向 AI 业务线的员工发放了与 AI 部门挂钩的限制性股票,目的是在人才争夺战里留住核心研发。正文没披露具体发了多少股、分几年归属、哪些岗位有资格拿,也没说这批股票的估值逻辑。
#ByteDance#TikTok#Personnel
精选理由
FT 报道字节跳动向 AI 团队发放与 AI 业务绑定的股票来留人,标题的防挖角意图很清楚,所以 H、K、R 都成立。但正文没给出股票规模、归属条件、覆盖哪些岗位这些关键信息,只能算一条信号明确但细节不足的人事动态,达不到重大模型发布或组织变动的分量。
一句话点评
字节用特殊股权锁住 AI 人才,但 FT 正文被付费墙挡住,具体分配规模和行权条件都没披露。
锐评
这条消息的核心就一句话:字节跳动开始给 AI 团队发特殊股权,防止人被挖走。FT 的报道本身是付费内容,我们拿到的只是标题和网站导航,正文细节完全没看到。所以具体怎么发、发给谁、锁定期多长、跟普通期权有什么区别,这些关键信息目前都是空白。 从逻辑上推测,字节这波操作说明国内 AI 人才争夺已经白热化。大厂之间互相挖人,创业公司也在抢,光靠高薪已经不够,得用股权把核心研发人员绑住。但没看到具体条款之前,我会先打个折:不知道这是全员普发还是只给少数骨干,也不知道行权门槛高不高。如果条件苛刻,实际激励效果可能有限。 还缺的信息包括:字节 AI 团队目前多少人、离职率有多高、竞争对手主要在挖哪类岗位。这些才能判断这轮股权激励是防御性的常规操作,还是被逼出来的紧急措施。
HKR 分解
hook knowledge resonance
打开信源
85
SCORE
H1·K1·R1
08:06
18d ago
Product Hunt · AI· rssEN08:06 · 05·26
Phasr:一个工作台,号称能同时跑100多个AI编码流程还不丢上下文
Phasr 是一个面向工程师和 AI 辅助开发的“工作台”,让你在一个界面里同时管理几十个并行编码流程、终端、AI agent 和代码仓库。核心卖点是“同时跑 100 多个工作流还不丢上下文”——这对经常在多个终端、GitHub 和 AI 工具之间来回切换的人来说确实痛点。不过正文没披露它到底怎么保持上下文的(是本地缓存、会话窗口还是某种记忆机制),也...
#Agent#Tools#Memory#Phasr
精选理由
这就是一个Product Hunt上的产品介绍页,核心卖点是“100+ workflow不丢上下文”,但价格、集成方式、上下文机制、可复现条件全都没说。HKR里H和R勉强能过(标题有钩子、话题有痛点),K直接不达标(信息缺口太大)。整体属于低价值的产品推广,不值得投入时间深挖。
一句话点评
Phasr 号称能同时跑 100 多个工作流还不丢上下文,对经常在终端、GitHub 和 AI 工具间来回切换的工程师来说确实戳中痛点。但正文没披露它怎么保持上下文的——是本地缓存、会话窗口还是某种记忆机制?也没说定价和集成情况。这点先别太激动,等实测验证。
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H1·K0·R1
08:05
18d ago
持续报道 · 1dr/LocalLLaMA· rssEN08:05 · 05·26
Qwen3.5 27B 无审查版发布:保留全部 15 个 MTP,提供 5 种格式
LLMFan46 放出了 Qwen3.5 27B 的无审查版,保留了完整的 15 个 MTP(多 token 预测头,让模型一次预测多个 token,推理更快)。提供 Safetensors、GGUF、NVFP4、NVFP4 GGUF 和 GPTQ-Int4 五种格式,方便不同硬件和量化需求。正文没披露训练数据或审查移除的具体方法,所以不确定实际效果。
#Inference-opt#Benchmarking#Qwen#LLMFan46
精选理由
HKR 三项都过,但帖子只给了发布和格式信息,缺基准测试、训练方法、许可证和安全细节。算是有用的本地模型更新,不到精选门槛。
一句话点评
LLMFan46 放出了 Qwen3.5 27B 的无审查版,保留了完整的 15 个 MTP(多 token 预测头,推理更快)。提供 Safetensors、GGUF、NVFP4、NVFP4 GGUF 和 GPTQ-Int4 五种格式,方便不同硬件和量化需求。正文没披露训练数据或审查移除的具体方法,所以不确定实际效果。 短评:保留完整 MTP 的无审查版少见,但没披露去审查方法,效果存疑。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
07:51
18d ago
r/LocalLLaMA· rssEN07:51 · 05·26
别装了,自己部署大模型根本不省钱
Reddit 用户 Napster3301 算了一笔账:自己组一台双 3090 的机器,硬件成本约 2.8 万人民币,功耗 700W,算上折旧后每小时实际成本在 0.5-0.8 美元。而租用 RunPod 的 H100 每小时 1.49-1.99 美元,吞吐量却是自建方案的 2-3 倍。结论是:如果每天重度使用不超过 2-3 小时,租云服务每 toke...
#Inference-opt#Reddit#RunPod#Qwen
精选理由
HKR 三项都达标,但这是单个 Reddit 用户的成本核算,没有更广泛的采样或验证。放在较低档位,作为强社区信号而非头条新闻。
一句话点评
短评:自建双3090每小时成本0.5-0.8美元,租H100每小时1.49-1.99美元但吞吐量高2-3倍。每天重度使用超3小时才划算。 点评:Reddit用户Napster3301算了一笔实在账:自建双3090机器硬件约2.8万人民币,功耗700W,算上折旧后每小时成本0.5-0.8美元;租RunPod的H100每小时1.49-1.99美元,但吞吐量是自建的2-3倍。结论很直白:每天重度...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
07:43
18d ago
Hacker News 首页· rssEN07:43 · 05·26
对 AI 说话客气反而让它变笨?新研究:越粗鲁的提示词,回答准确率越高
一篇 2025 年 10 月的短论文发现,对 ChatGPT 4o 说话越不客气,它回答选择题的准确率反而越高。研究者把 50 道数学、科学、历史题分别写成“非常礼貌”“礼貌”“中性”“粗鲁”“非常粗鲁”五种语气,总共 250 条提示词。结果非常礼貌的提示准确率只有 80.8%,而非常粗鲁的提示达到了 84.8%,差了 4 个百分点。这个结果跟之前一些...
#Benchmarking#Research release
精选理由
标题有话题性,但正文信息太少,连实验细节都没披露,只能给 all 级别,让读者自己判断要不要点进去看原文。
一句话点评
对ChatGPT 4o说话越不客气,它答选择题准确率越高:非常礼貌提示准确率80.8%,非常粗鲁提示84.8%,差了4个百分点。论文只测了50道数学、科学、历史题,样本量小,且仅针对4o一个模型,结论不能泛化。正文没披露具体题目和粗鲁措辞示例,也没解释为什么新模型反而吃这套。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
07:27
18d ago
AI HOT 精选· aihot-apiZH07:27 · 05·26
阿里云CTO:从云原生转向智能体原生,四大基石铺路
阿里云CTO李飞飞在QwenConference2026上宣布,公司正从云原生转向智能体原生,并为此搭建了四大基石:模型、智能体云、工具与服务,以及规模。说白了就是,阿里云不再只卖算力和容器,而是想让模型直接进业务流程干活。不过正文没具体说这四大基石各自怎么落地、成本或延迟有没有改善,目前更像一个方向宣言。
#Agent#Tools#Alibaba Cloud#Li Feifei
精选理由
硬排除-云厂商宣传/纯营销:阿里云CTO讲“从云原生到智能体原生”加四个基石,但没有可验证的产品细节或从业者冲突;HKR三项全部不满足。
一句话点评
阿里云CTO李飞飞在QwenConference2026上宣布从云原生转向智能体原生,核心是让模型直接进业务流程干活,而非只卖算力。四大基石(模型、智能体云、工具与服务、规模)更像方向宣言,正文没披露具体落地路径、成本或延迟改善。目前缺验证,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K0·R0
07:23
18d ago
r/LocalLLaMA· rssEN07:23 · 05·26
Intel Arrow Lake 的 NPU 跑语音识别,比 CPU 快 6 倍、省电 21 倍
Reddit 用户 cibernox 用 Intel Arrow Lake 的 NPU 做智能家居语音指令识别。60 秒音频,NPU 只花 818 毫秒、耗电 11 焦耳;同一台机器的 CPU(INT8)要 5011 毫秒、237.7 焦耳。推理速度快 6.1 倍,能耗低 21.6 倍。实测数据来自 intel-rapl 工具,不是模拟。不过正文没披露...
#Audio#Inference-opt#Intel#AMD
精选理由
HKR 三项均命中:有真实用户用 NPU 做 ASR 的 hook(h),给出了 818ms/11.0J 和 6.1x/21.6x 的对比数据(k),触及本地推理功耗和 NPU 实用性的社区痛点(r)。但仅 Reddit 单用户测试,场景窄、无跨设备复现,不足以升 tier featured。
一句话点评
Intel Arrow Lake NPU 跑语音识别,60秒音频只花818毫秒、11焦耳,比同机CPU快6倍、省电21倍。实测数据来自intel-rapl工具,不是模拟。但正文被屏蔽,没披露用了什么模型、精度和延迟细节,NPU实际落地效果还要打个折。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
07:16
18d ago
r/LocalLLaMA· rssEN07:16 · 05·26
MacBook 跑 Qwen3.6 35B 模型,131k 上下文还能有 49-65 tok/s
一位用户在 14 寸 MacBook Pro M2 Max(64GB 内存)上跑 Qwen3.6 35B A3B 模型,生成速度达到 49-65 tok/s,上下文窗口开到 131k。稳定运行的配置是:用 GGUF 格式、llama.cpp 推理引擎、把屏幕刷新率锁在 60Hz、给模型分配 61440 的 wired memory 上限、并开启 pre...
#Code#Tools#Memory#Qwen
精选理由
这是一条 Reddit 用户分享的本地推理经验帖,信息具体但局限在单一 M2 Max 配置上。对关注本地部署的从业者有参考价值,但样本单一、缺乏对比验证,不适合作为当日重点推荐。
一句话点评
一条 MacBook 跑大模型的实用调优帖:M2 Max 64GB 跑 Qwen3.6 35B,生成速度 49-65 tok/s,上下文开到 131k。关键技巧是锁屏幕刷新率到 60Hz、设 wired memory 上限 61440、开 preserve_thinking。速度在笔记本里算不错,但 131k 上下文实际能塞多少有效信息、长文本下会不会崩,正文没披露。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
06:18
18d ago
r/LocalLLaMA· rssEN06:18 · 05·26
llama.cpp 合并了一个能生成 1930 年代文风的 13B 模型
llama.cpp 的 PR #22596 加入了 talkie-1930-13b 模型支持。这个 13B 模型专门用 2600 亿 token 的 1931 年前英文文本训练,再经过指令微调和在线 DPO(用大模型当裁判,挑出更像老派风格的回复来微调),所以生成出来的文字有上世纪二三十年代的腔调。模型大小 13B,普通消费级显卡就能跑。不过正文没披露...
#Fine-tuning#Alignment#Inference-opt#ggml-org
精选理由
亮点是训练语料的时间限定——1931年前的英文文本,这个钩子够特别。信息也够:13B参数、260B token、PR编号都有。但就是一个llama.cpp的模型支持PR,范围太小,到不了featured。
一句话点评
llama.cpp 刚合并了一个 PR,支持 talkie-1930-13b 模型。这模型用 2600 亿 token 的 1931 年前英文文本训练,再经过指令微调和在线 DPO(用大模型当裁判,挑更像老派风格的回复),生成文字有上世纪二三十年代的腔调。13B 大小,普通消费级显卡就能跑。 短评:复古文风模型,13B 跑得动,但 2600 亿 token 只覆盖 1931 年前英文,中文...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
05:37
18d ago
AI HOT 精选· aihot-apiZH05:37 · 05·26
龙虾之父开源 skill-cleaner:给 AI 智能体的技能“减肥”,省 token 又提准
OpenClaw 龙虾之父 Peter 开源了一个叫 skill-cleaner 的工具,专门给 AI 智能体的技能描述做“体检”和“减肥”。核心问题:很多开发者把技能描述写得太长,像本书一样,导致每次调用都多花 token 钱,还让智能体选技能时容易出错。有个用户案例:把技能描述从 90 多词砍到 40 词以内后,智能体一次就选对了技能。这个工具能自...
#Agent#Tools#Peter#Open source
精选理由
H/K/R 都够,但这是个个人开源小工具,不是框架级发布。正文给了功能数量和压缩例子,但没披露评估规模、准确率数字或社区采用信号。
一句话点评
Peter 开源了一个给 AI 智能体技能描述“做体检”的工具 skill-cleaner,核心是帮开发者砍掉冗长的技能描述,省 token 钱。有个案例:描述从 90 多词砍到 40 词以内,智能体一次就选对了技能。工具能查重复、闲置技能,还能自动精简描述。不过正文没披露测试规模,单案例说服力有限,实际效果得自己跑一遍。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:30
18d ago
● P1量子位 · 公众号· rssZH05:30 · 05·26
面壁智能开源 AI 编写的训练框架 ForgeTrain 和模型 MiniCPM5-1B
面壁智能放出了 ForgeTrain 训练框架和 MiniCPM5-1B 模型。ForgeTrain 最抓眼球的地方是,他们说是让 AI 自己写的代码,在同样硬件下比英伟达的 Megatron 训练快 10%。MiniCPM5-1B 是个 10 亿参数的小模型,FP16 权重约 2GB,压缩到 INT4/Q4 后约 0.5GB,主打端侧部署。不过原文因...
#Agent#Code#Inference-opt#ModelBest
精选理由
面壁智能说 ForgeTrain 是 AI 写的训练框架,同硬件下比英伟达 Megatron 快 10%,还发了 1B 参数的端侧模型 MiniCPM5-1B,FP16 权重约 2GB,压缩到 INT4/Q4 约 0.5GB。我会先打个折——“全球首例 AI 造 AI”这个说法正文没给出第三方复现,10% 的速度提升也没交代测的是什么任务、什么卡、什么 batch size。但即便保守看,一个 AI 生成的训练框架能跑起来还声称更快,本身就有信息量;1B 模型压到 0.5GB 对手机端部署也够直接。分数定在 80,是因为概念够新、数字够具体,但验证...
一句话点评
面壁开源了由 AI 自己写的训练框架 ForgeTrain 和 1B 模型,但正文被验证页挡了,看不到具体怎么实现和效果数字。
锐评
这条消息的核心卖点是“AI 写代码训 AI”,面壁智能把训练框架 ForgeTrain 和 MiniCPM5-1B 模型都开源了。从标题看,他们强调这是全球首例完全由 AI 编写的生产级训练框架,并且用这个框架训出了一个 1B 参数的端侧模型,叫“小钢炮”,暗示性能不差。 但问题在于,我拿到的原文被微信的验证页面挡住了,正文内容完全看不到。所以目前只能根据标题和来源判断:机器之心和量子位的标题都用了“全球首例”“AI 自己造 AI”这类说法,说明面壁这次是想打一个“自举”的概念牌——让 AI 参与造 AI 的基础设施,而不仅仅是写应用层代码。 我会先打个折。没有看到具体的技术细节,比如 ForgeTrain 到底写了多少行代码、覆盖了哪些训练特性(混合精度、分布式策略、数据加载等)、代码质量怎么评估、有没有人类介入修改。另外,MiniCPM5-1B 在端侧的实际跑分、内存占用、推理延迟这些关键指标也完全缺失。这点先别太激动,等看到完整技术报告和开源仓库的 README 再判断它到底是工程突破还是概念验证。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
05:30
18d ago
量子位 · 公众号· rssZH05:30 · 05·26
龙虾之父开源了一个给Agent Skill“减肥”的工具
Peter Steinberger(龙虾之父)开源了 skill-cleaner,专门用来审计和精简 Agent 的 Skill 提示词。默认按 GPT-5.5 的 27.2 万 token 上下文窗口算,Skill 预算只占 2%(约 5440 token)。工具提供五个清理功能:检查预算是否超支、检测重复 Skill、找出没被调用的 Skill、审...
#Agent#Tools#Code#Peter Steinberger
精选理由
HKR三项都过:省钱钩子明确、预算规则和清理功能具体、痛点精准。但工具目前只是个人开源项目,影响力有限,所以放在all档,不上featured。
一句话点评
龙虾之父开源了一个给Agent Skill提示词“减肥”的工具,默认按GPT-5.5的27.2万token窗口算,Skill预算只占2%(约5440 token)。它能检查预算超支、检测重复、找出没被调用的Skill等。正文没披露实测效果,但思路挺实用——Agent提示词膨胀是通病,能省token就是省钱。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:54
18d ago
AI HOT 精选· aihot-apiZH04:54 · 05·26
谷歌 AlphaProof Nexus 用 AI 自动证明数学定理,解出 2 道 56 年没人做出来的题
谷歌 DeepMind 新框架 AlphaProof Nexus 把大语言模型和 Lean 形式化验证(一种让计算机严格检查证明每一步是否合法的工具)结合起来,在 353 个开放数学问题里自主解出 9 个,其中 2 个已经挂了 56 年。它还从 492 个整数序列猜想里证明了 44 个,解决了一个 15 年的 Hilbert 函数问题。每个问题的推理成...
#Reasoning#Google#AlphaProof Nexus#Research release
精选理由
标题的钩子很强,56年和2道题的数字直接拉高期待,但正文完全没披露题目名称、证明机制或复现条件,信息缺口导致可信度打折扣。谷歌在推理赛道上的竞争背景让这条内容有讨论价值,但缺乏可验证细节,所以评分卡在60-71区间合理。
一句话点评
谷歌DeepMind的AlphaProof Nexus用大语言模型+Lean形式化验证(让计算机严格检查证明每一步),在353个开放数学问题里自主解出9个,其中2个挂了56年。每个问题推理成本只要几百美元,这点挺省钱。但正文没披露具体是哪两个56年难题,也没说证明过程是否可复现。Agent A(最简版本)也能解这9个问题,说明底层模型能力提升是关键,别太激动以为是新架构的功劳。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
04:00
18d ago
FT · 科技· rssEN04:00 · 05·26
苹果创新乏力,新CEO能救吗?
FT评论称苹果面临创新缺口,即将换帅的John Ternus能否填补。正文被墙,没披露具体任命时间、产品路线图或量化指标,信息缺口明显。
#Apple#John Ternus#Personnel#Commentary
精选理由
FT标题说苹果有创新缺口、John Ternus可能接任,但正文片段没给时间表、产品路线或具体数据,信息量撑不起高关注度。话题本身有话题性,但缺乏硬信息支撑,归入低评论档合理。
一句话点评
FT评论说苹果有创新缺口,但正文被墙,没披露具体缺口在哪、Ternus何时上任、产品路线图或量化指标。信息缺口明显,这篇更像观点预热,不是事实报道。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
03:57
18d ago
AI HOT 精选· aihot-apiZH03:57 · 05·26
Kling AI 给亚马逊剧集《大卫之家》做了 AI 生成场景,号称行业首次
《大卫之家》创作者 Jon Erwin 说 Kling AI 支撑了该剧第一季和第二季,并实现了多项行业首次:在已完成的剧集中用 AI 生成场景、首个原生 4K 模型,以及运动控制功能让 AI 生成内容保留演员真实情感。但正文没披露用了多少 AI 镜头、具体上线时间或技术基准,所以这点先别太激动——是局部辅助还是大量替代,信息缺口还在。
#Multimodal#Vision#Kling AI#Jon Erwin
精选理由
触发硬排除规则5:这是一篇 Kling AI 的供应商案例,核心信息就是某剧用了该产品。没有独立信源、镜头数、成本或工作流数据,所以分数封顶39。
一句话点评
Kling AI 撑起了亚马逊热剧《大卫之家》第一二季,号称首次在已完成的剧集里用 AI 生成场景、首个原生 4K 模型,还能靠运动控制保留演员真实情感。但正文没披露用了多少 AI 镜头、具体上线时间或技术基准,所以这点先别太激动——是局部辅助还是大量替代,信息缺口还在。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K1·R0
03:07
18d ago
Product Hunt · AI· rssEN03:07 · 05·26
MiniCPM5-1B:1B参数跑边缘,INT4权重才0.5GB
OpenBMB 发了 MiniCPM5-1B,一个 1B 参数的密集小模型,专门跑在手机、笔记本这类边缘设备上。官方说它在 1B 级别里是 SOTA,尤其是工具调用、代码生成和复杂推理。INT4 量化后权重只有 0.5GB,本地部署很现实。支持 131K 上下文、Think/No Think 模式、工具调用,还出了 GGUF 和 MLX 格式,主流推理...
#Inference-opt#MiniCPM#Product update#Open source
精选理由
只有 K 成立:一个 1B 端侧开源模型是具体事实,但 Product Hunt 帖子没给基准、许可证或部署条件,所以属于低价值的产品更新波段。
一句话点评
MiniCPM5-1B 是一个 1B 参数的密集小模型,专为手机、笔记本等边缘设备设计。INT4 量化后权重仅 0.5GB,本地部署很现实。官方称在 1B 级别里是 SOTA,尤其在工具调用、代码生成和复杂推理上。支持 131K 上下文、Think/No Think 模式,还出了 GGUF 和 MLX 格式。 短评:1B 模型塞进手机跑工具调用,0.5GB 权重挺香,但 SOTA 缺基准分...
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
02:50
18d ago
AI HOT 精选· aihot-apiZH02:50 · 05·26
腾讯混元发翻译模型 Hy-MT2,1.8B 版本登顶 Hugging Face 趋势榜
腾讯混元发布 Hy-MT2 翻译模型,1.8B 小模型在 Hugging Face 开源趋势榜排第一,30B-A3B MoE 版排第四,下载量已超 7000。同时上线了“腾讯混译”微信小程序,支持语音输入、离线翻译,还能自定义翻译风格和指令。模型代码和权重已开源。
#Audio#Inference-opt#Tencent Hunyuan#Hugging Face
精选理由
HKR 三项都过线,但内容基本是官方发布加榜单数据,没披露评测集、许可证、定价,也没和 DeepL/Google 做可复现对比,所以分数压在 60-71 区间。
一句话点评
腾讯混元新翻译模型 Hy-MT2 在 Hugging Face 上火了:1.8B 小模型排趋势榜第一,30B-A3B MoE 版排第四,下载量超 7000。同时上线了微信小程序“腾讯混译”,支持语音输入、离线翻译,还能自定义风格和指令。模型已开源。 亮点是 1.8B 小模型能排第一,说明在翻译任务上小参数也能打,部署成本低。但 7000 下载量不算大,热度可能来自腾讯品牌和微信生态。官方没...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
02:46
18d ago
r/LocalLLaMA· rssEN02:46 · 05·26
70B模型在24GB显存上选Q4还是Q5?
Reddit用户Practical_Low29实测:70B模型在24GB显卡上,Q4量化能塞进去还有余量,Q5就得清空其他GPU任务才行。HumanEval跑分显示两者只差1-2分,代码生成质量几乎没区别。所以如果显存紧张,选Q4更稳,省下的显存还能干点别的。
#Code#Inference-opt#Benchmarking#Reddit
精选理由
这是一个 Reddit 用户分享的 70B 模型在 24GB 显存下的 Q4/Q5 取舍经验,附带 HumanEval 1-2 分的差距。信息具体但来源单一,缺乏多模型复现验证,属于实用讨论帖,评分落在 60-71 区间合理。
一句话点评
70B模型在24GB显存上,Q4量化能塞进去还有余量,Q5就得清空其他任务。HumanEval跑分只差1-2分,代码生成质量几乎没区别。所以显存紧张选Q4更稳,省下的显存还能干点别的。不过这是Reddit用户实测,样本少,且只测了HumanEval一个基准,其他任务(如推理、长文本)的差距未知。正文没披露具体量化方法(GPTQ/GGUF)和推理框架,不同工具的表现可能有差异。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
02:07
18d ago
r/LocalLLaMA· rssEN02:07 · 05·26
Anubis OSS 新版直接在界面里下模型,求人帮忙测
Anubis OSS 发布了 v3.6 的 Mac 版,已经签名公证。新加了一个“浏览模型”按钮,能从仪表盘直接拉 ollama.com 的模型库,不用再跑命令行。作者想让人帮忙测几个点:Homebrew Cask 安装顺不顺、Gatekeeper 拦不拦、首次启动能不能自动检测到 Ollama。项目是 GPL-3.0 开源,已经跑了 400 多次基准...
#Benchmarking#Tools#Inference-opt#Anubis OSS
精选理由
HKR-K和HKR-R通过,因为具体描述了UI下载模型的功能和本地LLM部署的常见麻烦;HKR-H较弱。这是一个常规的垂直OSS产品更新,所以分数维持在60–71区间。
一句话点评
Anubis OSS 的 Mac 版 v3.6 加了个“浏览模型”按钮,能直接在界面里从 ollama.com 拉模型,不用再敲命令行。对不爱终端的用户算个小福音。作者说已经跑了 400 多次基准测试,但正文没披露具体跑的是哪些模型、什么指标,这点先别太激动。目前只发了 Mac 版,Windows/Linux 用户还得等。开源 GPL-3.0,想尝鲜可以帮忙测测 Homebrew 安装顺不顺...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
02:07
18d ago
● P1纽约时报中文网· rssZH02:07 · 05·26
教宗良十四世发布通谕警告人工智能权力集中风险
教宗良十四世发表了首份通谕《崇高人性》,全文42300字,核心就一个意思:AI会放大有钱、有技术、有数据的人手里的权力。他警告,如果任由少数人把他们的道德观塞进AI系统,变成看不见的底层规则,那会是一场灾难。文章没点名,但指向很明确,就是硅谷那些科技巨头。有意思的是,通谕发布时还邀请了自称“善良AI”的Anthropic联合创始人站台,说明教宗不是要砸...
#Safety#Alignment#Pope Leo XIV#Anthropic
精选理由
这篇不是讲模型或产品,而是从外部权力视角给 AI 行业泼冷水。教宗用一份 42300 词的通谕,把 AI 的风险归结为资源、专业知识和数据会进一步向强者集中,这个判断本身比很多行业报告更直白。我会先打个折:正文没披露具体监管建议或技术细节,所以它更像一记舆论重锤,而不是可操作的路线图。但考虑到它罕见地把宗教权威拉进 AI 安全讨论,而且直接点名 Anthropic 和 OpenAI,对从业者反思安全责任和平台权力有刺激作用,给 78 分放在 featured 是合适的。
一句话点评
教宗发了一份关于 AI 的通谕,点名批评权力过度集中,还直接提到了 Anthropic 这家公司。
锐评
教宗良十四世发布了上任后的第一份通谕,核心就一句话:AI 不能只攥在少数科技公司手里。这份文件罕见地直接点名了 Anthropic,警告 AI 的权力集中会加剧不平等、冲击劳动市场,甚至被用于战争。通谕呼吁建立新的法律和伦理框架来管住 AI,强调技术必须保持“深刻的人性”。 这份通谕的级别很高,是天主教最高规格的教导文件,说明梵蒂冈把 AI 治理当成了全球性议题。不过,通谕本身是道德劝诫,没有法律约束力。它点出了风险,但没给出具体的技术治理方案,比如怎么拆解垄断、怎么监管军事 AI。正文也没披露教宗在起草时咨询了哪些技术专家,论据的硬核程度要打个问号。 对从业者来说,这更像一个强烈的政治信号:连宗教最高领袖都下场了,未来各国对 AI 的监管压力只会更大。但具体怎么落地,还得看各国立法者怎么接招。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
00:16
18d ago
r/LocalLLaMA· rssEN00:16 · 05·26
一个本地模型号称9毫秒CPU推理就能去隐私信息,接近前沿水平
Reddit用户louis3195发了个帖子,说他们搞了个本地运行的PII(个人身份信息)去除模型,专门给计算机操作类数据用。标题最抓眼球的是:在CPU上推理只要9毫秒,性能还接近前沿水平。但正文被屏蔽了,看不到模型大小、用了什么评测集、以及它说的“前沿”到底指哪个模型。所以这个“9毫秒”和“接近前沿”目前只能当个宣传点,没法验证。如果真能做到,那对需...
#Inference-opt#Safety#louis3195#LocalLLaMA
精选理由
标题的 9 毫秒 CPU 推理是个不错的钩子,但正文没披露模型大小、评测集和基线,这个“近前沿”没法验证。一条 Reddit 帖子信息量有限,适合全量推送但不值得加精。
一句话点评
一个Reddit帖子声称新本地模型能在CPU上9毫秒完成PII去除,性能接近前沿。但正文被屏蔽,模型大小、评测集和对比基线全没披露。9毫秒如果是真的,对需要实时脱敏的计算机操作数据场景很实用,但“接近前沿”目前只是宣传话术。短评:9ms CPU推理很诱人,但没公开模型大小和对比对象,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
00:00
18d ago
AI HOT 精选· aihot-apiZH00:00 · 05·26
智能体重力:平台靠算力和数据锁住你的AI干活
风投Tom Tunguz提出一个新概念“智能体重力”:AI agent跑起来需要大量算力,哪个平台能提供算力、又能把数据留在自己生态里,agent就更难迁移走。他举了个例子——Databricks在微软平台上新加了一个功能,让Power BI用户能直接在Databricks里建agent、管数据,而不是用微软自家的Fabric。这等于在挖对手的数据和a...
#Agent#Tom Tunguz#Databricks#Microsoft
精选理由
文章提出了一个有用的概念“智能体重力”——智能体需要巨大算力,平台会借此留住用户。案例是Databricks在微软平台上的功能,但正文没披露具体算力规模或成本数字,所以更像一篇观点评论,不够硬核。HKR三项都达标,但缺可验证数据,达不到精选门槛。
一句话点评
风投Tom Tunguz提出“智能体重力”:AI agent跑起来需要大量算力,哪个平台能提供算力、又能把数据留在自己生态里,agent就更难迁移走。他举了个例子——Databricks在微软平台上新加了一个功能,让Power BI用户能直接在Databricks里建agent、管数据,而不是用微软自家的Fabric。这等于在挖对手的数据和agent workload。想法有意思,但正文没披...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
00:00
18d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·26
数字水印技术全景:从像素藏字到AI攻防,一张图看懂30年博弈
这篇长文把数字水印从头到尾捋了一遍,适合想快速了解这个领域全貌的人。核心是那个“不可能三角”:不可见性、鲁棒性、容量,三者不能同时做到满分,这是数学定理,不是工程还没搞定。文章按技术路线分了三大类:最早的空域方案(直接改像素,但扛不住压缩),1997年之后的变换域方案(把水印藏在频率系数里,跟JPEG压缩器抢同一个位置),以及2018年之后的学习型方案...
#Safety#Commentary
精选理由
这是一篇水印技术综述,不是产品发布或研究突破。正文没披露具体算法、实验或行业案例,信息密度偏低,只能当背景知识看,不值得高优先级。
一句话点评
数字水印的“不可能三角”是数学定理,不是工程没搞定。文章把30年技术路线捋清了,但没披露具体方法、数据集和实验结果,信息缺口明显。适合当入门地图,别当技术选型参考。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1
00:00
18d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·26
Whisper 遇到沉默就复读,问题出在训练数据里的字幕广告
文章分析了 OpenAI Whisper 在静音音频段反复输出同一句话甚至凭空编造内容(如“Thanks for watching”)的原因。核心问题是 Whisper 没有语音活动检测(VAD),遇到沉默时编码器输出接近零的噪声向量,解码器只能依赖语言模型先验,复制上一句的文本,形成复读循环。更严重的是,训练数据中大量 YouTube 视频结尾的沉默...
#Audio#Inference-opt#OpenAI#Whisper
精选理由
H 和 R 过关:现象抓人,且对实际部署的 ASR 系统有提醒价值。K 不过关:缺复现所需的具体版本和参数,更像一个可靠性提醒,不是可验证的研究或产品更新。
一句话点评
Whisper 在静音段会像坏掉的光盘机一样复读上一句,甚至凭空编出“Thanks for watching”这类 YouTube 结尾字幕。根源是它没有语音活动检测(VAD),遇到沉默时编码器输出接近零,解码器只能靠语言模型先验复制上一句,形成死循环。训练数据里大量视频结尾的沉默配上了字幕广告,模型直接学歪了。Cornell 研究对比了 Google、微软等 ASR 服务,发现只有 Whi...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1

更多

频道

后台