ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-22

114 items · updated 3m ago
RSS live
2026-05-22 · 星期五2026年5月22日
23:59
21d ago
● P1AI HOT 精选· aihot-apiZH23:59 · 05·22
Gemini 月活破 9 亿,新增两个能替你干活的代理功能
Google 说 Gemini 应用月活用户超过 9 亿了。这次更新把 Gemini 从问答工具往主动干活的个人代理方向推了一步。新模型叫 Gemini 3.5 Flash,还换了套叫“Neural Expressive”的设计语言,另外 Gemini Omni 模型能把提示词直接生成视频。重点在两项代理功能:Daily Brief 会给你出个性化每日...
#Agent#Multimodal#Google#Gemini
精选理由
Google 这次更新核心就两件事:一是 Gemini 应用月活冲到 9 亿,盘子确实大;二是推出了 Daily Brief 和 Gemini Spark 两个代理功能,后者可以在用户授权下 24 小时跑任务。我会先打个折,正文没披露代理功能的具体完成率和延迟数据,实际干活靠不靠谱还不知道。但 9 亿这个量级加上“常驻后台的个人代理”定位,对做 agent 产品的团队来说是个明确的信号——大厂开始用自家分发渠道推代理了,竞争门槛在抬高。
一句话点评
Gemini 月活破 9 亿,但 Google 没说是怎么算的。新推的 Daily Brief 和 Spark 代理功能听起来像能替你干活,实际能接管多少任务、会不会翻车,正文没给细节,先别太激动。
锐评
Google 这次把 Gemini 从问答工具往主动干活的个人代理方向推了一步。月活 9 亿这个数字挺大,但正文没披露统计口径,是打开过就算,还是真在用的,不知道。新模型叫 Gemini 3.5 Flash,还换了套设计语言,另外 Omni 模型能把提示词直接生成视频,这点如果效果稳定,对内容创作挺省事。 重点在两项代理功能:Daily Brief 给你出个性化每日简报,Gemini Spark 号称能 7x24 小时替你管理任务。听着像能帮你订票、回消息、整理日程,但授权范围、出错率、隐私怎么处理,正文全没提。这种主动代理一旦翻车,代价比问答答错大得多。 还缺的是实际体验数据和限制条件。比如 Spark 能接管哪些 App,跨平台支持怎么样,延迟高不高。这些不说清楚,9 亿用户更像是个宣传数字,产品到底能不能用,还得等上手。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
22:41
21d ago
彭博科技· rssEN22:41 · 05·22
Zoom 2023 年初投了 Anthropic,现在账面赚了 10 亿美元
Zoom 在 2023 年初投了 Anthropic,目前这笔投资已经赚了大约 10 亿美元。正文没披露 Zoom 当初投了多少钱、拿了多少股份,也没说它是怎么退出的——是卖了股票还是公司回购。10 亿美元这个数字本身挺大,但因为没有本金和持股比例,没法算实际回报倍数。对 AI 从业者来说,这条消息更像一个信号:早期押注头部模型公司,回报空间确实惊人,...
#Zoom#Anthropic#Funding
精选理由
正文只说了 Zoom 从 Anthropic 投资赚了约 10 亿美元,但没披露投了多少、占多少股、怎么退出的。这个数字本身有信息量——说明早期押注头部 AI 公司的回报确实可观,但缺少投资成本,没法算实际收益率。对 AI 从业者来说,这是一个有用的 AI 财务信号,不是当天必须写的产品或融资事件。
一句话点评
Zoom 2023年初投了Anthropic,现在账面赚了约10亿美元。但正文没披露本金和持股比例,也没说怎么退出的——是卖了股票还是公司回购。10亿美元这个数字挺大,但没成本基数就没法算回报倍数。对AI从业者来说,这条消息更像一个信号:早期押注头部模型公司,回报空间确实惊人。不过,如果Zoom只投了几千万,那回报倍数就很高;如果投了几个亿,那也就一般。缺关键信息,没法判断这笔投资到底多成功。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
22:11
21d ago
r/LocalLLaMA· rssEN22:11 · 05·22
8GB 显卡跑 26 万 token 上下文,速度还能到 30+ token/秒
有人在 8GB 的 RTX 3070 Ti 上跑了 Qwen3.6-35B-A3B 的 Q4 量化版,上下文长度开到 262144 token,实测生成速度约 34–37 token/秒(Ubuntu 系统),Windows 下不到 27 token/秒。用的是 llama.cpp,KV 缓存精度 q8_0,系统内存 32GB DDR4-2666。这个...
#Inference-opt#Code#Qwen#NVIDIA
精选理由
这是一条 Reddit 用户实测数据,不是官方发布或广泛验证的产品更新。亮点是 262k 上下文在 8GB 显存卡上达到 30+ tps,对本地部署党有吸引力。但只有单点测试,缺乏多环境对比或稳定性验证,所以分数卡在 60-71 区间。正文没披露功耗、温度或长时间运行稳定性,这点先别太激动。
一句话点评
8GB显存跑35B模型,262K长上下文,每秒34-37 token——这个数字很实在。Qwen3.6-35B-A3B的Q4量化版在3070 Ti上跑出了接近实时对话的速度,Ubuntu比Windows快30%左右。代价是32GB系统内存和q8_0 KV缓存,长上下文下内存带宽是瓶颈。正文没披露具体推理框架版本和prompt长度,实测可能打折扣。对本地部署党来说,这个配置门槛不高,但别指望同...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
22:10
21d ago
AI HOT 精选· aihot-apiZH22:10 · 05·22
ViggleAI 说动捕和角色动画变简单了,但没给细节
ViggleAI 发帖称动作捕捉和角色动画制作变得更容易,但正文只说了“持续构建,更多功能即将推出”。没有披露具体能力、技术参数、定价或发布日期,信息量很少,无法判断实际效果。
#Vision#Multimodal#ViggleAI#Product update
精选理由
硬排除规则5适用:这是一条产品预告,没有具体功能、规格、发布日期或可验证的机制。HKR-H、HKR-K、HKR-R均不满足。
一句话点评
ViggleAI 发了条帖子,说动捕和角色动画变简单了,但正文就一句“持续构建,更多功能即将推出”。没提具体能力、技术参数、定价或发布日期,信息量约等于零。短评:画饼帖,等真东西出来再说。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
21:46
21d ago
彭博科技· rssEN21:46 · 05·22
美国考虑对进口芯片加关税,贸易代表称暂无具体计划
美国贸易代表Jamieson Greer说,特朗普政府仍在考虑对进口半导体加征关税,目的是刺激本土芯片制造。但短期内不会落地新税。正文没披露税率范围或时间表,所以这点先别太激动——目前只是放风阶段,离真正执行还有距离。
#Jamieson Greer#Trump administration#Policy
精选理由
这是一条政策动态,不是AI技术突破。正文只确认了“还在评估、暂无新关税”,没披露税率、范围和具体时间表。对AI从业者来说,算力成本是命门,所以这条值得关注,但信息缺口明显,不能当重磅新闻推。
一句话点评
美国贸易代表放风要对进口芯片加关税,刺激本土制造。但正文没披露税率和时间表,目前只是口头施压,离落地还远。关键看后续细则,别急着下注。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
21:09
21d ago
r/LocalLLaMA· rssEN21:09 · 05·22
Blackwell 新特性 PDL 实测:推理提速最多 9%,Prefill 几乎没变
Llama.cpp 最新版 b9282 开始支持 Nvidia 的 PDL(程序化依赖启动),但仅限计算能力 >= 90 的 Blackwell 架构显卡,Ada 系列用不了。有人在 RTX Pro 4500 Blackwell 32GB 上跑了四个模型,结果 token 生成速度提升了 2.2% 到 9.17%,但 prefill(预填充)阶段几乎没...
#Inference-opt#Benchmarking#Tools#Llama.cpp
精选理由
Llama.cpp新版b9282支持了Nvidia PDL(一种推理加速库),实测RTX Pro 4500上预填充速度没变,四个模型的token生成快了2.2%到9.17%。加速幅度不大,但胜在免费升级,对跑本地模型的用户算个小甜头。正文没披露PDL具体怎么起效、功耗有没有变化,这点先别太激动。
一句话点评
Llama.cpp 新版 b9282 给 Blackwell 显卡开了个叫 PDL 的硬件加速,RTX Pro 4500 32GB 实测 token 生成速度最多提了 9%,但 prefill 几乎没变化。注意:只有计算能力 >= 90 的 Blackwell 能用,Ada 系列被排除。提升幅度不大,且来源是 Reddit 单用户测试,缺少多卡、长上下文或大 batch 的对比数据。正文没披...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
20:17
21d ago
r/LocalLLaMA· rssEN20:17 · 05·22
给 Cohere 的语音转文字模型加了个说话人分离和时间戳,误差不到 0.1 秒
Reddit 用户 iamMess 微调了 Cohere Transcribe,加上了说话人分离(谁在什么时候说话)和时间戳功能。实测平均时间戳误差 0.097 秒,每 30 秒片段最多能识别 4 个说话人。正文没披露用了多少训练数据、微调成本或模型大小,所以这点先别太激动——效果看着不错,但验证还不够充分。
#Audio#Fine-tuning#Cohere#Hugging Face
精选理由
HKR 三项都过,但这是单个 Reddit 用户的实验,范围窄。0.097 秒误差和 4 说话人条件有用,但没公布训练数据量、微调成本、是否开源模型权重,也没说在更长音频或嘈杂环境下的表现。信息缺口明显,不够上精选。
一句话点评
Reddit 用户微调 Cohere Transcribe,加上了说话人分离和时间戳。实测平均时间戳误差 0.097 秒,每 30 秒片段最多识别 4 个说话人。误差不到 0.1 秒,效果不错。但正文没披露训练数据量、微调成本和模型大小,验证还不够充分,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
20:16
21d ago
AI HOT 精选· aihot-apiZH20:16 · 05·22
Codex 差异视图新增经典 +/- 标记选项
OpenAI 给 Codex 功能加了个外观设置:差异视图现在可以切换成传统的 +/- 标记,而不是只有彩色条。默认还是彩色条,需要你手动去开。就是个界面小调整,不影响功能。
#Code#Tools#OpenAI#Product update
精选理由
这是 OpenAI 开发者工具里一个很小的 UI 设置更新:HKR-K 靠具体机制(新增标记选项)通过,HKR-H 和 HKR-R 都很弱。属于小产品更新的低端,不值得推荐。
一句话点评
OpenAI 给 Codex 的差异视图加了个外观选项,可以切回传统的 +/- 标记,默认还是彩色条。就是个界面小调整,不影响功能,别激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
20:15
21d ago
r/LocalLLaMA· rssEN20:15 · 05·22
Strix Halo 核显 + 双 3090 外接显卡,硬塞 124GB 显存跑大模型
作者在 Strix Halo 系统(124GB 统一显存)上外挂两块 RTX 3090,用 vLLM 跑 Qwen 3.6 27B 模型。实测支持 131K 或 262K 超长上下文,同时处理 4 个并发请求,并开启了 MTP=3(预测下一个 token 时多看 3 步)。这套组合把核显统一内存和独立显卡显存全堆在一起,显存总量很夸张,但外接显卡走 P...
#Inference-opt#Code#Tools#Qwen
精选理由
一篇 Reddit 个人魔改帖,用 Strix Halo 的 124GB 统一显存加上双 3090 外接显卡跑 Qwen 3.6 27B,vLLM 测试条件写得很清楚:131K/262K 上下文、4 并发、MTP=3。亮点是显存够大,能塞下 27B 模型的长上下文,但来源单一、配置小众,所以分数压在 60–71 区间。正文没披露具体吞吐数值和功耗,这点先别太激动。
一句话点评
一个玩家在 Strix Halo 系统(124GB 统一显存)上外挂两块 RTX 3090,用 vLLM 跑 Qwen 3.6 27B 模型,实测支持 131K 或 262K 超长上下文,同时处理 4 个并发请求,并开启了 MTP=3(预测下一个 token 时多看 3 步)。这套组合把核显统一内存和独立显卡显存全堆在一起,显存总量很夸张,但外接显卡走 PCIe 带宽有限,实际推理速度会打折...
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
20:06
21d ago
彭博科技· rssEN20:06 · 05·22
AI 行情把收益都吸走了,华尔街主动基金经理被架在火上烤
彭博发了一篇报道,说 AI 板块的持续上涨让市场收益高度集中在少数几只股票上,导致那些靠选股吃饭的主动基金经理很难跑赢大盘。文章提到 AI 热潮正在扭曲市场信号,让人类投资者屡屡受挫。不过正文没有披露具体样本数量、管理资产规模、业绩对比数据或统计时间段,所以这个“被套住”到底有多普遍、多严重,目前只能当个现象描述来看,先别急着下结论。
#Bloomberg#Commentary
精选理由
Bloomberg 的标题有冲击力,H和R都过关。但正文太短,没有给出任何具体数字或案例来支撑判断,K不通过。整体属于行业评论,不是硬新闻,所以放在通用报道档位。
一句话点评
彭博说AI板块集中上涨,主动选股基金跑不赢大盘。但正文没给样本数量、管理规模、业绩对比数据和时间段,这个“被套住”有多普遍只能当现象看,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
19:57
21d ago
● P1AI HOT 精选· aihot-apiZH19:57 · 05·22
Anthropic 的 Project Glasswing 一个月内发现超万个高危软件漏洞
Anthropic 说,他们和大约 50 家合作伙伴用 Claude Mythos Preview 模型,在全球最关键的基础软件里找到了超过一万个高危或严重级别的漏洞。现在瓶颈已经不是找漏洞的速度,而是验证、通报和打补丁的速度。在开源软件扫描这块,模型自己估算发现了 6,202 个高危或严重漏洞,其中 1,752 个已经过独立安全公司或 Anthrop...
#Code#Agent#Benchmarking#Anthropic
精选理由
Anthropic 这次放出的不是模型跑分,而是 Claude 在真实关键系统里挖漏洞的战报。约 50 家合作伙伴用 Claude Mythos Preview 扫出超过一万个高危或严重漏洞,独立验证准确率 90.6%,说明模型在安全自动化这条线上已经从“能看”走到“能干活”了。我会先打个折:正文没披露漏洞类型分布、误报率和修复成本,也没说这 90.6% 是在什么条件下测的,所以准确率数字先别太激动。但不管怎么说,一万多个高危漏洞这个量级,加上 Mozilla、Cloudflare 这类合作方背书,对做安全自动化和关键基础设施防护的团队来说,是一个...
一句话点评
Anthropic 用新模型一个月扫出上万个高危漏洞,但具体细节要等补丁铺开才能说,现在看到的数字先打个折。
锐评
Anthropic 公布了 Project Glasswing 的首月数据:约 50 家合作方用 Claude Mythos Preview 模型,在各自的核心软件里总共发现了超过一万个高危或严重漏洞。Cloudflare 一家就找到 2000 个 bug,其中 400 个是高危或严重级别,而且误报率比人类测试员还低。Mozilla 测 Firefox 150 时挖出 271 个漏洞,是上一版用 Claude Opus 4.6 时的十倍多。这些数字说明 AI 找漏洞的速度已经远超人类,现在瓶颈变成了怎么快速验证、通报和打补丁。 在开源软件扫描上,Anthropic 自己用 Mythos Preview 扫了 1000 多个项目,模型自己估计有 6202 个高危或严重漏洞。其中 1752 个已经过外部安全公司复核,90.6% 是真漏洞,62.4% 确认是高危或严重级别。按这个比例推算,光开源项目就能筛出近 3900 个高危漏洞。wolfSSL 那个例子挺直观——模型直接构造了一个能伪造证书的攻击,影响数十亿设备。 不过要冷静看。Anthropic 自己说了,因为行业惯例是漏洞发现后 90 天才公开细节,现在披露的都是滞后指标。正文没给出漏洞的具体类型分布,也没说这些漏洞里有多少是模型独立发现、多少需要人工引导。英国 AISI 和 XBOW 的外部评测都夸模型能力强,但评测基准的覆盖面和真实攻防场景的差距有多大,文章没展开。另外,微软和甲骨文都说补丁量在猛增,但没提这些补丁对应的漏洞修复成本有多高。等补丁大规模部署后 Anthropic 承诺会放出更多细节,那时候才能判断这波 AI 挖漏洞到底改变了什么。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
19:52
21d ago
r/LocalLLaMA· rssEN19:52 · 05·22
双卡混搭成功:R9700 PRO + 7800 XT 凑出 48GB 显存跑 llama.cpp
Reddit 用户 Jorlen 在 Kubuntu 24.04 上把一张 R9700 AI PRO(32GB)和一张 7800 XT(16GB)拼在一起,用 llama.cpp 跑通了推理。Vulkan 后端能快速出结果,但 ROCm 不支持这种 RDNA4 和 RDNA3 混插,直接罢工。48GB 显存够跑 70B 模型,但跨卡通信开销和驱动兼容性...
#Inference-opt#Reddit#Jorlen#AMD
精选理由
这是一个 Reddit 上的折腾笔记,不是模型或产品发布。它证明了 AMD 混搭双卡跑 llama.cpp 可行,但正文没披露推理速度、功耗、稳定性等关键指标,实用价值有限。影响范围在 60–71 分档合理。
一句话点评
Reddit 用户 Jorlen 把一张 R9700 AI PRO(32GB)和一张 7800 XT(16GB)混插,用 llama.cpp 的 Vulkan 后端跑通了推理,48GB 显存够跑 70B 模型。但 ROCm 不支持 RDNA4 和 RDNA3 混插,直接罢工。跨卡通信开销和驱动兼容性是硬伤,实际推理速度可能打折。正文没披露具体延迟和吞吐量,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
19:42
21d ago
● P1彭博科技· rssEN19:42 · 05·22
Anthropic融资超300亿美元,估值突破900亿
彭博社援引知情人士消息,Anthropic 计划最快下周关闭一轮超过 300 亿美元的融资,投后估值超过 9000 亿美元。这个数字会让它超过 OpenAI,成为全球最值钱的 AI 创业公司。不过正文被 Bloomberg 的机器人验证墙挡住了,具体条款、投资方和资金用途都没披露。
#Anthropic#OpenAI#Bloomberg#Funding
精选理由
彭博说 Anthropic 最快下周就能把这轮超过 300 亿美元的融资关掉,投后估值冲到 9000 亿美元以上,按这个数字它会超过 OpenAI 成为估值最高的 AI 初创公司。我会先打个折:正文没披露具体投资人、资金用途和估值计算方式,而且交易还没落袋,所以重要性停在 91 分,没往 95 以上推。但这条消息本身够直接——钱、时间、排名三个要素都给了,对关注前沿实验室资本动态的人就是一条硬消息。
一句话点评
Anthropic 这轮融的钱比原定目标还多,估值直接反超 OpenAI,但 9000 亿这个数字得看最终条款会不会缩水。
锐评
Anthropic 这轮融资的规模和速度都挺夸张。超过 300 亿美元、估值破 9000 亿,如果下周真能敲定,它会直接超过 OpenAI 成为估值最高的 AI 创业公司。这个估值背后有收入数据在撑:公司预计第二季度营收 109 亿美元,比上季度翻了一倍多,而且可能首次实现盈利。年化营收目标也喊到了 500 亿美元,去年 7 月这个数字才 40 亿,增长曲线很陡。 不过这些数字目前都来自彭博社引用的匿名消息源,最终投资承诺和条款还在谈,存在变数。文章没披露这轮融资的具体领投方和资金用途,也没说 9000 亿估值是投前还是投后。另外,年化营收是按短期收入推算全年,如果后续季度增速放缓,这个数字会打折扣。 我会先打个折看这件事:收入增长是真的猛,但估值已经跑到很前面了。还缺的是具体的投资人名单、资金怎么花,以及这轮融资后离上市还有多远。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
19:34
21d ago
AI HOT 精选· aihot-apiZH19:34 · 05·22
ChatGPT语音模式现在能帮你填表了
拍一张表单照片,用嘴说你要填什么,ChatGPT就能把填好的版本吐出来。正文没提支持哪些格式、哪些语言、要不要额外付费、以及什么时候上线。
#Multimodal#Vision#Audio#ChatGPT
精选理由
HKR中H和K通过,因为语音+图像的表单填写是一个具体可用的新交互流程,用户能直观理解价值。R偏弱,这只是OpenAI的一个小产品更新,没有披露支持的文件格式、语言范围、定价或上线时间,信息缺口明显,所以分数落在60-71区间。
一句话点评
拍张表单照片,用嘴说填什么,ChatGPT 就能吐出填好的版本。这功能把语音和视觉串起来了,省了打字和手写。但正文没提支持哪些格式、哪些语言、要不要额外付费、以及什么时候上线。如果是免费且支持中文,日常填表确实方便;要是只限英文 PDF 或 Plus 用户独享,那实用性就大打折扣。等具体上线范围和定价出来再判断值不值得激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
19:34
21d ago
Hacker News 首页· rssEN19:34 · 05·22
Linux 音频子系统也迎来大量 AI 驱动的补丁
继网络子系统之后,Linux 音频子系统也出现了大量由 AI 生成的补丁。维护者 Takashi Iwai 表示,本周的修复中大部分是小问题,包括 HD-audio 中断处理、UAF(释放后使用)漏洞修复,以及针对 HP、ASUS 笔记本的 Realtek 声卡 quirks。邮件列表里能看到不少补丁标注了“assisted-by”,来自 Claude...
#Code#Linux#Phoronix#Hacker News
精选理由
H 和 R 通过:AI 参与 Linux 音频修复值得聊。K 不通过:缺补丁数、模型名、工作流,且内核维护这个角度太窄,受众有限。
一句话点评
Linux 7.1 音频子系统的修复补丁里,不少标注了“assisted-by”,来自 Claude Code 和 GPT-5.5。维护者说大部分是小问题,比如中断处理、UAF 漏洞和笔记本声卡 quirks。但正文没披露具体补丁数量,也没说 AI 贡献占比。真正该担心的是 review 负担——AI 写补丁快,但人工审核跟不上,质量风险就堆在那了。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
18:46
21d ago
Hacker News 首页· rssEN18:46 · 05·22
伪装成领域术语的注入攻击,多智能体系统几乎防不住
这篇论文发现,现有的 LLM 注入检测器有一个系统性盲区:如果攻击指令伪装成目标文档的领域术语和权威结构(作者叫“领域伪装注入”),检测率会从 93.8% 暴跌到 9.7%(Llama 3.1 8B),Gemini 2.0 Flash 也从 100% 掉到 55.6%。更夸张的是,生产级安全分类器 Llama Guard 3 一个都没拦住,检测率直接归...
#Agent#Safety#Research release#Safety/alignment
精选理由
H 和 R 通过,但 K 不通过:正文只有标题级信号,HN 7 分且零评论,缺乏机制、实验或指标。信息缺口太大,只能给 66 分,维持 tier all。
一句话点评
攻击指令伪装成目标文档的术语和格式,Llama 3.1 8B 检测率从 93.8% 暴跌到 9.7%,Gemini 2.0 Flash 从 100% 掉到 55.6%,生产级分类器 Llama Guard 3 一个都没拦住。论文只测了单作者、单轮注入,没披露多轮对话或实时流场景下的表现。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
18:17
21d ago
Hacker News 首页· rssEN18:17 · 05·22
KanBots:开源看板桌面应用,每张卡片上跑一个 AI 代理
KanBots 是一个开源桌面应用,把看板上的每张卡片变成一个独立的工作区,每个卡片可以并行跑一个 Claude Code 或 Codex 代理。你丢一个文件夹进去,它就自动生成看板,然后可以手动派代理干活,或者开“自动驾驶”模式——让产品经理、工程师、测试等角色自动拆任务、并行执行、互相检查输出。所有数据存在本地的 SQLite 里,代码不出机器,没...
#Agent#Tools#Kanbots#Hacker News
精选理由
标题说开源看板应用能在每张卡片上跑并行 agent,这个点对从业者很有吸引力——相当于把项目管理工具直接变成 agent 执行层。但正文信息严重不足:没给仓库地址、没讲 agent 怎么调度、没提支持哪些模型、也没说系统要求。目前只能当个概念钩子看,想复现或评估可行性还得等更多资料。
一句话点评
KanBots 把看板每张卡片变成一个独立工作区,并行跑 Claude Code 或 Codex 代理,还能开“自动驾驶”让产品经理、工程师等角色自动拆任务、互相检查。所有数据存在本地 SQLite,代码不出机器,这点对隐私敏感团队友好。开源 MIT 许可,免费,也有付费云版。但正文没披露并行代理的调度机制、任务冲突怎么处理,也没说支持多少卡片同时跑、延迟如何。如果只是简单轮询,大规模并行可...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
18:01
21d ago
r/LocalLLaMA· rssEN18:01 · 05·22
VPO:用向量奖励替代标量奖励,让模型在搜索时更愿意尝试不同答案
VPO(Vector Policy Optimization)把GRPO里单一的标量奖励改成了向量奖励,相当于给模型多个维度的反馈,而不是只给一个总分。实验显示,在四个任务上,VPO在pass@k和best@k这类测试时搜索指标上持平或超过了标量RL基线,搜索预算越大优势越明显。简单说,就是训练时鼓励模型生成更多样化的回答,这样在推理时多试几次就能找到...
#Reasoning#Code#Fine-tuning#Vector Policy Optimization
精选理由
HKR-H/K通过:钩子有反直觉点(多样性提升搜索),正文给出了具体替代方案(向量奖励换掉GRPO优势估计)和4个任务的pass@k/best@k测试结果。来源和影响都还在研究社区层面,所以分数维持在60-71区间。
一句话点评
VPO把GRPO的单一奖励改成向量奖励,训练时鼓励模型生成更多样化的回答。实验显示,在四个任务上,VPO在pass@k和best@k等测试时搜索指标上持平或超过标量RL基线,搜索预算越大优势越明显。简单说,就是训练时鼓励模型生成更多样化的回答,这样在推理时多试几次就能找到更好的答案。 关键数字:四个任务、pass@k和best@k指标。来源是Reddit帖子,正文被屏蔽,无法验证实验细节。...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
18:00
21d ago
AI HOT 精选· aihot-apiZH18:00 · 05·22
Google I/O 2026对话环节回顾
这篇博客回顾了Google I/O 2026的对话环节,主题涵盖AI、量子计算、机器人和创造力。但正文没有披露具体演讲者、产品发布或技术细节,信息量有限。
#Robotics#Google#Commentary
精选理由
这是一篇Google I/O 2026对话环节的回顾,正文只提到讨论了AI、量子计算、机器人和创造力,没有披露嘉宾名单、产品发布或任何技术参数。HKR三项全挂:没有悬念或发布钩子(h),信息量太少连关键事实都不够(k),对从业者来说没有可用的产品、成本或竞争信息(r)。按0/3规则直接排除。
一句话点评
Google I/O 2026 对话环节回顾,但正文没提任何具体演讲者、产品发布或技术细节,信息量约等于零。标题看着大,实际是篇活动总结,对从业者没参考价值。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
17:34
21d ago
r/LocalLLaMA· rssEN17:34 · 05·22
BeeLlama v0.2.0 发布:单张 RTX 3090 跑 Qwen 3.6 27B,速度冲到 164 tok/s
BeeLlama 新版本主打 DFlash 优化,单卡 RTX 3090 上 Qwen 3.6 27B 的生成速度达到 164 tok/s,是基线(未优化)的 4.4 倍;Gemma 4 31B 跑到 177.8 tok/s,提速 4.93 倍。提示词处理速度基本没掉(1214 vs 1229 tok/s),说明加速主要靠解码阶段。不过正文只贴了部分跑...
#Inference-opt#Vision#Tools#BeeLlama
精选理由
HKR 三项全过:单卡 RTX 3090、27B/31B 模型、4.40x/4.93x 加速比,既有钩子又有证据。分数维持 all,因为这是 Reddit 项目帖,基准表被截断,缺少复现细节,正文没披露完整对比数据。
一句话点评
BeeLlama v0.2.0 在单张 RTX 3090 上把 Qwen 3.6 27B 的生成速度拉到 164 tok/s,比基线快 4.4 倍;Gemma 4 31B 跑到 177.8 tok/s,提速近 5 倍。提示词处理速度几乎没掉,说明加速主要靠解码阶段,对长上下文场景友好。不过正文只贴了部分跑分表,Gemma 4 的完整数据没披露,实测条件(精度、上下文长度、batch size...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
17:25
21d ago
AI HOT 精选· aihot-apiZH17:25 · 05·22
Warp 终端现在能直接调 OpenRouter 的模型了
Warp 这个终端工具接入了 OpenRouter,工程师演示了怎么连 DeepSeek。正文只给了文档链接,没提价格和具体上线时间。
#Agent#Tools#OpenRouter#Warp
精选理由
这是一个小型的开发者工具集成。正文只给了文档链接,没有披露定价、模型覆盖范围或 Warp 具体能力变化,所以分数维持在 60–71 区间。
一句话点评
Warp终端现在能直接调OpenRouter的模型了,包括DeepSeek。对开发者来说,等于少装一个插件,在命令行里就能切换模型。但正文只给了文档链接,没提价格、延迟和具体上线时间,实际体验和成本未知。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
17:17
21d ago
The Verge · AI· rssEN17:17 · 05·22
别硬推 Grok 了,美国政府几乎不用它
路透社查了 400 多个美国政府 AI 使用案例,其中提到 Grok 或 xAI 的只有 3 个,而且都是写文档、管社交媒体这类基础活。正文没披露具体采购金额或用户数,但光看这个渗透率,Grok 在政府市场基本没存在感。Musk 一边把它吹成史上最大 IPO 的核心,一边实际落地数据却很骨感。
#Agent#Elon Musk#xAI#Reuters
精选理由
核心信息是路透社的硬数字:400 多个案例里 Grok 只出现 3 次,说明政府市场渗透率极低。但这是媒体评论,不是模型发布或政策变动,所以分数压在 60–71 区间。正文没披露那 3 个案例的具体部门或采购金额,信息缺口留着了。
一句话点评
路透社查了400多个美国政府AI使用案例,提到Grok或xAI的只有3个,还都是写文档、管社交媒体这类基础活。正文没披露具体采购金额或用户数,但光看这个渗透率,Grok在政府市场基本没存在感。Musk一边把它吹成史上最大IPO的核心,一边实际落地数据却很骨感。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:03
21d ago
AI HOT 精选· aihot-apiZH17:03 · 05·22
Perplexity 开源了供应链安全扫描器 Bumblebee
Perplexity 今天开源了一个叫 Bumblebee 的工具,专门扫描 macOS 和 Linux 开发者机器上的高风险软件包、扩展和 AI 工具配置。它是只读的,不会改你系统。亮点是连上他们的 Computer 平台后,一旦有新的供应链风险出现,可以自动触发更深的扫描。目前只支持 macOS 和 Linux,Windows 用户暂时用不了。代码...
#Tools#Perplexity#Open source#Product update
精选理由
HKR 三项都过:Perplexity 出安全工具出乎意料,扫描范围具体(包、扩展、AI 配置),供应链安全焦虑真实。但原文只是一条简短社交更新,没披露规则集、误报率、集成方式或采用数据,所以分数压在 60–71 区间。
一句话点评
Perplexity 开源了 Bumblebee,一个只读扫描器,专查 macOS/Linux 开发者机器上的高危包、扩展和 AI 工具配置。亮点是连上他们的 Computer 平台后,新风险出现能自动触发深度扫描。目前只支持 macOS 和 Linux,Windows 用户暂时用不了。 短评:开源供应链扫描工具,只读不写系统,连平台能自动触发深度扫描。但只支持 macOS/Linux,W...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:41
21d ago
r/LocalLLaMA· rssEN16:41 · 05·22
用 DeepSeek 和 65MB 模型在浏览器里检测提示注入,F1 达 99%
Reddit 用户 Everlier 用 ml-intern 和 DeepSeek v4 Flash 训练了一个 DistilBERT 分类器,专门检测提示注入攻击。模型转成 ONNX int8 后只有 65MB,能在浏览器里通过 Transformers.js v3 跑推理,F1 分数宣称达到 99%。不过作者自己提醒,训练和测试用的数据都是合成生成...
#Agent#Safety#Inference-opt#DeepSeek
精选理由
HKR三项都达标,但这是Reddit上的个人实验,99% F1背后的数据集和外部验证都没披露。具体模型大小和浏览器运行条件让这个方案有实用价值,但还不到专题推荐的程度。
一句话点评
一个 Reddit 用户用 DeepSeek v4 Flash 合成数据,训练了一个 65MB 的提示注入检测模型,宣称 F1 达 99%,还能在浏览器里跑。关键问题是训练和测试数据都是合成生成的,可能太像,真实场景效果要打折。正文没披露合成数据的具体分布和多样性,也没提对抗性测试结果。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:41
21d ago
AI HOT 精选· aihot-apiZH16:41 · 05·22
Luma Agents 上线 Seedance 2.0,一键生成电影级画面
Luma Agents 推出了 Seedance 2.0,主打人像、风景、科幻、奇幻四种风格,声称能一键生成电影级画面。正文没披露模型参数、分辨率、生成速度或价格,所以实际效果和可用性还不清楚。如果你对 AI 视频生成感兴趣,可以点链接试试,但先别太激动。
#Agent#Multimodal#Vision#Luma Labs
精选理由
H/K 通过,因为 Seedance 2.0 集成和场景覆盖算新事实;但正文没提价格、分辨率、生成时长和基准对比,属于常规小版本更新,从业者参考价值有限。
一句话点评
Luma Agents 上线了 Seedance 2.0,主打四种风格一键生成电影级画面。但正文没披露分辨率、生成速度或价格,实际效果和可用性未知。如果你对 AI 视频生成感兴趣可以试试,但先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
16:19
21d ago
Hacker News 首页· rssEN16:19 · 05·22
儿子用AI把老爸的法务会计工作自动化了62%
作者是12年经验的软件工程师,他老爸是法务会计(查欺诈、离婚藏钱那种)。他们拆了老爸15个旧案(1084小时、34.5万美元收费),算出62%的工作量可以自动化。大头是文档录入(占26%工时,90%可自动)——以前两周的活压缩到几小时,就能同时接10个案而不是3个。他们做了个叫CaseTrail的产品:先让AI逐页分类PDF、识别不同银行的流水单(这块...
#Tools#Hacker News#Product update
精选理由
H和R通过:标题钩子强,且切中职业自动化焦虑。K不通过:任务拆解、系统机制、可验证结果均未披露,信息不足。
一句话点评
一个软件工程师帮做法务会计的老爸拆了15个旧案,算出62%工作量可自动化。大头是文档录入(占26%工时,90%可自动),以前两周的活压缩到几小时,就能同时接10个案而不是3个。他们做了个叫CaseTrail的产品,让AI逐页分类PDF、识别不同银行流水单,还能按自然语言指令(比如“找离婚案隐藏资产”)自动跑分析并标记风险。上个月真在离婚案里几分钟就揪出一笔异常税务付款。 短评:数字扎实,场...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
16:17
21d ago
AI HOT 精选· aihot-apiZH16:17 · 05·22
Suno AI 做的《波多黎各》成夏日神曲,被美国早间节目 GMA 推荐
Suno 官方发帖说,今年夏天一首叫《波多黎各》的歌是用他们的 AI 工具做的,还上了美国早间节目 GMA 的推荐。帖子没透露播放量、创作者是谁、以及具体怎么生成的。
#Audio#Suno#GMA#Product update
精选理由
硬排除——纯营销:Suno 自己发帖说《Puerto Rico》用了它的工具、上了 GMA,但播放量、创作者、制作流程一概没披露,也没有第三方验证。
一句话点评
Suno 官方说《波多黎各》是AI做的,还上了GMA早间节目。但没提播放量、创作者和生成细节,更像品牌宣传。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H1·K0·R0
16:10
21d ago
AI HOT 精选· aihot-apiZH16:10 · 05·22
GitHub 连续第三年拿下 Gartner 企业级 AI 编程代理领导者象限
Gartner 把 GitHub 放在企业级 AI 编程代理的领导者象限,这是第三年。正文没披露具体的评估标准、竞争对手位置,也没说 Copilot 的企业采用数据。所以这个排名更多是品牌背书,不能直接当采购决策依据。
#Agent#Code#GitHub#Gartner
精选理由
触发硬排除规则5:这是一篇厂商获奖公告,核心事实是 GitHub 被 Gartner 认可,但正文没披露评估方法、竞品排名或 Copilot 采用数据。HKR 三项均不满足,因此排除。
一句话点评
GitHub Copilot 连续第三年被 Gartner 评为企业级 AI 编程代理领导者。但正文没披露评估标准、竞品位置和企业采用数据,这个排名更像品牌背书,不能直接当采购依据。短评:Gartner 连续三年把 GitHub 放领导者象限,但没给评分细节,当品牌新闻看就好。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K0·R0
16:10
21d ago
r/LocalLLaMA· rssEN16:10 · 05·22
ByteShape 量化让 35B 模型在 6GB 笔记本上跑出 33 tok/s,比 Unsloth 快 30%
ByteShape 发布了一种新的量化方法,在 6GB 显存的 RTX 3060 笔记本上运行 Qwen3.6-35B-A3B 模型,生成速度达到 33.1 tok/s,比 Unsloth 的 UD-IQ4_XS 量化快 30%。不过预填充速度是 564 tok/s,反而慢了 4%。测试基于 llama.cpp,上下文长度 65,536,部分计算交给了...
#Inference-opt#Code#ByteShape#Qwen
精选理由
一条Reddit基准测试,亮点是35B-A3B在6GB笔记本上输出速度33.1 tok/s,比Unsloth快30%,对本地推理用户有吸引力。但PP(首token延迟)反而慢了4%,且只测了单卡单模型,没有多轮对话或长上下文数据。正文没披露量化精度损失或实际任务效果,所以分数卡在60-71区间。
一句话点评
ByteShape 新量化方法在 6GB 显存笔记本上跑 35B 模型,生成速度 33.1 tok/s,比 Unsloth 快 30%,但预填充慢了 4%。实测基于 llama.cpp,上下文 65K,部分计算交给 CPU。注意这是单点测试,没披露其他模型或硬件下的表现,且预填充慢可能影响首字延迟。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:06
21d ago
彭博科技· rssEN16:06 · 05·22
渣打CEO称AI会让部分人变成“低价值人类”,道歉后工会仍不满
渣打银行CEO Bill Winters在一次发言中称AI可能导致部分员工沦为“低价值人类”,引发工会强烈抗议。他随后道歉,但全球最大工会联合会之一认为道歉不够,未能安抚劳工组织。正文未披露他原话的完整上下文、道歉的具体措辞,以及可能受影响的员工规模。
#Bill Winters#Commentary
精选理由
彭博信源加上CEO在AI与劳工问题上的失言,满足了HKR-H和HKR-R。HKR-K弱是因为帖子没给出原话、道歉文本、员工规模或具体政策跟进。
一句话点评
渣打CEO说AI可能让部分员工变'低价值人类',工会炸了,道歉也没用。正文没披露原话完整上下文、道歉具体措辞和受影响员工规模,信息缺口大。这事更多是公关危机,不是技术新闻。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
15:35
21d ago
r/LocalLLaMA· rssEN15:35 · 05·22
Qwen3-Coder 量化横评:UD-Q5_K_M 在 55GB 模型上保住 94% 的 top-1 准确率
Reddit 用户 alphatrad 用 3 块 Radeon Pro 9700 跑了一轮 Qwen3-Coder-Next 的量化对比测试。测试数据是 wikitext-2,切了 583 段,每段 512 token。结果里表现最好的 UD-Q5_K_M 量化版(55.2 GB)跟原版比,top-1 一致率 94%,平均 KL 散度 0.0217,...
#Code#Inference-opt#Benchmarking#Qwen
精选理由
Reddit 用户 alphatrad 用 3 张 R9700 PRO 在 llama.cpp Vulkan 上测了 Qwen3-Coder-Next 的量化版本,UD-Q5_K_M 在 wikitext-2 的 583 个块、上下文 512 下 top-1 达到 94.0%。测试条件偏窄——只用了 wikitext-2 一个数据集、上下文也短,所以分数压在 70 档,没到推荐位。信息够用:硬件、框架、数据集、准确率都给了,但没披露推理速度、显存占用或对比其他量化档位的完整表格,想自己复现的话得补这些。
一句话点评
Reddit 用户用 3 块 Radeon Pro 9700 测了 Qwen3-Coder-Next 的量化版,UD-Q5_K_M 跟原版 top-1 一致率 94%,KL 散度平均 0.0217,文件 55.2 GB。数据来自 wikitext-2,只切了 583 段、每段 512 token,测试规模偏小,结论参考价值有限。正文被屏蔽,没披露具体推理速度或显存占用,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
15:27
21d ago
彭博科技· rssEN15:27 · 05·22
理财App十年内会消失?AI助手替你管钱,你连界面都不用打开
Atomic Invest CEO David Dindi 在彭博视频里说,投资类App可能十年内就没了——AI助手会直接替你管组合,你连界面都不用打开。这个判断挺狠,但正文没披露具体产品怎么跑(是让模型直接下单还是只给建议),也没说监管怎么看待AI代客理财,更没有用户接受度的数据。所以这点先别太激动,方向有意思,但验证还很弱。
#Agent#Atomic Invest#David Dindi#Bloomberg
精选理由
Bloomberg采访里Atomic Invest CEO David Dindi放了个10年预言:投资App会被AI助手取代。观点够猛,但正文没披露任何产品、数据或实现机制,属于纯评论,所以落在60–71分档。
一句话点评
Atomic Invest CEO 在彭博视频里说,投资类App十年内会消失——AI助手直接替你管组合,连界面都不用打开。方向有意思,但正文没披露产品怎么跑(模型直接下单还是只给建议),也没说监管态度和用户接受度数据。这点先别太激动,验证还很弱。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:17
21d ago
彭博科技· rssEN15:17 · 05·22
Axon 总裁谈 AI 公共安全:无人机、企业安防与警务软件
Axon 总裁 Josh Isner 在 Bloomberg 访谈中透露,公司 AI 战略覆盖无人机、企业安防和公共安全软件三大块。正文没披露具体收入目标、产品参数、部署规模或上线时间表,所以目前只能听个方向,没法评估实际落地深度。
#Agent#Vision#Axon#Josh Isner
精选理由
HKR-R通过,但HKR-H太泛,HKR-K缺数字和机制。Bloomberg采访有来源价值,但事实只停在Axon的策略框架上,属于低价值行业报道区间。
一句话点评
Axon总裁在Bloomberg访谈里聊了AI安防三大块:无人机、企业安防、公共安全软件。但全文没披露任何收入目标、产品参数、部署规模或上线时间表,目前只能听个方向,没法评估实际落地深度。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
15:08
21d ago
r/LocalLLaMA· rssEN15:08 · 05·22
Qwen3.6 跑 MTP 反而变差,显存还涨了
一位用户在双卡 16GB+12GB 的本地环境里测了 Qwen3.6 27B 和 35B A3B,用 GLM 5.1 当裁判,给了一个模糊的 React 应用任务。结果开了 MTP(多 token 预测)后显存占用更高,生成质量反而下降;而 ngram-mod 没有出现这种退化。正文没披露具体测试次数和置信区间,所以这点先别太激动,但至少说明在显存吃紧...
#Inference-opt#Code#Benchmarking#Qwen
精选理由
一条 Reddit 帖子,有人用 GLM 5.1 测了 Qwen3.6 27B 和 35B A3B 两个模型,发现 MTP 在双 GPU 16GB+12GB 配置下不仅多占显存,还损伤效果,而 ngram-mod 没有类似退化。这个反直觉结果对本地跑模型的人是个意外发现,但帖子没交代样本量、具体任务和评测细节,所以只能当线索看,不能当结论。
一句话点评
有人在双卡16GB+12GB本地跑Qwen3.6 27B和35B A3B,发现开MTP(多token预测)反而显存更高、生成质量下降,而ngram-mod没这问题。测试次数和置信区间没披露,结论先打折。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:00
21d ago
Product Hunt · AI· rssEN15:00 · 05·22
Orchestria:AI 音乐引擎,能单独改鼓点或贝斯,不用整首重来
Orchestria 把 AI 生成的音乐拆成鼓、贝斯、旋律等独立音轨(stem),你可以用自然语言单独改某个乐器,比如“让贝斯更拨弦一点”,而不会破坏整体混音。输出是 24-bit / 44.1kHz 的 WAV 文件,音质达到录音室级别,且 100% 免版税。正文没披露用了什么模型、定价多少、什么时候开放,也没说生成一首歌要多久、算力成本高不高。目...
#Audio#Orchestria#Product update
精选理由
K勉强过关:颗粒级音轨控制是个可测试的功能点。H和R都不达标,整篇读起来像一张信息很薄的Product Hunt卡片——没模型、没定价、没上线条件,所以归入低价值浏览层级。
一句话点评
Orchestria 把 AI 生成的音乐拆成鼓、贝斯等独立音轨,你可以用自然语言单独改某个乐器,比如“让贝斯更拨弦一点”,不会破坏整体混音。输出是 24-bit / 44.1kHz 的 WAV,音质达到录音室级别,且 100% 免版税。但正文没披露用了什么模型、定价多少、什么时候开放,也没说生成一首歌要多久、算力成本高不高。目前只是个产品页,技术细节和可用性都是盲区,想用还得等。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
14:36
21d ago
● P1AI HOT 精选· aihot-apiZH14:36 · 05·22
BitCPM-CANN开源发布,华为昇腾NPU原生训练1.58比特大模型
ModelBest、清华和OpenBMB搞了个BitCPM-CANN,从0.5B到8B都有,全程用华为昇腾910B NPU训练,没走英伟达路线。1.58比特三元量化意味着每个权重只取三种值,内存比BF16省了约6倍,能塞进手机、电脑和车载设备里跑。基准测试成绩保住了全精度模型的95-97%,这点挺实在。我会先打个折:正文没披露具体推理延迟和功耗数据,也...
#Inference-opt#Benchmarking#ModelBest#Tsinghua University
精选理由
HKR三项都站得住:昇腾910B全栈训练1.58比特开源模型这个角度够新,数据也扎实。没给P1是因为目前只有发布事实,缺少独立复现或实际落地效果的佐证,所以先放在featured。
一句话点评
面壁智能在华为昇腾 NPU 上原生训练并开源了 1.58-bit 大模型,显存省了约 6 倍,能力保留率 90% 以上,但正文没给具体评测基准和延迟数据。
锐评
这条消息最值得看的是“全栈国产算力跑通了极低比特训练”。BitCPM-CANN 从量化算子到训练框架全在昇腾 910B 上完成,意味着以后在华为卡上做 1.58-bit 模型有了公共基础设施,不用每家从头搭一遍。四个尺寸(0.5B 到 8B)都开源了,官方说推理显存比 BF16 省约 6 倍,能力保留率在 90% 到 97.2% 之间,8B 模型能塞进旗舰手机跑。 但先别太激动。文章没交代这个“能力保留率”是在哪些基准上测的,也没提推理延迟和吞吐。极低比特模型最怕的是生成质量在长文本或复杂任务上掉得厉害,光看一个百分比不够。另外,训练成本、与同尺寸全精度模型在真实业务场景下的对比也都没给。如果后续能补上这些,才能判断它是不是真能当端侧主力模型用。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
14:30
21d ago
The Verge · AI· rssEN14:30 · 05·22
英联邦短篇小说奖得主被指用AI写稿,文学圈还没准备好
《The Verge》报道,今年英联邦短篇小说奖的一篇获奖作品《The Serpent in the Grove》被怀疑是AI写的。作者Jamir Nazir的文章里出现了混合隐喻、排比句和“三点式”列举——这些都是大语言模型生成文本的常见特征。Granta杂志从2012年起刊登该奖的区域得主,但这次没有公布任何验证证据,只靠文本特征判断。正文没披露作...
#The Verge#Granta#Jamir Nazir#Commentary
精选理由
H和R过关,但K很弱:文章只提供了怀疑和Granta的背景,没有可验证的证据、检测方法或市场数据。这是文化信号,不是模型、产品或政策故事。
一句话点评
英联邦短篇小说奖一篇获奖作品被指AI生成,特征包括混合隐喻、排比和三点式列举。Granta杂志仅凭文本特征判断,未公布验证证据。正文没披露作者回应或检测工具。判断靠风格而非证据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
14:16
21d ago
Product Hunt · AI· rssEN14:16 · 05·22
Cohere 发布 Command A+:开源企业模型,主打跑 Agent 效率
Cohere 今天在 Product Hunt 上架了 Command A+,号称是自家最快最强的语言模型,开源、面向企业,专门用来跑高绩效的 AI Agent。正文没披露参数量、定价、上下文窗口和具体发布时间,所以性能到底多强、能不能本地跑、成本多少,目前都只能看他们自己说的“最高效率”。不过既然打“开源企业工作马”的标签,推测是想让企业拿它做业务流...
#Cohere#Product Hunt#Product update
精选理由
Cohere 给这条消息带来一定权重,但正文只提了 Command A+ 及其企业定位;参数、价格、上下文窗口和评测结果都没披露。HKR 只有 K 通过,所以属于低价值的产品更新。
一句话点评
Cohere 在 Product Hunt 上架了 Command A+,号称自家最快最强的开源模型,专为企业跑 AI Agent 设计。但正文没披露参数量、定价、上下文窗口和发布时间,性能多强、能不能本地跑、成本多少,目前只能看他们自己说的“最高效率”。打“开源企业工作马”标签,推测是想让企业拿它做业务流,但缺关键数字,建议等第三方跑分和定价出来再评估。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
14:11
21d ago
彭博科技· rssEN14:11 · 05·22
英国IT分销商Softcat上调利润预期,股价涨13%,自称AI赢家
Softcat上调了全年利润预期,股价当天跳涨13%。公司把自己重新定位成AI受益者,但正文没披露具体上调了多少、AI业务怎么赚钱。投资者态度在转,这点先别太激动——目前只知道市场信了,但不知道信的是什么。
#Softcat#Commentary
精选理由
HKR-H勉强过关,因为AI股票叙事反转有话题性;但HKR-K/R都不及格:没给指引上调幅度、财务指标或AI收入机制。属于低价值浏览项,不推荐重点展示。
一句话点评
Softcat 上调全年利润预期,股价当天涨 13%。公司把自己包装成 AI 受益者,但正文没披露具体上调了多少、AI 业务怎么赚钱。投资者态度在转,这点先别太激动——目前只知道市场信了,但不知道信的是什么。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
13:43
22d ago
r/LocalLLaMA· rssEN13:43 · 05·22
Qwen 3.6 写德语文档翻车,本地模型处理非英语任务还差点意思
一位用户用 Whisper 转录了一小时的心理治疗录音,然后让本地模型生成德语病历文档。Qwen 3.6 的 27B 和 35B 版本以及 Gemma 41B 都出现了用词不自然、重点信息筛选能力弱的问题。正文没披露具体用了多少条样本、提示词怎么写、跑在什么硬件上,也没给量化评估指标。结论是:本地模型处理德语这类非英语的垂直场景任务,质量还不太够用。
#Audio#Fine-tuning#Agent#Qwen
精选理由
HKR-H 和 HKR-R 靠一个具体的本地 LLM 德语翻车案例通过;HKR-K 不通过,因为帖子没有可复现的提示词、输出、样本量或评分指标。
一句话点评
一位用户用 Whisper 转录一小时心理治疗录音,让本地模型写德语病历。Qwen 3.6 的 27B/35B 和 Gemma 41B 都出现用词不自然、抓不住重点的问题。正文没披露用了多少样本、提示词怎么写、跑在什么硬件上,也没给量化评估。结论:本地模型处理德语这类非英语垂直场景,质量还不太够用。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
13:28
22d ago
Product Hunt · AI· rssEN13:28 · 05·22
Vibedock:菜单栏一键开关 Claude Code 的 MCP 服务器
Vibedock 是一个 macOS 菜单栏工具,让你一键开关 Claude Code 的 MCP 服务器。每个 MCP 服务器都会在每次对话时把它的工具定义塞进上下文窗口,不管你这轮用不用。Vibedock 帮你按需开关,省 token 也省上下文空间。它会自动杀掉并重启 Claude 会话让改动生效。目前只支持 macOS,免费,正文没披露是否支持...
#Code#Tools#Vibedock#Claude
精选理由
一个小工具发布,绑定 Claude Code 和 MCP 工作流,所以 HKR-R 成立,HKR-H 和 HKR-K 都弱。平台、价格、版本、配置方式全没披露,只能算普通产品更新。
一句话点评
Claude Code 每轮对话都会把所有 MCP 工具定义塞进上下文,不管用不用。Vibedock 是个 macOS 菜单栏工具,让你一键开关 MCP 服务器,省 token 也省上下文空间。免费,但只支持 macOS,正文没披露是否支持 Windows/Linux,也没说配置机制。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K0·R1
13:07
22d ago
Hacker News 首页· rssEN13:07 · 05·22
Sam Altman 赢了官司,但我们都输了
《纽约客》评论说,Altman 赢了 Musk 的诉讼,但这场官司不像 Elizabeth Holmes 或 SBF 案那样让人看到恶有恶报——两边都是硅谷大佬,谁赢都谈不上正义。正文没有披露具体诉讼请求、判决细节、审理法院或案件时间线。
#Sam Altman#Elon Musk#OpenAI#Policy
精选理由
标题有钩子,但正文只给了 HN 元数据,没写任何案件细节、判决或法院,信息缺口太大,没法判断实际价值。
一句话点评
《纽约客》评论Altman赢了Musk的官司,但说两边都是硅谷大佬,谁赢都不代表正义。正文没披露具体诉讼请求、判决细节或法院信息,更像一篇立场评论而非案件报道。想了解法律影响的话,信息缺口很大。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
12:34
22d ago
r/LocalLLaMA· rssEN12:34 · 05·22
SupraLabs发布Supra-50M轻量级语言模型
SupraLabs 放出了 Supra-50M,一个 50M 参数的 Llama 风格解码器模型,用 20B 的 fineweb-edu 数据训练。Base 和 Instruct 两个版本都已上传 Hugging Face。50M 参数意味着它可以在普通 CPU 或低端 GPU 上跑推理,适合资源受限的场景。20B tokens 的训练量不算大,但 f...
#Reasoning#Code#Benchmarking#SupraLabs
精选理由
HKR-K和HKR-R通过:帖子给出了具体的模型大小和训练数据量,对本地部署有吸引力。HKR-H较弱:只是Reddit上一条发布帖,没有跑分、许可证或实际用例证明。
一句话点评
SupraLabs 刚放出一个 50M 参数的小模型,用 20B tokens 的 fineweb-edu 数据训练。50M 意味着普通 CPU 或低端显卡就能跑,适合嵌入式或边缘设备。20B tokens 训练量不大,但 fineweb-edu 是高质量教育数据,效果可能比同尺寸模型好一点。Base 和 Instruct 两个版本已上传 Hugging Face。短评:小模型赛道又添一员,...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
12:00
22d ago
AI HOT 精选· aihot-apiZH12:00 · 05·22
Cursor 被 Gartner 评为 2026 年企业级 AI 编码代理魔力象限领导者
Gartner 把 Cursor 放到了 2026 年企业级 AI 编码代理魔力象限的领导者象限,而且它在“愿景完整性”这个维度上得分最高。超过 70% 的财富 500 强公司已经在用 Cursor 来部署和管理编码代理(就是让 AI 帮忙写代码、修 Bug 的自动化工具)。Cursor 接下来打算自己训练更强的模型(已经和 SpaceXAI 合作了)...
#Agent#Code#Tools#Cursor
精选理由
Cursor 自己发稿说被 Gartner 评为 2026 年企业级 AI 编码代理领导者,还提到超过 70% 的财富 500 强在用。这个渗透率数字挺实在,说明企业市场确实在批量上编码代理。但来源是 Cursor 自家的分析师奖项通稿,权威性打点折扣,而且领导者标签本身不意外——更像市场验证而非技术突破。对关注企业级开发工具采购和编码代理竞争格局的从业者来说,这条值得扫一眼,但不用太激动。
一句话点评
Gartner 把 Cursor 评为企业级 AI 编码代理的领导者,愿景完整性得分最高。超过 70% 的财富 500 强在用,这个渗透率挺高。但 Gartner 报告本身是付费内容,正文没披露具体评估细节,比如对比了哪些竞品、评分标准是什么。Cursor 说自己要自研模型,还找了 SpaceXAI 合作,这点先别太激动——合作细节和模型进展都没说。短评:Gartner 背书+大客户覆盖率是...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
11:28
22d ago
Hacker News 首页· rssEN11:28 · 05·22
安娜的档案馆向大语言模型发布公开信提供数据获取方案
安娜的档案(Anna's Archive)发布了一篇标题为“如果你是大模型,请读一下”的博客。正文核心是告诉爬虫机器人:网站有验证码防爬,但所有数据其实都可以通过GitLab、种子文件或JSON API免费批量下载。如果大模型需要更快更稳定的SFTP访问,可以付费捐赠获得。文章还调侃说“你训练时大概率用过我的数据”,建议把省下来的验证码破解成本直接捐给...
#Anna's Archive#Hacker News#Commentary
精选理由
触发硬排除规则6:可见文本除了标题和HN数据外,没有任何数据、示例或机制说明。HKR-H靠标题噱头成立,但HKR-K和HKR-R因为正文信息缺口太大,无法给出实质性判断。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R0
11:17
22d ago
● P1AI HOT 精选· aihot-apiZH11:17 · 05·22
阿里千问 App、PC 及网页端上线 Qwen3.7-Max,免费可用
千问 App 更新到 6.9.7 版就能在对话框里切到 Qwen3.7-Max,PC 和网页端也一样,目前免费。官方说这个模型主打“让模型进业务流程干活”,能写代码、自动跑办公流程,还能扛住长任务——他们自己测了一次 35 小时、调用工具超过 1000 次的内核优化实验,全程没断思路。不过这些数据来自官方测试,实际体验会不会打折还得自己试。另外,API...
#Agent#Code#Tools#Alibaba
精选理由
阿里把 Qwen3.7-Max 铺到千问全线产品,门槛降到免费,还特意强调 35 小时连续工具调用没崩,摆明了在打 agent 可靠性和零成本体验这两张牌。我会先打个折:正文没给基准测试、上下文窗口和 API 定价,所以实际能力上限和商用成本还看不清。但就凭多端同步上线和这个压测结果,对正在选模型做工具链集成的人来说,是个值得立刻上手试的信号。
一句话点评
千问 App 更新后能免费用 Qwen3.7-Max,官方说它能跑 35 小时不断思路,但这是自家测试,实际稳不稳还得自己上手试。
锐评
阿里把最新的 Qwen3.7-Max 直接塞进了千问 App、PC 和网页端,更新到 6.9.7 版就能免费用。这个模型的核心卖点是“让模型进业务流程干活”,也就是所谓的智能体能力。官方给了一个很具体的数字:在一次内核优化实验里,它自主跑了 35 个小时,调用了超过 1000 次工具,全程没断思路。这个数字如果真实,说明它在处理长链条、多步骤任务时的稳定性确实不错,至少比动不动就忘掉上下文的模型强。 但这里有个关键信息缺口:这个 35 小时的测试是官方自己跑的,任务场景、失败重试次数、人工干预比例都没披露。所以这个数字更像一个上限参考,实际用起来,比如让它自动处理几十封邮件或写一个复杂项目,效果可能会打折。另外,文章提到它能跨框架部署,在 Claude Code 等工具里也能用,这对开发者是个好消息,不用被绑在单一工具上。 目前 API 还没上线,只能通过官方客户端体验。想评估它到底能不能扛住真实业务,最好等 API 开放后,用自己的任务跑一遍,重点关注它在第 20 步、第 50 步时的逻辑连贯性和错误恢复能力。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
10:57
22d ago
AI HOT 精选· aihot-apiZH10:57 · 05·22
PixVerse App 上线图像生成,手机端也能文生图
PixVerse 在自家 App 里加了图像生成功能,输入提示词或传参考图就能在手机上出图。5月24日到31日每人免费3次,之后要花钱。转发关注还能抽300积分,限72小时。功能本身不新鲜,但说明视频生成工具开始往多模态走。
#Multimodal#Vision#PixVerse#Product update
精选理由
PixVerse App 新增图像生成功能,支持文生图和参考图生图,5月24-31日每人免费3次。属于小版本更新,有具体使用细节,所以 K 通过、归入 all。H 和 R 不通过,因为没提生成质量、定价、分发规模或竞争对比。
一句话点评
PixVerse 在自家 App 里塞了个文生图/图生图功能,手机端直接出图。5月24-31日每人免费3次,之后收费。功能本身不新鲜,但说明视频生成工具开始往多模态走,先抢个入口。短评:视频工具加个图生图,功能不新但补模态,免费3次算尝鲜,后续收费看留存。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K1·R0
10:44
22d ago
r/LocalLLaMA· rssEN10:44 · 05·22
GGUF 模型突然掉速?先检查文件是否损坏
Reddit 用户 yeah-ok 发现两个 GGUF 模型从 20+ token/s 掉到 5 token/s,用 sha256sum 一查是文件损坏了,重新下载就恢复。推测是手动嵌入 MTP 层时搞坏了文件。如果你本地跑模型突然变慢,先跑个校验,别急着调参数。
#Inference-opt#Qwen#Unsloth#Incident
精选理由
一条本地模型跑飞后的排查记录:Reddit 用户 yeah-ok 发现 Qwen 的 GGUF 文件下载损坏,导致推理速度从 20+ tg/s 暴跌到 5 tg/s,用 sha256sum 校验后重下恢复。正文没披露具体是哪个 Qwen 版本或量化格式,也没说损坏原因(可能是下载中断或存储介质问题)。对跑本地模型的人来说,这个排查路径(先查文件完整性)有参考价值,但只是一个用户案例,不是系统性漏洞或优化方案,所以重要性中等,适合所有关注本地推理的读者看一眼。
一句话点评
本地跑 GGUF 突然从 20+ token/s 掉到 5 token/s,别急着调参数——先跑 sha256sum 校验文件完整性。Reddit 用户 yeah-ok 发现是手动嵌入 MTP 层时搞坏了文件,重下就恢复。正文没披露具体模型和损坏机制,但这条提醒对自部署用户很实用:文件损坏比参数调错更隐蔽,校验成本几乎为零。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
10:38
22d ago
Hacker News 首页· rssEN10:38 · 05·22
Antigravity 2.0 在 OpenSCAD 建筑 3D 模型评测中排第一
ModelRift 团队用万神殿(Pantheon)的参考图,让六个模型写 OpenSCAD 代码生成 3D 建筑。评测结果:Antigravity 2.0 综合最好,Cursor Composer 跑得最快但效果最差。OpenSCAD 的好处是代码即几何,模型可以直接说“绕半径排 28 根柱子”,比让模型操作 3D 软件更直接。不过正文没披露测试集大...
#Benchmarking#Code#Antigravity 2.0#OpenSCAD
精选理由
H 钩子成立,因为 3D CAD/代码评测少见。K 不成立,因为分数、测试条件、模型列表都没披露,属于低价值榜单。
一句话点评
Antigravity 2.0 在 OpenSCAD 写 3D 建筑评测里综合第一,Cursor Composer 最快但效果垫底。评测用万神殿参考图,让模型写代码生成柱廊、穹顶等结构,比让模型操作 3D 软件更直接。但正文没披露测试集大小、评分指标和对比模型版本,结果只能当参考。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H1·K0·R0
10:11
22d ago
r/LocalLLaMA· rssEN10:11 · 05·22
Box for Linux:一个跑本地模型的桌面应用,但闭源且只支持 Ubuntu 26.04
开发者发布了 Box 0.1.0 for Linux,一个基于 GTK4/libadwaita 的桌面应用,专门跑 Gemma 4 E2B/E4B 的 LiteRT-LM 模型。首次运行要下载约 2.59GB 的模型文件,支持语音、摄像头实时视觉、文档问答、网页搜索、文件系统访问和记忆功能,还内置了可选的 agent 工具(让模型进业务流程干活)。但注...
#Agent#Vision#Audio#Box
精选理由
一个开发者工具的小版本发布,但离线跑 Gemma 4 这个点对本地部署党有吸引力。信息够具体(版本、系统、模型大小),不过正文没披露推理速度或硬件要求,这点先别太激动。影响面窄,给 68 分合理。
一句话点评
一个 Linux 桌面应用,专跑 Gemma 4 的 LiteRT-LM 模型,首次下载约 2.59GB。支持语音、摄像头实时视觉、文档问答、网页搜索和记忆,还内置了可选的 agent 工具。但正文没披露模型跑在什么硬件上、推理速度如何,也没说是否开源。如果真能在普通笔记本上流畅跑视觉和 agent,那挺实用,但这点先别太激动——等实测。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:51
22d ago
彭博科技· rssEN08:51 · 05·22
AI动画长片《Critterz》因OpenAI关停Sora错过戛纳首映,正在找新AI伙伴
一部全长AI动画《Critterz》原本计划在戛纳电影节首映,展示OpenAI视频生成工具Sora的潜力,结果OpenAI把Sora关了,片子没赶上首映。团队现在得重新找一家AI公司合作。正文没披露Sora关停的具体原因,也没说新伙伴找得怎么样了。
#Multimodal#Vision#OpenAI#Sora
精选理由
HKR三项都成立:Sora、戛纳、合作方断联,构成一个具体的供应商风险故事。来源是彭博社,但事件本身是电影制作受挫,不是OpenAI的重大产品或政策变动,所以重要性中等偏上,不调分。
一句话点评
一部全长AI动画《Critterz》原计划在戛纳首映,结果OpenAI把Sora关了,片子没赶上。团队现在得重新找AI公司合作。正文没披露Sora关停的具体原因,也没说新伙伴找得怎么样了。这事说明:依赖单一AI工具做长内容风险很高,平台一关项目就卡住。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:49
22d ago
r/LocalLLaMA· rssEN08:49 · 05·22
ztok:一个用 Zig 写的快几倍的分词器,能直接加载 tiktoken / HF / SentencePiece
FaustAg 开源了 ztok,一个用 Zig 写的分词库,能直接加载 .tiktoken、HuggingFace tokenizer.json、SentencePiece .model、TokenMonster 和 Mistral Tekken 这些格式。实测在 EPYC 24核48线程机器上,单线程比 tiktoken 快约2倍,批量处理快3.8...
#Tools#RAG#Code#ztok
精选理由
HKR 三项都成立:速度声称、基准数字、本地推理成本角度都很具体。不过这只是个关于小众工程库的单帖,所以分数没到 72 的精选线。
一句话点评
ztok 是一个用 Zig 写的分词库,能直接加载 tiktoken、HuggingFace、SentencePiece 等主流格式。实测在 EPYC 24核48线程机器上,单线程比 tiktoken 快约2倍,批量处理快3.8-5.5倍。还提供了8种语言绑定,通过一个 C ABI 调用。 短评:分词速度翻倍,批量场景更明显,但实测只在 AMD EPYC 上跑过,Intel 和 Apple...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
08:45
22d ago
量子位 · 公众号· rssZH08:45 · 05·22
LeCun 砸10亿美元押注的世界模型,这家中国视觉团队早就开始做了
LeCun 最近高调押注的“潜在空间世界模型”,北京时识科技(Shiqi Future)说自己已经布局了。5月15日他们和百度智能云联合发布了 EgoTwin,一个给自动驾驶和机器人用的视觉理解系统。核心卖点是手部3D对齐引擎,号称采集训练数据的效率是主流方案的3.75倍。但正文没披露具体对比对象和测试场景,这个倍数先打个折看。团队之前主要做手势识别和...
#Vision#Robotics#Multimodal#Shiqi Future
精选理由
HKR三项都过,但事实来源是一篇产品稿,3.75倍这个数字没披露测试条件或第三方验证。这条放在中等权重的机器人/视觉更新档位,不到推荐位。
一句话点评
时识科技说自己的手部3D对齐引擎采集训练数据效率是主流方案的3.75倍,但正文没披露对比对象和测试场景,这个倍数先打个折看。团队之前主要做手势识别,这次搭上LeCun的“潜在空间世界模型”概念,实际落地效果还缺第三方验证。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
08:45
22d ago
量子位 · 公众号· rssZH08:45 · 05·22
周鸿祎给虾塘装了个云端办公室:360安全云虾版上线,设备关机任务不中断
360发布了安全云虾云端版和云虾教练,核心卖点是云主机、云存储、云浏览器加1000多个预设专家智能体。文章说设备关机后任务还能继续跑,配置一个自定义写作智能体大约两分钟。但正文没披露云虾教练的具体训练数据来源和效果验证,这点先别太激动。
#Agent#Tools#Memory#360
精选理由
360 这个安全龙虾云端版和龙虾教练,核心卖点是云上跑Agent、关机也能用、两分钟生成一个专属Agent。标题的龙虾梗有点意思,但正文没解释为什么叫龙虾,也没披露定价、模型参数或跟竞品比怎么样。功能点够具体,但缺少成本、性能或生态层面的信息,所以分数压在60-71区间。
一句话点评
360 把云电脑包装成“云虾”,主打设备关机后任务不中断,配了 1000 多个预设智能体,号称两分钟搭一个写作助手。但正文没披露训练数据来源和效果验证,这点先别太激动。如果真能低成本跑长任务,对个人开发者算个便利,但安全性和实际延迟存疑。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
08:10
22d ago
AI HOT 精选· aihot-apiZH08:10 · 05·22
18年老粉与微软GitHub决裂:平台天天崩,代码还被偷,我走了
GitHub 18年老用户、Ghostty终端作者Mitchell Hashimoto公开宣布弃用GitHub,原因是平台频繁宕机,每天把他锁在外面好几个小时,没法正经写代码。他打包所有项目资产走人。这只是一个缩影:GitHub最近被黑客攻破3800多个内部仓库,源代码被挂网叫卖5万美元,起因是一名工程师装了带毒的VS Code插件,凭证被偷。更早前还...
#Code#GitHub#Microsoft#Mitchell Hashimoto
精选理由
H/K/R三项都成立,但这是开发者平台可靠性和安全事件,不是AI模型、智能体、Copilot或AI产品更新。AI RADAR匹配度弱,所以分数压在40以下。
一句话点评
GitHub 18年老用户、Ghostty作者Mitchell Hashimoto因平台频繁宕机(每天被锁几小时)公开弃用,并打包项目走人。更严重的是,黑客攻破3800+内部仓库,源代码被挂网叫卖5万美元,起因是一名工程师装了带毒VS Code插件。微软收购后GitHub并入CoreAI团队、取消CEO职位,管理层动荡。正文未披露GitHub后续修复计划及用户迁移数据。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H1·K1·R1
07:38
22d ago
r/LocalLLaMA· rssEN07:38 · 05·22
柠檬MLX引擎新版本:AMD ROCm跑本地大模型,修了Qwen3/3.5/3.6的bug
lemon-mlx-engine 发布了基于 ROCm 7.13 的新版本,让 AMD 显卡用户也能用 MLX 引擎跑本地大模型。这次更新主要修了 Qwen3、3.5 和 3.6 的 MoE 和密集模型里的一些内核和 bug,但正文没披露跑分数据,所以实际性能提升多少还不清楚。如果你手头有 AMD 卡想试新 ROCm 栈,可以更新看看,但别急着下结论—...
#Inference-opt#Tools#lemon-mlx-engine#ROCm
精选理由
一个小型开源推理引擎更新:HKR-K 有具体的 ROCm/Qwen 修复,HKR-R 切中本地推理 AMD 用户的痛点。信息来源单薄,没有跑分或生态影响,所以停留在常规产品更新区间。
一句话点评
lemon-mlx-engine 新版本集成了 ROCm 7.13,让 AMD 显卡用户也能用 MLX 引擎跑本地大模型。主要修了 Qwen3/3.5/3.6 的 MoE 和密集模型里的内核和 bug,但正文没披露跑分数据,实际性能提升多少还不清楚。如果你手头有 AMD 卡想试新 ROCm 栈,可以更新看看,但别急着下结论——没跑分就是没证据。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
07:34
22d ago
AI HOT 精选· aihot-apiZH07:34 · 05·22
X平台发帖体验太差,开发者用ChatGPT做了个插件救场
一条推文吐槽X平台的产品经理不行,发文章体验很烂。有开发者直接用ChatGPT(通过codex/goal)写了个Markdown转换插件,拖拽文件就能生成X文章格式,开源且提供了谷歌插件版本。正文没披露插件具体安装量或用户反馈,但至少说明原生体验确实有痛点,逼得用户自己动手。
#Code#Tools#X#ChatGPT
精选理由
痛点具体、产物明确、能引起同类开发者共鸣,HKR三项都过。但这是个轻量工具,正文没披露下载量、GitHub星数或实际使用反馈,信息缺口明显,所以分数压在60–71区间。
一句话点评
短评:X发文章体验差到逼用户自己写插件,ChatGPT顺手就搓了一个。 点评:X平台发文章体验烂到用户自己动手写插件,这本身就是个产品事故。开发者用ChatGPT(通过codex/goal)搞了个Markdown转X文章格式的插件,拖拽文件就能用,开源还上了谷歌插件商店。这事说明两点:一是原生编辑器确实拉胯,二是现在用AI搓工具的门槛低到离谱,一个人半天就能补上大厂产品缺口。不过正文没披露...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
06:35
22d ago
Product Hunt · AI· rssEN06:35 · 05·22
Faby:一个住在 Slack 里、自带电脑的虚拟同事
Faby 是一个嵌入 Slack 的 AI 代理,它有自己的电脑、浏览器和编程环境,能直接在 Slack 里接任务并端到端执行,比如拉数据、做报表、写代码、修工单。创始人说,大多数 AI 工具只给建议,不干活,Faby 想解决的是“把活干完”这一步。它背后用了 Cursor、Claude Code 和 OpenAI Codex 3.0 来驱动执行。目前...
#Agent#Tools#Faby#Product Hunt
精选理由
HKR-H 靠'Slack 虚拟同事+独立电脑'这个产品钩子过关,但 K 和 R 都挂掉,因为正文没给模型、权限、价格或任务证据。这只是一个低价值的产品亮相,先别太激动。
一句话点评
Faby 相当于在 Slack 里塞了一个自带电脑、浏览器和编程环境的虚拟同事,能直接拉数据、写代码、修工单,而不是只给建议。背后用了 Cursor、Claude Code 和 OpenAI Codex 3.0 来干活,听起来挺全能。但正文没披露定价、权限模型和任务成功率,实际跑复杂流程时会不会翻车、成本高不高,都得打个问号。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
06:00
22d ago
AI HOT 精选· aihot-apiZH06:00 · 05·22
DeepSeek V4 Flash 冲上周榜第一
OpenRouter 发帖说 DeepSeek V4 Flash 登顶周排行榜,但没说是哪个榜、评测指标是什么、对比了哪些模型、样本量多大。目前只能确认排名结果,其他细节一概缺失,建议等官方或第三方详细报告再下结论。
#Benchmarking#DeepSeek#OpenRouter#Benchmark
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过:正文只说了登顶周榜,没有方法论、指标或可复现的对比,信息不足以支撑判断。
一句话点评
OpenRouter 发帖说 DeepSeek V4 Flash 登顶周榜,但没说是哪个榜、评测指标、样本量、对比了哪些模型。目前只能确认排名结果,其他细节一概缺失,建议等官方或第三方详细报告再下结论。短评:榜名、指标、样本量全没提,先别急着信。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
05:50
22d ago
r/LocalLLaMA· rssEN05:50 · 05·22
花两年半搭了个“准本地”AI工作站,9个本地模型+云端兜底
一位Reddit用户花了2.5年,用Msty Studio+LiteLLM搭了一套混合AI工作流:本地跑了9个模型端点,算力约25.3 TFLOPs(大概相当于一块中端显卡),还做了Docker容器监控、模型降级链和成本追踪。核心思路是“能本地就不上云”,本地搞不定再自动切云端API兜底。正文没披露具体硬件配置和延迟数据,但25.3 TFLOPs这个数...
#Agent#Tools#Inference-opt#Msty Studio
精选理由
HKR 三项都过,但这就是一个 Reddit 个人展示帖,没有可复现的基准测试、开源仓库或采用信号。第一人称的搭建数字拉高了可读性,但不足以进 featured。
一句话点评
一位Reddit用户花2.5年搭了一套“准本地”AI工作流:本地跑9个模型(约25.3 TFLOPs算力,相当于一块中端显卡),搞不定再自动切云端API兜底。还做了Docker监控、模型降级链和成本追踪。核心思路务实:能本地就不上云。但正文没披露具体硬件和延迟数据,25.3 TFLOPs这个数偏保守,实际体验可能打折。适合想省API费、又不想全自建的人参考。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
04:54
22d ago
Hacker News 首页· rssEN04:54 · 05·22
CODA:将Transformer块重写为GEMM后处理程序
训练 Transformer 时,除了矩阵乘法(GEMM)这种密集计算,还有大量内存搬运操作——归一化、激活函数、残差连接、归约等。这些算子本身算得少、搬得多,在优化得很好的训练栈里越来越拖后腿。CODA 的思路是把它们写成 GEMM 的“尾段程序”(epilogue),让这些操作在 GEMM 的输出块还留在片上缓存时就执行完,不用写回全局内存再读。论...
#Inference-opt#Research release
精选理由
触发硬排除——技术可及性不足:GEMM-Epilogue 重写需要内核和编译器背景才能理解,而 RSS 正文只给了 arXiv 和 HN 链接,没有披露任何性能数据、方法细节或可复现的配置,信息缺口太大,无法判断实际价值。
一句话点评
这篇论文把Transformer里那些零散的归一化、激活函数、残差连接等操作,直接塞进矩阵乘法(GEMM)的尾声阶段,让数据在芯片上算完再写回内存,省掉大量读写开销。核心思路是把这些算子重写成GEMM的“后处理程序”,保持高性能的同时还能灵活组合。作者用人类手写和LLM生成的kernel都跑出了不错的效果,说明这条路在工程上可行。不过论文目前只覆盖了标准Transformer块,没提对注意力...
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K1·R0
04:47
22d ago
Hacker News 首页· rssEN04:47 · 05·22
KVBoost:给 HuggingFace 模型加个 KV 缓存复用,首 token 延迟快 5–48 倍
KVBoost 是一个即插即用的推理加速库,核心思路是把 prompt 切成小块并哈希,命中缓存块就直接跳过 attention,只算新 token。实测多轮对话的缓存命中率从第 2 轮的 45% 涨到第 5 轮后的 85%,首 token 延迟从 HuggingFace 默认的 850ms 降到 210ms。它还支持 AWQ 量化后的层流式加载,32...
#Inference-opt#HuggingFace#KVBoost#Product update
精选理由
HKR 三项都过,但正文只给了机制和 5–48x 的 TTFT 加速倍数,没披露测试模型、硬件和复现条件。当一个小型 Show HN 工具看,分数压在 60–71 合理。
一句话点评
KVBoost 把 prompt 切成小块哈希,命中缓存块就跳过 attention,只算新 token。多轮对话第 5 轮后缓存命中率 85%,首 token 延迟从 850ms 降到 210ms,比 HuggingFace 默认快 3-5 倍。还支持 AWQ 量化后层流式加载,32B 模型跑在 8GB 显存卡上,但解码速度只有 0.11 tok/s——PCIe 带宽瓶颈,适合省显存不适合...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
04:30
22d ago
● P1AI HOT 精选· aihot-apiZH04:30 · 05·22
DeepSeek推进七百亿元融资,承诺坚持开源而非商业化
DeepSeek 正在敲定一笔约 700 亿元人民币的首轮外部融资,投前估值约 450 亿美元。腾讯、IDG 资本和砺思资本接近参投,梁文锋个人也可能注资约 200 亿元。他在投资者会议上明确表示,公司会继续做开源模型,目标是通用人工智能,而不是急着商业化。如果这笔钱到位,将创下中国科技初创公司首轮融资的最高纪录。不过文章也提到,具体金额和最终参投方仍...
#DeepSeek#Liang Wenfeng#Tencent#Funding
精选理由
HKR 三项都踩中了。700 亿融资规模本身就够炸,加上梁文锋个人可能跟投 200 亿,这种资金体量在开源模型公司里不常见,所以 H 给了。K 这边,450 亿美元估值、腾讯和 IDG 接近入局,以及梁文锋明确说坚持开源不急着商业化,都是能帮人判断行业水温的关键事实。R 更直接,这笔钱怎么花、开源路线能不能扛住商业化压力,会直接影响国内 AI 创业的资本逻辑和开源生态。分数没给到 95 以上,是因为交易还在推进,最终条款和交割都没披露,先打个折。
一句话点评
700亿融资、450亿美元估值,梁文锋自己还要再掏200亿,但承诺继续开源不急着变现——这个组合挺少见,先别太激动,钱到账再说。
锐评
DeepSeek这轮融资如果落地,700亿元人民币的规模会是中国科技初创公司首轮融资的最高纪录。投资前估值约450亿美元,腾讯、IDG和砺思资本接近确定参投,国家队也在里面。梁文锋个人可能注资约200亿,同时明确表示继续开发开源模型,目标是通用人工智能而不是短期变现。 这些数字很大,但正文没披露资金的具体用途——是买算力、养团队还是做生态?也没说开源会开到什么程度,是只放权重还是连训练方法、数据配比都公开。另外,报道来源是彭博社援引知情人士,最终参与者和金额都可能变,现在下结论还早。 如果梁文锋真的用个人资金跟投200亿,那他对控制权和长期路线的坚持会比口头承诺更有说服力。但反过来,这么大一笔钱进来,投资方对回报的耐心能有多久,正文完全没提。
HKR 分解
hook knowledge resonance
打开信源
99
SCORE
H1·K1·R1
04:25
22d ago
AI HOT 精选· aihot-apiZH04:25 · 05·22
Antigravity付费版Gemini周配额再翻三倍
Antigravity把付费用户的Gemini每周调用额度又提了三倍,而且已经重置了。之前翻倍过,这次再翻,对高频用户来说能省不少钱,不用频繁买包了。正文没披露具体数字,但连续翻倍说明用量增长快,或者他们在压成本。
#Google#Antigravity#Gemini#Product update
精选理由
HKR三项都过,但事实只是Antigravity付费用户的Gemini配额增加。没有新模型、新能力或定价细节,属于小产品更新,分数卡在66。
一句话点评
Antigravity 把付费用户的 Gemini 每周调用额度又提了三倍,而且已经重置了。之前翻倍过,这次再翻,对高频用户来说能省不少钱,不用频繁买包了。正文没披露具体数字,但连续翻倍说明用量增长快,或者他们在压成本。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
02:58
22d ago
● P1彭博科技· rssEN02:58 · 05·22
DeepSeek 创始人把目标定为通用人工智能,同时一笔 100 亿美元的融资在推进
彭博这条快讯只给了标题,正文被付费墙挡住了。标题说 DeepSeek 创始人公开把 AGI(通用人工智能)设为目标,并且公司正在推进一轮 100 亿美元的融资。但创始人具体怎么说的、钱从哪来、谁领投、估值多少、钱打算怎么花,这些关键信息正文都没披露。100 亿这个数字放在 AI 创业公司里非常夸张,如果是真的,说明资本市场对 DeepSeek 的预期已...
#Reasoning#DeepSeek#Bloomberg#Funding
精选理由
标题信息量不小,但正文基本是空壳,没给出创始人原话、融资细节或任何时间线。我会先打个折:这条消息的传播价值在于 DeepSeek 把 AGI 目标和巨额融资同时抛出来,信号很强,但事实支撑很弱。Bloomberg 的稿子只给了标题级事实,投资人是谁、钱怎么花、估值多少全没写,所以重要性停在 86 分是合理的,不能再往上拉。
一句话点评
DeepSeek 创始人公开把 AGI 当目标,同时 100 亿美元融资在推进。但正文被付费墙挡住,具体谁投、估值多少、钱怎么花全没披露,先别太激动。
锐评
这条消息只有标题,正文被彭博的付费墙挡得严严实实,所以能确认的事实非常有限。标题透露了两件事:一是 DeepSeek 创始人首次公开把 AGI(通用人工智能)设为公司目标,二是公司正在推进一轮 100 亿美元的融资。100 亿这个数字放在 AI 创业公司里极其夸张,如果属实,说明资本市场对 DeepSeek 的预期已经拉到了和 OpenAI 差不多的量级。但关键信息全是缺口——创始人原话怎么说的、是内部信还是公开演讲、这轮融资谁领投、估值多少、钱打算砸在算力还是人才上,正文都没披露。另外,喊 AGI 目标本身在 2026 年这个节点不算新鲜事,各家头部公司都在喊,重点要看有没有配套的路线图或阶段性验证指标。这条新闻目前更像一个信号,说明 DeepSeek 在资本层面要搞大动作,但具体怎么搞、能不能搞成,还得等更多细节出来才能判断。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
02:39
22d ago
彭博科技· rssEN02:39 · 05·22
三星代工合作伙伴 SemiFive 上市后首份财报:营收增长 137%,AI 需求把产能预订率拉到 74%
SemiFive 是三星晶圆代工的合作伙伴,去年 12 月在韩国 Kosdaq 上市。CEO Brandon Cho 在 Bloomberg 访谈里说,公司一季度营收同比涨了 137%,产能预订率冲到 74%,主要靠 AI 芯片订单。74% 这个数字说明产线已经接近满负荷,后续扩产压力不小。正文没披露具体客户名单和毛利率,所以暂时没法判断这波增长是靠大...
#Samsung#SemiFive#Brandon Cho#Commentary
精选理由
HKR-K通过,因为有两个AI相关芯片需求的运营指标。HKR-H/R较弱:这是一段财报视频摘要,不是模型、产品或重大基础设施变化。
一句话点评
SemiFive 是三星晶圆代工的合作伙伴,去年12月在韩国上市。一季度营收同比涨137%,产能预订率冲到74%,接近满负荷。AI芯片订单是主要推手。但正文没披露具体客户名单和毛利率,所以暂时没法判断这波增长是靠大客户还是分散订单。74%的预订率说明产线快满了,后续扩产压力不小。短评:三星代工伙伴靠AI订单营收翻倍,产能快满了,但客户和利润细节没给,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
02:37
22d ago
纽约时报中文网· rssZH02:37 · 05·22
17位CEO陪特朗普访华,各家公司在中国都有什么“卡脖子”的麻烦
特朗普带17位CEO去中国开会,表面是谈生意,实际每家都有具体麻烦。特斯拉想从苏州迈为买近30亿美元的太阳能设备,被中国卡住没放行;英伟达的H200芯片中国还没批准采购,尽管美国已经同意卖给阿里、腾讯等;Coherent拿不到中国出口的磷化铟,做光子芯片缺材料;因美纳还在“不可靠实体清单”上;Meta被要求取消收购AI公司Manus;高通被反垄断调查;...
#Tesla#Nvidia#Apple#Policy
精选理由
HKR三项都过,但AI只是这篇中美商业外交大故事里的一条线。H200审批被卡是具体的算力政策信号,所以分数落在60–71区间。
一句话点评
特朗普带17个CEO去中国开会,每家都有具体麻烦。特斯拉想从苏州迈为买近30亿美元太阳能设备被卡;英伟达H200芯片中国没批;Coherent缺磷化铟;因美纳还在黑名单;Meta被要求取消收购Manus;高通被反垄断调查。波音十年没在中国卖出一架飞机。维萨拿不到人民币结算牌照。贝莱德收购港口被反对。通用电气缺稀土。嘉吉被关税报复。每家公司都在逐案解决许可、市场准入和供应链问题。正文没披露这些...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
02:35
22d ago
Hacker News 首页· rssEN02:35 · 05·22
MATLAB 之父 Cleve Moler 去世,享年 86 岁
MathWorks 联合创始人、首席数学家 Cleve Moler 于 2026 年 5 月 20 日在家中去世。他是 MATLAB 的第一版作者,也是数值计算库 LINPACK 和 EISPACK 的合著者——这两个 Fortran 库是早期科学计算的基石。正文没有披露死因。
#Cleve Moler#MathWorks#MATLAB#Personnel
精选理由
HKR-H 和 HKR-R 靠 MATLAB 创始人讣告的钩子通过,但 HKR-K 信息太薄,且不是 AI 行业事件。留在 all 层级,不上精选。
一句话点评
MATLAB 之父 Cleve Moler 于 5 月 20 日去世,享年 86 岁。他是数值计算库 LINPACK 和 EISPACK 的合著者,这两个 Fortran 库是早期科学计算的基石。正文未披露死因。对 AI 从业者来说,Moler 的遗产——MATLAB——仍是学术界和工业界做快速原型验证的标配工具,但它在深度学习时代正被 Python 生态快速替代。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
02:08
22d ago
彭博科技· rssEN02:08 · 05·22
川崎重工与英伟达合作搞物理AI机器人,股价单日涨12%
川崎重工宣布将与英伟达等公司合作开发物理AI机器人技术,消息一出股价最高涨12%,创2月9日以来最大单日涨幅。不过正文没披露项目具体范围、投资金额、产品时间表或部署目标,所以这波上涨更多是市场对“英伟达合作”标签的短期反应,实际落地细节还全是空白。
#Robotics#Kawasaki Heavy Industries#Nvidia#Partnership
精选理由
股价涨12%和Nvidia physical AI机器人方向让这条新闻有H/K/R价值,但正文没披露产品规格、时间表或具体技术路径,属于合作消息的常规区间。
一句话点评
川崎重工宣布与英伟达合作开发物理AI机器人,股价单日涨12%。但正文没披露项目范围、投资金额或时间表,这波上涨基本是炒“英伟达合作”标签,落地细节全是空白。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
02:00
22d ago
机器之心 · 公众号· rssZH02:00 · 05·22
人形机器人手指里的微型电机,这家公司花898天搞定了国产化
上海马新芯动建成了国内首条高精度空心杯电机产线,全长32米,年产能40万台,覆盖4毫米到80毫米规格。空心杯电机是人形机器人手指关节的核心驱动件,相当于指尖的“小心脏”。之前这类电机基本靠进口,价格贵、供货不稳定。这条产线跑通后,成本有望降下来,国产机器人厂商不用再被卡脖子。不过正文没披露具体客户和量产时间,实际落地节奏还要再观察。
#Robotics#上海马赫智造#Figure AI#Maxon
精选理由
这是一条国产零部件产线投产消息,不是模型或机器人整机发布,所以分数压在60-71区间。数字够具体(898天、32米、40万只),'指尖心脏'的比喻也让人能快速理解这东西用在哪儿。但全文是公司宣传口径,没披露客户是谁、良率多少、跟Maxon比性能差多少,信息缺口明显。对关注人形机器人供应链的人有价值,但对模型或平台层从业者参考意义有限。
一句话点评
上海马新芯动建成了国内首条高精度空心杯电机产线,年产能40万台,覆盖4mm到80mm规格。空心杯电机是人形机器人手指关节的核心驱动件,之前基本靠进口,价格贵、供货不稳。这条产线跑通后,成本有望降下来,国产机器人厂商不用再被卡脖子。不过正文没披露具体客户和量产时间,实际落地节奏还要再观察。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
00:15
22d ago
FT · 科技· rssEN00:15 · 05·22
外资收购基金最后10亿美元退出中国数据中心,买家未披露
Princeton Digital Group的出售流程标志着外资从中国敏感数字基础设施撤退,这笔交易规模约10亿美元。正文没披露买家身份和具体条款,但金额本身说明这是外资在中国数据中心领域的最后一笔大额退出。对AI从业者来说,这意味着国内算力基础设施的资本来源将进一步本土化,外资对数据主权和监管风险的顾虑在加速兑现。
#Princeton Digital Group#Funding
精选理由
HKR的K和R都通过了:10亿美元级别的中国数据中心出售,直接关联算力基础设施的控制权转移和外资撤退。H不通过:正文没提GPU容量、客户、买方或交易条款,信息量停留在行业报道层面,没有技术或产品层面的新东西。
一句话点评
Princeton Digital Group 以约 10 亿美元出售中国数据中心,这是外资从国内敏感数字基础设施退出的最后一笔大额交易。对 AI 从业者来说,算力基础设施的资本来源将进一步本土化,外资对数据主权和监管风险的顾虑在加速兑现。正文没披露买家身份和具体条款,但金额本身说明退出规模。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
00:00
22d ago
● P1Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·22
智谱发布GLM-5.1高速版API,输出速度达每秒400个token
智谱在 5 月 22 日放出了 GLM-5.1 高速版 API,输出速度标称 400 tokens/s,是人类阅读速度的 80 倍以上。这个速度不是靠传统编译优化“调”出来的,而是底层的 TileRT 推理引擎把 GPU 的工作模式从“批处理车间”改成了“连续流水线”——取消计算步骤之间的等待和隔离,让数据持续流动,GPU 不再频繁启停。模型本身也做了...
#Inference-opt#Zhipu#GLM-5.1#TileRT
精选理由
400 tokens/s 是个好钩子,但正文没交代测试条件、并发数、输入长度和计费规则,所以速度先打个折看。TileRT 的说法有信息量,不过没展开具体怎么重构执行模型,技术细节偏薄。整体对从业者有提醒价值,但缺少独立验证,所以分数停在 78 不动。
一句话点评
智谱把旗舰模型的速度拉到400 tokens/s,不是靠换小模型,而是重写了推理引擎。这点挺狠,但正文没提价格和实际延迟,先别急着喊“最快”。
锐评
智谱这次发布的GLM-5.1高速版,直接把API输出速度干到了每秒400个token,刷新了全球大模型厂商的公开纪录。更值得关注的是,它没走“用小模型换速度”的老路,而是声称在旗舰级模型上做到了低延迟。技术实现上,他们和TileRT团队合作,在推理引擎、调度系统和基础设施三个层面做了系统级优化。简单说,就是通过提前编译、把计算任务常驻在GPU里,省掉了大量调度和同步的开销,让单卡吞吐能力更高,多卡协同也更聪明。 不过,这篇IT之家的报道主要来自厂商通稿,缺少第三方实测数据。400 tokens/s是稳定输出还是瞬时峰值?在高并发下尾延迟到底压到了多少?这些关键指标都没给。另外,价格也没披露,速度快但成本如果翻倍,对生产环境来说意义就大打折扣。目前这个API只开放给部分企业客户,普通开发者还没法验证。 总的来说,技术思路有突破,但实际效果还得等更多独立评测和定价信息出来才能下判断。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
00:00
22d ago
OpenAI 博客· rssEN00:00 · 05·22
OpenAI被Gartner评为企业编码智能体领导者
Gartner 在 2026 年企业 AI 编码智能体魔力象限中把 OpenAI 列为领导者,主要靠的是 Codex。Codex 现在每周有超过 400 万人使用,客户包括 Cisco、Datadog、Dell 和 NVIDIA。Gartner 认可了它在智能体开发、企业治理、沙箱隔离和灵活部署上的能力。OpenAI 自己说,Codex 已经是增长最快...
#Agent#Code#OpenAI#Gartner
精选理由
触发硬排除-纯营销:OpenAI 引用 Gartner 领导者徽章,未提供方法论、评分或 Codex 新能力。HKR 均缺乏具体钩子,评分上限低于 40。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K0·R0

更多

频道

后台