ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-05-18 · 星期一2026年5月18日
14:14
26d ago
r/LocalLLaMA· rssEN14:14 · 05·18
Kokoro 82M 和 Supertonic 3 TTS 在 CPU 上的跑分对比
有人在 4 核 CPU、16GB 内存、无 GPU 的机器上跑了 Kokoro 82M 和 Supertonic 3 两个 TTS 模型,测了 6 种文本长度,总共跑了 120 次。Supertonic 3 只用 2 步推理,实时率(RTF)0.165,也就是生成 1 秒音频只需约 0.165 秒,基本能实时用。Kokoro 82M 用 PyTorch...
#Audio#Benchmarking#Inference-opt#Kokoro
精选理由
HKR 三项都通过,因为这是一次具体的 CPU TTS 基准测试,有 RTF 数字。但只是单个 Reddit 用户的测试,正文没披露重复运行次数、音频质量评分或完整脚本,所以分数压在 60–71 区间。
一句话点评
有人在4核CPU、16GB内存、无GPU的机器上测了Kokoro 82M和Supertonic 3两个TTS模型。Supertonic 3只用2步推理,实时率0.165,生成1秒音频只需0.165秒,基本能实时用。Kokoro 82M用PyTorch跑实时率0.469,慢一些但也能用。测试覆盖6种文本长度,总共跑了120次,数据可信。但正文没披露音质评测,只测了速度,这点先别太激动。如果音质...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:12
26d ago
Hugging Face 博客· rssEN14:12 · 05·18
IBM 和 Hugging Face 搞了个开源智能体排行榜
IBM 研究院和 Hugging Face 联合推出了一个开源智能体排行榜,用来评估 AI 智能体(能自己调用工具、执行多步任务的程序)的表现。但正文目前只显示了 Hugging Face 的 429 限流页面,没有给出任何评测指标、上榜模型、具体任务或发布时间。想了解排行榜怎么打分、哪些智能体上榜,还得等官方放出完整内容。
#Agent#Benchmarking#Hugging Face#IBM Research
精选理由
HKR-R 通过是因为 Agent 评测影响从业者选工具和判断榜单可信度;HKR-H 和 HKR-K 不通过:正文只披露了榜单名称,没有指标、任务、模型或结果。
一句话点评
IBM 和 Hugging Face 说要搞一个开源智能体排行榜,但目前点进去只有 429 限流页面,正文一个字都没披露。所以这篇目前只有标题有价值,具体怎么打分、哪些智能体上榜、任务是什么,全得等官方补上。先别太激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
13:37
26d ago
● P1Hacker News 首页· rssEN13:37 · 05·18
Cloudflare 用 Mythos 模型在内部代码库测试漏洞挖掘和攻击链生成
Cloudflare 在 Project Glasswing 里测试了 Anthropic 的 Mythos Preview 模型,把它丢到 50 多个内部代码仓库上跑。这个模型跟之前通用大模型最大的区别是:它能自己把几个小漏洞串成一条完整的攻击链,并写出验证代码在沙箱里编译运行,跑不通就自己改假设再试,直到证明漏洞真的可利用。不过,这个预览版没有正式...
#Reasoning#Code#Safety#Cloudflare
精选理由
HKR 三项全中。Cloudflare 拿自己的代码库做了一手测试,跑出可执行漏洞利用链,还记录了不一致拒答的问题,信号很强。但这不是 Anthropic 官方模型发布,只是第三方试用报告,所以分数停在 84 这个区间是合理的。
一句话点评
Cloudflare 拿 Anthropic 的 Mythos 模型扫了自己五十多个代码库,发现它能自动把几个小漏洞串成完整攻击链,还会自己写代码验证漏洞是否真的能用。
锐评
Cloudflare 这篇博客讲的是他们内部测试 Mythos Preview 的真实体验,不是第三方评测,所以结论要打点折——他们只测了自己的代码库,不代表对所有项目都有效。但信息量很足:Mythos 最大的进步不是找漏洞,而是能把几个原本不起眼的小问题(比如内存释放后还能访问)串成一条完整的攻击路径,并且自己写验证代码、编译、运行,失败了还会调整假设再试。这个闭环能力让之前只停在“可能有问题”的发现变成了“确实能打穿”的证明。 另一个值得注意的点是模型会“拒绝干活”。即使 Anthropic 给的是去掉额外安全限制的版本,Mythos 有时还是会拒绝写漏洞利用代码,但换个问法或改个环境变量就又同意了。这种不一致说明模型自带的护栏不可靠,不能当安全策略用。 博客没给出具体的漏洞发现数量、误报率,也没说扫一次要花多少钱、跑多久。这些数据对判断它能不能规模化用很关键,目前只能看到能力演示,离生产环境的成本收益评估还差一截。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
13:26
26d ago
Hacker News 首页· rssEN13:26 · 05·18
华盛顿大学曾计划让幼师戴摄像头录课,用来训练AI
华盛顿大学研究人员曾计划让幼儿园老师佩戴第一人称摄像头,或教室架设固定摄像头,每次最多录150分钟、一个月4次,把录到的师生互动画面拿去训练AI模型,用来评估课堂互动质量。家长收到的通知是“opt-out”模式——不主动拒绝就等于同意,而且只有英文版,非英语母语家庭很难真正知情。有家长看到后表示“被吓到”,担心孩子影像被用到未知AI工具里。报道说,家长...
#Vision#Multimodal#Research release
精选理由
HKR的H和R都满足,但K不满足:RSS只给了标题和HN的39分、8条评论,没有机构、数据用途或采集规模。话题本身有讨论价值,但信息量不够上精选。
一句话点评
华盛顿大学曾计划让幼儿园老师戴摄像头录课堂互动,每次最长150分钟、一月4次,用来训练AI评估教学质量。家长收到的是“不拒绝=同意”的opt-out通知,且只有英文版,非英语母语家庭很难真正知情。有家长看到后“被吓到”,担心孩子影像被用到未知AI工具。报道说校方已搁置计划。关键缺口:正文没披露具体用什么模型架构、训练数据量多大、评估指标是什么,也没说影像是否会上传云端或本地处理。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
12:49
26d ago
Hacker News 首页· rssEN12:49 · 05·18
Benedict Evans 春季报告:AI 吃掉世界
这是一份 79 页的 PDF,Benedict Evans 在 2026 年 5 月更新了他对 AI 行业的全景判断。核心论点是:AI 正经历一场平台级迁移,类似 PC 到智能手机的切换。报告用大量数据说明资本投入爆炸——四大科技公司 2026 年计划资本开支 7000 亿美元,超过全球电信业总和;Nvidia 收入已远超 Intel,数据中心建设支出...
#Benedict Evans#Hacker News#Commentary
精选理由
这是一篇只有标题的 PDF 链接,来自知名分析师 Benedict Evans 的年度 AI 报告,所以 H 项勉强通过。但正文没披露任何论点、数据或框架,K 和 R 项都不满足——从业者看完不知道报告在说什么,更谈不上触发讨论或争议。
一句话点评
Benedict Evans 的 79 页春季报告核心判断:AI 正经历类似 PC 到智能手机的平台迁移。关键数字:四大科技公司 2026 年资本开支 7000 亿美元,超过全球电信业总和;Nvidia 收入已远超 Intel。报告用大量数据说明资本投入爆炸,但没披露具体应用落地和 ROI 验证。短评:数据堆得扎实,但缺“钱花出去换回了什么”的判断。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0
12:21
26d ago
r/LocalLLaMA· rssEN12:21 · 05·18
Continue.dev 接 Qwen 3.6 出 bug:编码调用在思考块后卡死
Reddit 用户 Jorlen 发现,用 Continue.dev 对接 Qwen 3.6 dense 27B 和 35B/A3B 时,简单聊天正常,但一涉及编码调用或读文件,模型输出到思考块(thinking block)就停住不动。llama.cpp 的 reasoning budget 参数会复现一个 1024 token 截断问题,但正文没披...
#Code#Reasoning#Tools#Continue.dev
精选理由
这是一条 Reddit 上的单一用户求助帖,有复现步骤和截断现象,但正文没披露根因,也没有修复方案或官方确认。作为 niche 事件信号放进 all 层合适,不值得上 featured。
一句话点评
Qwen 3.6 在 Continue.dev 里一跑编码任务就卡在思考块,llama.cpp 的 reasoning budget 参数会复现 1024 token 截断。正文没披露根因,可能是工具链对长思考链的兼容问题。如果是高频编码用户,建议先降级或换后端。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K1·R1
12:20
26d ago
Hacker News 首页· rssEN12:20 · 05·18
Linus 吐槽:AI 挖漏洞的人太多,Linux 安全邮件列表快被搞崩了
Linus Torvalds 说,现在一堆人用 AI 工具找 Linux 内核漏洞,结果大家用的工具差不多,报的 bug 也差不多,导致安全邮件列表里全是重复报告,几乎没法管理。他原话是“almost entirely unmanageable”,还补了一句“不必要的痛苦和毫无意义的工作”。正文没披露具体有多少重复报告、邮件量涨了多少,也没说用的是哪些...
#Code#Tools#Safety#Linus Torvalds
精选理由
HKR-H 和 HKR-R 成立:Linus 把 AI 漏洞猎手和 Linux 安全列表失控挂钩,冲突直接。HKR-K 弱:没给邮件增幅、样本量或具体案例,信息不足,所以落在 60–71 的 all 档。
一句话点评
Linus Torvalds 吐槽 AI 找 bug 工具让 Linux 安全邮件列表“几乎完全没法管”——大家用差不多的工具报差不多的漏洞,全是重复报告。他原话是“不必要的痛苦和毫无意义的工作”。正文没披露具体重复量或邮件增幅,也没点名是哪些工具。这点先别太激动:问题出在工具同质化,不是 AI 找 bug 本身没用。如果团队只用一两种公开模型跑静态分析,结果必然撞车。真正该关注的是:开源社...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
11:52
26d ago
r/LocalLLaMA· rssEN11:52 · 05·18
给 MTP 的 KV 缓存降精度,几乎白捡性能
有人在 Qwen3.7-27B-Q8_0 上试了试把 MTP(多 token 预测)模块的 KV 缓存从 fp16 压到 q8_0,9 次请求的接受率(0.735)纹丝不动,总耗时从 49.46 秒降到 49.32 秒。省了不到 0.3%,但内存占用降了——对显存吃紧的本地部署来说,这点优化不亏。正文没披露具体显存节省量,也没说更长序列下的效果。
#Inference-opt#Benchmarking#Qwen#llama.cpp
精选理由
这篇帖子样本量太小(9个请求),只在单模型单量化配置上跑了一次,没有跨硬件或跨模型验证,所以“免费午餐”的结论要打个折。但数字具体、钩子清晰,对关注量化推理成本的从业者来说有参考价值。正文没披露量化前后的显存占用变化,这点先别太激动。
一句话点评
有人在 Qwen3.7-27B-Q8_0 上把 MTP(多 token 预测)模块的 KV 缓存从 fp16 压到 q8_0,9 次请求的接受率(0.735)纹丝不动,总耗时从 49.46 秒降到 49.32 秒。省了不到 0.3%,但内存占用降了——对显存吃紧的本地部署来说,这点优化不亏。正文没披露具体显存节省量,也没说更长序列下的效果。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
11:51
26d ago
Hacker News 首页· rssEN11:51 · 05·18
隐藏音频信号能劫持AI语音系统
IEEE Spectrum报道了一种针对语音AI系统的攻击方式:攻击者可以在正常音频里嵌入人耳听不到的隐藏信号,让AI语音助手执行非预期的操作。文章标题说“能劫持”,但正文没有披露具体的攻击机制、复现条件或受影响的产品型号。目前只有30个Hacker News点赞和4条评论,信息量有限,建议等更详细的技术分析出来再评估实际威胁。
#Audio#Safety#IEEE Spectrum#Hacker News
精选理由
HKR-H 和 HKR-R 通过:隐藏攻击语音 AI 这个点有新闻性和安全相关性。HKR-K 不通过:正文只有 HN 热度(30 分、4 条评论)和标题复述,没有机制或可测试的细节,信息缺口大。
一句话点评
攻击者能在正常音频里藏人耳听不到的信号,让语音助手干坏事。但正文没披露攻击机制、复现条件或受影响产品,只有30个HN点赞和4条评论,信息量太少。建议等详细技术分析出来再评估实际威胁。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
11:35
26d ago
r/LocalLLaMA· rssEN11:35 · 05·18
OpenBMB 发了三个 BitNet 模型,8B/3B/1B,但还没人跑过评测
Reddit 上有人贴了 OpenBMB 的三个 BitNet 模型链接(BitCPM4-CANN 8B、3B、1B),说自己在等 llama.cpp 更新支持才能跑。BitNet 是微软搞的 1-bit 大模型路线,理论上能把显存和计算量压到极低,但这次发的模型没有放出任何 benchmark、许可证或发布时间。正文没披露训练数据、精度损失或实际推理...
#Inference-opt#OpenBMB#Hugging Face#llama.cpp
精选理由
HKR-K 成立,因为三个具体尺寸的 BitCPM4-CANN 权重链接是实打实的信息。HKR-R 对 LocalLLaMA 用户有价值,但缺少基准测试、许可证和 llama.cpp 支持时间表,所以分数压在 60–71 区间。
一句话点评
OpenBMB 发了三个 BitNet 模型(8B/3B/1B),走的是微软 1-bit 路线,理论上能把显存和计算量压到极低。但正文没放任何 benchmark、许可证或发布时间,连训练数据、精度损失都没提。目前只能等 llama.cpp 更新才能跑,实际效果未知。短评:饼画得大,但缺实测数据,先别激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R1
11:00
26d ago
TechCrunch AI· rssEN11:00 · 05·18
韩国公司LetinAR在做AI眼镜的光学镜片,指甲盖大小
LetinAR开发了一款拇指甲大小的镜片,用于AI眼镜的光学显示。文章提到这项技术今年就会在欧洲摩托头盔上落地——导航箭头直接浮现在路面上,不用看手机。但正文没披露量产时间、客户名单、价格或具体光学参数,所以离消费级眼镜还有多远不好说。
#Vision#LetinAR#Product update
精选理由
HKR-H和HKR-K靠拇指大小镜片这个具体硬件钩子过关,但HKR-R不行:缺规格、客户和量产时间,对从业者来说只是供应链背景信息,不是当天能用的情报。
一句话点评
韩国LetinAR做了个拇指甲大小的镜片,能让导航箭头直接浮现在路面上,今年先装在欧洲摩托头盔上。光学方案是“针孔镜片”,比传统方案薄很多,适合塞进眼镜框。但正文没披露量产时间、客户名单、价格或具体光学参数,所以离消费级眼镜还有多远不好说。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
10:50
26d ago
Hacker News 首页· rssEN10:50 · 05·18
施密特在亚利桑那大学毕业典礼谈AI遭学生喝倒彩
施密特在亚利桑那大学毕业典礼上把AI比作当年计算机带来的技术变革,结果被台下学生喝倒彩。正文没披露他具体说了什么惹毛了观众,也没提学校和学生为什么反应这么大。只知道不止他一个演讲者因为AI话题被嘘——NBC新闻的视频标题提到“多位毕业典礼演讲者因AI言论被嘘”。
#Eric Schmidt#Google#NBC News#Incident
精选理由
HKR-H和R通过:知名科技人物因AI话题当众被嘘,有场景感和从业者情绪价值。HKR-K不通过:正文没披露学校、具体言论、现场原因,也没有数据或引用,只能算低价值线索。
一句话点评
前Google CEO施密特在亚利桑那大学毕业典礼上谈AI,被台下学生喝倒彩。正文没说他具体讲了什么惹毛观众,也没提学校和学生为何反应这么大。只知道不止他一个演讲者因AI话题被嘘。这事本身信息量有限,但说明AI在公众舆论里已经成了敏感词——尤其对即将进入职场的毕业生来说,AI更多意味着岗位替代而非技术乐观。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K0·R1
10:09
26d ago
新智元 · 公众号· rssZH10:09 · 05·18
GPT-5.5 被曝用上全球最快芯片,每秒吐 2000 个 token
新智元转述,Cerebras 的 WSE-3 芯片跑 120B 参数的 GPT-5.3-Codex-Spark,推理速度冲到 2000 token/秒,比普通 GPU 快一个量级。但别急着激动:Cerebras 公有云上跑的最大生产模型还是 120B,没提更大规模;上下文窗口只有 128K,实测里近一半请求会超限。芯片快是真的,但场景受限,离替代主流推...
#Inference-opt#Code#Agent#Cerebras
精选理由
这篇是传闻性质,新智元爆料Cerebras芯片把120B模型跑到2000 token/秒,但正文没披露任何OpenAI或Anthropic的官方确认,也没说GPT-5.5到底是不是真的。速度数字很唬人,但128K上下文限制意味着近一半的真实请求可能塞不进去,这点先别太激动。整体信息有钩子也有缺口,适合推给所有人看,但不够硬到上头条。
一句话点评
Cerebras WSE-3芯片跑120B模型推理速度冲到2000 token/秒,比普通GPU快一个量级。但别急着激动:Cerebras公有云上最大生产模型还是120B,没提更大规模;上下文窗口只有128K,实测近一半请求会超限。芯片快是真的,但场景受限,离替代主流推理还远。正文没披露具体功耗和成本对比,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
10:09
26d ago
新智元 · 公众号· rssZH10:09 · 05·18
多模态大模型别盲目刷题:诊断-生成-强化闭环,找准盲点
北大和山大提出 DPE 方法,给多模态大模型做“体检”:先诊断出 12 个能力维度的短板,每轮只用 200 个样本,再用多智能体生成针对性训练数据,最后用 GRPO 强化学习更新。在 Qwen2.5-VL-7B-Instruct 上跑三轮,平均分从 57.29 涨到 59.29。提升幅度不大,但样本量极小,适合低成本快速迭代。正文没披露具体哪些维度提升...
#Multimodal#Agent#Fine-tuning#Peking University
精选理由
一篇ICML论文,方法叫DPE,核心思路是诊断-生成-强化闭环:先测模型在12个维度上的短板,再针对短板生成训练样本,最后用GRPO(一种强化学习更新方式)来微调。Qwen2.5-VL-7B平均分从57.29提到59.29,涨了2分。分数不高,但思路有意思——不是无脑刷题,而是先找盲点再补。不过正文没披露这12个维度具体是什么、诊断样本怎么选,以及GRPO相比传统微调的成本差异。适合关注多模态微调策略的人看一眼,但别太激动,涨分幅度和验证规模都有限。
一句话点评
北大和山大给多模态大模型做了套“体检+补课”流程:先诊断12个能力维度的短板,每轮只用200个样本,再用多智能体生成针对性数据,最后用GRPO强化学习更新。在Qwen2.5-VL-7B上跑三轮,平均分从57.29涨到59.29——提升不大,但样本量极小,适合低成本快速迭代。正文没披露具体哪些维度提升最多,也没说诊断本身是否可靠。短评:样本少是亮点,但涨分幅度小,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
10:09
26d ago
新智元 · 公众号· rssZH10:09 · 05·18
AnySearch 号称能搜到谷歌找不到的 80% 互联网,开发者已经在接入了
AnySearch 5月11日上线后冲上 skills.sh 热榜第一。它用一个统一的接口去调 Reddit、代码仓库、股票数据等来源,相当于给大模型配了个能翻墙的搜索助手。正文没披露具体支持多少数据源、延迟多高,但如果是真的,等于把谷歌搜不到的论坛帖、代码片段、实时行情都拉进了对话里。
#Agent#RAG#Tools#AnySearch
精选理由
标题的80%和连夜接入是典型的钩子,但正文确实有上线日期、排名和覆盖的数据源,信息够用。没有定价、基准测试或规模数据,所以分数在60-71区间合理。
一句话点评
AnySearch 上线即冲热榜第一,号称能调 Reddit、代码库、股票数据等谷歌搜不到的 80% 互联网。相当于给大模型配了个能翻墙的搜索助手,开发者连夜接入。但正文没披露具体支持多少数据源、延迟多高,这点先别太激动。如果是真的,等于把论坛帖、代码片段、实时行情都拉进了对话里,挺省钱。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
08:32
26d ago
AI HOT 精选· aihot-apiZH08:32 · 05·18
阿里云 AgentScope Java 1.1 发布,主打企业级 Agent 的持久化与沙箱编排
阿里云发了 AgentScope Java 1.1,核心是让企业用 Java 搭 Agent 时能自动管理上下文、挂不同的文件系统,还能在安全沙箱里编排任务。说白了就是让 Agent 跑得更稳、更可控,适合放进生产环境。不过正文没披露定价和具体发布时间线,想上手的得自己去翻文档。
#Agent#Tools#Memory#Alibaba Cloud
精选理由
HKR-K和HKR-R通过,因为文章点名了具体的企业级Agent机制和生产痛点。HKR-H不通过;这是厂商版本更新,没有基准测试、采用数据、定价或路线图,所以分数落在60–71区间。
一句话点评
阿里云把 AgentScope Java 1.1 定位成企业级 Agent 框架,核心加了工作区持久化、可插拔文件系统和安全沙箱编排,说白了就是让 Java 搭的 Agent 能自动管上下文、挂不同存储、在沙箱里跑任务,更适合放进生产环境。但正文没披露定价和发布时间线,想评估成本或排期的得自己去翻文档。短评:企业 Java Agent 框架更新,主打稳和可控,但定价和时间线都没说。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
06:31
27d ago
r/LocalLLaMA· rssEN06:31 · 05·18
一个开源记忆工具让14B模型跨会话问答准确率从4%飙到97%
rtk-ai 开源的 ICM(上下文记忆模块)在本地跑了个测试:让 qwen2.5:14b 先读一篇密集的技术文档,然后关掉原文,在后续会话里回答10个事实性问题。不加 ICM 时准确率只有4%,加上后直接跳到97%。这个提升幅度很大,但正文没披露测试集规模、问题难度分布,也没说是否只测了单文档。如果效果稳定,等于给本地小模型装了个外挂记忆,不用每次重...
#Agent#RAG#Memory#rtk-ai
精选理由
HKR 三项都过,但这是一条单篇 Reddit 帖子,只有一个小型本地基准测试;复现细节和独立验证都没披露,所以不上精选。
一句话点评
rtk-ai 开源的 ICM 让 qwen2.5:14b 在跨会话记忆测试中从 4% 跳到 97%,相当于给本地小模型装了个外挂记忆,不用每次重读原文。但正文没披露测试集大小、问题难度分布,也没说是否只测了单文档,效果得打个折。如果稳定,对本地 agent 和 RAG 场景很实用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
06:28
27d ago
Product Hunt · AI· rssEN06:28 · 05·18
Voiser AI:140多种语言的AI配音,号称“真人感”
Voiser AI 是一个文本转语音工具,主打140多种语言和1000多种声音,还支持情感风格和自定义指令。它说自己生成速度快、听起来像真人,适合做视频、广告、播客的配音。不过正文没披露具体价格、API接口、延迟数据,也没说部署方式。有免费选项,但不知道免费额度够不够用。跟ElevenLabs、HeyGen这些竞品比,它多语言覆盖更广,但技术细节和成本...
#Audio#Voiser AI#Product update
精选理由
这是Product Hunt上一个普通的AI配音工具,唯一可验证的事实是140+语言。HKR-K通过,HKR-H和HKR-R不通过,因为缺少价格、API、延迟和质量细节。
一句话点评
Voiser AI 号称支持140多种语言、1000多种声音,还带情感风格和自定义指令,听起来挺全。但正文没披露具体价格、API接口、延迟数据和部署方式,只有个“免费选项”和70%折扣,不知道免费额度够不够用。跟ElevenLabs、HeyGen比,多语言覆盖是优势,但技术细节和成本都藏着,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
04:49
27d ago
Product Hunt · AI· rssEN04:49 · 05·18
Krea 2:一个主打风格控制和情绪板的AI图像模型
Krea 推出了自研的底层图像模型 Krea 2,核心卖点是风格控制和情绪板(moodboard)功能,适合做创意素材和设计灵感探索。产品页展示了大量视频样片,但正文没披露模型参数量、定价、是否开放API,也没有任何基准测试对比。目前有免费选项,但具体限制不清楚。如果你需要快速出图、对风格一致性有要求,可以试试,但想评估它跟 Midjourney 或 ...
#Vision#Krea#Product update
精选理由
这是一个小型的视觉产品更新,HKR-H 和 HKR-K 都偏弱;feed 只给了能力方向,没有参数、价格、上线范围或基准数据,所以够不上有趣更新的门槛。
一句话点评
Krea 2 是 Krea 自研的底层图像模型,主打风格控制和情绪板功能,适合做创意素材和设计灵感探索。产品页展示了大量视频样片,但正文没披露模型参数量、定价、是否开放API,也没有任何基准测试对比。目前有免费选项,但具体限制不清楚。如果你需要快速出图、对风格一致性有要求,可以试试,但想评估它跟 Midjourney 或 Flux 的差距,信息还不够。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R0
04:47
27d ago
● P1机器之心 · 公众号· rssZH04:47 · 05·18
openJiuwen 开源多智能体蜂群框架 JiuwenSwarm
openJiuwen 社区在「虾马」之后又开源了一个叫 JiuwenSwarm 的多智能体框架,把多个 AI 模型组织成“蜂群”来协作。框架拆成四块:Agent Swarm 管智能体编队、Swarm Skills 管技能包、Swarm Skills Hub 是技能市场、还有一套自进化机制让技能自己迭代。他们拿 PinchBench 跑了个分,Jiuwe...
#Agent#Tools#Memory#openJiuwen
精选理由
我会先打个折:openJiuwen 不是一线实验室,这篇又缺复现细节和基线对比,所以分数停在 78。但 HKR 三项都踩中了——“养蜂”说法有传播力,四个组件加 PinchBench 94.2% 给了硬信息,开源蜂群架构对做智能体编排的人确实有吸引力。正文没披露许可证和复现配置,这点先别太激动。
一句话点评
openJiuwen 社区开源了一个叫 JiuwenSwarm 的多智能体框架,主打“蜂群”式协作。但两篇来源文章都因环境异常无法读取正文,具体架构、性能数据和实际效果目前全看不到。
锐评
这条消息目前只能看个标题,两篇来源(机器之心和量子位)的微信文章都触发了环境异常验证,正文内容完全缺失。从标题判断,openJiuwen 社区在之前“虾马”项目之后,又推出了 JiuwenSwarm,定位是多智能体蜂群框架,强调群体智能和“养蜂”概念。 “蜂群”这个比喻在智能体领域不算新,通常指大量简单 agent 通过简单规则涌现出复杂行为,类似蚂蚁或蜜蜂的群体智能。但这类框架的落地难点一直在于:任务拆解是否可靠、agent 间通信开销多大、整体行为是否可控。正文没披露,这些关键点一个都验证不了。 我会先打个折。开源框架的新闻,如果连代码仓库链接、架构图、基准测试结果都没放出来,光靠标题里的“重磅”“引领”撑不起判断。等正文能读了,或者社区放出实际跑通的 demo 和对比数据,再评估不迟。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
04:00
27d ago
● P1FT · 科技· rssEN04:00 · 05·18
Musk 诉 Altman 案陪审团就 OpenAI 归属权作出裁决
FT 这篇付费文章只露了个标题和摘要,正文被订阅墙挡了。标题说 OpenAI 的 IPO 估值可能到 1 万亿美元,但 Elon Musk 的法律挑战可能搅黄它的商业化计划。具体开庭时间、IPO 条款、Musk 的诉求是什么,正文没披露。
#OpenAI#Elon Musk#Funding#Policy
精选理由
FT 这篇标题把 OpenAI 的万亿美元 IPO 和奥克兰陪审团直接挂钩,冲突感很强,但正文其实只说了马斯克的法律挑战可能阻碍其商业计划,审理时间表、IPO 具体条款都没披露。我会先打个折:钩子够猛,信息密度不够,所以放在 78 分这档,不是必写级别。
一句话点评
Altman 出庭作证了,但这场官司的核心不是谁更会说话,而是陪审团信谁的旧邮件和聊天记录。
锐评
这场审判走到陪审团阶段,说明双方都没能在庭前和解,现在把 OpenAI 的归属权交给 8 个普通人决定。Altman 出庭的表现被描述为“占上风”,但报道也提醒,证人席上的表现不一定能赢官司——陪审团最终看的是证据,不是口才。Musk 和 Altman 都在攻击对方可信度,这本身就说明书面协议存在模糊地带,否则不用打到这个地步。 FT 的报道点出了一个很实际的背景:OpenAI 正盯着千亿美元级别的 IPO,而这场在奥克兰陪审团房间里做出的裁决,会直接决定这家公司到底属于谁、以什么结构上市。Verge 的评论更直接,认为无论谁赢,都证明 AI 行业被错误的人领导。 目前公开报道主要围绕庭审戏剧性展开,对 Musk 当初到底承诺了什么、有没有书面协议、OpenAI 非营利转营利的具体条款这些关键事实披露有限。判决出来之前,所有“谁更有理”的判断都得先打个折。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
04:00
27d ago
FT · 科技· rssEN04:00 · 05·18
扫雷公司准备清理海湾航道
FT报道称,一批公司正在准备清理海湾地区的水雷,新一代无人艇可能帮助恢复这条重要航线的交通。正文没披露公司名称、部署时间、船只数量或技术细节。
#Robotics#Product update
精选理由
FT 来源有权威性,但 RSS 正文只给了无人扫雷概念和恢复航线的结论,没披露具体公司、部署规模或自主扫雷的技术机制。HKR 里只有 H 勉强成立,K 和 R 都缺信息,所以这条价值低,适合 all 分发。
一句话点评
FT报道称有公司准备用无人艇清理海湾水雷,但正文被墙,没披露公司名、部署时间、船只数量或技术细节。信息缺口太大,无法判断这是真进展还是画饼。短评:标题说无人艇扫雷,但正文被墙,信息为零。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
03:30
27d ago
FT · 科技· rssEN03:30 · 05·18
商学院开始教学生怎么跟AI协作,不只是教工具怎么用
FT这篇报道说商学院正在从教基础AI操作转向教人跟AI协作。正文被墙了,看不到具体开了哪些课、哪些学校在改、怎么教。标题透露的信息是:以前教的是“怎么用AI”,现在教的是“怎么跟AI一起干活”——后者更强调判断力、分工和决策,而不是点按钮。如果课程真落地,对AI从业者是个信号:企业对“人机协作”的需求已经大到商学院要专门开课了。但正文没披露课程规模、学...
#Commentary
精选理由
标题有趋势感,但正文信息量太少,既没有具体学校、课程数量,也没讲怎么教AI协作,只能算一个低价值的风向标。
一句话点评
商学院从教AI操作转向教人跟AI协作,核心是判断力、分工和决策,而非点按钮。但正文被FT墙了,看不到具体开了哪些课、哪些学校在改、怎么教。如果课程真落地,说明企业对“人机协作”的需求已大到商学院专门开课。缺课程规模、学员反馈和实际效果数据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
02:48
27d ago
r/LocalLLaMA· rssEN02:48 · 05·18
开源模型知识截止日期实测:Qwen 3.6-27B 和 Gemma4 都不知道 RTX 5060 Ti 存在
一位 Reddit 用户拿 RTX 5060 Ti 去问 Qwen 3.6-27B 和 Gemma4,两个模型都说这张卡不存在。帖子指出它们的知识截止日期是 2025 年初,但没透露具体用了哪个版本的数据训练。实测暴露的问题是:模型对 2025 年中期的新硬件信息完全空白,如果你依赖它们做选型或采购建议,这点先别太激动——它们可能连你刚发布的显卡都不认...
#Tools#Qwen#Gemma#ECrispy
精选理由
Reddit 用户拿一张不存在的显卡去问两个模型,结果它们都一本正经说没有,说明知识截止日期确实早于 5060 Ti 发布。但正文没披露具体训练数据版本,也没说测试了多少次、是不是单次偶然。信息量就这么多,不算重磅,但够当个趣闻。
一句话点评
实测 Qwen 3.6-27B 和 Gemma4 不认识 RTX 5060 Ti,因为知识截止在 2025 年初。如果你拿模型做硬件选型,这点先别太激动——它连你刚发布的显卡都不认。正文没披露具体用了哪个版本的数据训练,但暴露的问题是:模型对 2025 年中期的新硬件信息完全空白。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R1
02:23
27d ago
AI HOT 精选· aihot-apiZH02:23 · 05·18
上传自拍一键生成韩国棒球视频,PixVerse模板火了
PixVerse 的 K-Baseball Sprint 模板让你上传一张自拍,点一下就能生成一段韩国棒球风格的 AI 视频,不需要写提示词也不需要剪辑。这个模板在 X 上被疯转,但正文没披露具体播放量、定价或模型参数,所以热度到底多大、成本多低还不清楚。
#Multimodal#Vision#PixVerse#Product update
精选理由
HKR-H 靠视频模板的病毒钩子过关,但 HKR-K 缺数据、定价和模型细节,HKR-R 没打到从业者痛点。这只是一个产品/模板小更新,所以留在较低的 all 档。
一句话点评
PixVerse 搞了个韩国棒球风 AI 视频模板,上传自拍一键生成,不用写提示词,在 X 上被疯转。这种“零门槛”玩法确实容易出圈,但正文没披露播放量、定价或模型参数,热度多大、成本多低还不清楚。短评:模板化降低使用门槛,但没数据支撑前先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R0
01:51
27d ago
r/LocalLLaMA· rssEN01:51 · 05·18
FlashLM v9.7:用4个免费CPU核训2小时,模型100个token后就崩了
作者用4个免费CPU核心在TinyStories数据集上训了2小时,得到一个247万参数的小模型,验证集困惑度10.23。但所有FlashLM模型都无法保持连贯,大约输出100个token后就开始胡言乱语。成本确实低,但效果也基本不可用。正文没披露具体架构或训练细节,所以不清楚问题出在数据量太小还是训练方法本身有缺陷。
#Reasoning#Memory#Benchmarking#FlashLM
精选理由
HKR-K通过,因为帖子给出了具体的训练条件和验证指标。HKR-H和HKR-R偏弱:标题太干,而且一个100 token后就跑偏的小模型,受众面很窄。
一句话点评
用4个免费CPU核在TinyStories上训2小时,247万参数模型验证集困惑度10.23——成本极低,但输出约100个token后就开始胡言乱语,所有FlashLM模型都无法保持连贯。正文没披露具体架构或训练细节,所以不清楚问题出在数据量太小还是训练方法本身有缺陷。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H0·K1·R0
00:39
27d ago
AI HOT 精选· aihot-apiZH00:39 · 05·18
人机分拣直播:人类暂时领先,但机器人没掉链子
Figure 直播了一场机器人与人类比快递分拣的挑战,目前人类稍稍领先。正文没披露分拣件数、计时规则和机器人型号,所以这个“领先”有多大参考价值不好说。看点在于直播形式本身——敢把实时对比放出来,说明机器人至少能稳定跑完全流程,不会中途卡住或出错。
#Robotics#Figure#Benchmark
精选理由
HKR-H/R 通过:Figure 的人机分拣对决直播有竞争噱头,且触及仓库自动化焦虑。HKR-K 不通过:分拣件数、计时规则和机器人型号均未披露,信息缺口大,因此落在 60–71 分区间。
一句话点评
Figure 直播机器人和人类比快递分拣,目前人类稍稍领先。正文没披露分拣件数、计时规则和机器人型号,所以这个“领先”有多大参考价值不好说。看点在于直播形式本身——敢把实时对比放出来,说明机器人至少能稳定跑完全流程,不会中途卡住或出错。 短评:直播比输赢,信息太少先打折。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
00:29
27d ago
AI HOT 精选· aihot-apiZH00:29 · 05·18
Hermes 一个指令切换国内外大模型,支持 GPT-5.5、Grok-4.3、DeepSeek V4 等七家
Hermes 是一个模型切换工具,支持 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini、DeepSeek V4、智谱 GLM-5、Kimi K2.6 和小米 Mimo V2.5-pro 共七家模型。用户需要自己有对应服务的订阅或 API 密钥,配置好后用 /model 指令就能切换,比如输入 /model gpt-5.5 -...
#Tools#Hermes#OpenAI#xAI
精选理由
这是一条轻量级的工具配置提示,包含了/model切换和7类模型等可用细节,但来源和正文内容单薄。HKR仅K通过,因此落在60分区间。
一句话点评
Hermes 是个模型切换工具,支持 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini、DeepSeek V4、智谱 GLM-5、Kimi K2.6 和小米 Mimo V2.5-pro 共七家。用户需自备订阅或 API 密钥,配置后用 /model 指令切换。好处是省去手动换平台,但正文没披露切换延迟、是否支持流式输出、以及各家 API 成本对比。如果只是命令行切模...
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K1·R0
00:00
27d ago
● P1AI HOT 精选· aihot-apiZH00:00 · 05·18
Cursor 发布编程模型 Composer 2.5
Cursor 把代码助手 Composer 升级到了 2.5 版,底层还是基于月之暗面的 Kimi K2.5 开源模型。这次主要做了三件事:一是用“文字反馈强化学习”,在模型犯错的地方直接插一句提示(比如“提醒:可用工具有这些”),让模型在那个点上学会纠正,而不是靠最后的总分去猜哪里做错了;二是把合成训练数据的量提到了上一代的 25 倍,并且动态生成更...
#Agent#Code#Fine-tuning#Cursor
精选理由
HKR 三项都踩中了:Cursor 本身就是编程助手的核心入口,文章又给了 Moonshot 基座、25 倍合成数据、文本反馈 RL 和分片 Muon 这些实打实的训练细节。我会先打个折——正文没给基准测试、没提价格,也没说用户端能力边界,所以分数卡在 78–84 这个区间是合理的。
一句话点评
Cursor 把编程模型 Composer 2.5 放出来了,跑分涨了,还专门训了模型的沟通风格和“别瞎忙活”的节奏。
锐评
Cursor 这次更新 Composer 2.5,核心不是换了个更强的底座模型,而是把训练方法做了升级。它还是基于 Kimi K2.5 的开源检查点,但用了两个新招:一是“带文字反馈的定向强化学习”,说白了就是模型在干活过程中哪句话说错了、哪个工具用错了,直接在出错的地方插一句提示当老师,让模型只改那个点,而不是等整件事干完再给个模糊的总分。这对纠正代码风格、减少无效工具调用这类局部毛病很管用。二是用 25 倍于上一代的合成任务来练,动态挑更难的题,防止模型刷分刷到天花板。 官方给的跑分表确实涨了,但更值得看的是他们放出的“努力曲线”图——模型在长任务里更稳,不会干到一半开始摸鱼或过度折腾。正文没披露具体延迟和成本变化,也没说这个模型在真实项目里的通过率比 2.0 高多少。另外,他们提到正和 SpaceXAI 用百万张 H100 级别的算力从头训一个更大的模型,那才是真正的下一代,2.5 更像是一次训练工程上的中期升级。
HKR 分解
hook knowledge resonance
打开信源
97
SCORE
H1·K1·R1
00:00
27d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·18
AI 模型公司的两条死路与一条活路
AI21 Labs 裁员 60% 并停止卖模型,Meta 则把 7000 人调去搞 AI、再裁 8000 人。文章把这两件事放在一起看:独立卖模型的路已经走不通了,模型层正在商品化——GPT-5.5、Claude、Gemini 等顶级模型差距缩小,token 价格两年跌了 100 倍。能活下来的要么有主权背书(Mistral、Cohere)、要么有分销...
#AI21 Labs#Meta#Commentary#Personnel
精选理由
HKR三项都达标,但正文只有RSS摘要,没披露两家公司的时间表、成本结构或执行细节。适合作为一篇有意思的评论,不值得上头条。
一句话点评
AI21 Labs 裁员 60% 并停售模型,Meta 则强制调动 7000 人搞 AI、再裁 8000 人。文章把两件事放一起看:独立卖模型的路走不通了,模型层正在商品化——GPT-5.5、Claude、Gemini 等顶级模型差距缩小,token 价格两年跌了 100 倍。能活下来的要么有主权背书(Mistral、Cohere)、要么有分销渠道(Anthropic 嵌入三大云)。但正文没...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
00:00
27d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·18
Pi:一个更好的 AI 编程工具,被挡在了门外
Mario Zechner 做了一个极简的 AI 编程 agent Pi,system prompt 不到 1000 token,只有四个工具,但 benchmark 不输 Claude Code 和 Cline。Pi 的核心设计是“缺什么比有什么更重要”:没有 MCP(外挂工具协议)、没有 sub-agent(子任务黑盒)、没有权限弹窗、没有 con...
#Code#Tools#Pi#Anthropic
精选理由
HKR-H 和 HKR-R 通过:访问冲突的钩子对重度用 Claude 的开发者成立。HKR-K 不通过:价格、API 细节和限制机制正文都没披露,信息量不足,属于低价值区间。
一句话点评
Pi 是一个极简 AI 编程工具,system prompt 不到 1000 token,只有四个工具,benchmark 不输 Claude Code 和 Cline。设计哲学是“缺什么比有什么更重要”:没有 MCP、sub-agent、权限弹窗,用 tmux 和文件替代。亮点是 session trees(可分支回退)和 extensions 系统(agent 自己写插件)。但 adop...
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
2026-05-17 · 星期日2026年5月17日
23:07
27d ago
r/LocalLLaMA· rssEN23:07 · 05·17
AIPointer 接入 Ollama,找本地视觉模型用户当小白鼠
AIPointer 开发者正在给 v1.2.0 版本内置 Ollama 支持,计划下周发布。现在找 beta 测试者,要求 M 系列 Mac、RTX 3090/4090/5090、AMD ROCm 或 16GB 显存以上的显卡,帮忙反馈首 token 延迟(TTFT)、模型量化方式、硬件配置和工具调用失败的情况。正文没披露具体支持哪些视觉模型,也没说是...
#Vision#Tools#Agent#AIPointer
精选理由
这是一个小众开源应用的更新,没有跑分结果或广泛市场影响,所以分数卡在 60–71 区间。
一句话点评
AIPointer 要内置 Ollama 了,下周发 v1.2.0。现在找 beta 测试者,要求 M 系列 Mac、RTX 3090/4090/5090 或 16GB 以上显存。主要测首 token 延迟、量化方式和工具调用失败情况。正文没披露具体支持哪些视觉模型,也没说是否支持 Qwen 等常见本地模型。如果你手头有这些硬件,可以试试,但别指望开箱即用——beta 阶段工具调用可能翻车。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
21:59
27d ago
r/LocalLLaMA· rssEN21:59 · 05·17
2 张 3090 跑 MiniMax M2.7,128K 上下文,速度还行但不算快
Reddit 用户 wombweed 用 2 张 3090、256GB DDR4 内存和二手 10900X CPU,跑起了 MiniMax M2.7 模型(Q8_0 量化,128K 上下文,KV 缓存未量化)。提示处理速度约 50 tokens/秒,生成速度约 10 tokens/秒——对编码 agent 工作流来说够用,但不算快。作者特意选了 Q8_...
#Code#Inference-opt#MiniMax#wombweed
精选理由
一条 Reddit 用户的一手实测,数据具体、配置明确,对本地推理玩家有参考价值。但只有单点测试,没有可复现的基准或官方支持,所以定为 tier all。
一句话点评
Reddit 用户用 2 张 3090 加 256GB 内存跑起了 MiniMax M2.7 模型,Q8_0 量化下 128K 上下文,提示处理约 50 tokens/秒,生成约 10 tokens/秒。作者说对编码 agent 工作流够用,但速度确实慢——比高端卡差一个数量级。亮点是用了 CPU 分担 MoE 专家层(--cpu-moe),把 GPU 显存省给 KV 缓存。不过正文没披露具...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:36
27d ago
r/LocalLLaMA· rssEN21:36 · 05·17
Qwen3.5-122B 用 WebGL 实时渲染人脸,效果接近照片
Reddit 用户发帖展示 Qwen3.5-122B-A10B 模型(UD-Q3_K_XL 量化版)生成的 WebGL 实时人脸渲染,画面接近照片级。但帖子正文被屏蔽,没透露具体 prompt、运行环境或帧率,所以不清楚实际延迟和硬件门槛。如果是真的,说明大模型写 WebGL 代码的能力又进了一步,但这点先别太激动——缺少可复现的细节。
#Code#Vision#Qwen#Reddit
精选理由
HKR-H 靠 WebGL 人脸渲染 demo 钩子通过,但 HKR-K 和 HKR-R 都不满足:正文没披露提示词、运行环境、帧率、代码、成本或工作流影响,信息不足以支撑更高评分。
一句话点评
Qwen3.5-122B 的量化版号称能直接写 WebGL 代码,实时渲染出接近照片级的人脸。帖子正文被屏蔽,没透露 prompt、运行环境或帧率,所以不清楚实际延迟和硬件门槛。如果是真的,说明大模型写图形代码的能力又进了一步,但这点先别太激动——缺少可复现的细节。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
21:17
27d ago
r/LocalLLaMA· rssEN21:17 · 05·17
7900 XTX 跑 Qwen3.6-27B,开 MTP 投机解码从 22 tok/s 翻倍到 50 tok/s
一位用户在 7900 XTX 上用 llama.cpp Vulkan 跑 Qwen3.6-27B(Q4_K_M 量化),64K 上下文,开启 MTP 投机解码后首轮生成速度 22.6 tok/s;换成 q8 缓存把模型塞进显存后,生成速度直接翻倍到 50 tok/s。正文没披露具体显存占用和功耗,但 50 tok/s 对本地 27B 模型来说已经很快,...
#Inference-opt#Reasoning#Qwen#llama.cpp
精选理由
H/K/R 都达标,但这是 Reddit 单用户硬件测试,没有多卡或多模型复现,覆盖面窄。具体的 tok/s 数字和 q8 cache 条件让它在 60–71 实用信号区间里站得住脚。
一句话点评
7900 XTX 跑 Qwen3.6-27B,开 MTP 投机解码首轮 22.6 tok/s,换 q8 缓存塞满显存后翻倍到 50 tok/s。50 tok/s 对本地 27B 模型算很快了,但这是单用户单卡数据,没披露显存占用和功耗,实际部署成本未知。MTP 加速效果明显,但依赖模型和量化精度,通用性待验证。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
20:57
27d ago
r/LocalLLaMA· rssEN20:57 · 05·17
12GB显存跑本地安全模型,选7B还是硬上32B?
Reddit用户想用RTX 5070(12GB显存)跑本地大模型做网络安全,包括代码分析、逆向工程、写PoC脚本、总结威胁报告。他纠结几个点:7B-14B模型速度快,但32B模型部分卸载到系统内存(32GB DDR5)值不值得;量化选Q4还是Q5;上下文长度32k够不够,还是需要128k(比如Qwen2.5)。另外担心模型因为内容涉及漏洞或恶意软件而拒...
#Code#Tools#Reddit#Ollama
精选理由
HKR-R 通过,因为 12GB 显存跑本地 LLM 做安全工作是很多人关心的省钱又保隐私的场景;但 HKR-H 和 HKR-K 不通过:标题没新角度,正文没测试也没可复用的结论。
一句话点评
RTX 5070(12GB显存)跑安全分析,7B-14B模型最稳,32B模型卸载到系统内存(32GB DDR5)会明显变慢,不划算。量化选Q4_K_M,速度和质量平衡好。32k上下文够用,128k(如Qwen2.5)显存扛不住。模型拒答漏洞/恶意软件问题常见,正文没提具体哪些模型不拒,建议试Mistral或Llama 3.1的abliterated版。短评:12GB显存跑安全分析,7B-14...
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
20:19
27d ago
r/LocalLLaMA· rssEN20:19 · 05·17
把视觉模块嫁接到纯文本模型上,一个 Reddit 用户自己动手改了 llama.cpp 的代码
一位 Reddit 用户把 Pixtral-Large 的视觉模块(mmproj)挂到了 Behemoth-X 文本模型上,然后改了 llama.cpp 里 Pixtral 处理图片结束的 token,从 [IMG_END] 换成了换行符。这么做的原因是:原版代码在文本模型处理图片时会出现 turn-loss 问题(模型把图片后的第一句话当成下一轮对话...
#Multimodal#Vision#Audio#Mistral
精选理由
HKR 三项都达标,但这是 Reddit 上的本地模型小技巧,行业影响力有限。具体的 llama.cpp/Pixtral 机制让它比灌水帖强,但够不上精选。
一句话点评
有人把 Pixtral-Large 的视觉模块嫁接到 Behemoth-X 纯文本模型上,改了 llama.cpp 里图片结束 token 为换行符,解决了图片后第一句话被当成下一轮对话的 turn-loss 问题。这相当于给文本模型加了个眼睛,成本低(只换模块不改训练),但正文没披露视觉对齐效果和推理速度。短评:低成本嫁接视觉,但效果和速度未知。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
19:49
27d ago
r/LocalLLaMA· rssEN19:49 · 05·17
M5 Mac、DGX Spark、Strix Halo、RTX 6000 跑本地大模型,谁快?
Reddit 用户 Signal_Ad657 花了三天,用统一测试脚本跑了四套本地 AI 硬件。RTX 6000 内存带宽约 1800 GB/s,M5 约 600 GB/s,DGX Spark 和 Strix Halo 都在 256 GB/s 左右。带宽直接决定大模型推理速度,RTX 6000 领先 M5 三倍,领先后两者七倍。不过正文没披露具体跑的是...
#Inference-opt#Benchmarking#Signal_Ad657#NVIDIA
精选理由
HKR 三项都达标,但来源是 Reddit 上单个用户的硬件测试,不是官方发布或大规模基准。数字有用,权威性和覆盖面有限,所以分数卡在 69 这个高位区间。
一句话点评
RTX 6000 带宽 1800 GB/s,是 M5 的三倍、DGX Spark 和 Strix Halo 的七倍,跑大模型推理快很多。但这是 Reddit 用户自测,没披露具体模型和量化精度,参考价值打折。如果是真的,买 DGX Spark 前得想清楚:便宜但带宽只有 256 GB/s,跑大模型会慢。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
19:46
27d ago
TechCrunch AI· rssEN19:46 · 05·17
马斯克诉OpenAI案:信任成了核心问题
马斯克和OpenAI的律师本周做了结案陈词,陪审团要决定OpenAI在转型为营利组织的过程中是否违规。但庭审最后几天的一个大主题是:OpenAI CEO Sam Altman到底值不值得信任。比如马斯克的律师拿Altman在国会作证时的说法追问真假。TechCrunch记者指出,马斯克自己也没少说误导性的话,而且信任问题不只针对Altman——所有AI...
#Safety#Elon Musk#OpenAI#Sam Altman
精选理由
H 和 R 通过:Musk 告 OpenAI 庭审有真实的治理戏剧性。K 不通过:RSS 只给了信任角度,没有新证词、裁决里程碑或监管后果。
一句话点评
马斯克诉OpenAI案结案陈词,陪审团要判OpenAI转营利是否违规。庭审最后几天焦点变成:Altman值不值得信任?马斯克律师拿他国会证词追问真假。但记者指出马斯克自己也说过不少误导话,而且信任问题不只针对Altman——所有AI公司都面临。正文没披露陪审团倾向或判决时间。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
19:36
27d ago
FT · 科技· rssEN19:36 · 05·17
阳狮22亿美元收购数据公司LiveRamp,给AI营销补数据弹药
阳狮集团(Publicis)宣布以22亿美元收购美国数据公司LiveRamp,官方口径是“深化AI营销”。22亿美元买的是数据打通能力——LiveRamp的核心是把线上浏览、线下购买、电视广告等不同来源的用户ID串起来,让广告主知道同一个人的跨屏行为。这对AI营销的实际意义是:模型需要喂“谁看了什么、买了什么”的关联数据,LiveRamp正好提供这种清...
#Publicis#LiveRamp#Funding
精选理由
22亿美元的收购金额是实打实的数字,说明数据资产在AI营销里的竞争在升级。但正文没披露交易结构、时间表或具体AI机制,信息缺口明显,所以分数压在60–71区间。
一句话点评
阳狮22亿美元买LiveRamp,核心是拿用户ID打通能力喂AI营销模型。但正文被墙,交易结构、交割时间、具体怎么跟AI结合都没披露。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R0
18:55
27d ago
Product Hunt · AI· rssEN18:55 · 05·17
Haystack:帮你筛出真正需要人看的 PR
Haystack 是一个挂在 GitHub 上的 PR 审查工具,专门应对 AI 写代码后 PR 数量暴增的问题。它会分析每个 PR 的代码差异、上下文、AI 代理的执行轨迹、意图和验证证据,然后自动分类:安全的直接放行,有问题的打回修改,只有需要人工判断的才推给开发者。正文没披露具体的审查机制、支持哪些仓库、集成方式和定价。
#Code#Tools#Haystack#Product update
精选理由
一个小众 Product Hunt 工具发布;只有 HKR-R 勉强通过。没有披露机制、定价、集成方式或测试结果,属于低价值的产品更新,但也不至于直接排除。
一句话点评
短评:AI写代码后PR暴增,Haystack自动筛出需要人看的,省时间。但正文没披露审查准确率、支持哪些仓库、定价,先别太激动。 点评:Haystack挂在GitHub上,分析PR的代码差异、上下文、AI代理执行轨迹和验证证据,然后自动分类:安全的直接放行,有问题的打回修改,只有需要人工判断的才推给开发者。思路很直接——AI写代码后PR数量暴增,人工一个个看效率太低,Haystack相当于...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
18:18
27d ago
r/LocalLLaMA· rssEN18:18 · 05·17
一个开发者从 Composer 2/Kimi 2.6 换到 Qwen3.6:35b-a3b,说能撑住 60 小时周工作量
一位 Reddit 用户分享,他把 Composer 2 和 Kimi 2.6 换成了 Qwen3.6:35b-a3b,用来处理 50 万到 70 万行代码的企业级项目。他说这个模型能支撑他每周 60 小时的开发工作流,而且通过 OpenRouter 调用,算上缓存等优化后,每百万 token 成本大约 0.08 美元。这个价格比很多闭源模型便宜不少,...
#Code#Vision#Agent#Qwen
精选理由
H、K、R 三项都够,但这是一条 Reddit 个人经验,有工作量和成本数字,不是可复现的基准测试或正式发布。放在 60-71 分区间合适,作为一线从业者的实用参考。正文没披露具体任务类型、缓存命中率、以及是否涉及视觉或 agent 场景,这些缺口会影响结论的泛化能力。
一句话点评
一位开发者用 Qwen3.6:35b-a3b 替代 Composer 2 和 Kimi 2.6,处理 50-70 万行代码的企业项目,每周工作 60 小时。通过 OpenRouter 调用,算上缓存后每百万 token 成本约 0.08 美元,比多数闭源模型便宜。但这是个人分享,缺乏系统评测,且正文被屏蔽,无法验证具体效果和稳定性。如果是真的,对预算有限的团队挺省钱。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
18:15
27d ago
r/LocalLLaMA· rssEN18:15 · 05·17
Qwen3.6 27B 打不过旧版 Coder?用户实测翻车
一位 Reddit 用户在 96GB Strix Halo 机器上用 llama.cpp 跑 Qwen3.6 27B Dense Q8,结果在 opencode 和合成测试里输给了旧版 Qwen-Coder-Next Q5。用户没贴具体分数、测试提示词和可复现日志,所以没法判断是量化损失、测试集偏差还是模型本身退步。如果是真的,那新模型在代码任务上可能...
#Code#Benchmarking#Inference-opt#Qwen
精选理由
HKR 三项都达标:帖子有一个反直觉的模型排名结论,加上具体的测试环境和硬件细节。但缺少分数、且是单用户 Reddit 来源,所以分数落在 60–71 区间。
一句话点评
一位用户在96GB Strix Halo机器上跑Qwen3.6 27B Q8,发现代码能力不如旧版Qwen-Coder-Next Q5。没贴分数、提示词和日志,所以没法判断是量化损失、测试集偏差还是模型真退步。如果是真的,新模型在代码任务上可能没进步甚至倒车,但证据太弱,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
17:29
27d ago
Hacker News 首页· rssEN17:29 · 05·17
欧盟考虑限制政府用美国云服务处理敏感数据
欧盟正在讨论出台规则,限制成员国政府用美国云服务商(比如微软Azure、谷歌云、AWS)处理敏感数据。正文没披露具体覆盖哪些机构、什么算敏感数据、以及执行时间表。目前只有CNBC的报道,没有正式提案文本。作者认为这事早该做,但很多成员国已经深度绑定美国云,比如荷兰刚把政府ID服务公司卖给美国企业,欧盟层面强制立法可能是唯一出路。评论里有人指出,就算数据...
#European Union#Policy
精选理由
HKR-H 和 HKR-R 靠云主权冲突过关,但 HKR-K 不成立:只有标题级事实,没有具体范围或时间表。这条新闻跟 AI 基础设施(云)沾边,不是 AI 产品或模型本身的故事。
一句话点评
欧盟想限制成员国政府用微软Azure、谷歌云、AWS处理敏感数据,但正文没披露具体覆盖哪些机构、什么算敏感数据、执行时间表。目前只有CNBC的报道,没有正式提案文本。作者认为早该做,但很多成员国已深度绑定美国云,比如荷兰刚把政府ID服务公司卖给美国企业,欧盟层面强制立法可能是唯一出路。评论指出,微软在欧盟的数据中心已受当地法律管辖,限制未必能提升安全,反而可能推高成本。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
16:38
27d ago
r/LocalLLaMA· rssEN16:38 · 05·17
本地模型做会议记录够用吗?一个 Reddit 帖子的提问
一个 Reddit 用户说 Bluedot 能搞定会议录制、转录、摘要、待办和搜索,还提到 Claude MCP 可以用自然语言查历史会议。但帖子只问了本地模型能不能做到同样的事,正文没披露用了什么本地模型、准确率多少、延迟多高、跑在什么硬件上,也没说部署条件。所以这个问题目前没有答案,只是抛出了一个需求。
#Memory#Tools#Bluedot#Commentary
精选理由
HKR-H 和 HKR-R 通过,因为本地会议记忆这个提问很实际,且跟从业者身份强相关。HKR-K 不通过:正文没披露任何模型名称、准确率数据或可复现的部署条件。
一句话点评
用户问本地模型能否替代Bluedot做会议记忆,但正文没披露用了什么模型、准确率、延迟或硬件。问题本身有价值,但信息缺口太大,没法判断可行性。Bluedot的转录+摘要+搜索功能对本地模型来说,瓶颈通常在长上下文和实时性,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
16:33
27d ago
AI HOT 精选· aihot-apiZH16:33 · 05·17
开源工具把微信读书数据变成26种图表,帮你复盘两年阅读习惯
开发者姚老师开源了 yao-weread-skill,一个能把微信读书数据导出成本地可视化报告的工具。它分析你近两年的阅读时长、节奏、书架构成、分类和作者偏好,还能对笔记和想法做语义分析,最后用词云、热力图、雷达图等26种图表展示。代码已公开在 GitHub。适合想用数据复盘自己阅读习惯的人,但正文没披露数据导出是否需要手动操作、隐私风险如何,以及是否...
#Tools#GitHub#WeRead#姚老师
精选理由
HKR-H和HKR-K靠26种图表和个人数据分析钩子通过,但正文没披露任何AI模型、智能体机制或工作流影响,低于AI雷达相关性门槛,按<40规则归为excluded。
一句话点评
姚老师开源了一个微信读书数据可视化工具,能分析近两年阅读时长、节奏、书架构成等,并用26种图表展示。对想用数据复盘阅读习惯的人挺实用。但正文没披露数据导出是否需要手动操作、隐私风险如何,以及是否支持增量更新。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H1·K1·R0
16:04
27d ago
Hacker News 首页· rssEN16:04 · 05·17
Mistral CEO:欧洲还有两年窗口期,否则将沦为美国AI的“附庸国”
Mistral CEO Arthur Mensch 在法国议会听证会上警告,欧洲只剩两年时间避免在AI基础设施(芯片、能源、算力)上依赖美国,否则将沦为“附庸国”。文章来自 Business Insider,但正文被付费墙挡住,没有披露他具体拿什么数据或案例支撑这个两年窗口期——比如欧洲目前算力缺口多大、本土芯片产能多少、能源成本对比如何,这些关键信息...
#Mistral#Business Insider#Hacker News#Commentary
精选理由
HKR-H和HKR-R通过:标题的“2年”和“附庸国”措辞很抓眼球,且切中AI主权焦虑。HKR-K不通过:正文没有给出任何证据、政策路径或能力差距,所以这篇只能归到60–71分的评论类。
一句话点评
Mistral CEO 在法国议会喊话:欧洲只剩两年窗口期,否则就会沦为美国 AI 的“附庸国”。这话挺狠,但正文被付费墙挡住了,没披露他到底拿什么数据支撑——欧洲算力缺口多大?本土芯片产能多少?能源成本差多少?这些关键数字全缺。Hacker News 上 66 分、71 条评论,说明社区在吵但没定论。短评:口号响亮,证据欠奉,先别急着站队。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
15:56
27d ago
r/LocalLLaMA· rssEN15:56 · 05·17
ROCm 7.13 夜版给 Strix Halo 加了优化,但没给跑分
AMD 的 ROCm 7.13 技术预览版针对 Ryzen AI Max 300“Strix Halo”做了优化,还把 ROCprof 跟踪解码器开源了。GitHub 上能下源码自己编译,但正文没披露具体提升了多少、测试条件是什么,也没说正式版什么时候发。想尝鲜可以自己试,但先别太激动,数据缺口太大。
#Inference-opt#Tools#AMD#ROCm
精选理由
HKR-K 和 HKR-R 通过,但 HKR-H 偏弱:这是 ROCm 的 nightly 小版本更新,没有跑分、测试条件或发布时间表。对本地推理用户有信息价值,但不够格做头条。
一句话点评
AMD 的 ROCm 7.13 技术预览版专门优化了 Strix Halo(Ryzen AI Max 300),还把 ROCprof 跟踪解码器开源了。GitHub 上能下源码自己编译,但正文没披露具体性能提升多少、测试条件是什么,也没说正式版发布时间。想尝鲜可以自己试,但数据缺口太大,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
15:51
27d ago
r/LocalLLaMA· rssEN15:51 · 05·17
自己搭的 agent 流程,用 Qwen3.5 9B 小模型替换了 Claude Code 99% 的工作
Reddit 用户 DeltaSqueezer 自己写了一套 agent 工作流,底层模型用的是 Qwen3.5 9B(一个 90 亿参数的小模型)。为了绕开小模型的上下文窗口限制(不能一次性塞几百个文件),他用了 map-reduce 模式——把大任务拆成小块并行跑,跑完再合并结果。同时强制模型输出结构化数据,减少随机性,让合并步骤更稳定。他还搭了一...
#Agent#Code#Tools#Qwen
精选理由
这是 Reddit 用户的个人经验分享,机制讲得清楚,但 99% 替代率是自报数据,没有可复现的基准测试或开源工具。信息缺口在于:没披露具体任务类型、失败案例、以及 Qwen3.5 9B 在复杂任务上的实际表现。所以虽然 H/K/R 都成立,但证据强度有限,放在默认档位比较稳妥。
一句话点评
Reddit 用户 DeltaSqueezer 用 Qwen3.5 9B(90亿参数小模型)搭了一套 agent 工作流,靠 map-reduce 拆任务、强制结构化输出来绕开小模型上下文窗口限制,声称已替代 Claude Code 99% 的任务。关键看点是:小模型+好流程能打,但这是个人项目,没披露任务类型和成功率,且作者承认自己成了瓶颈(等审批)。这点先别太激动,99% 可能只针对他自...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
14:36
27d ago
AI HOT 精选· aihot-apiZH14:36 · 05·17
Codex 自己做了条视频,演示怎么用文本直接生成解说动画
这个方案把四个工具串起来:PPT Skill 负责画面和动效,HyperFrames 管时间线和渲染,Listenhub Skill 做配音,即梦 CLI 补片段。用户直接在 Codex 里输入文字,就能生成带动效的解说视频,还能在聊天界面预览。适合快速做产品介绍视频。正文没提价格、时长限制和输出分辨率。
#Agent#Code#Tools#Codex
精选理由
H/K/R 都过,因为演示给出了具体的 Codex 到视频的工作流,对实践者有吸引力。重要性留在 all:这是单个 X 的 demo,没有代码、指标或正式发布信息,正文也没披露生成一条视频的成本和延迟。
一句话点评
把PPT动效、时间线渲染、配音和视频补片段四个工具串成一条流水线,用户只在Codex里打字就能出解说视频。好处是快,适合产品介绍这种短平快场景。但正文没提输出分辨率、时长上限和价格,实际可用性要打折——如果只能出720p、30秒,那离“替代剪辑”还远。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:15
27d ago
r/LocalLLaMA· rssEN14:15 · 05·17
给 llama.cpp 配了个图形界面,不用再背命令行参数了
一位开发者做了 Hexllama,给 llama.cpp 套了个模板管理器和 GUI。核心功能:用模板保存常用参数组合、一键切换 llama.cpp 版本、直接从 Hugging Face 下 GGUF 模型、同时跑多个模型在不同端口、以及纯 API 模式。项目 MIT 开源免费。正文没披露性能对比或资源占用,但如果你嫌每次敲命令行麻烦,这个能省点事。
#Tools#Inference-opt#Hexllama#llama.cpp
精选理由
一个 Reddit 个人项目,功能实在但没披露用户量、跑分或维护者背景,属于正常的产品更新,不放大。
一句话点评
Hexllama 给 llama.cpp 套了个图形界面,核心卖点是模板管理:把常用参数存成模板,下次一键加载,不用再背命令行。还支持一键切换 llama.cpp 版本、从 Hugging Face 直接下 GGUF 模型、多模型同时跑在不同端口。MIT 开源免费。但正文没披露性能对比或资源占用,实际用起来会不会比命令行更吃内存、切换版本是否稳定,都不清楚。如果你嫌每次敲命令行麻烦,这个能省...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
14:00
27d ago
● P1彭博科技· rssEN14:00 · 05·17
Apple新版Siri应用将支持自动删除聊天记录
彭博社爆料 iOS 27 会有一个类似 ChatGPT 的 Siri 独立应用,核心卖点是聊天记录会自动清理。文章没提保留多久、什么时候上线,也没说具体功能细节。另外 Siri 这次可能还是挂着“Beta”标签,同时 Genmoji(AI 生成表情)也会升级。
#Agent#Multimodal#Apple#Siri
精选理由
我会先打个折:标题很抓人,但正文能落地的料太少。Bloomberg 这篇把 Siri 往 ChatGPT 方向靠,还强调聊天会自动删,隐私角度确实能引起讨论。可翻遍正文,只说了 iOS 27 会有 Genmoji 升级,自动删除的保留多久、什么时候上线、Siri 本身怎么改,全都没披露。这点先别太激动,信息缺口摆在那。不过对做 AI 的人来说,苹果在隐私和功能之间怎么取舍,本身就是个长期看点,所以还是值得扫一眼。
一句话点评
新版Siri会像聊天软件一样自动删记录,但苹果还没说清楚是本地删还是云端也删。
锐评
苹果要给Siri加自动删除聊天记录的功能,这步棋走得挺聪明——既想让你像用ChatGPT一样随便聊,又用“阅后即焚”来安抚隐私焦虑。Bloomberg的爆料提到,iOS 27里Siri会变成一个独立App,聊天记录默认自动清除,但正文没披露具体保留多久、是本地删除还是服务器端一并抹掉。Verge和TechCrunch的跟进也基本是转述同一篇爆料,没有苹果官方的确认。 对从业者来说,这个功能的技术门槛不高,难的是怎么在“删记录”和“模型需要上下文学习”之间做平衡。如果每次对话都清空,Siri就很难记住你的习惯,个性化能力会打折。另外,苹果会不会把删除前的数据用于模型训练,正文完全没提,这是最大的信息缺口。先别太激动,等WWDC看官方怎么圆这个隐私和体验的跷跷板。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K0·R1
13:25
27d ago
r/LocalLLaMA· rssEN13:25 · 05·17
Qwen3.6-27B MTP 深度测试:深度3提速1.83倍,深度4反而崩了
一位用户在 RTX 3090Ti 上跑了 Qwen3.6-27B 的 MTP(多 token 预测)GGUF 量化版。深度3时速度冲到 75.2 tokens/s,是关闭 MTP 时的 1.83 倍,说明这个技巧在消费级显卡上确实能白嫖速度。但深度4直接掉到 7.93 tokens/s,比不开还慢,推测是显存或带宽撑不住了。正文没披露具体量化等级和上下...
#Inference-opt#Benchmarking#Code#Qwen
精选理由
一条 Reddit 用户实测帖,在 RTX 3090Ti 上跑 Qwen3.6-27B 的 GGUF 量化版,MTP 3 生成速度 75.2 t/s,是无 MTP 的 1.83 倍。数字实在,对本地部署党有参考价值。但只是单点测试,不是官方发布,正文也没披露功耗、显存占用或长序列稳定性,所以评分压在 66 分合理。
一句话点评
Qwen3.6-27B 在 RTX 3090Ti 上开 MTP 深度3,速度冲到 75.2 tokens/s,比不开快 1.83 倍,消费级显卡白嫖加速挺香。但深度4直接崩到 7.93 tokens/s,比基线还慢,显存或带宽瓶颈明显。正文没披露量化等级和上下文长度,这俩变量对结果影响很大,实测前别直接套用。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
12:44
27d ago
Hacker News 首页· rssEN12:44 · 05·17
ShurikenTrade 开源了一个让 AI 代理直接调用交易技能的仓库
ShurikenTrade 在 GitHub 上开源了 shuriken-skills,一个让 AI 代理(agent)直接调用交易功能的集成技能库。说白了就是给交易模型预装了一堆“技能插件”,比如下单、查行情、设止损,代理按需调用,不用每次都从头写逻辑。项目目前只有 4 个 Star、0 个 Issue,还非常早期。正文没披露这些技能具体怎么防乱操作...
#Agent#Safety#Tools#ShurikenTrade
精选理由
H和R两条都成立,但K不成立:正文没给机制、指标或可复现条件。当成一个低信息量的开源链接处理,不值得上推荐位。
一句话点评
ShurikenTrade 开源了一个给交易 agent 用的技能库,预装了下单、查行情、设止损等插件,agent 按需调用。项目才 4 个 Star,非常早期。正文没披露这些技能具体怎么防乱操作,安全护栏的设计是空的。
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H1·K0·R1
12:09
27d ago
Hacker News 首页· rssEN12:09 · 05·17
Apple Silicon本地运行成本高于OpenRouter在线服务
作者算了一笔账:用 M5 Max MacBook Pro 本地跑 Gemma 4 31b,算上电费和硬件折旧,每百万 token 成本约 1.5 美元,而 OpenRouter 上同模型只要 38-50 美分,速度还快 2-7 倍。电费其实很便宜(满载一天不到 5 毛钱),大头是硬件折旧——一台 4299 美元的笔记本,按 5 年寿命摊下来每小时近 1...
#Inference-opt#Apple#OpenRouter#Hacker News
精选理由
硬排除——零来源。RSS 只有标题和 HN 热度数据,没有能耗、模型、价格或测试条件,无法验证核心论断。HKR-H 和 HKR-R 通过,但 HKR-K 不通过。
一句话点评
本地跑大模型不一定比调 API 省钱。作者实测 M5 Max 跑 Gemma 4 31B,算上硬件折旧和电费,每百万 token 成本约 1.5 美元,是 OpenRouter 同类模型的三倍,速度还慢一半。硬件折旧是大头,电费反而忽略不计。不过正文只测了 M5 Max 一种配置,没对比其他 Apple Silicon 或 GPU 方案,也没算网络延迟和隐私价值。如果你对延迟敏感或数据必须本...
HKR 分解
hook knowledge resonance
打开信源
51
SCORE
H1·K0·R1
12:04
27d ago
彭博科技· rssEN12:04 · 05·17
中国能源基建可能成为AI竞赛的隐藏王牌
彭博采访了三位美国政策界人士,他们表示中国在输电、可再生能源、电池和发电上的投资,正在把AI竞争从芯片和软件延伸到数据中心所需的电力上。前财长保尔森警告,美国AI技术虽然领先,但数据中心用电激增可能导致电力短缺。前驻华大使博卡斯说,中国在能源基建上的巨额投入已经在重塑全球供应链。胡佛研究所学者认为,北京的清洁能源战略既是气候政策,也是经济和地缘政治筹码...
#Bloomberg#Hank Paulson#Nicholas Burns#Commentary
精选理由
Bloomberg 采访 3 位美国政策人士,提出一个反直觉判断:中国在电力基础设施上的大规模投资,可能让 AI 竞争从芯片延伸到电力供给。这个视角有信息增量,但正文没披露中国当前数据中心耗电量、新增输电容量或可再生能源占比等关键数字,说服力有限。作为评论性文章,适合从业者了解地缘视角,但不宜直接指导决策。
一句话点评
彭博采访三位美国政策人士,核心观点:中国在输电、可再生能源、电池和发电上的巨额投资,正把AI竞争从芯片延伸到电力。前财长保尔森警告美国数据中心用电激增可能导致缺电;前驻华大使博卡斯说中国能源基建已重塑全球供应链;胡佛学者认为清洁能源战略也是经济和地缘筹码。 关键数字:正文没披露具体投资额或电力缺口数据,来源是RSS摘要,信息有限。 缺什么:缺中国实际电力装机增速、数据中心用电占比、以及美...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
10:57
27d ago
r/LocalLLaMA· rssEN10:57 · 05·17
RTX 5090 跑 Qwen3.6-27B,开网上推荐的加速选项反而掉速
一位用户在 Docker 里用 RTX 5090 跑 Qwen3.6-27B 的 GGUF 模型,试了网上常见的 draft-mtp 等加速选项,结果吞吐从 100 tok/s 掉到 80 tok/s。正文没披露具体配置和测试方法,所以不清楚是选项冲突还是 Docker 环境问题。如果你也在本地跑大模型,这个案例提醒你:网上推荐的参数不一定通用,最好自...
#Inference-opt#Qwen#Reddit#InternalMode8159
精选理由
单个 Reddit 用户测试,有完整配置和吞吐数据,所以 H/K/R 都成立;但只是 Qwen3.6-27B GGUF 的单一场景,没有对比其他模型或解释机制,所以分数维持在 60-71 区间。
一句话点评
RTX 5090 跑 Qwen3.6-27B,网上抄的 draft-mtp 加速参数反而让吞吐从 100 tok/s 掉到 80 tok/s。正文没披露 Docker 挂载、CUDA 版本或测试脚本,所以不清楚是选项冲突还是容器开销。提醒:本地推理的“最佳实践”经常是特定硬件+裸机环境测出来的,照搬可能负优化。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
10:44
27d ago
r/LocalLLaMA· rssEN10:44 · 05·17
12个模型同题PK:谁能在单HTML文件里画一个开车动画?
Reddit用户AkiDenim用同一个Canvas提示词测试了12个模型,要求生成一个不依赖任何库或外部资源的独立HTML文件,实现开车动画。帖子只展示了结果截图,没有透露生成耗时、token速度或量化评分,所以只能看个大概,没法直接比谁快谁准。开源模型和闭源前沿模型都有参与,但具体表现差异正文没细说。
#Code#Tools#Benchmarking#GPT-5.5
精选理由
开源 vs 前沿模型在 Canvas 动画编码上的对决,标题有冲突感。12 个模型同提示、单文件、无库无外部资产的条件够硬,但正文没披露 tok/s、生成耗时和量化评分,信息缺口明显,所以放在 all 层,先别太激动。
一句话点评
同一个Canvas提示词测12个模型,只看截图结果,没给生成耗时和token速度,只能看个大概。开源和闭源都有参与,但具体谁快谁准正文没披露。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
10:24
27d ago
r/LocalLLaMA· rssEN10:24 · 05·17
双卡跑大模型提速40%,一个llama.cpp分支修复了量化KV缓存的张量分配bug
Reddit用户发了一个llama.cpp分支,修复了--split-mode tensor与量化KV缓存不兼容的问题。实测3060 12GB加4070 Super 12GB,跑Qwen3.5 27B Q4_K_M加q8_0 KV缓存,生成速度从21.22涨到30.05 tokens/s(提升约42%),但预填充从582.60降到544.82 toke...
#Inference-opt#Code#llama.cpp#Qwen
精选理由
一个 Reddit 用户 fork 了 llama.cpp,修了双卡推理时 --split-mode tensor 和量化 KV cache 打架的问题。实测 3060 12GB + 4070 Super 12GB 跑 Qwen3.5 27B,tg32 从 21.22 提到 30.05 tokens/s,提升约 42%。对本地玩家来说,不用换卡就能多挤点速度,挺实在。不过来源是个人 fork,没提稳定性、显存占用细节,也没说其他模型或卡组效果如何。
一句话点评
一个llama.cpp分支修了双卡跑大模型时量化KV缓存不兼容的bug。实测3060+4070 Super跑Qwen3.5 27B,生成速度从21涨到30 tokens/s(+42%),预填充略降。修的是tensor切分模式,不是更常见的row模式,适用面有限。代码已开源,但正文没披露显存占用变化。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
10:22
27d ago
● P1量子位 · 公众号· rssZH10:22 · 05·17
蔚蓝科技发布BabyAlpha A3四足机器人,搭载国产异构芯片
蔚蓝科技发了款消费级机器狗 BabyAlpha A3,用六颗芯片搭了个异构计算集群,直接在本地跑 7B 参数的大模型,推理速度到 280 TPS。视觉上配了 6600 万像素的摄像头,每秒能扫出 223.2 万个点云数据点,计划第三季度上市。不过正文因为环境验证没抓到具体内容,上面这些数字都来自外部摘要,实际表现和定价还没法核实。
#Robotics#Inference-opt#Multimodal#Weilan Technology
精选理由
我会先打个折:正文是单篇产品发布稿,没披露功耗、价格和对比基准,所以别太激动。但这条消息确实有料——蔚蓝科技在机器狗里塞了6颗芯片搭异构集群,本地跑70亿参数模型,推理速度标到280TPS,Q3就要上市。对做端侧部署和机器人的人来说,这等于给“离了英伟达行不行”提供了一个实物样本。信息缺口也很明显:没写具体芯片型号、没给功耗数据、没说明280TPS是在什么精度和batch size下测的,这些都会影响实际可用性。综合来看,角度抓人、事实具体、但验证信息不足,放在featured门槛上刚好。
一句话点评
蔚蓝科技新机器狗用国产芯片跑通了70亿参数大模型,成本号称只有英伟达方案的十分之一,但正文没披露具体芯片型号和实测延迟。
锐评
这条新闻的核心看点不是机器狗本身,而是它肚子里那块国产异构芯片。蔚蓝科技声称在BabyAlpha A3上本地跑通了70亿参数的大模型,并且把成本压到了英伟达Jetson Thor方案的十分之一。如果属实,这对做端侧部署的团队是个好消息——不用再被英伟达的供货周期和价格卡脖子。 但目前的公开信息太少了。机器之心那篇原文因为微信环境异常根本打不开,我们只能看到标题里的几个数字。算力提升1000倍这个说法需要看跟谁比,如果是跟前代产品比,那前代得多弱才能差出三个数量级。另外,70亿参数模型在机器狗上具体跑什么任务、推理延迟多少、功耗多大,这些关键指标一概没提。 我会先给这条新闻打个七折。国产芯片替代是个真趋势,但“跑通”和“能用”之间还有很长距离。等实测数据和具体芯片型号出来再判断不迟。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
10:12
27d ago
AI HOT 精选· aihot-apiZH10:12 · 05·17
Garry Tan 开源 GBrain:给 AI Agent 装一个 8 层记忆系统
Garry Tan 开源了一个叫 GBrain 的知识系统,不是简单的“外挂资料库”,而是用 8 层结构解决 AI Agent 记不住事的问题。前 4 层升级检索,后 4 层让 Agent 能记住用户的人际关系、决策过程甚至认知变化,实现终身记忆和自我进化。OpenClaw、Hermes 等 Agent 已经在生产环境用它处理大量数据。用户可以通过安装...
#Agent#RAG#Memory#Garry Tan
精选理由
Garry Tan 开源 GBrain,用 8 层结构改造 Agent 记忆:前 4 层增强检索,后 4 层处理终身记忆和自我进化。这个 4+4 拆分给出了具体机制,比泛泛的“记忆系统”更实在。但正文没披露代码仓库地址和性能指标,也没说跑起来需要多少资源,验证门槛不清楚。信息缺口明显,所以分数压在 60–71 区间。
一句话点评
Garry Tan 开源了 GBrain,一个 8 层结构的 Agent 记忆系统。前 4 层升级检索,后 4 层让 Agent 记住用户的人际关系、决策过程甚至认知变化,实现终身记忆。OpenClaw、Hermes 等 Agent 已在生产环境用它处理大量数据。但正文没披露仓库地址和性能指标,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
09:31
27d ago
新智元 · 公众号· rssZH09:31 · 05·17
华东师大开源DAG模型:用有向图把外部变量塞进时间序列预测,12个数据集上跑赢9个基线
华东师大团队提出DAG模型,专门解决时间序列预测里怎么利用外部变量(比如天气、节假日)的问题。核心做法是建一个有向图,把时间维度和变量之间的依赖关系都显式建模进去,让模型知道“今天下雨”和“明天销量”之间怎么影响。论文在12个真实数据集上对比了9个基线方法,效果更好,而且代码、数据集、排行榜都开源了。不过正文没披露推理速度和参数量,实际部署成本还不清楚。
#Benchmarking#East China Normal University#Qiu Xiangfei#Decision Intelligence Lab
精选理由
正文交代了华东师大团队做了个新框架 DAG,核心是同时建模时间维度和通道维度的相关性,用来处理 TSF-X 任务(时间序列预测的扩展版)。在 12 个真实数据集上跟 9 个基线比了,结果没细说,但开源了代码、数据和排行榜,这点对想复现或做对比的人挺友好。不过正文没披露具体性能提升多少、计算开销如何,所以先别太激动,等跑过榜再说。整体属于扎实的基准贡献,适合放进 all 让关注时序预测的人看到。
一句话点评
华东师大开源了DAG模型,专门解决时间序列预测里怎么用外部变量(比如天气、节假日)的问题。核心是建一个有向图,把时间和变量间的依赖关系显式建模,让模型知道“今天下雨”和“明天销量”怎么影响。在12个真实数据集上比了9个基线,效果更好,代码、数据、排行榜都开源了。但正文没披露推理速度和参数量,实际部署成本还不清楚。短评:开源+多数据集验证是亮点,但没提算力需求,想落地还得自己测。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
09:27
27d ago
r/LocalLLaMA· rssEN09:27 · 05·17
求推荐一个能当私人助理的本地小模型
Reddit 用户 DecodeBytes 想给 Mac M4 Max(36GB 统一内存)找个 12B 参数以下的本地模型当私人助理,要求能调用工具、通过 bash 执行 `date` 这类定时命令,还要兼容现有的 MCP 服务器。正文被 Reddit 屏蔽了,没披露具体讨论内容。
#Agent#Tools#DecodeBytes#Apple
精选理由
这是一条 Reddit 求推荐帖,约束条件很具体:本地个人助理、M4 Max、12B 以内、要支持 MCP。HKR-R 通过,但 HKR-H 和 HKR-K 不通过,因为没有测试、发布或可验证的发现。
一句话点评
有人在 Reddit 问 Mac M4 Max(36GB)上跑个 12B 以下本地模型当私人助理,要能调工具、跑 bash 定时任务、兼容 MCP 服务器。正文被 Reddit 屏蔽了,没看到具体推荐。36GB 跑 12B 模型够用,但工具调用和 MCP 兼容性得实测,小模型在这两块容易翻车。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H0·K0·R1
08:27
27d ago
r/LocalLLaMA· rssEN08:27 · 05·17
花760美元买二手RX7900XTX跑Qwen3.6,值不值?
一位Reddit用户卖掉RTX 3080 10GB后,花约760美元买了二手RX7900XTX,想跑Qwen3.6 27/35模型,目标量化到Q5或更高。帖子没透露实际跑的速度、上下文长度或显存占用,所以没法判断这笔买卖到底划算不划算。如果你也在纠结A卡跑大模型,这篇只能当个参考,具体性能还得自己测。
#Audio#Code#Inference-opt#Qwen
精选理由
这是LocalLLaMA板块的个人买卡提问:R项通过,因为本地跑模型用户确实关心24GB显存能不能跑Qwen3.6 27/35 Q5,760美元的价格也有参考价值;H和K不通过,标题平淡,正文没披露实测速度、上下文长度或显存占用,信息缺口明显。整体属于低价值浏览内容。
一句话点评
一位Reddit用户卖掉RTX 3080 10GB,花约760美元买了二手RX7900XTX,想跑Qwen3.6 27/35模型,目标量化到Q5或更高。帖子没透露实际跑的速度、上下文长度或显存占用,所以没法判断这笔买卖到底划算不划算。如果你也在纠结A卡跑大模型,这篇只能当个参考,具体性能还得自己测。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
07:33
28d ago
r/LocalLLaMA· rssEN07:33 · 05·17
Qwopus3.5-9B-Coder:一个能在16GB内存跑8bit精度的编程小模型
Jackrong 放出了 Qwopus3.5-9B-Coder 的 GGUF 量化版,主打 agentic coding(让模型自己调用工具写代码)、tool calling 和逻辑推理。9B 的稠密模型在 16GB 内存设备上就能跑 8bit 精度,目标显存约 10GB,还带了 MTP(多 token 预测,一次预测多个后续 token 来加速推理)...
#Agent#Code#Tools#Jackrong
精选理由
HKR-K/R 通过:一个本地 9B 编码 GGUF 模型,附带 16GB 内存条件,对从业者有用。HKR-H 不通过,且正文缺少基准测试或更广泛的行业影响,因此分数维持在 60–71 区间。
一句话点评
Jackrong 把 Qwopus3.5-9B-Coder 量化成 GGUF 格式,主打让模型自己调工具写代码(agentic coding)。9B 模型在 16GB 内存设备上就能跑 8bit 精度,显存约 10GB,还带了多 token 预测来加速推理。但正文没披露任何跑分或实测效果,这点先别太激动。如果真能打,对本地 coding agent 场景挺实用。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
07:09
28d ago
r/LocalLLaMA· rssEN07:09 · 05·17
Qwen 3.5 122B 跑得慢?19 tokens/s 算正常吗
Reddit 用户用 DGX Spark(128GB 连续内存)跑 Qwen3.5-122B-A10B-Q5_K_M 量化版,通过 llama-server 和 Open WebUI 推理,速度大约 19 tokens/s。这个速度对 122B 参数的大模型来说不算慢,但也不算快——相当于每秒输出十来个词,读起来会感觉有点卡顿。用户开了 262k 超长...
#Inference-opt#Qwen#LocalLLaMA#Open WebUI
精选理由
这是一条 Reddit 求助帖,用户报告在 DGX Spark 128GB 连续内存上跑 Qwen3.5-122B 的量化版,llama-server 速度约 19 tokens/s,上下文开到 262k。19 tokens/s 对对话场景勉强可用,但长上下文推理确实会慢,用户也在问有没有不降质的优化方法。帖子给出了可复现的本地推理配置和速度数据,对关注本地部署的从业者有参考价值,但只是一个单点反馈,没有系统评测或行业影响,所以分数落在 60–71 区间。
一句话点评
19 tokens/s 跑 122B 模型,对 DGX Spark 来说算正常,但读起来会卡。用户开了 262k 超长上下文,这本身就很吃显存带宽。想提速可以降 ctx-size 或换更小量化,但正文没提具体硬件瓶颈,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
06:14
28d ago
r/LocalLLaMA· rssEN06:14 · 05·17
Strix Halo 跑本地模型:ROCm 多 Token 预测能到 37.5 tok/s
Reddit 用户 IvGranite 在 AMD Strix Halo 上测了三款模型(含 35B MoE),对比了 ROCm 和 Vulkan 两个后端,还试了三种提示长度。满上下文时,ROCm 开启多 Token 预测(MTP)跑 35B MoE 达到 37.5 tok/s,而 Vulkan 不开 MTP 只有 28.9 tok/s。差距接近 3...
#Inference-opt#Benchmarking#llama.cpp#ROCm
精选理由
HKR-K 和 HKR-R 通过:它有可复现的 Strix Halo/ROCm/Vulkan 速度数据,能帮人做本地推理选型。但来源是 Reddit 单帖,且属于小众调优场景,不值得上首页推荐。
一句话点评
AMD Strix Halo 跑 35B MoE 模型,满上下文时 ROCm 后端开 MTP 达 37.5 tok/s,比 Vulkan 不开 MTP 的 28.9 tok/s 快约 30%。MTP 让模型一次预测多个 token,推理提速明显。但注意这是单用户本地跑分,未披露功耗和显存占用,实际部署时散热和带宽可能打折。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
06:07
28d ago
r/LocalLLaMA· rssEN06:07 · 05·17
Pi 编程助手怎么让 Qwen 的思考变短?
有人在本地用 llama-server 跑 Qwen 35B A3B,把推理预算设成 -1,结果 Pi 编程助手产出的思考块很短且自然结束。正文没披露 Pi 具体怎么控制思考长度,可能是通过 prompt 或采样参数,但没证据。
#Agent#Reasoning#Code#Qwen
精选理由
这是一个 Reddit 上的具体观察,有 HKR-H 和 HKR-R 价值——Pi 让思考块自然结束这个点很抓人,也切中本地 coding agent 的推理成本与可控性痛点。但正文没给复现步骤、代码或控制机制,属于浏览级信息,不是产品更新或研究突破。
一句话点评
有人在本地用 llama-server 跑 Qwen 35B A3B,把推理预算设成 -1,Pi 编程助手产出的思考块很短且自然结束。正文没披露 Pi 具体怎么控制思考长度,可能是通过 prompt 或采样参数,但没证据。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
05:41
28d ago
r/LocalLLaMA· rssEN05:41 · 05·17
LeanLoop:用 Claude 做规划,本地小模型干苦力,还自带测试纠错
一位叫 DiscipleofDeceit666 的开发者放出了一个叫 LeanLoop 的工具,思路挺实在:让 Claude(或其他云端模型)先写一份“瘦任务清单”(leanfile),然后交给本地跑的小模型——他用的是一块 Qwen3.6 35B A3B,32K 上下文——去一条条执行。每干完一个任务,自动跑单元测试,没过就把失败信息塞回本地模型让它...
#Agent#Code#Tools#Claude
精选理由
一个 Reddit 用户发的开源工具帖,没有 star 数、可复现基准或交叉验证。当成小工具发布处理,留在 all 层。
一句话点评
一个开发者用 Claude 写任务清单,本地 Qwen3.6 35B 模型逐条执行并自动跑单元测试,失败就回传修复。思路是拿云端模型做规划、本地模型干苦力,省钱且能并行。目前只验证了 Qwen,其他 CLI 脚本靠猜,多线程还没实现。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:30
28d ago
Hacker News 首页· rssEN05:30 · 05·17
Codiff:一个本地 diff 审查工具,原型用 LLM 16 分钟生成
nkzw-tech 发布了 Codiff,一个本地 diff 审查工具。作者说原型是用 LLM 在 16 分钟内生成的,速度很快,界面简洁。支持文件过滤、搜索、LLM 逐行讲解模式,以及可以把审查意见粘贴回 LLM。适合审查 LLM 生成的大量代码。正文没披露具体性能数据,但作者说处理大 diff 极快。
#Code#Tools#nkzw-tech#Codiff
精选理由
一个开源小工具发布,有噱头(16 分钟原型)、有功能(本地 diff + LLM 辅助)、有受众(AI 编程从业者),但缺少采用数据、基准测试或直接竞品对比,所以放在“all”层的高位。
一句话点评
作者用 LLM 16 分钟搓了个本地 diff 审查工具,主打快和简洁。支持文件过滤、搜索、LLM 逐行讲解,还能把审查意见贴回 LLM。适合审 LLM 写的大量代码。正文没披露大 diff 具体多大、多快,但说处理极快。18 个赞 7 条评论,热度一般,胜在实用。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
05:24
28d ago
AI HOT 精选· aihot-apiZH05:24 · 05·17
ChatGPT手机版能直接写代码项目了
OpenAI CEO Sam Altman发帖说,ChatGPT手机应用现在集成了Codex,用户可以直接在App里构建项目。正文没披露支持哪些平台、要不要额外付费、以及开放范围有多大。如果是真的,等于把编程环境塞进手机,对快速原型和调试挺实用,但手机屏幕写代码的体验和权限限制还得看实测。
#Code#Tools#ChatGPT#Codex
精选理由
HKR 全过,因为手机端 Codex 建项目这个场景很新,对从业者有实际冲击。重要性定在 all 上段,因为正文只说了能在应用内建项目,平台、权限、价格、上线范围全没披露,信息缺口明显,不能给更高分。
一句话点评
OpenAI CEO 发帖说 ChatGPT 手机 App 现在能直接用 Codex 搭项目,等于把编程环境塞进手机里,快速原型和调试挺实用。但正文没披露支持哪些平台、要不要额外付费、开放范围多大。手机屏幕写代码的体验和权限限制还得看实测,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
05:10
28d ago
Product Hunt · AI· rssEN05:10 · 05·17
Chert:让AI在iMessage里直接给客户发短信
Chert是一个帮你搭建iMessage聊天机器人的工具,可以自动处理客服、获取潜在客户等。你只需要设置好系统提示词和语气,就能创建一个能主动发消息、也能回复客户的AI代理。它还支持接入HubSpot等CRM,把聊天记录写回去。正文没披露定价、具体怎么集成、以及支持的对话流程细节,所以不清楚成本高不高、部署门槛怎么样。
#Agent#Chert#Product update
精选理由
HKR-H 通过,但 K/R 不通过:这是一个小型 Product Hunt 产品列表,唯一亮点是“iMessage 客户短信 agent”这个前提,所以落在低价值产品更新区间。
一句话点评
Chert 让你搭一个能主动发 iMessage 的 AI 客服,设好提示词和语气就能跑,还能接 HubSpot 等 CRM 写回聊天记录。但正文没披露定价、集成细节和对话流程支持到什么程度,所以不清楚成本高不高、部署门槛怎么样。如果是真的,对做苹果生态获客的团队挺实用,但建议先问清楚是按消息量收费还是月费。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
04:16
28d ago
AI HOT 精选· aihot-apiZH04:16 · 05·17
微信读书Skill安装指南:两种方式让AI直接查你的划线
想用AI直接查微信读书里的高亮划线?装个Skill就行。官方给了两种安装路径:一是把微信读书提供的zip包发给Codex或Claude Code,二是用网友@eviljer做的优化版,跑一行npx命令就能装。装好后直接跟AI说“调用微信读书skill 查看被讨厌勇气的高亮划线”就能用。需要API key的话,微信官方页面可以获取。正文没提这个Skill...
#Agent#Tools#WeChat Read#Codex
精选理由
这篇帖子讲的是怎么把微信读书装成 Codex 或 Claude Code 的 Skill,给了两种安装路径。对想用 AI 工具读微信读书的人来说挺实用,但正文没披露 Skill 具体能做什么、效果如何,也没有成本或性能数据。整体就是个单篇教程,没有行业级信号,所以重要性 64 合理。
一句话点评
微信读书出了官方 Skill,装完后 AI 能直接查你书里的划线。两种装法:把官方 zip 丢给 Codex/Claude Code,或者跑一行 npx 命令用网友优化版。正文没披露 Skill 具体能做什么(比如能不能搜全文、导出笔记),也没说 API key 的调用限额和费用。对重度微信读书用户是省事工具,但先别激动——第三方 Skill 的稳定性和数据权限都没细说。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
04:03
28d ago
r/LocalLLaMA· rssEN04:03 · 05·17
八款大模型给灯塔管理员起了同一个名字,这人还在亚马逊卖癌症偏方
Reddit 用户发现,用八个不同的大模型给一个灯塔管理员起名,它们都给出了“Elias Thorne”。更离谱的是,亚马逊上还真有同名作者在卖癌症治疗建议。帖子没披露具体用了哪些模型、提示词怎么写、商品详情页长什么样,也没说怎么验证这八个名字完全一致。所以这点先别太激动——可能是巧合,也可能是模型训练数据里都见过同一个虚构人物。
#Agent#Safety#Amazon#Elias Thorne
精选理由
H和R都够格:八个模型撞名+亚马逊卖癌症建议,这个钩子够怪,也直接关联安全风险。但K太弱——正文没披露模型名单、提示词和商品详情,基本是个Reddit孤例,没法当正式线索。所以放在60-71的“有趣但别太激动”档,不推首页。
一句话点评
八个不同大模型给灯塔管理员起名都叫“Elias Thorne”,亚马逊上还真有同名作者卖癌症治疗建议。帖子没披露具体用了哪些模型、提示词怎么写,也没说怎么验证八个名字完全一致。这点先别太激动——可能是巧合,也可能是训练数据里都见过同一个虚构人物。正文被屏蔽了,信息缺口很大,没法判断是模型记忆撞车还是真有安全风险。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
04:00
28d ago
FT · 科技· rssEN04:00 · 05·17
AI 生成的“垃圾漏洞报告”正在压垮企业的漏洞悬赏计划
FT 报道,企业漏洞悬赏计划(让白帽黑客找漏洞换奖金)正被大量 AI 生成的虚假报告淹没。这些报告看起来像模像样,但实际是无效的“垃圾内容”,导致安全团队需要花大量时间筛选,拖慢真实漏洞的修复。正文没有披露具体增长比例、受影响公司、奖金金额或时间跨度,但问题已经严重到让一些公司考虑调整审核流程。
#Financial Times#Incident
精选理由
标题有冲击力,但正文信息不足,缺乏具体数据和案例支撑,只能算行业泛泛报道,所以分数卡在60-71区间。
一句话点评
AI生成的假漏洞报告正在淹没企业悬赏计划,安全团队得花大量时间筛垃圾,拖慢真漏洞修复。FT报道但没给具体增长比例、受影响公司或奖金金额,信息缺口明显。问题已严重到让公司考虑改审核流程,但缺数据支撑,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
03:08
28d ago
r/LocalLLaMA· rssEN03:08 · 05·17
llama.cpp WebUI 现在能直接传视频文件了
llama.cpp 的 WebUI 新增了一个 PR(#22830),让用户可以直接上传视频文件作为输入。作者只说了一句“现在可以聊视频了”,但正文没披露支持哪些视频格式、怎么抽帧、需要什么模型,以及这个 PR 是否已经合并。对本地跑多模态模型的人来说是个好消息,但具体怎么用还得等更多细节。
#Multimodal#Vision#Tools#ggml-org/llama.cpp
精选理由
HKR 三项都过,但这是个很小的开源工具更新,信息源太薄。正文没披露格式、抽帧机制和合并状态,所以分数压在 60–71 区间。
一句话点评
llama.cpp 的 WebUI 现在能直接上传视频文件当输入了,作者只说了一句“可以聊视频了”。这对本地跑多模态模型的人来说是个好消息,但正文没披露支持哪些视频格式、怎么抽帧、需要什么模型,以及这个 PR 是否已经合并。具体怎么用还得等更多细节,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
00:00
28d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·17
Vercel Zero 和 Cloudflare 都在为 AI 重写工具,核心不是包一层 API
Vercel 的新语言 Zero 编译器输出结构化 JSON 错误码(如 NAM003),让 AI agent 能稳定匹配修复,而不是猜自然语言措辞。Cloudflare 把 2,594 个 API endpoint 压缩成 search 和 execute 两个工具,让 agent 写代码调用而不是从几百个 tool 里选——Anthropic 数据...
#Agent#Tools#Memory#Vercel
精选理由
HKR 三项都过,但事实停留在工具设计评论层面。没有发布、定价、基准测试或大厂能力更新,所以落在 60–71 的有趣区间。
一句话点评
Vercel 新语言 Zero 的编译器输出结构化 JSON 错误码(如 NAM003),让 AI agent 能稳定匹配修复,而不是猜自然语言措辞。Cloudflare 把 2,594 个 API endpoint 压缩成 search 和 execute 两个工具,让 agent 写代码调用而不是从几百个 tool 里选——Anthropic 数据说 134K token 的 tool ...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:00
28d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·17
给 AI 编程工具说话,麦克风到底该怎么选
这篇文章讲的是在开放办公室里用语音跟 AI 编程工具(比如 Claude Code、Cursor)交互时,麦克风该怎么选。核心观点是:距离决定一切,麦克风必须离嘴足够近,否则语音识别准确率会大幅下降。文章对比了三条近场拾音路线:领夹麦(如 DJI Mic 2,方便但全向麦头抗噪一般)、口罩式麦克风(如 mutalk,隐私最好但佩戴负担重)、手持式(如 ...
#Code#Audio#Tools#Commentary
精选理由
HKR-H和HKR-K靠一个窄的语音编程设备角度和三条拾音路径勉强过关。正文没披露任何型号、价格、延迟或识别率数据,所以只能留在普通教程档位。
一句话点评
短评:近场麦才是 vibe coding 刚需,别被桌面麦忽悠了。 点评:文章核心判断很实在:开放办公室用语音编程,麦克风离嘴越近越好,这是物理规律,不是品牌能解决的。作者对比了三条近场路线:领夹麦(DJI Mic 2 等,方便但全向麦头抗噪一般)、口罩式(mutalk 等,隐私最好但 183 克贴脸一小时不舒服)、手持(iPhone 现成但姿态不自然)。关键数字:0.5 米内词错误率 2...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
2026-05-16 · 星期六2026年5月16日
23:39
28d ago
r/LocalLLaMA· rssEN23:39 · 05·16
有人试过 MTP 预发布分支吗?速度能快 20%
一位用户在双路 Xeon 8268 CPU 加 Tesla T4 的机器上测试了 llama.cpp 的 MTP 预发布分支,输出速度约 38 tokens/s,比正式版的 30 tokens/s 快了约 20%。正式版还在轻量编码时崩溃过,预发布版反而没出问题。不过这只是单用户单配置的体验,正文没披露 MTP 分支的具体改动或稳定性测试,这点先别太激动。
#Inference-opt#Vision#Code#Reddit
精选理由
HKR三项都过,但这是单条Reddit用户对llama.cpp预发布分支的体验,没有可复现的配置细节,也没有上游确认。对本地推理用户有用,但对更广的AI行业来说信号弱。
一句话点评
一位用户在双路Xeon 8268加Tesla T4上测试llama.cpp的MTP预发布分支,输出速度约38 tokens/s,比正式版30 tokens/s快约20%。正式版轻量编码时崩溃,预发布版反而没出问题。不过这只是单用户单配置体验,正文没披露MTP分支的具体改动或稳定性测试,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K1·R1
23:04
28d ago
AI HOT 精选· aihot-apiZH23:04 · 05·16
Figure人形机器人连续自主运行四天,仓库里干到第四天没停
Figure的F.03机器人在真实仓库里24小时不间断干活,抓取、搬运、分拣,已经连续跑了四天。测试目的是看它能撑多久、出什么故障、怎么恢复。之前人形机器人大多是演示单次动作,这次是测持续工作能力,离实用更近一步。正文没披露具体故障次数和维护间隔,所以这点先别太激动,但能连续跑四天本身是个信号。
#Robotics#Agent#Figure#Benchmark
精选理由
四天24/7仓库测试是个实在的进展,但来源单薄,没给故障率、维护间隔和对比基线,所以分数压在60-71区间。
一句话点评
Figure的F.03机器人在真实仓库里连续自主运行四天,抓取、搬运、分拣,测的是持续工作能力而非单次演示。正文没披露故障次数和维护间隔,这点先别太激动,但能跑四天本身是个信号——人形机器人从‘能动’往‘能干’迈了一步。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
22:19
28d ago
r/LocalLLaMA· rssEN22:19 · 05·16
Qwen 3.6 35B 在双 3090 上跑 MTP 后速度掉到 80 t/g,有人试出更好的方案吗?
Reddit 用户分享在双 RTX 3090 上跑 Qwen 3.6 35B 的实测:分两层部署时 prompt 处理速度 1500 token/秒,生成速度 120 token/秒;但 llama.cpp 合并 MTP(多 token 预测,让模型一次猜多个 token 来加速推理)后,生成速度降到 80 token/秒。该用户目前改用 CPU 溢出...
#Inference-opt#Qwen#llama.cpp#NVIDIA
精选理由
HKR 三项都过,钩子来自 MTP 合并后吞吐不升反降的反直觉结果,数字具体到 120→80 t/g 和 3500 p/p 的 CPU overflow,对跑本地大模型的人有参考价值。但来源是单条求助帖,没有披露完整配置或可复现的 benchmark,所以放在 lower all 档。
一句话点评
双3090跑Qwen 3.6 35B,MTP合并后生成速度从120掉到80 token/秒,反而变慢了。用户改用CPU溢出方案,prompt处理冲到3500 token/秒,但生成还是80。MTP理论上能加速,实测却降速,说明当前实现或配置还有坑。正文没披露具体MTP参数和模型量化精度,这两点对结果影响很大。社区还在等优化,别急着上MTP。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R1
21:54
28d ago
r/LocalLLaMA· rssEN21:54 · 05·16
Qwen3.5-122B 量化版实测:Q5 跑出 20 tok/s,比 Q6 快 18%
Reddit 用户用 llama.cpp 的 MTP 模式跑了两个 Qwen3.5-122B 的量化版。Q5 版本在 4200 个评估 token 上达到 20.24 tok/s,Q6 版本在 3283 个 token 上跑到 17.17 tok/s。Q5 比 Q6 快了约 18%,但精度损失多少正文没披露。MTP 是让模型在生成时提前预测多个 tok...
#Inference-opt#Benchmarking#Qwen#Unsloth
精选理由
HKR-K 和 HKR-R 通过:帖子给出了 llama.cpp ROCm MTP 下的具体吞吐数字,且涉及本地推理成本。HKR-H 不通过,且仅单条 Reddit 来源、缺少硬件与质量细节,因此归入 all。
一句话点评
Qwen3.5-122B 量化版在 llama.cpp 的 MTP 模式下跑出 20 tok/s,比 Q6 快 18%,但精度损失没披露。MTP 就是让模型生成时提前猜多个 token,类似投机解码。测试 token 数只有几千,参考价值有限。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
21:34
28d ago
r/LocalLLaMA· rssEN21:34 · 05·16
有人在 Mac mini 上跑通了 δ-mem 长记忆方案,LoCoMo 评分从 0.05 涨到 0.18
一位 Reddit 用户把 δ-mem(一种给大模型加长期记忆的新方法)移植到了 MLX 框架上,在 64GB 内存的 Mac mini 上跑 Qwen3-4B-Instruct。搭配 OpenClaw 历史记录后,LoCoMo-10 mini 长程记忆评分从 0.05 提升到 0.18(满分未知,但涨幅接近 3.7 倍),OpenClaw 回放测试的...
#Memory#Agent#Benchmarking#Apple
精选理由
HKR 三项都过,但这是 Reddit 单用户实验,配置小(64GB Mac mini),复现细节也不够,所以留在 all 层,不到 72 分 featured 门槛。
一句话点评
有人在64GB Mac mini上把δ-mem(一种给大模型加长期记忆的新方法)移植到了MLX框架,跑Qwen3-4B。长程记忆评分从0.05涨到0.18,涨了近3.7倍,延迟只多了30%。但注意:这是4B小模型,评分满分未知,且正文被屏蔽,没披露测试集规模和复现细节。如果是真的,低成本本地记忆方案挺省钱。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:51
28d ago
r/LocalLLaMA· rssEN19:51 · 05·16
本地跑 Qwen 3.6 写 HTML 动画,效果接近顶级模型,速度 2.7 token/秒
有人在 Reddit 上拿同一个“单文件 HTML Canvas 驾驶动画”的 prompt 测了 11 个模型,本地跑的 Qwen3.6-27B Q4_K_M 主观排名第二,仅次于 Kimi k2.6 Thinking,还超过了 Claude-opus-reasoning-distilled 的 27B 量化版。代价是速度只有 2.70 tok/s,...
#Code#Benchmarking#Qwen#Claude
精选理由
HKR三项都通过,因为这是一个具体的本地vs前沿模型编码测试,有排名和速度数据。但来源是Reddit单帖,只测了一个HTML Canvas任务,样本量和权威性有限,所以分数压在60-71区间。
一句话点评
本地跑 Qwen3.6-27B 量化版,写一个 HTML Canvas 驾驶动画,主观效果排第二,只输给 Kimi k2.6 Thinking,还压过了 Claude 蒸馏版。代价是速度只有 2.7 tok/s,几乎没法交互。测试只有一条 prompt,样本太少,排名参考价值有限。正文被 Reddit 屏蔽,没披露具体评分标准和硬件配置,量化对效果的影响也不清楚。如果是真的,说明小模型在特定...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:43
28d ago
AI HOT 精选· aihot-apiZH19:43 · 05·16
Codex 现在能自定义键盘快捷键了
Codex 更新了键盘快捷键自定义功能,你可以在设置里按自己的习惯改键位,不用再死记默认组合。正文没提版本号、支持哪些平台、以及什么时候推送给所有用户,所以想用的话得自己去设置里翻一翻。
#Code#Tools#Product update
精选理由
Codex 一个小 UX 更新:K 项有一条具体功能,但版本号、支持平台和上线时间都没披露,不值得上推荐位。
一句话点评
Codex 终于能自定义快捷键了,不用再死记默认组合。正文没提版本号、支持哪些平台、以及什么时候推送给所有用户,想用的话得自己去设置里翻一翻。短评:改键位这种基础功能现在才加,说明之前团队优先级不在这。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
18:58
28d ago
r/LocalLLaMA· rssEN18:58 · 05·16
一年后我换掉了IDE里的AI补全,改用命令行编码代理
Reddit用户/ievkz分享过去一年的编程习惯变化:不再用IDE里的AI自动补全,转而使用一个支持@引用文件的命令行编码代理。IDE现在只用来做Git对比、调试和导航,这部分工作估计只占他全部工作的5-10%。正文没披露他用的是哪个具体工具或模型,但核心判断是:补全式的AI辅助效率低,不如让代理在终端里直接操作文件。
#Agent#Code#Tools#JetBrains
精选理由
HKR 三项都靠一个具体的工作流切换和那个 5-10% 的断言落地,但这是一条 Reddit 个人经验帖,没有列出具体工具、没有控制对比、也没有可复现的配置,所以留在 all 里,不单独提级。
一句话点评
一位Reddit用户说过去一年编程习惯变了:不再用IDE里的AI自动补全,改用命令行编码代理(@引用文件),IDE只用来做Git对比、调试和导航,这部分只占他工作的5-10%。正文没披露他用的是哪个工具或模型。核心判断是:补全式AI效率低,不如让代理在终端直接操作文件。这点先别太激动——这只是个人经验,样本量1,且没提具体工具和效果对比。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
18:56
28d ago
● P1AI HOT 精选· aihot-apiZH18:56 · 05·16
Eric Jang 从零实现 AlphaGo 训练框架和成本分析
Eric Jang 花了几个月从零实现 AlphaGo,并把过程写成教程和代码放了出来。他原本的理解是“用自我对弈训练的搜索增强神经网络”,但亲手做一遍后对细节有了更深体会。他给出一条关键判断:前沿研究仍然很贵,但特定能力的落地成本掉得很快——到 2026 年,训练一个能打的围棋 AI 租算力只要几千美元,不再需要 DeepMind 级别的资源。他自称...
#Reasoning#Code#Eric Jang#AlphaGo
精选理由
我会先打个折:这是个人分享,不是论文或模型发布,所以信息密度有限。但亮点很明确——Eric Jang 一个人花几个月从零把 AlphaGo 做出来,还给了个具体成本判断:2026 年租算力训强围棋 AI 只要几千美元。这个数字直接说明当年需要大团队、大预算的系统,现在个人和小团队也能碰了。正文没披露具体训练配置和模型强度验证,所以“强”到什么程度还不好说,这点先别太激动。整体适合当一条有话题、有数字、对从业者有参考价值的动态来推。
一句话点评
Eric Jang 用休假时间从零复现了 AlphaGo,并公开了训练成本。这比看论文更实在,能直接摸清当年那套搜索加自我对弈在今天到底要花多少钱。
锐评
Eric Jang 在播客里聊了他从零搭建 AlphaGo 的过程,核心是想搞懂深度神经网络怎么把极其耗时的树搜索“压缩”进一个十层网络里。他提到 AlphaGo 的蒙特卡洛树搜索能给出每一步的明确改进方向,这比现在大语言模型用的强化学习聪明得多——后者得从几万个 token 里猜哪一步做对了,效率极低。 这次复现最有价值的是他顺带做了成本分析,让我们能直观对比 2016 年的烧钱玩法和现在的开销。不过,正文没披露他具体用了什么显卡、花了多少电费或租了多少云实例,只说了是基于现代工具重写。这点信息缺口挺关键,因为成本数字直接决定个人开发者或小团队能不能玩得起这套流程。 另外,他还试了用 AI 自动调参跑实验,发现让模型写代码、调超参已经很顺,但选研究方向、跳出死胡同这类需要“品味”的活,AI 目前还干不了。这个判断很实在,别被“AI 研究员”的噱头带偏,它现在更像一个任劳任怨的实习生,而不是能拍板课题的导师。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
18:31
28d ago
AI HOT 精选· aihot-apiZH18:31 · 05·16
Codex 现在支持自定义快捷键了
OpenAI Devs 说 Codex 现在可以在设置里自定义键盘快捷键,让你按自己的习惯来,不用硬记默认键位。正文没提支持哪些平台、什么时候上线、或者需要什么版本,所以想用的话得自己去设置里翻一翻。
#Code#Tools#OpenAI#Product update
精选理由
HKR-K 和 HKR-R 通过:Codex 在设置里加了可配置快捷键,涉及开发者的工作流习惯。HKR-H 不通过,且正文没披露平台范围或版本号,所以这只是一个小的产品更新。
一句话点评
Codex 现在能自定义快捷键了,不用硬记默认键位,按自己习惯来就行。不过正文没披露支持哪些平台、什么时候上线、需要什么版本,想用的话得自己去设置里翻一翻。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
18:12
28d ago
r/LocalLLaMA· rssEN18:12 · 05·16
OpenReader:开源文档朗读器,支持 EPUB/PDF 导出有声书
OpenReader v3.0.0 是一个开源的文档朗读服务器,支持 EPUB、PDF、DOCX、TXT 和 Markdown 格式。它可以用 OpenAI、Replicate、Deepinfra 或自托管的 OpenAI 兼容 API 来生成语音,还能通过 ffmpeg 导出带章节元数据的 m4b/mp3 有声书。简单说就是:你丢进去一本书或一篇文档...
#Audio#Tools#OpenReader#OpenAI
精选理由
H 和 K 都成立:OpenReader 把多格式文档、TTS 后端和有声书导出整合成一个可测试的工具。但只是一个小型开源产品更新,对行业影响有限,所以 R 不成立,tier 保持 all。
一句话点评
OpenReader v3.0.0 是一个开源文档朗读服务器,支持 EPUB、PDF、DOCX、TXT 和 Markdown 格式。它可以用 OpenAI、Replicate、Deepinfra 或自托管的 OpenAI 兼容 API 来生成语音,还能通过 ffmpeg 导出带章节元数据的 m4b/mp3 有声书。简单说就是:你丢进去一本书或一篇文档,它帮你读出来,还能导出成有声书。 短评...
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R0
17:43
28d ago
Product Hunt · AI· rssEN17:43 · 05·16
CtrlOps:用自然语言管 Linux 服务器,部署从 60 分钟缩到 5 分钟
CtrlOps 是一个 AI 终端工具,让你用自然语言给 Linux 服务器下命令,比如部署、调试、监控。它内置脚本库、可视化文件管理、一键从 GitHub 仓库部署,号称原来 60 分钟的部署现在 5 分钟搞定。所有操作在本地执行,凭据不出机器,服务器上不需要装任何代理。目前支持 Mac、Windows、Linux,有免费选项。不过正文没披露定价细节...
#Agent#Code#Tools#CtrlOps
精选理由
HKR-H 和 HKR-R 成立,但 HKR-K 不成立。这更像一个 Product Hunt 风格的工具介绍,没有权限模型、发行版支持和定价信息,所以归入低价值浏览层级。
一句话点评
CtrlOps 让你用自然语言给 Linux 服务器下命令,部署、调试、监控一条龙,号称 60 分钟变 5 分钟。所有操作本地执行,凭据不出机器,服务器不用装代理,这点对安全敏感的用户挺友好。但正文没披露定价细节、权限控制粒度、支持哪些发行版,以及 AI 生成命令出错了怎么兜底。短评:省时间但缺安全细节,先别急着上生产。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
17:19
28d ago
r/LocalLLaMA· rssEN17:19 · 05·16
海盗船出AI工作站:Ryzen 395 + 128GB统一内存,能跑大模型吗?
Reddit 上有人贴了海盗船 AI Workstation 300 的配置单:Ryzen AI Max 395 处理器、128GB LPDDR5X 内存(最多可分 96GB 给显存用)、1TB 固态。统一内存意味着 CPU 和 GPU 共享这 128GB,跑大模型时显存上限比普通消费卡高不少,但正文没披露实际跑模型的速度、能跑多大参数量的模型,也没说...
#Inference-opt#Corsair#AMD#Reddit
精选理由
H/K/R 三个信号都沾边,靠的是工作站规格和本地跑模型省钱的讨论角度。但帖子没给 LLM 吞吐量、价格和具体模型测试数据,信息缺口明显,所以落在 40–59 的低价值区间。
一句话点评
海盗船这台工作站用 Ryzen AI Max 395 和 128GB 统一内存,最多能分 96GB 给显存,跑大模型显存上限比普通消费卡高不少。但正文没披露实际跑模型的速度、能跑多大参数量的模型,也没说价格。统一内存带宽有限,跑推理可能比不过独立显卡,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K1·R1
17:02
28d ago
r/LocalLLaMA· rssEN17:02 · 05·16
iOS 上跑本地大模型,哪个 App 能稳定调用自家后端?
Reddit 用户想找个 iOS App,能连自己电脑上的本地推理后端(兼容 OpenAI 接口)。他试了四个:Apollo、Locally AI、Noema、3 Sparks。3 Sparks 能用,但缺 MCP 和联网搜索;Noema 连 Mac Studio 跑 DeepSeek V4 Flash 直接卡死。正文没披露具体报错或硬件配置,所以问题...
#Agent#Tools#Inference-opt#3 Sparks
精选理由
这是一条 Reddit 求推荐帖,不是发布、基准测试或行业事件。但它列出了具体 App 条件和功能缺口(3 Sparks 能用但缺 MCP 和网页搜索),对本地 LLM 用户有参考价值——想省钱省隐私、在手机上跑推理的人会关心。不过信息量有限,正文没披露各 App 的延迟或样本量,判断只能挂在已知缺口上。
一句话点评
Reddit 用户想找个 iOS App 连本地推理后端,试了四个:Apollo、Locally AI、Noema、3 Sparks。3 Sparks 能用但缺 MCP 和联网搜索;Noema 连 Mac Studio 跑 DeepSeek V4 Flash 直接卡死。正文没披露具体报错或硬件配置,所以问题可能出在兼容性或资源占用上。目前没有完美方案,选型得看你对 MCP 和搜索的需求是否迫切。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K1·R1
16:41
28d ago
r/LocalLLaMA· rssEN16:41 · 05·16
Strix Halo 跑 Llama.cpp:27B 模型靠 MTP 提速 22%,35B 反而变慢
有人在 Strix Halo 上测了 Llama.cpp 的 MTP(多 token 预测,即一次预测多个 token 来加速推理)。Qwen3.6-27B-MTP 在 5 轮对话、约 28.5k 上下文下,总耗时从 258.65 秒降到 200.55 秒,快了约 22%。但同设置下 Qwen3.6-35B-MTP 反而从 58.86 秒涨到 60.2...
#Inference-opt#Benchmarking#Qwen#Unsloth
精选理由
单机 llama.cpp/Strix Halo 的 Reddit 测试,受众窄,但具体耗时数据让它在 all 档站得住,不到 featured。
一句话点评
AMD Strix Halo 上测了 Llama.cpp 的多 token 预测(MTP,一次预测多个 token 加速推理)。Qwen3.6-27B 快了约 22%,但 35B 反而慢了。好消息是 27B 在本地跑长对话能省点时间,坏消息是 35B 不升反降,说明 MTP 对模型大小和硬件很敏感。正文没披露具体硬件配置和功耗,这点先别太激动。如果是真的,对本地部署 27B 模型挺省钱。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
16:38
28d ago
AI HOT 精选· aihot-apiZH16:38 · 05·16
vLLM 宣布支持万亿参数模型,但正文没给细节
vLLM 团队发推说社区协作又成了,vLLM 现在能跑万亿参数模型。但正文只感谢了社区,没提具体模型名字、参数到底多少、怎么实现的、能不能复现。标题很猛,信息缺口也很大。
#Inference-opt#vLLM#Product update#Open source
精选理由
标题的万亿级规模是钩子,H 和 R 都成立,但正文信息缺口太大——没披露模型名称、参数规模和复现条件,K 不通过。整体属于有趣但不够上推荐的程度。
一句话点评
短评:标题说能跑万亿参数,正文只感谢社区,没提模型名、参数数、实现方式。信息缺口太大,先别激动。 标题很猛,但正文只有一句“又一次Day0协作,又一次社区胜利”,连模型名字都没提。万亿参数是稀疏MoE还是稠密?用了多少卡、什么硬件、延迟多少?能不能复现?全没披露。vLLM团队一贯靠谱,但这条更像社区感谢信而非技术公告。建议等具体实现细节出来再评估,目前信息不足以判断这是真突破还是标题党。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
15:37
28d ago
The Verge · AI· rssEN15:37 · 05·16
索尼解释 Xperia 1 XIII 的 AI 相机助手:不修图,只给建议
索尼澄清,Xperia 1 XIII 的 AI 相机助手不会自动修图,而是根据光线、景深和拍摄对象,给出曝光、色彩和背景虚化的四种调节建议。它还会推荐“最上镜的角度”,但演示视频里只是建议用户拉近镜头,跟真正找角度不是一回事。索尼之前发的宣传帖引发争议,现在赶紧出来解释。
#Vision#Sony#The Verge#Product update
精选理由
一个消费级AI产品的小更新:HKR-H来自The Verge的防守性报道框架,索尼主动澄清“不烂”制造了话题;HKR-K来自具体的4条建议机制,明确了功能边界;HKR-R对AI从业者较弱,所以留在all层级。
一句话点评
索尼Xperia 1 XIII的AI相机助手不是自动修图,而是根据光线、景深给四种曝光/色彩/虚化建议,还会推荐“最上镜角度”——但演示里只是让用户拉近镜头,跟找角度两码事。索尼之前宣传翻车,现在赶紧澄清。实际效果存疑,建议等实测。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
15:28
28d ago
r/LocalLLaMA· rssEN15:28 · 05·16
用 Apple Watch 录音,iPhone 本地转文字,还接入了 Notion 和 Obsidian
开发者发布了一款叫 Dictawiz 的 iOS 应用,核心卖点是 Apple Watch 录音后直接在 iPhone 上本地转文字,用的是 Parakeet 和 Whisper 模型,不需要联网。还做了一个自定义键盘,可以在任何 App 里语音输入。支持发送到 Notion、Obsidian,甚至通过自定义 webhook 和 Cloudflare ...
#Audio#Tools#Memory#Apple
精选理由
H/K/R 都轻度通过:工作流具体,对本地 AI 用户有参考价值,但延迟、准确率和价格都没披露。这是一个实用的独立工具更新,不是行业级新闻。
一句话点评
Dictawiz 让 Apple Watch 录音后直接在 iPhone 本地转文字,用了 Parakeet 和 Whisper 模型,不联网。还做了自定义键盘,能在任何 App 里语音输入,支持发到 Notion、Obsidian 和自定义 webhook。亮点是本地运行,隐私好,但正文没披露延迟、定价、模型大小和准确率。如果是小模型,长录音或嘈杂环境可能翻车。适合快速记想法,但别当主力转...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:18
28d ago
r/LocalLLaMA· rssEN15:18 · 05·16
给 llama.cpp 加自定义采样器,有人写了个防重复循环的 demo
DeProgrammer99 给 llama-server 做了个自定义采样器扩展原型,附带一个 C++ 写的循环检测器——专门打断重度量化模型里常见的 1-3 token 重复循环。这个分支基于合并了 MTP(多 token 预测)后的 llama.cpp master,兼容推测解码,还提供了 Windows x64 Vulkan 编译版和一条示例命...
#Inference-opt#Code#Tools#DeProgrammer99
精选理由
HKR-K 和 HKR-R 通过:采样器机制具体,且对本地推理用户有实际意义。HKR-H 偏弱,帖子没有提供基准测试、采用计划或更广泛的产品影响。
一句话点评
DeProgrammer99 给 llama.cpp 的 llama-server 做了个自定义采样器扩展原型,附带一个 C++ 写的循环检测器,专门打断重度量化模型里常见的 1-3 token 重复循环。这个分支基于合并了 MTP(多 token 预测)后的 llama.cpp master,兼容推测解码,还提供了 Windows x64 Vulkan 编译版和一条示例命令。 短评:量化...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
14:54
28d ago
AI HOT 精选· aihot-apiZH14:54 · 05·16
烧吧,宝贝,烧吧:一个帮你销毁代币的开源工具
开发者 dtnewman 在 GitHub 上开源了一个叫“Burn, Baby, Burn”的工具,让用户自己销毁(burn)持有的代币,从而减少总供应量。这个项目在 Hacker News 上拿到了 100 个点赞。简单说,就是你想让某个代币变稀缺,可以用它把一部分代币永久打入黑洞。项目本身是命令行工具,代码量不大,适合懂点技术的用户自己操作。正文...
#GitHub#Hacker News#Open source
精选理由
这更像是一个Hacker News上的实用工具链接,而非AI行业新闻。HKR三项均未命中目标受众,且与AI关联极弱,评分低于40合理。
一句话点评
一个命令行工具,让你自己销毁持有的代币,减少总供应量。项目在 HN 上拿了 100 赞,但代码量不大,适合懂技术的用户自己操作。正文没披露支持哪些链、有没有合约验证,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
14:40
28d ago
r/LocalLLaMA· rssEN14:40 · 05·16
Lemonade 本地 AI 工具 macOS 版转正,一个 3MB 的二进制文件跑三大系统
Lemonade 宣布 macOS 支持结束测试,正式可用。这个本地 AI 工具只有一个 3MB 的便携二进制文件,就能在 Linux、Windows 和 macOS 上跑。目前开放了五大能力:OmniRouter(路由)、编程、图片生成、语音生成和语音转文字。3MB 的体积意味着几乎不占硬盘,启动快,适合随身带一个 U 盘跑本地模型。但正文没披露具体...
#Multimodal#Code#Audio#Lemonade
精选理由
K 和 R 过关:文章给出了具体的 macOS 能力覆盖和 3 MB 二进制体积声明,对本地 AI 用户有明确参考价值。H 偏弱,没有性能或采用数据支撑,所以分数落在 60–71 区间。
一句话点评
Lemonade 的 macOS 版正式上线,核心卖点是那个 3MB 的便携二进制文件,跨平台(Linux、Windows、macOS)都能跑,启动快,适合 U 盘随身带。目前开放了路由、编程、图片生成、语音合成和转写五大能力。但正文被屏蔽,没披露具体支持哪些模型、性能如何、是否依赖联网。3MB 体积确实轻量,但能力覆盖这么广,实际跑起来对硬件要求可能不低,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
14:15
28d ago
r/LocalLLaMA· rssEN14:15 · 05·16
同一个双摆模拟题,Claude 和 DeepSeek 选了相反的物理约定,一秒就能看出差异
作者用完全相同的提示词让 Claude 3.5 Sonnet 和 DeepSeek V3 模拟双摆运动,初始条件都是 θ1=π/2、θ2=π/2、角速度为零。在同一个渲染器下,两个模型输出的动画在一秒内就出现镜像行为——一个摆向左,另一个摆向右。这说明模型对物理约定(比如角度正方向的定义)有不同理解,而且这种差异在动态模拟中会立刻暴露。正文没披露具体用...
#Code#Reasoning#Benchmarking#Claude 3.5 Sonnet
精选理由
这是一个 Reddit 单次实验,不是系统评测,所以分数压在 60–71 区间。但它的价值在于用极低成本(一个双摆提示词)快速暴露了模型对物理约定(θ 正方向定义)的敏感度差异,对做模型评测的人是个提醒:提示词里隐含的歧义可能让比较结果失真。正文没披露两个模型的具体版本号,也没说重复多次是否稳定,这点先别太激动。
一句话点评
同一个双摆提示词,Claude 3.5 Sonnet 和 DeepSeek V3 跑出镜像动画,一秒内就看出方向相反。问题出在模型对角度正负的默认约定不同,不是谁对谁错,而是物理模拟里这种隐性偏差会立刻暴露。正文没披露具体用了哪个渲染器、跑了多少次、是否复现,所以这点先别太激动——它更像一个有趣的观察,不是严谨评测。对做代码生成或物理仿真的团队有提醒价值:模型对物理常识的“默认值”可能不一致...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
13:46
28d ago
AI HOT 精选· aihot-apiZH13:46 · 05·16
杭州开了个国家级机器人训练基地,给具身智能搞“职业技能培训”
5月16日,国家人工智能应用中试基地(具身智能)在杭州挂牌启用,相当于给机器人建了一个国家级“职业技能训练场”。这个基地既展示已经落地的商业场景,也演示数据采集和技能训练过程,目的是帮机器人技术从实验室往真实应用走。杭州还从5月1日起施行了全国首部具身智能机器人地方性法规,要求建设中试和检测平台,并推动机器人在应急救援、医疗康养等领域落地。目前杭州已有...
#Robotics#Hangzhou#国家人工智能应用中试基地#Policy
精选理由
H和K靠机器人训练场这个钩子和杭州的产业数据通过。R不通过,因为这只是地方基建新闻,不是模型或产品能力更新,不直接冲击成本、安全、就业或竞争。
一句话点评
杭州搞了个国家级机器人训练基地,5月16日挂牌,相当于给机器人建了个“职业技能训练场”。当地已有700多家机器人相关企业,2025年产业集群产值1068亿元。5月1日还施行了全国首部具身智能地方性法规,要求建中试和检测平台,推动机器人在应急救援、医疗康养等领域落地。基地展示商业场景和数据采集过程,帮技术从实验室走向应用。但正文没披露基地具体训练能力、开放时间或企业入驻细节,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
12:49
28d ago
r/LocalLLaMA· rssEN12:49 · 05·16
有人用开源模型做了个代码审查工具,声称比 CodeRabbit 便宜 6 倍
Reddit 用户 Axintwo 发帖说,他做的 PrixAI 用开源模型做 PR 代码审查,在一个测试 PR 里 10 个埋点问题全抓出来了。价格方面,CodeRabbit 标价每月 60 美元,PrixAI 声称便宜 6 倍,也就是大概 10 美元。不过正文没披露具体用了哪些开源模型、跑在什么硬件上、延迟怎么样,也没说是不是本地部署。如果真能 1...
#Code#Agent#CodeRabbit#PrixAI
精选理由
Reddit用户自测,10个植入问题全检出,价格比CodeRabbit低6倍,数字漂亮但来源单一,没有第三方复现,所以放在'all'档的上限。正文没披露具体用了哪些开源模型、延迟多高、是否支持复杂多文件PR,这些缺口让判断不能往上提。
一句话点评
Reddit 用户 Axintwo 用开源模型做了个 PR 代码审查工具 PrixAI,号称比 CodeRabbit 便宜 6 倍(月费约 10 美元 vs 60 美元),并在一个测试 PR 中 10 个埋点问题全抓出来了。但正文没披露具体用了哪些开源模型、跑在什么硬件上、延迟如何,也没说是否本地部署。如果真能 1/6 的价格做到同等效果,对个人开发者和小团队挺有吸引力,但验证太弱——一个测...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
12:15
28d ago
● P1r/LocalLLaMA· rssEN12:15 · 05·16
MTP 支持合并至 llama.cpp 主分支
llama.cpp 的 master 分支合并了 PR #22673,正式加入 MTP(Multi-Token Prediction)支持。MTP 让模型在推理时一次预测多个后续 token,而不是逐个生成,理论上能降低解码延迟。不过正文没披露具体支持哪些模型、有没有 benchmark 数据、以及合并到了哪个正式版本。如果你跑本地模型,可以关注后续 ...
#Inference-opt#llama.cpp#ggml-org#Open source
精选理由
MTP 支持合并进 llama.cpp 主分支,对本地推理玩家是个直接可用的更新——从 main 分支编译就能跑。但正文只有 RSS 摘要,没披露 MTP 的具体机制(比如是单头还是多头预测)、支持哪些模型、实测能快多少,也没给发布版本号。信息缺口明显,所以分数压在 68 合理:有钩子、有新事实、有触达面,但验证和细节全缺,属于小规模开源推理优化更新。
一句话点评
llama.cpp 主分支正式合并 MTP 支持,本地跑 DeepSeek 类模型推理速度能提一截。
锐评
MTP(多 token 预测)被合进 llama.cpp 主分支,意味着以后用这个推理引擎跑 DeepSeek-V2/V3 这类模型时,可以一次预测多个 token,而不是一个一个字往外蹦。对本地部署的人来说,最直接的好处是生成速度变快、延迟更低。社区讨论里有人提到 b9180 这个构建版本已经落地,说明代码不是停留在 PR 阶段,而是真能用了。 不过目前信息主要来自 Reddit 帖子标题和合并记录,正文被屏蔽,看不到具体实现细节和性能对比数据。比如到底快了多少、显存占用有没有变化、支持哪些量化格式,这些关键数字都缺失。另外 MTP 对输出质量是否有影响,社区也没展开讨论。 想尝鲜的话可以更新 llama.cpp 试试,但建议先在自己常用的模型上跑一遍对比,别急着上生产环境。等有人放出实测数据,再判断这个合并的实际收益有多大。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
12:11
28d ago
Product Hunt · AI· rssEN12:11 · 05·16
pixserp:一个API接口,让大模型直接查实时网页,支持10种答案格式
pixserp 是一个给大模型用的实时网页搜索API,一个接口就能查网页、新闻、图片、地点、购物、航班、酒店、YouTube、字幕和任意URL,结果自带引用。价格是每1000次请求1.5美元,作者说比Perplexity Sonar Pro(约19美元/千次)便宜很多。响应时间大约1.5秒,支持流式输出。可以直接替换OpenAI SDK的base_ur...
#RAG#Tools#pixserp#Product update
精选理由
HKR-K 有一个产品事实,但 HKR-H/R 都很弱。定价、模型、延迟和 API 细节都没说,这只是一个低价值的 Product Hunt 工具更新,随便翻翻就行。
一句话点评
pixserp 是一个给大模型用的实时网页搜索API,一个接口就能查网页、新闻、图片、地点、购物、航班、酒店、YouTube、字幕和任意URL,结果自带引用。价格是每1000次请求1.5美元,作者说比Perplexity Sonar Pro(约19美元/千次)便宜很多。响应时间大约1.5秒,支持流式输出。可以直接替换OpenAI SDK的base_url,集成成本低。 短评:一个接口查十种...
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
12:06
28d ago
● P1Hacker News 首页· rssEN12:06 · 05·16
SANA-WM开源世界模型发布 可生成一分钟720p可控视频
NVIDIA 放出了一个叫 SANA-WM 的开源模型,参数规模 26 亿,主打的是用一张图加一条镜头移动路线,直接生成长达一分钟的 720p 视频。它把长视频生成拆成两步:先用一个混合线性注意力的主干网络跑出长序列粗稿,再用一个 170 亿参数的精修模型去改善纹理、动作和后半段的画质。训练成本不算高,64 块 H100 跑 15 天,用了约 21.3...
#Multimodal#Vision#NVIDIA#Open source
精选理由
标题说 SANA-WM 是个 2.6B 参数的开源世界模型,能生成 1 分钟 720p 视频。我会先打个折:正文只给了链接、9 分和 8 条评论,训练数据、许可证、推理成本、跟其他模型的对比跑分全都没披露。2.6B 这个尺寸在视频模型里算小的,如果真能稳定跑一分钟不崩,推理成本可能比较友好,但这点先别太激动,因为没看到任何实测证据。开源是个加分项,不过没写是什么许可证,商用能不能用还不清楚。整体看,这是个有话题度的发布,但信息缺口很大,实际能力得等更多细节出来才能判断。
一句话点评
NVIDIA 开源了一个 26 亿参数的世界模型,一张图加镜头轨迹就能在单张显卡上生成一分钟 720p 可控视频,但模型权重还没放出来。
锐评
SANA-WM 把长视频生成的门槛打下来了。它用 26 亿参数的小模型,在单张 H100 上就能跑出一分钟 720p 视频,甚至还有个蒸馏版能在 RTX 5090 上用 34 秒搞定。对比它提到的 LingBot-World 等工业级方案,吞吐量号称高了 36 倍,训练也只用了 64 张 H100 跑 15 天,成本确实低。 能这么省,核心在于它把注意力机制做了混合设计:逐帧用轻量的 Gated DeltaNet,隔一段时间才做一次完整的 softmax 注意力,显存不会随着视频变长而爆炸。另外它专门加了一个双分支模块来控制 6 自由度镜头轨迹,让画面跟着指定路径走,不是随机乱飘。 不过先别太激动。正文明确说模型权重还是“soon”的状态,没得下载跑不起来。另外它只用了约 21.3 万段公开视频训练,这个数据量对世界模型来说不算大,泛化能力要打问号。演示视频全是固定视角的慢速自然场景,没看到快速运动或复杂交互,实际可控性还得等开源后自己测。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
11:34
28d ago
Hacker News 首页· rssEN11:34 · 05·16
OpenClaw 作者一个月烧了 130 万美元的 OpenAI 接口费
OpenClaw 的开发者发推说,30 天内光 OpenAI 的 token 就花了 130 万美元。正文没披露具体用了多少 token、调了哪些模型、有没有折扣或包月协议,也没有账单截图。如果是真的,这个烧钱速度说明要么用户量极大,要么每个请求都用了最贵的模型(比如 GPT-4 Turbo 或 o1)。但信息缺口太大,没法判断是真实成本还是营销噱头。
#OpenClaw#OpenAI#Commentary
精选理由
H和R通过:130万美元月账单是强钩子,也切中开发者的成本焦虑。K不通过:只有金额,没有用量、模型组合、定价和账单证明,信息不完整,所以留在all层级。
一句话点评
OpenClaw 开发者称30天烧了130万美元OpenAI token费,约合每天4.3万美元。正文没披露具体用量、模型组合或是否有折扣协议,也无账单截图。如果是真的,要么用户量极大,要么每个请求都用了最贵模型(如GPT-4 Turbo)。但信息缺口太大,无法判断是真实成本还是营销噱头。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
11:03
28d ago
r/LocalLLaMA· rssEN11:03 · 05·16
给显卡降功耗,跑本地模型更省电
Reddit 用户 NotArticuno 实测给 GPU 降功耗墙(power limit)对本地推理的影响。测试用 qwen3.5:9b 模型,跑 TG128 生成和 PP512 处理。正文没披露具体显卡型号和数字结果,所以省了多少电、速度掉多少都不清楚。思路本身对自建服务器或长期跑推理的人有价值——降功耗能省电费、降温度,适合不在意那点速度损失的用户。
#Inference-opt#NotArticuno#Qwen#Commentary
精选理由
H和R靠的是降功耗跑推理这个反直觉的实用钩子,本地用户确实会在意电费和显卡寿命。但K不通过:正文没披露GPU型号、具体功耗限制值以及TG128/PP512的测试结果,信息缺口太大,只能算一条低价值的实操贴士。
一句话点评
Reddit 用户实测给 GPU 降功耗墙跑本地推理,思路对自建服务器或长期跑推理的人有价值——省电费、降温度。但正文没披露具体显卡型号和数字结果,省了多少电、速度掉多少都不清楚,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
10:22
28d ago
机器之心 · 公众号· rssZH10:22 · 05·16
Anthropic 让 Claude Code 跑在卡片大小的开发板上
Anthropic 在 Code With Claude 活动上给开发者发了一台 Cardputer,这是一块 ESP32-S3 掌上开发板,大小跟卡片差不多。官方说它能跑完整的 Claude Code,也就是让开发者在这块小板上直接写代码、调模型。正文没披露具体跑起来延迟多高、能处理多复杂的任务,但能在这么小的硬件上塞进一个完整的 AI 编程助手,成...
#Code#Tools#Anthropic#Claude
精选理由
HKR的H和R很强,K也有具体的设备宣称,但这更像一个Claude Code的硬件演示彩蛋,不是Anthropic的能力发布。性能、联网、能否复现都没披露,先别太激动。
一句话点评
Anthropic 给开发者发了张卡片大小的 ESP32-S3 开发板,说能跑完整 Claude Code。听着挺酷,但正文没披露延迟和任务复杂度——这么小的硬件跑完整编程助手,大概率只能处理极简单的代码补全或脚本,别指望能写复杂项目。更像一个概念验证或开发者玩具,离实用还有距离。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
10:22
28d ago
机器之心 · 公众号· rssZH10:22 · 05·16
2026杭州具身智能大赛:不比炫技,比谁真能干活
2026年杭州国际具身智能场景应用大赛设了三个赛道,200多支队伍在真实场景里比干活——消防、电力巡检、数据中心、水下救援、仓库物流。正文没披露具体技术方案和评分标准,但方向很明确:别光秀走路翻跟头,得能进真实环境解决实际问题。
#Robotics#Agent#Multimodal#机器之心
精选理由
HKR三项都过:标题有钩子,信息具体,话题踩中行业焦点。分数在60-71区间合理,因为正文没披露比赛结果、技术方法细节和可复现的评测标准,信息缺口明显。
一句话点评
短评:比赛方向务实,但没披露技术细节和评分标准,先别太激动。 2026年杭州这场具身智能大赛,200多支队伍在消防、电力巡检、数据中心、水下救援、仓库物流等真实场景里比干活,而不是比走路翻跟头。方向是对的——行业确实需要从炫技转向解决实际问题。但正文没披露具体技术方案、评分标准、参赛队伍的技术水平,也没说这些场景的难度系数和真实环境还原度。所以这个比赛的意义更多是信号:政策方和产业方在推动...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
09:30
28d ago
Hacker News 首页· rssEN09:30 · 05·16
Δ-Mem:给大模型加一个超小内存,不用改模型结构就能记住历史
这篇论文提出了一种叫 Δ-Mem 的轻量记忆机制,核心思路是给一个已经训练好的、参数冻结的大模型(full-attention backbone)外挂一个固定大小的在线记忆状态。这个状态矩阵通过 delta 规则(一种增量更新算法)不断压缩和存储历史信息,生成时再用它的输出去修正注意力计算,相当于给注意力加了一个低秩的“记忆偏置”。效果上,只用了一个 ...
#Memory#Research release
精选理由
HKR-H 和 HKR-R 通过,因为在线记忆对 agent 开发者确实重要。HKR-K 不通过:该条目只披露了标题和 arXiv 链接,没有机制、指标或可复现的成果,所以分数落在 60–71 区间。
一句话点评
给冻结的大模型外挂一个8×8的记忆状态矩阵,用delta规则增量压缩历史,推理时修正注意力计算。MemoryAgentBench涨了31%,LoCoMo涨了20%,成本极低——8×8矩阵几乎不占显存。但论文没披露延迟对比,也没说长上下文场景下记忆是否会饱和。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
08:52
28d ago
● P1AI HOT 精选· aihot-apiZH08:52 · 05·16
研究员用Anthropic Mythos工具六天破解苹果M5芯片内存完整性保护
苹果在 M5 和 A19 芯片上花五年做的 MIE 内存完整性保护,被三个研究员用 Anthropic 的 Mythos 工具攻破了。他们 4 月 25 日发现漏洞,5 月 1 日就写完利用程序,全程只用了六天。攻击手法是纯数据攻击,不碰指针,靠普通用户权限的标准系统调用就能拿到 root 权限。团队已经当面把报告交给了苹果。完整技术细节要等苹果发补丁...
#Agent#Code#Safety#Anthropic
精选理由
我会先打个折:正文只提了三位研究人员和 Mythos 工具,没披露漏洞是否已报给苹果、Mythos 具体怎么辅助的、以及 Anthropic 的回应,所以信息有缺口。但 6 天从发现到完成内核漏洞利用、绕过 M5/A19 的 MIE 并拿到 root,这个速度和效果本身就很说明问题——AI 辅助攻击开发的门槛在降。对从业者来说,这比单纯说“AI 不安全”更有冲击力,因为直接落在具体芯片和系统上。H/K/R 全过,但单篇来源和缺少后续处理信息,让我没给到 85 分以上。
一句话点评
Anthropic 的安全研究工具 Mythos 帮研究员六天挖出两个苹果 M5 芯片的内核漏洞,直接绕过了内存完整性保护。但正文没披露漏洞具体细节和苹果的回应。
锐评
这条消息的看点不是 Anthropic 又发了个模型,而是他们用自家工具 Mythos 干了件很实际的事:在六天内找到并利用了两个 macOS 内核未知漏洞,成功绕过了苹果 M5 芯片的内存完整性保护机制。内存完整性保护可以理解为芯片层面的一道硬锁,防止恶意代码篡改内核数据,绕过它意味着攻击者能在系统最底层执行任意代码。 目前的信息都来自 RSS 摘要,正文是空的,所以没法判断漏洞的严重等级、利用条件苛刻与否,也不知道 Anthropic 是否按常规漏洞披露流程提前通知了苹果。标题里“五天内”和“六天”的差异,可能是不同来源统计口径不同,但都指向同一个事实:自动化漏洞挖掘的效率在提高。 对从业者来说,这条消息的价值在于它提供了一个具体案例,说明 AI 辅助安全研究正在从理论走向实战。但别急着下结论说“AI 已经能独立挖漏洞了”,工具还是需要研究员来操作和决策。还缺的关键信息是:漏洞是否已被修复、Mythos 这套工具对外部研究者的开放程度,以及这种效率提升对防守方意味着多大的压力。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
06:31
29d ago
● P1新智元 · 公众号· rssZH06:31 · 05·16
OpenAI大规模重组由总裁Brockman主导
标题说 OpenAI 大规模重组,总裁 Brockman 掌权。但正文只显示微信验证页,没披露重组范围、汇报线、涉及团队、决策过程和时间表。信息缺口很大,目前只能当传闻看。
#OpenAI#Brockman#Personnel
精选理由
硬排除-零信源:标题声称OpenAI大规模重组,但正文没有任何可验证的组织事实,连正文本身都不存在。H和R通过,但K不通过,不能作为重大人事新闻打分。
一句话点评
OpenAI 总裁 Brockman 亲自接管产品,要把所有 AI 代理业务整合成一个平台。这轮高管换血说明他们急了,但正文没披露具体产品路线图,先别太激动。
锐评
OpenAI 又换高管了,这次是联合创始人兼总裁 Greg Brockman 亲自下场抓产品,目标是把公司所有“让模型进业务流程干活”的 AI 代理业务,整合成一个统一的平台。从 The Verge 的报道看,Brockman 在内部备忘录里明确说要“投资单一代理平台”,这基本等于承认之前多条业务线各自为战,现在要集中火力。 这次调整的背景是 AI 代理领域的竞争已经白热化,谷歌、Anthropic 都在猛推类似产品。OpenAI 频繁换将,说明他们对目前的推进速度不满意。但报道里没提这个新平台具体长什么样、什么时候上线、跟现有的 ChatGPT 插件或 Assistant API 是什么关系。这些关键信息都缺着,所以这次重组到底是真能提速,还是又一次内部权力洗牌,现在下不了判断。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K0·R1
06:31
29d ago
新智元 · 公众号· rssZH06:31 · 05·16
只用头显和手柄,就能高精度重建全身动作
这篇 ICML'26 的工作声称只用 VR 头显和两个手柄,就能还原全身骨骼动作,精度还很高。正文被验证页挡住了,没披露用了什么模型、数据集、误差指标,也没说是否可复现。如果真能省掉全身追踪套件,对 VR 社交和动捕行业会挺省钱,但这点先别太激动——信息缺口太大,没法判断实际效果。
#Vision#Multimodal#ICML#Research release
精选理由
HKR-H 靠低硬件门槛的动捕钩子通过,加上 ICML'26 给了一点研究可信度。HKR-K 和 HKR-R 不通过,因为能访问的正文只有验证页,没有指标、方法或从业者视角。
一句话点评
ICML'26 的工作号称只用 VR 头显和两个手柄就能还原全身骨骼动作,精度还高。但正文被验证页挡住了,没披露用了什么模型、数据集、误差指标,也没说是否可复现。如果真能省掉全身追踪套件,对 VR 社交和动捕行业会挺省钱,但这点先别太激动——信息缺口太大,没法判断实际效果。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
04:04
29d ago
● P1量子位 · 公众号· rssZH04:04 · 05·16
阿里健康发布医疗AI青灵子 接入BMJ十年期刊文献
阿里健康发布了一款叫“青灵子”的医疗 AI,目标用户是中国 500 万医生。它直接拿了 BMJ 集团旗下 70 本期刊过去十年的全文内容做知识底子,不是只搜摘要。回答问题时,模型会按 PICO 框架(把临床问题拆成患者、干预、对照、结局)和 GRADE 证据分级来走流程,相当于先框定问题结构再给答案,而不是自由发挥。产品还拉了 300 多位临床专家做审...
#RAG#Reasoning#Safety#Alibaba Health
精选理由
阿里健康把BMJ的期刊库直接做成回答的证据底座,再用临床专家评审兜底,等于在“模型胡说”和“医生不敢用”之间加了一层硬约束。正文没披露评审通过率、更新频率和实际延迟,这些会直接影响医生愿不愿意买单。我会先打个折:方向对,但落地效果还得看真实诊疗场景的反馈。
一句话点评
阿里健康推了个叫“青灵子”的医疗AI,主打卖点是接了BMJ十年期刊文献当证据源,但正文没披露具体评测数据和临床验证结果,这点先别太激动。
锐评
这条新闻的核心卖点是“证据源”——阿里健康的医疗AI“青灵子”直接接入《英国医学杂志》(BMJ)过去十年的期刊文献,想用顶级循证证据把自己和市面上其他医疗大模型区分开。机器之心那篇稿子提到一个数字:有医生88天登录了193次,想说明产品粘性高,但样本量只有一个人,完全不能代表500万中国医生的使用情况。 两篇报道都来自科技媒体,不是医疗专业期刊或第三方评测机构,所以目前只能看到厂商宣传的“独家合作”和“顶级证据”,看不到任何关于回答准确率、误诊率、科室覆盖范围的独立验证数据。医疗AI最要命的就是安全性和可靠性,光说接了BMJ不够,得说清楚模型在真实问诊场景下到底表现怎么样。 还缺几个关键信息:第一,BMJ文献是实时更新还是定期导入,更新延迟多久;第二,模型是通用大模型加RAG(外挂资料库)方案,还是专门用医学数据训练过;第三,有没有做过和医生诊断的对照实验。这些没披露之前,只能把它当成一个“声称有更好资料来源的医疗问答工具”,离“神助攻”还有距离。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
02:35
29d ago
AI HOT 精选· aihot-apiZH02:35 · 05·16
藏师傅PPT新增截图美化,不烧GPT资源自动配背景
藏师傅PPT Skills更新了截图美化功能,能根据截图尺寸、长宽比、当前PPT模板和配色自动匹配背景图,效果类似CleanShot X这类专业截图工具。关键是它不消耗GPT-Image 2.0的额度,省成本。还能自动裁剪过长的图片并排成两列展示。正文没披露支持哪些模板类型和颜色主题的匹配精度,这点先别太激动。
#Vision#Tools#藏师傅PPT Skills#GPT-Image 2.0
精选理由
藏师傅 PPT Skills 这次更新加了个截图自动美化功能,能根据截图尺寸、长宽比、PPT 模板和颜色主题自动配背景,而且不消耗 GPT-Image 2.0 的额度——这点对经常做 PPT 截图的人来说挺省钱。但正文没披露用户规模、定价或者模型能力变化,所以就是个 60–71 分段的单功能更新,不涉及更广的 AI 竞争或就业话题。
一句话点评
藏师傅PPT Skills新增截图美化,能根据截图尺寸、PPT模板和配色自动配背景,效果类似CleanShot X。关键是不耗GPT-Image 2.0额度,省成本。还能自动裁剪长图排成两列。但正文没披露支持哪些模板类型和颜色主题的匹配精度,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
00:28
29d ago
r/LocalLLaMA· rssEN00:28 · 05·16
RTX 5090 跑 Qwen3.6 推理冲到 3238 tok/s,但序列长度只有 64 token
Reddit 用户发帖称,在 RTX 5090 32GB 上用 open-dLLM 跑未经训练的 Qwen3.6 模型,达到了 3238 tok/s 的推理速度。代价是序列长度只有 64 token、batch size 为 1、扩散步数 10 步——这基本是玩具级配置,实际生成一句话就截断了。帖子说训练后会补质量评测,但正文没披露训练数据量、训练时长...
#Inference-opt#Benchmarking#Qwen#Open-dLLM
精选理由
这个帖子的核心是一个惊人的速度数字,而且给出了完整的测试条件,信息量够。但来源是 Reddit 用户,样本只有 64 token,实际场景参考价值有限,所以分数卡在 60-71 区间,不上精选。
一句话点评
RTX 5090 跑 Qwen3.6 号称 3238 tok/s,但序列长度只有 64 token、batch size 1、扩散步数 10 步——相当于每次只生成一句话就截断,纯玩具级。帖子说训练后会补质量评测,但正文没披露训练数据量和时长,也没说模型是否真的收敛。速度数字好看,但离可用差得远。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
00:00
29d ago
● P1Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·16
OpenAI通过Plaid让ChatGPT接入银行账户
ChatGPT 在美国向 Pro 用户开放了个人理财功能预览,通过 Plaid 连接银行账户后,能读取余额、交易记录和投资持仓,回答消费和储蓄问题。文章指出,OpenAI 的隐私承诺存在两个关键缺口:理财对话未被列入广告敏感话题排除清单,意味着消费和贷款讨论可以触发广告匹配;财务数据的模型训练默认是 opt-in,用户需主动关闭。作者认为,这个功能的主...
#Tools#OpenAI#Plaid#ChatGPT
精选理由
我会先打个折:正文只说了 OpenAI 通过 Plaid 让 ChatGPT 连接银行账户,没披露上线时间、授权流程和可访问的数据范围,所以这更像一个信号而不是一个可评估的产品更新。但信号本身够强——让模型直接碰银行数据,权限和安全的坑一个都不少,从业者看到标题就会想点进去看细节。HKR 三项都踩中了,只是信息缺口把分数压在 featured 档,没往上走。
一句话点评
ChatGPT 要接你的银行账户了,用的是 Plaid 这个中间人,能看余额和流水但不能转账。
锐评
OpenAI 给 ChatGPT 开了个新口子:通过 Plaid 直接读你的银行账户数据。Plaid 就是那个很多金融 App 背后负责安全连接银行的中间件,所以技术上不是 OpenAI 自己存你的密码,而是你授权 Plaid 把只读数据喂给 ChatGPT。能看余额、信用卡欠款、交易记录,但碰不了钱,没法转账或支付。 这件事的逻辑跟之前接健康数据一样——让模型拿到更私密的个人上下文,回答才能更贴你本人。比如你问“我能不能买这个沙发”,它能直接扫一眼账户说“你信用卡还欠着八千,建议下个月再说”。但正文没披露这些财务数据会不会被 OpenAI 用来训练模型,也没说数据在服务器上留多久。隐私政策这块目前是空的,这点先别太激动。 对从业者来说,这等于把 AI 助手往“个人 CFO”方向推了一步,但信任门槛比健康数据还高。银行账户是多数人最敏感的数字资产,一次数据泄露的代价远大于推荐错一家餐厅。OpenAI 能不能让用户放心把账本交出来,比技术接没接通更重要。
HKR 分解
hook knowledge resonance
打开信源
97
SCORE
H1·K1·R1
00:00
29d ago
● P1OpenAI 博客· rssEN00:00 · 05·16
OpenAI与马耳他合作向全体公民提供ChatGPT Plus
OpenAI 与马耳他政府宣布全球首个国家级合作:所有公民完成马耳他大学开发的 AI 素养课程后,可免费获得一年 ChatGPT Plus。课程教 AI 能做什么、不能做什么、怎么用,不设背景门槛。第一阶段 2026 年 5 月启动,由马耳他数字创新局负责分发。正文没披露覆盖多少人口、政府是否承担成本、以及课程具体时长。
#Tools#Safety#OpenAI#Malta
精选理由
HKR-H/K 通过:国家级 ChatGPT Plus 分发是一个真实的分发信号。HKR-R 偏弱,因为正文缺少覆盖人数、费用分摊、上线日期或采购矛盾,所以这条归入普通合作类。
一句话点评
马耳他成了全球第一个全民免费领 ChatGPT Plus 的国家,但得先上完 AI 素养课才能用一年。
锐评
OpenAI 和马耳他政府合作,给所有公民发一年免费 ChatGPT Plus,条件是先完成马耳他大学设计的一门 AI 素养课。这更像一次国家级的付费获客实验:用课程筛选用户,用补贴培养使用习惯。马耳他人口不到 60 万,成本可控,适合跑通“政府买单、全民普及”的模式。OpenAI 也借机把“智能像水电一样变成公共设施”的说法落地了一次。 不过,正文没披露 OpenAI 给马耳他的具体价格,也没说一年后公民是否要自己续费、数据隐私条款有没有特殊安排。课程内容、完成率和实际使用数据也都没给。这些缺口让“全民普及”的效果暂时没法验证。 另外,OpenAI 提到已在爱沙尼亚、希腊做教育合作,马耳他这次是把范围从学校扩到全体公民。如果后续能公布续费率、使用频次和课程通过率,才能判断这是真普及还是品牌活动。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R0
00:00
29d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·16
Agent Runtime 正在成为 AI 的下一个主战场
Cline 的 benchmark 数据显示,同一个模型在不同 runtime(运行环境)上跑,性能能差出 4.8 个百分点——这差不多等于把模型升一个版本。更夸张的是,Cline 团队只优化 runtime 的提示词、工具定义和错误处理,不换模型,就把分数从 47% 拉到 57%,提升了 10 个百分点。文章认为,模型 API 价格已经打到地板价(D...
#Agent#Benchmarking#Tools#Cline
精选理由
只有 R 通过:话题踩中了 agent 工具链竞争这条线,Cline 和 DeepSeek 两个锚点够抓人。但正文缺 benchmark 数字、招聘条件和 runtime 机制,信息密度不够,达不到精选标准。
一句话点评
同一个模型在不同运行环境上跑,性能能差出4.8个百分点,相当于白升一个模型版本。Cline团队只改提示词和工具定义,不换模型,就把分数从47%拉到57%。文章说模型API价格已打到地板价,价值正从模型层转移到平台层。但正文没披露Cline的benchmark具体任务集,也没说DeepSeek那个Harness PM岗位到底要做什么。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
2026-05-15 · 星期五2026年5月15日
23:43
29d ago
彭博科技· rssEN23:43 · 05·15
特朗普与习近平谈英伟达芯片
彭博社报道,特朗普和习近平讨论了英伟达芯片。正文没披露具体谈了哪些型号、有没有松口出口条件,也没说谁先提的。这条信息目前只能确认“聊过”,谈成什么、对供应链有没有实质影响,一概未知。
#Bloomberg#Nvidia#Donald Trump#Policy
精选理由
Bloomberg 的权威性加上英伟达芯片在中美政策中的位置,HKR 的 H 和 R 都成立;但 K 不成立——正文只有标题级别信息,没有芯片型号、出口条件或讨论细节。保留在 all 里,但读者需要知道这条目前只有标题,没有实质内容。
一句话点评
特朗普和习近平聊了英伟达芯片,但正文只确认了“聊过”,没提具体型号、出口松口条件,也没说谁先提的。目前信息量极低,对供应链没有实质影响。短评:标题炸裂,内容空洞,先别激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
23:15
29d ago
r/LocalLLaMA· rssEN23:15 · 05·15
Luce Megakernel:一个把上百次CUDA调用压成一次的推理加速方案
Reddit 用户发帖说 Luce Megakernel 能在 NVIDIA 显卡上把推理速度提到 1.8 倍。原理是把原来每生成一个 token 就要启动约 100 次 CUDA 内核(每次都有 CPU 调度开销)合并成一次大内核调用,省掉层与层之间的 CPU 调度。对比对象是 llama.cpp 的 CUDA 实现。帖子正文被 Reddit 屏蔽了...
#Inference-opt#Luce Org#NVIDIA#Apple
精选理由
正文只给了一个 Reddit 帖子作为证据,没有公开 benchmark 脚本、硬件配置、模型版本或复现步骤,权威性很弱。1.8 倍加速和减少 100 次 kernel launch 的机制听起来合理,但缺少第三方验证。建议先观望,等有可复现的跑分再认真对待。
一句话点评
Reddit 用户称 Luce Megakernel 能把 NVIDIA 显卡推理速度提到 1.8 倍,原理是把每 token 约 100 次 CUDA 内核启动合并成一次,省掉 CPU 调度开销。对比对象是 llama.cpp 的 CUDA 实现。但正文被 Reddit 屏蔽,代码、测试环境、模型大小、精度都没披露。1.8 倍如果是真的,对本地推理挺省钱,但这点先别太激动——没开源、没复现...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
22:38
29d ago
● P1Hacker News 首页· rssEN22:38 · 05·15
Orthrus-Qwen3模型推理速度提升至7.8倍
Orthrus 号称能让 Qwen3 模型一次前向传播多生成 7.8 倍的 token,而且输出分布和原始模型一模一样。这意味着推理速度可能大幅提升,但正文没披露具体用了什么机制,也没给基准测试条件和复现步骤。GitHub 和 Hacker News 链接里也没有更多细节。所以这点先别太激动,等看到可复现的 benchmark 再说。
#Inference-opt#Qwen#Orthrus-Qwen3#Open source
精选理由
标题的7.8倍和“输出分布相同”两个点都很抓人,但正文没披露具体机制、基准条件或复现步骤,信息缺口太大,没法直接信。先打个折,放在60–71分档,等更多细节出来再调。
一句话点评
Qwen3-8B 推理速度最高提到 7.8 倍,且输出分布数学上可证明不变,不是近似加速。
锐评
这个项目给 Qwen3-8B 装了一套叫“双视角扩散解码”的加速方案,不动原模型参数,直接把每次前向能处理的 token 数拉到原来的 7.8 倍。最硬的一点是它声称输出分布完全一致,不是那种牺牲精度换速度的近似方法。 目前信息全来自 GitHub 仓库和社区帖子,没看到论文或第三方基准测试。7.8 倍这个数字是在什么硬件、什么 batch size、什么序列长度下跑出来的,正文没披露。另外,方法是否只对 8B 这个尺寸有效、对长文本生成会不会掉速,也都还是未知数。 如果这个“无损加速”在更多模型和场景下能复现,推理成本会直接打骨折。但现阶段只能把它当一个很有潜力的开源实验,等更多验证出来再激动。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
22:28
29d ago
AI HOT 精选· aihot-apiZH22:28 · 05·15
Claude Code v2.1.143:插件市场能看上下文消耗了,还支持直接改工作树
Anthropic 给 Claude Code 打了个小补丁,主要加了两个实用功能:一是插件市场现在会显示每个插件的预估上下文消耗(就是跑一次任务大概吃掉多少 token),开发者装插件前能掂量一下成本;二是新增了 `worktree.bgIsolation: "none"` 配置项,允许后台任务直接修改当前工作树文件,不用再切分支或建隔离环境。另外修...
#Code#Tools#Anthropic#Claude Code
精选理由
这是 Claude Code 的官方小版本更新,有具体的插件和上下文成本细节,但影响面主要限于重度用户,属于小型产品更新范畴。
一句话点评
Claude Code 小版本更新,两个实用改动:插件市场现在显示每个插件的预估 token 消耗,装之前能算算账;新增配置项让后台任务直接改当前文件,不用切分支。修了一批 CLI、Windows 终端和 macOS 后台任务的 bug。属于日常优化,没有新能力,但插件成本透明化对重度用户有用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
22:25
29d ago
The Verge · AI· rssEN22:25 · 05·15
YouTube 把 AI 换脸检测工具开放给所有成年用户
YouTube 把之前只给部分人试用的“肖像检测”工具(自动扫描视频里有没有你的脸)开放给所有 18 岁以上用户。正文没披露具体上线时间、申诉流程和删除标准,所以实际效果和误报率还不清楚。
#Vision#Safety#YouTube#Product update
精选理由
HKR 三项都过:开放范围从试点扩到全体成年用户,检测机制明确写的是扫视频人脸匹配。重要性没给更高是因为准确率、申诉流程和执行细节正文都没披露,这点先别太激动。
一句话点评
YouTube 把扫脸查 deepfake 的工具开放给所有成年用户了,之前只给部分人试。正文没披露上线时间、申诉流程和删除标准,所以实际效果和误报率还不清楚。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
22:05
29d ago
彭博科技· rssEN22:05 · 05·15
Arm 因芯片技术面临美国反垄断调查
彭博社报道,Arm Holdings 将因芯片技术面临美国反垄断调查。正文只重复了标题和导航栏,没有披露调查机构、涉嫌行为、调查机制或时间表。信息缺口很大,目前无法判断是哪个部门发起、涉及 Arm 的授权模式还是收购行为。
#Arm Holdings#Bloomberg#Policy
精选理由
H和R通过:Arm反垄断调查触及AI芯片授权和供应链竞争,有真实监管悬念。K不通过:正文只给了标题,没披露调查机构、指控机制和时间表,信息严重不足,所以分数落在60-71区间。
一句话点评
彭博独家称Arm将因芯片技术面临美国反垄断调查,但正文只重复了标题和导航栏,没披露调查机构、涉嫌行为、时间表。信息缺口极大,目前无法判断是FTC还是司法部、涉及授权模式还是收购。建议等正式报道再判断影响。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
21:30
29d ago
r/LocalLLaMA· rssEN21:30 · 05·15
AllenAI 给 Molmo 模型做了四个机器人专用微调版本
AllenAI 放出了四个 MolmoAct2 模型,都是基于 5B 参数的视觉-语言-动作模型微调出来的。分别针对 LIBERO、DROID、BimanualYAM 和 SO100_101 四个数据集,覆盖通用任务、交互式任务和绝对关节位姿控制。简单说就是让同一个视觉语言模型能直接输出机器人动作指令,不用再单独训练动作策略。正文没披露具体性能指标或推...
#Robotics#Vision#Fine-tuning#AllenAI
精选理由
正文只给了模型数量、参数量和数据集名字,没披露任何基准分数、许可证或复现细节,信息缺口明显,所以分数压在 60–71 区间。
一句话点评
AllenAI 把同一个 5B 参数的视觉语言模型微调成四个机器人专用版本,分别适配不同数据集(通用任务、交互操作、关节位姿控制)。好处是模型直接输出动作指令,省掉单独训练动作策略的环节。但正文没披露任何性能指标或推理延迟,实际能不能跑通、精度够不够用都是未知数。开源是好事,但别急着当成熟方案用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:23
29d ago
r/LocalLLaMA· rssEN21:23 · 05·15
4块RTX 3090怎么调最划算:功耗锁220W,速度248 token/s
Reddit用户实测Qwen3.6-27B FP16模型跑在4块RTX 3090上,用vLLM张量并行(TP=4)。把每张卡功耗限制在220W后,总吞吐248 token/s,能效1.13 token/焦耳。正文没披露显存占用和是否量化,但功耗锁220W比默认350W省电约37%,速度损失不大,适合长期跑推理的场景。
#Inference-opt#Reddit#Qwen#vLLM
精选理由
这是一条 Reddit 用户的单点测试,范围窄,但数字扎实:4×3090 在 220W 下跑出 248 t/s,能效比 1.13 t/J,对本地推理玩家有参考价值。不过正文没披露显存占用、多卡通信开销、长序列下的稳定性,这些缺口让分数卡在 69,够不到推荐位。
一句话点评
4块3090跑Qwen3.6-27B,功耗锁220W后总吞吐248 token/s,能效1.13 token/焦耳,比默认350W省电约37%,速度损失不大。适合长期跑推理的场景,但正文没披露显存占用和是否量化,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
21:02
29d ago
r/LocalLLaMA· rssEN21:02 · 05·15
骁龙X2笔记本本地跑RAG,索引20万文件
VecML在骁龙X2 Windows笔记本上演示了纯本地的RAG(外挂资料库)方案,索引了约20万个文件,实际跑完约10万个。检索时只用了1200个token,靠一个128分片的活跃缓冲区加大部分数据存磁盘来省内存。正文没披露检索延迟和模型大小,但内存占用控制得不错,适合在低配设备上试。
#RAG#Embedding#Memory#VecML
精选理由
这是一条Reddit上的单帖本地RAG演示,不是大模型或产品发布,所以分数压到70、tier all。亮点是硬件落地很具体,但正文没披露检索质量或延迟,这点先别太激动。
一句话点评
VecML 在骁龙 X2 笔记本上跑纯本地 RAG,索引了 20 万个文件,实际跑完约 10 万个。亮点是检索只用了 1200 个 token,靠 128 分片的活跃缓冲区加大部分数据存磁盘来省内存,适合低配设备。但正文没披露检索延迟和模型大小,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:01
29d ago
r/LocalLLaMA· rssEN21:01 · 05·15
Nexidion:一个本地知识库,后台AI自动帮你整理Markdown笔记
Nexidion开源了一个纯本地的Markdown知识库,核心卖点是后台有个AI代理自动干活。作者说开发了两年、重写了五次架构,支持批量操作节点和文件夹、版本化AI提交、一键回滚。实测用RTX 2080 Ti跑Qwen 3.6 35B-A3B IQ3_XXS(通过llama.cpp),说明一张老显卡就能带动35B参数的稀疏模型。不过正文没披露AI代理具...
#Agent#Tools#Memory#Nexidion
精选理由
这是一个 Reddit 自发布的小工具,零 star、无采用数据、无基准测试,所以不能给太高分。但产品定位清晰——私有知识库 + 本地 agent 自动整理,对注重隐私和本地部署的从业者有一定参考价值。正文没披露性能指标或用户反馈,建议先观望。
一句话点评
Nexidion 开源了一个纯本地的 Markdown 知识库,后台有个 AI 代理自动帮你整理、提交内容。作者说开发了两年、重写了五次架构,支持批量操作、版本化 AI 提交和一键回滚。实测用 RTX 2080 Ti 跑 Qwen 3.6 35B-A3B IQ3_XXS(通过 llama.cpp),一张老显卡就能带动 35B 参数的稀疏模型,这点挺省钱。但正文没披露 AI 代理具体能干什么—...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
20:51
29d ago
r/LocalLLaMA· rssEN20:51 · 05·15
动态分配算力给难题,Qwen-35B-A3B 接近 GPT-5.4-xHigh 水平
Reddit 帖子标题称,Qwen-35B-A3B 通过动态分配算力给更难的问题,并在训练中逐步进化模型分区,在 HLE 基准上接近 GPT-5.4-xHigh 的表现。但正文只返回了链接片段,没有披露具体分数、样本量、提示词或复现步骤,所以这个结论目前只能当个传闻看。
#Reasoning#Inference-opt#Benchmarking#Qwen
精选理由
HKR中H和R通过,但K不通过:这只是一个Reddit标题级别的声称,没有分数、样本量或复现条件。归入all,不推荐featured。
一句话点评
标题说 Qwen-35B-A3B 动态分配算力给难题,在 HLE 上接近 GPT-5.4-xHigh,但正文被 Reddit 屏蔽,没披露分数、样本量、提示词或复现步骤,目前只能当传闻看。短评:标题炸裂但正文被墙,分数、样本量、提示词全没披露,先别信。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
20:51
29d ago
彭博科技· rssEN20:51 · 05·15
Figure CEO 称人形机器人测试完全无人远程操控
Figure 的 CEO 说他们的人形机器人测试没有用任何远程操控(teleoperation),也就是全程靠机器人自己跑,没有人在背后遥控。但 Bloomberg 这条只有视频标题,正文没披露具体测试了什么任务、做了多少次、怎么验证的。所以这个说法目前只是一个声明,没有公开的实验细节支撑。
#Robotics#Figure#Bloomberg#Commentary
精选理由
Figure CEO 否认远程操作这条消息有 HKR-H 和 HKR-R,但 Bloomberg 页面几乎只有标题,任务、样本量、验证机制全没披露,HKR-K 不成立,整体价值偏上低位。
一句话点评
Figure CEO 声称人形机器人测试全程无远程遥控,全靠机器人自主运行。但 Bloomberg 这条只有视频标题,没披露具体任务、测试次数和验证方式。目前只是一个声明,缺乏公开实验细节支撑,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
20:38
29d ago
彭博科技· rssEN20:38 · 05·15
美国芯片行业缺人,SEMI 高管在 Bloomberg 上聊了
SEMI 高管 Shari Liss 在 Bloomberg Tech 上谈美国半导体人才缺口,但正文没披露具体缺多少人。另外顺带提了一句:特朗普在北京两天峰会期间和习近平聊了 AI 护栏和英伟达 H200 芯片。
#Safety#SEMI#Nvidia#Shari Liss
精选理由
45分:R项通过,因为芯片人才与AI算力供给直接挂钩;H和K项不通过——Bloomberg视频里只说了Trump在北京谈AI护栏和H200,没给任何缺口规模、岗位结构或具体政策动作。
一句话点评
SEMI高管说美国芯片业缺人,但正文没披露具体缺口数字,这点先别太激动。顺带提了特朗普和习近平聊AI护栏和H200芯片,但没细节,更像花絮。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
20:28
29d ago
Hacker News 首页· rssEN20:28 · 05·15
伦敦警察首次在抗议活动中用上人脸识别
伦敦警察局明天将在卡姆登区的一场政治集会上启用实时人脸识别(LFR),这是英国警方首次在抗议活动中使用这项技术。现场还会有无人机高空扫描。但同一天一场预计3万人参加的亲巴勒斯坦游行却不会受到同样的监控。正文没披露用了哪家厂商的系统、识别库有多大、匹配流程怎么走,也没说误报率。这点先别太激动——技术落地场景从商业街跳到政治集会,边界在扩大,但实际效果和合...
#Vision#Safety#London Police#Hacker News
精选理由
H和R成立:伦敦警方首次在抗议中用人脸识别,这个事实本身就有新闻价值和争议性。但K很弱:正文只有标题和摘要,没写在哪场抗议、用的哪家系统、识别准确率多少、误报率如何、法律依据是什么。信息太少,只能确认“第一次用”这个点,其他全是空白。
一句话点评
伦敦警察首次在抗议活动中启用实时人脸识别,还搭配无人机高空扫描。但同一天一场3万人规模的亲巴勒斯坦游行却不受同样监控,选择性地用技术让人警惕。正文没披露用了哪家厂商的系统、识别库多大、误报率多少,实际效果和合规边界都不清楚。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
20:06
29d ago
Hacker News 首页· rssEN20:06 · 05·15
Palantir 挖走 30 多名英国政府高级官员
Palantir 从英国政府挖了超过 30 名高级官员,Hacker News 上热度 52 分、3 条评论。正文没披露具体职位、入职时间或合同细节,所以不清楚这些人去了哪个部门、做什么。但人数不少,说明 Palantir 在政府业务上布局很深,可能想靠前官员打通关系或拿项目。
#Palantir#UK Government#Hacker News#Personnel
精选理由
HKR 三项都过,但信息太薄:只有 30+ 这个数字,没有职位、时间线、合同关联或 AI 产品影响。Palantir 做政府数据业务确实对读者胃口,但这条只能放 all,不值得 featured。
一句话点评
Palantir 从英国政府挖了超过 30 名高级官员,人数不少,说明它在政府业务上布局很深,可能想靠前官员打通关系或拿项目。但正文没披露具体职位、入职时间或合同细节,所以不清楚这些人去了哪个部门、做什么。这点先别太激动,信息缺口挺大。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
19:37
29d ago
AI HOT 精选· aihot-apiZH19:37 · 05·15
Krea 2 上线,只给 Pro 用户先用
Krea 2 今天正式面向 Pro 用户开放,但正文只说了这一句。没提价格、功能变化或普通用户什么时候能用,信息缺口很大。如果你不是 Pro 用户,暂时还上不了手。
#Krea#Product update
精选理由
这是一条很薄的供应商上线通知,只说了 Krea 2 对 Pro 用户开放,功能、价格、变化全都没披露。H/K/R 三项都不满足,按 0/3 规则排除。
一句话点评
Krea 2 上线了,但只对 Pro 用户开放,价格、功能变化、普通用户何时能用一概没提。信息缺口太大,非 Pro 用户暂时别激动。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
19:34
29d ago
r/LocalLLaMA· rssEN19:34 · 05·15
Gemma4 26B MoE 在 MacBook Air M5 上跑起来了,128k 上下文还能同时处理 4 个请求
开发者 maddie-lovelace 把 Google 的 Gemma4 26B MoE 模型移植到了 MLX 框架上,用上了 turboquant(一种更快的量化方法)和旋转 KV 缓存(减少长上下文的内存占用),还自己写了一个自定义 SWA 内核来压榨性能。在 MacBook Air M5(32GB 内存)上,8k 上下文时生成速度 17.15 ...
#Inference-opt#Code#Gemma#MLX
精选理由
单条 Reddit 帖子,作者自己写了 MLX 自定义 kernel 和 turboquant,技术细节扎实但缺乏多方验证。128k 上下文和 4 并发批次是亮点,但正文没披露长上下文下的实际速度或显存占用,这点先别太激动。整体适合作为本地推理的参考案例,但离 featured 还差一点验证深度。
一句话点评
短评:MacBook Air M5 跑 Gemma4 26B,生成速度 17 tok/s,比 llama.cpp 快还省内存,但这是手写内核换来的。 点评:开发者把 Google 的 Gemma4 26B MoE 模型移植到 MLX 框架,用 turboquant(更快的量化方法)和旋转 KV 缓存(减少长上下文内存占用),还自己写了 SWA 层内核。在 32GB MacBook Air ...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
19:18
29d ago
Hacker News 首页· rssEN19:18 · 05·15
CostHawk 搞了个 Claude Code 和 Codex 的全球用量排行榜
CostHawk 上线了一个公开排行榜,按 token 消耗量给 Claude Code、OpenAI Codex 和 Cursor 的用户排名。目前追踪了 96 个用户,总消耗 3270 亿 token,第一名用了 455 亿。Claude Code 占绝对主导(86.9% 的 token),但 Codex 本月增速更快(环比 +183.5%,Cla...
#Code#Benchmarking#Costhawk#Claude Code
精选理由
H 和 R 过关,但 K 硬伤:页面只甩了个排行榜,没交代怎么统计的、数据从哪来、多久更新一次。HN 上才 7 分 2 条评论,热度低,就是个信息不全的工具页面,不值得高优先级。
一句话点评
CostHawk 搞了个公开排行榜,按 token 消耗量给 Claude Code、Codex 和 Cursor 用户排名。目前追踪了 96 个用户,总消耗 3270 亿 token,第一名用了 455 亿。Claude Code 占绝对主导(86.9% 的 token),但 Codex 本月增速更快(环比 +183.5%,Claude Code 是 +136.8%)。 这个榜更像一个“...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
19:08
29d ago
AI HOT 精选· aihot-apiZH19:08 · 05·15
Clawpatch:把代码库切成语义切片来审 bug
Clawpatch 0.1.0 已发布,通过 npm install -g clawpatch 安装。它把整个代码库映射成“语义功能切片”,然后逐片审查错误和质量问题,并记录已验证的修复尝试。作者说“能发现的问题之多令人惊讶”,但正文没披露任何基准测试结果或定价,所以这点先别太激动。
#Code#Tools#clawpatch#Product update
精选理由
一个小型代码工具发布:HKR-K 有 npm 0.1.0 加上语义切片机制,HKR-R 贴合 AI 编码审查痛点。正文未披露基准、案例或定价,因此保持在 60–71 区间。
一句话点评
Clawpatch 把整个代码库切成“语义功能切片”逐片审查 bug 和质量,还能记录已验证的修复尝试。作者说“发现的问题之多令人惊讶”,但正文没披露任何基准测试或定价,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1

更多

频道

后台