ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-13

135 items · updated 3m ago
RSS live
2026-05-13 · 星期三2026年5月13日
23:50
30d ago
r/LocalLLaMA· rssEN23:50 · 05·13
Qwen 3.6 35B A3B 在两张 5060 Ti 上跑出 90 token/s,但想上更高量化得先解决散热
Reddit 用户用两张 16GB 的 5060 Ti 显卡,在 LM Studio 里以 Q4 量化跑通 Qwen 3.6 35B A3B 模型,全上下文吞吐达到 90 token/s。这个速度对本地部署来说已经很快,但用户想进一步升到 Q6 或 Q8 量化来提升质量,同时担心两张显卡叠放、中间没有缝隙会导致散热问题。正文没披露具体显存占用和功耗,所...
#Inference-opt#Qwen#LM Studio#NVIDIA
精选理由
K 项扎实,给了可复现的硬件和速度数据;R 项切中本地推理的成本和散热焦虑。但来源是 Reddit 单帖,范围窄,所以分数压在 60–71 区间。
一句话点评
两张 16GB 5060 Ti 跑 Qwen 3.6 35B A3B,Q4 量化下全上下文 90 token/s,本地部署算很快了。用户想升 Q6/Q8 提质量,但两张卡叠放无缝隙,散热是隐患。正文没披露显存占用和功耗,升级量化前得先确认散热和供电够不够。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
23:38
30d ago
Product Hunt · AI· rssEN23:38 · 05·13
Gradient Bang:跟 LLM 聊天就能玩的大型多人游戏
Gradient Bang 是一款刚在 Product Hunt 上线的游戏,核心玩法就是跟大模型聊天。它号称“AI 原生”,界面由 LLM 动态生成,支持语音输入,玩家还得管理一群 AI 小助手才能赢。你甚至可以自己写小助手的逻辑,放到 Vercel 沙箱里跑。技术栈用了 Pipecat、Daily WebRTC、Supabase 和 Vercel。...
#Agent#Gradient Bang#Product Hunt#Product update
精选理由
只有H勉强通过:LLM对话驱动的多人游戏有个小新意,但正文停留在Product Hunt概念展示层面,没披露模型、规模或可复现的机制,验证很弱。
一句话点评
一个跟大模型聊天来玩的多人游戏,界面由LLM动态生成,支持语音输入,还得管一群AI小弟。技术栈用了Pipecat、Daily WebRTC、Supabase和Vercel,甚至能自己写小弟逻辑跑在Vercel沙箱里。免费,但正文没披露具体模型、玩家上限和收费模式,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H1·K0·R0
23:19
30d ago
AI HOT 精选· aihot-apiZH23:19 · 05·13
Claude Code 小版本更新:新增工作目录选项,修复30多个Bug
Anthropic 发布了 Claude Code 的 v2.1.141 版本,主要更新包括三个变量或字段的更新、一个让 Claude 智能体指定工作目录的 --cwd 选项,以及修复了30多个问题,涉及 Markdown 表格渲染、权限提示和历史管理。这次没有新功能,主要是修修补补,让日常使用更稳。
#Agent#Code#Tools#Anthropic
精选理由
HKR-K/R通过:--cwd、字段更新和30多项修复对频繁使用Claude Code的用户有价值。HKR-H不通过,因为这是小版本发版日志,所以保持在常规产品更新区间,评分68。
一句话点评
Claude Code 小版本更新,修了30多个bug,加了让智能体指定工作目录的--cwd参数。没有新功能,但修的都是日常痛点:Markdown表格渲染、权限提示、历史管理。如果你在用Claude Code写代码,这版值得升,稳定性有提升。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
23:15
30d ago
AI HOT 精选· aihot-apiZH23:15 · 05·13
AI智能体工程化实战:Claude点不准、Codex沙箱隔离、RAG Agent三成幻觉
BestBlogs早报聊AI智能体落地。Anthropic官方指南说Claude Computer Use点不准是常见坑,得用虚拟机隔离加人工确认门控。OpenAI工程师给Codex搭Windows沙箱,靠系统级文件隔离防乱写。另外注意:RAG Agent在基准测试里分数高,但一上生产幻觉率能到30%,这点先别太激动。
#Agent#RAG#Safety#Anthropic
精选理由
HKR-K 靠的是那个 30% 生产环境幻觉率,直接点出 RAG Agent 在真实场景下的可靠性问题;HKR-R 靠的是智能体安全焦虑,从业者看到这个数字会想“我的系统会不会也这样”。HKR-H 弱是因为这是篇早报汇总,不是独家发布或新论文,所以分数压在 60–71 区间。
一句话点评
BestBlogs早报聊AI智能体落地。Anthropic说Claude Computer Use点不准是常见坑,得用虚拟机隔离加人工确认门控。OpenAI给Codex搭Windows沙箱,靠系统级文件隔离防乱写。另外注意:RAG Agent在基准测试里分数高,但一上生产幻觉率能到30%,这点先别太激动。正文没披露具体测试集和样本量,验证力度有限。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
23:10
30d ago
Hacker News 首页· rssEN23:10 · 05·13
Intercom 改名 Fin,客服软件品牌保留
Intercom 宣布公司名改为 Fin,原名称 Intercom 继续作为客服软件产品线存在。CEO 在博客里承认改名拖太久了,理由是科技圈失败的改名案例太多,但最终还是觉得 Fin 这个 AI 客服品牌更代表未来。正文没披露改名对业务数据的具体影响,比如客户迁移成本或品牌认知变化。简单说就是:公司主体换了个更 AI 的招牌,老产品名留着继续卖。
#Intercom#Fin#Product update
精选理由
H 是因为 Intercom 改名 Fin 是个反常的 AI 品牌转向,来自一家成熟的 SaaS 公司;R 是因为客服 SaaS 正在向 agent 方向转型,连名字都改了。K 不成立,因为正文没披露改名原因、上线细节或业务指标。
一句话点评
Intercom 把公司名改成了 Fin,老产品名 Intercom 继续卖。CEO 承认改名拖太久,理由是科技圈失败的改名案例太多。正文没披露改名对业务数据的具体影响,比如客户迁移成本或品牌认知变化。简单说就是:公司主体换了个更 AI 的招牌,老产品名留着继续卖。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
23:05
30d ago
彭博科技· rssEN23:05 · 05·13
黑石REIT上市募资17.5亿美元,专买数据中心
黑石数字基础设施信托在美国IPO拿了17.5亿美元,钱要用来买数据中心。这轮融资说明投资者对AI基础设施的热情还在,但正文没披露具体要买多少资产、目标是谁、什么时候动手。
#Blackstone Digital Infrastructure Trust#Blackstone#Funding
精选理由
HKR-K靠17.5亿美元IPO数字通过,但HKR-H和R都弱:正文没给资产规模、收购目标、时间表,也没直接关联AI算力。这条属于低到中等的行业报道范畴。
一句话点评
黑石旗下数字基础设施信托IPO拿了17.5亿美元(约126亿人民币),钱要用来买数据中心。这轮融资说明机构对AI基建的热情还在,但正文被墙了,没披露具体要买多少资产、目标是谁、什么时候动手。如果是真的,这笔钱在当下算大额弹药,但数据中心收购价格和运营成本都没提,投资回报率不好判断。短评:AI基建热钱还在,但缺细节,先别激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
23:00
30d ago
彭博科技· rssEN23:00 · 05·13
中国AI股票涨得猛但做空难,7月解禁后才好下手
做空机构现在很难借到中国那些亏损AI公司的股票,因为流通盘太小。锁定期到7月才结束,届时才有更多股票可以借来卖空。正文没披露具体公司名单和解禁股数量,所以这波做空窗口到底多大还不清楚。
#Commentary
精选理由
HKR三项均通过:7月做空窗口、低流通股机制、AI估值焦虑。正文没披露公司名单和解禁规模,且是市场评论而非模型或产品更新,所以分数落在60–71区间。
一句话点评
做空机构现在很难借到中国那些亏损AI公司的股票,因为流通盘太小。锁定期到7月才结束,届时才有更多股票可以借来卖空。正文没披露具体公司名单和解禁股数量,所以这波做空窗口到底多大还不清楚。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
22:17
30d ago
Sinocism · 比尔·毕晓普· rssEN22:17 · 05·13
特朗普抵京,黄仁勋随行;AI芯片交易未落地
特朗普已到北京,韩正接机。黄仁勋和科技政策办公室主任Kratsios也来了,但正文没披露任何具体的英伟达芯片交易或AI议程成果。Kratsios上个月刚发过一份关于“对抗性蒸馏美国AI模型”的备忘录,这次随行可能涉及相关讨论,但没细节。
#Safety#Donald Trump#Xi Jinping#Nvidia
精选理由
H和R成立:特朗普带黄仁勋进北京,直接触及芯片管制和算力供应。K不成立:正文只提了随行人员,没给AI能源计划、交易条款或政策机制,信息缺口明显。
一句话点评
特朗普到北京,黄仁勋和科技政策主任Kratsios随行,但正文没披露任何具体芯片交易或AI议程成果。Kratsios上个月刚发过一份关于“对抗性蒸馏美国AI模型”的备忘录,这次随行可能涉及相关讨论,但没细节。短评:黄仁勋临时加入,但没谈成什么?Kratsios的蒸馏备忘录是看点,但正文没给结论。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
21:40
30d ago
Hacker News 首页· rssEN21:40 · 05·13
用户吐槽:退订 Claude 后项目全丢,别用 Claude Design
一位 HN 用户发帖说,自己用了 5 个月 Claude Code Max 订阅后想试试别的,结果退订后之前用 Claude Design 做的项目全没了。帖子目前 65 分、13 条评论。用户还提到之前 Anthropic 给过补偿额度,但订阅一结束额度也失效,重新订阅也没恢复。他怀疑只有大 V 闹才会被处理。正文没披露 Anthropic 的官方回...
#Code#Anthropic#Claude#Hacker News
精选理由
一条Hacker News用户投诉帖,62分、12条评论,属于具体个案。核心信息是退订Claude Code Max后Claude Design项目被锁,但正文没披露Anthropic是否有恢复路径、是否涉及数据导出、以及这是否是普遍政策。信息缺口明显,所以分数压在60–71区间。
一句话点评
退订 Claude Code Max 后,之前用 Claude Design 做的项目全没了。用户用了 5 个月,退订后项目消失,补偿额度也失效,重新订阅也没恢复。帖子 65 分、13 条评论,正文没披露 Anthropic 官方回应。短评:订阅制锁数据,退订即丢失,这点先别太激动,可能只是个案,但值得关注。点评:Anthropic 的订阅条款把项目访问权和付费状态绑定,用户退订后数据不可见...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
21:24
30d ago
● P1Hacker News 首页· rssEN21:24 · 05·13
美国医保推出为AI设计的新支付模型
这篇报道标题说美国联邦医保(Medicare)推出了一套专门为AI设计的新支付模型,但正文只给了文章链接和Hacker News链接,没有披露模型的具体机制、覆盖范围或上线时间。目前帖子只有3个积分和0条评论,说明科技圈确实还没注意到这件事。信息缺口很大,没法判断这个模型到底怎么运作、对AI公司有什么实际好处。
#Medicare#TechCrunch#Hacker News#Policy
精选理由
触发硬排除规则-6:只有标题、URL、3 个 HN 热度分和 0 条评论,没有任何数据、案例或机制。HKR-H 钩子成立,但信息源太薄,不足以支撑任何判断。
一句话点评
美国医保开了个口子,让 AI 干的活也能找政府报销了,但科技圈还没反应过来。
锐评
这条新闻值得点开,因为它讲的是一个很实际的信号:美国联邦医保(Medicare)新推出的 ACCESS 支付模型,第一次给 AI 在诊间之外干的活——比如打电话随访、协调住房转介、提醒吃药——留出了报销通道。以前没有这种付费机制,AI 做得再好也收不到钱。文章说科技圈大多数人还没意识到这件事,这判断不算夸张,因为政策细节确实藏在医保规则里,不是常规科技新闻会追的。 不过得打个折:正文没披露这个模型的具体报销标准、试点规模或启动时间,也没说哪些 AI 服务符合条件。它更像一个框架性变化,离“AI 公司能直接赚钱”还有距离。另外,文章只引了 TechCrunch 一家的报道,没有其他信源交叉验证,政策落地会不会打折扣还不清楚。 还缺什么:需要看 CMS(美国医保服务中心)的原始文件,搞清楚支付门槛、审核流程和试点范围。如果这些细节不明确,现在只能说方向对了,但别急着算账。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K0·R0
20:56
30d ago
Product Hunt · AI· rssEN20:56 · 05·13
Nodey:把 n8n 自动化工作流装进口袋
Nodey 是一个手机端的 n8n 控制中心,让你在手机上查看、触发和管理自动化流程。正文没提是否支持编辑或调试,只确认了远程监控和手动触发。对需要随时盯着自动化的运维或业务人员挺实用。
#Nodey#n8n
精选理由
一个手机端 n8n 控制工具,功能明确但信息单薄:只确认了远程监控和手动触发,没提是否支持编辑或调试。对运维人员实用,但不够新颖或深入,不值得上推荐位。
一句话点评
n8n 手机遥控器来了,能看状态、手动触发、用 NFC 或地理围栏启动流程,还能用 AI 诊断失败任务。对运维和业务人员挺实用,不用开电脑就能盯着自动化。但正文没提是否支持编辑或调试,目前更像监控面板而非完整 IDE。免费可用,具体限制没披露。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
20:37
30d ago
Product Hunt · AI· rssEN20:37 · 05·13
TrustClaw:一行命令在 Vercel 上自托管一个能连 1000+ 应用的 AI 代理
Composio 今天在 Product Hunt 上发布了 TrustClaw,一个可以自托管的 AI 代理,主打“一行命令部署到 Vercel”。它背后连了 1000 多个应用(通过 OAuth 授权),能自己跑定时任务,还能在网页或 Telegram 上跟你对话。代码完全开源,MIT 协议。说白了,就是给你一个能直接干活、不用把数据交给第三方的个...
#Agent#Tools#Composio#Vercel
精选理由
H 和 R 靠自托管 agent 这个角度过关,但 K 太弱:价格、许可证、部署条件全没披露。整体只能算低优先级的产品更新,不值得推荐。
一句话点评
Composio 推出 TrustClaw,一个能自托管、一行命令部署到 Vercel 的 AI 代理,背后连了 1000 多个应用(通过 OAuth 授权),能跑定时任务,还能在网页或 Telegram 上对话。代码完全开源(MIT 协议)。亮点是数据不用交给第三方,适合对隐私敏感的用户。但正文没披露具体支持哪些应用、部署步骤是否真的一行搞定,以及免费版有没有调用次数限制。如果是个人开发者...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
20:03
30d ago
r/LocalLLaMA· rssEN20:03 · 05·13
上下文不等于控制权:新评测看模型会不会被错误信息带偏
RJSabouhi 发了一篇短文和一个评测集,核心观点是:模型出错不光是“信息不够”,更多时候是“信息太多但分不清谁说了算”。评测覆盖 7 种上下文干扰,比如检索文档、用户预设、引文、夹带指令、无依据断言、假权威等。说白了就是看模型能不能守住“信息来源边界”——哪些内容能当证据用,哪些只是背景或干扰。作者特别强调这不是要解决幻觉,而是把很多幻觉/顺从/...
#RAG#Safety#Benchmarking#RJSabouhi
精选理由
这篇短论文和评测集的价值在于它把“模型该信什么”这个模糊问题拆成了7类可测的上下文陷阱,对RAG和Agent安全有直接参考意义。但正文没披露模型具体表现、样本量或可复现细节,验证力度偏弱,所以放在高关注度全量推送档位。
一句话点评
模型出错不光是信息不够,更多是信息太多但分不清谁说了算。作者 RJSabouhi 发了一个评测集,测试模型在 7 种上下文干扰下能否守住“信息来源边界”——比如检索文档、用户预设、引文、夹带指令、无依据断言、假权威等。说白了就是看模型能不能区分哪些内容能当证据用,哪些只是背景或干扰。评测集已开源,覆盖场景挺全,但正文没披露具体模型得分和样本量,效果打折。短评:别把上下文当控制信号,模型得学会...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
20:00
30d ago
AI HOT 精选· aihot-apiZH20:00 · 05·13
阿里云发布Qwen-Character:让AI角色记住你、共情你、主动找你聊天
阿里云推出Qwen-Character,主打三个能力:记忆(记住你和之前聊过什么)、共情(理解你的情绪)、主动交互(不用你问,它自己先开口)。官方说用在游戏、虚拟伴侣、自适应学习场景里,参与度能提升50%以上。但正文没披露这个50%是怎么测的、样本多大、价格多少、什么时候能用。如果真能低成本落地,对做虚拟角色或陪伴类产品的团队是个好消息,但这点先别太激...
#Memory#Agent#Alibaba Cloud#Qwen
精选理由
HKR-H和HKR-R通过,因为AI角色的记忆和留存是行业关注点;HKR-K不通过:参与度提升50%以上这个说法缺少评测口径、样本规模和上线条件,信息缺口太大。
一句话点评
阿里云发了Qwen-Character,主打记忆、共情和主动开口。说用在游戏、虚拟伴侣里参与度能提50%以上,但没披露怎么测的、样本多大、价格和上线时间。如果真能低成本落地,做虚拟角色或陪伴类产品的团队可以关注,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
19:59
30d ago
Hacker News 首页· rssEN19:59 · 05·13
Rars:一个几乎全由大模型写出来的 Rust RAR 解压器
作者用 OpenAI Codex 5.5 和 Claude Opus 4.7,花了 5 周业余时间、约 40 美元(补贴价)的 token 费,写出了 5.5 万行 Rust 代码的 RAR 解压器。正文没披露模型生成代码的具体占比,也没说功能覆盖到 RAR 哪个版本。作者自己承认代码是“slop”(垃圾),速度不快,还差点被 OpenAI 封号——因...
#Code#Rars#Open source
精选理由
HKR-H和HKR-R成立:一个LLM写的Rust归档工具是个很强的编码文化钩子。HKR-K不成立,因为feed只披露了HN热度,没有模型、过程、测试或仓库细节。
一句话点评
作者用 OpenAI Codex 5.5 和 Claude Opus 4.7,5 周业余时间、约 40 美元(补贴价)token 费,写出了 5.5 万行 Rust 的 RAR 解压器。代码自称是“slop”(垃圾),速度不快,还差点因逆向 WinRAR 被 OpenAI 封号。正文没披露模型生成代码的具体占比,也没说功能覆盖到 RAR 哪个版本。亮点是成本极低,但验证弱——仅靠作者自己测试...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
19:56
30d ago
彭博科技· rssEN19:56 · 05·13
TPG 说跟 OpenAI 合作是常规操作
私募股权公司 TPG 表示,与 OpenAI 成立合资公司属于其传统业务范畴。正文被 Bloomberg 付费墙挡住,没有披露合资结构、出资金额或时间表。
#TPG#OpenAI#Partnership
精选理由
彭博社加 OpenAI 的组合有浏览价值,但全文只有 TPG 的定性表态,缺少合资结构、资本规模或产品影响。HKR 只过 H,所以落在 60–71 低段。
一句话点评
TPG 说跟 OpenAI 搞合资是它的常规操作,但正文被 Bloomberg 付费墙挡住了,没披露出资额、股权结构或时间表。目前能确认的只有 TPG 在淡化这件事的战略色彩,把它归到传统 PE 业务里。缺关键信息,没法判断这笔交易有多大、OpenAI 拿钱干什么。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R0
19:38
30d ago
彭博科技· rssEN19:38 · 05·13
马斯克的 xAI 拉华尔街投行试用 Grok,为 SpaceX 上市前撑营收
xAI 找了多家与马斯克商业版图有关系的华尔街机构来测试 Grok 聊天机器人,这次推广被包装成在 SpaceX 上市前帮 xAI 拉收入。正文没披露具体是哪几家投行、测试规模多大、部署条件、定价或时间表,信息缺口不少,先别太激动。
#Agent#xAI#Elon Musk#SpaceX
精选理由
Bloomberg 信源扎实,H 和 R 成立,但 K 弱在缺名单、规模和定价。这是一次可讨论的 xAI 商业动作,不是重大产品或融资事件。
一句话点评
短评:马斯克拿 SpaceX 上市前帮 xAI 拉收入当由头,让华尔街关系户试 Grok,但具体哪几家、测什么、多少钱都没说,先别太激动。 点评:xAI 找了多家与马斯克商业版图有关系的华尔街机构来测试 Grok 聊天机器人,这次推广被包装成在 SpaceX 上市前帮 xAI 拉收入。正文没披露具体是哪几家投行、测试规模多大、部署条件、定价或时间表,信息缺口不少,先别太激动。关键看点是:如...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
19:35
30d ago
r/LocalLLaMA· rssEN19:35 · 05·13
Google 收紧免费搜索,Cloudflare 默认拦 AI 爬虫,联网搜索越来越难跑了
Google 把免费 site-specific 搜索的域名上限砍到 50 个,2027 年 1 月 1 日生效,高级搜索的定价至今没公开。Cloudflare 也通过和 GoDaddy 的合作,默认开始拦截 AI 爬虫。这意味着靠免费接口做联网搜索的团队会很快撞墙——50 个域名对多数应用来说根本不够用,而 Cloudflare 的默认拦截会让大量普...
#Tools#RAG#Agent#Google
精选理由
我会先打个折:这是 Reddit 讨论帖,没有官方公告链接,也没披露高级搜索的公开价格或可复现的测试数据。但信息本身对开发者有实际参考价值——Google 免费搜索缩水、Cloudflare 加码拦截,两条路一起变窄,做外挂资料库和让模型进业务流程的人现在就得算账。正文没给出替代方案的具体成本对比,这点先别太激动。
一句话点评
Google 免费搜索接口要砍到只剩 50 个域名,2027 年 1 月生效,高级版定价至今没公开。Cloudflare 联手 GoDaddy 默认拦截 AI 爬虫。靠免费接口做联网搜索的团队很快会撞墙——50 个域名对多数应用根本不够用,Cloudflare 的默认拦截会让大量普通网站数据拿不到。正文没披露 Google 高级搜索的具体价格,也没说 Cloudflare 拦截能否付费绕过。...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:28
30d ago
TechCrunch AI· rssEN19:28 · 05·13
Anthropic 产品负责人:未来 AI 会主动猜你想要什么,甚至在你开口之前
Anthropic 的 Claude Code 和 Cowork 产品负责人 Cat Wu 说,AI 的下一个大方向是“主动”——不等你下指令,它自己推测需求并动手。但正文没披露具体功能、时间表或实现方式,所以这点先别太激动,目前更像一个方向判断。
#Agent#Anthropic#Cat Wu#Claude
精选理由
HKR-H和HKR-R通过:Anthropic产品负责人把主动式AI定义为下一个界面问题,这个判断本身有话题性。HKR-K不通过:因为正文没有披露Claude Code或Cowork的任何功能、时间表或实现机制,所以这条新闻只能留在all层级,不值得单独推高优先级。
一句话点评
Anthropic 产品负责人说 AI 下一步是“主动”——不等你开口就猜需求。但正文没披露任何功能、时间表或实现方式,所以这点先别太激动,目前更像一个方向判断。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
19:22
30d ago
彭博科技· rssEN19:22 · 05·13
黑客已经在用 AI 强化攻击并隐藏痕迹
标题说黑客在用 AI 加强攻击和隐藏活动,但正文只提到安全团队也在用新方法抓攻击者,没有披露样本量、技术细节或受影响目标。信息缺口明显,没法判断 AI 到底帮黑客提升了多少效率。
#Safety#Bloomberg#Incident
精选理由
H和R勉强过关,因为AI黑客攻击是安全风险话题。K不通过:RSS正文没给任何数字、机制、受害方或具体案例,属于低价值报道。
一句话点评
标题说黑客用AI加强攻击和隐藏活动,但正文只提到安全团队也在用新方法抓攻击者,没有披露样本量、技术细节或受影响目标。信息缺口明显,没法判断AI到底帮黑客提升了多少效率。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
19:21
30d ago
AI HOT 精选· aihot-apiZH19:21 · 05·13
Anthropic 把 Claude Code 周额度提了 50%,用到 7 月 13 日
Anthropic 把 Claude Code 的每周使用限额提高了 50%,这个调整至少持续到 7 月 13 日。推文提到可能是 Colossus 1 模型上线带来的算力余量。正文没披露原来的额度是多少、哪些套餐能享受、以及具体怎么算用量——比如是按请求次数还是 token 数。对重度用户来说,额度多了总归是好事,但具体能多干多少活还得看自己实际消耗。
#Code#Anthropic#Claude Code#Colossus 1
精选理由
Anthropic 把 Claude Code 周限额提了 50%,截止 7 月 13 日。对天天用的人,额度多了能少停几次,但正文没讲原来额度是多少、什么套餐能用,所以没法算到底省多少。信息偏薄,不够上头条。
一句话点评
Anthropic 把 Claude Code 周额度提了 50%,至少到 7 月 13 日。推文猜测是 Colossus 1 模型上线腾出了算力。但正文没披露原额度、适用套餐和用量计算方式(按请求还是 token)。对重度用户是好事,但具体能多干多少活还得看自己实际消耗。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
19:11
30d ago
彭博科技· rssEN19:11 · 05·13
库克、马斯克随特朗普访华,黄仁勋不在名单上
特朗普将对中国进行36小时访问,蒂姆·库克、埃隆·马斯克等美国科技CEO随行,预计会谈涉及关税、台湾等议题。截至发稿,英伟达CEO黄仁勋不在出席名单上。正文没披露AI议题的具体讨论方向,但多位AI相关企业高管到场,说明AI会是绕不开的话题。
#Inference-opt#Apple#Tim Cook#Tesla
精选理由
HKR-H靠CEO阵容和黄仁勋缺席拿到通过,但HKR-K和HKR-R都不及格,因为正文没有给出具体的AI政策、芯片管制或合作细节。这条新闻只能算行业背景,价值偏低。
一句话点评
特朗普带库克、马斯克访华36小时,AI会是绕不开的议题。但正文没披露具体谈什么——芯片出口限制?中国AI监管?还是合作机会?黄仁勋不在名单上,这点先别太激动。看点在于多位AI相关CEO到场,说明AI已成贸易谈判标配,但具体方向全靠猜。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
19:08
30d ago
r/LocalLLaMA· rssEN19:08 · 05·13
八张 AMD MI50 跑 Qwen 3.6-27B,生成速度 52.8 token/秒,首字延迟 32.9 秒
Reddit 用户 ai-infos 用八张 AMD MI50 显卡(每张 16GB HBM2)跑 Qwen 3.6-27B 模型,用的是 vLLM 的 ROCm 分支。标题里报的生成速度是 52.8 token/秒,预填充速度 1569 token/秒,没开 MTP(多 token 预测)也没做量化。实际测试是同时发 4 条请求,每条输入 1 万 t...
#Inference-opt#Tools#Qwen#vLLM
精选理由
HKR 三项都过:硬件配置具体(8×MI50),有基准条件和实测数据(32.91 tok/s、32.9s TTFT),且能引发本地推理圈对成本和 AMD 可行性的讨论。来源单一(Reddit 用户)、硬件范围窄,分数落在 60–71 区间。
一句话点评
八张AMD MI50(16GB HBM2)跑Qwen 3.6-27B,生成速度52.8 token/s,预填充1569 token/s,没开量化也没用多token预测。实测4条并发请求(输入1万token,输出1千token),实际生成掉到32.9 token/s,首token延迟32.9秒。速度还行,但首token延迟偏高,长输入场景下体验打折。正文没披露功耗和成本,MI50是旧款加速卡,...
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R1
19:07
30d ago
AI HOT 精选· aihot-apiZH19:07 · 05·13
Claude代码周限额临时提升50%
Anthropic把Claude Code的每周使用额度临时提高了50%,从即日起到7月13日,Pro、Max、Team和按席位付费的企业用户都能享受。相当于原来一周能跑100次现在能跑150次,对重度用户算是个小福利。不过这只是限时活动,正文没提活动结束后额度会不会回调。
#Code#Claude#Product update
精选理由
HKR 三项全过:50% 的配额提升、截止日期和适用套餐都写清楚了,对开发者有用,但不是新能力或模型发布,所以保持 high all。
一句话点评
Anthropic 把 Claude Code 周额度临时提了 50%,Pro/Max/Team 和按席位付费的企业用户都能用,相当于原来一周 100 次变 150 次。对重度用户算小福利,但只是限时到 7 月 13 日,正文没提结束后会不会回调。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
18:51
30d ago
Product Hunt · AI· rssEN18:51 · 05·13
Stella:号称全球首款能自己改自己的桌面应用
Stella 是一款桌面应用,宣传点是“自我修改”——它能自己改自己的代码或行为,不需要用户手动更新。功能上覆盖了后台操作电脑、浏览器、Office 文件、写代码、生成图片/视频/3D 等,还支持手机发消息遥控。标榜零配置、开箱即用。不过正文没披露它到底怎么实现自我修改的,也没说支持哪些操作系统、价格多少、什么时候正式发布。目前只在 Product H...
#Stella#Product Hunt#Product update
精选理由
标题概念新颖,H 通过;但正文信息太少,K 和 R 都不及格。这属于低价值的产品发布预告,不值得投入时间深挖。
一句话点评
Stella 号称全球首款“自我修改”桌面应用,能自己改代码、操作电脑、写 Office、生成图片视频,还支持手机遥控。但正文没披露自我修改的具体机制、支持哪些系统、价格和发布时间。目前只有 Product Hunt 上的 56 个 upvote 和 22 个关注,验证很弱。先别太激动,等更多细节出来再说。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
18:46
30d ago
Hacker News 首页· rssEN18:46 · 05·13
OpenAI 庭审:Altman 被当庭质问“惯于撒谎”
Ars Technica 报道,在决定 OpenAI 未来的庭审中,Altman 周二出庭,被迫面对原告方(马斯克)律师提出的“惯于撒谎”指控。马斯克此前起诉 OpenAI 背离非营利使命、与微软合谋“窃取慈善机构”。Altman 在庭上自称“我相信自己是个诚实的人”。正文未披露 Altman 具体如何回应撒谎指控,也未透露庭审是否出现关键证据。
#Sam Altman#OpenAI#Ars Technica#Policy
精选理由
HKR-H 和 HKR-R 通过:OpenAI 庭审涉及 Altman 可信度,有明确讨论价值。HKR-K 不通过:RSS 缺少证词、案件背景或证据,信息缺口太大,所以分数落在 60–71 区间。
一句话点评
Altman在庭审中被马斯克律师贴脸开大,指控他“惯于撒谎”。Altman回应“我相信自己是个诚实的人”,但正文没披露他具体怎么反驳,也没给出关键证据。这场官司决定OpenAI未来走向,看点在于Altman的诚信能否经得起交叉质询。目前信息缺口大,先别急着站队。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
18:42
30d ago
AI HOT 精选· aihot-apiZH18:42 · 05·13
AI电影大师Gossip Goblin创作流程首度揭秘?其实正文啥也没说
这条推文标题说首次揭秘AI电影《Gossip Goblin》的创作流程,但正文只提了一句“主要用Kling做动画”,没有披露任何具体步骤、模型参数、定价或可复现的制作条件。说白了就是个标题党,想看干货的可以散了。
#Multimodal#Gossip Goblin#Kling#PJaccetturo
精选理由
触发硬排除规则5:这是供应商侧“创作者用了Kling”的案例,没有工作流细节或可复现数据。H/K/R三项都不满足,所以分数低于40。
一句话点评
标题说“首度揭秘AI电影创作流程”,正文只提了一句“主要用Kling做动画”,没披露任何步骤、参数或成本。说白了就是个标题党,想看干货的可以散了。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
18:31
30d ago
AI HOT 精选· aihot-apiZH18:31 · 05·13
Krea 2 上线情绪板分享
Krea 2 新增了情绪板分享功能,现在你可以把做好的情绪板发给别人看。推文附了几个示例链接,但没说明分享权限、协作方式或是否收费。
#Krea#Product update
精选理由
HKR-K 通过,因为可分享的情绪板是一个具体更新;但 HKR-H 和 HKR-R 不通过:没有意外角度,没有权限/定价/工作流细节。小产品更新,不值得上推荐位。
一句话点评
Krea 2 上线情绪板分享功能,可以直接把做好的视觉参考发给别人看。推文附了几个示例链接,但没披露分享权限(公开/私密)、是否支持协作编辑,以及免费版能不能用。功能本身不复杂,对设计师团队协作有用,但信息缺口太大,具体体验得自己试。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K1·R0
18:21
30d ago
彭博科技· rssEN18:21 · 05·13
企业还在“试水”AI成本,OpenAI新开咨询业务,TPG牵头砸几十亿美元
彭博分析师David Trujillo说,企业目前仍在测试AI的成本,还没大规模铺开。OpenAI这周推出了咨询和服务业务,帮客户落地AI。另外,TPG牵头的合资公司拿到了几十亿美元的私募资金。正文没披露具体金额和客户案例,所以这点先别太激动——几十亿听着多,但分到具体项目上能撑多久还不清楚。
#David Trujillo#TPG#OpenAI#Product update
精选理由
Bloomberg视频片段信息量有限,正文没披露具体成本数字或测试细节,不够上头条。但OpenAI做咨询、TPG拿几十亿美金这两条线,对关注企业AI落地和资本动向的人有价值。
一句话点评
彭博分析师说企业还在试AI成本,没大规模铺开。OpenAI这周推咨询业务帮落地,TPP牵头的合资公司拿到几十亿美元私募资金。正文没披露具体金额和客户案例,几十亿听着多,分到具体项目能撑多久还不清楚。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
18:15
30d ago
r/LocalLLaMA· rssEN18:15 · 05·13
有人把 Anthropic 的“自然语言自动编码器”跑在本地了,还做了个 UI 让你调模型内部想法
Reddit 用户发布了一个叫 nla.cpp 的工具,基于 llama.cpp 改造,支持 Anthropic 提出的四种自然语言自动编码器功能。配合 Mikupad UI,可以查看每个 token 的激活解释,还能手动“引导”模型输出方向。说白了就是让你能看模型内部在想什么,甚至试着改一改它的思路。不过正文被 Reddit 屏蔽了,具体支持哪些模型...
#Interpretability#Tools#Inference-opt#Anthropic
精选理由
Reddit 个人工具发布,没有跑分、安装门槛或稳定性数据,正文也没披露具体模型大小或硬件要求,属于 60–71 分的 niche 开源工具档。
一句话点评
有人把 Anthropic 那套“自然语言自动编码器”搬到了本地,用 llama.cpp 跑,还配了个 UI 叫 Mikupad。能看每个 token 的激活解释,甚至手动“引导”模型输出方向——说白了就是拆开黑箱看一眼,再试着拧一拧。但正文被 Reddit 屏蔽了,具体支持哪些模型、效果多好、引导会不会把模型搞崩,全没披露。如果是真的,对可解释性研究是个低成本玩具,但先别太激动,等代码放出...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
17:17
30d ago
AI HOT 精选· aihot-apiZH17:17 · 05·13
Krea 2 发限量访问码,每个码能用 50 次
Krea AI 放出了三个 Krea 2 的访问码(K2-PRFUF8 / K2-NRWW9E / K2-CAP48S),每个码能用 50 次。官方说这是他们第一个从零训练的基座模型,主打审美多样性和风格控制。目前只有码没有公开模型细节,具体效果和参数都没披露。
#Multimodal#Krea AI#Product update
精选理由
HKR的H和K通过:码的数量有限,加上是Krea首个自研基础模型,信息具体。来源是Krea的X帖子,没有基准测试、定价、部署范围或能力证明,属于小产品更新,从业者参考价值有限。
一句话点评
Krea 2 放出三个访问码,每个能用 50 次,总共 150 次生成机会。官方说是第一个从零训练的基座模型,主打审美多样性和风格控制。但正文没披露参数量、训练数据、评测指标,效果全靠抢到码的人试。限量码+无细节,更像早期用户测试,不是正式发布。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R0
17:15
30d ago
● P1彭博科技· rssEN17:15 · 05·13
Microsoft 在 OpenAI 合作上累计投入超过 1000 亿美元
彭博这条消息的正文被付费墙挡住了,只抓到一个标题。标题说微软至今在 OpenAI 合作上花的钱已经超过 1000 亿美元,但具体怎么花的、分几年、是现金还是算力折算,正文没披露。这个数字本身很大——作为对比,微软 2025 财年全年资本开支大概在 800 多亿美元,等于把一年多点的全部基建预算都砸进这一项合作里。不过先别太激动,没看到明细之前,没法判断...
#Microsoft#OpenAI#Partnership
精选理由
Bloomberg 抛出一个超过 1000 亿美元的数字,把微软和 OpenAI 之间的经济与控制关系摆上台面。我会先打个折:正文没披露这笔钱具体怎么花的、分了多少年、有没有附带条款,所以只能当个信号看。HKR 三项都成立,但信息缺口明显,重要性停在 84 不动。
一句话点评
微软在 OpenAI 身上砸了超 1000 亿美元,但回报只有 300 亿,新协议把分成上限锁在 380 亿,省了 970 亿,这笔账算得很精。
锐评
微软企业发展负责人在庭审中确认,对 OpenAI 的累计支出已超 1000 亿美元,其中只有 130 亿是直接投资,大头是 Azure 云基础设施和托管成本。到 2025 年,相关营收约 300 亿美元,投入产出比目前看并不好看。不过新签的非独家协议把 OpenAI 的分成上限卡在 2030 年前累计 380 亿美元,相比旧条款能省下约 970 亿美元,微软在财务上给自己留了很大的安全垫。 纳德拉在庭上打感情牌,说当年投资是“没人愿意下注”时扛的风险,但文章没披露这 1000 亿里有多少已经转化为固定资产或研发摊销,也没说 300 亿营收的利润率和增速。光看总额容易高估或低估这笔投资的真实回报。 另外,微软已经在看其他 AI 初创公司,包括考虑过收购 Cursor 但怕反垄断没动手。这说明微软不想把身家性命全绑在 OpenAI 上,一边用新协议锁成本,一边在外面找备胎。后续值得盯的是微软自研模型进展,以及它对其他 AI 公司的收购动作,那才是判断它长期 AI 路线的关键。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
17:14
30d ago
● P1彭博科技· rssEN17:14 · 05·13
Anduril 融资50亿美元估值翻倍至610亿美元
Anduril 在 Thrive Capital 和 a16z 领投的一轮里融了 50 亿美元,估值直接跳到 610 亿美元,比上一轮翻了一倍。CEO Brian Schimpf 说这笔钱主要砸在三个地方:扩大产线、研发和基础设施。视频里没给具体的收入数字或交付时间表,所以这个估值到底靠多少实际订单撑着,正文没披露。
#Robotics#Anduril#Thrive Capital#Andreessen Horowitz
精选理由
Anduril 这轮 50 亿直接把估值拉到 610 亿,翻了一倍,说明资本在押注国防 AI 和自主系统的制造规模。钱会砸进工厂、研发和基建,不是纯烧模型,而是铺产能。我会先打个折:正文没披露具体产能目标或交付时间表,所以别急着算回报。对从业者来说,这更像一个信号——国防机器人赛道在加速从原型走向量产,但验证还要看后续订单和交付数据。
一句话点评
Anduril 估值半年翻倍到 610 亿美元,但 FT 正文被付费墙挡住,具体融资条款和收入数据都没看到。
锐评
Anduril 这轮融了 50 亿美元,估值直接冲到 610 亿,比上一轮翻了一倍。这个数字说明资本在加速押注国防科技赛道,尤其是用 AI 做无人机、反无人机系统和边境监控这类硬件的公司。不过目前能读到的只有标题,FT 和彭博的正文都在付费墙后面,没法确认这轮融资的领投方、资金用途和公司最新的营收规模。估值翻倍听起来很猛,但国防科技公司的收入往往跟政府合同节奏走,波动大,没有收入数据的话,610 亿这个数字到底贵不贵还不好说。另外,正文没披露公司是否盈利,也没提到这轮融资有没有附带对赌条款。这些信息缺口让估值翻倍这件事得先打个折看,等更多细节出来再判断。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
17:08
30d ago
AI HOT 精选· aihot-apiZH17:08 · 05·13
人形机器人 Helix-02 已能自主干满8小时轮班
Brett Adcock 发视频称,其人形机器人 Helix-02 已能以人类水平自主完成8小时轮班。正文没披露具体任务类型、机器人数量或现场条件,所以先别太激动——能干满8小时不等于能干好所有活。如果属实,对工厂流水线这类重复性岗位是个信号,但验证信息还太少。
#Robotics#Agent#Brett Adcock#Kimmonismus
精选理由
HKR-H和HKR-R通过:8小时自主轮班的说法有噱头且跟机器人落地强相关。HKR-K不通过:任务、机队规模和场地条件都没说,够不上精选。
一句话点评
Brett Adcock 发视频说 Helix-02 人形机器人已能自主干满8小时轮班,且达到人类水平。但正文没披露具体任务类型、机器人数量或现场条件,所以先别太激动——能干满8小时不等于能干好所有活。如果是真的,对工厂流水线这类重复性岗位是个信号,但验证信息还太少。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
17:08
30d ago
r/LocalLLaMA· rssEN17:08 · 05·13
Reddit 帖子说百度文心本月可能发新模型,但正文只贴了截图和视频链接
一条 Reddit 帖子称百度文心(ERNIE)本月可能发布新模型,但正文只引用了两条推文截图和一个 2.5 小时的百度 Create 2026 视频,没有披露模型参数量、具体发布时间或开源条件。帖子本身没有提供任何技术细节或官方确认,信息缺口很大,目前只能当作传闻看待。
#Baidu#ERNIE#Product update
精选理由
只有 HKR-H 通过:百度文心新模型的传闻有钩子,但正文缺少参数、发布时间、开源条件或官方确认,国内旗舰模型发布的热度不适用。
一句话点评
Reddit 帖子说百度文心本月可能发新模型,但正文只贴了两条推文截图和一个2.5小时的百度大会视频,没提参数量、发布时间或是否开源。目前纯属传闻,信息缺口太大,先别当真。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
17:06
30d ago
r/LocalLLaMA· rssEN17:06 · 05·13
DramaBox:号称“最有表现力”的语音模型,基于LTX 2.3
Reddit 帖子介绍了一个叫 DramaBox 的语音模型,基于 LTX 2.3,号称“最有表现力”。作者给了 GitHub、模型和在线体验三个链接,但正文没披露训练数据量、参数量或任何评测指标。所以“最有表现力”目前只是宣传,没有公开证据支撑。如果你好奇可以去试玩链接听一下,但别急着下结论。
#Audio#ResembleAI#DramaBox#LTX
精选理由
一个基于 LTX 2.3 的小型开源语音模型发布,附了可测试的链接,但训练数据、参数规模和评测结果都没披露。只有 K 条件通过,所以定位为中等关注度的开源更新,评分 60。
一句话点评
DramaBox 号称“最有表现力”的语音模型,基于 LTX 2.3,但正文没披露训练数据量、参数量或任何评测指标,所以这个称号目前只是宣传。如果你好奇可以去试玩链接听一下,但别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K1·R0
17:04
30d ago
AI HOT 精选· aihot-apiZH17:04 · 05·13
Krea 2 情绪板教程:10-20张参考图就能定调
Krea AI 发了个 Krea 2 情绪板教程,说不用塞满 250 个图片位,10-20 张高质量参考图就够确立视觉方向并出图。对做设计或风格探索的人来说,这能省不少挑图时间,但教程没提这些参考图具体怎么选、风格冲突时怎么处理,实操细节还得自己试。
#Vision#Tools#Krea AI#Krea 2
精选理由
HKR-H和HKR-K成立,因为10–20张参考图替代250个图片位这个点有信息差,且给出了可复用的操作条件。HKR-R弱,这只是一条来自厂商的流程小技巧,不是行业级故事。
一句话点评
Krea 2 说情绪板不用塞满250张图,10-20张高质量参考图就能定视觉方向。这对设计师挺友好,省了挑图时间。但教程没讲参考图怎么选、风格冲突咋处理,实操细节得自己试。短评:省事但得自己踩坑。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
16:45
30d ago
● P1The Verge · AI· rssEN16:45 · 05·13
Meta AI推出端到端加密的隐私聊天模式Incognito Chat
Meta 老板扎克伯格亲自发帖,给 Meta AI 加了一个“无痕聊天”模式。按他的说法,这种对话用上了端到端加密,聊完退出会话后消息就没了,服务器上不存对话记录。Meta 强调这跟其他聊天机器人不一样。不过,这篇报道没写这个功能什么时候上线、覆盖哪些地区,也没提 Meta 有没有找第三方来做安全审计,或者密钥到底是怎么管的。所以“完全私密”这个说法,...
#Safety#Meta#Mark Zuckerberg#The Verge
精选理由
我会先打个折:Meta 说“完全私密”的 AI 聊天,服务器不存日志还端到端加密,听着挺省钱省心。但正文没披露上线范围、保留策略审计和密钥管理机制,这点先别太激动。它更像一个产品更新,隐私承诺的验证链条还没给全,所以放在 featured 里当个信号看就行。
一句话点评
Meta AI 在 WhatsApp 里加了个阅后即焚的隐身聊天,扎克伯格说全程端到端加密。但正文没讲加密密钥怎么管、模型是不是本地跑,隐私成色得打个折。
锐评
Meta 给 WhatsApp 里的 AI 助手加了个“隐身聊天”模式,核心卖点是端到端加密,聊完记录自动消失。扎克伯格亲自站台说“完全私密”,这说法挺重,但文章里没给出技术细节来撑住它。 最大的信息缺口在于:加密到底发生在哪一层?如果模型推理还在 Meta 服务器上,那“端到端”只保护了传输过程,Meta 自己能不能看到请求内容,正文完全没提。另外,聊天记录阅后即焚,那 Meta 还拿不拿这些对话去改进模型?如果还做训练或日志留存,隐私承诺就要大打折扣。 目前只有 The Verge 一篇报道,且基于 Meta 官方口径,没有独立安全审计或第三方验证。对真正在意隐私的用户来说,这点先别太激动,等白皮书或技术文档出来再看。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
16:43
30d ago
r/LocalLLaMA· rssEN16:43 · 05·13
Reddit 用户对比 Qwen3.5 122B 量化版:Unsloth 在 GSM8K 上略胜一筹
一位 Reddit 用户在 LocalLLaMA 板块发帖,比较了 Qwen3.5 122B 的 IQuality 和 Q4_K_XL 两种量化版本,并提到 Unsloth 的量化版在 GSM8K 数学推理测试中表现稍好。不过帖子没有给出具体分数、硬件配置、提示词或可复现的设置,所以这个结论只能当个参考,没法直接拿来用。
#Inference-opt#Benchmarking#Unsloth#Mudler
精选理由
Reddit 用户测了 Qwen3.5 122B 的 Q4_K_XL 量化版,说 Unsloth 在单次 GSM8K 上比 IQuality 好一点。但正文没披露具体分数、用什么硬件跑的、能不能复现,信息缺口太大。唯一能看的是社区在讨论量化工具选型,对本地部署用户有参考意义,所以只留了 R 标签,整体归入 all 层级。
一句话点评
Reddit 用户对比了 Qwen3.5 122B 的 IQuality 和 Q4_K_XL 两种量化版,称 Unsloth 的量化版在 GSM8K 数学推理上“稍好”。但帖子没给具体分数、硬件配置、提示词,结论只能当个参考。正文被屏蔽,无法核实更多细节。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
16:31
30d ago
TechCrunch AI· rssEN16:31 · 05·13
Sam Altman 在法庭上自称“诚实可信”
Sam Altman 在联邦法庭作证时自称“诚实可信的商人”。正文未披露案件背景、开庭日期或质询细节,信息缺口较大,无法判断这是辩护策略还是个人声明。
#Sam Altman#Commentary
精选理由
HKR-H/R 通过:Altman 法庭自证诚信的标题有强点击钩子,也触及 OpenAI 信任问题。HKR-K 不通过:缺少案件背景和质询细节,信息量不足,因此评分落在 60–71 区间。
一句话点评
Sam Altman 在联邦法庭自称“诚实可信的商人”。正文没披露案件背景、开庭日期或质询细节,信息缺口太大,无法判断这是辩护策略还是个人声明。先别急着信,等更多上下文。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
16:22
30d ago
TechCrunch AI· rssEN16:22 · 05·13
Origin Lab 融资 800 万美元,帮游戏公司把数据卖给世界模型团队
Origin Lab 刚拿了 800 万美元,打算搭一个授权数据市场,让 AI 实验室能从游戏公司手里买高质量数据集。正文没披露投资方、定价模式、上线时间或数据集使用条款。游戏数据对训练世界模型挺有价值,但数据授权和定价怎么落地还不清楚。
#Multimodal#Origin Lab#Funding#Product update
精选理由
HKR三项都过:h新鲜,k有融资和机制但信息不全,r切中数据稀缺痛点。重要性给68分合理,因为只是早期融资,关键细节缺失,不值得更高分。
一句话点评
Origin Lab 拿了800万美元搭个数据市场,让AI实验室从游戏公司买高质量数据训练世界模型。游戏数据确实值钱,但正文没披露投资方、定价模式、上线时间或数据集使用条款,这点先别太激动。如果是真的,能帮AI公司绕过版权雷区,但授权和定价怎么落地还不清楚。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:15
30d ago
FT · 科技· rssEN16:15 · 05·13
白领报告“AI脑糊”:被新工具搞到 overwhelmed,但调查细节全没披露
FT 标题说白领报告“AI 脑糊”(AI brain fry),意思是员工被新技术搞得头大、精力透支。但正文被付费墙挡住,RSS 摘要只提了一句“工人对新科技感到 overwhelmed”,没披露样本量、行业分布、调查方法、时间范围。结论本身不意外,但缺乏数据支撑,没法判断是普遍现象还是少数人抱怨。
#Financial Times#Commentary
精选理由
FT 的报道有来源背书,HKR 的 H 和 R 靠“AI 脑疲劳”这个职场话题过关。K 不过是因为摘要没披露样本量、方法或具体案例,所以只能放在“有趣但不重点推荐”的档位。
一句话点评
FT 报道白领出现“AI 脑糊”,说员工被新技术搞得头大精力透支。但全文被付费墙挡住,RSS 只提了一句“工人感到 overwhelmed”,没披露样本量、行业分布、调查方法。结论不意外,但缺乏数据支撑,没法判断是普遍现象还是少数人抱怨。短评:标题抓人,但正文被墙,信息量约等于零。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
16:13
30d ago
AI HOT 精选· aihot-apiZH16:13 · 05·13
Runway 推出 Agent:把视频剪辑、生图和 3D 建模塞进一个工作流
Runway 上线了一个叫 Agent 的新产品,把视频特效、图片生成和 3D 建模整合到一个界面里,用户上传一张图、写一句话就能出大片级 VFX 效果。正文没披露定价、模型细节、上线时间,也没有可复现的评测条件,所以目前只能当个概念预览看。对做视频后期或创意内容的人来说,如果真能跑通,省掉来回切软件的时间是实打实的。
#Agent#Multimodal#Tools#Runway
精选理由
HKR-H 和 HKR-K 通过:多模态 Runway Agent 有明确钩子和基本机制。价格、模型细节、发布时间和可复现评测条件都没披露,所以这条属于普通产品更新档位。
一句话点评
Runway 把视频特效、图片生成和 3D 建模塞进一个界面,上传一张图写句话就能出大片级 VFX。正文没披露定价、模型细节、上线时间,也没有可复现的评测条件,目前只能当概念预览看。对做视频后期的人来说,如果真能跑通,省掉来回切软件的时间是实打实的。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
16:00
30d ago
TechCrunch AI· rssEN16:00 · 05·13
Anthropic 开始拉拢小企业主
Anthropic 新推出一项面向小企业主的产品,瞄准美国 3600 万家小企业这个市场。正文没披露产品功能、定价、上线时间或哪些客户能用。对创业者和投资人来说,这意味着 AI 平台战正在下沉,下一个抢用户的主战场不再是世界 500 强,而是小企业。
#Anthropic#Product update
精选理由
H 给分是因为 Anthropic 这次瞄准小企业主,不是常规模型发布,角度有点新;K 靠的是 3600 万家这个数字,但正文没披露功能、定价和上线时间,信息缺口太大,只能放 all。
一句话点评
Anthropic 盯上美国 3600 万家小企业,推新产品。但正文没披露功能、定价、上线时间,信息缺口很大。方向对:AI 平台战从大企业下沉到小生意,但这点先别太激动,等产品细节出来再说。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
15:54
30d ago
r/LocalLLaMA· rssEN15:54 · 05·13
Sipeed K3 RISC-V 开发板跑 30B 模型,60 TOPS 算力但实测细节全缺
Sipeed 的 K3 RISC-V 单板计算机号称能跑 30B 参数的大模型,INT4 下算力 60 TOPS,还支持 BF16/FP16。60 TOPS 在边缘设备里算不错,但正文只贴了个外部链接,没披露跑了哪个模型、用了什么推理框架、具体怎么配置的。所以这个 30B 到底能跑到多少 token/秒、内存够不够、实际能不能用,全都不清楚。想尝鲜的可...
#Inference-opt#Sipeed#Product update
精选理由
标题说 Sipeed K3 RISC-V 开发板能跑 30B 参数大模型,INT4 算力 60 TOPS,支持 BF16/FP16/INT4,硬件指标挺唬人。但正文只有外链,没披露实测吞吐、内存配置或复现条件——这点先别太激动。对关注本地推理和硬件控制的从业者来说,RISC-V 跑 30B 是个信号,但信息缺口太大,只能算小硬件更新,不值得高优先级。
一句话点评
Sipeed 的 K3 RISC-V 单板计算机号称 INT4 下 60 TOPS,能跑 30B 参数模型。60 TOPS 在边缘设备里算不错,但正文只贴了个外部链接,没披露跑了哪个模型、用了什么推理框架、具体配置。所以 30B 到底能跑到多少 token/秒、内存够不够、实际能不能用,全都不清楚。想尝鲜的可以先观望,等有人跑出 benchmark 再说。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:30
30d ago
The Verge · AI· rssEN15:30 · 05·13
微软在马斯克诉奥特曼案中只想撇清关系
The Verge记者旁听马斯克诉奥特曼案第三周,觉得微软比他还想离开法庭。微软的开场陈述几乎就是自家产品广告,连Xbox都列进去了,潜台词是:这案子很荒谬,我们不该被扯进来,但陪审团各位不妨玩个游戏。正文没披露具体争议点、关键证词或判决时间表。
#Microsoft#Elon Musk#Sam Altman#Incident
精选理由
HKR-H和HKR-R通过:OpenAI法庭戏码加微软的尴尬角色有讨论价值。HKR-K不通过,因为正文没披露具体诉求、证词和裁决时间,信息缺口大,兴趣度偏低。
一句话点评
微软在马斯克诉奥特曼案第三周的开场陈述,几乎把自己产品列了个遍,连Xbox都搬出来了。潜台词很直白:这案子很荒谬,我们不该被扯进来,但陪审团各位不妨玩个游戏。The Verge记者旁听后的感受是,微软比他还想离开法庭。正文没披露具体争议点、关键证词或判决时间表,信息缺口明显。短评:微软用产品广告当法庭陈述,潜台词是“这案子跟我无关,但你们玩个游戏吧”。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
15:18
30d ago
Hacker News 首页· rssEN15:18 · 05·13
太浩湖5万居民等通电,电力公司却想把线路优先给数据中心
Fortune报道,加州太浩湖地区约5万居民面临供电不足,而当地电力公司正考虑将现有输电线路改道优先供给新建数据中心。正文没披露是哪家电力公司、数据中心容量多大、项目何时开工,也没说当地缺电缺口具体是多少。简单说就是:一边是居民等电用,一边是数据中心要抢电,电网容量不够,只能二选一。
#Incident
精选理由
HKR三项都达标,但正文只给了5万居民和改线机制这两个事实;公司名称、数据中心规模、改线时间表、供电缺口都没披露。这是一个AI基础设施的社会成本信号,还没到头条级别。
一句话点评
太浩湖5万居民可能没电用,因为电力公司想把线路优先给数据中心。正文没说是哪家电力公司、数据中心多大、何时开工,也没说缺口具体数字。这事提醒我们:AI基建的能源争夺已经从“抢电”升级到“抢路权”,但报道信息不全,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:47
30d ago
AI HOT 精选· aihot-apiZH14:47 · 05·13
Suno 上车了:Apple CarPlay 和 Android Auto 都能用
Suno 正式登陆 Apple CarPlay 和 Android Auto,车主可以在车里直接播放自己用 Suno 生成的歌曲。官方只贴了一个通勤歌单链接,没提支持哪些车型、哪些地区、要不要额外付费。
#Suno#Apple#Android#Product update
精选理由
HKR 的 H 和 K 靠车载平台这个新场景和两个集成名字通过。重要性卡在 63 的小产品更新区间,因为正文没给使用量、技术细节或竞争压力,信息缺口明显。
一句话点评
Suno 正式上车,Apple CarPlay 和 Android Auto 都能用,开车时直接播自己用 Suno 生成的歌。官方只贴了一个通勤歌单链接,没提支持哪些车型、哪些地区、要不要额外付费。目前更像一个尝鲜入口,离“车载流媒体新体验”还差不少细节。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
14:30
30d ago
r/LocalLLaMA· rssEN14:30 · 05·13
花五六万配一台5090跑本地大模型,值不值?
Reddit 用户想配一台 RTX 5090 整机(约 5500-6000 美元,合人民币 4-4.3 万),主要跑 Qwen3.6-27B 和 Gemma4-31B 这类稠密模型,不玩游戏。他纠结是买这台机器,还是按需租云 GPU(比如 vast.ai 或谷歌云)。自己算了一笔账:租云虽然单次便宜,但用多了也贵,而且每次都要配置环境,麻烦。正文没披露...
#Inference-opt#Reddit#Qwen#Google Cloud
精选理由
这是一条个人硬件咨询帖,有预算和模型目标,但没有实测数据或可复现的发现。HKR 只靠价格共鸣拿到 R,所以归入低价值讨论区。
一句话点评
RTX 5090 整机 5500-6000 美元(约 4-4.3 万人民币),跑 Qwen3.6-27B 和 Gemma4-31B 这类稠密模型。用户自己算过账:租云 GPU 单次便宜,但用多了也贵,而且每次要配置环境,麻烦。正文没披露他实际使用频率和月预算,所以没法判断买断还是租赁更划算。如果只是周末玩玩,租云更灵活;如果天天跑实验,买断长期看可能省钱。但 32GB 内存跑 31B 模型有...
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
14:20
30d ago
r/LocalLLaMA· rssEN14:20 · 05·13
llama.cpp 出 Docker 镜像跑 MTP 模型了,Unsloth 的量化版省一半显存
用户 havenoammo 发了五份 llama.cpp Docker 镜像,支持 CUDA 12/13、Vulkan、Intel 和 ROCm,专门跑 MTP(多 token 预测)模型。目前他只测了 cuda13 版,其他没验证。跑 MTP 的关键参数是 --spec-type mtp 和 --spec-draft-n-max 3。同时 Unslo...
#Inference-opt#Tools#llama.cpp#Unsloth
精选理由
一个实用的 LocalLLaMA 工具更新:HKR-K 有具体参数和量化大小对比,HKR-R 触及本地推理成本,但影响面窄,所以分数留在 60-71 区间。
一句话点评
社区用户 havenoammo 打包了五份 llama.cpp Docker 镜像,专跑 MTP(多 token 预测)模型,目前只测了 CUDA 13 版,其他没验证。Unsloth 的 Qwen3.6 MTP GGUF 把部分 MTP 层量化到 Q3_K/Q4_K/Q5_K,MTP 层体积从 430 MB 降到 222 MB,省了近一半显存。但量化会不会影响预测精度和加速效果,作者自己也...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
14:01
30d ago
r/LocalLLaMA· rssEN14:01 · 05·13
有人把 Hugging Face 的 ML 实习项目做成了 Claude 技能,还训了个 1 亿参数小模型
Reddit 用户把 Hugging Face 的 ml-intern 项目改写成 Claude 技能,用订阅制代替按 token 付费,省了推理成本。同时分享了一个用 GPT-2 tokenizer 训练的 100M TinyStories 模型——参数只有 1 亿,适合资源有限时跑故事生成。正文没披露技能的具体效果或模型评测,所以这点先别太激动。
#Agent#Code#Fine-tuning#Hugging Face
精选理由
一个 Reddit 用户的临时方案,没有跑分、安装细节或任务验证,属于低价值的实用分享。
一句话点评
Reddit 用户把 Hugging Face 的 ml-intern 项目改成了 Claude 技能,用订阅制代替按 token 付费,省推理成本。还分享了一个 100M 参数的 TinyStories 模型,用 GPT-2 tokenizer 训练,适合资源有限时跑故事生成。正文没披露技能效果或模型评测,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K1·R1
13:59
30d ago
AI HOT 精选· aihot-apiZH13:59 · 05·13
全球首个全AI运营的电台开播,五个AI主播24小时聊AI动态
一个叫“AI Radio”的在线电台在X上线,主播、编辑、选曲全是AI,没有真人。五个AI主播各有性格和记忆,能实时播报几分钟前的AI新闻,每半小时做一次综述,还追踪融资、分析GitHub工具趋势、总结社区讨论。它们不是念稿,而是会主动发现矛盾、形成论点、互相辩论。背景音乐也是AI选的,不吵。适合当背景音听行业动态。不过正文没披露用了什么模型、成本多高...
#Agent#Memory#Tools#X
精选理由
HKR三项都过,但证据只有一条X帖子,没披露技术栈、听众规模或运营成本,更像一个有意思的产品demo,不是当天必须写的新闻。
一句话点评
全球首个全AI电台上线,五个AI主播24小时播报AI新闻,还能辩论、选曲。关键信息缺失:没披露用了什么模型、成本多高、延迟如何。适合当背景音,但别当权威信源。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
13:34
31d ago
Hacker News 首页· rssEN13:34 · 05·13
开发者抱怨AI在“让脑子变笨”
404 Media 采访了多位签了保密协议或怕被报复的开发者,他们普遍反映被公司强制用AI写代码,但实际体验是:AI生成的代码质量差,自己还得花更多时间检查和修bug,反而更累。更严重的是,有人觉得长期依赖AI后,自己独立写代码的能力在退化,原文引述一位开发者的话说“它肯定让我变笨了”。文章还提到,尽管Google、微软、Meta的高管都在吹AI写了多...
#Code#404 Media#Hacker News#Commentary
精选理由
HKR-H 和 HKR-R 通过:标题是尖锐的开发者焦虑钩子。HKR-K 不通过:RSS 正文没有披露采访人数、案例或证据,只有 HN 元数据,够不上精选。
一句话点评
短评:开发者吐槽被强制用AI写代码,结果更累还变笨。 点评:404 Media这篇报道采访了多位匿名开发者(签了NDA或怕被报复),核心控诉两点:一是AI生成代码质量差,检查修bug比手写更耗时;二是长期依赖后独立编码能力退化,有人直言“它肯定让我变笨了”。文章引用了Reddit、Hacker News上的讨论,但没披露具体采访人数或量化数据(比如效率下降多少、bug率多高)。高管们(Go...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
13:30
31d ago
r/LocalLLaMA· rssEN13:30 · 05·13
Qwen3.6 跑着跑着就停了
Reddit 用户反馈,用 vLLM 在 Docker 里跑 Qwen3.6(27B int4 量化版,张量并行度 2,最大模型长度 185000,最大批处理 token 8192),配合 dflash 投机解码(5 个投机 token),在 qwen-code CLI 和 opencode 下都会中途停止。正文被 Reddit 屏蔽了,没披露具体报错...
#Code#Inference-opt#Tools#Qwen
精选理由
单个Reddit帖子,没有官方确认,也没有说明是普遍问题还是个别配置冲突,影响范围和根因都不清楚,所以只适合全量推送,不做紧急处理。
一句话点评
短评:跑一半就停,可能是量化或投机解码的坑,但正文被屏蔽了,缺关键报错信息。 Reddit 用户反映,用 vLLM 在 Docker 里跑 Qwen3.6(27B int4 量化版,张量并行度 2,最大长度 185k),配合 dflash 投机解码(5 个 token),在 qwen-code CLI 和 opencode 下都会中途停止。正文被 Reddit 屏蔽,没披露具体报错。27B...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R1
13:27
31d ago
TechCrunch AI· rssEN13:27 · 05·13
Poppy 上线主动式 AI 助手:连上日历、邮件、短信,自动提醒你该干嘛
Poppy 发布了一款 AI 应用,能接入你的日历、邮件、短信和其他服务,根据你生活中的动态主动弹出提醒、建议和待办事项。说白了就是不用你手动查,它自己判断什么时候该提醒你什么事。不过正文没披露具体定价、上线范围,也没说用了什么模型架构,所以实际体验和成本还不好判断。
#Agent#Tools#Poppy#Product update
精选理由
HKR-K/R通过:跨应用个人助手机制具体,涉及Agent和数据访问,对从业者有参考价值。HKR-H弱,标题偏营销且正文没披露价格、上线范围、模型机制,信息缺口明显,所以落在60-71产品更新区间。
一句话点评
Poppy 是个主动型 AI 助手,能连你的日历、邮件、短信,自己判断什么时候该提醒你什么事,不用你手动查。但正文没披露定价、上线范围,也没说用了什么模型,实际体验和成本还不好判断。短评:主动提醒是亮点,但没定价没模型,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H0·K1·R1
13:02
31d ago
Product Hunt · AI· rssEN13:02 · 05·13
Vivago Video Agent:号称对标 Sora 的视频生成工具,主打“跳过提示词”
Vivago 在 Product Hunt 上发布了第二版产品,叫 Video Agent。核心卖点是“不用写提示词”,你只要给素材、讲个故事,它就能自动生成一段叙事视频。官方说一段 1 分钟 1080P 的视频大约 40 分钟渲染完,这个速度不算快,但如果你想要的是“有剧情、角色一致”的视频,而不是随机抽卡式的片段,这个流程可能更可控。它还会先生成关...
#Agent#Multimodal#Vivago#Product update
精选理由
就是个普通的 Product Hunt 新品发布,只有 H 钩子。正文没披露模型、定价、画质指标或可复现条件,所以没触发硬排除,但也只能归到低价值的产品更新档位。
一句话点评
Vivago 第二版主打“不用写提示词”,给素材和故事梗概,AI 自动生成有剧情、角色一致的叙事视频。1 分钟 1080P 视频约 40 分钟渲染完,速度不算快,但比随机抽帧可控。短评:叙事视频可控性提升,但渲染慢、定价和模型细节未披露,别急着对标 Sora。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
13:00
31d ago
r/LocalLLaMA· rssEN13:00 · 05·13
TextGen 从网页版变成了桌面应用,不用装环境直接跑
TextGen(原 text-generation-webui)花两个月从网页 UI 改成了免安装的桌面应用,支持 Windows、Linux、macOS,后端覆盖 CUDA、Vulkan、纯 CPU、Apple Silicon、Intel 和 ROCm。相当于 LM Studio 的开源平替,但正文没披露安装包大小、首次启动速度、模型加载方式这些细节...
#Tools#Agent#Code#TextGen
精选理由
这是一个面向本地推理用户的社区工具更新,不是模型或平台级发布。文章只列出了构建选项,没有给出用户采用数据、性能对比或关键机制说明,信息密度偏低。
一句话点评
TextGen 从网页版改成了桌面应用,两个月搞定,支持 CUDA、Vulkan、Apple Silicon 等后端,相当于 LM Studio 的开源平替。但正文被屏蔽,没披露安装包大小、首次启动速度、模型加载方式这些细节,所以实际体验要打折。短评:开源平替来了,但细节欠奉,先观望。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
13:00
31d ago
NVIDIA 博客· rssEN13:00 · 05·13
Hermes 智能体学会自我进化,英伟达 RTX 电脑和 DGX Spark 就能跑
Nous Research 的 Hermes Agent 开源不到三个月就在 GitHub 上拿到 14 万星。核心卖点是它能自己进化技能:遇到不会的任务,会自己写新工具、自己测试、自己记住,下次再用。架构上用了隔离的子智能体(sub-agents),每个干自己的活,互不干扰,适合本地一直跑。英伟达把它放进 RTX AI Garage 项目,意味着 R...
#Agent#Tools#Inference-opt#NVIDIA
精选理由
HKR 靠 hook、事实和本地 agent 共鸣点全过,但来源是 NVIDIA 硬件推广文,框架明显在推 RTX/DGX Spark。当生态更新看有用,不值得当头条。
一句话点评
Hermes Agent 开源不到三个月 GitHub 14 万星,核心卖点是能自己写工具、测试、记住,下次直接用。架构用隔离子智能体,适合本地一直跑。英伟达把它放进 RTX AI Garage,等于给 RTX PC 和 DGX Spark 用户发了个能自我进化的 AI 助手。但正文没披露具体 benchmark 或成本对比,14 万星更多是社区热度,实际效果要打折。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:00
31d ago
The Verge · AI· rssEN13:00 · 05·13
亚马逊把 Alexa 塞进购物搜索,Rufus 下岗了
亚马逊今天把 Alexa Plus 驱动的购物助手直接嵌进 Amazon.com 和 App 的搜索框,取代了之前的 Rufus。搜“厕纸”还是老样子出列表,但问“男士护肤流程”或“上次买 AA 电池是什么时候”就会触发 Alexa 回答。说白了就是把聊天助手当购物导购用,入口更显眼。正文没披露具体延迟或准确率,但至少不用再单独点进 Rufus 了。
#Agent#Tools#Amazon#Alexa
精选理由
H/K/R 三项都过,但正文只给了替换动作和几个查询例子,没有披露模型细节、效果指标或上线范围。属于中等体量的购物助手更新,所以落在 60–71 区间。
一句话点评
亚马逊把 Alexa Plus 购物助手直接塞进 Amazon.com 搜索框,取代 Rufus。搜“厕纸”照旧出列表,但问“男士护肤流程”或“上次买 AA 电池是什么时候”会触发 Alexa 回答。入口更显眼,不用再单独点 Rufus。正文没披露延迟或准确率,但至少省了一步操作。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:00
31d ago
AI HOT 精选· aihot-apiZH13:00 · 05·13
Cloudflare 把无头浏览器服务搬到了自家容器上,并发上限翻到 4 倍
Cloudflare 把 Browser Run(在云端跑无头浏览器,用来做网页测试、AI agent 抓网页、截图等)从原来和浏览器隔离服务共享的底层,迁移到了自家 Containers 平台。改动后,通过 Workers 绑定每分钟能启动 60 个浏览器实例,同时运行最多 120 个,是之前的 4 倍;Quick Action 响应时间降了 50%...
#Agent#Tools#Cloudflare#Browser Run
精选理由
这是一次 Cloudflare 内部的基础设施迁移,正文只说了“更快更强”,但没给任何可验证的性能数字,和 AI 工具链的关联也很弱。按规则,这类云厂商宣传稿直接排除,不给分发。
一句话点评
Cloudflare 把 Browser Run(云端无头浏览器,用于 AI agent 抓网页、截图等)迁移到自家 Containers 平台。每分钟能启动 60 个浏览器实例,同时最多跑 120 个,是之前的 4 倍;Quick Action 响应时间降了 50%。对做网页测试或 AI 抓取的人来说,并发上限和速度都明显提升。但正文没披露具体延迟数字和价格变化,迁移后成本是否上涨还不清楚。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R0
12:11
31d ago
TechCrunch AI· rssEN12:11 · 05·13
Adaption 推出 AutoScientist:让模型自己训练自己,不用人动手微调
Adaption 发布了一个叫 AutoScientist 的工具,核心思路是把传统微调流程自动化——模型自己就能完成特定能力的适配,不需要人工一步步调参。听起来像“模型自己教自己”,但正文没披露用了什么训练数据、成本多少、跑过哪些基准测试,也没说什么时候能用。所以先别太激动,方向有意思,但验证信息基本为零。
#Fine-tuning#Agent#Adaption#Product update
精选理由
HKR-H和HKR-R通过:自动化微调对从业者确实有吸引力。HKR-K不通过:数据、成本、基准、发布时间全缺,只能归到小产品更新档位。
一句话点评
短评:模型自己调自己,方向有意思,但正文没披露训练数据、成本、跑过哪些基准,也没说什么时候能用。先别太激动。 点评:Adaption 的 AutoScientist 想做的事很直接:把传统微调流程自动化,让模型自己完成特定能力适配,不用人一步步调参。听起来像“模型自己教自己”,省人工。但正文没披露用了什么训练数据、成本多少、跑过哪些基准测试,也没说什么时候能用。所以这点先别太激动——方向有...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
11:46
31d ago
r/LocalLLaMA· rssEN11:46 · 05·13
别掉进追大模型、追硬件的坑,先把手头的反馈回路做快
Reddit 用户 iEslam 发帖劝大家别总想着换更大上下文或升级显卡。他实际跑的例子是:Qwen3.6-35B-A3B-UD-Q3_K_XL 这个量化小模型,在 RTX 3060 12GB 上就能塞进 64k 上下文,用来做交易策略的迭代——用实盘或回测的反馈来改进。核心观点是:提升反馈速度比堆参数更管用。正文没披露具体策略收益或延迟数据,但思路...
#Inference-opt#Memory#iEslam#Qwen
精选理由
这是一条 Reddit 用户的个人经验帖,主张别追更大上下文,先改进反馈闭环。亮点是 RTX 3060 12GB 跑 64k 上下文做交易策略迭代,配置具体,对本地部署用户有参考价值。但正文没披露任何交易回测结果或收益数据,证据链弱,属于单点轶事。分数卡在 60–71 区间合理:有信号,但别太激动。
一句话点评
Reddit 用户 iEslam 用 Qwen3.6-35B-A3B-UD 量化版,在 RTX 3060 12GB 上塞进 64k 上下文做交易策略迭代,核心观点是提升反馈速度比堆参数更管用。思路对,但正文没披露具体策略收益或延迟数据,验证弱。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
11:00
31d ago
FT · 科技· rssEN11:00 · 05·13
OpenAI 非营利梦碎:FT 长文复盘马斯克与奥特曼的法律战
FT 这篇付费文章的核心论点是 OpenAI 的非营利模式已经崩塌,并把这件事直接挂到了马斯克和奥特曼的法律纠纷上。正文被 paywall 挡住,所以具体指控、时间线、治理细节和财务条款都没披露。如果你关心 OpenAI 从非营利转向 capped-profit 的完整故事,这篇可能是 FT 的深度梳理,但信息缺口很大,目前只能看到标题和摘要给出的判断。
#OpenAI#Elon Musk#Sam Altman#Policy
精选理由
HKR-H 和 HKR-R 成立,因为 FT 标题确实抛出了一个有冲突感的治理话题。HKR-K 不成立:正文没有给出任何新主张、日期或治理机制,所以分数卡在 60-71 区间。
一句话点评
FT说OpenAI的非营利梦已死,直接挂钩马斯克和奥特曼的官司。但全文被paywall挡住,具体指控、时间线、治理细节都没披露。标题判断很猛,但信息缺口太大,目前只能当观点看,别当事实用。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
11:00
31d ago
● P1OpenAI 博客· rssEN11:00 · 05·13
OpenAI为Windows上的Codex构建安全有效沙箱
Codex 是 OpenAI 的编程助手,能在开发者电脑上直接跑命令。Windows 版之前没有沙箱,用户要么得每条命令都点同意,要么就得开“完全访问”把安全交给运气。OpenAI 工程师 David Wiesen 写了篇文章讲他们怎么从零给 Windows 造沙箱。他们先看了 Windows 自带的几个方案:AppContainer 管得太死,编程助...
#Agent#Code#Safety#OpenAI
精选理由
OpenAI 给 Windows 版 Codex 搭了个安全沙箱,主要管两件事:文件访问和网络连接。我会先打个折——正文没披露沙箱的技术方案,比如是容器还是虚拟化、权限粒度到哪一层,所以没法判断它到底有多硬。但这条消息对做 coding agent 的人很实际,因为文件系统和网络就是最容易出事的两个面。
一句话点评
OpenAI 自己动手给 Windows 版 Codex 做了个沙箱,因为微软现成的方案要么太死板,要么会改乱你电脑的文件权限,没法直接用。
锐评
OpenAI 发了一篇工程博客,讲他们怎么给 Windows 上的编程助手 Codex 搭安全沙箱。核心问题是:Codex 需要在开发者真实的电脑环境里跑命令,但又要限制它不乱写文件、不乱联网。macOS 和 Linux 有现成的隔离工具,Windows 没有。他们评估了三种微软方案:AppContainer 太死,只适合权限固定的应用,扛不住 Codex 这种随时要调各种开发工具的灵活 workflow;Windows Sandbox 是个临时虚拟机,隔离强但没法直接操作用户本地的代码仓库,而且家庭版 Windows 根本用不了;强制完整性控制(MIC)看起来优雅,但会把用户整个工作目录标记成“低信任区”,等于给整台电脑开了个后门,风险太大。 最后他们自己从零开发,第一版原型叫“非提权沙箱”,目标是不弹管理员权限窗口就能把隔离做起来。文章只披露了设计思路和踩坑过程,没给性能损耗、兼容性测试数据,也没说这个沙箱现在是不是已经全量推给 Windows 用户了。对用 Windows 做开发的 AI 从业者来说,这篇值得看的是他们对 Windows 安全机制的实战评估,但别指望看到可以直接抄的代码或架构细节。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
10:10
31d ago
r/LocalLLaMA· rssEN10:10 · 05·13
llama.cpp 给推理模型加了“继续生成”按钮
llama.cpp 的 PR #22727 在服务端 WebUI 里给推理模型加了一个“继续生成”功能,用户点一下就能让模型接着往下写。正文只说了“现在可以继续了”,没交代这个 PR 有没有被合并、具体怎么实现的,也没说支持哪些推理模型。如果你在跑本地推理模型,这个功能挺实用,但具体能不能用还得看后续合并状态。
#Reasoning#Tools#ggml-org#llama.cpp
精选理由
这是 llama.cpp 开源工具的一个小更新,事实清晰但正文只写了“now you can CONTINUE”,没有披露合并状态、实现机制或支持哪些推理模型。HKR-K 通过;HKR-H 和 HKR-R 不通过,所以留在 all 层。
一句话点评
llama.cpp 给推理模型加了个“继续生成”按钮,点一下就能让模型接着往下写。正文没披露这个 PR 是否已合并、支持哪些模型,也没说实现细节。如果你跑本地推理模型,这个功能挺实用,但具体能不能用还得看后续合并状态。
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H0·K1·R0
10:06
31d ago
量子位 · 公众号· rssZH10:06 · 05·13
腾讯元宝能直接读微信聊天记录了
腾讯元宝上线了一个功能:用户在微信里选中聊天记录,转发到“其他应用”,粘贴进元宝,就能让它生成摘要、待办、表格甚至帮你拟回复。操作路径是微信→转发→元宝。正文没披露这个功能是灰度还是全量上线,也没说聊天数据会不会上传到腾讯服务器、用户能不能删除。目前看更像一个快捷粘贴工具,不是自动抓取聊天记录。
#Tools#Tencent#WeChat#Yuanbao
精选理由
HKR三项全过,但披露的事实只是元宝的转发流程和输出类型,全在腾讯生态内。没提用了什么模型、权限怎么申请、安全措施、API变化,所以分数压在60–71区间。
一句话点评
腾讯元宝上线微信聊天记录处理功能:选中对话转发到元宝,就能生成摘要、待办、表格甚至拟回复。操作路径是微信→转发→其他应用→元宝。 关键信息:正文没披露是灰度还是全量上线,也没说聊天数据是否上传服务器、用户能否删除。目前看更像一个快捷粘贴工具,不是自动抓取。 短评:微信聊天记录喂AI,腾讯官方版。操作路径短,但隐私和上线范围都没说清,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
09:59
31d ago
r/LocalLLaMA· rssEN09:59 · 05·13
Qwen 3.6 27B 在单张 RTX 5090 上跑通 Codex 工具链
作者用单张 RTX 5090 跑 Qwen 3.6 27B,配合 Codex、tbg(o)llama-swap 和 llama.cpp,成功调用了 apply_patch、shell、web_search、file_search、view_image、request_user_input、update_plan 等工具,以及 agent 工作流(让模型...
#Agent#Code#Tools#Qwen
精选理由
这是一篇 Reddit 级别的搭建报告,不是产品发布。配置很窄(单卡、特定模型、特定桥接),来源权威性一般,所以分数压在 71 不往上调。正文没披露延迟、吞吐量或稳定性数据,这点先别太激动。
一句话点评
单张RTX 5090跑Qwen 3.6 27B,成功调用了shell、web_search等工具和agent工作流。关键限制:正文被Reddit屏蔽,实际效果、延迟、成功率都没披露。如果真能一张卡跑通多工具agent,对本地部署是好事,但这点先别太激动,等实测。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
09:49
31d ago
Product Hunt · AI· rssEN09:49 · 05·13
Forsy:把你的 AI 智能体干活过程录下来卖掉
Forsy 是一个数据交易市场,专门买卖 AI 智能体(agent)的工作流程数据。它支持接入 OpenClaw、Claude、Codex、Hermes 等常见智能体,自动捕获它们执行任务时的完整步骤,然后打包成结构化数据出售。卖点在于这些数据来自真实生产环境,比人工合成的训练数据更贴近实际,适合用来做强化学习(RL)训练下一代智能体。Forsy 声称...
#Agent#Forsy#Product update
精选理由
HKR-R 通过,因为 agent 工作流数据的所有权是敏感话题;HKR-H 和 HKR-K 不通过,因为标题只有名字,正文也缺格式、定价、接入方式和证据。
一句话点评
Forsy 搞了个数据交易市场,让你把 AI 智能体干活时的完整步骤录下来打包卖。卖点是数据来自真实生产环境,比人工合成的更适合做强化学习训练下一代智能体。想法挺有意思,但正文没披露定价、数据格式、买家在哪,也没说怎么保证数据隐私和版权。先打个折,等看到实际成交量和买家反馈再说。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
09:42
31d ago
机器之心 · 公众号· rssZH09:42 · 05·13
快手电商搜索升级OneSearch-V2:推理成本没涨,商品点击率提升近4%
快手在电商搜索场景全量上线了OneSearch-V2,核心卖点是“零成本升级”——推理耗时和服务延迟都没增加,但商品点击率涨了3.98%,买家数和订单数各涨约2%。正文没披露具体用了什么模型或技术方案,只说这是生成式搜索的迭代。对做搜索或电商推荐的人来说,这个“不涨成本提效果”的指标挺实在,但具体怎么做到的得等更多细节。
#Reasoning#Fine-tuning#Alignment#Kuaishou
精选理由
快手全量上线OneSearch-V2,核心卖点是搜索升级不涨成本不增延迟,换来几个点的转化提升。对做搜索或电商推荐的团队来说,这个‘免费午餐’值得看一眼。但正文没披露具体技术改动或消融实验,更像产品公告而非技术论文,所以放在‘有趣’档,不上推荐位。
一句话点评
快手电商搜索OneSearch-V2全量上线,核心卖点是“零成本升级”——推理耗时和服务延迟都没增加,但商品点击率涨了3.98%,买家数和订单数各涨约2%。正文没披露具体用了什么模型或技术方案,只说这是生成式搜索的迭代。对做搜索或电商推荐的人来说,这个“不涨成本提效果”的指标挺实在,但具体怎么做到的得等更多细节。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
09:18
31d ago
AI HOT 精选· aihot-apiZH09:18 · 05·13
生成生僻事物配图前,先让AI搜图垫底
作者建议用Codex这类模型生成配图前,先让它搜一张真实参考图(比如云南甲马符),再基于这张图生成新图,这样能保证画面准确且高清。正文没披露用了什么模型、分辨率多少,也没给可复现的评测设置,所以效果到底多稳还不清楚。
#Tools#Vision#Codex#GPT
精选理由
正文没披露模型、分辨率或可复现评测,信息量只够当个轻量级技巧分享。HKR-K和HKR-R勉强及格,但HKR-H不成立,所以分数压在低教程/工作流区间。
一句话点评
短评:垫图提准是老办法,但让模型自己搜参考图再画,省了手动找图。 点评:作者提了个实用技巧:让Codex这类模型生成配图前,先搜一张真实参考图(比如云南甲马符),再基于这张图生成新图,能保证画面准确且高清。这本质是“检索增强生成”在图像领域的变体——先找事实依据再创作,比纯靠模型记忆靠谱。但正文没披露用了什么模型、分辨率多少,也没给可复现的评测设置,所以效果到底多稳还不清楚。另外,搜索到的...
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
09:12
31d ago
Product Hunt · AI· rssEN09:12 · 05·13
Open Browser Use:让本地AI直接操控你的Chrome浏览器
这是一个开源工具,能让本地AI智能体直接控制你的Chrome浏览器,比如打开标签页、点击按钮、下载文件等。它通过一个Chrome扩展和本地服务来实现,不需要把数据传到云端。支持JS/Python/Go的SDK,方便开发者集成。不过正文没披露具体的API文档、开源许可证、安装步骤和性能基准数据,想用的话得自己去GitHub仓库翻。
#Agent#Tools#Open Browser Use#Product Hunt
精选理由
HKR-H 靠“本地开源浏览器 Agent”这个钩子通过,但 K 和 R 都挂了——正文缺 API、安装、许可证和基准,信息太薄,只能算一个很小的产品更新,不值得上推荐位。
一句话点评
开源工具让本地AI直接操控Chrome,数据不用上云。支持JS/Python/Go SDK,但正文没披露API文档、许可证和性能基准,想用还得自己去GitHub翻。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H1·K0·R0
09:00
31d ago
The Verge · AI· rssEN09:00 · 05·13
缅因州废弃造纸厂改数据中心,但租户、算力和就业数都没披露
The Verge 报道了缅因州 Jay 镇一个前造纸厂的重建计划:占地 140 万平方英尺,2023 年被联合收购后拆除了旧设备,今年初签下了转售协议,准备改建成数据中心。但正文没披露租户是谁、规划多少算力、签了多大电力合同、能带来多少就业。原造纸厂曾雇 1500 人,2020 年因爆炸关闭。
#The Verge#JGT2 Redevelopment#Tony McDonald#Commentary
精选理由
一个具体的农村数据中心案例,但正文没披露租户、算力规模或用电条件,属于通用 AI 基础设施报道,落在 60–71 分区间。
一句话点评
短评:旧厂改数据中心,就业从1500人归零,新租户和算力都没披露,先别激动。 点评:The Verge 报道了缅因州 Jay 镇一个前造纸厂(曾雇1500人,2020年因爆炸关闭)的改造计划:占地140万平方英尺,2023年被联合收购,拆了设备运到巴基斯坦,今年初签了转售协议,准备改建成数据中心。但正文没披露租户是谁、规划多少算力、签了多大电力合同、能带来多少就业。原厂就业已归零,新项目能...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
08:50
31d ago
AI HOT 精选· aihot-apiZH08:50 · 05·13
VS Code 里同时跑 DeepSeek V4、GLM-5.1、Kimi K2.6 三款模型
SiliconFlowAI 发帖说,通过 Continue.dev 插件,可以在 VS Code 里同时调用 DeepSeek V4、GLM-5.1、Kimi K2.6 三款模型,支持代码自动补全、对话式编辑和智能体功能。帖子只给了三步设置指南的链接,没披露具体配置细节,比如是否需要本地部署、API 调用方式或资源占用。如果你手头有这几家模型的 API...
#Agent#Code#Tools#SiliconFlowAI
精选理由
SiliconFlowAI 这篇就是教你怎么在 VS Code 里用 Continue.dev 同时挂上 DeepSeek V4、GLM-5.1 和 Kimi K2.6,支持补全、对话编辑和智能体。正文只给了三步设置线索,没展开讲不同模型在补全或 agent 场景下的实际表现差异,也没给出延迟、成本或成功率的对比数据。对想快速试多模型开发的工程师有点用,但信息量就停在“能这么配”这一步,没有验证也没有踩坑记录,所以我会先打个折,不推荐放进简报。
一句话点评
短评:VS Code 里同时调三款模型,听起来很爽,但配置细节全在链接里,正文没披露。 SiliconFlow 说通过 Continue.dev 插件,能在 VS Code 里同时用 DeepSeek V4、GLM-5.1、Kimi K2.6,支持代码补全、对话编辑和智能体。好处是开发时不用切窗口,一个编辑器搞定多个模型。但帖子只给了“三步设置指南”的链接,没写具体怎么配——要不要本地部署...
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
08:31
31d ago
● P1r/LocalLLaMA· rssEN08:31 · 05·13
小米把 1 万亿参数的 MiMo-V2.5-Pro 开源了,但自己跑真的划算吗?
小米放出了 MiMo-V2.5-Pro,参数总量 1.02 万亿,但每次推理只激活 420 亿参数,上下文窗口能塞进 100 万个 token,用 MIT 许可证。作者拿它跑了 125 次 Claude Code 任务,走 API 总共花了 70.12 美元,处理了约 3.87 亿个 token,缓存命中率高达 96.3%。这个命中率说明大部分请求其实...
#Agent#Code#Inference-opt#Xiaomi
精选理由
我会先打个折:正文没披露 MiMo-V2.5-Pro 的评测跑分,所以性能好坏只能靠参数规模猜。但这条信息本身够直接——小米把一个 1.02 万亿参数、42B 激活的模型开源,另一边作者用 Claude Code 跑了 125 次会话,3.87 亿 token 花了 70.12 美元,缓存命中率 96.3%。这两组数字摆在一起,自建成本和 API 开销的对比就出来了。对做工程的人,这种一手成本数据比技术报告更有参考价值。
一句话点评
万亿参数模型开源了,但自部署成本可能远高于 API 的 70 美元,先别急着买显卡。
锐评
小米把 MiMo-V2.5-Pro 开源了,参数总量 1.02 万亿,但每次推理只激活 420 亿个参数,上下文窗口能塞进 100 万个 token,用 MIT 许可证。作者拿它跑了 125 次 Claude Code 任务,走 API 总共花了 70.12 美元,处理了约 3.87 亿个 token,缓存命中率高达 96.3%。这个命中率说明大部分请求其实是在重复处理相似内容,API 端靠缓存省了大量计算,但你自己部署时,这些重复计算都得实打实跑在显卡上,成本会高很多。 文章没给出自部署的硬件需求和具体成本估算,也没说这 125 次任务的成功率和效果如何。70 美元跑 3.87 亿 token 听起来不贵,但如果你要自己搭服务器,光显卡钱可能就够买好几年的 API 额度了。这点先别太激动,等有人测出本地部署的真实开销再说。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
08:20
31d ago
Product Hunt · AI· rssEN08:20 · 05·13
Open Computer Use:开源版桌面操控 MCP,让 AI 替你点鼠标
这是一个开源项目,把本地桌面自动化包装成标准的 MCP 服务(MCP 是 AI 模型调用外部工具的通用协议)。装上之后,Codex、Claude Code、Gemini CLI 这些 AI 工具就能直接在你的电脑上点、拖、打字、截屏,跨 macOS、Linux 和 Windows 三系统。项目用 npm 安装,主打“非侵入式”——意思是 AI 只操作界...
#Agent#Tools#Open Computer Use#Product update
精选理由
HKR-H 和 HKR-R 勉强通过,但 HKR-K 不通过,因为许可证、接口范围和运行条件缺失。这只是一个 Product Hunt 上的小型开源工具发布,所以重要性落在常规更新档位以下。
一句话点评
开源项目,把本地桌面操作包装成MCP服务,让Codex、Claude Code等AI工具直接在你的电脑上点、拖、打字、截屏,跨macOS、Linux和Windows。npm安装,主打“非侵入式”。但正文没披露安全模型、权限控制、维护方背景,生产环境慎用。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
07:43
31d ago
r/LocalLLaMA· rssEN07:43 · 05·13
有人试过本地VLM做桌面GUI自动化吗?
一位Reddit用户在Apple Silicon上测试了量化版VLM,用截图驱动桌面GUI自动化。基本操作能跑,但小图标和密集界面翻车了——视觉token数比预期高很多,导致预填充阶段特别慢。帖子没透露具体模型、量化等级、token数或延迟数据,所以没法判断是模型选型问题还是量化损失太大。
#Multimodal#Vision#Agent#Reddit
精选理由
这是一条 Reddit 单帖,没有模型名、延迟数字或完整 benchmark,信息缺口明显。但胜在场景具体——Apple Silicon 上跑量化 VLM 做截图式 GUI 自动化,且给出了可复现的失败模式(小图标、密集 UI、高 token 拖慢 prefill)。对关注本地 agent 的从业者来说,这是一条有用的现场笔记,不是结论。60–71 分合理。
一句话点评
有人在 Apple Silicon 上跑量化 VLM 做桌面 GUI 自动化,基本操作能跑,但小图标和密集界面翻车——视觉 token 数比预期高很多,预填充阶段特别慢。帖子没透露具体模型、量化等级、token 数或延迟数据,所以没法判断是模型选型问题还是量化损失太大。短评:本地 VLM 做桌面自动化有戏,但小图标和密集界面翻车,视觉 token 数高导致预填充慢,具体模型和量化等级未知,先...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
07:32
31d ago
Product Hunt · AI· rssEN07:32 · 05·13
Quietly:完全离线的 AI 代码编辑器,代码和提示词全在本地跑
Quietly 是一个主打 100% 离线的 AI IDE 和聊天工具,支持 Windows、macOS 和 Linux。它的卖点很直接:你的源代码和提示词全部留在本机,不上云、不传遥测数据、零延迟。对于隐私敏感的开发场景(比如处理内部代码或合规要求高的项目),这个定位挺实用。不过正文没披露它支持哪些模型、是否收费、以及具体发布状态——这些信息目前是缺...
#Code#Quietly#Product Hunt#Product update
精选理由
这是一个 Product Hunt 上的微型发布,只有定位描述,没有模型、定价、平台或可验证的机制,所以归入低价值的产品更新区间。
一句话点评
Quietly 是一款主打 100% 离线的 AI IDE 和聊天工具,代码和提示词全留本机,不上云、不传遥测、零延迟。对隐私敏感的开发场景很实用。但正文没披露支持哪些模型、是否收费、具体发布状态,信息缺口明显,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
07:31
31d ago
r/LocalLLaMA· rssEN07:31 · 05·13
有人在8GB显存上试过BeeLlama.cpp吗?能做agentic coding吗?
Reddit用户问BeeLlama.cpp在8GB显存+32GB内存上跑agentic coding的效果,特别是Q4量化版Qwen3.6-35B-A3B、Qwen3.6-27B、Gemma-4-31B和Gemma-4-26B-A4B。帖子引用了一个相关讨论,说Qwen 3.6 27B Q5在RTX 3090上跑200k上下文,速度比基线快2-3倍,峰...
#Agent#Code#Inference-opt#BeeLlama.cpp
精选理由
这是一条Reddit上的提问帖,不是正式发布、一手实测或可复现的基准测试。虽然HKR三项都过,但信息价值低,属于社区信号,所以留在all里。
一句话点评
BeeLlama.cpp 在 8GB 显存上跑 agentic coding 有人试过吗?帖子说 Qwen 3.6 27B Q5 在 3090 上 200k 上下文速度比基线快 2-3 倍,峰值 135 tps。但正文被 Reddit 屏蔽了,没披露具体 agent 任务类型和成功率。8GB 跑 27B 模型显存肯定不够,得靠 CPU 卸载,延迟会高。这点先别太激动,等实测。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R1
07:16
31d ago
r/LocalLLaMA· rssEN07:16 · 05·13
Q.ANT 光子 GPU 号称性能百倍、功耗降 90%,但正文没给任何实测数据
Reddit 上有人讨论德国公司 Q.ANT 的光子 GPU 进展。这家公司刚在奥斯汀开了办公室,挖了 IBM 老将 Bruno Spruth 当 CTO。它说自己的光子 GPU 已经在莱布尼茨超算中心跑了几个月,第二代产品性能是晶体管 GPU 的 100 倍、能效高 90 倍。数字很漂亮,但正文没披露任何实测数据或第三方验证,连跑的是什么负载都没说。...
#Inference-opt#Q.ANT#Bruno Spruth#Leibniz Supercomputing Centre
精选理由
HKR三项都达标,但来源仅一条Reddit帖子,100倍/90倍的硬件数据没有独立验证或可复现的测试条件。算一个有意思的AI基础设施信号,不值得上首页。
一句话点评
德国公司Q.ANT说自己的光子GPU已在莱布尼茨超算中心跑了好几个月,第二代性能是晶体管GPU的100倍、能效高90倍。数字漂亮得像PPT,但正文没披露任何实测数据或第三方验证,连跑的是什么负载都没说。挖了IBM老将当CTO、在奥斯汀开办公室,更像融资前造势。如果是真的挺省钱,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
06:57
31d ago
Hacker News 首页· rssEN06:57 · 05·13
有人用 ChatGPT 用出了“AI 精神病”,还去申请当教皇
一名荷兰 IT 工作者 Dennis Biesma 在使用 ChatGPT 后出现严重幻觉,自称破解了宇宙终极理论、无限核聚变,甚至向梵蒂冈申请当教皇。医生诊断为“AI 精神病”(AI psychosis),认为 AI 的拟人化对话可能诱发或加重精神分裂倾向。正文没有披露他具体用了多久、每天对话量多少,也没有给出既往精神病史。这件事提醒从业者:对话式 ...
#Safety#ChatGPT#Hacker News#The Standard
精选理由
标题有冲击力,但正文信息严重不足,只有HN的分数和评论数,没有当事人背景、时间线或医学评估,无法验证事件真实性或严重性。对从业者来说,这个话题能引发对模型安全边界的讨论,但当前信息量不足以支撑高价值判断,所以维持低分全量推送。
一句话点评
一名荷兰IT男跟ChatGPT聊到自称破解了宇宙终极理论、无限核聚变,还向梵蒂冈申请当教皇。医生诊断这叫“AI精神病”,认为AI的拟人化对话可能诱发或加重精神分裂倾向。正文没披露他具体用了多久、每天对话量多少,也没给既往精神病史。这件事提醒从业者:对话式AI的拟人化风险不是理论上的,真实用户可能分不清边界。但个案不能直接推成普遍结论,缺使用时长和病史数据,没法判断是AI诱因还是既有病发。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
06:37
31d ago
● P1纽约时报中文网· rssZH06:37 · 05·13
中国智库向Anthropic要Mythos模型被拒,美方视作AI竞赛升级信号
上个月在新加坡一场非官方对话中,一家中国智库要求Anthropic向北京开放其最新的Mythos模型,被直接拒绝。Mythos是个擅长找软件漏洞的模型,Anthropic目前只给美国政府和40多家机构用,理由是怕引发网络安全危机。美方官员认为这次接触虽非正式外交,但背后大概率有中国政府授意,并把它看作中美AI竞赛升温的又一个迹象。文章提到,美国最新模型...
#Code#Safety#Tools#Anthropic
精选理由
这条消息我会先打个折:正文没披露中国智库具体是哪家、怎么谈的、Anthropic 拒绝的细节也没展开。但核心信息够硬——Mythos 是个找漏洞的模型,Anthropic 只给美国政府和 40 多个组织用,中国想要但拿不到。这比一般的模型封锁更敏感,因为直接关系到软件供应链安全。对从业者来说,说明顶尖漏洞挖掘能力正在变成国家级的受控资源,以后这类模型可能越来越难公开拿到。
一句话点评
中国智库私下要 Anthropic 开放 Mythos 模型被拒,这事不意外,但说明中美 AI 技术隔离已经从芯片烧到了模型本身。
锐评
这条新闻的核心不是“被拒”,而是“谁在要”和“要的是什么”。出面的是智库,不是政府,但美方判断背后有北京授意,这种“二轨外交”本身就是试探水温的标准动作。他们要的 Mythos 是个专门找软件漏洞的模型,Anthropic 只给了美国政府及 40 多家机构,理由是怕引发网络安全危机。换句话说,这模型在美方眼里已经不是商业产品,而是类似军火清单上的东西。 文章提到美方估计自家最新模型领先中国九个月到一年,比之前的半年差距拉大了。但这个数字得打个折:领先幅度是动态的,而且 DeepSeek 去年已经证明能用华为芯片做出有竞争力的模型。真正值得关注的信息缺口是:Anthropic 拒绝的具体理由是什么?是法律限制、公司政策,还是政府直接施压?正文没披露。另外,中方要模型的用途是“保护关键基础设施”,这个说法本身不新鲜,但放在 Mythos 这种攻击属性极强的模型上,说服力有限。
HKR 分解
hook knowledge resonance
打开信源
87
SCORE
H1·K1·R1
06:19
31d ago
● P1AI HOT 精选· aihot-apiZH06:19 · 05·13
SenseTime发布SenseNova-U1技术报告和开源模型
报告把训练一个原生多模态模型的全流程拆成了六步,从统一建模、无损接视觉信号,到用自回归加像素空间流匹配一起训,再到强化学习后训练和蒸馏,每一步都给了实操细节。开源版本 SenseNova-U1-A3B-MoT 用了混合专家架构,只激活 30 亿参数,主打跑得快、成本低。模型权重、代码和演示都放出来了,不过报告里没给具体 benchmark 对比,实际效...
#Multimodal#Vision#Fine-tuning#SenseTime
精选理由
我会先打个折:这是厂商自己发的技术报告,正文没给基准分数、开源协议和复现细节,所以别当第三方评测看。亮点在于把训练全流程讲清楚了——从数据配比、六阶段课程到 RL 后训练和蒸馏,每一步都给了操作说明。A3B-MoT 用 MoE 把激活参数压到 30 亿,推理时确实省钱,但报告没披露总参数量、专家数这些关键数字,也没说开源权重什么时候放出来。这点先别太激动,等代码和权重落地再判断。
一句话点评
商汤发了SenseNova-U1的技术报告并开源了模型权重,用MoE架构做原生多模态,但正文没披露具体性能基准和参数量,这点先别太激动。
锐评
商汤把SenseNova-U1的技术报告和模型权重都放出来了,核心卖点是原生多模态加MoE(混合专家)架构。MoE的好处是推理时只激活部分参数,理论上能省算力,但报告里没写总参数量和激活参数量,也没给具体的多模态基准测试分数,所以省不省钱、效果好不好都还不好判断。 目前能看到的信息来自两个标题,正文是空的,所以关键细节全缺:训练数据规模、支持哪些模态组合、开源协议是什么、有没有对齐人类偏好的后训练步骤。这些直接决定模型能不能用、好不好用。 建议等完整报告出来再看,重点关注多模态理解任务的横向对比,以及MoE路由策略是否稳定。如果只是把已有技术路线复现一遍,那开源的价值主要在工程参考,而不是能力突破。
HKR 分解
hook knowledge resonance
打开信源
85
SCORE
H1·K1·R1
05:26
31d ago
AI HOT 精选· aihot-apiZH05:26 · 05·13
AI技能更新:新增可交互地图组件,支持缩放拖拽和AI标记
Skills功能更新后,AI可以生成带地图的版式和地图组件,支持缩放、拖动等交互操作,还能在地图上任意打标记。正文没披露这个功能支持哪个平台、怎么调用、以及版本号。
#Tools#Product update
精选理由
只有K通过:帖子给出了具体的地图交互能力,但没提平台、API路径或版本号。这是一个小产品更新,所以留在all以下,不上精选。
一句话点评
AI 技能更新加了地图组件,能缩放、拖动、打标记,适合做位置相关的交互展示。但正文没说是哪个平台、怎么调用、版本号多少,目前只能当个功能预告看。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K1·R0
05:10
31d ago
r/LocalLLaMA· rssEN05:10 · 05·13
Qwen3.6-27B 一次修好 CSS 界面 bug,Gemma4-26B 循环 15 分钟没搞定
一位用户在 MacBook Pro M4 Max 上本地跑模型,用 Qwen3.6-27B-UD-MLX-8bit 一次就修好了 CSS 下拉菜单跑出屏幕的 bug,而 Gemma4-26B 在同一台机器上反复读代码、改代码、失败,循环了大约 15 分钟。正文没披露具体 prompt 或调试步骤,但对比很直观:Qwen 一次过,Gemma 卡死循环。
#Code#Reasoning#Vision#Qwen
精选理由
HKR 三项都达标:有具体模型名、有具体 CSS 任务、有 15 分钟对比。但只是一个 Reddit 单帖,正文没披露 prompt 和修复前后的代码 diff,验证强度弱,所以分数压在 60–71 区间。
一句话点评
Qwen3.6-27B 一次修好 CSS 下拉菜单 bug,Gemma4-26B 在同一台 MacBook Pro M4 Max 上循环 15 分钟失败。对比直观,但正文没披露 prompt 和调试步骤,可能是 prompt 差异或模型对局部代码修改的稳定性不同。单次成功不等于全面碾压,Gemma 的循环也可能是策略保守。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
04:35
31d ago
AI HOT 精选· aihot-apiZH04:35 · 05·13
oMLX 新版让苹果本地跑多模态更快,显存压力也小了
oMLX 更新到 0.3.9.dev2,主要加了三个东西:Gemma 4 的 MTP 视觉路径(让模型看图更准)、DFlash 引擎(加速推理)、ParoQuant(量化压缩,省显存)。还支持一键启动 copilot 接 Claude 这类工具,以及 oQ 自动代理来缓解显存瓶颈。作者说图文处理速度变快、显存占用更低,但没给具体跑分或延迟对比,所以实际...
#Vision#Multimodal#Inference-opt#oMLX
精选理由
这是一条oMLX小版本更新的产品动态,核心信息是集成了几个新组件(视觉路径、推理引擎、量化工具),并加了copilot和自动代理功能。标题的'直逼云端'有点夸张,正文没披露具体延迟或精度对比,所以钩子要打折。但K和R是扎实的:技术名词都给了,且本地推理对成本、隐私、离线场景确实有吸引力。单来源、小众工具,评分68合理,不升不降。
一句话点评
oMLX 0.3.9.dev2 让苹果端侧跑多模态模型更快、更省显存,新增 Gemma 4 视觉路径、DFlash 推理引擎和 ParoQuant 量化压缩。还支持一键启动 copilot 接 Claude,以及 oQ 自动代理缓解显存瓶颈。作者说图文处理变快、显存占用更低,但没给具体跑分或延迟对比,所以实际提升幅度要自己测。对想在 Mac 上本地跑多模态模型的人来说,这版值得试,但别直接信...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:06
31d ago
新智元 · 公众号· rssZH04:06 · 05·13
VLA模型总忽略语言指令?LangForce用对数似然比损失让模型更听话
华中科大、哈工大和港科大(广州)联合提出了LangForce,核心思路是给VLA模型加一个对数似然比损失,强迫它更依赖语言指令而不是只盯着视觉。在SimplerEnv的分布外场景测试里,LangForce平均成功率66.5%,比QwenGR00T基线高了11.3个百分点。正文没披露训练数据量和计算成本,但效果提升挺明显,尤其对指令跟随幻觉有针对性。
#Robotics#Multimodal#Alignment#Huazhong University of Science and Technology
精选理由
这是一篇VLA模型指令跟随的改进工作,来自华科、哈工大和港科广。核心问题是VLA模型在分布外场景下容易忽略语言指令(即指令跟随幻觉),作者提出LangForce,用LLR损失让模型更依赖语言信号。在SimplerEnv基准上平均成功率66.5%,比QwenGR00T提升11.3个百分点。数字说明效果明显,但正文没披露在真实机器人上的部署成本或延迟,这点先别太激动。对做机器人多模态对齐的团队是实用信号,但属于研究发布而非产品级发布,所以没到精选线。
一句话点评
给VLA模型加一个对数似然比损失,强迫它更听语言指令而不是只看视觉。在SimplerEnv分布外场景测试里,平均成功率66.5%,比QwenGR00T基线高了11.3个百分点。正文没披露训练数据量和计算成本,但效果提升挺明显,尤其对指令跟随幻觉有针对性。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:00
31d ago
FT · 科技· rssEN04:00 · 05·13
欧洲那几只AI股票涨了,因为美国科技热钱开始往外找标的
FT报道,欧洲为数不多的AI概念股最近涨了一波,原因是投资者在美国科技股涨了几年之后,开始去欧洲翻有没有能跟上的标的。正文没披露具体公司名字、涨幅数字、估值变化或时间区间,所以没法判断这波是情绪驱动还是真有业绩支撑。
#Financial Times#Funding#Commentary
精选理由
HKR的H和R靠欧洲AI稀缺性交易成立,但K不成立:RSS摘要没披露公司名、涨幅或时间窗口。FT的权威性让它值得浏览,但不值得推荐。
一句话点评
FT说欧洲AI概念股涨了,因为美国科技股涨太久,投资者开始去欧洲翻标的。但正文被付费墙挡住,没披露具体公司、涨幅、估值或时间区间。这点先别太激动——没法判断是情绪轮动还是真有业绩支撑。缺关键数字和标的名单,信息量约等于标题本身。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
04:00
31d ago
FT · 科技· rssEN04:00 · 05·13
亚马逊设备负责人:我们不一定非要造手机
亚马逊硬件负责人 Panos Panay 在 Alexa+ 发布后接受采访,明确说公司不一定要做手机。正文没披露具体产品形态、发布时间或盈利目标,所以这点先别太激动。Panay 的潜台词可能是亚马逊更想围绕 Alexa+ 做智能家居或可穿戴设备,而不是跟苹果、三星正面抢手机市场。
#Audio#Amazon#Panos Panay#Alexa+
精选理由
FT 来源加分,H 和 R 通过;K 不通过是因为文章只给了战略信号,没有产品形态、时间表或业务指标。
一句话点评
亚马逊硬件老大说公司不一定做手机,潜台词是更想围绕Alexa+做智能家居或可穿戴,而不是跟苹果三星硬碰硬。正文没披露具体产品形态、发布时间或盈利目标,所以这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
04:00
31d ago
FT · 科技· rssEN04:00 · 05·13
Google DeepMind 计划“反击”
FT 一篇报道标题说 Google DeepMind 准备“卷土重来”,但正文只提到 Google 和 DeepMind 正在对 OpenAI 和 Anthropic 施加压力,没有披露任何具体模型、时间表或性能指标。所以这个“反击”目前更像一个战略姿态,不是产品发布预告。
#Google DeepMind#OpenAI#Anthropic#Commentary
精选理由
H 和 R 过关,但 K 太弱:正文没给模型、时间表或指标。FT 来源有信誉,但信息量不足以推到精选。
一句话点评
FT标题说DeepMind要“卷土重来”,但正文只提了它和Google在给OpenAI、Anthropic施压,没披露任何模型、时间表或跑分。目前更像一个战略姿态,不是产品预告。 短评:标题党,正文没干货,先别激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
03:56
31d ago
r/LocalLLaMA· rssEN03:56 · 05·13
本地跑视频流水线:Qwen3 27B 比 Gemma 4 26B 更会调工具
一位用户在本地跑视频自动化流程,Qwen3 27B 能干净地调度工具,Gemma 4 26B 却在同一个机器上卡在工具调用循环里。整个流程用了 OpenCode 工作流,上下文窗口撑到 174K token,本地图片生成靠 Hugging Face 上的 Said Image Turbo。最终只拿到一次性的部分结果,说明长上下文和工具调用的稳定性还有坑。
#Agent#Tools#Multimodal#Qwen
精选理由
H/K/R 都达标:Reddit 帖子点名了模型、失败模式和 174K 上下文,信息密度够。但来源单一、可复现性弱,所以虽然话题实用,还够不上精选。
一句话点评
Qwen3 27B 在本地视频自动化流程里比 Gemma 4 26B 更稳,后者容易卡在工具调用循环里。整个工作流上下文撑到 174K token,但只拿到一次性的部分结果,说明长上下文和工具调用的稳定性还有坑。正文没披露具体硬件配置和耗时,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
03:27
31d ago
AI HOT 精选· aihot-apiZH03:27 · 05·13
腾讯混元Hy3预览版上线GMI云,自称最强开源模型
腾讯混元在X上宣布Hy3预览版已登陆GMI Cloud,并称其为最强开源模型。但正文没披露参数量、跑分、定价或使用门槛,所以这个“最强”目前只能当宣传口号看,等具体数据出来再判断。
#Tencent Hunyuan#GMI Cloud#Hy3#Product update
精选理由
硬排除规则:云厂商促销+纯营销。唯一事实是Hy3预览版在GMI Cloud可用,参数、跑分、价格全无。HKR三项全不满足,重要性上限40。
一句话点评
腾讯混元说 Hy3 预览版上了 GMI Cloud,号称“最强开源模型”。但正文没给参数量、跑分、定价或使用门槛,这个“最强”目前只能当宣传口号看。等具体数据出来再判断。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
03:15
31d ago
AI HOT 精选· aihot-apiZH03:15 · 05·13
百度李彦宏提新指标:日活跃智能体数(DAA)
李彦宏提议用日活跃智能体数(DAA)衡量智能体时代,类比移动互联网的DAU。他认为令牌消耗只反映成本,DAA更能体现产出价值。但正文没披露怎么统计、时间窗口多长,也没给出任何具体数值,所以这个指标目前还只是个概念。
#Agent#Baidu#Robin#Commentary
精选理由
Robin提的DAA(日活跃智能体数)是个好传播的概念,类比DAU让圈内人秒懂他想说什么。但正文没披露统计口径、时间窗口和具体数值,所以这条只能当轻评论看,不能当实证分析用。H和R两条都成立:概念有话题性,也切中行业痛点。K不成立是因为信息缺口太大,没法验证。
一句话点评
李彦宏提议用日活跃智能体数(DAA)替代令牌消耗来衡量智能体时代,类比移动互联网的DAU。想法不错,但正文没披露怎么统计、时间窗口多长,也没给任何具体数值,目前只是个概念。短评:指标方向对,但没数据没方法,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
03:14
31d ago
FT · 科技· rssEN03:14 · 05·13
北京叫停一家新加坡AI公司收购案,“新加坡洗白”还走得通吗?
FT这篇报道的核心案例是:北京叫停了一起涉及一家总部设在新加坡的AI初创公司的收购案。文章把这件事当作一个测试,看中国公司通过在新加坡设总部来规避国内监管的做法(FT称之为“Singapore washing”)还能不能持续。正文没披露买方、卖方、交易金额、法律依据和时间线,也没说这笔交易对Manus这家公司的具体运营有什么影响。信息缺口比较大,但信号...
#Manus#Financial Times#Policy
精选理由
HKR-H 和 HKR-R 通过,因为 FT 把中国和新加坡之间的 AI 监管风险具体化了。HKR-K 不通过:正文没给交易方、价格、法律依据或时间线,所以这条只能算有趣,不够硬。
一句话点评
北京叫停一家新加坡AI初创公司的收购案,FT拿它当测试案例:中国公司靠“新加坡洗白”绕监管还行不行?正文没披露买方、卖方、交易金额和法律依据,信息缺口很大。信号意义大于实操参考,别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
03:10
31d ago
r/LocalLLaMA· rssEN03:10 · 05·13
本地小模型每周跑一遍完整工作流:查库、发邮件、写文档、转PDF
Reddit用户NoWorking8412分享了一个每周用Qwen3.6-35B-A3B(35B参数但激活仅3B,本地跑得动)跑完的完整流程:先评估数据库内容,然后通过邮件交换选择,自动生成Google Doc,收集修改意见,最后转成PDF模板。整个过程不依赖云端API,全部在本地完成。正文没披露具体延迟和硬件配置,但35B模型能跑通多步骤agent ...
#Agent#Embedding#Memory#Qwen
精选理由
一篇 Reddit 用户的自述,讲他用 Qwen3.6-35B-A3B 搭了个每周工作流,覆盖 5 个环节。话题本身很接地气,能缓解“本地模型没用”的焦虑,但正文没披露每个环节的耗时、失败率、样本量,也没说复现门槛,所以分数卡在 60–71 档。
一句话点评
一个Reddit用户用Qwen3.6-35B-A3B(35B参数但只激活3B,本地能跑)跑通了一个每周自动流程:评估数据库、邮件选内容、生成Google Doc、收集修改意见、转PDF。全程不调云端API。亮点是证明了小激活模型也能做多步agent干活,但正文没披露延迟和硬件配置,实用性要打折。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
03:07
31d ago
AI HOT 精选· aihot-apiZH03:07 · 05·13
Codex 更新了应用内浏览器,支持多视口测试和截图核查
Codex 这次更新主要给应用内浏览器加了多视口测试功能,你可以切换不同屏幕尺寸测应用,还能在断点处点按验证。长测试会在关键节点自动截图,方便你回头检查。如果嫌测试慢,可以隐藏浏览器来禁用动画,速度能快1-2倍。另外标注功能也优化了,发送更快、消耗更少 tokens。整体看下来,对做 UI 测试的人来说挺实用,尤其是多视口和截图核查能省不少手动检查的功夫。
#Agent#Code#Tools#Codex
精选理由
这是Codex工作流的一次小到中型更新,有具体机制和1-2倍速度提升的声称,但看起来只是一篇单一发布说明,影响范围比模型或Agent发布要窄。HKR的K和R通过,H不通过,所以落在60-71分区间。
一句话点评
Codex 给浏览器加了多视口测试,能切屏幕尺寸、在断点处点按验证,长测试还会自动截图。隐藏浏览器能禁用动画,速度提升1-2倍。标注也优化了,发送更快、耗 tokens 更少。对 UI 测试挺实用,但正文没披露截图精度和标注节省的具体比例。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
03:03
31d ago
彭博科技· rssEN03:03 · 05·13
摩根大通资管:AI还在早期,别盯着短期,要看长期价值迁移
摩根大通资管的Joanna Shen在彭博电视上说,AI仍处于早期采用阶段,AI agent是几十年来第一个能提升劳动力投入的技术。正文没披露具体投资标的、估值方法或时间线,所以这点先别太激动——观点偏宏观,适合做长期配置的参考,不是操作建议。
#Agent#JPMorgan Asset Management#Joanna Shen#Bloomberg
精选理由
HKR-R勉强通过,因为agent和劳动投入触及投资和生产力神经。HKR-H/K不通过:正文缺少数字、目标、估值方法或时间表,属于低价值评论。
一句话点评
摩根大通资管Joanna Shen说AI agent是几十年来第一个能提升劳动力投入的技术,AI还在早期采用阶段。观点偏宏观,适合做长期配置参考,不是操作建议。正文没披露具体投资标的、估值方法或时间线,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H0·K0·R1
02:47
31d ago
Latent Space· rssEN02:47 · 05·13
微调要凉了?OpenAI 停掉微调 API,Latent Space 说这是趋势
OpenAI 停掉了微调 API,Latent Space 把这当作头条。文章说,虽然头部玩家(Cursor、Cognition)反而在加大开源模型的强化微调,但对大多数 AI 工程团队来说,微调已经不是主流。替代方案包括超长提示词(比如 Claude 的 Constitution)和推理时计算。正文没披露 OpenAI 停 API 的具体原因,但暗示...
#Fine-tuning#Benchmarking#Inference-opt#OpenAI
精选理由
HKR三项都成立:OpenAI微调API废弃对从业者确实有实际影响,12/544的源范围也提供了上下文。但分数卡在60-71是因为这是一份日报汇总,正文没披露被废弃的API具体叫什么、迁移截止日期是什么、替代方案是什么,信息缺口明显,不能给更高分。
一句话点评
OpenAI 停掉微调 API,Latent Space 直接说“微调已死”。但头部玩家 Cursor、Cognition 反而在加大开源模型的强化微调,所以“死”的是大众市场,不是全部。替代方案是超长提示词(比如 Claude 的 Constitution)和推理时计算。正文没披露 OpenAI 停 API 的具体原因,只暗示 GPU 紧缺或用户已转向。对多数 AI 工程团队来说,微调确实...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
02:38
31d ago
AI HOT 精选· aihot-apiZH02:38 · 05·13
BenchLoop:给本地大模型跑分,一键出排行榜
BenchLoop 是一个给本地大模型做标准化测试的工具。你拉个模型下来,跑一下,它就能给出质量、速度和可靠性的综合评分,还支持对比不同提示格式(比如原生模式和 Hermes 模式)的表现。结果可以自动发到公开排行榜上,方便横向比较。说白了就是帮你省掉自己搭测试流程的麻烦,直接看哪个模型在本地跑得又快又好。不过正文没披露它具体用了哪些测试集、评分权重怎...
#Benchmarking#Inference-opt#BenchLoop#Hermes
精选理由
工具本身有用但信息太薄:没披露测试集是什么、评分公式怎么算、也没给任何实测样本结果。HKR三项都勉强够到门槛,但每个都缺关键细节支撑,所以落在60–71区间。
一句话点评
BenchLoop 是个给本地大模型跑分的工具,拉下来一键测质量、速度和可靠性,还能对比不同提示格式(比如原生 vs Hermes 模式),结果自动上排行榜。省了你自己搭测试流程的麻烦。但正文没披露具体用了哪些测试集、评分权重怎么定,排行榜的权威性得打个问号。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
02:23
31d ago
r/LocalLLaMA· rssEN02:23 · 05·13
别急着买本地推理机,先攒钱等下一代
Reddit 用户说一台计划中的 1TB Genoa 机器从 6000 美元涨到了 30000 美元,涨幅 5 倍。帖子提到 64GB DDR5 RDIMM 已量产、256GB DDR5 RDIMM 可达 9200 MT/s,但没给任何跑分或实测数据。作者认为未来 2-3 年本地推理硬件会大升级,现在买不划算。不过正文没披露具体配置清单和涨价原因,也没...
#Inference-opt#Reddit#Apple#Micron
精选理由
HKR 三个维度都沾边:成本跳升有钩子,内存规格有具体数字,话题切中本地搭建者的痛点。但正文没给实测跑分、没标价格来源、也没给出可复现的配置单,所以只能算低价值讨论,不值得高分。
一句话点评
一台计划中的1TB Genoa机器从6000美元涨到3万美元,涨幅5倍。帖子说64GB DDR5 RDIMM已量产、256GB可达9200 MT/s,但没给任何跑分或实测数据。作者认为未来2-3年本地推理硬件会大升级,现在买不划算。不过正文没披露具体配置清单和涨价原因,也没说明是关税、供应链还是需求导致。信息缺口大,建议等实测再决定。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K1·R1
01:50
31d ago
彭博科技· rssEN01:50 · 05·13
AI 基建把内存芯片吃紧了,股市里赢家和输家差距拉大
全球内存芯片短缺,原因是 AI 基础设施建得太猛。Bloomberg 这篇报道说,缺货已经让不同公司的业绩和股价表现明显分化。正文被 paywall 挡住了,没披露具体是哪几家公司、股价涨跌多少、供需缺口有多大。
#Inference-opt#Commentary
精选理由
Bloomberg的供应链角度有权威性,通过HKR-H和HKR-R。HKR-K不通过,因为没给出具体公司、股价变动或供需缺口数据,停留在行业报道的通用层面。
一句话点评
全球内存芯片缺货,AI基建猛建是主因。Bloomberg说这已让公司业绩和股价明显分化,但正文被paywall挡住,没披露具体公司、涨跌幅和供需缺口。缺货本身不意外,关键是哪些公司扛得住、哪些掉队,这点先别太激动,等具体数据出来再判断。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
01:45
31d ago
Product Hunt · AI· rssEN01:45 · 05·13
BossHogg:给 AI 代理用的 PostHog 命令行工具
BossHogg 是一个面向 AI 编码代理和终端开发者的 CLI 工具,让你不用打开庞大的 MCP 工具集就能操作 PostHog 的分析和功能开关。简单说,就是让 AI 代理直接在命令行里查数据、改配置,省去来回切换界面的麻烦。项目开源免费,但正文没披露安装步骤、定价和具体支持哪些命令,想用还得自己去 GitHub 翻文档。
#Agent#Tools#BossHogg#PostHog
精选理由
HKR-K 通过是因为它点出了工具的目标和用途。HKR-H/R 不通过:安装方式、价格、支持的命令范围都没披露,属于低端小产品更新,不值得激动。
一句话点评
BossHogg 给 PostHog 套了个命令行壳,AI 编码代理不用开笨重的 MCP 工具集就能查数据、改功能开关。开源免费,但正文没披露具体支持哪些命令、怎么装,想用还得去 GitHub 翻文档。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
01:26
31d ago
AI HOT 精选· aihot-apiZH01:26 · 05·13
阿里云 Qwen 3.6 Plus 限免,主打“智能体原生”
阿里云宣布 Qwen 3.6 Plus 在 Nous Portal 上限时免费,并称其为“AI 未来原生智能体”。合作方是 Hermes Agent 和 NousResearch 社区。正文没披露免费期多久、模型参数量、免费结束后定价多少、以及使用有无限制。
#Agent#Alibaba Cloud#NousResearch#Hermes Agent
精选理由
硬排除理由:纯营销/云厂商推广。唯一事实是 Qwen 3.6 Plus 在 Nous Portal 限时免费,没披露限免时长、模型参数或 API 调用条件。成本相关性让它勉强没掉到最低档。
一句话点评
阿里云把 Qwen 3.6 Plus 放到 Nous Portal 上限免,合作方是 Hermes Agent 和 NousResearch 社区。正文没披露免费期多久、模型参数量、免费结束后定价多少、以及使用有无限制。短评:限免拉新,但关键信息全缺,先别激动。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H1·K0·R1
00:29
31d ago
AI HOT 精选· aihot-apiZH00:29 · 05·13
Telegram 里点几下就能跑 AI 智能体,不用注册也不用花钱
Browser Use 新项目 BuxFather,直接在 Telegram 里启动 AI agent,点几下就给一个完整电脑加浏览器环境,24/7 自己跑还能自己改进。关键是不需要注册、不需要付费,对重度 Telegram 用户来说很方便。正文没披露具体能跑什么任务、有没有使用限制,但即开即用这个思路挺省事。
#Agent#Tools#Browser Use#BuxFather
精选理由
这是一个低摩擦 agent 上手的实际产品更新,H/K/R 都够。但来源单一,正文没披露性能、限制、定价边界或采用情况,所以分数压在 60–71 区间。
一句话点评
Browser Use 搞了个 BuxFather,在 Telegram 里点几下就能启动一个带浏览器的完整电脑环境,AI agent 24/7 自己跑还能自我改进。关键是不用注册、不用付费,对重度 Telegram 用户来说确实方便。但正文没披露具体能跑什么任务、有没有使用限制,这点先别太激动。即开即用这个思路挺省事,但实际能干啥还得看后续。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:04
31d ago
r/LocalLLaMA· rssEN00:04 · 05·13
用 H200 花几美元微调 TranslateGemma-4B,让英语和威尔士语双向翻译更好
作者开源了一个微调 TranslateGemma-4B 的仓库,专门优化英语和威尔士语的双向翻译。只跑了 5% 的训练量,在 H200 上花了 40 分钟、几美元成本,用来验证流程能跑通。正文没披露用了多少数据,也没给 BLEU 或 COMET 分数,所以效果到底多好还不清楚。作者还在等 Flash Attention v4 出正式版,打算之后上 B2...
#Fine-tuning#TranslateGemma#NVIDIA#Open source
精选理由
HKR-H 和 HKR-K 成立:低成本 H200 微调和 40 分钟耗时提供了新信号。HKR-R 受限,加上正文没披露数据集规模和 BLEU/COMET 结果,整体属于正常开源实践范畴。
一句话点评
有人用 H200 花了 40 分钟、几美元微调 TranslateGemma-4B 做英语-威尔士语双向翻译,只跑了 5% 的训练量,主要是验证流程能跑通。成本确实低,但正文没披露用了多少数据,也没给 BLEU 或 COMET 分数,效果到底多好还不清楚。作者还在等 Flash Attention v4 正式版,打算之后上 B200 云实例跑完整训练。这点先别太激动,目前更像一个可复现的 d...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
00:00
31d ago
● P1OpenAI 博客· rssEN00:00 · 05·13
OpenAI 回应 TanStack npm 供应链攻击:员工设备受影响
OpenAI 确认有两台公司电脑在 5 月 11 日的“Mini Shai-Hulud”供应链攻击中受影响,攻击者通过被篡改的 TanStack 开源库(npm 包)进入内部,从这两台设备能接触到的部分代码仓库里偷走了一些凭证。OpenAI 说没发现用户数据、生产系统或核心知识产权被碰过,被偷的凭证也没被实际利用。作为预防,他们正在更换所有应用的代码签...
#Safety#OpenAI#TanStack#Incident
精选理由
OpenAI 发了一份安全公告,确认 TanStack 的“Mini Shai-Hulud”npm 供应链攻击影响到了自家应用,macOS 用户要在 6 月 12 日前更新。正文没披露攻击具体怎么进来的、影响了哪些版本、有没有数据泄露,技术细节基本为零。所以这条消息的实际分量就卡在“官方认了、给了截止日”这个层面,没法往深了挖。我会先打个折,把它放在 featured 的入门线附近,等后续有更多技术复盘再往上调。
一句话点评
OpenAI 承认两名员工电脑因 npm 包投毒中招,部分内部代码仓库的凭证被偷,但用户数据和产品没受影响。macOS 用户需在 6 月 12 日前更新应用,否则旧版会被系统拦截。
锐评
这事说白了就是一次供应链连坐:TanStack 这个开源库被植入恶意代码,OpenAI 内部有两台员工设备没来得及打上新的安全补丁,结果中招了。攻击者从这两个员工能访问的代码仓库里偷走了一些凭证,但 OpenAI 说被偷的凭证数量有限,没发现后续利用,也没动到用户数据或核心模型。 比较实在的动作是,他们发现被偷的仓库里包含各平台应用的签名证书,所以现在全部换新。macOS 用户最受影响,必须在 6 月 12 日前更新 ChatGPT 桌面版、Codex 等应用,否则旧证书一撤,系统会直接拦下不让跑。Windows 和 iOS 用户倒不用管。 不过,正文没披露那两台员工设备到底跑了什么恶意行为、偷走的凭证具体能访问哪些系统,也没说第三方取证公司查到了什么程度。OpenAI 自己承认,之前 Axios 事件后就在推新的供应链防护措施,但这次中招的两台设备恰好还没部署到位。这点说明安全策略落地有滞后,不是方案本身无效,而是铺开速度没跟上攻击节奏。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
00:00
31d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·13
AI 行业在找一个新指标:从“烧了多少 token”转向“干成了多少事”
Salesforce 和百度几乎同时推出了新的 Agent 计费指标,前者叫 AWU(数完成的任务数),后者叫 DAA(数活跃的 agent 数)。核心逻辑是把衡量标准从“消耗了多少算力”换成“完成了多少产出”。文章指出,用 token 当指标会激励平台让用户多烧 token,而新指标会倒逼平台帮用户省 token、快完成任务。两个方案都还粗糙,没有第...
#Agent#Salesforce#Baidu#Commentary
精选理由
评分维持68:HKR-H/R通过,因为代理指标从Token转向任务完成直接击中成本和ROI争议;HKR-K不通过,因为定义、计费规则和实验数据均未披露。
一句话点评
Salesforce和百度几乎同时推出新计费指标,核心逻辑是把衡量标准从“消耗了多少算力”换成“完成了多少产出”。文章指出,用token当指标会激励平台让用户多烧token,而新指标会倒逼平台帮用户省token、快完成任务。两个方案都还粗糙,没有第三方审计,百度方案更像叙事工具。但方向对了:指标换了,激励就换了。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
00:00
31d ago
AI HOT 精选· aihot-apiZH00:00 · 05·13
每天121封邮件,AI帮你筛到只剩6封
风投人Tom Tunguz预测,五年内没人会一天打开五次Gmail。现在知识工作者日均收121封邮件,相当于工作时段每4分钟一封。AI处理方案用自然语言规则+个人邮件历史做上下文,敏感数据走本地模型,收据自动转发报销、销售线索自动进CRM并生成草稿。最终收件箱消失,只剩真正重要的6条消息。正文没披露具体产品名或实测延迟,但思路很直接:把邮件处理从手动分...
#Agent#Tools#Memory#Tom Tunguz
精选理由
H/K/R三项都过,但这是一篇生产力评论,不是产品发布或研究论文,没有可复现的设置或新成果,所以落在60-71分区间。
一句话点评
风投人Tom Tunguz预测五年内没人一天开五次Gmail。现在知识工作者日均收121封邮件,相当于工作时段每4分钟一封。AI方案用自然语言写规则+个人邮件历史做上下文,敏感数据走本地模型,收据自动转发报销、销售线索自动进CRM并生成草稿。最终收件箱消失,只剩6条真正重要的消息。正文没披露具体产品名或实测延迟,但思路很直接:把邮件处理从手动分拣变成个人AI助理。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1

更多

频道

后台