ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-06

93 items · updated 3m ago
RSS live
2026-05-06 · 星期三2026年5月6日
23:37
37d ago
The Verge · AI· rssEN23:37 · 05·06
马斯克最忠诚的人,成了他最大的软肋
Shivon Zilis 在 Musk 诉 Altman 案中出庭作证,确认自己是马斯克四个孩子的母亲。她曾在 2017 年起同时在 Tesla、Neuralink 和 OpenAI 工作。正文未披露完整证词内容及对案件走向的具体影响。
#Elon Musk#Sam Altman#Shivon Zilis#Commentary
精选理由
正文只交代了 Zilis 作证的事实,没有披露完整证词、对案件走向的影响,也没有涉及产品层面的后果,所以信息量够但深度不足,不上精选。
一句话点评
Shivon Zilis 出庭确认自己是马斯克四个孩子的母亲,并透露2017年起同时在特斯拉、Neuralink和OpenAI工作。
锐评
这条新闻的核心不是AI技术,而是Musk诉Altman案中一个关键证人的证词。Zilis是Musk的长期盟友,她的身份和跨公司工作经历可能成为法庭上质疑OpenAI早期治理结构的重要证据。正文未披露完整证词内容,所以目前只能确认她说了什么,无法判断对案件走向的具体影响。对于关注AI行业权力斗争的人,这是一条值得追踪的线索;但如果你只关心模型能力或产品,这条新闻暂时没有直接信息。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
23:16
37d ago
Product Hunt · AI· rssEN23:16 · 05·06
Unabyss:给 AI 装一个自动更新的“记忆层”,不用每次重新交代背景
Unabyss 是一个 MCP 原生的上下文层,能自动从你日常用的应用里提取、整理信息,然后通过 MCP 协议共享给任何 AI 工具。说白了就是:你设一次,以后 AI 就记住你的背景了,不用每次对话都重新说一遍“我是谁、我在做什么”。它支持细粒度权限控制,可以限制每个 AI 能看到哪些内容。目前标价免费,但正文没披露更新机制、支持哪些应用集成、上下文窗...
#Tools#Memory#Unabyss#Product update
精选理由
HKR-H 靠 MCP 原生自更新上下文这个钩子勉强过关,但 HKR-K 和 HKR-R 都不行:没机制、没定价、没上下文窗口大小、没测试数据。属于低价值的产品更新信息。
一句话点评
一个MCP原生的上下文层,自动从日常应用提取信息并共享给AI工具,省去每次重复交代背景。支持细粒度权限控制,标价免费。但正文没披露更新机制、支持哪些应用集成、上下文窗口大小,实际效果和兼容性待验证。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
23:04
37d ago
Hacker News 首页· rssEN23:04 · 05·06
DeepSeek V4 Pro 打75折,到5月31日
DeepSeek 把 V4 Pro 的 API 价格打了75%的折扣,持续到5月31日。打折后,输入(缓存命中)每百万 tokens 只要0.0036美元,缓存未命中0.435美元,输出0.87美元。对比原价,输入缓存命中从0.0145美元降到0.0036美元,缓存未命中从1.74美元降到0.435美元,输出从3.48美元降到0.87美元。这个价格在主...
#DeepSeek#Hacker News#Product update
精选理由
HKR三项都过:折扣钩子、截止日期、成本压力都到位。但正文只有HN摘要,没披露原价、折后价、上下文窗口和计费细则,信息量不足,所以不上精选。
一句话点评
DeepSeek V4 Pro API 打75折到5月底,输出每百万tokens只要0.87美元。
锐评
DeepSeek 把 V4 Pro 的 API 价格打了75%的折扣,持续到5月31日。打折后,输出每百万 tokens 只要0.87美元,输入缓存命中更是低到0.0036美元。对比原价,输出从3.48美元降到0.87美元,缓存未命中从1.74美元降到0.435美元。这个价格在主流模型中算很低了,尤其是缓存命中价格几乎可以忽略。不过要注意,这是限时折扣,不是永久降价。另外,V4 Pro 支持1M上下文窗口,最大输出384K tokens,功能上支持 JSON 输出、工具调用等。但正文没披露具体上下文窗口的计费细节,也没说折扣结束后价格会恢复到多少。如果是高频调用且能命中缓存,成本确实能压得很低。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
22:55
37d ago
彭博科技· rssEN22:55 · 05·06
新加坡议会承诺AI时代不搞“无就业增长”
新加坡议会全票通过一项动议,承诺在AI转型期间不会出现经济增长但就业不增长的局面。动议本身是政治表态,正文没披露具体就业指标、执行机制或时间表,所以目前更像一个方向性承诺,不是可追踪的政策。
#Singapore Parliament#CNA#Policy
精选理由
核心看点是新加坡国会用政治承诺回应AI替代焦虑,但正文只给了动议结果,没有就业指标、执行机制或时间表,信息密度偏低。对从业者来说,政策方向值得留意,但缺乏落地细节,暂时只能当信号看,不能当行动依据。
一句话点评
新加坡议会全票通过动议,承诺AI时代不会出现“有增长无就业”。目前只是政治表态,没有具体指标和执行机制。
锐评
新加坡议会全票通过一项动议,承诺在AI转型期间不会出现经济增长但就业不增长的局面。这本质上是一个政治表态,不是可追踪的政策。正文没有披露任何具体就业指标、执行机制或时间表,所以目前更像一个方向性承诺。对于AI从业者来说,这条新闻的信号意义大于实际约束力——新加坡政府至少在公开层面把“就业不增长”列为不可接受的结果,后续可能会影响企业部署AI时的合规预期。但缺的东西很多:没有说怎么衡量“就业不增长”,没有说企业如果裁员会有什么后果,也没有说政府会拿什么预算来兜底。如果后续配套细则出来,比如要求企业提交AI替代岗位的评估报告,那才是真正值得关注的政策落地。目前先当风向标看,别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R1
22:38
37d ago
Hacker News 首页· rssEN22:38 · 05·06
特朗普政府AI监管政策转向引发争议
The Verge 专栏说特朗普政府的 AI 监管态度来了个 180 度大转弯,从之前放松管制变成要加码,这让白宫 AI 与加密货币主管 David Sacks 很难受。文章标题用了“crash and burn”,但正文没披露具体翻车事件或细节,只说是政策转向导致他“噩梦成真”。目前 HN 上有 30 分和 6 条评论,讨论热度不高。
#David Sacks#The Verge#Trump administration#Policy
精选理由
H和R通过:标题把David Sacks放在白宫受挫的冲突框架里,且涉及AI模型审查与政府任命,对关注政策的人有吸引力。K不通过:正文只有RSS摘要,没披露任何审查机制、文件或具体事件,信息量不足。
一句话点评
政策转向让Sacks在内部失势,但正文没给具体翻车事件。
锐评
The Verge专栏标题用了“crash and burn”,但正文没披露任何具体翻车事件或细节,只说特朗普政府对AI监管态度从放松转向加码,让白宫AI主管David Sacks“噩梦成真”。目前HN上只有30分和6条评论,讨论热度不高。这篇更像一篇政策转向的评论,而非独家爆料。如果你关心美国AI监管风向,可以留意这个信号——但别指望从这篇文章里看到Sacks具体怎么栽跟头的。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
22:31
37d ago
Product Hunt · AI· rssEN22:31 · 05·06
Basedash 把数据分析能力打包成 MCP 服务器,让 Claude、Cursor 等 AI 工具直接查你的数据库
Basedash 上线了一个 MCP 服务器,本质上是把它的 BI 平台包装成一个标准接口,让 Claude、Cursor、ChatGPT 等支持 MCP 的 AI 客户端能直接查询你已连到 Basedash 的数据库、数仓和 SaaS 工具。用户用自然语言就能拉实时数据、对比用户群、生成图表。官方说权限沿用团队已有的访问控制,但正文没披露具体的数据源...
#Agent#Tools#Basedash#Product Hunt
精选理由
一个很小的Product Hunt产品更新:只披露了数据分析走MCP接入。HKR-R靠权限/审计焦虑过关,HKR-H/K因为没具体机制或上线细节而不过关。
一句话点评
BI 工具 Basedash 把数据查询包装成 MCP 接口,让 Claude 等 AI 直接问数据库。
锐评
Basedash 把自家 BI 平台包装成 MCP 服务器,等于给 Claude、Cursor 这些 AI 客户端开了一个“数据后门”——用户用自然语言就能查已连到 Basedash 的数据库、数仓和 SaaS 工具,拉实时数据、对比用户群、生成图表。官方说权限沿用团队已有的访问控制,这点先别太激动,因为正文没披露具体支持哪些数据源、有没有额外计费、以及 MCP 驱动的查询是否走独立审计日志。对团队来说,好处是省了来回切工具和写 SQL 的时间;风险是自然语言查询容易产生模糊或错误的 SQL,且权限边界在 MCP 场景下可能被绕过。如果是小团队快速看数,这个方案挺省钱;但金融、医疗等需要严格审计的场景,建议等官方补上查询日志和源列表再上生产。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
22:14
37d ago
FT · 科技· rssEN22:14 · 05·06
马斯克曾想挖奥特曼去特斯拉,后来在OpenAI闹翻了
据Shivon Zilis(马斯克旗下公司高管)在法庭证词中透露,马斯克在跟奥特曼闹翻之前,曾试图挖他去特斯拉任职。这篇FT报道把这件事跟两人后来在OpenAI发展方向上的争执以及马斯克起诉OpenAI联系了起来。但正文被付费墙挡住了,没披露具体是什么职位、什么时间、什么条件。
#Elon Musk#Sam Altman#Shivon Zilis#Personnel
精选理由
核心看点是马斯克挖Altman这个八卦钩子,加上Zilis证词提供了一个新事实。但正文没披露职位、时间、条件,也没有产品或治理层面的影响,所以分数压在60-71区间。信息缺口明显,先别过度解读。
一句话点评
法庭证词爆料,但正文被付费墙挡住,缺关键细节。
锐评
FT这篇报道的核心信息来自Shivon Zilis的法庭证词:马斯克在跟奥特曼闹翻之前,曾试图挖他去特斯拉任职。但正文被付费墙完全挡住,没披露具体是什么职位、什么时间、什么条件。所以这条新闻目前只能当八卦看——它把这件事跟两人后来在OpenAI发展方向上的争执以及马斯克起诉OpenAI联系了起来,但缺少支撑判断的细节。对AI从业者来说,这条信息本身没有技术或商业启示,更多是人物关系背景。如果后续有更多证词或文件披露具体职位和条件,才可能看出马斯克当时对AI人才的布局思路。目前信息缺口太大,不值得据此做任何判断。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
21:57
37d ago
TechCrunch AI· rssEN21:57 · 05·06
Barry Diller 说信任 Sam Altman,但 AGI 快来了,信任没用
IAC 主席 Barry Diller 公开力挺 OpenAI CEO Sam Altman,但他同时警告:AGI 一旦接近,信任就变得无关紧要,必须提前装好护栏。Diller 没有具体说护栏是什么、什么时候装、怎么验证效果。正文没披露他是否了解 OpenAI 内部的安全流程,也没给出 AGI 的时间表。
#Safety#Alignment#Barry Diller#Sam Altman
精选理由
H和R通过:标题有冲突,话题踩中AGI治理焦虑。K不通过:只有一句摘要级引语,没有机制或可验证的数字。
一句话点评
IAC主席Diller挺Altman,但说AGI快来了,信任没用,得提前装护栏。
锐评
Barry Diller(IAC主席)在WSJ活动上公开力挺Sam Altman,但他真正想说的是:AGI一旦接近,信任就无关紧要了,必须提前装好护栏。这话本身没错,但问题在于全文没披露任何具体方案——护栏是什么、谁来装、什么时候装、怎么验证效果,一概没提。Diller也没说他是否了解OpenAI内部的安全流程,更没给出AGI的时间表。所以这条新闻的价值在于:一个非AI圈的老牌商业大佬开始公开喊“AGI需要硬约束”,说明安全议题正在从技术圈扩散到董事会层面。但如果你指望从中读到可操作的安全方法论,正文给不了。信息缺口很明显:没有具体技术方案、没有时间线、没有验证机制。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
21:51
37d ago
r/LocalLLaMA· rssEN21:51 · 05·06
Unsloth 给 Qwen3.6 嫁接 MTP 模块,本地推理速度提升 6%-50%
Reddit 用户 havenoammo 上传了嫁接 MTP(多 token 预测)模块的 Qwen3.6-35B-A3B 模型 GGUF 版,并晒出本地跑分。在单张 5090 FE 上,Q4 量化从 215 涨到 228 token/秒,提升约 6%;5090+3090 组合下 Q8 从 148 涨到 152 token/秒;另一用户用 2 张 50...
#Inference-opt#Qwen#Hugging Face#llama.cpp
精选理由
这是一条 Reddit 上传帖,不是官方 Qwen 发布。核心看点是 MTP 嫁接后的本地速度变化,数字具体但范围窄:只测了 5090 FE 和混合显卡两种配置,Q4 涨 6% 不算惊艳,Q8 在混合卡上跳 50% 但正文没解释为什么。对想自己跑 GGUF 的人有参考价值,但别当通用结论。
一句话点评
单卡5090跑Qwen3.6-35B,MTP模块白送6%速度,几乎零成本。
锐评
Reddit用户havenoammo把MTP(多token预测,即模型一次猜多个词)嫁接到Qwen3.6-35B-A3B上,放出GGUF量化版并晒了本地跑分。单张5090上Q4量化从215涨到228 token/秒,提升约6%;5090+3090组合下Q8从148涨到152 token/秒。另一用户用2张5070 Ti+3090更夸张,从110跳到165 token/秒,但原文没解释配置差异,这点先别太激动。MTP原本是训练阶段的技巧,现在被强行塞进推理,效果居然正向,说明Qwen3.6的架构对这类嫁接容忍度高。不过正文没披露显存占用变化、生成质量是否下降,也没说MTP模块本身有多大。如果只是白嫖6%且不影响输出,那对本地部署用户挺划算。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
21:43
37d ago
TechCrunch AI· rssEN21:43 · 05·06
Snap 与 Perplexity 的 4 亿美元合作悄悄终止
Snap 在季度财报里提了一句,去年 11 月宣布的那笔 4 亿美元交易已经“友好结束”。按原计划,Perplexity 的 AI 搜索会直接嵌进 Snapchat,Perplexity 要在一年内付给 Snap 4 亿美元的现金加股权。现在合作在 Q1 就停了,双方都没说具体原因。我会先打个折:公告里只给了“友好结束”这四个字,没披露是谁先叫停、钱付...
#Tools#Snap#Perplexity#Snapchat
精选理由
4亿美元的合作说友好终止就终止,正文连个原因都没给,信息缺口很明显。对AI搜索公司来说,分销渠道是命门,这笔deal黄了说明抢入口没那么简单。分数卡在60-71的商务更新区间,因为缺终止原因、用户影响和替代方案。
一句话点评
4亿美元合作黄了,双方都说“友好分手”,但没提谁先撤。
锐评
Snap 在季度财报里轻描淡写一句:去年11月宣布的4亿美元合作已经“友好结束”。原计划是把 Perplexity 的 AI 搜索直接嵌进 Snapchat,Perplexity 一年内付给 Snap 4亿美元现金加股权。现在Q1就停了,双方都没说具体原因。 我会先打个折:公告里只给了“友好结束”四个字,没披露是谁先叫停、钱付了多少、有没有分手费。4亿美元对 Perplexity 这种估值几十亿的搜索公司不算小数目,但如果是分期付,实际损失可能没那么大。 缺的信息不少:合作终止是 Snap 觉得搜索嵌入效果不好,还是 Perplexity 觉得不值这个价?Snapchat 的 AI 功能(比如 My AI)会不会受影响?正文都没提。如果是 Perplexity 主动退出,说明它可能找到了更便宜的获客渠道;如果是 Snap 叫停,那它的 AI 战略可能又变了。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:26
37d ago
Hacker News 首页· rssEN21:26 · 05·06
苹果拿一条老规矩卡新软件:AI 生成的 App 算谁的?
苹果从今年 1 月开始用 App Store 审核条款 2.5.2 卡 AI 编程应用,Replit 和 Vibecode 的更新被拒,一个叫 Anything 的 App 直接被下架。核心矛盾是:AI 生成的代码在用户手机上才跑出来,苹果审核时看不到,没法保证安全。Replit 试过把生成的 App 预览放到外部浏览器里,苹果还是没放行。这事不只是 ...
#Apple#Policy#Commentary
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过。标题说苹果用旧规则卡新软件,但正文只给了 HN 的 13 分和 2 条评论,没有披露具体应用、规则条文或执行时间线,信息缺口太大,无法判断事件真实性和影响范围。
一句话点评
苹果用一条老规矩卡住了AI编程App,Replit和Vibecode更新被拒,Anything直接被下架。
锐评
苹果从1月开始用App Store审核条款2.5.2卡AI编程应用,Replit和Vibecode的更新被拒,一个叫Anything的App直接被下架。核心矛盾是:AI生成的代码在用户手机上才跑出来,苹果审核时看不到,没法保证安全。Replit试过把生成的App预览放到外部浏览器里,苹果还是没放行。 这事不只是App Store的审核问题。版本号、发布说明、bug报告、文档截图——整个软件分发体系都假设“软件发出去就不动了”。但AI编程App生成的代码每个用户都不一样,而且随时在变。苹果的审核流程没法检查一个“运行时才决定行为”的东西。 正文没披露苹果是否会推出针对AI生成代码的新审核规则,也没说Replit和Vibecode后续的应对方案。如果苹果坚持用旧规则卡新形态,这类App在iOS上基本没法正常更新。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
21:14
37d ago
Hacker News 首页· rssEN21:14 · 05·06
迪士尼乐园部署人脸识别入园
《卫报》报道迪士尼乐园在入口启用了人脸识别,标题玩了个“米老鼠在看着你”的梗。但正文没披露具体部署在哪个入口、用了哪家供应商、人脸数据保留多久、是否征得游客同意,以及覆盖范围有多大。对做AI或生物识别的人来说,关键缺口是缺乏任何生物特征治理细节——比如存储策略、脱敏方式、退出机制。这些信息缺失意味着目前只能当社会新闻看,没法评估技术合规性或隐私风险。
#Vision#The Guardian#Disneyland#Policy
精选理由
H 和 R 通过:迪士尼监控角度有话题性,隐私治理相关性强。K 不通过:范围、供应商、保存期限、同意机制都没披露,信息不足以支撑精选。
一句话点评
迪士尼乐园入口启用人脸识别,但正文没披露供应商、数据存多久、游客能否退出。
锐评
《卫报》报道迪士尼乐园入口启用了人脸识别,标题玩了个“米老鼠在看着你”的梗。但正文没披露具体部署在哪个入口、用了哪家供应商、人脸数据保留多久、是否征得游客同意,以及覆盖范围有多大。对做AI或生物识别的人来说,关键缺口是缺乏任何生物特征治理细节——比如存储策略、脱敏方式、退出机制。这些信息缺失意味着目前只能当社会新闻看,没法评估技术合规性或隐私风险。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
21:05
37d ago
彭博科技· rssEN21:05 · 05·06
马斯克曾考虑让奥特曼进特斯拉董事会,庭审爆料
庭审中陪审团得知,马斯克曾考虑拉拢Sam Altman加入特斯拉董事会。这是两人恩怨官司的最新爆料,但正文没披露具体时间、条件或Altman的回应。
#Elon Musk#Sam Altman#Tesla#Personnel
精选理由
HKR三项都达标,但正文只有一条RSS级别的法庭细节:一个没有时间、条件或回应的董事会席位想法。彭博社的权威性有帮助,但这仍然是纠纷中的花絮,算不上重大AI行业事件。
一句话点评
马斯克曾考虑拉Sam Altman进特斯拉董事会,这是两人官司的新料。
锐评
庭审爆料,马斯克曾考虑让Sam Altman进特斯拉董事会。这是两人恩怨官司的最新进展,但正文被Bloomberg paywall挡住,没披露具体时间、条件或Altman的回应。信息缺口很大:是收购OpenAI前的拉拢,还是后来和解的筹码?Altman是否接洽过?这些都没说。目前只能确认这是个法庭上的单方说法,未经交叉质证,可信度要打折。对AI从业者来说,这条新闻本身信息量有限,但反映了两人关系从合作到对簿公堂的戏剧性转折,以及科技圈高层人事博弈的复杂性。如果后续有更多细节流出,比如时间线和具体条件,才值得深入分析。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
20:47
37d ago
r/LocalLLaMA· rssEN20:47 · 05·06
Qwen3.6-35B-A3B 跑在 AMD 单卡上,VS Code 写 React 一次跑通
Reddit 用户用一块 AMD R9700 跑 Qwen3.6-35B-A3B-UD-Q5_K_XL 模型,在 VS Code 里配合 Copilot 写代码。上下文窗口开到 262144 token,一次喂了 18 万 token 的输入、生成 1 万 token,还调了工具函数。Vite React 应用第一次运行就成功,只有一个 Playwri...
#Code#Tools#Inference-opt#Qwen
精选理由
这是一个 Reddit 用户的单次实验报告,不是官方发布或基准测试,所以没给到 featured。但配置和速度数据具体,硬件门槛低,对想本地跑编码模型的用户有直接参考意义。正文没披露模型量化精度对质量的影响,也没对比其他本地方案。
一句话点评
35B模型跑出94-105 token/s,本地写代码够用了。
锐评
Reddit用户用一块AMD R9700跑Qwen3.6-35B-A3B-UD-Q5_K_XL,在VS Code里配合Copilot写代码,上下文窗口开到262k,一次喂了18万token输入、生成1万token,还调了工具函数。Vite React应用第一次运行就成功,只有一个Playwright测试需要手动修正。速度约94-105 token/s,对35B模型来说相当快,说明量化(Q5_K_XL)和MoE架构(A3B)在消费级显卡上确实能跑。但注意这是单用户单任务场景,生产环境并发或长上下文持续推理时性能会打折。正文没披露具体显存占用和功耗,也没说是否用到Flash Attention等优化。如果是真的,这个配置对个人开发者做代码辅助挺省钱,但离企业级部署还有距离。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
20:39
37d ago
r/LocalLLaMA· rssEN20:39 · 05·06
Zyphra 发了款 8B MoE 推理模型,活跃参数不到 1B,号称数学推理比肩 DeepSeek-V3.2 和 GPT-5-High
Zyphra 刚放出 ZAYA1-8B,一个混合专家(MoE)推理模型,每次推理只激活不到 10 亿参数。官方说它数学和推理能力超过很多更大的开源模型,甚至接近 DeepSeek-V3.2 和 GPT-5-High(配合测试时计算)。但正文没披露训练数据集、具体跑分和许可证,所以这些对比结论暂时没法验证。如果真能做到,那成本会非常低——毕竟活跃参数少,...
#Reasoning#Inference-opt#Zyphra#AMD
精选理由
HKR全过:小MoE做推理、活跃参数不到10亿、test-time compute,这些对本地模型玩家很有吸引力。分数保留64,因为训练集、评测表和许可证都没披露,信息缺口太大,没法给更高分。
一句话点评
一个只激活不到10亿参数的MoE模型,声称数学推理接近DeepSeek-V3.2和GPT-5-High,但没给训练数据、跑分和许可证,先别太激动。
锐评
Zyphra 新出的 ZAYA1-8B 是个混合专家(MoE)推理模型,每次推理只激活不到 10 亿参数。官方说它数学和推理能力超过很多更大的开源模型,甚至接近 DeepSeek-V3.2 和 GPT-5-High(配合测试时计算)。如果真能做到,那成本会非常低——毕竟活跃参数少,推理时显存和算力需求都小很多。但正文没披露训练数据集、具体跑分和许可证,所以这些对比结论暂时没法验证。另外,帖子来源是 Reddit 的 LocalLLaMA 板块,属于社区讨论,不是官方正式发布,信息可信度要打折。还缺什么?缺独立第三方跑分、模型权重下载链接、以及更详细的架构说明。如果是真的,对本地部署和低成本推理是个好消息,但建议等更多证据再下结论。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
20:07
37d ago
彭博科技· rssEN20:07 · 05·06
Arm 警告手机市场疲软,AI 数据中心增长勉强补坑
Arm 最新财报显示,智能手机业务拖累收入,但 AI 数据中心业务增长抵消了部分下滑。正文没披露具体销售指引、数据中心增速或手机业务占比,所以没法判断这个“抵消”到底能补多少。对 AI 从业者来说,Arm 在数据中心靠的是 CPU 架构授权,不是 GPU,这意味着它吃的是 AI 服务器里“配套”的份额,不是算力核心。手机疲软是长期趋势,AI 这块能撑多...
#Inference-opt#Arm#Commentary
精选理由
Bloomberg来源有权威性,H和R都过线,但正文是RSS摘要,缺预测数字、数据中心增速和手机业务占比。这是AI基础设施的商业信号,不是模型或产品更新,所以落在60–71区间。
一句话点评
Arm 靠 AI 数据中心拉业绩,但手机业务拖后腿,具体能补多少正文没给数。
锐评
Arm 最新财报说 AI 数据中心业务增长抵消了手机疲软,但正文没披露具体销售指引、数据中心增速或手机业务占比,所以没法判断这个“抵消”到底能补多少。对 AI 从业者来说,Arm 在数据中心靠的是 CPU 架构授权,不是 GPU,这意味着它吃的是 AI 服务器里“配套”的份额,不是算力核心。手机疲软是长期趋势,AI 这块能撑多久、撑多大,取决于服务器出货量,而服务器出货量又受资本开支节奏影响。如果数据中心增速只有个位数,那“抵消”可能只是杯水车薪。缺的是分业务线的收入占比和增速,以及管理层对下季度的具体指引。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
18:23
37d ago
TechCrunch AI· rssEN18:23 · 05·06
Greg Brockman 亲述:Elon Musk 当年是怎么离开 OpenAI 的
OpenAI 联合创始人 Greg Brockman 在法庭上回忆了 2017 年 8 月的一次关键会议:当时 OpenAI 还是个小非营利研究实验室,正讨论成立营利实体来筹钱做 AGI。Musk 要求完全控制公司,还刚给每位联合创始人送了辆 Model 3——Brockman 觉得这是在拉拢人心。与此同时,Sam Altman 也在争取支持。研究负责...
#Greg Brockman#Elon Musk#OpenAI#Personnel
精选理由
HKR-H/R 通过:马斯克离开 OpenAI 的故事有流量和治理话题性。HKR-K 不通过:正文只有 Brockman 单方面叙述,没有时间、条款或具体分歧,信息量不足。
一句话点评
Musk 要完全控制 OpenAI,Altman 在拉人,Brockman 觉得送 Model 3 是收买。
锐评
这是 Greg Brockman 在法庭上回忆的 2017 年 8 月内幕:当时 OpenAI 还是个小非营利实验室,正讨论成立营利实体筹钱做 AGI。Musk 要求完全控制公司,还刚给每位联合创始人送了辆 Model 3——Brockman 觉得这是在拉拢人心。同时 Sam Altman 也在争取支持。最终 Musk 退出,但这段谈判细节很少公开。正文没披露 Musk 具体要什么控制权、Altman 怎么拉的人,也没说当时营利实体的股权结构。看点在于创始人撕逼的罕见公开记录,但信息量有限,更像法庭证词节选,不是完整决策复盘。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
17:55
37d ago
● P1The Verge · AI· rssEN17:55 · 05·06
Mira Murati 作证称 Sam Altman 就 AI 模型安全流程误导她
Mira Murati 在 Musk 诉 Altman 案中宣誓作证,说 Altman 曾就一个新模型的安全流程对她撒谎。Altman 声称法务部门已批准跳过部署安全委员会的审查,但 Murati 发现事实并非如此。报道没透露具体是哪个模型。这件事的核心争议点在于 OpenAI 内部的安全治理到底有没有人真正在把关。
#Safety#Alignment#Mira Murati#OpenAI
精选理由
Murati 的证词把 OpenAI 内部安全流程的争议从传闻变成了法庭记录。她说 Altman 对她谎称一个未具名新模型不需要经过部署安全委员会,理由是法务已经认定——如果属实,等于安全委员会被架空了一次。正文没披露模型名称,也没说这个模型最终是否部署了,所以实际影响还判断不了。但“CEO 对 CTO 撒谎来绕过安全流程”这件事本身,比模型能力分数更值得从业者留意。我会先打个折,因为关键细节缺失,没法确认是单次事件还是系统性操作。
一句话点评
OpenAI前CTO在法庭上直接说“没法信Altman的话”,这是高管层信任崩塌的实锤,不是传闻。
锐评
Mira Murati 在马斯克诉 Altman 案中的证词把 OpenAI 2023 年“政变之夜”的内伤摊开了。她作证说 Altman 在模型安全流程上对她撒谎,导致她“无法信任他说的话”。这不是管理风格摩擦,而是直接指向安全决策信息被扭曲。结合之前曝光的内部短信,董事会当时罢免 Altman 的核心指控之一就是沟通不诚实,Murati 的证词等于给这个指控盖了章。 不过得注意,目前公开的报道只引用了证词片段,没披露 Murati 具体指哪次安全流程、涉及哪个模型版本。没有这些细节,我们只能确认信任关系破裂,但没法判断是单次隐瞒还是系统性欺瞒。另外,Murati 在 Altman 被罢免后短暂担任过临时 CEO,后来又离开 OpenAI 创立新公司,她的立场是否会影响证词倾向,正文也没展开讨论。这点先别急着下结论,等完整庭审记录出来再看。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
17:52
37d ago
彭博科技· rssEN17:52 · 05·06
美国最大电网CEO:数据中心用电太猛,电网得重新设计
美国最大电网的CEO David Mills说,数据中心带来的用电需求暴涨,电网必须重新设计才能扛住。正文没披露具体是哪个电网、用电量涨了多少、预算多少、什么时候动工。
#David Mills#Bloomberg#Commentary
精选理由
H 和 R 通过:AI 数据中心用电激增迫使电网改造,这是算力成本故事的关键一环。K 不通过:全文只有 CEO 的单一说法,没有电网名称、新增负荷、预算或时间表,信息缺口太大,无法验证判断。
一句话点评
电网要重新设计才能扛住AI用电潮,但正文没提具体涨了多少、预算多少。
锐评
一句话:美国最大电网CEO说电网得重新设计才能扛住数据中心带来的用电暴涨。关键信息缺口:没说是哪个电网(PJM?CAISO?)、用电量具体涨了多少、预算多少、什么时候动工。这相当于只给了个方向性警告,没有落地细节。对AI从业者来说,这信号意味着算力扩张可能遇到物理瓶颈——如果电网不改,新建数据中心并网周期会拉长、成本会上升。但正文没披露任何数字支撑,所以这点先别太激动,等具体方案出来再评估影响。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
17:11
37d ago
r/LocalLLaMA· rssEN17:11 · 05·06
DeepSeek V3.2 本地跑起来了,llama.cpp 新分支支持 404GB 量化版
开发者 fairydreaming 在 llama.cpp 上提交了一个 DeepSeek V3.2 的 PR,专门开了一个 deepseek-dsa 分支,一行 git clone 就能试。目前支持三种 GGUF 量化:Q4_K_M 约 404GB,Q8_0 约 714GB。如果你用 CUDA 跑 ggml_top_k() 爆显存,可以试试降低 ub...
#Inference-opt#Tools#fairydreaming#llama.cpp
精选理由
HKR 三项都过,但这是社区 PR 而非官方发布或主线合并,具体细节(分支、GGUF 大小、OOM 调参)对本地推理用户有参考价值,不过受众面窄,所以落在 60–71 区间。
一句话点评
社区开发者给 DeepSeek V3.2 做了 llama.cpp 支持,一行命令就能跑,但显存门槛极高。
锐评
fairydreaming 在 llama.cpp 上提交了 DeepSeek V3.2 的 PR,专门开了 deepseek-dsa 分支,git clone 即可试用。目前支持两种 GGUF 量化:Q4_K_M 约 404GB,Q8_0 约 714GB。这意味着跑 Q4 量化也需要至少 4 张 80GB A100 或 8 张 48GB 显卡,个人玩家基本没戏。正文没披露推理速度或显存优化细节,只提到 CUDA 下 ggml_top_k() 可能爆显存,建议降低 ubatch 或调高 -fitt。这点先别太激动:PR 还在早期,社区验证和 benchmark 都缺。对从业者来说,价值在于 llama.cpp 生态终于有人接 DeepSeek V3.2 了,后续如果能压到单卡可跑,本地部署才有意义。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:08
37d ago
Product Hunt · AI· rssEN17:08 · 05·06
iOrchestra AI 硬件工程师:用文字描述就能生成可生产的硬件设计
iOrchestra 在 Product Hunt 上发布了一个 AI 硬件工程师工具,号称从文字描述到可生产的硬件设计只需几分钟,而不是几周。它用多个 AI agent 自动生成 PCB 布局、原理图、机械和工业设计,还能仿真、迭代、自动生成物料清单(BOM)并直接送去生产。不过,正文没披露它支持哪些元器件、输出什么格式、如何做可制造性检查、定价多少...
#Agent#Tools#iOrchestra#Product Hunt
精选理由
Product Hunt 上发了个产品,号称输入提示就能出可制造的硬件设计,但正文没披露支持哪些器件、输出什么EDA格式、有没有样品或定价。HKR 只有 H 通过,属于低价值的产品更新类信息。
一句话点评
短评:从文字到可生产硬件设计,几分钟 vs 几周,听着很猛,但正文没披露支持哪些元器件、输出格式和定价,先别太激动。 点评:iOrchestra 在 Product Hunt 上推了个 AI 硬件工程师,号称从文字描述到可生产的硬件设计只需几分钟,而不是几周。它用多个 AI agent 自动生成 PCB 布局、原理图、机械和工业设计,还能仿真、迭代、自动生成物料清单(BOM)并直接送去生产...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
16:34
37d ago
● P1彭博科技· rssEN16:34 · 05·06
Anthropic 与 SpaceX 签署算力协议满足 Claude 需求增长
Anthropic 和马斯克的 SpaceX 签了一份算力合同,目的是撑住 Claude 越来越大的用量。报道没披露具体算力规模、合同金额、上线时间,也没说这批算力是拿来训练新模型还是跑线上推理。SpaceX 能不能挤进 Anthropic 的长期供应链,目前还看不出来。
#Inference-opt#Anthropic#SpaceX#Elon Musk
精选理由
我会先打个折,这条消息的新闻性在于“谁跟谁合作”,而不是合作本身有多扎实。Anthropic 把 SpaceX 拉进算力供应商名单,对缓解 Claude 的推理压力可能有帮助,但正文没披露任何具体数字或部署细节,所以现在还判断不了这是短期补缺还是长期供应链调整。真正值得盯的是后续会不会有训练或推理负载真的跑在 SpaceX 的设施上,以及合同规模能不能跟 AWS、Google Cloud 的量级比一比。目前只能当作一个信号来看,别太激动。
一句话点评
Anthropic 找 SpaceX 租数据中心来跑 Claude,说明自家算力已经跟不上用户增长了。但别急着喊“马斯克入局”,这只是商业租赁,不是技术合作。
锐评
Anthropic 跟 SpaceX 签了份算力租赁合同,把 Claude 的部分计算任务搬到 SpaceX 的数据中心去跑。Bloomberg 和 FT 都报了这事,但都没披露具体金额和租了多少台服务器。Latent Space 的社区消息提了个数字:300 兆瓦的电力容量,一年可能要花 50 亿美元——这个数如果属实,相当于 Anthropic 每年在算力上烧掉一笔巨款,侧面说明 Claude 的用户量和调用次数涨得很快,ARR 年化增长率被曝达到 8000%。 不过,300MW 和 50 亿美元这两个数字来自社区传闻,不是官方确认,我会先打个折。SpaceX 的数据中心业务本身也不是主业,它能提供多少稳定的 GPU 集群、网络延迟怎么样,正文都没交代。Anthropic 选 SpaceX 而不是 AWS 或 Google Cloud,可能是为了分散供应商风险,也可能是因为传统云厂商的 GPU 排期太满。但跟一家火箭公司租服务器,运维和扩展性上会不会有坑,现在还看不出来。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K0·R1
15:58
37d ago
Hacker News 首页· rssEN15:58 · 05·06
Tilde.run:给AI Agent一个可回滚的沙箱,跑在真实数据上也不怕
Tilde.run 是一个面向 AI Agent 的沙箱平台,核心卖点是“事务化、版本化的文件系统”。每个 Agent 运行都被当作一次数据库事务:跑完可以原子提交,也可以一键回滚。它把 GitHub 代码、S3 数据、Google Drive 文档挂载成一个统一的 ~/sandbox 目录,Agent 在里面读写,所有变更都被版本记录。网络默认隔离,...
#Agent#Tools#Tilde.run#Product update
精选理由
Tilde.run 这个 Agent 沙箱的卖点很直接:事务化、版本化的文件系统,听起来像是给 Agent 干活时能随时回滚、不怕搞乱环境。但正文只有 HN 上的 7 分和 1 条评论,没提隔离怎么做的、API 长什么样、要不要钱、开不开源。所以分数压在 60–71 的小更新区间,信息太少,先别太激动。
一句话点评
把Agent跑成数据库事务,能一键回滚,适合敢让AI动生产数据但怕搞砸的团队。
锐评
Tilde.run 的核心是把每个 Agent 运行当作数据库事务——跑完原子提交,出问题一键回滚,不用恢复备份。它把 GitHub 代码、S3 数据、Google Drive 文档挂载成一个统一目录,Agent 在里面读写,所有变更都被版本记录。网络默认隔离,出站请求被策略检查和审计,能防数据泄露和凭证滥用。 关键判断:这个思路对“让 Agent 动真实数据但怕搞砸”的场景很实用。回滚和审计是刚需,比事后补救强。但正文没披露隔离实现细节(是容器还是微VM)、API 延迟、定价模式,也没说是否开源。如果是真的,对做 Agent 工作流和自动化运维的团队是个省心工具。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:46
37d ago
TechCrunch AI· rssEN15:46 · 05·06
Genesis AI 发布首个机器人模型 GENE-26.5,还秀了一双能拧魔方的手
Genesis AI 今天公开了它的第一个机器人基础模型 GENE-26.5,同时放出一段演示:几台机械手在完成拧魔方、叠积木这类精细操作。这家公司刚拿了 Khosla 领投的 1.05 亿美元种子轮,但正文没披露模型参数量、训练数据来源,也没说什么时候落地。演示看起来挺唬人,但没给任何成功率或延迟数据,这点先别太激动。
#Robotics#Genesis AI#Khosla#Product update
精选理由
Genesis AI 拿了 1.05 亿美元种子轮(Khosla 投的),刚发了首个模型 GENE-26.5,还放了一段机械手做复杂任务的演示。全栈做机器人基础 AI 这个定位本身有看点,但正文没提模型参数、训练数据、上线计划,信息缺口明显。演示视频能说明一定能力,但离产品化还远,这点先别太激动。
一句话点评
Khosla 投了 1.05 亿美元种子轮,Genesis AI 发了机器人模型 GENE-26.5 和一段拧魔方、叠积木的演示。但没给成功率、延迟,也没说参数量和训练数据,先别太激动。
锐评
Genesis AI 今天公开了它的第一个机器人基础模型 GENE-26.5,同时放出一段演示:几台机械手在完成拧魔方、叠积木这类精细操作。这家公司刚拿了 Khosla 领投的 1.05 亿美元种子轮,金额在种子轮里算很大,说明资本对“机器人基础模型”这个方向押注很重。但正文没披露模型参数量、训练数据来源,也没说什么时候落地。演示看起来挺唬人,但没给任何成功率或延迟数据,这点先别太激动。如果是真的,这个模型能直接控制多台机械手做精细活,比传统写死程序灵活很多,成本也可能更低。但缺的东西太多:模型多大、用了多少真实机器人数据、有没有仿真数据、泛化能力如何——这些都没说。种子轮 1.05 亿,估值估计不低,但产品成熟度还看不清。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
15:27
37d ago
TechCrunch AI· rssEN15:27 · 05·06
Tinder 母公司 Match Group 放缓招聘,因为 AI 工具太烧钱
Match Group 说今年剩下时间要放慢招人,因为 AI 工具“花了很多钱”。正文没披露具体用了哪些 AI 工具、花了多少钱、也没说裁员。关键信号是:AI 的运营成本开始直接跟人头预算抢资源。
#Tools#Match Group#Tinder#Commentary
精选理由
HKR三项都过,但事实止于Match Group因AI工具成本高而放缓招聘;预算规模、供应商、是否裁员都没披露。这是一个有用的成本信号,不是模型或产品层面的故事。
一句话点评
AI 工具太烧钱,Tinder 母公司 Match Group 宣布放缓招聘。
锐评
Match Group 说今年剩下时间要放慢招人,因为 AI 工具“花了很多钱”。正文没披露具体用了哪些 AI 工具、花了多少钱、也没说裁员。关键信号是:AI 的运营成本开始直接跟人头预算抢资源。 这跟之前“AI 能降本增效”的叙事不太一样——至少短期看,AI 的投入是实打实的成本项,而且可能比招人还贵。对于做 AI 应用的公司来说,这是个值得关注的信号:如果连 Match 这种成熟平台都觉得 AI 贵,那创业公司更得算清楚账。 缺的信息不少:到底哪些 AI 功能在烧钱?是推荐模型、聊天机器人还是审核系统?成本大头是算力还是 API 调用?这些都没说。另外,放缓招聘不等于不招,也不等于裁员,所以“AI 替代人类”的结论还下不了。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:21
37d ago
r/LocalLLaMA· rssEN15:21 · 05·06
本地模型+智能体框架已经能顶替初级IT运维了
Reddit用户Porespellar用Qwen3.6 27b搭配Hermes Agent跑了一周初级IT运维任务。他让智能体给系统打补丁、装Docker、配置5个GitHub仓库并启动服务,结果1.5小时干完,他自己估摸初级运维得花3小时。关键瓶颈不在模型能力,而是工具权限、审批流程和失败恢复——智能体遇到小问题能自己解决或请求批准,基本不用人插手。...
#Agent#Tools#Code#Qwen
精选理由
HKR 三项全过:有具体的第一人称测试,给出了模型、工具、任务和时间的细节。封顶 71 是因为这只是 Reddit 上的单次测试,没有完整日志、失败案例或可复现步骤。
一句话点评
本地模型+智能体框架已经能顶初级运维了,实测1.5小时干完3小时的活。
锐评
Reddit用户Porespellar用Qwen3.6 27b搭配Hermes Agent跑了一周初级IT运维任务。他让智能体给系统打补丁、装Docker、配置5个GitHub仓库并启动服务,结果1.5小时干完,他自己估摸初级运维得花3小时。关键瓶颈不在模型能力,而是工具权限、审批流程和失败恢复——智能体遇到小问题能自己解决或请求批准,基本不用人插手。 这个测试用的是27B参数模型,跑在DGX Spark克隆机上,算力门槛不高。但注意这是单次任务,不是长期稳定运行,正文也没披露失败率、安全审计结果或复杂场景(比如多系统联动、权限冲突)的表现。如果真能规模化,初级运维的配比可能会从1人管N台变成1人管更多台,但直接说“替代”还早。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
15:07
37d ago
r/LocalLLaMA· rssEN15:07 · 05·06
llama.cpp 跑 150K 上下文,内存从 108GB 涨到 120GB,疑似内存泄漏
Reddit 用户用 128GB Strix Halo 机器跑 Step-3.5-flash,加载 105GB 的 bartowski Q4_XS 模型,上下文开到 150K,内存占用从 108GB 一路爬到 120GB。用的是 llama.cpp 2.13.0 Vulkan 版和 LM Studio。帖子没贴日志,也没给最小复现步骤,所以没法确认是模...
#Memory#Inference-opt#llama.cpp#LM Studio
精选理由
这是一条Reddit上的单次故障报告,有具体的复现步骤(opencode --continue、多轮查询、htop监控),但正文没贴日志或最小复现代码,也没给issue链接。信息够用但验证弱,所以放在all而不是featured。
一句话点评
llama.cpp 疑似内存泄漏,跑 150K 上下文时内存从 108GB 涨到 120GB。
锐评
Reddit 用户用 128GB Strix Halo 机器跑 Step-3.5-flash,加载 105GB 的 Q4_XS 模型,上下文开到 150K,内存占用从 108GB 一路爬到 120GB。用的是 llama.cpp 2.13.0 Vulkan 版和 LM Studio。12GB 的涨幅在 150K 长上下文下不算离谱,但如果是持续增长而非稳定在高位,就可能是泄漏。帖子没贴日志,也没给最小复现步骤,所以没法确认是模型、量化格式还是推理框架的问题。如果是泄漏,跑超长上下文或服务部署时影响大;如果只是正常缓存增长,那问题不大。缺复现步骤和对比实验(比如换短上下文或换模型是否复现),目前只能标记为待验证。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:00
37d ago
TechCrunch AI· rssEN15:00 · 05·06
Ethos 获 a16z 2275 万美元融资,用语音注册专家网络
Ethos 从 a16z 拿了 2275 万美元,做的是专家网络——就是帮企业找行业专家咨询那种。它主打语音注册,专家不用填表,直接说话就能入驻。目前每周能上 3.5 万个专家,这个量级说明语音流程可能确实比填表快。但正文没披露估值、轮次、语音具体怎么工作,也没说定价,所以先别急着判断它是不是比 GLG、Third Bridge 那些老玩家便宜或好用。
#Audio#Ethos#a16z#Funding
精选理由
a16z 和语音注册让这条融资新闻有传播点,2275 万美元和每周 3.5 万专家注册也提供了基础数据。但正文没披露估值、轮次、语音具体怎么用、专家怎么收费,对 AI 从业者来说信息缺口太大,只能当常规融资消息处理。
一句话点评
a16z 投了 2275 万美元给专家网络平台 Ethos,主打语音注册,专家说话就能入驻。
锐评
Ethos 做的是帮企业找行业专家咨询的生意,和 GLG、Third Bridge 竞争。它拿语音注册当卖点:专家不用填表,直接说话就能入驻,目前每周能上 3.5 万个专家。这个量级说明语音流程可能确实比填表快,但正文没披露估值、轮次、语音具体怎么工作,也没说定价。所以先别急着判断它是不是比老玩家便宜或好用。a16z 领投算一个信号,但专家网络这个赛道不缺钱,缺的是差异化。如果语音注册真能大幅降低专家入驻门槛,那它可能切到更多长尾专家,但正文没给验证数据,比如入驻后专家被预约的比例、客户留存率。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K1·R0
14:05
37d ago
持续报道 · 35d● P1r/LocalLLaMA· rssEN14:05 · 05·06
Qwen3.6 27B量化模型在单张RTX 5090上运行200k上下文
一位 Reddit 用户在单张 32GB 显存的 RTX 5090 上,用 vLLM 跑通了 Qwen3.6 27B 的 NVFP4 量化版,并验证了 200k 上下文长度。配置上用了 fp8_e4m3 的 KV 缓存、FlashInfer 和 3 个投机 token 的 MTP。10 次 200k 上下文跑分平均生成速度 73.6 tok/s,首 t...
#Inference-opt#Reasoning#Tools#Qwen
精选理由
我会先打个折:来源是 Reddit 用户自测,不是官方报告,但配置和日志都贴出来了,可复现性不低。真正值得盯的是显存边界——KV 缓存占了 8.3GiB,整卡吃到约 30478MiB,几乎榨干 32GB。这说明 NVFP4 量化确实把 27B 模型压进了消费级显卡,而且 200k 上下文不是摆设,十次都跑稳了。不过 TTFT 70 秒意味着首 token 要等一分多钟,实际用起来体验会打折扣。这点先别太激动,等更多卡型验证。
一句话点评
单张 RTX 5090 跑通 Qwen 3.6 27B 的 200k 上下文,80 TPS 够用,但来源是 Reddit 用户自测,没官方背书。
锐评
这条消息的核心看点很直接:一张消费级显卡(RTX 5090,48GB 显存)就能把 Qwen 3.6 这个 270 亿参数的模型跑起来,还带上了 20 万 token 的上下文窗口。这意味着处理一整本小说的长度,不需要昂贵的多卡服务器了。用户报告里提到用 FP8 精度加载模型,BF16 格式存 KV 缓存,推理速度能到每秒 80 个 token,这个速度日常聊天或做长文档摘要完全够用。 不过得先打个折。信息全部来自 Reddit 的 r/LocalLLaMA 板块,属于社区玩家的自发测试,正文甚至因为反爬机制没抓到完整内容。我们看不到具体的延迟波动、显存占用的峰值细节,也不知道这个 80 TPS 是生成第一个 token 的速度还是稳定输出速度。另外,用 FP8 量化后模型能力会损失多少,在超长上下文里会不会出现注意力衰减,这些关键指标都没披露。 如果你手头正好有这张卡,这条消息值得跟进验证。但做生产部署决策的话,还得等更严谨的基准测试,尤其是长文本召回率和推理稳定性的数据。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
13:47
37d ago
r/LocalLLaMA· rssEN13:47 · 05·06
雷击把两台外接显卡干废了,跑推理时直接崩
Reddit 用户 milpster 发帖说,附近一次雷击不光断了家里网,还把正在跑推理的两台 eGPU(外接显卡坞)同时搞崩溃了。他在机箱里贴了铜接地胶带,但雷还是从网线或电源线窜进来。帖子没交代具体是什么显卡、损坏到什么程度(是彻底烧了还是重启能用),也没说能不能复现。对自建推理集群的人来说,这是个提醒:光靠机箱接地可能挡不住雷击浪涌,最好在电源和...
#Inference-opt#Reddit#Incident
精选理由
H 和 R 通过:雷击/eGPU 崩溃有事故钩子,也触及本地推理硬件风险。K 不通过:缺型号、损坏程度和供电拓扑,属于低价值 Reddit 轶事。
一句话点评
雷击把两台跑推理的eGPU同时干废了,接地胶带没挡住。
锐评
Reddit用户milpster发帖说,附近一次雷击不光断了网,还把正在跑推理的两台外接显卡坞(eGPU)同时搞崩溃了。他在机箱里贴了铜接地胶带,但雷还是从网线或电源线窜进来。帖子没交代具体是什么显卡、损坏到什么程度(是彻底烧了还是重启能用),也没说能不能复现。对自建推理集群的人来说,这是个提醒:光靠机箱接地可能挡不住雷击浪涌,最好在电源和网线口都加浪涌保护器。正文没披露显卡型号和维修成本,这点先别太激动——可能只是驱动掉了,未必真烧硬件。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R1
13:00
38d ago
● P1The Verge · AI· rssEN13:00 · 05·06
Google AI 搜索功能更新支持引用 Reddit 帖子内容
Google 更新了 AI 搜索功能,会在摘要里直接展示来自 Reddit、社交媒体和论坛的“第一手观点”预览,把搜索词和相关的网络讨论串起来。官方说这是为了满足越来越多人在搜索时想看到真人建议的需求。不过公告没提这个功能具体什么时候、在哪些地区上线。对搜索团队来说,核心问题是 AI 摘要如何引用和排序这些用户生成内容来源。
#RAG#Tools#Google#Reddit
精选理由
我会先打个折,因为正文没写覆盖范围和上线时间,所以重要性停在 76 的产品更新档位是合理的。钩子够强——Google 把 Reddit 这种论坛内容塞进 AI 摘要,搜索的流量分配逻辑可能又要变。新事实是 perspectives 预览机制,但具体怎么触发、哪些讨论会被选中都没说。风险点很实在:UGC 来源的引用和排序机制一旦偏了,小站和原创作者会更难拿到流量。这点先别太激动,等看到实际覆盖数据再调整判断。
一句话点评
Google 的 AI 搜索摘要开始直接引用 Reddit 帖子和论坛内容了,这比只给链接更直接,但论坛里的“专家建议”质量参差不齐,别全信。
锐评
Google 这次更新,说白了就是让 AI 搜索概览在回答问题时,能像真人一样直接甩出一段 Reddit 或论坛里的帖子原文当论据。这解决了一个实际痛点:很多生活类、经验类问题,标准网页答案很空,而论坛里的真实用户分享更有用。但风险也在这,论坛内容没经过编辑审核,AI 直接引用可能把偏见、错误信息或玩笑话当成正经答案推给用户。 TechCrunch 的报道点出了这个设计选择可能带来的混乱,但正文没披露 Google 具体用什么机制来筛选和验证这些引用内容的可靠性。是只看点赞数,还是有别的算法?这点没说清楚。另外,报道也没提这种引用方式对 Reddit 等平台的流量是引流还是截流,这对内容创作者来说很关键。 我会先打个折,这个功能对找攻略、产品评价这类查询可能挺方便,但遇到需要严谨事实的问题,最好还是多点一下原始链接核实。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
12:56
38d ago
Hacker News 首页· rssEN12:56 · 05·06
Adam:一个用 C 写的嵌入式 AI Agent 库,号称 Agent 框架界的 SQLite
Adam 是一个用 C 语言写的跨平台 AI Agent 库,可以嵌入到任何应用里。它同时支持云端和本地大模型、工具调用、长期记忆、语音、会话管理、研究模式,甚至还有自我进化的循环。作者把它比作 Agent 框架界的 SQLite——小巧、可移植、开箱即用。目前 GitHub 上 8 个 Star、1 个 Issue,还没有评论。正文没披露具体支持哪些...
#Agent#Adam#SQLiteAI#Hacker News
精选理由
一个很小的 Show HN 开源项目:HKR 中只有 H 通过,K 和 R 都不满足。正文缺少 API、许可证、模型支持和运行机制等关键信息,只能归入低价值的产品更新类别。
一句话点评
一个自称Agent框架界SQLite的C语言库,功能吹得很全,但刚上线,社区反馈为零。
锐评
Adam把自己比作Agent框架里的SQLite——小巧、可嵌入、跨平台,用C语言写,支持云端和本地大模型、工具调用、长期记忆、语音、会话管理、研究模式,甚至自我进化循环。想法很性感:让开发者像嵌入数据库一样嵌入Agent能力。但正文没披露具体支持哪些模型、API接口长什么样、用什么许可证、运行时内存和CPU开销多少。GitHub上目前只有8个Star、1个Issue、0条评论,属于刚开张的状态。如果真能做到SQLite级别的轻量和稳定,那确实能解决当前Agent框架太重、依赖复杂的问题。但这点先别太激动——C语言写AI Agent库的维护成本极高,要对接不同模型API、处理工具调用的安全边界、管理长期记忆的持久化,任何一个环节做不好都容易翻车。建议观望,等它放出更多技术细节和实际跑起来的demo再评估。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
12:10
38d ago
MIT 科技评论· rssEN12:10 · 05·06
深海潜水器与军事聊天AI:本周科技简报
MIT科技评论本周简报聚焦两件事:一是Orpheus Ocean的潜水器下潜近6000米绘制海底矿物地图,成本远低于现有系统,但同样吸引深海采矿公司,环保争议随之而来;二是美军方测试对话式AI工具,可对潜在打击目标排序辅助决策,但存在AI错误、不透明及科技巨头影响力过大的隐忧。
#Agent#Tools#MIT Technology Review#Orpheus Ocean
精选理由
MIT Tech Review这篇是两条新闻的汇总,AI部分只说了军方在测能建议目标排序的对话式AI,但没披露用的什么系统、部署范围、评估结果。信息缺口明显,所以分数压在68。
一句话点评
MIT科技评论本周简报:Orpheus Ocean的潜水器下潜近6000米绘制海底矿物图,成本远低于现有系统,但同样吸引深海采矿公司,环保争议随之而来。另一条是美军测试对话式AI工具,可对潜在打击目标排序辅助决策,但存在AI错误、不透明及科技巨头影响力过大的隐忧。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
11:56
38d ago
r/LocalLLaMA· rssEN11:56 · 05·06
把注意力计算和权重拆开跑:Gemma 4 26B 能塞进两台旧电脑了
Reddit 用户分享了一个 Gemma 4 26B 的部署方案:把注意力计算(几 GB)放在本地机器,权重存在另一台廉价 Xeon 上,通过 larql 代码连接。这样一台机器不够显存跑完整模型时,可以用两台旧机器分担。但帖子没给任何速度或内存实测数据,实际延迟和吞吐量未知,想复现得自己试。
#Inference-opt#Gemma#Reddit#larql
精选理由
HKR 靠一个偏工程的思路、一个仓库和一个明确的本地推理成本痛点通过。但证据很薄:正文没披露速度、延迟、内存曲线或复现的 benchmark,所以分数压在 60–71。
一句话点评
把注意力计算和权重拆到两台旧机器上跑,思路挺省钱,但没实测数据,先别急着抄。
锐评
这个方案把 Gemma 4 26B 的注意力计算(几 GB)放在本地 GPU 机器,权重存在另一台廉价 Xeon 上,通过 larql 代码连接。好处是显存不够的旧机器也能跑大模型,两台凑一起比买新卡便宜。但帖子没给任何速度或内存实测数据,实际延迟和吞吐量未知,想复现得自己试。正文没披露网络带宽要求,如果两台机器之间走慢速网络,延迟可能高到没法用。另外,注意力计算和权重分离后,推理框架是否支持、代码稳定性如何,都是未知数。如果是真的挺省钱,但信息缺口太大,建议等社区跑出 benchmark 再决定是否投入。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
11:45
38d ago
r/LocalLLaMA· rssEN11:45 · 05·06
Qwen3.6-27B 用 MTP 投机解码,在 llama.cpp 上吞吐量翻 2.5 倍
Reddit 用户 havenoammo 放出了一个 Qwen3.6-27B 的魔改版 GGUF 模型,核心是把 3 层 Q8_0 量化的 MTP 草稿头嫁接到 Unsloth UD XL 的 GGUF 上,然后在 llama.cpp 里用一条还没合并的 PR(#22673)跑投机解码。实测吞吐量能到原来的 2.5 倍左右。关键信息:这个 MTP 支持...
#Inference-opt#Tools#Qwen#Unsloth
精选理由
HKR 三项都过:2.5 倍 MTP 吞吐是具体且相关的性能提升。给 68 分是因为来源单一(Reddit 个人帖)、依赖未合并的 llama.cpp PR,且受众偏窄(GGUF 本地推理用户)。
一句话点评
本地跑 Qwen3.6-27B 吞吐翻倍,但得自己编译 llama.cpp 的未合并 PR。
锐评
Reddit 用户 havenoammo 把 Qwen3.6-27B 的 3 层 MTP 草稿头(Q8_0 量化)嫁接到 Unsloth UD XL 的 GGUF 上,再用 llama.cpp 一条未合并的 PR(#22673)跑投机解码,实测吞吐量提升约 2.5 倍。关键点:这是本地 GGUF 首次支持 MTP,主分支还不包含。数字说明:3 层草稿头意味着每次推理先快速生成 3 个候选 token,再让主模型验证,成本低但延迟可能略增。正文没披露具体硬件和 batch size,也没对比原版 Qwen3.6-27B 的基线。如果是真的,对本地部署挺省钱,但得自己编译 PR,门槛不低。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
11:45
38d ago
The Verge · AI· rssEN11:45 · 05·06
微软 Office 和 LinkedIn 负责人现在也管 Teams 了
微软内部又一轮高管调整:负责 Office 和 LinkedIn 的 Ryan Roslansky 现在把 Teams 也收归旗下。原 Teams 负责人 Rajesh Jha 在微软干了 35 年后退休。这次调整是人事变动,正文没披露任何产品路线图或 AI 策略变化,所以暂时看不出对 Copilot 或 Teams 功能有什么直接影响。
#Microsoft#Ryan Roslansky#Rajesh Jha#Personnel
精选理由
K 通过:微软生产力业务边界变了。H 和 R 弱,因为正文没披露 Teams、Office Copilot 或 LinkedIn 的产品路线变化,所以落在 60 分左右的常规报道区间。
一句话点评
微软内部人事调整,跟产品功能无关。
锐评
微软把 Teams 划给了同时管 Office 和 LinkedIn 的 Ryan Roslansky,原负责人 Rajesh Jha 在干了 35 年后退休。这纯粹是高管换岗,正文没提任何 Copilot 或 Teams 的新功能、新策略。对 AI 从业者来说,这条消息暂时没有产品层面的信息量,不用过度解读。唯一值得留意的是:Teams 和 Office 归同一个人管,未来两个产品在 Copilot 集成上可能更容易对齐,但这点目前只是推测,正文没给证据。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
11:37
38d ago
FT · 科技· rssEN11:37 · 05·06
英国前内阁秘书:AI“输家”应获再培训补偿
英国前内阁秘书格斯·奥唐奈提议,为因AI失业的工人设立再培训基金。正文没披露资金规模、执行机构或资格规则。对从业者来说,劳动力成本会成为AI落地风险的一部分。
#Gus O’Donnell#Policy#Commentary
精选理由
H 和 R 靠“AI 输家”补偿角度和就业焦虑过关。K 不过:只提了再培训,没给资金规模、执行机构、适用条件,所以落在 60–71 区间。
一句话点评
英国前内阁秘书提议为被AI取代的工人设再培训基金,但没提钱从哪来、谁管、谁有资格。
锐评
英国前内阁秘书格斯·奥唐奈提了个听起来很合理的方案:AI让谁失业,就出钱给谁再培训。但正文没披露资金规模、执行机构或资格规则——等于只画了个饼。对AI从业者来说,这条新闻的真正信号是劳动力成本会成为AI落地风险的一部分。如果你在给客户做自动化方案,以后可能得把“裁员补偿”或“再培训预算”算进ROI里,否则政策一落地项目就卡住。另外,奥唐奈是前公务员,不是现任决策者,提案离立法还有距离。目前英国政府没有公开回应,所以这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
11:35
38d ago
r/LocalLLaMA· rssEN11:35 · 05·06
把显示器插到主板上,能省出几百MB显存跑模型
Reddit用户Th3Sim0n分享了一个小技巧:如果你的CPU有核显,把显示器接到主板视频口上,让核显负责桌面渲染,独显就能省下几百MB显存。Windows或带图形界面的Linux都适用。正文没披露具体显卡型号和实测省了多少,但几百MB对跑大模型来说,可能刚好够多塞一层或一个长上下文。
#Inference-opt#Th3Sim0n#Reddit#Commentary
精选理由
HKR全过:技巧实用,直击本地推理显存焦虑。但范围窄(仅限有核显的CPU+独显组合),且帖子没披露显卡型号和实测数据,所以分数压在60-71区间。
一句话点评
把显示器插到主板上,核显接管桌面渲染,独显能省几百MB显存。
锐评
Reddit 用户 Th3Sim0n 分享了一个零成本小技巧:如果你的 CPU 有核显,把显示器接到主板视频口,让核显负责桌面渲染,独显就能省下几百 MB 显存。Windows 或带图形界面的 Linux 都适用。 几百 MB 对跑大模型来说,可能刚好够多塞一层或一个长上下文,尤其对 8GB、12GB 显存的用户很实用。但正文没披露具体显卡型号和实测省了多少,不同驱动和桌面环境差异可能很大。如果是真的,这比调量化参数简单得多。 缺点:核显性能弱,高刷屏或 4K 多屏用户可能会觉得桌面卡顿。另外,部分主板 BIOS 默认关闭核显,需要手动开启。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
10:35
38d ago
彭博科技· rssEN10:35 · 05·06
Hut 8签下980亿美元德州AI数据中心租约,股价创五年最大涨幅
比特币矿商Hut 8签了一份至少98亿美元的德州AI数据中心租约,消息一出股价直接飙到2021年以来最大单日涨幅。租约对手方被描述为“高投资级公司”,但正文没披露具体是谁、算力规模多大、什么时候交付。98亿这个数字看着吓人,但租约通常是长期(10-15年),折到每年也就几亿美元,对超大规模数据中心来说不算离谱。不过信息缺口很明显:没说是给谁建、建多大、...
#Inference-opt#Hut 8#Partnership
精选理由
98亿美元租约+股价暴涨,信息密度够高,但客户名称、算力规模和交付时间都没披露,所以分数压在60-71区间。
一句话点评
矿商Hut 8签了至少98亿美元的德州AI数据中心租约,股价暴涨。但租约对手方、算力规模、交付时间都没披露。
锐评
Hut 8这笔租约金额98亿美元看着吓人,但租约通常10-15年,折到每年也就几亿美元,对超大规模数据中心来说不算离谱。股价涨到2021年以来最大单日涨幅,市场显然当利好炒。关键信息缺口很大:对手方只说是“高投资级公司”,没披露具体是谁;算力规模多大、什么时候交付、租约结构(是纯托管还是利润分成)都没说。矿商转型AI数据中心是趋势,但Hut 8之前没运营过超大规模AI集群,交付能力和运营经验存疑。正文被Bloomberg paywall挡住,更多细节拿不到。这点先别太激动,等具体客户和算力规模出来再判断价值。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
10:24
38d ago
Product Hunt · AI· rssEN10:24 · 05·06
ClawTick:一行命令给 AI agent 加定时任务,不用自己搭服务器
ClawTick 是一个云调度器,专门给 AI agent 用的。你不需要自己维护 cron 或拼凑 EventBridge + Lambda,一行 CLI 命令就能让 LangChain、CrewAI 或 webhook 任务定时跑。它自带监控、失败告警、自动重试和执行日志,还有一个仪表盘可以看运行状态。免费版给 10 个任务、每月 1000 次触发...
#Agent#Tools#ClawTick#Product update
精选理由
H和R通过:定时任务确实是agent开发者的痛点。K不通过:定价、调度机制、运行限制都没说,所以只能算个小产品更新,不值得上精选。
一句话点评
ClawTick 是一个专为 AI agent 设计的云调度器,让你用一行命令就能定时跑 LangChain、CrewAI 或 webhook 任务,自带监控、告警和重试,不用自己搭 cron 或拼 EventBridge + Lambda。免费版给 10 个任务、每月 1000 次触发,对个人或小团队够用。短评:省掉自己搭调度基础设施的麻烦,适合快速验证 agent 定时任务。但正文没披露...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
10:13
38d ago
The Verge · AI· rssEN10:13 · 05·06
Chrome 的 AI 功能可能吃掉你 4GB 硬盘空间
Chrome 开启某些 AI 功能(比如诈骗检测、写作辅助、自动填充和智能建议)后,会自动下载一个 4GB 的 weights.bin 文件。这个文件是 Google Gemini Nano 的模型权重,相当于在本地跑一个小型 AI 模型。4GB 对普通用户来说不小,尤其硬盘只有 128GB 或 256GB 的笔记本,可能直接占掉几个百分点的空间。正文...
#Inference-opt#Tools#Google#Chrome
精选理由
HKR 三项都过,但这不是模型发布或重大能力更新。有用的事实是 Chrome 下载了一个 4GB 的 Gemini Nano 权重文件,所以留在 all 层级。正文没披露删除机制或各平台差异,这点先别太激动,但 4GB 对本地存储来说确实不小。
一句话点评
Chrome 开 AI 功能会偷偷下载一个 4GB 的模型文件,硬盘小的电脑要小心了。
锐评
Google 在 Chrome 里集成了 Gemini Nano 本地模型,用于诈骗检测、写作辅助、自动填充和智能建议。开启这些功能后,浏览器会自动下载一个 4GB 的 weights.bin 文件。对于 128GB 或 256GB 硬盘的笔记本,这直接占掉 1.5%-3% 的空间,成本不算低。正文没披露这个文件能否删除、是否跨平台(Windows/macOS/Linux)行为一致,也没说用户能否手动关闭下载。如果用户只是偶尔用 AI 写作,4GB 的本地模型就显得有点浪费。这点先别太激动,因为实际影响取决于你的硬盘容量和是否真的需要这些 AI 功能。对于 AI 从业者来说,这倒是本地部署小模型的一个参考:模型权重 4GB,推理时还需要额外内存,对终端设备的存储压力不小。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
09:46
38d ago
量子位 · 公众号· rssZH09:46 · 05·06
讯飞智文上线 Vision Agent,一句话生成 17 页 PPT,目前只支持导出 PDF
量子位实测了讯飞智文的新功能 Vision Agent,输入一句需求就能自动生成一份 17 页的旅行攻略 PPT。流程分四步:确认意图、列大纲、润色内容、渲染设计,每步默认 30 秒倒计时,超时自动继续。Beta 版只能导出 PDF,PPTX 格式还没开放。正文没披露底层模型和 token 成本,也没说是否支持自定义模板。
#Agent#Multimodal#Tools#iFlytek
精选理由
量子位实测讯飞智文Vision Agent,1句提示出17页PPT,流程分4步,30秒默认继续,Beta版只支持PDF下载(PPTX开发中)。HKR三项都通过,但仍是垂直办公工具的Beta版,重要性落在60–71区间,不到精选线。
一句话点评
一句话生成17页PPT,但Beta版只能导出PDF,PPTX还没开放。
锐评
讯飞智文新功能Vision Agent,输入一句需求就能自动生成一份17页的旅行攻略PPT。流程分四步:确认意图、列大纲、润色内容、渲染设计,每步默认30秒倒计时,超时自动继续。这个设计挺省心,适合快速出初稿。但Beta版只能导出PDF,PPTX格式还没开放,想直接拿去用还得等。正文没披露底层模型和token成本,也没说是否支持自定义模板,所以实际效果和成本控制还不清楚。如果是免费或低价,那对做PPT头疼的人来说是个好工具;如果收费高,可能还不如自己手动做。另外,30秒倒计时虽然快,但用户可能来不及调整细节,这点先别太激动,等正式版看看。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:28
38d ago
r/LocalLLaMA· rssEN08:28 · 05·06
本地跑大模型:一张AMD 32GB卡 vs 两张16GB的NVIDIA卡,哪个更划算?
Reddit 用户在纠结本地跑模型选哪套方案:一张 AMD Radeon AI Pro R9700(32GB 显存)还是两张 RTX 5060 Ti(各 16GB,共 32GB)。双卡方案更便宜,目标是用 llama.cpp 跑 Qwen 3.6 27B 模型的高量化版本。但帖子正文被屏蔽了,没披露具体价格、跑分或搭建步骤。双卡虽然显存总量一样,但跨卡...
#Inference-opt#Tools#AMD#NVIDIA
精选理由
这是一个 Reddit 购买咨询帖,不是可复现的基准测试。HKR-H 和 HKR-R 因为本地推理场景成立,但 HKR-K 缺少价格差、推理速度和驱动条件,所以只能算低价值讨论。
一句话点评
双卡便宜但跨卡延迟高,单卡省心但贵,具体价格和跑分都没说。
锐评
Reddit 用户在纠结本地跑模型选单张 AMD Radeon AI Pro R9700(32GB 显存)还是两张 RTX 5060 Ti(各 16GB,共 32GB)。双卡方案更便宜,目标是用 llama.cpp 跑 Qwen 3.6 27B 模型的高量化版本。但帖子正文被屏蔽了,没披露具体价格、跑分或搭建步骤。双卡虽然显存总量一样,但跨卡通信延迟会拖慢推理速度,尤其大模型需要频繁交换中间数据;单卡则没有这个瓶颈,但 AMD 的 ROCm 生态在 llama.cpp 上的兼容性不如 CUDA 成熟,可能遇到驱动或算子问题。正文没披露两张 5060 Ti 的总价是否真的低于 R9700,也没给任何实测 token 数或量化精度对比。如果追求即插即用且预算够,单卡更省心;如果愿意折腾跨卡优化且预算紧张,双卡值得一试,但需要确认主板是否支持 PCIe 拆分。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H1·K0·R1
08:00
38d ago
OpenAI 博客· rssEN08:00 · 05·06
ChatGPT 怎么一边学知识一边保护隐私
OpenAI 发了一篇面向普通用户的隐私说明,核心就三件事:训练用了哪些数据、怎么去掉个人信息、用户能怎么控制。训练数据包括公开网页、合作方数据、用户对话(如果你开了“帮助改进模型”)。上个月他们发过一个叫 Privacy Filter 的工具,能在训练前自动识别并遮盖姓名、邮箱这类个人信息,官方说效果比同类工具都好,而且已经开源了。用户可以在设置里关...
#Safety#OpenAI#ChatGPT#Policy
精选理由
HKR-R 通过是因为 ChatGPT 数据使用方式对从业者确实重要,但 HKR-H 和 HKR-K 不通过:这只是一篇 OpenAI 的隐私说明文,正文没有披露任何具体机制、参数或产品变更。
一句话点评
OpenAI 发了一篇面向普通用户的隐私说明,核心就三件事:训练用了哪些数据、怎么去掉个人信息、用户能怎么控制。训练数据包括公开网页、合作方数据、用户对话(如果你开了“帮助改进模型”)。上个月他们发过一个叫 Privacy Filter 的工具,能在训练前自动识别并遮盖姓名、邮箱这类个人信息,官方说效果比同类工具都好,而且已经开源了。用户可以在设置里关闭对话用于训练。整篇是科普文,没有披露具...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
07:37
38d ago
Hacker News 首页· rssEN07:37 · 05·06
马克·库班:OpenAI 永远赚不回它投的那1万亿美元
马克·库班在视频标题里直接说,OpenAI 投的那1万亿美元永远赚不回来。帖子只有一条 YouTube 链接、4个 Hacker News 积分和1条评论,正文没披露这1万亿具体怎么构成的、投在哪些地方、以及库班为什么这么判断。信息缺口很明显:不知道他指的是训练成本、数据中心、还是估值泡沫。如果是真的,这个数字比目前任何公开的 AI 投资估算都大,但缺...
#Mark Cuban#OpenAI#Commentary
精选理由
HKR-H/R 通过:Cuban 对 OpenAI 万亿美元 ROI 的质疑有反共识价值。HKR-K 不通过:正文没披露投资构成、时间表或计算依据,HN 热度低,属于低价值信息片段。
一句话点评
库班说OpenAI投的1万亿美元永远赚不回来,但正文没说他指的是什么钱。
锐评
马克·库班在视频标题里直接放话:OpenAI 投的那1万亿美元永远赚不回来。这个数字比目前任何公开的 AI 投资估算都大——OpenAI 自己没承认过这个规模,外界估算的训练成本、数据中心和估值加总也远没到万亿。库班是知名投资人,但这条帖子只有4个 Hacker News 积分和1条评论,来源只有一条 YouTube 链接,正文没披露这1万亿具体怎么构成的、投在哪些地方、以及他为什么这么判断。信息缺口很明显:不知道他指的是训练成本、数据中心、还是估值泡沫。如果是真的,这个数字比目前任何公开的 AI 投资估算都大,但缺来源和论证,先打个折。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
07:15
38d ago
r/LocalLLaMA· rssEN07:15 · 05·06
Chrome 可能要把 4GB 的本地 AI 塞进浏览器
Reddit 用户发现 Google Chrome 搜索结果里出现了一条跟本地 AI 相关的内容,显示需要 4GB 内存。帖子正文被屏蔽了,只留下标题和一张截图描述,所以不知道这个功能叫什么名字、模型多大、什么时候上线、覆盖哪些用户。关键看点是:如果 Chrome 把端侧推理做成默认能力,那等于每个用 Chrome 的人都能在本地跑 AI,不用装任何东...
#Inference-opt#Google#Chrome#Commentary
精选理由
H 和 R 成立:Chrome 加 4GB 本地 AI 提示是平台钩子。K 不成立:功能名、上线范围、版本号和复现步骤全缺,只有一个 Reddit 来源,信息缺口太大。
一句话点评
Chrome 搜索结果里出现本地 AI 入口,要求 4GB 内存,但具体功能、模型大小、上线时间全没披露。
锐评
这条 Reddit 帖子的信息量其实很少:正文被屏蔽,只剩标题和一张截图,说 Chrome 搜索结果里出现了本地 AI 相关的内容,要求 4GB 内存。关键看点是,如果 Google 真把端侧推理塞进 Chrome 作为默认能力,那等于每个用 Chrome 的人都能在本地跑 AI,不用装任何东西——这比任何独立 App 的覆盖都广。但正文没披露这个功能叫什么、模型多大、什么时候上线、覆盖哪些用户。4GB 内存门槛不算高,但模型能力大概率受限(可能只做摘要或翻译)。如果是真的,挺省钱,但别太激动:Chrome 之前推过类似实验功能,最后没全量上线。缺的是官方确认和性能数据。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
06:59
38d ago
r/LocalLLaMA· rssEN06:59 · 05·06
Solidity 专用模型 Qwen3.6-Solidity-27B 声称在智能合约任务上超过 Opus
Reddit 用户 swingbear 发帖称 Qwen3.6-Solidity-27B 在智能合约代码生成评测 soleval 上的 pass@1 指标超过了 Opus 4.7。但帖子只贴了 Hugging Face 链接,没有披露具体任务数量、得分、评测脚本或可复现条件。正文也没说用了多少样本、什么硬件跑的、是否独立验证过。所以这个“超过”目前只能...
#Code#Fine-tuning#Benchmarking#Qwen
精选理由
HKR-H和HKR-R通过,但HKR-K不通过:pass@1的声称缺少分数、任务数量、评测脚本和复现条件。这是Reddit上的一个线索,不是可以上头条的素材。
一句话点评
一个 Reddit 帖子说 Qwen 微调版在智能合约代码生成上超过了 Opus,但没给任何可复现的细节。
锐评
Reddit 用户 swingbear 发帖称 Qwen3.6-Solidity-27B 在智能合约代码评测 soleval 上 pass@1 超过了 Opus 4.7。但帖子只贴了 Hugging Face 链接,没披露具体任务数量、得分、评测脚本或可复现条件。正文也没说用了多少样本、什么硬件跑的、是否独立验证过。所以这个“超过”目前只能当个传闻看,不能当结论。如果后续有人放出完整评测脚本和得分分布,才值得认真对待。目前信息缺口太大,建议先观望。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
06:51
38d ago
r/LocalLLaMA· rssEN06:51 · 05·06
Qwen 3.6 写 TypeScript 时会自动加行内注释
Reddit 用户发现 Qwen 3.6 在 Pi 测试框架里写 TypeScript 代码时,会自动在每行后面加注释。帖子只贴了一个 GitHub 代码链接,没透露用了什么提示词、模型参数,也没说换其他语言会不会一样。用户想把这个行为写进 AGENTS.md 里,让代码代理干活时保持这个风格。正文没披露这是模型固有行为还是测试框架导致的,也没说注释质...
#Code#Agent#Qwen#Reddit
精选理由
这是一个 Reddit 用户的单次观察,附了一个代码链接,但缺少复现设置,验证很弱。对代码代理实践有参考价值,不过属于低权重的从业者闲聊,不用过度反应。
一句话点评
Qwen 3.6 写 TypeScript 会自动加行内注释,但来源只有一条 Reddit 帖子,且正文被屏蔽,信息缺口很大。
锐评
Reddit 用户发现 Qwen 3.6 在 Pi 测试框架里写 TypeScript 代码时,每行后面自动加注释,想把这种行为写进 AGENTS.md 让代码代理保持风格。但帖子只贴了一个 GitHub 链接,正文被屏蔽,没透露用了什么提示词、模型参数,也没说换其他语言会不会一样。正文没披露这是模型固有行为还是测试框架导致的,也没说注释质量如何。如果是模型原生能力,那对代码可读性和协作挺有用;但如果是框架或提示词偶然触发的,那就不值得太激动。目前信息太少,建议等更多独立测试或官方说明再下判断。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
06:47
38d ago
TechCrunch AI· rssEN06:47 · 05·06
Peter Sarlin 的 QuTwo 天使轮估值冲到 3.8 亿美元
芬兰 AI 实验室 QuTwo 完成 2500 万欧元(约 2900 万美元)天使轮融资,估值 3.8 亿美元。创始人 Peter Sarlin 之前是 AMD 旗下 Silo AI 的 CEO,这次明确说公司定位是企业 AI,量子计算只是算力的一种,不是主业。正文没披露具体投资方和产品细节,所以估值高但验证弱。对欧洲本土 AI 和量子赛道来说,这个估...
#Peter Sarlin#QuTwo#Funding
精选理由
一条天使轮估值3.8亿美元的融资新闻,但正文几乎没给有效信息:没写融了多少钱、谁投的、产品做什么。创始人说量子只是新型计算,这句话也没展开。对从业者来说,除了知道这家公司估值高,其他都是空白,所以不放到featured。
一句话点评
天使轮估值3.8亿美元,但正文没披露具体产品和投资人,水分不小。
锐评
芬兰AI实验室QuTwo刚完成天使轮融资,估值冲到3.8亿美元,但实际只融了2500万欧元(约2900万美元)。创始人Peter Sarlin之前是AMD旗下Silo AI的CEO,这次明确说公司做企业AI,量子计算只是算力的一种,不是主业。这个估值在天使轮里算很高,但正文没披露具体投资方和产品细节,验证很弱。对欧洲本土AI和量子赛道来说,这个估值有信号意义,但信息缺口太大,建议等产品出来再认真评估。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
06:34
38d ago
TechCrunch AI· rssEN06:34 · 05·06
Marc Lore 说 AI 很快能让任何人开餐厅
Marc Lore 想把 Wonder 的机器人厨房变成 AI 驱动的“餐厅工厂”,你写个 prompt(提示词)就能生成一个虚拟餐饮品牌。正文没披露上线时间、成本、覆盖城市和厨房数量。
#Agent#Robotics#Marc Lore#Wonder
精选理由
HKR-H和HKR-R通过:提示词开餐厅是个尖锐的钩子,同时触及创业门槛和线下自动化两个痛点。HKR-K不通过:没有上线时间、成本、城市范围或厨房数量,信息缺口明显。
一句话点评
Marc Lore 想把 Wonder 的机器人厨房变成 AI 驱动的“餐厅工厂”,你写个 prompt 就能生成一个虚拟餐饮品牌。
锐评
Marc Lore 的 Wonder 想用 AI 把开餐厅变成写 prompt 的事:你输入“美式汉堡配辣薯条”,AI 自动生成菜谱、包装和营销文案,再由机器人厨房做出来。核心卖点是“零经验开店”,把餐饮品牌变成可生成的数字资产。但正文没披露上线时间、成本、覆盖城市和厨房数量,也没说 AI 生成的菜谱是否经过人工品控。目前 Wonder 已有 30 多个自有品牌和机器人厨房网络,但让外部用户用 prompt 生成品牌,意味着要解决食品安全责任归属和口味一致性——这两点文章都没提。如果真能跑通,确实能大幅降低餐饮创业门槛,但现阶段更像概念演示,离规模化还有距离。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
05:50
38d ago
● P1FT · 科技· rssEN05:50 · 05·06
中国AI初创公司DeepSeek融资估值接近450亿美元
FT 报道,DeepSeek 正在谈一轮新融资,估值接近 450 亿美元,腾讯是意向投资方之一。正文被付费墙挡住,没披露具体融资金额、条款和时间表。这个估值目前还只是谈判桌上的数字,关键要看它跟模型实际收入能不能对上——正文没给营收数据,这点先别太激动。
#DeepSeek#Tencent#Funding
精选理由
我会先打个折:450 亿美元是讨论中的估值,不是落地的钱,正文没披露融资规模、条款和时间表,所以别急着当成交价看。真正值得盯的是这个估值和 DeepSeek 模型收入能不能对上——目前没看到收入数据,信息缺口不小。腾讯想入股是个强信号,但没写具体怎么投、投多少,先当风向标看。
一句话点评
DeepSeek 首次对外融资,估值可能冲到 450 亿美元,但 FT 正文被付费墙挡住,具体条款和投资方名单都没看到。
锐评
这条消息最值得关注的点是 DeepSeek 终于开始拿外部钱了,而且一上来估值就对标 OpenAI 那个量级。450 亿美元这个数字如果坐实,说明资本对低成本训练路线是买单的——之前他们用不到 600 万美元训出 V3 模型,把大模型的价格战直接打穿了。不过现在能确认的信息很少:FT 的报道锁在付费墙后面,我们只看到标题;Reddit 上有人提到中国“大基金”在牵头谈,还有消息说他们要融 73.5 亿美元,下个月发 V4.1 更新。这些数字先别太激动,融资额、估值、发布时间都来自非官方渠道,DeepSeek 自己没公告。另外,拿了国资背景的钱之后,开源节奏和模型可用性会不会变,正文没披露,这是后面要盯住的地方。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
05:30
38d ago
Product Hunt · AI· rssEN05:30 · 05·06
ChatGPT 插件版:在 Google 表格里直接聊天改数据
这是一个 Google 表格的侧边栏插件,让你用自然语言跟表格对话、写公式、清理数据,不用手动拖拽或记函数。产品免费,但正文没披露用了哪个模型版本、权限怎么处理(比如会不会读取整张表),也没说是否支持离线或大表格的延迟表现。适合分析师和运营人员日常用,但如果是敏感数据或超大数据集,建议先小范围试一下。
#Tools#ChatGPT#Google#Product update
精选理由
HKR-K 勉强过关:文章列出了表格对话和自然语言改单元格两个功能,但没披露价格、模型版本和权限机制。这是一个信息量很低的工具小更新,不值得上推荐位。
一句话点评
Google 表格侧边栏插件,用自然语言写公式、清数据,不用记函数。免费,但正文没披露用了哪个模型版本、权限怎么处理(会不会读整张表),也没说大表格的延迟表现。适合分析师和运营日常用,敏感数据或超大数据集建议先小范围试。 短评:免费但信息不全,模型版本和权限都没说,先别往敏感表里塞。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
05:10
38d ago
r/LocalLLaMA· rssEN05:10 · 05·06
Qwen 3.6 27B 量化对比:BF16 和 Q8_0 基本正确,Q6_K 开始出错
Reddit 用户用同一个国际象棋转 SVG 的任务,测了 Qwen 3.6 27B 从 BF16 到 IQ3_XXS 的量化版本,想看看 16GB 显存该用哪个。设置是温度 0.6、top-p 0.95、top-k 20、上下文 65536。结果 BF16 和 Q8_0 基本都对,Q6_K 就开始出现棋子位置错误。正文没披露所有量化版本的完整结果,所...
#Reasoning#Code#Inference-opt#Qwen
精选理由
Reddit 用户拿一个棋局 SVG 任务测 Qwen 3.6 27B 的量化边界,BF16 和 Q8_0 基本正确,Q6_K 开始丢棋子位置。测试参数透明(temp 0.6、top-p 0.95、top-k 20、65536 上下文),但只靠一个任务下结论太单薄,正文也没披露所有量化的完整结论。对 16GB 显存用户来说,Q8_0 是安全线,Q6_K 以下要谨慎。信息缺口:没测推理速度、没对比其他模型、没验证多轮对话稳定性。
一句话点评
Qwen 3.6 27B 量化到 Q6_K 就开始出错,16GB 显存用户选 Q8_0 最稳。
锐评
Reddit 用户用一个国际象棋转 SVG 的任务测了 Qwen 3.6 27B 从 BF16 到 IQ3_XXS 的量化版本,想看看 16GB 显存该用哪个。设置是温度 0.6、top-p 0.95、top-k 20、上下文 65536。结果 BF16 和 Q8_0 基本都对,Q6_K 就开始出现棋子位置错误。 关键信息:这个测试只用了单一任务,样本太少,不能代表通用能力。正文没披露所有量化版本的完整结果,比如 IQ4_XS 和 IQ3_XXS 的表现,所以没法判断更低量化的实际损失。另外,温度 0.6 和 top-p 0.95 的设置偏随机,可能放大了低量化的错误率。 对 16GB 显存用户来说,Q8_0 是安全选择,显存占用约 16GB,性能几乎无损。如果想省显存跑更长上下文,Q6_K 可能勉强可用,但需要更多任务验证。这点先别太激动,单一任务测试不能当通用基准。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:07
38d ago
● P1机器之心 · 公众号· rssZH04:07 · 05·06
DeepSeek-TUI开源工具登顶GitHub热榜获超8700颗星
这个叫DeepSeek TUI的工具在GitHub上拿了8700多颗星,是开发者Hunter Bown(鲸鱼哥)用Rust写的,让你在本地终端里直接调用DeepSeek V4干活。它能聊天、改文件、跑shell命令、管任务。比较特别的是RLM模式:一次可以派发最多16个V4 Flash子任务,上下文窗口有100万token,操作前还有审批关卡,等于让模...
#Agent#Code#Tools#DeepSeek
精选理由
我会先打个折:这是个人项目,不是 DeepSeek 官方出品,稳定性和后续维护都还是未知数。但 8700 星的热度是实打实的,RLM 的并发和审批设计也给了具体的技术细节,不是空炒概念。对想省钱又想在终端里用 DeepSeek 干活的开发者来说,这东西值得盯一下,但暂时别把它当生产工具。
一句话点评
一个把DeepSeek模型塞进终端做编程助手的开源工具,两天从2300星冲到8700星,但别急着叫它“DeepSeek版Claude Code”,功能差距还不小。
锐评
这个叫DeepSeek-TUI的工具,说白了就是让你在命令行里直接用DeepSeek模型写代码、改bug、跑命令。它火起来的速度很快,量子位报道时还是2300星,机器之心跟进时已经8700星登顶热榜了,说明开发者对这种轻量级终端AI助手的需求确实大。 但得说清楚,它跟Claude Code不是一回事。Claude Code是Anthropic官方出的,能直接读写文件、执行shell命令、管理git,跟编辑器深度绑定。DeepSeek-TUI目前更像一个带对话界面的终端客户端,正文没披露它能不能自动改文件、能不能跑多步任务流程。如果只是把API包了一层TUI,那实用天花板就比较明显。 另外两篇报道都没提到用的DeepSeek哪个模型、API费用谁出、本地能不能跑。这些信息缺了,就没法判断它到底是省钱利器还是烧token玩具。热度先收着看,等有人测完真实开发场景再说。
HKR 分解
hook knowledge resonance
打开信源
91
SCORE
H1·K1·R1
04:01
38d ago
● P1FT · 科技· rssEN04:01 · 05·06
Samsung市值突破1万亿美元
三星市值在 AI 热潮中突破1万亿美元,主要靠存储芯片业务拉动。这波上涨还把韩国 Kospi 指数推到了历史新高。不过正文没披露具体涨幅、估值方法或日期,信息缺口明显。
#Samsung#Kospi#Commentary
精选理由
HKR三项都通过:万亿美元里程碑、存储芯片行情、Kospi创新高,市场信号明确。但正文没披露涨幅、估值口径和具体时间,信息缺口明显,所以不上精选。
一句话点评
三星靠 AI 概念市值破万亿,但股价涨了四倍多,这波更多是市场情绪在定价,别急着把它和台积电的实打实地位划等号。
锐评
三星市值摸到一万亿美元,和台积电一起进了这个俱乐部。直接原因是股价从低点翻了四倍多,市场把 AI 带来的存储芯片需求预期打得很满。但这里要打个折:市值是股价乘以股本,反映的是投资者愿意出多少钱,不等于公司已经赚到了这些钱。报道本身没披露这轮上涨里 HBM(高带宽内存)这类 AI 核心产品的具体营收占比,也没说三星在 HBM 上对英伟达等大客户的验证进度到底如何。缺了这两块数据,就很难判断现在的市值是靠短期情绪撑着,还是有订单和利润在底下托底。另外,文章只提了“加入台积电的精英俱乐部”,但台积电的万亿市值背后是先进制程的代工垄断和实打实的毛利率,三星的业务结构更杂,存储、手机、代工都有,直接用市值对标容易高估。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
04:00
38d ago
FT · 科技· rssEN04:00 · 05·06
Anthropic 真的是 AI 领域的“好人”吗?
FT 这篇评论直接质疑 Anthropic 的“好人”人设。CEO Dario Amodei 一直把公司塑造成 AI 竞赛里讲安全、有道德的那一方,但文章没给出具体模型、业务或安全机制的细节来支撑或反驳这个形象。说白了,这是一篇立场讨论,不是技术报道。如果你想知道 Anthropic 到底在安全上做了什么、没做什么,正文没披露。
#Anthropic#Dario Amodei#Financial Times#Commentary
精选理由
HKR-H 和 HKR-R 通过:FT 挑战 Anthropic 安全第一的身份,这是 Claude 社区正在讨论的活话题。HKR-K 不通过:RSS 正文只给了 Dario Amodei 的叙事框架,没有模型、商业或安全细节。
一句话点评
FT 质疑 Anthropic 的“好人”人设,但全文没提具体模型或安全机制,更像立场讨论。
锐评
FT 这篇评论直接挑战 Anthropic CEO Dario Amodei 一直塑造的“安全、有道德”形象。文章没有给出任何具体模型、业务数据或安全机制的细节来支撑或反驳这个形象,纯粹是一场立场讨论。如果你想知道 Anthropic 在安全上到底做了什么、没做什么,正文没披露。对于从业者来说,这篇的价值在于提醒:别只看公关话术,要看实际动作。但信息缺口太大,无法据此做任何判断。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
03:37
38d ago
Hacker News 首页· rssEN03:37 · 05·06
美光开始出货 245TB 数据中心 SSD,容量是亮点但接口和性能都没说
美光宣布 6600 Ion 数据中心 SSD 开始出货,容量做到 245TB,是目前行业最大的。但正文没披露接口(是 PCIe 还是 SAS?)、读写速度、价格和哪些地区能买到。对 AI 基础设施来说,大容量意味着单盘能塞更多模型或训练数据,减少换盘次数,但没性能数据就没法判断它适不适合高吞吐场景。目前只确认了容量和已发货,其他信息等后续。
#Micron#Product update
精选理由
H 和 K 通过:245TB 出货事实具体。R 不通过:正文没给 AI 负载、定价或性能数据,所以这只是一个次要的基础设施更新。
一句话点评
单盘245TB,但没性能数据,高吞吐场景先别激动。
锐评
美光6600 Ion数据中心SSD开始出货,容量做到245TB,是目前行业最大的。对AI基础设施来说,大容量意味着单盘能塞更多模型或训练数据,减少换盘次数,适合冷存储或大模型归档。但正文没披露接口(是PCIe还是SAS?)、读写速度、价格和哪些地区能买到。没性能数据就没法判断它适不适合高吞吐场景——比如训练时频繁读写,或者推理时快速加载模型。目前只确认了容量和已发货,其他信息等后续。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
03:17
38d ago
Product Hunt · AI· rssEN03:17 · 05·06
ChatGPT 开始卖广告位了
OpenAI 在 Product Hunt 上发布了一个广告管理工具,让广告主可以在 ChatGPT 里创建、管理和衡量广告效果。目前只对美国广告主开放 beta 测试,支持按点击付费(CPC)和按展示付费(CPM),还能做转化追踪和汇总报告。广告会明确标注,和 ChatGPT 的回答分开。正文没披露具体定价、定向能力、投放范围,也没说 OpenAI ...
#Tools#ChatGPT#Product Hunt#Product update
精选理由
H 和 R 靠 ChatGPT 广告这个钩子和变现焦虑过关,但 K 不过:Product Hunt 的 RSS 摘要只说了 create/manage/measure,没有官方范围、定价或机制,信息量撑不起高可信度。
一句话点评
ChatGPT 正式上线广告管理后台,美国广告主可以自助投 CPC/CPM 广告了。
锐评
OpenAI 在 Product Hunt 上低调上线了 ChatGPT 广告管理工具,目前仅限美国广告主参与 beta 测试。支持 CPC(按点击付费)和 CPM(按千次展示付费),附带转化追踪和汇总报告,广告会明确标注并与回答内容分离。这相当于给 ChatGPT 装了个“广告投放后台”,让品牌可以直接在对话界面里买量。关键信息缺口不少:正文没披露具体定价、定向能力(比如能否按用户对话意图或历史行为定向)、投放范围(是否只限美国),也没说 OpenAI 的广告收入分成或长期商业化节奏。如果是真的,这对依赖搜索广告的 Google 是个直接威胁——ChatGPT 的日活和停留时长都不低,广告主多了一个“对话式”投放渠道。但 beta 阶段样本小、验证弱,实际点击率和转化效率还没数据,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
03:15
38d ago
Hacker News 首页· rssEN03:15 · 05·06
VS Code 提交信息里“Co-authored-by: Copilot”的后续更新
VS Code 的一个 issue 更新了提交信息中“Co-authored-by: Copilot”的处理方式。目前只有 GitHub/HN 链接、27 个点赞和 11 条评论,正文没披露具体机制。
#Code#Microsoft#VS Code#Copilot
精选理由
HKR-H 和 HKR-R 通过:Copilot 出现在 commit 作者栏里,对开发者来说有话题性和点击欲。HKR-K 不通过:帖子只给了链接和评分,没交代 VS Code 改了啥、什么时候上线、有没有开关,信息缺口太大。
一句话点评
VS Code 要在提交信息里给 Copilot 署名,但具体怎么实现还没说。
锐评
这条信息来自 VS Code 的一个 GitHub issue,目前只有 27 个点赞和 11 条评论,热度不高。核心是讨论在 Git 提交信息中自动添加“Co-authored-by: Copilot”的机制,让 AI 辅助的代码提交有明确的归属记录。但 issue 正文没有披露具体实现方式——是自动追加、用户手动确认,还是只在 Copilot 生成代码时触发?这些细节都缺失。对于团队协作来说,这个功能有助于区分人类和 AI 的贡献,但如果没有清晰的触发规则,可能会让提交历史变得混乱。目前还处于早期讨论阶段,没有合并或发布的计划,开发者暂时不用太在意。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
03:10
38d ago
Hacker News 首页· rssEN03:10 · 05·06
Agent 能自己注册 Cloudflare 账号、买域名、部署应用了
Cloudflare 宣布 Agent 现在可以替用户完成全套上云流程:注册账号、开通付费订阅、买域名、拿 API Token,然后直接部署代码。整个过程不需要人进后台、复制粘贴 Token 或输信用卡号,只需要在关键步骤点一次授权。这套能力是和 Stripe 联合设计的,底层走的是 Stripe Projects 的新协议——Agent 先通过 St...
#Agent#Tools#Cloudflare#Stripe
精选理由
Cloudflare 和 Stripe 联手让 Agent 走完开户→买域名→部署的流程,标题本身够抓人。但正文没披露 Stripe Projects 的具体机制、权限边界、价格、审核流程或可复现条件,信息量只够当个产品动态看,所以给 70 分,放在全量推送里提醒大家留意但别急着下结论。
一句话点评
Agent 能自己注册 Cloudflare 账号、买域名、部署,全程只需点一次授权。
锐评
Cloudflare 和 Stripe 联合搞了个新协议,让 Agent 能替用户走完上云全流程:注册账号、开通付费、买域名、拿 API Token 然后直接部署代码。人不用进后台、复制粘贴 Token 或输信用卡号,只在关键步骤点一次授权。这对 AI 编程工具来说是个实用进展——以前 Agent 写代码容易,部署到生产环境却卡在人工注册和配置上。现在 Stripe Projects 插件加 Cloudflare 的 MCP 服务器,一条命令就能从零到上线。不过正文没披露 Stripe Projects 协议的具体机制、权限边界、定价细节,也没说审核流程和可复现条件。如果是真的,能省掉不少 DevOps 的脏活,但安全模型和成本控制还没讲清楚,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
02:57
38d ago
彭博科技· rssEN02:57 · 05·06
Blue Owl 旗下数据中心运营商 Stack 考虑出售亚洲业务,估值 300 亿美元
彭博援引知情人士消息,Blue Owl 旗下的数据中心运营商 Stack Infrastructure 正在考虑出售其亚洲业务,整体估值约 300 亿美元。这笔交易如果落地,意味着亚洲算力供应格局可能发生重大变化——谁接手这些数据中心,谁就掌握了亚太地区一批关键算力资产。不过正文没有披露潜在买家、具体资产范围、交易时间表或结构,信息缺口不小,目前只能当...
#Blue Owl Capital#Stack Infrastructure#Bloomberg#Funding
精选理由
HKR三项都过,靠的是300亿美元出售亚洲数据中心这个具体数字。但买方、资产范围、时间表、交易结构正文都没披露,信息缺口明显。这是AI基建领域的财务新闻,不是模型或产品发布,所以分数压在60-71区间。
一句话点评
300亿美元亚洲数据中心打包出售,谁接盘谁就掌握亚太算力命脉。
锐评
彭博消息,Blue Owl旗下Stack Infrastructure正考虑出售亚洲业务,整体估值约300亿美元。这个数字说明交易规模巨大——谁接手这批数据中心,谁就掌握了亚太一批关键算力资产。对AI infra团队来说,核心问题是亚洲算力供应格局会不会因此改变。 但正文信息缺口很大:没披露潜在买家、具体资产范围、交易时间表或结构。目前只能当“正在考虑”阶段处理,离落地还有距离。建议关注后续买家身份——如果是主权基金或云厂商,可能意味着算力资产从金融资本转向战略持有。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
02:02
38d ago
r/LocalLLaMA· rssEN02:02 · 05·06
Ollama 曝严重内存泄漏漏洞,无需认证即可读取
Reddit 用户发帖称 Ollama 存在一个严重的内存泄漏漏洞,攻击者无需任何认证就能读取内存数据。帖子链接指向安全公司 Cyera 的研究,但正文被 Reddit 屏蔽,所以没披露受影响版本、复现步骤和官方是否已修复。如果你在用 Ollama 跑模型,建议先去查 Cyera 的原始报告和 Ollama 的安全公告,确认自己是否中招。
#Safety#Ollama#Cyera#Incident
精选理由
HKR-H和HKR-R成立:Ollama未认证内存泄漏对本地大模型运维者来说很紧迫。HKR-K不成立,因为正文没披露受影响版本、复现条件和补丁状态,信息不足以支撑完整判断。
一句话点评
Ollama 爆出无需认证的内存泄漏漏洞,攻击者能直接读内存数据。
锐评
Reddit 用户曝出 Ollama 存在一个严重漏洞:攻击者无需任何认证就能读取内存数据,可能泄露模型权重、对话历史甚至 API key。帖子指向安全公司 Cyera 的研究,但正文被 Reddit 屏蔽,所以没披露受影响版本、复现步骤和官方是否已修复。如果你在用 Ollama 跑模型,建议先去查 Cyera 的原始报告和 Ollama 的安全公告,确认自己是否中招。目前缺的信息很多:漏洞影响哪些版本、是否已有 PoC、官方补丁出了没。这点先别太激动,等原始报告出来再评估实际风险。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
01:56
38d ago
r/LocalLLaMA· rssEN01:56 · 05·06
Gemma 4 和 Qwen 3.6 你选哪个?
Reddit 上有人问大家拿 Gemma 4 干什么用,底下回帖说现在本地跑模型最火的两款就是 Gemma 4 和 Qwen 3.6。讨论集中在写代码、跑基准和做 agent 任务上,但正文没披露具体分数、模型大小或测试条件。真正有用的不是排名,而是什么场景下你会选 Gemma 而不是 Qwen。
#Code#Agent#Benchmarking#Gemma
精选理由
HKR-R 通过,因为本地模型选型是用户能共情的话题。HKR-H/K 不通过:帖子是常规提问,没给分数、规模或测试设置,所以保持低价值 all。
一句话点评
Reddit 用户问 Gemma 4 能干嘛,回帖说它和 Qwen 3.6 是本地跑模型最火的两款。
锐评
这条讨论的价值不在排名,而在场景选择。回帖提到写代码、跑基准和做 agent 任务,但正文被屏蔽,没披露具体分数、模型大小或测试条件。真正有用的问题是:什么场景下你会选 Gemma 而不是 Qwen?比如 Gemma 4 在低资源设备上可能更轻量,Qwen 3.6 在中文任务上更强。缺的是实测对比和用户真实用例,比如代码生成准确率或 agent 任务成功率。如果是真的,这种社区反馈比官方 benchmark 更贴近实际部署。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
01:42
38d ago
r/LocalLLaMA· rssEN01:42 · 05·06
红迪网友说一块魔改AMD卡跑72B模型能打7900XTX
红迪网友psychoOC发帖称,一块叫“Super god bin 9700 pro”的魔改AMD MI100加速卡,在Geekbench计算测试里追平甚至超过了7900XTX。这块卡用涡轮散热跑到3.3GHz,是特挑体质芯片,专门用来跑72B Q5量化模型。不过帖子没贴AI跑分,只放了通用计算benchmark,所以实际跑大模型的速度和推理延迟到底怎...
#Inference-opt#Benchmarking#Reddit#Geekbench
精选理由
7900XTX 级别的跑分加上 3,300MHz 频率和 72B Q5 配置,对本地推理用户有吸引力。但 AI 基准数字没出,来源只有一个 Reddit 帖子,验证弱,所以重要性压在中档。
一句话点评
魔改AMD MI100加速卡超频到3.3GHz,通用计算跑分追上7900XTX,但没贴AI跑分,实际推理性能存疑。
锐评
红迪网友psychoOC晒出一块叫“Super god bin 9700 pro”的魔改卡,本质是AMD MI100加速卡的特挑体质版本,用涡轮散热跑到3.3GHz。帖子只放了Geekbench通用计算跑分,声称追平甚至超过7900XTX,但没贴任何AI benchmark(比如LLM推理速度或延迟)。对于跑72B Q5量化模型的目标,通用计算跑分和实际推理性能之间差距可能很大——MI100的架构和驱动优化远不如消费级7900XTX成熟,而且涡轮散热在高负载下的持续表现也是未知数。正文没披露功耗、显存带宽、实际推理延迟等关键数据,也没说明跑分时的具体配置和散热条件。这点先别太激动,等有人放出llama.cpp实测再说。如果真能稳定跑72B模型且成本远低于7900XTX,那对本地部署玩家是个好消息,但目前证据太弱。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
01:38
38d ago
Hacker News 首页· rssEN01:38 · 05·06
Telus 用 AI 实时改客服口音,被批欺骗客户
加拿大电信商 Telus 通过旗下 Telus Digital 部门,在客服通话中实时修改海外客服的口音,以减少所谓的“口音摩擦”。技术由一家叫 Tomato.ai 的公司提供,属于语音转语音的实时转换。劳工组织批评这种做法有欺骗性,要求强制告知客户。加拿大另外两家运营商 Rogers 和 Bell 表示不会跟进。正文没披露具体用了什么模型、延迟多高、...
#Audio#Telus#Product update
精选理由
HKR-H和HKR-R通过:Telus用AI改客服口音这件事,天然带有信任和劳动争议的讨论价值。HKR-K不通过:正文只给了标题级别的信息,没有部署范围、模型或合规机制。
一句话点评
Telus 用 AI 实时改海外客服口音,被骂欺骗。
锐评
加拿大电信商 Telus 在客服通话中,用 Tomato.ai 的语音转语音技术实时修改海外客服的口音,号称减少“口音摩擦”。劳工组织批评这是欺骗,要求强制告知客户。Rogers 和 Bell 已表态不会跟进。 技术上,实时语音转换通常要串 ASR、口音转换模型和神经声码器,延迟和自然度是难点。正文没披露具体模型、延迟多高、覆盖多少坐席、有没有客户告知机制。如果是真的,成本可能不低,但效果和合规风险都存疑。 这事对做客服 AI 的团队是个警示:技术能用不代表该用,透明度和用户信任比降口音更重要。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
00:53
38d ago
彭博科技· rssEN00:53 · 05·06
CDC签下澳大利亚最大数据中心合同,母公司Infratil股价大涨
CDC Data Centres签下了澳大利亚有史以来规模最大的数据中心合同,并预测未来三年盈利将大幅增长。消息一出,其最大股东Infratil股价应声上涨。不过正文没披露客户是谁、合同金额多少、容量多大、交付时间表如何,所以这个“最大”到底有多大,目前只能先打个折看。
#Inference-opt#CDC Data Centres#Infratil#Partnership
精选理由
这是一条数据中心基建的股票消息,不是AI模型或产品更新。HKR-H靠“最大合同”标题吸引点击,但正文没披露客户、金额、容量或交付时间表,信息量不足。K分低是因为关键数字全缺。R分低是因为跟AI从业者的算力、模型、工具链没有直接关系,更像行业新闻而非技术参考。
一句话点评
CDC签下澳洲最大数据中心合同,但客户、金额、容量都没披露,先打个折看。
锐评
CDC Data Centres签了澳大利亚史上最大的数据中心合同,预测未来三年盈利大涨,大股东Infratil股价应声上涨。但正文没披露客户是谁、合同金额多少、容量多大、交付时间表如何,所以这个“最大”到底有多大,目前只能先打个折看。消息来源是RSS摘要,信息缺口明显,建议等更多细节出来再评估实际影响。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H1·K0·R0
00:04
38d ago
r/LocalLLaMA· rssEN00:04 · 05·06
SubQ 号称 1200 万上下文,实测 128K 就撑不住了
Reddit 用户扒出 SubQ 的 12M 上下文宣传和实际产品 1M-Preview 对不上。RULER 评测只跑到 128K,MRCR v2 在 1M 长度下得分从 83 掉到 65.9,低于 Opus 4.6 的 78.3 和 GPT-5.5 的 74。技术报告发布日期没写,验证细节也不够透明。
#Inference-opt#Benchmarking#SubQ#Opus
精选理由
HKR 三项都过,但来源是 Reddit 对一家不太知名的模型厂商的批评。正文有基准分数,但技术报告发布日期和完整复现细节都没披露,所以分数压在 60–71 区间。
一句话点评
12M 上下文宣传和实际产品对不上,评测也缩水了。
锐评
Reddit 用户扒出 SubQ 的 12M 上下文宣传和实际产品 1M-Preview 对不上,技术报告日期也没写。RULER 评测只跑到 128K,MRCR v2 在 1M 长度下得分从 83 掉到 65.9,低于 Opus 4.6 的 78.3 和 GPT-5.5 的 74。这说明长上下文能力在长文本下明显衰减,验证细节也不够透明。正文没披露训练数据、评测配置和硬件成本,这些缺口让宣传可信度打折。如果是真的,1M 上下文成本可能很高,但实际效果还差一截。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:00
38d ago
Hugging Face 博客· rssEN00:00 · 05·06
开源语音识别排行榜加了防作弊机制
Hugging Face 给 Open ASR 排行榜加了一层“防刷榜”机制,名字叫 Benchmaxxer Repellant。正文没披露具体怎么防——是用数据集扰动、评分规则调整,还是检测异常提交——所以暂时没法判断效果。如果只是改个名字,那意义不大;如果是真能识别出针对榜单优化的提交,对社区公平性会有帮助。
#Audio#Benchmarking#Hugging Face#Open ASR Leaderboard
精选理由
H 和 R 通过:标题用防刷榜概念制造了传播钩子,且触及了 ASR 和模型评测从业者对榜单信任的焦虑。K 不通过:正文为空,未披露任何机制、数据集或可复现的评测条件,信息量不足以支撑判断。
一句话点评
Hugging Face 给 Open ASR 排行榜加了“防刷榜”机制,名字叫 Benchmaxxer Repellant。正文没披露具体怎么防——是用数据集扰动、评分规则调整,还是检测异常提交——所以暂时没法判断效果。如果只是改个名字,那意义不大;如果是真能识别出针对榜单优化的提交,对社区公平性会有帮助。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1

更多

频道

后台