ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-05-08 · 星期五2026年5月8日
07:31
37d ago
AI 群聊日报· atomZH07:31 · 05·08
群聊日报:Agent 无人值守产出 40 万行代码,DeepSeek Flash 单日 70 亿 token 实战
两条实战线:一是 MVVM + 六边形架构配合 test automation,让 agent 自己跑 ReAct 循环,上月产出 30-40 万行代码,实现无人值守开发。二是 DeepSeek Flash 单日消耗 70 亿 token(大部分命中缓存),成本仅数百元,为 guideme.city 批量生成城市导览和品牌故事。用户总结“笨模型因为笨所...
#Agent#Code#Memory#DeepSeek
精选理由
这是一条群聊日报,记录了两条 AI 实战信息:agent 借测试自动化跑 ReAct 循环,产出了30-40万行代码;DeepSeek Flash 单日处理70亿 token。两个数字都很具体,对从业者有参考价值——前者展示了 agent 在编码场景的吞吐上限,后者给出了一个可量化的 token 消耗基准。但来源是聊天记录,没有披露复现方法、测试环境、代码质量或成本数据,可信度有限。正文没披露 agent 用了什么模型、测试框架、代码是否经过人工审查,也没说70亿 token 对应多少请求、延迟如何。这些缺口让信息停留在“有意思”的层面,不足以作为...
一句话点评
两条实战线值得细看:一是MVVM+六边形架构让agent自动跑ReAct循环,上月产出30-40万行代码,实现无人值守开发——关键是test automation做到位。二是DeepSeek Flash单日消耗70亿token(大部分命中缓存),成本仅数百元,为guideme.city批量生成城市导览和品牌故事。用户总结“笨模型因为笨所以更可控”,但代价是需要极其详细的prompt。Clau...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:38
37d ago
r/LocalLLaMA· rssEN05:38 · 05·08
TokenAI 发了个新优化器 STAM,训练时动态调动量,内存比 AdamW 省一半
TokenAI 在 Reddit 上贴了一篇优化器论文,叫 STAM。核心思路是训练过程中根据梯度残差动态调整 beta1(动量系数),在噪声大的阶段自动减小动量,避免震荡。他们同时给了个轻量版 STAMLite,参数内存只占模型参数的 1 倍,而 AdamW 要 2 倍,这对大模型微调来说能省不少显存。论文报了个 0.61 的准确率和 0.91 的 ...
#Fine-tuning#Inference-opt#Benchmarking#TokenAI
精选理由
HKR 的 K 和 R 都过了:优化器机制(g-m 降噪)和状态量对比(1× vs 2×)是具体数字,训练成本对微调用户有参考意义。卡在 60–71 是因为来源是 Reddit 帖子,且完整实验设置缺失,没法判断泛化能力。
一句话点评
TokenAI 发了个新优化器 STAM,号称训练时动态调动量,省显存。但论文正文被屏蔽了,关键实验设置没披露。
锐评
TokenAI 在 Reddit 上贴的 STAM 优化器,核心是训练时根据梯度残差动态调整 beta1(动量系数),噪声大时自动减动量,避免震荡。轻量版 STAMLite 参数内存只占模型参数的 1 倍,而 AdamW 要 2 倍,对大模型微调确实能省显存。论文报 0.61 准确率和 0.91 loss,但没披露完整实验设置——比如基座模型、数据集、训练步数、对比基线是否公平。正文被 Reddit 屏蔽了,无法验证细节。如果是真的,省显存这点挺实用,但准确率提升幅度没给置信区间,得打个折。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
05:15
37d ago
r/LocalLLaMA· rssEN05:15 · 05·08
两台 Strix Halo 组集群,本地内存翻倍到 256GB,专为跑 400B 大模型
Reddit 用户想用两台 AMD Strix Halo 机器组集群,把本地统一内存从 128GB 堆到 256GB,目标是跑 Minimax 2.7、GLM 4.7、GLM 5.1、Qwen 3.5 这些约 400B 参数的大模型,上更高精度的量化版本。思路挺直接:单机 128GB 不够塞 400B 模型的高量化,两台凑一起就能装下。但正文没披露实际...
#Inference-opt#Agent#Code#Thanks-Suitable
精选理由
HKR 中 H 和 R 通过:256GB 集群跑 400B 量化模型是个具体的本地推理钩子,且切中成本和数据控制痛点。K 不通过:正文只列了量化目标和互连选项,没有跨节点实测数据。
一句话点评
两台 Strix Halo 组集群,把 128GB 统一内存翻倍到 256GB,想跑 400B 大模型的高量化版。想法直接,但网络延迟和带宽是硬伤。
锐评
Reddit 用户想用两台 AMD Strix Halo 机器组集群,把本地统一内存从 128GB 堆到 256GB,目标是跑 Minimax 2.7、GLM 4.7、GLM 5.1、Qwen 3.5 这些约 400B 参数的大模型,上更高精度的量化版本。思路挺直接:单机 128GB 不够塞 400B 模型的高量化,两台凑一起就能装下。但正文没披露实际跑起来的延迟和吞吐数据,关键瓶颈在互联:50/100GbE 网卡在 tensor parallel 下延迟可能很高,远不如单机 NVLink 或 Infinity Fabric。vLLM 的 tensor parallel 设置和 Exo 框架的支持情况也没提,实际部署坑不少。如果只是做实验验证可行性,成本比买一台 256GB 统一内存的机器低,但推理速度会打折。这点先别太激动,等有人放出 benchmark 再说。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
04:42
37d ago
TechCrunch AI· rssEN04:42 · 05·08
美国医疗还在用传真机,VC 开始投 AI 替人填表了
TechCrunch 报道,美国医疗后台还在靠传真机传单子,效率极低。一家叫 Basata 的 AI 公司专门做行政工作自动化,帮人填表、处理文书。创始人说,员工不担心被取代,更担心被活淹死。正文没披露融资金额、客户数量或产品具体怎么跑,信息缺口明显。
#Agent#TechCrunch#Basata#Funding
精选理由
HKR-H靠传真机这个奇怪但具体的钩子成立,但HKR-K和R都很弱:没融资金额、没客户数、没AI机制。当成低价值的行业报道处理,没有硬性排除理由。
一句话点评
美国医疗后台还在靠传真机传单子,效率低到离谱。AI 公司 Basata 专做行政自动化,帮人填表、处理文书。创始人说员工不担心被取代,更担心被活淹死。正文没披露融资金额、客户数量或产品具体怎么跑,信息缺口明显。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
04:12
37d ago
新智元 · 公众号· rssZH04:12 · 05·08
快手发了个打工人Agent:说人话就能生成桌面软件,跑起来不烧token
快手推出KroWork,用户用自然语言描述工作流程,它就能调用大模型规划、写代码、生成界面,最终打包成一个本地桌面应用。之后每次运行不再重复调用大模型,所以不烧token。相当于把一次性的模型调用成本换成永久可用的工具,适合重复性任务。正文没披露具体支持哪些API或能否离线运行,这点先别太激动。
#Agent#Code#Tools#Kuaishou
精选理由
HKR 三项都通过,但正文只披露了产品名和运行机制,没有说是否开放、定价、性能表现或真实任务效果。属于正常到中等的产品更新,评分合理。
一句话点评
快手出了个KroWork,用自然语言描述工作流,它就能调用大模型规划、写代码、生成界面,最后打包成桌面应用。关键是一锤子买卖:第一次跑烧token,之后每次运行都不再调用大模型,相当于把一次性的模型调用成本换成永久可用的工具。适合重复性任务,比如日报生成、数据整理。但正文没披露具体支持哪些API、能否离线运行,也没说生成的代码能不能改。如果是真的挺省钱,但先别太激动,验证信息太少。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
04:09
37d ago
r/LocalLLaMA· rssEN04:09 · 05·08
“硬件才是唯一护城河”——现在买显卡还是再等等?
Reddit 用户 Alan_Silva_TI 发帖说硬件才是 AI 的护城河,理由是 Anthropic 和 xAI 最近的动作表明推理需求会暴涨,数据中心抢卡会挤压消费级 GPU 供应。但正文没披露任何价格、时间线或跑分数据,所以这个判断目前更像一个观点,不是可执行的购买建议。如果你在纠结买不买新硬件,可以先当个信号看,别急着下单。
#Inference-opt#Anthropic#xAI#Alan_Silva_TI
精选理由
HKR-H 和 HKR-R 通过:帖子直接抛出“买还是等”的决策问题,并击中 GPU 成本焦虑。HKR-K 不通过:没有价格、供货数据或基准测试支撑,属于低价值 Reddit 闲聊。
一句话点评
观点先行,缺数据支撑,先当信号看。
锐评
Reddit 用户 Alan_Silva_TI 认为硬件才是 AI 的护城河,理由是 Anthropic 和 xAI 最近的动作表明推理需求会暴涨,数据中心抢卡会挤压消费级 GPU 供应。这个判断逻辑上说得通——推理需求上来后,算力确实可能成为瓶颈——但正文没披露任何价格、时间线或跑分数据,所以目前更像一个观点,不是可执行的购买建议。如果你在纠结买不买新硬件,可以先当个信号看,别急着下单。缺的是具体证据:比如数据中心 GPU 采购量增长多少、消费级 GPU 供应是否真的被挤压、以及新硬件跑推理的实际性价比。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
04:00
37d ago
● P1FT · 科技· rssEN04:00 · 05·08
Anthropic考虑融资交易估值接近一万亿美元
Anthropic 收到了外部投资意向,如果谈成,估值会接近 1 万亿美元,超过 OpenAI。不过这篇 FT 文章正文被付费墙挡住了,只显示了标题和导航栏,没有披露收入到底涨了多少、具体融资金额、投资人是谁、条款怎么定。所以“收入激增”这个说法暂时看不到数据支撑,先别太激动。
#Anthropic#OpenAI#Funding
精选理由
HKR全中:FT说Anthropic在考虑一笔可能让估值冲到近1万亿美元的交易,甚至超过OpenAI。我会先打个折,因为正文没披露收入到底涨了多少、谁在投、什么条件,信息缺口不小。分数留在85-94这个区间,就是因为它有猛料但缺关键数字,别太激动。
一句话点评
Anthropic 被曝在谈新一轮融资,估值可能冲到近一万亿美元,但 FT 原文被付费墙挡了,具体条款和投资人还没看到。
锐评
这条消息先打个折看。FT 的标题确实写了“near $1tn valuation”,但正文需要订阅才能读,我们看不到收入到底涨了多少、谁在领投、钱怎么花这些关键信息。另外两家中文媒体的转述提到“今夏融资数百亿美元”和“反超 OpenAI”,这些说法目前没法从 FT 原文交叉验证。一万亿美元估值是什么概念——比现在全球绝大多数上市科技巨头都高,如果成真,说明有投资人赌 Anthropic 会成为 AI 基础设施层级的公司,而不只是又一个模型厂商。但没看到具体收入数字和增长曲线之前,这个估值更像谈判桌上的开价,不是落地的价签。还缺的东西很明确:Anthropic 最新的年化收入、这轮融资的实际规模和领投方、以及钱主要投向模型训练还是推企业客户。
HKR 分解
hook knowledge resonance
打开信源
99
SCORE
H1·K1·R1
03:31
37d ago
Hacker News 首页· rssEN03:31 · 05·08
AWS弗吉尼亚数据中心故障,FanDuel和Coinbase交易中断,恢复需数小时
AWS位于弗吉尼亚的一个数据中心从周四晚上开始出现“热故障”(散热系统出问题),导致FanDuel(体育博彩)和Coinbase(加密货币交易所)的交易服务中断。AWS说恢复需要几个小时。正文没有披露具体有多少客户受影响、故障根因是硬件还是电力、以及是否有数据丢失风险。对AI从业者来说,这件事的提醒是:如果你的推理或训练任务跑在美东区域,尤其是单AZ部...
#AWS#Amazon#Incident
精选理由
标题给了事件和恢复时长,但正文没披露影响范围、故障模式或受影响服务,信息量只到标题级别。对 AI 行业来说,这是间接的可靠性警示,但缺乏具体细节,只能归到低价值通用技术类。
一句话点评
AWS弗吉尼亚数据中心因散热故障宕机,FanDuel和Coinbase交易中断,恢复需数小时。对AI从业者的提醒:推理或训练任务若依赖美东单可用区,需检查冗余设计。正文未披露根因是硬件还是电力,也未说明是否有数据丢失风险。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
03:00
37d ago
FT · 科技· rssEN03:00 · 05·08
韩国金融科技公司Toss:刷脸支付三年内取代实体信用卡
韩国金融科技公司Toss放话,三年内要让韩国人彻底扔掉实体信用卡,全面转向刷脸支付。Toss是韩国最大的移动支付平台之一,用户量超过3000万,相当于韩国一半以上人口。他们已经在便利店、咖啡店等场景铺开了人脸识别支付终端,用户注册后刷脸就能扣款,不需要掏手机或卡片。Toss CEO说,刷脸支付的体验比扫码快得多,而且能降低商户的终端成本——一台人脸识别...
#Vision#Toss#Product update
精选理由
Toss放话三年内韩国取消实体卡、全面刷脸支付,这个时间点确实有新闻性。但正文只有一句话摘要,没讲用什么识别技术、覆盖多少商户、费率多少、合规怎么走,信息量太少。对AI从业者来说,这更像一个支付行业动态,缺乏模型或安全层面的硬信息,先别太激动。
一句话点评
刷脸支付三年内取代信用卡?Toss 画了个大饼,但韩国 3000 万用户基础让这事值得看。
锐评
Toss 放话三年内让韩国人扔掉实体信用卡,全面转向刷脸支付。他们已有 3000 万用户(超韩国一半人口),在便利店、咖啡店铺开了人脸识别终端,注册后刷脸扣款,不用掏手机。CEO 说比扫码快,还能降低商户终端成本。 但正文没披露识别精度、活体检测方案、商户覆盖率、费率或合规细节。刷脸支付最大的坎是隐私和安全——人脸数据一旦泄露不可重置,韩国监管态度也未提及。三年取代信用卡更像是愿景,不是 roadmap。如果 Toss 能公开误识率、防伪方案和监管进展,这个判断才站得住。目前看,先当 PR 稿打折读。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
02:49
37d ago
Hacker News 首页· rssEN02:49 · 05·08
Mojo 1.0 Beta 发布
Mojo 语言宣布进入 1.0 Beta 阶段,但官网除了版本号外,没有透露任何新功能、兼容性、发布计划或迁移规则。对于从业者来说,这只是一个版本里程碑的确认,编译器性能或语法变化一概未知。正文未披露任何技术细节,建议观望。
#Code#Mojo#Product update
精选理由
HKR-H 和 HKR-R 通过:Mojo 1.0 Beta 对 AI 语言生态有意义。HKR-K 不通过,因为正文没有给出任何特性、兼容性或性能数据,所以分数落在 60–71 区间。
一句话点评
Mojo 1.0 Beta 只是改了个版本号,官网没提任何新功能或性能数据。
锐评
Mojo 宣布进入 1.0 Beta,但官网除了版本号,没透露任何新功能、兼容性、发布计划或迁移规则。对于从业者来说,这只是一个版本里程碑的确认,编译器性能或语法变化一概未知。正文未披露任何技术细节,建议观望。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
02:38
37d ago
r/LocalLLaMA· rssEN02:38 · 05·08
DDR6 又跳票了,商用推到 2028 年
Reddit 帖子说 DDR6 再次延期,引用了一份报告称商用时间改到 2028 年。正文只提了之前预期是 2026 年,没披露 JEDEC 的规划、带宽规格或量产条件。如果真拖到 2028,意味着当前 DDR5 的寿命会再拉长两年,对需要高带宽内存的本地大模型推理来说不是好消息。不过帖子本身信息有限,具体延期原因和官方说法都没给,这点先别太激动。
#Reddit#MSN#JEDEC#Commentary
精选理由
HKR-H和HKR-K勉强通过:2028年延期这个钩子和2026年预期对比是实打实的,但正文只是一段Reddit用户的质疑,没有JEDEC路线图、带宽规格或量产条件,信息缺口明显,判断价值有限。
一句话点评
DDR6 延期到 2028 年,DDR5 还得再撑两年。
锐评
Reddit 帖子引用了一份报告,说 DDR6 商用时间从 2026 年改到 2028 年。如果属实,意味着当前 DDR5 的寿命会再拉长两年,对需要高带宽内存的本地大模型推理来说不是好消息——带宽和容量都卡在 DDR5 的天花板上。不过帖子本身信息有限:正文只提了之前预期是 2026 年,没披露 JEDEC 的规划、带宽规格或量产条件,也没说延期原因。来源是 Reddit 和 MSN,权威性一般,这点先别太激动。缺的是官方确认和具体技术细节,比如带宽目标、功耗改进和量产时间表。如果是真的,挺省钱——不用急着升级内存架构,但也意味着本地推理的瓶颈会持续更久。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K1·R0
02:34
37d ago
Product Hunt · AI· rssEN02:34 · 05·08
Memori:让 AI 智能体记住自己干过什么,不只是聊过什么
Memori 做的是智能体(agent)的长期记忆,但记忆来源不只是对话,还包括智能体执行过的工具调用、工作流步骤、决策逻辑等 trace 数据。相当于给智能体装了一个“操作日志型记忆”,而不只是聊天记录。在 LoCoMo 基准上准确率 81.95%,每次查询只花 1294 个 token——大约是塞满全部上下文成本的 5%,也就是说推理开销能省 95...
#Agent#Memory#Memori#Product update
精选理由
这是一篇 Product Hunt 式的轻量发布,核心就一个机制亮点——从 agent trace 提记忆,比纯对话记忆更持久。但正文没披露存储机制、接口、定价和上线条件,信息缺口明显。HKR 三项都勉强过关,但证据太薄,所以分数压在 60–71 区间。
一句话点评
Memori 给智能体装了个“操作日志型记忆”——不光记对话,还记它调过什么工具、走过什么流程、做过什么决策。LoCoMo 基准 81.95% 准确率,每次查询只用 1294 token,大约是塞满全部上下文的 5%,推理开销省 95% 以上,这点挺省钱。但正文没披露存储机制、API 细节和定价,开源程度和落地门槛还不清楚。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
02:27
37d ago
r/LocalLLaMA· rssEN02:27 · 05·08
苹果芯片上跑最快的本地 AI 引擎,专为 agent 场景优化
一位开发者发布了 lightning-mlx,号称是 Apple Silicon 上最快的本地推理引擎。在 128GB 内存的 MacBook Max M5 上,Qwen3.6-27B 跑到 40.67 tok/s,Qwen3.6-35B-A3B 更是冲到 220.86 tok/s——后者每秒能吐两百多个 token,基本感觉不到延迟。目标场景是写代码...
#Agent#Code#Inference-opt#Apple
精选理由
HKR 三项都够,但这是 Reddit 自荐帖,所有 benchmark 都是作者自己跑的,没有第三方复现。对本地 agent 场景有价值,不过信源强度不够上 featured。
一句话点评
Apple Silicon 上跑 Qwen3.6-35B-A3B 能到 220 tok/s,写代码几乎无延迟。
锐评
这个 lightning-mlx 引擎在 128GB M5 Max 上把 Qwen3.6-27B 推到 40.67 tok/s,35B-A3B 混合专家版更是飙到 220.86 tok/s——每秒两百多个 token,写代码、调工具基本感觉不到卡顿。作者专门为 agent 短轮次场景优化了 prompt 拼接和 KV 缓存复用,这点先别太激动:实测只跑了单机单卡,没披露多轮对话或长上下文下的表现,也没和 llama.cpp、MLX 官方做同条件对比。正文没披露具体优化手段,只说“重写了注意力层和调度器”,可信度要打折。如果真能稳定跑满 200+ tok/s,那本地 agent 的体验会从“能忍”跳到“顺手”,但得等第三方复现。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
01:36
37d ago
r/LocalLLaMA· rssEN01:36 · 05·08
台湾 Skymizer 发布 HTX301 PCIe 推理卡:384GB 内存、240W 功耗
Skymizer 新出的 HTX301 是一张 PCIe 推理卡,塞了 384GB 内存,功耗只有 240W 左右。384GB 意味着能本地跑 70B 甚至更大参数的模型,不用拆层或量化太狠。功耗 240W 比一张 RTX 4090(450W)还低,对机房散热和电费都友好。但正文没披露用了什么芯片、内存带宽多少、价格多少、什么时候量产——这些才是决定实...
#Inference-opt#Skymizer#HTX301#Product update
精选理由
HKR 三项都过,但正文只有 Reddit RSS 摘要,给了 384GB 和 ~240W 两个数字,没有芯片架构、带宽、价格、量产时间。所以这只是一个很小的硬件更新,先别太激动。
一句话点评
384GB 内存、240W 功耗,能本地跑 70B 模型不拆层,但没带宽和价格,先别激动。
锐评
Skymizer 的 HTX301 是一张 PCIe 推理卡,塞了 384GB 内存,功耗仅 240W。384GB 意味着能本地跑 70B 甚至更大参数的模型,不用拆层或量化太狠;240W 比 RTX 4090(450W)还低,对机房散热和电费都友好。但正文没披露用了什么芯片、内存带宽多少、价格多少、什么时候量产——这些才是决定实际推理速度的关键。如果带宽低,大模型跑起来可能比预期慢很多。另外,Skymizer 是台湾公司,之前产品落地案例不多,验证程度有限。建议等带宽和价格出来再评估性价比。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
01:30
37d ago
彭博科技· rssEN01:30 · 05·08
印度投资者因本土缺乏AI概念股且回报差,转向海外市场
彭博报道,印度投资者长期以来主要投资国内市场,但现在因为本土市场缺乏AI相关公司、回报率跑输全球,开始把钱投向海外。正文没有披露具体资金流出规模、时间节点或哪些AI公司被提及,信息缺口比较明显。
#Bloomberg#Commentary
精选理由
HKR-H成立,因为“印度没有AI股票→资金出海”这个反转有信息差。HKR-K/R不成立:正文只有摘要,没给规模、时间、公司名,所以这条对AI从业者价值低,属于市场背景。
一句话点评
印度投资者因本土缺AI概念股、回报跑输全球,开始转向海外市场。
锐评
彭博这篇报道点出一个趋势:印度投资者长期只买国内股票,现在因为本土市场缺少AI相关公司、回报率跑输全球,开始把钱投向海外。核心逻辑很直白——哪里能买到AI,钱就去哪里。但正文没披露具体资金流出规模、时间节点,也没说哪些AI公司被提及,信息缺口比较明显。报道本身更像一个现象观察,缺乏数据支撑,这点先别太激动。对AI从业者来说,这条新闻的启示是:AI正在重塑全球资本流向,一个市场如果没有AI标的,可能连本土资金都留不住。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
01:12
37d ago
彭博科技· rssEN01:12 · 05·08
Principal 要募 30 亿美元建两个数据中心基金,押注 AI 基建
Principal Financial Group 今年打算募 30 亿美元,成立两只数据中心基金,钱主要投美国和欧洲的数据中心。30 亿这个数字不小,说明机构资金还在往 AI 基础设施里涌。但正文没披露基金的具体条款,也没说哪些 AI 公司会是租户,所以这轮募资到底能落地多少、回报怎么算,目前还不清楚。
#Principal Financial Group#Funding
精选理由
HKR的K和R通过:故事有具体的30亿美元数据中心募资目标和AI基础设施相关性。H偏弱,且正文未披露基金条款、租户或GPU容量细节,所以分数落在60–71区间。
一句话点评
Principal 要募 30 亿美元建数据中心基金,钱不少,但租户和条款都没说。
锐评
Principal Financial Group 今年计划募 30 亿美元,成立两只数据中心基金,投向美国和欧洲。30 亿这个数字不小,说明机构资金还在往 AI 基础设施里涌,尤其是数据中心这种重资产。但正文没披露基金的具体条款,比如期限、预期回报率,也没说哪些 AI 公司会是租户。这点很关键——数据中心基金的核心是租约锁定,没有大客户承诺,募资和回报都存在不确定性。所以这轮募资到底能落地多少、回报怎么算,目前还不清楚。如果是真的,说明传统金融机构对 AI 基建的押注在加码,但信息缺口太大,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
01:05
37d ago
r/LocalLLaMA· rssEN01:05 · 05·08
Qwen3.6-35B-A3B 魔改版:Apple Silicon 上跑得快的聊天模型,但没跑分没细节
Reddit 用户 eclipsegum 推荐了一个 Qwen3.6-35B-A3B 的魔改版(Abliterated-Heretic-MLX-4bit),说它适合当通用聊天机器人,在 Apple Silicon 上跑得很快。但帖子正文被屏蔽了,看不到任何跑分、量化细节、许可证或可复现的设置。有用的信息只有两点:一是 MLX 格式意味着能在苹果芯片本地...
#Inference-opt#Qwen#Apple#eclipsegum
精选理由
HKR 的 h 和 r 过关,但 k 不达标:没有速度数据、测试环境、许可证或复现路径。这更像 LocalLLaMA 社区的一条线索,不是一次扎实的模型发布。
一句话点评
一个 Reddit 用户吹 Qwen3.6 魔改版在苹果芯片上跑得快,但帖子正文被屏蔽,没跑分没细节,信源价值极低。
锐评
这条 Reddit 帖子来自用户 eclipsegum,推荐 Qwen3.6-35B-A3B 的魔改版(Abliterated-Heretic-MLX-4bit),声称适合当通用聊天机器人,在 Apple Silicon 上跑得快。但正文被 Reddit 屏蔽(403 错误),看不到任何跑分、量化细节、许可证或可复现设置。唯一有用信号是 MLX 格式意味着能在苹果芯片本地推理,但速度多快、效果如何全凭一张嘴。没有对比基线、没有样本量、没有延迟数据,连模型权重来源都没披露。对于 AI 从业者来说,这条信息只能当个线索:有人在做 Qwen3.6 的苹果端优化,但具体效果需要自己实测。正文没披露任何可验证指标,建议直接忽略主观好评,等第三方跑分出来再判断。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
01:02
37d ago
Hacker News 首页· rssEN01:02 · 05·08
GPT-5.5 涨价了,但实际多花的钱没标价那么夸张
OpenRouter 分析了从 GPT-5.4 切到 5.5 的用户实际账单,发现虽然输入和输出 token 的单价都翻了一倍,但最终成本只涨了 49% 到 92%。原因是 GPT-5.5 在处理长文本(超过 1 万个 token)时,回答比 5.4 短了 19% 到 34%,省下了一部分输出费用。不过短对话就没这么幸运了,2K token 以内的请求...
#OpenRouter#Commentary
精选理由
H 和 R 通过:GPT-5.5 涨价是成本敏感话题。K 不通过:价格、计费单位、生效日期均未披露,信息量不足以进入精选。
一句话点评
OpenRouter 用真实账单算了一笔账:GPT-5.5 单价翻倍,但长文本回答变短,实际成本只涨了 49%-92%。短对话用户就没这么幸运了,涨幅最高 92%。
锐评
OpenRouter 抓了一批从 GPT-5.4 切到 5.5 的用户,对比同一批人换模型前后的实际账单。结论:单价翻倍(输入 $2.5→$5/M,输出 $15→$30/M),但长文本(>10K token)的回答变短了 19%-34%,所以最终成本只涨了 49%-92%。短对话(<2K token)回答反而长了 7%,成本直接涨 92%。 这个数据来自 OpenRouter 自己的请求日志,样本是纯文本请求,时间窗口是 5.4 上线前三天 vs 5.5 上线后三天。好处是真实用户真实账单,不是 benchmark 估算;缺点是样本量没披露,而且 OpenRouter 的 token 计数和 OpenAI 官方可能不一致。另外正文没披露 GPT-5.5 在短对话场景下回答变长 52%(2K-10K 区间)的原因,是模型更啰嗦了还是任务分布变了,不清楚。 对开发者来说,如果你的场景是长文档总结、代码生成这类长输入,升级 5.5 的成本涨幅可控;如果是短对话客服、聊天,成本翻倍基本跑不掉。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
00:49
37d ago
r/LocalLLaMA· rssEN00:49 · 05·08
Qwen 3.6 27B 在 2×3090 NVLink 上跑分:拓扑比卡数更重要
Reddit 用户实测 Qwen3.6-27B-AWQ-BF16-INT4 在 4×RTX 3090 上的推理速度。关键发现:用 NVLink 桥接的两张卡(TP=2)在并发数为 1 时比纯 PCIe 快 25%;并发数到 4 时,NVLink 跑到 181.9 tok/s,PCIe 只有 119.2 tok/s,而四卡全开(TP=4)反而只有 127...
#Inference-opt#Benchmarking#Qwen#NVIDIA
精选理由
一个Reddit用户的单次硬件测试,样本有限,但第一手实测数字和反直觉结论(2卡NVLink胜4卡全开)让这条值得关注。正文没披露功耗、温度或长时间稳定性,验证偏弱。
一句话点评
NVLink 在并发高时优势明显,但 TP=4 反而比 TP=2 慢,说明拓扑比卡数更重要。
锐评
Reddit 用户实测 Qwen3.6-27B 在 4×RTX 3090 上的推理速度,核心发现:NVLink 桥接的两张卡(TP=2)在并发数为 1 时比纯 PCIe 快 25%;并发数到 4 时,NVLink 跑到 181.9 tok/s,PCIe 只有 119.2 tok/s。有意思的是,四卡全开(TP=4)反而只有 127.9 tok/s,说明多卡通信开销抵消了算力增长。测试环境是 vLLM 0.20.1、CUDA 12.8,输入 1024 token 输出 256 token。这个结果对自建推理集群有参考价值:如果并发请求多,优先组 NVLink 对子,而不是堆更多卡。不过正文没披露功耗和温度,也没说量化精度对速度的影响,实际部署还得自己跑一遍。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
00:18
37d ago
彭博科技· rssEN00:18 · 05·08
黄仁勋:如果特朗普邀请,我愿意一起去中国
英伟达CEO黄仁勋表示,如果收到邀请,他愿意加入特朗普即将进行的中国之行。目前他还没收到正式邀请,正文也没透露具体日期、代表团名单或议程。
#Nvidia#Jensen Huang#Donald Trump#Policy
精选理由
彭博社的消息源权威,英伟达与中国政策的相关性也高,但文章只说了黄仁勋愿意去且没被邀请。没有议程、政策变化或交易细节,信息缺口明显,暂时没有实质动作。
一句话点评
黄仁勋表态愿随特朗普访华,但还没收到邀请。
锐评
黄仁勋公开说,如果特朗普邀请,他愿意加入访华团。目前只是口头表态,没有正式邀请,也没有具体日期、代表团名单或议程。这条新闻的信息量其实很少,更像一个试探性信号。 关键看两点:一是特朗普团队是否真的会带科技企业高管访华,二是英伟达对华芯片出口限制的走向。黄仁勋此前多次强调中国市场的重要性,这次表态可以理解为在政策不确定性中主动释放善意。但正文没披露任何实质进展,连“是否已与白宫沟通”都没提,所以这点先别太激动。 如果成行,这将是中美科技高层罕见的高级别接触,对AI芯片、半导体设备等领域的政策预期会有直接影响。但目前信息缺口太大,连代表团规模、议题范围都没有,只能当作一个政治姿态来读。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
00:00
37d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·08
Chrome 静默推送 4GB AI 模型:一个更自洽的商业解释
Chrome 147 未经用户同意向约 5 亿台设备静默下载了 4GB 的 Gemini Nano 本地模型,删了还会自动重装,唯一关闭入口藏在 chrome://flags 里。Google 官方说是为了端侧推理保护隐私,但文章指出这个解释有漏洞:AI Mode 按钮是混合调用,部分请求仍会发到云端,用户根本不知道自己的数据去了哪。作者提出一个更自洽...
#Inference-opt#Chrome#Gemini Nano#Commentary
精选理由
核心卖点是“5亿设备静默推送4GB模型”这个反直觉的钩子,H/K/R都过了。但正文自己承认这个推送是推测性的,4GB模型的具体参数、版本号、以及有没有回传数据都没披露,所以信息缺口明显,不够格上精选。
一句话点评
短评:Google 给 5 亿台 Chrome 静默塞了个 4GB 模型,删了还自动重装。说是为了隐私,但 AI Mode 按钮却混合调用云端。作者猜它可能是个本地数据预处理管道:过滤噪声、提取标签再传回,绕过隐私合规。如果是真的挺省钱,但正文没披露模型版本和传输机制,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
2026-05-07 · 星期四2026年5月7日
23:49
37d ago
AI HOT 精选· aihot-apiZH23:49 · 05·07
Claude Code v2.1.133 更新:新增三个配置项,修复并行会话死锁
Anthropic 发布了 Claude Code 的 v2.1.133 版本,主要加了三个配置项和一堆修复。新增的配置包括 worktree.baseRef(指定 Git 工作树的基础分支)、sandbox.bwrapPath(自定义沙箱路径)和 parentSettingsBehavior(控制子进程是否继承父配置)。修复方面,解决了并行会话死锁、...
#Code#Agent#Tools#Anthropic
精选理由
HKR-K/R 通过:三个新配置项和死锁、代理失效、VSCode 错误修复,对日常使用者有价值。HKR-H 不通过:这只是一个小版本补丁,不是模型或核心能力发布,标题吸引力弱。正文没披露新配置的具体用法和修复细节,信息量有限。
一句话点评
Claude Code v2.1.133 是个小版本,加了三个配置项:worktree.baseRef 指定 Git 工作树的基础分支,sandbox.bwrapPath 自定义沙箱路径,parentSettingsBehavior 控制子进程是否继承父配置。修复了并行会话死锁、代理失败和 VSCode 扩展报错。 对日常用户影响不大,主要是给团队协作和沙箱隔离场景用的。正文没披露性能提升...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H0·K1·R1
23:25
37d ago
AI HOT 精选· aihot-apiZH23:25 · 05·07
OpenAI 发布 GPT-Realtime-2 语音应用提示指南
OpenAI Devs 发布了针对 GPT-Realtime-2 的提示指南,专门给语音应用开发者用。指南讲了怎么调推理强度(让模型多想或少想)、写前导说明(开场白)、设计工具调用行为、处理听不清的音频、准确抓取实体信息,以及在长对话里保持状态。正文没披露具体参数或定价,但如果你在做语音助手,这份指南能省不少试错时间。
#Audio#Tools#Reasoning#OpenAI
精选理由
HKR-K 和 HKR-R 通过:GPT-Realtime-2 指南给出了语音应用可复用的提示机制。HKR-H 偏弱,且正文未披露参数、价格或能力变化,因此归为实用更新档位。
一句话点评
OpenAI 发了 GPT-Realtime-2 的提示指南,专治语音应用开发里的坑:怎么调推理强度(让模型多想或少想)、写开场白、处理听不清的音频、抓实体、保持长对话状态。正文没披露具体参数或定价,但如果你在做语音助手,这份指南能省不少试错时间。短评:官方补课,省得自己踩坑。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
23:20
37d ago
AI HOT 精选· aihot-apiZH23:20 · 05·07
Grok语音助手能处理复杂客服流程
xAI 发了条推,说 Grok Voice Think Fast 1.0 能搞定复杂客服场景,比如嘈杂环境下的多步骤故障排查和频繁调用工具。但正文没披露延迟、准确率和价格,所以实际好不好用、贵不贵还不清楚。
#Agent#Audio#Tools#xAI
精选理由
HKR 三项都过,因为 xAI 的语音助手更新给出了具体的复杂工作流条件(嘈杂环境、多步骤排障、高频工具调用),不是画饼。但正文没披露延迟、准确率或价格,验证力度不够,所以分数压在 60–71 区间。
一句话点评
xAI 说 Grok 语音助手能处理嘈杂环境下的多步骤客服流程,还频繁调工具。但没披露延迟、准确率和价格,实际好不好用、贵不贵都不清楚。如果是真的,挺省钱,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
23:13
37d ago
r/LocalLLaMA· rssEN23:13 · 05·07
MiniMax M2.7 的混合精度量化版,74GB 硬盘占用
JANGQ-AI 放出了 MiniMax M2.7 的混合精度量化版,硬盘占用 74GB。正文没披露具体量化方案、精度损失或推理硬件需求,所以暂时没法判断实际效果。如果你手头有 80GB 以上显存的卡,可以自己拉下来跑跑看。
#Inference-opt#JANGQ-AI#MiniMax#Hugging Face
精选理由
74GB 的 MiniMax M2.7 量化版对本地部署用户有吸引力,但正文只给了 Reddit 和 Hugging Face 链接,没披露量化方法、精度损失或推理硬件条件。信息缺口太大,只能算低价值更新,分数压在 52 合理。
一句话点评
MiniMax M2.7 的混合精度量化版,硬盘占用 74GB,但没披露精度损失和推理硬件需求。
锐评
JANGQ-AI 放出了 MiniMax M2.7 的混合精度量化版,硬盘占用 74GB。这个体积意味着它可能适合 80GB 以上显存的显卡(如 A100/H100)本地运行,但正文没披露具体量化方案(比如是 4-bit 还是混合精度)、精度损失多少,也没说推理需要多大显存。所以暂时没法判断实际效果——可能跑得动但质量打折,也可能需要双卡。如果你手头有 80GB 以上显存的卡,可以自己拉下来跑跑看,否则建议等更详细的评测。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R1
23:06
37d ago
r/LocalLLaMA· rssEN23:06 · 05·07
i5-14400F + RTX 4060 跑 Qwen 35B 模型,输出速度 30 token/s 算快吗?
Reddit 用户问怎么让 llama-server 跑得更快。配置是 i5-14400F、32GB DDR4、RTX 4060,跑 Qwen3.6-35B-A3B 的 GGUF 量化版,当前输出速度 30 token/s,预填充 500 token/s,开了 65535 上下文、-ngl 999(尽量把层塞进显存)、连续批处理和 Flash Atte...
#Inference-opt#Reddit#Qwen#Claude
精选理由
HKR-K 和 HKR-R 勉强过关,因为帖子给出了硬件和吞吐量数字。没有修复方案、量化对比或延迟曲线,所以这仍是低价值闲聊而非新闻。
一句话点评
30 token/s 对 35B 模型来说其实不慢,但显存可能已经爆了。
锐评
用户用 RTX 4060(8GB 显存)跑 Qwen3.6-35B-A3B 的 GGUF 量化版,30 token/s 的输出速度对 35B 参数模型来说已经算不错了——这得益于 MoE 架构只激活 3B 参数。但 65535 上下文窗口和 -ngl 999(尽量把层塞进显存)很可能导致显存溢出,触发 CPU offloading 拖慢速度。正文没披露显存占用和具体量化精度(如 Q4_K_M 还是 Q8_0),也没说延迟曲线。想提速可以:降低上下文长度、用更小的量化(如 Q4_K_M)、或者关掉连续批处理减少显存争抢。如果是单用户场景,30 tps 已经够用,不用太纠结。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R1
23:00
37d ago
AI HOT 精选· aihot-apiZH23:00 · 05·07
GitHub 给 PR 上的 Agent 工作流省 Token,但没公布省了多少
GitHub 在每次 Pull Request 都会跑 Agent 工作流(让模型进业务流程干活),发现有些步骤 Token 消耗太高,于是专门写了一个优化 Agent 来砍成本。正文没披露具体省了多少 Token、用了哪个模型、基线是多少,也没给可复现的配置。做法是监控线上流程,找出低效环节,再让一个专用 Agent 去修。思路对,但缺关键数字,没法...
#Agent#Inference-opt#GitHub#Product update
精选理由
GitHub 在自家 PR 智能体工作流里抓低效环节,专门造了个优化智能体来省 Token 钱。方向对,但正文没披露省了多少、调了哪个模型、Token 基线是多少,也没给复现配置。信息缺口太大,够不上精选。
一句话点评
GitHub 给每次 PR 都跑 Agent 工作流(让模型进业务流程干活),发现 token 烧得太快,于是写了个专用 Agent 来砍成本。思路是监控线上流程、找出低效环节、让另一个 Agent 去修。正文没披露省了多少 token、用了哪个模型、基线是多少,也没给可复现配置。方向对,但缺关键数字,没法判断是真省钱还是公关叙事。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
22:50
37d ago
r/LocalLLaMA· rssEN22:50 · 05·07
ZAYA1-74B-Preview:用AMD集群训了个74B模型,但细节基本没提
Zyphra放出了ZAYA1-74B-Preview,标题说是在AMD上做的预训练。74B参数规模不算小,如果AMD集群能稳定跑通这个量级的训练,对想绕开NVIDIA的团队是个好消息。但正文几乎没披露任何关键信息:用了什么数据集、多少张卡、训了多少token、花了多少钱、模型用什么协议发布,全都没说。最核心的“AMD训练栈能不能复现”也没提。所以这条消...
#Zyphra#AMD#Research release
精选理由
HKR 三项都是弱正面:74B 跑在 AMD 上确实有话题、有数字、能引起从业者共鸣。但正文只有 Reddit RSS 片段,没给训练集、加速卡型号、token 数、成本或权重许可,信息缺口太大,只能放在低价值区间的上沿。
一句话点评
标题说在AMD上训了74B模型,但正文啥都没披露,等于只放了个标题。
锐评
Zyphra 放了个 ZAYA1-74B-Preview,标题最值钱:74B 参数在 AMD 集群上跑通预训练。如果属实,对想绕开 NVIDIA 的团队是个信号——AMD 生态至少能撑起这个量级。但正文几乎为零:没提用了多少张卡、训了多少 token、花了多少钱、数据集是什么、模型用什么协议发布。最关键的“AMD 训练栈能不能复现”也没说。所以这条消息目前只能当“有人声称做到了”来听,不能当技术参考。如果后续补上 token 效率、成本对比和硬件配置,才有实际价值。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
22:39
37d ago
r/LocalLLaMA· rssEN22:39 · 05·07
有人攒了台 2.3TB 内存的本地集群,自称集齐了无限宝石
Reddit 用户 Street-Buyer-2428 晒了一台本地集群:2.3TB 内存、400 多个 vCores,计划用 Blackwell 做 prefill(首 token 生成),再通过 RDMA 连到 studio mesh 做 decode(续写)。内存和核心数确实大,但正文没披露用了多少张 GPU、实际吞吐多少,也没给可复现的配置清单...
#Inference-opt#Tools#Street-Buyer-2428#Blackwell
精选理由
HKR 三项全过,因为这是一套具体的本地推理集群方案,能引发 DIY 社区共鸣。重要性压在 60–71 区间,因为 GPU 数量、实际吞吐和可复现配置都没披露,信息缺口明显。
一句话点评
2.3TB 内存、400+ vCores,但没提 GPU 数量和实际吞吐,配置清单也不完整。
锐评
Reddit 用户 Street-Buyer-2428 晒了一台本地集群,内存 2.3TB、vCores 超过 400 个,计划用 Blackwell 做 prefill(首 token 生成),再通过 RDMA 连到 studio mesh 做 decode(续写)。内存和核心数确实大,但正文没披露用了多少张 GPU、实际吞吐多少,也没给可复现的配置清单。这种规模如果跑大模型推理,prefill 阶段可能快,但 decode 的延迟和带宽瓶颈未知。另外,Blackwell 和 studio mesh 的具体型号、网络拓扑都没说,验证成本很高。对于想抄作业的从业者,信息缺口太大,只能当个概念参考。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
22:39
37d ago
彭博科技· rssEN22:39 · 05·07
谷歌垄断案:法官驳回暂停数据共享令,上诉期间照常执行
联邦法官拒绝了Alphabet(谷歌母公司)在反垄断上诉期间暂停搜索数据访问令的请求。这意味着谷歌必须继续向竞争对手开放搜索数据,不能等上诉结果出来再执行。正文没披露具体要开放哪些数据、涉及哪些对手、以及执行时间表,所以实际影响范围还不清楚。
#Alphabet#Google#DOJ#Policy
精选理由
HKR-K和R通过,H不通过:这是一条Google搜索反垄断的程序性进展。搜索数据开放令对平台竞争有实质影响,但正文没交代数据范围、时间表和具体对手,信息缺口明显,所以落在60–71分区间。
一句话点评
法官驳回了谷歌在上诉期间暂停执行数据开放令的请求,谷歌得继续向对手开放搜索数据。
锐评
联邦法官明确拒绝谷歌在上诉期间暂停执行搜索数据开放令,意味着反垄断补救措施不会因上诉而推迟。谷歌必须继续向竞争对手开放搜索数据,不能等上诉结果出来再执行。这对依赖搜索数据的AI公司和搜索引擎厂商是短期利好,但正文没披露具体开放哪些数据、涉及哪些对手、以及执行时间表,所以实际影响范围还不清楚。Bloomberg来源可靠,但信息缺口明显——没有数据量级、开放方式(API还是原始数据)、以及是否包含用户行为信号等关键细节。这点先别太激动,等具体执行方案出来再评估对搜索生态的实际冲击。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
22:00
37d ago
彭博科技· rssEN22:00 · 05·07
软银股价能不能继续涨,全看OpenAI能不能帮它把账做平
软银这一波股价上涨,下周就要面对一次关键考验——市场要看它投OpenAI那几百亿美元到底值不值。投资者想要的是软银能拿出证据,证明这笔投资不会把资产负债表拖垮。但正文没披露软银具体持有多大的OpenAI股份,也没给出任何财务指标或下周要公布什么事件。简单说,软银的AI赌注能不能撑住股价,现在还缺硬数据。
#SoftBank#OpenAI#Funding#Commentary
精选理由
彭博的权威性加分,但事实信息太薄:软银股价涨、OpenAI敞口、投资者施压,就这三条。HKR的h和r过关,k不达标,所以这条有意思但不够头条。
一句话点评
软银股价下周面临考验,市场要看它投OpenAI的几百亿值不值。
锐评
软银这一波股价上涨,下周就要面对一次关键考验——市场要看它投OpenAI那几百亿美元到底值不值。投资者想要的是软银能拿出证据,证明这笔投资不会把资产负债表拖垮。但正文没披露软银具体持有多大的OpenAI股份,也没给出任何财务指标或下周要公布什么事件。简单说,软银的AI赌注能不能撑住股价,现在还缺硬数据。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
21:18
37d ago
r/LocalLLaMA· rssEN21:18 · 05·07
把 AI 代理塞进终端,它能帮你跑交互式程序了
Reddit 用户 zoomaaron 花了一个月做了个开源项目 agent-sh,把 AI 代理直接嵌进 shell 里。代理能实时感知终端里发生的一切,不用你再手动复制粘贴报错信息给别的编码助手。演示里有个浮动覆盖层扩展,代理能读取终端内容并自动敲命令,适合处理交互式安装或远程 SSH 场景。项目 MIT 协议,支持本地和云端模型。注意:浮动覆盖层...
#Agent#Code#Tools#zoomaaron
精选理由
HKR 三项都过,但这是个人 Reddit 项目,正文没披露沙箱、权限流程和任务成功率,所以分数卡在 60–71 区间,不上推荐位。
一句话点评
把 AI 塞进终端,让它自己看报错、自己敲命令,省去复制粘贴的麻烦。
锐评
Reddit 用户 zoomaaron 花了一个月做了个开源项目 agent-sh,把 AI 代理直接嵌进 shell 里。代理能实时感知终端里发生的一切,不用你再手动复制粘贴报错信息给别的编码助手。演示里有个浮动覆盖层扩展,代理能读取终端内容并自动敲命令,适合处理交互式安装或远程 SSH 场景。项目 MIT 协议,支持本地和云端模型。注意:浮动覆盖层还在 example 文件夹里,属于实验功能,正文没披露沙箱或权限控制,直接让代理敲命令有安全风险,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:14
37d ago
AI HOT 精选· aihot-apiZH21:14 · 05·07
开源了一个给 AI Agent 用的网盘 NeuDrive,能自动同步记忆、技能和文件
NeuDrive 是一个专门给 AI Agent 用的网盘,能自动同步 Agent 的记忆、技能和文件,支持 Claude Code、Codex、Cursor 这些主流开发工具和网页应用。项目已经在 GitHub 开源,也提供了可以直接用的部署版本。免费版覆盖大部分场景,付费版输入优惠码“vivo50”能换三个月免费。正文没披露同步协议、权限模型和自己...
#Agent#Tools#Memory#NeuDrive
精选理由
HKR 三项都过,但这是个人开发者开源项目,正文没披露同步协议、权限模型和自托管成本,验证力度弱。按小产品更新处理:70 分,all 层级。
一句话点评
短评:Agent 专用网盘,自动同步记忆和文件,免费版够用,但同步协议和权限模型没披露。 点评:NeuDrive 定位很实用——Agent 的记忆、技能、文件自动同步,省去手动搬运。支持 Claude Code、Cursor 等主流工具,免费版覆盖大部分场景,付费码“vivo50”能换三个月免费,诚意够。但正文没披露同步协议(是 WebDAV 还是自定义?)、权限模型(多 Agent 读写...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:02
37d ago
TechCrunch AI· rssEN21:02 · 05·07
Voi 创始人新公司 Pit 拿到 a16z 领投的 1600 万美元种子轮
欧洲滑板车公司 Voi 的创始人又搞了个 AI 公司叫 Pit,a16z 领投了 1600 万美元种子轮。正文没披露产品细节、模型能力或客户数据,所以目前只能知道团队背景和融资额——1600 万在种子轮算大钱,但具体做什么还不清楚。
#Pit#Voi#a16z#Funding
精选理由
早期融资消息:K 项靠 1600 万种子轮和 a16z 领投过关;H 项偏弱,R 项缺产品、模型能力或客户数据。没有硬排除理由,但事实单薄,分数压在低位。
一句话点评
Voi创始人新公司Pit拿了a16z 1600万美元种子轮,但产品细节全没披露。
锐评
Pit是欧洲滑板车公司Voi的创始人再创业,a16z领投1600万美元种子轮。1600万在种子轮算大钱,说明a16z对团队背景很认可。但正文没披露Pit具体做什么——是AI应用、模型还是中间件?模型能力、客户数据一概不知。目前能判断的只有两点:一是斯德哥尔摩又出了一个被a16z押注的AI公司,延续了当地创业生态的热度;二是种子轮金额大不等于产品靠谱,这点先别太激动。缺的是产品形态、技术路线和首批客户信息,这些才是判断Pit是否真值得关注的关键。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
20:56
37d ago
● P1彭博科技· rssEN20:56 · 05·07
Cloudflare 宣布裁员1100人 转向AI优先运营模式
Cloudflare 计划在全球裁掉超过 1,100 个岗位,相当于每五个员工里就有一个要走人。公司把这轮裁员和转向“agentic AI-first”运营模式直接挂钩——也就是让 AI 代理接管一部分业务流程里的活。不过正文没披露具体砍掉哪些部门、什么时候执行,也没说省下来的成本目标是多少。我会先打个折:这更像是一个组织调整信号,但实际用 AI 替代...
#Agent#Cloudflare#Personnel#Product update
精选理由
Cloudflare 宣布全球裁员超 1100 人,占员工五分之一,理由是要转向 agentic AI-first 运营模式。这个信号很硬——不是用 AI 辅助现有流程,而是直接动组织架构。不过正文没给岗位分布、时间表和成本目标,所以省钱效果到底多大、裁的是哪些职能,现在全是缺口。光凭“压缩 90% Token 精度不掉”和“裁 20% 人做 AI-first”这两条,已经够上 featured,但信息密度还撑不起 P1。
一句话点评
Cloudflare 一边营收创新高,一边裁掉 20% 员工,理由是 AI 让这些岗位没必要了。这个说法先打个折,正文没披露具体哪些岗位被 AI 替代、替代到什么程度。
锐评
Cloudflare 宣布裁掉 1100 人,占员工总数五分之一,同时公司营收刚创了新高。CEO 的说法是转向“AI 优先”运营模式,AI 让部分岗位变得多余。 这个时间点很微妙:营收新高时裁员,通常说明公司想趁业绩好把成本结构调得更轻,AI 是个现成的理由。但两篇报道都没给出关键细节——到底是客服、销售、还是技术岗被砍?AI 替代是指完全自动化,还是用工具把一个人的活压成半个人的活?没有这些信息,很难判断这是真转型还是借 AI 之名做常规瘦身。 对从业者来说,这更像一个信号:上市公司开始公开把裁员和 AI 挂钩,以后这类公告会越来越多。但具体到 Cloudflare 这次,缺的信息太多,先别急着当 AI 替代人的标杆案例看。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
20:46
37d ago
r/LocalLLaMA· rssEN20:46 · 05·07
Gemma 4 26B 的 4bit 量化版来了,但暂时跑不起来
网友 catlilface69 把 Google 的 Gemma 4 26B A4B(混合专家模型,每次推理只激活 4B 参数)转成了 NVFP4 格式的 GGUF 量化版,文件体积更小,适合本地部署。但注意:目前 llama.cpp 主线还不支持这个格式,得用他提供的 Docker 镜像才能跑。测试只用了 RTX 5070Ti(12GB 显存),如果...
#Inference-opt#NVIDIA#Gemma#llama.cpp
精选理由
HKR-K/R 通过:帖子给出了一个不支持的 GGUF 路径、Docker 镜像和仅 5070Ti 的测试。HKR-H 不通过,因为这只是一个小众的打包更新,不是模型或框架发布。
一句话点评
社区把Gemma 4 26B转成NVFP4量化版,但主线llama.cpp跑不了,得用作者提供的Docker。
锐评
网友catlilface69把Google的Gemma 4 26B A4B(混合专家模型,每次推理只激活4B参数)转成了NVFP4格式的GGUF量化版,文件更小,适合本地部署。但注意:目前llama.cpp主线不支持这个格式,得用他提供的Docker镜像才能跑。测试只用了RTX 5070Ti(12GB显存),如果CPU卸载会有性能问题。正文没披露具体推理速度或显存占用对比,这点先别太激动。如果是真的,NVFP4量化能降低本地部署门槛,但兼容性差、验证弱,目前更像一个实验性玩具。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
20:25
37d ago
AI HOT 精选· aihot-apiZH20:25 · 05·07
Luma Agents:输入一句标语,自动生成广告视频
Luma Labs 发布 Luma Agents,用户只需输入一句标语并选择美学风格,系统就能自动生成对应的广告视频。正文没披露模型规格、定价和生成耗时,所以实际可用性和成本还不清楚。如果生成质量过得去,这相当于把广告创意从“写脚本+拍素材”压缩成“写一句话”,对预算有限的小团队可能挺省钱。
#Agent#Multimodal#Tools#Luma Labs
精选理由
HKR-H 和 HKR-R 通过:标语生成广告这个点有视觉冲击力,也切中创意自动化成本焦虑。HKR-K 不通过:价格、延迟、模型细节、评测全没披露,所以分数压在 60–71 区间。
一句话点评
Luma 说输入一句标语、选个风格就能自动生成广告视频。正文没披露模型规格、定价和生成耗时,所以实际可用性和成本还不清楚。如果生成质量过得去,这相当于把广告创意从“写脚本+拍素材”压缩成“写一句话”,对预算有限的小团队可能挺省钱。 短评:一句话生成广告视频,省脚本和拍摄成本,但没披露定价和耗时,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
20:19
37d ago
彭博科技· rssEN20:19 · 05·07
Block 靠 AI 裁员后上调全年利润预期
Jack Dorsey 的 Block(前 Square)在搞了一轮 AI 驱动的裁员之后,上调了全年利润和增长预期。Bloomberg 说裁员力度不小,但正文没披露具体裁了多少人、利润指引上调了多少、增长数字是多少。结论就是:公司用 AI 替代人力省成本,资本市场暂时买账,但具体省了多少、能不能持续,信息还不够判断。
#Block Inc.#Jack Dorsey#Product update#Personnel
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 缺少裁员人数、利润指引或增长数字。来源是 Bloomberg,有权威性,但这是 AI 相关的财报新闻,不是技术突破,所以分数落在 60–71 区间。
一句话点评
Block 用 AI 裁员换利润上调,但具体裁了多少、利润涨了多少都没说。
锐评
Jack Dorsey 的 Block 在搞了一轮 AI 驱动的裁员后,上调了全年利润和增长预期,资本市场暂时买账。但正文没披露具体裁了多少人、利润指引上调了多少、增长数字是多少。结论就是:公司用 AI 替代人力省成本,资本市场暂时买账,但具体省了多少、能不能持续,信息还不够判断。如果裁员规模不大,利润上调可能更多来自其他业务改善,而非 AI 降本。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
19:45
37d ago
彭博科技· rssEN19:45 · 05·07
Arm 警告手机市场疲软,Anthropic 与 SpaceX 签算力协议
Arm CEO 说手机市场还在低迷,但 AI 数据中心的需求在涨。Anthropic 跟马斯克的 SpaceX 签了算力接入协议,但正文没披露规模、价格和期限,所以这笔交易到底多大、划不划算还不好说。另外,卫星情报公司 HawkEye 360 以 4.16 亿美元 IPO 上市。
#Inference-opt#Arm#Anthropic#SpaceX
精选理由
Anthropic 找 SpaceX 买算力是个新事实,有话题性,但正文没披露规模、价格和期限,信息缺口大。Bloomberg 这期还混了 Arm 谈手机疲软和 HawkEye 360 的 IPO 募资 4.16 亿美元,内容杂,所以重要性压在 68 分,覆盖全行业读者。
一句话点评
Anthropic 找 SpaceX 买算力,但价格和规模都没说,先别太激动。
锐评
Arm CEO 说手机市场还在低迷,但 AI 数据中心需求在涨,这基本是行业共识,没什么新信息。真正值得点的是 Anthropic 跟 SpaceX 签了算力接入协议——一家 AI 公司找火箭公司买算力,说明算力紧缺到什么程度了。但正文没披露规模、价格和期限,所以这笔交易到底多大、划不划算还不好说。如果是真的,Anthropic 可能拿到了 SpaceX 星链或地面数据中心的闲置算力,成本或许比 AWS 便宜,但延迟和稳定性存疑。另外,卫星情报公司 HawkEye 360 以 4.16 亿美元 IPO 上市,这个数字不算大,说明商业遥感赛道还没到爆发期。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
19:38
37d ago
Hacker News 首页· rssEN19:38 · 05·07
南非内政部两名官员因AI“幻觉”被停职
南非内政部两名官员被停职,原因是他们起草的一份政策文件里出现了AI“幻觉”——也就是模型编造了不存在的事实。报道没说是哪个AI系统、具体编了哪些内容,也没披露调查流程和复核机制。这件事的看点在于:政府用AI写正式文件,出了错直接追责到人,而不是怪模型。如果AI输出没有人工审核流程兜底,这类事件会越来越多。
#Safety#Home Affairs#Incident
精选理由
HKR-H和HKR-R通过:停职这个处理结果很实在,直接关联AI幻觉的责任问题。HKR-K不通过:RSS摘要只说了停职两人,没有系统名称、错误细节和复核机制,信息量不够支撑知识性判断。
一句话点评
南非内政部两名官员因AI编造事实被停职,但报道没说是哪个AI系统、编了啥。
锐评
南非内政部两名官员被停职,因为他们起草的政策文件里出现了AI“幻觉”——模型编造了不存在的事实。报道没披露用的是哪个AI系统、具体编了哪些内容,也没说调查流程和复核机制。这件事的看点在于:政府用AI写正式文件,出了错直接追责到人,而不是怪模型。如果AI输出没有人工审核流程兜底,这类事件会越来越多。目前信息缺口很大:不知道是哪个模型、幻觉比例多高、文件是否已外发。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
19:36
37d ago
Hacker News 首页· rssEN19:36 · 05·07
Mozilla 说 Mythos 找到了 271 个漏洞,而且几乎没有误报
Mozilla 宣称其内部工具 Mythos 挖出了 271 个漏洞,且误报率极低。但正文只给了链接和 Hacker News 上的 39 个点赞、9 条评论,没披露漏洞类型、验证流程、影响组件或复现条件。信息缺口很大,没法判断这 271 个漏洞的严重性,也没法验证“几乎无误报”这个说法靠不靠谱。
#Code#Tools#Safety#Mozilla
精选理由
核心看点是Mythos扫出271个漏洞且误报率极低,但正文只给了URL和HN讨论,没披露漏洞分类、验证流程、受影响组件和复现条件,信息缺口太大。分数卡在60-71之间,够不上精选。
一句话点评
Mozilla 说自家工具 Mythos 挖了 271 个漏洞,几乎零误报,但正文只给了个链接和 39 个 HN 赞,信息缺口太大,先别信。
锐评
Mozilla 宣称内部工具 Mythos 挖出 271 个漏洞,且“几乎无误报”。但正文只贴了 Ars Technica 链接和 Hacker News 上的 39 个点赞、9 条评论,没披露任何漏洞类型、影响组件、验证流程或复现条件。271 这个数字看着大,但没说明严重性——是高危远程代码执行还是低危信息泄露?误报率“几乎为零”也没给具体百分比或测试集规模。来源是 Mozilla 自家宣传,缺乏第三方审计或公开 PoC。对从业者来说,这条信息目前只能当个线索,没法直接用于评估 Mythos 的实用性。想跟进的话,得等 Mozilla 放出详细报告或独立验证结果。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:26
37d ago
● P1The Verge · AI· rssEN19:26 · 05·07
SpaceX 计划在得州投资逾 550 亿美元建设芯片工厂
SpaceX 在奥斯汀的“Terafab”芯片工厂计划投资至少 550 亿美元,一份听证会文件显示后期总投资可能拉到 1190 亿美元。马斯克 3 月说过目标是年产能支撑 200GW 算力的芯片,但正文没披露具体用哪种制程工艺。
#Inference-opt#SpaceX#Elon Musk#The New York Times
精选理由
这条消息的钩子就是 SpaceX 跨界造芯片,数字大得离谱,所以 HKR 全中。我会先打个折:正文没披露工艺节点、时间表和已签约客户,没法判断是动真格还是画饼。550 亿到 1190 亿的投资区间,以及 200GW 算力目标,如果是真的挺省钱——但前提是得先有厂、有客户、有产能爬坡,这些信息目前全是缺口。
一句话点评
SpaceX 要在得州砸 550 亿美元建芯片厂,但这是申请税收减免的预估上限,实际花多少、能不能成还两说。
锐评
SpaceX 向得州格里姆斯县提交了一份税收减免申请,计划在当地建一座叫“Terafab”的芯片制造厂。文件里写的总投资上限是 1190 亿美元,但第一阶段预估投入是 550 亿美元。这个数字是公司自己报的,目的是争取税收优惠,不是已经落地的投资额,我会先打个折看。 马斯克的说法是,现有的芯片厂产能跟不上他旗下公司(SpaceX、xAI、特斯拉)对 AI 和机器人的需求,所以必须自己造。工厂定位是“垂直整合”,也就是从设计到制造一条龙全包,目标未来年产芯片能提供 1 太瓦的算力。英特尔也被拉了进来,负责提供制造技术。 目前公开信息只有这份申请文件,没有披露资金来源、技术路线、建设时间表,也没有第三方验证。550 亿美元是什么概念——差不多是台积电一年资本开支的 1.5 倍。如果是真的,确实挺省钱(省去了外购芯片的溢价),但前提是 SpaceX 能搞定芯片制造这个极其烧钱、技术壁垒又高的行当。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
19:21
37d ago
Hacker News 首页· rssEN19:21 · 05·07
Dirtyfrag:通用Linux本地提权漏洞公开披露
安全研究员公开了一个叫 Dirty Frag 的本地提权漏洞,影响所有主流 Linux 发行版。它把两个内核漏洞串起来用,攻击者只要能在机器上跑代码就能直接拿到 root 权限。作者说影响范围和之前的 Copy Fail 差不多。因为保密期被提前打破,目前没有任何官方补丁或 CVE 编号。临时缓解办法是禁用 esp4、esp6 和 rxrpc 这三个内...
#Linux#Openwall#Hacker News#Incident
精选理由
硬排除的技术可及性失败:这是一个 Linux 本地提权线索,但没给受影响版本、复现条件或补丁状态。AI 相关性仅限于基础设施安全,所以 35 分。
一句话点评
Dirty Frag 是一个通用 Linux 本地提权漏洞,组合了两个内核漏洞,影响所有主流发行版。由于披露流程被打破,目前没有补丁和 CVE 编号。官方给出的缓解措施是禁用 esp4、esp6 和 rxrpc 三个内核模块。漏洞利用代码已公开,可覆盖 /usr/bin/su 文件写入一个 192 字节的 root shell ELF。正文没披露漏洞被利用的活跃程度,但 PoC 已出,风险很高。
HKR 分解
hook knowledge resonance
打开信源
47
SCORE
H1·K0·R1
19:06
37d ago
TechCrunch AI· rssEN19:06 · 05·07
Bumble 要取消左滑右滑,CEO 说靠 AI 来配对
Bumble 的 CEO 宣布将移除传统的滑动匹配机制,转向 AI 驱动。公司正在开发一个叫 Bee 的 AI 约会助手,CEO 曾称 AI 会是“爱情的超强加速器”。但正文没披露 Bee 的上线时间、具体功能或收费方式,目前只是方向性表态。
#Agent#Bumble#Whitney Wolfe Herd#Bee
精选理由
H 和 R 通过:Bumble 取消滑动是个强产品钩子,也引出了 AI 代理改变用户体验的问题。K 偏弱:文章只给了 Bee 的方向,没有机制、时间或商业条款,所以分数落在 60–71。
一句话点评
Bumble 要砍掉左滑右滑,改让AI帮你挑对象。
锐评
Bumble CEO 宣布要砍掉经典的左滑右滑匹配,转向 AI 驱动。公司正在做的 AI 约会助手叫 Bee,CEO 曾放话 AI 会是“爱情的超强加速器”。但正文只给了方向,没披露 Bee 什么时候上线、具体能干什么、怎么收费——目前就是个表态。如果 Bee 真能根据用户偏好自动筛选和发起对话,确实能省掉大量手动刷人的时间,对用户留存和匹配效率都是好事。但这点先别太激动:AI 约会助手之前也有产品试过,效果参差不齐,核心难点在于模型能不能理解真实的人类暧昧信号,而不是简单按标签匹配。正文没披露 Bee 的推荐逻辑、隐私方案或任何实测数据,验证还很弱。Bumble 股价之前承压,这个方向性喊话更像给市场画饼,实际落地还得看后续产品细节。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
18:20
37d ago
● P1彭博科技· rssEN18:20 · 05·07
Apple 配摄像头 AirPods 进入后期开发测试阶段
彭博社拿到消息,苹果把带摄像头的 AirPods 推进到了后期开发阶段。这可能是苹果第一款明确为 AI 场景设计的穿戴设备,但报道没公布摄像头具体参数、工作原理和发布时间。我会先打个折:目前只有进度信息,产品能不能落地、怎么用 AI 都还是未知数。
#Vision#Multimodal#Apple#Product update
精选理由
消息来自彭博,加上带摄像头的 AirPods 这个设定,H、K、R 都站得住。分数定在 72–77 区间,是因为只说了后期测试,没给规格、没讲 AI 怎么跑、也没提什么时候发,信息密度有限。
一句话点评
苹果带摄像头的 AirPods 已进入量产前的 DVT 测试,但别急着下单——它主要靠红外摄像头给 AI 当“眼睛”,不是用来拍照的。
锐评
这条消息的核心是:苹果把 AirPods 做成了 AI 的传感器。耳机上装的不是常规摄像头,而是红外摄像头,用来感知周围环境,再配合新 Siri 做实时信息处理。Bloomberg 说产品已进入 DVT(设计验证测试)阶段,这是量产前的最后几道关卡之一,说明硬件方案基本定型了。 但文章没提电池能撑多久、红外摄像头在强光下效果如何,也没说这功能是本地跑还是依赖手机。这些直接决定它到底是“有用的 AI 耳朵”还是“又一个小众实验品”。另外,最快 9 月亮相的说法来自供应链推测,苹果自己没确认,时间上可以先打个折。 对从业者来说,这代表苹果在 AI 可穿戴上的路线选择:不做眼镜,先改造耳机。如果跑通,会推动一波“耳机+传感器+端侧模型”的落地尝试。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
18:13
37d ago
r/LocalLLaMA· rssEN18:13 · 05·07
怎么把 PDF 喂给 Gemma-4?Reddit 用户问了一圈没标准答案
有人在 Reddit 问怎么把 PDF(含文字、公式、表格、图片)喂给 Gemma-4。llama.cpp 几个月前就加了 PDF 支持,但只是把 PDF 当纯文本或图片处理,没有专门解析公式和表格的逻辑。帖子没给出官方 API、参数设置或可复现的工作流,所以目前没有标准做法。如果你要处理带公式和表格的 PDF,得自己搭解析管线,Gemma-4 本身没...
#Multimodal#Vision#Tools#Gemma-4
精选理由
HKR-K/R 通过:帖子点出了具体的 PDF 解析痛点,并给出了 llama.cpp 的处理细节。HKR-H 不通过:这是一个常规求助帖,正文未披露 Gemma-4 的官方接口、参数或可复现流程。
一句话点评
PDF喂给Gemma-4没有标准做法,得自己搭管线。
锐评
有人在Reddit问怎么把带公式、表格、图片的PDF喂给Gemma-4。llama.cpp几个月前就加了PDF支持,但只是当纯文本或图片处理,没有专门解析公式和表格的逻辑。帖子没给出官方API、参数设置或可复现的工作流,所以目前没有标准做法。如果你要处理带公式和表格的PDF,得自己搭解析管线,Gemma-4本身没内置PDF解析器。正文没披露任何实测效果或性能数据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K1·R1
17:46
37d ago
AI HOT 精选· aihot-apiZH17:46 · 05·07
Replit 安全中心2.0:批量管理应用安全,Agent 自动修漏洞
Replit 发布了安全中心2.0,主要功能是让开发者批量查看和管理自己所有 Replit 应用的安全状态。亮点是能一键标记高风险应用,并用 Agent 在几秒内自动修复关键漏洞,还能批量通知应用所有者或直接下架。另外支持导出 SBOM(软件物料清单),方便对接外部安全工具。正文没披露这个功能覆盖多少应用、具体定价以及上线范围,所以实际能管多大规模还不清楚。
#Agent#Tools#Safety#Replit
精选理由
HKR 三项都过,但只是 Replit 安全中心 2.0 一个产品更新。覆盖多少应用、怎么定价、哪些地区上线,正文都没说,所以压在 60–71 这个区间。
一句话点评
Replit 安全中心2.0 让开发者批量管理所有应用的安全状态,亮点是用 Agent 几秒自动修关键漏洞,还能一键下架或通知所有者。支持导出 SBOM 对接外部工具。正文没披露覆盖应用数、定价和上线范围,实际能管多大规模还不清楚。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
17:43
37d ago
AI HOT 精选· aihot-apiZH17:43 · 05·07
Gemini 3.1 Flash Lite 上线 OpenRouter,百万上下文只要 0.25 美元
Google DeepMind 的 Gemini 3.1 Flash Lite 今天在 OpenRouter 上架。它支持文本、图片、视频、音频和 PDF 转文字,上下文窗口拉到 100 万 token(相当于一次塞进好几本书)。价格很便宜:输入每百万 token 0.25 美元,输出每百万 1.5 美元。另外 OpenRouter 新加了一个 ser...
#Multimodal#Vision#Audio#OpenRouter
精选理由
这是OpenRouter上架更新,不是Google DeepMind原生发布。具体价格、百万上下文和service_tier参数让这条消息有用,但属于小版本更新,所以落在60–71分区间。
一句话点评
短评:百万上下文+多模态,价格确实低,但延迟和效果未知,先别急着换。 点评:Google DeepMind 的 Gemini 3.1 Flash Lite 今天在 OpenRouter 上架,主打便宜和大胃口:输入每百万 token 0.25 美元,输出 1.5 美元,比很多模型便宜一个量级。上下文窗口拉到 100 万 token,能一次塞进好几本书,还支持文本、图片、视频、音频和 PDF...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:27
37d ago
FT · 科技· rssEN17:27 · 05·07
IMF警告:新AI模型可能引发金融系统级风险
国际货币基金组织(IMF)发报告说,金融机构用上新一代AI模型后,如果出现AI驱动的安全漏洞,可能造成系统性金融冲击。报告要求企业为“不可避免”的网络故障做准备。正文没披露具体是哪种模型、攻击怎么运作,也没给出可能的损失金额。
#Safety#IMF#Policy#Safety/alignment
精选理由
FT加IMF,来源权威。HKR的h和r靠“系统性金融冲击”这个框架过关,但k项扣分——正文没讲模型类型、攻击路径或量化损失,所以分数压在60–71区间。
一句话点评
IMF警告金融机构用新AI模型可能引发系统性风险,但没说是哪种模型、攻击怎么运作,也没给损失金额。
锐评
IMF这份报告的核心判断是:金融机构大规模部署新一代AI模型后,如果出现AI驱动的安全漏洞,可能造成系统性金融冲击。报告要求企业为“不可避免”的网络故障做准备。但正文没披露具体是哪种模型(比如是推理模型还是Agent)、攻击怎么运作(是数据投毒、对抗样本还是供应链攻击),也没给出可能的损失金额。这点先别太激动——没有攻击路径和损失估算,警告更像原则性表态。对AI从业者来说,值得关注的是“系统性”这个定性:如果多家机构用同一套AI基础设施(比如同一个基础模型或外挂资料库),一个漏洞就能连锁传染。但报告没提监管该怎么做,也没说现有安全测试够不够。信息缺口明显:缺模型类型、攻击场景、损失量级。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
17:03
37d ago
r/LocalLLaMA· rssEN17:03 · 05·07
DIY装机市场在缩水,因为内存太贵了
Reddit 帖子引用数据说,华硕 2025 年出货了 1500 万块主板,2026 年预计只出 1000 万块,降了三分之一。CPU 也在涨价,但帖子没披露具体涨了多少。对本地跑 AI 的人来说,硬件物料清单(BOM)的压力是实打实的——内存贵了,装机的人就少了,买来跑大模型的人更得掂量预算。正文没披露内存和 CPU 的具体涨幅,这点先别太激动。
#Asus#DigiTimes#Commentary
精选理由
HKR 三项都过:内存涨价是本地推理的成本痛点,华硕出货量从 1500 万降到 1000 万是硬数字。正文没披露 RAM、CPU 涨价幅度和统计口径,信息缺口明显,所以分数压在 60–71 区间。
一句话点评
内存涨价,DIY 装机市场凉了三分之一。
锐评
Reddit 帖子引用 DigiTimes 数据:华硕 2025 年出货 1500 万块主板,2026 年预计只出 1000 万块,降了三分之一。CPU 也在涨,但正文没披露具体涨幅。对本地跑 AI 的人来说,硬件物料清单(BOM)的压力是实打实的——内存贵了,装机的人就少了,买来跑大模型的人更得掂量预算。如果是真的,这波涨价会直接推高本地推理的入门门槛。不过数据来源是 DigiTimes 的行业预测,不是华硕官方财报,且帖子本身被 Reddit 屏蔽了,原始出处无法直接验证。还缺内存和 CPU 的具体涨幅数字,以及这是短期供需波动还是长期趋势。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:03
37d ago
FT · 科技· rssEN17:03 · 05·07
老牌IT公司也想蹭AI,但正文没说是谁、卖什么、赚多少
FT一篇付费文章讲传统IT厂商(服务器、通用芯片、软件公司)正在努力让自己跟AI沾上边。文章标题挺有画面感,但正文被付费墙挡住了,看不到具体公司名字、营收数字、产品路线图或交易条款。简单说就是:老玩家不想被新贵甩开,但这条链接给不出更多干货。
#Inference-opt#Commentary
精选理由
FT 的牌子加分,H 和 R 靠“旧 IT 翻盘”这个角度勉强过关。K 直接挂掉,因为现有文本里没有名字、数字、机制或条款,纯粹是泛泛的评论,没法用。
一句话点评
付费墙挡住了,看不到具体公司、数字和产品路线图。
锐评
FT这篇讲传统IT厂商(服务器、通用芯片、软件公司)正拼命往AI上靠,标题挺有画面感,但正文被付费墙完全挡住。没有具体公司名字、营收数字、产品路线图或交易条款,信息量约等于零。老玩家不想被新贵甩开是常识,但这条链接给不出任何可验证的判断。如果你在关注传统IT转型,建议直接搜Dell、Intel、Oracle的财报或产品发布,比这篇有干货。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
16:54
37d ago
r/LocalLLaMA· rssEN16:54 · 05·07
AMD 要出插槽式 GPU,本地跑模型可能不用再折腾外接供电了
Reddit 用户发帖称 AMD 将推出 slottable GPU,链接指向一款基于 PCIe 的 Instinct 显卡。这意味着它可以直接插在主板上,不用额外供电线或外置显卡坞,对本地 LLM 玩家来说部署门槛更低。但帖子正文被屏蔽,没披露价格、显存、功耗和发布时间——这些才是决定能不能跑大模型的关键。目前信息只够确认“有这回事”,具体规格还得等官方。
#Inference-opt#AMD#The Register#Product update
精选理由
HKR-H和HKR-R成立,因为硬件角度对本地推理有实际意义,且触及替代NVIDIA的采购决策。但HKR-K不成立:正文只有一条评论和一个链接标题,没有一手规格或官方确认,来源太单薄。所以重要性55、tier all是合理的——方向对但证据不足,适合所有人扫一眼,不值得深度跟进。
一句话点评
AMD 要出插槽直插的 Instinct 显卡,不用外接供电和显卡坞,本地跑模型部署门槛更低。但帖子正文被屏蔽,价格、显存、功耗、发布时间全没披露——这些才是决定能不能跑大模型的关键。目前只能确认有这回事,具体规格等官方。
锐评
这条消息来自 Reddit 用户发帖,链接指向一款基于 PCIe 的 Instinct 显卡,标题说 AMD 要出 slottable GPU。对本地 LLM 玩家来说,直插主板、不用额外供电线和外置显卡坞,部署门槛确实更低。但帖子正文被屏蔽,关键信息全缺:价格、显存、功耗、发布时间——这些才是决定能不能跑大模型的核心。目前只能确认“有这回事”,具体规格得等官方。来源是 Reddit 用户,不是 AMD 官方,权威性打折。如果真能像普通显卡一样插上就用,对个人开发者和小团队是好事,但显存和功耗没出来前别太激动。正文没披露任何数字,没法判断性价比和实际性能。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
16:33
37d ago
r/LocalLLaMA· rssEN16:33 · 05·07
Meera:一个完全离线的 Linux 桌面助手,1.2GB 模型就能干活
开发者发布了一个叫 Meera 的 Linux Gnome 本地助手,核心是 Qwen3.5-2B-Q4_K_M 模型,只有 1.2GB,通过 llama-cpp 跑在 Vulkan 上,完全离线。它能调日历、控制系统、搜文件。关键设计是工具路由:先用一个更小的嵌入模型把候选工具和“外挂资料库”(RAG)片段筛一遍,再让主模型调用。这样 2B 模型也能...
#Agent#RAG#Tools#Meera
精选理由
H/K/R三项都达标,但这是个人项目,正文没披露用户量、可靠性测试或成熟开源信号。它更像一份可复现的本地agent配方,不是当天必须追的热点。
一句话点评
1.2GB 的本地助手,能调日历搜文件,但别指望它写代码。
锐评
Meera 是一个完全离线的 Linux Gnome 本地助手,核心是 Qwen3.5-2B-Q4_K_M 模型,仅 1.2GB,通过 llama-cpp 跑在 Vulkan 上。关键设计是工具路由:先用一个更小的嵌入模型把候选工具和“外挂资料库”(RAG)片段筛一遍,再让主模型调用。这样 2B 模型也能完成日历、系统控制、文件搜索等任务,成本极低。但正文没披露工具调用的准确率或延迟数据,2B 模型在复杂指令下的理解能力存疑。另外,它只支持 Linux Gnome 环境,Windows 和 macOS 用户暂时用不了。整体看,这是一个轻量级本地 Agent 的有益尝试,但验证还很初步。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:26
37d ago
FT · 科技· rssEN16:26 · 05·07
Meta 起诉英国通信管理局,称其罚款权“史无前例”且违法
Meta 对英国《在线安全法》发起法律挑战,核心指控是监管机构 Ofcom 的罚款权力过大且缺乏法律依据。正文未披露具体罚款上限、涉及案例数量或相关法律条款,信息缺口明显。目前只能确认这是一起科技巨头与英国监管之间的法律对抗,具体影响和风险等级尚不明确。
#Safety#Meta#Ofcom#Policy
精选理由
FT来源扎实,Meta与Ofcom的冲突让H成立;但K因为缺少法律细节而扣分;R弱在文章讲的是平台政策,不是AI产品或模型监管。
一句话点评
Meta 告英国监管罚款权过大,但正文被墙,具体罚多少、依据哪条法都没说。
锐评
Meta 对英国《在线安全法》发起法律挑战,核心指控是 Ofcom 罚款权“史无前例”且缺乏法律依据。但 FT 正文被付费墙挡住,没披露具体罚款上限、涉及案例数量或相关法律条款,信息缺口明显。目前只能确认这是一起科技巨头与英国监管之间的法律对抗,具体影响和风险等级尚不明确。对 AI 从业者来说,这事可能影响未来模型在英国的部署合规成本,但正文没给细节,暂时没法判断 Meta 胜算或罚款对业务的实际冲击。建议等 Ofcom 回应或法院文件公开后再评估。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H1·K0·R0
16:16
37d ago
AI HOT 精选· aihot-apiZH16:16 · 05·07
NBC报道Suno短信转歌功能走红
NBC新闻刚报道了Suno的一个新玩法:把短信聊天记录直接转成歌,正在社交媒体上病毒式传播。正文只给了一个NBC视频链接,没披露用户量、生成机制或Suno的具体参数,所以不清楚是免费功能还是付费玩法,也不确定生成一首歌要多久。
#Audio#NBC News#Suno#Commentary
精选理由
HKR-H靠“短信转歌”这个玩法过关,但HKR-K和HKR-R都不行:全文只指向一条NBC视频,没有规模、机制或可复现的细节。当成一条信息量很薄的媒体转载处理。
一句话点评
Suno 把短信聊天记录直接转成歌,NBC 刚报道了这波病毒式传播。正文只给了一个视频链接,没披露用户量、生成时长或是否免费,所以先别太激动。如果真能秒级生成且音质不崩,这玩法比写 prompt 门槛低得多,适合社交裂变。但信息缺口太大:Suno 没公布参数,不清楚是免费功能还是付费玩法,生成一首歌要多久也没说。建议等实测或官方数据再判断。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
16:12
37d ago
AI HOT 精选· aihot-apiZH16:12 · 05·07
AI 助手一键生成 70 多种公众号排版风格
这个 AI 助手能根据 Design md 参考,直接生成公众号文章的 CSS 排版,支持 70 多个知名网站的风格。你告诉它想要哪种风格,它就能自动套用。不过原文没透露这个 Agent 的具体实现、生成质量如何,也没说测试环境,所以实际效果得自己试。
#Agent#Code#VoltAgent#Product update
精选理由
一个开源小工具/资源:公开了70多种参考排版样式,但Agent设计、输出质量和可复现测试都没提。HKR-H和弱HKR-K通过,HKR-R不通过。
一句话点评
一个Agent能直接套70多种公众号排版风格,省了手动调CSS的功夫。但正文没披露生成质量、测试环境,实际效果得自己试。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K1·R0
16:05
37d ago
TechCrunch AI· rssEN16:05 · 05·07
Anthropic 的 Mythos 帮 Firefox 挖出一堆高危漏洞
Mozilla 安全团队说,Anthropic 的 Mythos 模型在 Firefox 里找到了多个高危 bug。正文没披露具体数量、复现步骤、修没修,也没说 Mythos 是怎么工作的。
#Agent#Code#Safety#Anthropic
精选理由
TechCrunch 报道加上 Anthropic 和 Firefox 的安全合作,H 和 R 都成立。K 不成立是因为正文信息缺口太大——没给漏洞数、复现步骤、修复状态和 Mythos 机制,所以分数压在 60–71 区间。
一句话点评
Anthropic 的 Mythos 模型在 Firefox 里挖出多个高危 bug,但具体数量、复现步骤和修复情况都没说。
锐评
Mozilla 安全团队说 Anthropic 的 Mythos 模型在 Firefox 里找到了多个高危 bug,但正文没披露具体数量、复现步骤、修没修,也没说 Mythos 是怎么工作的。这相当于只给了个结论,没有验证细节。如果 Mythos 真能稳定挖到浏览器级漏洞,那对安全测试自动化是个好消息——省人工、提效率。但这点先别太激动,因为 Mozilla 没公开任何可复现的证据,也没说 Mythos 是独立发现还是辅助人工。另外,Mythos 本身是闭源模型,外部无法复现实验,验证链条是断的。缺的是:漏洞编号、CVE 状态、Mythos 的召回率和误报率,以及和传统 fuzzing 工具的对比。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
16:05
37d ago
Hacker News 首页· rssEN16:05 · 05·07
Mozilla 用 Claude Mythos Preview 给 Firefox 做了一次深度安全加固
Mozilla 公开了用 Claude Mythos Preview 等 AI 模型在 Firefox 里挖到的一批潜伏安全漏洞,数量前所未有。文章列出了 12 个已修复的 bug,包括 JIT 编译优化跳过初始化、15 年历史的 <legend> 元素 bug、IPC 竞争条件导致沙箱逃逸、20 年历史的 XSLT 哈希表重入问题等。这些漏洞很多是沙...
#Code#Safety#Mozilla#Claude
精选理由
H 和 R 都够格,但 K 不通过:正文没披露加固机制、评估指标或可复现条件,只有一条链接和评论区入口。Hacker News 的 99 分和 64 条评论说明讨论热度不低,但故事本身信息量撑不起更高分,卡在 60–71 这个区间合理。
一句话点评
Mozilla 用 Claude 挖出 12 个 Firefox 潜伏漏洞,包括 15 年和 20 年历史的老 bug,但没公开具体用了多少模型算力、花了多少钱。
锐评
Mozilla 这篇博客最值钱的信息是:AI 模型(Claude Mythos Preview)真的能挖到传统 fuzzing 漏掉的深层漏洞,比如 JIT 编译优化跳过初始化、IPC 竞争条件导致沙箱逃逸、XSLT 哈希表重入问题——有些 bug 活了 15 到 20 年。文章列了 12 个已修复的 CVE,但没披露用了多少模型调用、花了多少推理成本、以及误报率。如果成本可控,这对浏览器安全是实打实的提升,因为传统 fuzzing 很难覆盖跨组件、跨进程的复杂路径。但正文没说明这些漏洞是否已有野外利用,也没给出可复现的评估基准。对于想跟进的团队,建议先关注 Mozilla 后续是否开源其 prompt 工程和过滤 pipeline。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
15:56
37d ago
Hacker News 首页· rssEN15:56 · 05·07
Chrome 删掉了“设备端 AI 不上传数据”的声明
Chrome 悄悄移除了之前声称“设备端 AI 不会向 Google 服务器发送数据”的说明。这意味着你本地的 AI 功能可能并不完全本地——至少 Google 不再承诺这一点。正文没披露具体是哪个 Chrome 版本、哪个 AI 功能、传了什么数据、以及什么时候改的。如果你在用 Chrome 的 AI 特性(比如智能选词或页面总结),这点先别太激动,...
#Inference-opt#Safety#Google#Chrome
精选理由
标题本身有隐私反转钩子,H 和 R 都成立。但正文信息严重不足——没提版本、功能名、数据类型和生效时间,K 不通过。建议等更完整的报道再深入分析。
一句话点评
Google 悄悄删了“设备端AI不上传数据”的承诺,但没说哪个功能、传了什么、何时改的。
锐评
Chrome 移除了“设备端 AI 不会向 Google 服务器发送数据”的说明。这意味着你本地的 AI 功能可能并不完全本地——至少 Google 不再承诺这一点。正文没披露具体是哪个 Chrome 版本、哪个 AI 功能、传了什么数据、以及什么时候改的。如果你在用 Chrome 的 AI 特性(比如智能选词或页面总结),这点先别太激动,因为信息缺口很大:没有版本号、没有功能名、没有数据类型。来源是 Reddit 用户发帖,非官方公告,可信度要打折。缺的是 Google 的官方回应、变更日志链接、以及受影响功能的清单。对于做隐私合规或依赖本地推理的团队,这是个信号:设备端 AI 的隐私承诺可能随时撤回,建议自己抓包验证流量,别只看宣传文案。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
15:40
38d ago
● P1Hacker News 首页· rssEN15:40 · 05·07
DeepSeek 4 Flash 的 Metal 本地推理引擎发布
Redis 作者 antirez 开源了一个叫 ds4 的项目,专门在 Mac(Metal 框架)上本地跑 DeepSeek 4 Flash。目前 GitHub 上 164 个星、10 个 fork,讨论热度一般。项目刚发布,正文没披露推理速度、模型规格或部署步骤,所以实际能跑多快、显存吃多少都还不清楚。如果你是 Mac 用户想本地试 DeepSeek...
#Inference-opt#DeepSeek#GitHub#Hacker News
精选理由
HKR 三项都过,但正文只披露了项目名和 Metal 本地推理这个条件。没有速度、显存占用、模型规格或安装步骤,所以只能算一个小型开源推理项目。
一句话点评
Redis 作者写了个专供 DeepSeek 4 Flash 在 Mac 上跑的推理引擎,128GB 内存能跑,但正文没给速度或显存占用数据。
锐评
antirez(Redis 创始人)放出了一个叫 ds4 的项目,是一个专门为 DeepSeek 4 Flash 模型定制的本地推理引擎,跑在苹果的 Metal 图形框架上。这意味着你可以在自己的 Mac 上运行这个模型,不用联网。项目 README 里特别提到目标硬件是 128GB 内存的 MacBook,说明这个模型对内存要求不低,不是随便一台机器就能流畅跑。 目前项目刚公开,GitHub 上只有 164 个星标,10 个复刻,2 个待合并的代码请求。但正文没披露任何性能数据,比如生成速度有多快、内存实际占用多少、跟官方推理库比有没有优势。这些关键信息缺失,现在只能把它看作一个技术极客的早期实验品。 另外,这个引擎只针对 DeepSeek 4 Flash 这一个模型,通用性为零。如果你手头正好有高配 Mac 又想折腾本地部署,可以关注;否则先别急着激动,等社区跑出实测数据再说。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
15:38
38d ago
Hacker News 首页· rssEN15:38 · 05·07
Stage CLI:把 AI 生成的代码改动拆成章节,方便人审
Stage 开源了一个命令行工具 Stage CLI,能把当前 Git 分支的改动按逻辑拆成章节,在本地浏览器里逐段审阅。它不挑 AI 编程助手,只要给个 skill 就能把 diff 切块。核心卖点是审阅结构,不是换个 diff 界面。正文没披露许可证和安装步骤,想试还得自己翻仓库。
#Agent#Code#Tools#Stage
精选理由
小团队的开源工具,HKR 三个维度都沾边:痛点真实、机制有新意、切中成本焦虑。但正文没披露许可证和安装方式,也没有用户数据或评测,信息缺口明显。属于 60-71 分的小产品更新区间,不往上调。
一句话点评
把 AI 生成的代码改动按逻辑拆成章节,在本地浏览器里逐段审阅,不挑 AI 工具。
锐评
Stage 开源了一个命令行工具,核心是把当前 Git 分支的 diff 按逻辑拆成章节,在本地浏览器里逐段审阅,而不是只给一个平铺的 diff 界面。它不挑 AI 编程助手,只要配个 skill 就能把改动切块。这点对用 Cursor、Copilot 等工具的人挺实用——AI 经常一次改很多文件,逐行看 diff 容易漏逻辑。正文没披露许可证和安装步骤,想试还得自己翻仓库。另外,工具只负责展示,不负责生成改动,所以它解决的是“审阅结构”问题,不是“改得对不对”的问题。如果团队里 AI 代码占比高,这个工具能降低 review 负担,但前提是 AI 生成的 diff 本身质量还行。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
15:23
38d ago
Hacker News 首页· rssEN15:23 · 05·07
主板销量暴跌25%以上,芯片厂把产能都拿去造AI芯片了
Tom's Hardware报道,主板销量正在崩盘,跌幅超过25%。原因是芯片厂把产能优先给了AI芯片,导致PC主板芯片组供应紧张。华硕2025年预计少卖500万块主板,技嘉、微星、华擎也都在下滑。正文没披露具体季度数据或各厂商的详细损失,但趋势很明确:AI在挤占消费级硬件的产能。对DIY玩家来说,接下来买主板可能更贵、选择更少。
#Tom's Hardware#Commentary
精选理由
HKR三项都过,但正文太薄:关键数字只出现在URL里,没有预测来源或厂商确认。这是AI供应链外溢的关联信息,不是AI行业核心事件。
一句话点评
AI 芯片挤占产能,主板销量崩了 25% 以上,华硕一家就少卖 500 万块。
锐评
Tom's Hardware 报道,芯片厂把产能优先给了 AI 芯片,导致 PC 主板芯片组供应紧张,主板销量跌幅超过 25%。华硕 2025 年预计少卖 500 万块主板,技嘉、微星、华擎也都在下滑。数字很直观:500 万块不是小数目,说明 AI 对消费级硬件的挤压已经不只是涨价,而是直接砍出货量。对 DIY 玩家来说,接下来主板选择更少、价格更高。不过正文没披露具体季度数据或各厂商的详细损失,跌幅 25% 是整体还是某区域也不清楚。另外,芯片厂到底挪了多少产能给 AI、是否长期如此,文章没展开。结论方向没问题,但缺细节支撑,建议当趋势信号看,别直接拿来做投资或采购决策。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:56
38d ago
r/LocalLLaMA· rssEN14:56 · 05·07
本地跑 35B 模型,上下文一满缓存就废,200k token 重算太慢
一位用户在本地用 llama.cpp 跑 Qwen 3.6 35B(配置:5800X、96GB DDR4、RX 6800XT),生成速度 15-22 tok/s,提示词处理能到 1000+ tps。问题出在上下文压缩上:opencode、pi、kilo 这些编程智能体在压缩超过 200k token 的上下文后,会清空整个缓存,导致必须重新处理全部提示...
#Agent#Code#Inference-opt#llama.cpp
精选理由
帖子提供了一个本地 Qwen 3.6 35B 跑 23 万上下文的真实配置和性能数据,并暴露了 opencode、pi、kilo 等工具压缩超 20 万 token 后缓存全失效、提示重算的痛点。信息具体、场景真实,但缺少已验证的修复方案、可复现步骤或权威来源,所以落在 60-71 分区间。
一句话点评
本地跑编程智能体,上下文一超200k就清缓存重算,等得心累。
锐评
一位用户在5800X+96GB内存+RX 6800XT上本地跑Qwen 3.6 35B,生成速度15-22 tok/s,提示词处理能到1000+ tps,配置算中高端。问题在于opencode、pi、kilo这些编程智能体在压缩超过200k token的上下文后,会清空整个缓存,导致必须重新处理全部提示词——即使提示词处理快,200k token重算也要等很久。核心矛盾是:本地推理的缓存机制和智能体的上下文压缩策略不兼容,压缩完等于没缓存。正文没披露这些智能体具体用了什么压缩算法(是KV cache量化还是摘要替换),也没说llama.cpp的缓存验证逻辑是否可配置。如果只是缓存被粗暴清空,那优化方向可能是让智能体在压缩时保留部分缓存,或者llama.cpp支持增量缓存更新。这点对本地跑长上下文编程任务的用户很关键,但目前没有现成解法。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
14:46
38d ago
r/LocalLLaMA· rssEN14:46 · 05·07
SurrealDB 的混合搜索方案:BM25 + HNSW 向量 + RRF 融合,专治精确术语召回
SurrealDB 团队分享了一个内部文档搜索方案:同时用 BM25(传统关键词匹配)和 HNSW(向量近似搜索),最后用 RRF(倒数排序融合)把两路结果合并。关键卖点是向量搜索经常漏掉精确术语匹配(比如 API 函数名、版本号),加 BM25 能兜底。参数给了:每路取 top 30,向量搜索的 ef 设 100,RRF 的常数分别是 60 和 80...
#RAG#Embedding#Tools#SurrealDB
精选理由
这篇来自 Reddit 的教程本身中规中矩,但作者点出了一个真实问题:开发者文档里搜技术关键词,纯向量搜索会漏。这个判断让文章从普通教程变成了有实操价值的参考。HKR-K 和 HKR-R 靠具体的检索参数和 RAG 痛点通过,HKR-H 不通过,来源是 Reddit 教程,所以分数压在 60–71 区间。
一句话点评
向量搜不到精确术语时,加个BM25兜底,方案简单实用。
锐评
SurrealDB 团队分享的内部文档搜索方案:同时跑 BM25(传统关键词匹配)和 HNSW(向量近似搜索),再用 RRF(倒数排序融合)合并两路结果。核心痛点:纯向量搜索经常漏掉 API 函数名、版本号这类精确术语,BM25 正好兜底。参数给了:每路取 top 30,向量搜索的 ef 设 100,RRF 常数分别是 60 和 80。融合直接在数据库内用 FULLTEXT、HNSW 和 search::rrf() 完成,省掉外部编排。 值得参考的是方案本身轻量,不依赖外部 reranker,适合文档站快速落地。但正文没披露评测指标(比如召回率提升多少、延迟多高),也没说 BM25 索引的构建成本和更新策略。如果数据量大或查询频繁,ef=100 的 HNSW 延迟可能偏高,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
14:34
38d ago
AI HOT 精选· aihot-apiZH14:34 · 05·07
OpenRouter 新增语音端点,TTS 和语音识别直接调用
OpenRouter 上线了两个音频 API 端点:/api/v1/audio/speech 做文本转语音(TTS),/api/v1/audio/transcriptions 做语音转文本。好处是复用已有的路由、计费和密钥体系,不用额外配置。如果你已经在用 OpenRouter 调文本或图像模型,现在可以直接加语音功能,不用换平台。正文没披露具体支持哪...
#Audio#OpenRouter#Product update
精选理由
OpenRouter 新增了两个音频端点,一个做语音合成,一个做语音转文字。对开发者来说,好处是延续了文本、图像那套路由和计费逻辑,不用再单独接其他语音 API。但正文没披露具体支持哪些模型、定价多少、延迟如何,所以目前只能算一个常规的产品补全,不是突破性更新。
一句话点评
OpenRouter 把 TTS 和语音识别做成了标准 API 端点,复用已有的路由和计费,对已经在用他们文本/图像接口的团队来说,加语音功能不用换平台。正文没披露具体支持哪些模型、延迟和价格,如果是走第三方模型转接,延迟和成本可能比专用服务高。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
14:24
38d ago
TechCrunch AI· rssEN14:24 · 05·07
Aurora CEO:无人卡车终于能规模化了,今年从几辆扩到几百辆
Aurora 去年4月就开始了商业无人驾驶运营,现在要把车队从几辆卡车扩到几百辆,跑达拉斯到休斯顿的货运路线。CEO Chris Urmson 说时机到了,但正文没披露具体成本、安全指标或人工干预率——这点先别太激动,规模化的前提是这些数字能打平有人驾驶。
#Robotics#Aurora#Chris Urmson#TechCrunch
精选理由
H/K/R 都达标,但正文没披露单车成本、安全指标或接管率,信息缺口明显。这是一篇不错的自动驾驶商业化访谈,不是核心 AI 能力发布,所以分数压在 70 档。
一句话点评
Aurora 要把无人卡车从几辆扩到几百辆,但没给成本和安全数据,先别激动。
锐评
Aurora CEO Chris Urmson 说无人驾驶卡车终于能规模化了。事实是:去年4月已开始商业运营,今年车队从几辆扩到几百辆,跑达拉斯到休斯顿的固定路线。但正文没披露三个关键数字:每英里运营成本是否低于有人驾驶、安全指标(如人工干预率)、以及几百辆车的具体交付时间表。没有这些,规模化只是愿景。另外,Aurora 走的是“限定路线+编队行驶”路线,不是全场景无人驾驶,这点先别太激动。如果是真的,几百辆无人卡车跑固定干线,成本确实能打平甚至低于人类司机——但前提是安全验证足够硬。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:14
38d ago
r/LocalLLaMA· rssEN14:14 · 05·07
同一个问题换个问法,Qwen 3.5 和 Gemma 4 就答不对了
Reddit 用户拿两个相似问题测了 Qwen 3.5、Gemma 4 和 Qwen 3.6,每个组合跑了 10 次。正确答案是 300,常见错误答案是 150。Qwen 3.6 在长提示词下即使跑 Q8 量化也经常翻车。关键信号是:模型对提示词风格很敏感,不是光看版本号就行。正文没披露具体提示词和测试环境,所以这个结论的泛化性要打个折。
#Reasoning#Benchmarking#Qwen#Gemma
精选理由
HKR 三项全过:一个具体的 Reddit 提示测试报告了运行次数和失败模式。范围窄:完整提示和统计显著性未披露,所以落在 60–71 分区间。
一句话点评
提示词风格比模型版本更影响结果,Qwen 3.6 在长提示下 Q8 量化也常翻车。
锐评
Reddit 用户用两个相似问题测了 Qwen 3.5、Gemma 4 和 Qwen 3.6,每个组合跑 10 次。正确答案是 300,常见错误答案是 150。Qwen 3.6 在长提示词下即使跑 Q8 量化也经常答错,说明它对提示词风格很敏感,不是版本号越高就越稳。 这个测试样本量小(每组合仅 10 次),且正文没披露具体提示词和测试环境,所以结论的泛化性要打折。不过它提醒了一个实用点:换模型时别只看跑分,先拿自己的典型提示词试几轮,尤其是长提示或带推理链的场景。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:00
38d ago
The Verge · AI· rssEN14:00 · 05·07
谷歌 Fitbit Air 发布:99 美元的屏幕无屏手环,主打 AI 健康教练
谷歌推出了 99 美元的 Fitbit Air,一款没有屏幕的健康手环,外观很像 Whoop 的绑带款。机身用金属织物搭扣固定,可以夹在衣服上或当吊坠戴。正文没披露具体用了什么传感器、AI 教练怎么工作、以及要不要额外订阅。目前看更像一个低成本的心率/运动追踪器,AI 部分还没落地。
#Google#Fitbit#Whoop#Product update
精选理由
HKR-H 和 HKR-K 成立:Google 做健康 AI 硬件的角度和 99 美元无屏手环是实打实的信息。传感器、模型机制、订阅价格都没披露,所以不上 featured。
一句话点评
99 美元的 Fitbit Air 没屏幕,像 Whoop 但更便宜,AI 教练还没影。
锐评
谷歌出了个 99 美元的 Fitbit Air,没屏幕,靠金属织物搭扣固定,能夹衣服上当吊坠。外形像 Whoop,但价格只有 Whoop 订阅一年的一半左右。正文没披露具体用了什么传感器,只说是个“模块化传感器”,大概率还是心率加运动追踪。AI 教练部分只提了个概念,怎么工作、要不要额外付费都没说。目前看就是个低成本的心率手环,AI 功能还没落地。如果传感器精度跟 Charge 6 差不多,那 99 美元买基础追踪还行;但如果 AI 教练要额外订阅,性价比就不好说了。信息缺口:传感器型号、AI 教练的具体能力、订阅价格——这些都没披露,建议等实测再判断值不值得买。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
13:52
38d ago
AI HOT 精选· aihot-apiZH13:52 · 05·07
ColaMD 1.5 把 Markdown 当数据库用,一份内容换多套皮肤
ColaMD 1.5 把 .md 文件当作内容层,HTML 模板当作视图层,改 Markdown 就能同时生成幻灯片、博客等不同输出。作者受“Markdown as Database”启发,解决了做演示文稿时改内容要改多处的麻烦。功能已内置,模板可以开源或让 AI 扩展。正文没披露模板 API 怎么写、渲染机制和兼容范围,想自己接模板的话得等更多文档。
#Tools#ColaMD#Product update#Open source
精选理由
HKR-K 因为版本更新中的内容-模板分离这个新事实通过,但 HKR-H 和 HKR-R 都不满足。文章跟AI工作流的关联很弱,而且没披露模板接口、渲染机制或兼容范围,信息缺口太大,所以分数低于40。
一句话点评
ColaMD 1.5 把 .md 当数据库,HTML 当皮肤,改一份 Markdown 就能同时出幻灯片和博客,省得每改一次内容要调多个文件。作者受“Markdown as Database”启发,功能已内置,模板可开源或让 AI 扩展。但正文没披露模板 API 怎么写、渲染机制和兼容哪些 Markdown 方言,想自己接模板得等文档。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K1·R0
13:47
38d ago
r/LocalLLaMA· rssEN13:47 · 05·07
AMD 发布 MI350P 加速卡:CDNA 4 终于做成 PCIe 插卡了
AMD 正式推出 Instinct MI350P 加速器,核心看点是 CDNA 4 架构终于做成了 PCIe 插卡形态,可以直接插进普通服务器。正文没披露定价和上市时间,所以实际部署成本未知。对跑本地模型的人来说,这意味着以后可能不用买整台专用机器,直接插卡就能用上新一代 AMD 计算单元,但具体能跑多大模型、延迟如何,还得等实测。
#Inference-opt#AMD#Product update
精选理由
HKR 全过,核心钩子是 CDNA 4 出 PCIe 卡了,事实是明确的 SKU 和形态,共鸣点在于 AI 服务器改造成本。正文没披露性能、价格和供货,所以分数压在 60–71 区间合理。
一句话点评
AMD 把 CDNA 4 塞进了 PCIe 卡,本地跑模型不用买整机了。
锐评
AMD 正式推出 Instinct MI350P,核心看点是 CDNA 4 架构终于做成了 PCIe 插卡形态,可以直接插进普通服务器。对跑本地模型的人来说,这意味着以后可能不用买整台专用机器,直接插卡就能用上新一代 AMD 计算单元。但正文没披露定价和上市时间,实际部署成本未知。具体能跑多大模型、延迟如何,也得等实测。另外,Reddit 原文被屏蔽,信息来自标题和摘要,细节有限。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:36
38d ago
量子位 · 公众号· rssZH13:36 · 05·07
原生Agent杀入画布:一站式搞定专业创作,全程可控、不抽卡
RunningHub 发布 RHTV,把 Agent 直接塞进画布,用户可以在一个界面里规划工作流、生成分镜、批量出素材、剪辑、记忆和复用流程。它接了 170 多个标准模型 API、10 万多个社区应用接口和 13681 个可用节点,覆盖图、视频、音频、3D 和文字。正文没披露定价,只说 Seedance 2.0 年费会员能打六折。
#Agent#Multimodal#Tools#RunningHub
精选理由
HKR三项全过:画布内嵌Agent和“不抽卡”的卖点有具体工作流钩子;API和节点数提供了可验证的规模信号;选题踩中了创作者工具焦虑。但这是一家小厂的单方产品发布,没有披露定价、基准测试或用户采用数据,所以分数卡在60–71区间。
一句话点评
短评:一站式创作画布,Agent 直接嵌入流程,省去来回切换。但正文没披露定价,六折优惠也仅限 Seedance 2.0 年费会员。 点评:RunningHub 把 Agent 塞进画布,用户在一个界面里就能规划工作流、生成分镜、批量出素材、剪辑,还能记忆和复用流程。接了 170 多个标准模型 API、10 万多个社区应用接口和 13681 个可用节点,覆盖图、视频、音频、3D 和文字,生...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:28
38d ago
Product Hunt · AI· rssEN13:28 · 05·07
Warp 开源了:一个让社区用 AI 代理一起写代码的开发环境
Warp 把自己那个带 AI 的终端开发环境开源了。核心思路是让 Oz 这个 AI 代理(可以理解为一个自动写代码、做计划、跑测试的机器人)干重活,社区成员只负责提想法、定方向、做验证。上线第一周就收获了 2.5 万以上的 GitHub Star 和 500 多个贡献者,社区热度很高。不过正文没披露具体用的什么开源许可证、仓库地址在哪、以及到底开源了哪...
#Agent#Code#Warp#Product Hunt
精选理由
标题说开源,正文没披露仓库、许可证和发布时间,信息缺口明显。产品更新类内容,价值偏低,所以维持低分。
一句话点评
Warp 把终端开发环境开源了,核心是让 AI 代理 Oz 自动写代码、做计划、跑测试,社区成员只负责提想法和验证。上线一周 GitHub 星标超 2.5 万,贡献者 500+,热度很高。但正文没披露具体开源许可证、仓库地址和开源范围,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
13:00
38d ago
● P1OpenAI 博客· rssEN13:00 · 05·07
OpenAI 扩大 GPT-5.5 网络安全可信访问范围
OpenAI 把“可信网络访问”机制扩展到了 GPT-5.5 和 GPT-5.5-Cyber 上。简单说,就是给经过身份验证的安全从业者开绿灯,让他们能用更强的模型做防御类工作,比如漏洞分析、恶意软件排查、写检测规则,同时继续拦截攻击性操作。GPT-5.5 加上这个权限后,对大多数防御任务就够用了;GPT-5.5-Cyber 则更激进,只开放给做授权渗...
#Code#Tools#Safety#OpenAI
精选理由
OpenAI 把可信网络访问从旧模型扩展到了 GPT-5.5 和 GPT-5.5-Cyber,只给验证过的防御者用,做漏洞研究和关键基础设施防护。我会先打个折:正文没披露怎么申请、要不要付费、模型在漏洞挖掘或攻防场景下的评测数据也没给,所以没法判断实际能力有多强。这点先别太激动,等有可复现的测试再下结论。
一句话点评
OpenAI 给 GPT-5.5 加了身份审核通道,让安全人员能拿模型做漏洞验证和恶意软件分析,但普通用户还是会被拦。
锐评
OpenAI 这次不是发新模型,而是给 GPT-5.5 套了一层身份验证机制,叫“可信网络访问”。简单说,就是安全从业者通过审核后,模型会少拦你,让你能做漏洞复现、恶意软件分析、补丁验证这些活;没审核的普通用户问同样的问题,模型直接拒。 文章举了个例子:同一个漏洞利用请求,默认 GPT-5.5 会拒绝或只给防御建议,开了 TAC 的版本直接生成漏洞利用代码和 README。他们还分了两档——TAC 给大多数防御工作用,GPT-5.5-Cyber 更宽松,给红队和渗透测试用,但要求更强的账号安全措施,比如防钓鱼认证,6 月 1 日起强制。 正文没披露审核门槛、通过率、误拦率,也没说这套机制对模型本身能力有没有削弱。性能数据只提了“已经交付强大能力”,没有具体基准测试或对比数字。这点先别太激动,更像是一次权限管理更新,而不是安全能力本身的突破。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
12:21
38d ago
AI HOT 精选· aihot-apiZH12:21 · 05·07
《AI营销》作者把25个提示词全开源了
作者 @yaojingang 把新书《AI营销:从SEO到GEO》配套的25个AI营销与GEO提示词开源到了GitHub,还额外补了短视频和文案类提示词。两个仓库链接已放出,可以直接下载或拉取。正文没披露许可证类型、维护计划或实际效果,所以商用前最好自己先测一轮。
#Tools#yaojingang#vista8#GitHub
精选理由
HKR-K通过:25个提示词和仓库链接是新事实。HKR-H/R弱:许可证、示例输出、维护计划未披露,所以这条属于低价值开源资源。
一句话点评
作者把新书配套的25个AI营销和GEO提示词全开源了,还额外补了短视频和文案类。两个GitHub链接已放出,直接就能用。但正文没提许可证类型、维护计划或实际效果,商用前最好自己先测一轮。短评:开源是好事,但没许可证和效果数据,商用前得自己踩坑。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
12:20
38d ago
AI HOT 精选· aihot-apiZH12:20 · 05·07
PixVerse 上线 4K 超分,限时免费试用 3 次
PixVerse 推出了 4K 超分辨率功能,可以在一个工作流里同时增强图片和视频。每个用户免费试用 3 次,之后用积分支付可享 35% 折扣,活动时间是 5 月 7 日至 14 日 UTC 8:00。转发、关注、回复后还能通过私信领 300 积分(限 72 小时)。正文没披露用了什么模型、分辨率上限或生成速度,免费额度不多,但折扣力度还行,适合想低成...
#Vision#Multimodal#PixVerse#Product update
精选理由
HKR-K/R通过:帖子给出了具体的获取条件和折扣,并触及创作者的成本和分辨率关切。HKR-H不通过:这是一条常规促销式的功能通知,没有模型参数、处理上限或质量对比。
一句话点评
PixVerse 上线了 4K 超分功能,图片和视频能在一个工作流里一起增强。每个用户免费试用 3 次,之后用积分支付打 65 折,活动到 5 月 14 日。转发关注回复还能领 300 积分(限 72 小时)。 短评:免费额度少,但折扣力度还行,适合低成本试水。 点评:功能本身不新鲜,但把图片和视频超分做到一个流程里算个小便利。3 次免费试用基本只够测效果,想批量用就得买积分。35% 折...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
12:20
38d ago
TechCrunch AI· rssEN12:20 · 05·07
Spotify AI DJ 新增法语、德语、意大利语和巴西葡语
Spotify 的 AI 主播功能现在能讲四门新语言:法语、德语、意大利语和巴西葡萄牙语。正文没披露具体在哪些地区上线、是否需要付费订阅、语音是合成还是真人录制,以及支持哪些设备。
#Audio#Spotify#Product update
精选理由
HKR-K 靠新增四种语言通过,但 HKR-H 和 HKR-R 很弱:这是 Spotify AI DJ 的常规本地化更新,正文没披露上线地区、订阅条件、语音机制或可用平台。
一句话点评
Spotify AI 主播新增四门语言,但没说在哪能用、要不要付费。
锐评
Spotify 的 AI 主播(AI DJ)现在能讲法语、德语、意大利语和巴西葡萄牙语了。功能本身不新,就是让一个 AI 声音在歌曲之间插话、推荐音乐,类似一个会聊天的电台主持人。这次只是语言扩展,正文没披露具体在哪些国家上线、是否需要 Premium 订阅、语音是合成还是真人录制,以及支持哪些设备。如果是合成语音,成本低但听感可能偏机械;如果是真人录制,成本高但更自然。目前信息缺口太多,没法判断这个更新对用户的实际价值。对从业者来说,值得关注的是 Spotify 在多语言场景下如何平衡语音自然度和延迟——如果延迟高或口音不准,用户可能直接关掉。建议等更多细节出来再评估。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
12:10
38d ago
MIT 科技评论· rssEN12:10 · 05·07
MIT Technology Review 汇总:AI 优化体外受精、阳台太阳能立法、Anthropic GPU 合作
MIT 技术评论今日摘要:AI 正被用于 IVF(试管婴儿)中筛选有潜力的精子和胚胎,并开发机器人来自动化部分流程,甚至探索基因编辑来预防遗传病——这些技术可能让 IVF 更有效、更便宜,但也引发伦理争议。美国数十个州正在考虑立法允许安装“阳台太阳能”(即插即用的小型光伏板),几乎无需安装就能省电费、减排放,但专家提醒有安全隐患。Anthropic 与...
#Robotics#Safety#Agent#MIT Technology Review
精选理由
这是一篇MIT Technology Review的周报汇总,AI部分只有Anthropic用SpaceX GPU和Claude Code额度翻倍两条硬信息。额度翻倍对重度用户是实打实的利好,但文章主体是IVF和阳台太阳能,整体信息密度对AI从业者一般,属于可看可不看的级别。
一句话点评
MIT Tech Review 的每日汇总,核心是两篇长文:一篇讲公众对 AI 的普遍焦虑(AI malaise),另一篇讲 AI 和机器人如何改变 IVF(体外受精)流程,比如用 AI 筛选胚胎、机器人操作显微注射。短评:AI 焦虑是情绪观察,IVF 那篇有具体技术落地,但正文没披露任何临床数据或成本对比,所以“AI 优化 IVF”目前还是概念大于证据。适合当行业风向标,别当技术验证报告。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
11:23
38d ago
r/LocalLLaMA· rssEN11:23 · 05·07
llama.cpp 社区 PR 给 MiMo v2.5 加上了本地推理支持
llama.cpp 的 #22493 PR 加入了 MiMo v2.5 模型支持。MiMo v2.5 是一个稀疏 MoE,总参数量 310B,但每次推理只激活 15B,所以本地跑得动。它还支持 100 万 token 的超长上下文,能同时处理文字、图片、视频和音频。不过这个 PR 还没说是否已经合并进主分支,想尝鲜得自己编译。
#Multimodal#Vision#Audio#ggml-org
精选理由
HKR 全过:钩子是 llama.cpp 支持 310B 多模态 MoE,规格明确(310B/15B 激活/1M 上下文)。重要性压在 60–71 是因为这只是个兼容性 PR,且合并状态正文没披露。
一句话点评
310B 总参数但只激活 15B,本地能跑多模态大模型了。
锐评
llama.cpp 的 PR 加入了小米 MiMo v2.5 支持。这是一个稀疏 MoE 模型,总参数量 310B,但每次推理只激活 15B,所以消费级显卡也能本地跑。它还支持 100 万 token 超长上下文,能同时处理文字、图片、视频和音频。不过 PR 正文没披露是否已合并进主分支,想尝鲜得自己编译。另外,15B 激活参数跑多模态任务的实际效果(比如视频理解精度、音频识别延迟)也没有 benchmark 数据,这点先别太激动。如果是真的,本地部署一个能看视频、听语音的模型,成本确实很低。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
11:21
38d ago
Product Hunt · AI· rssEN11:21 · 05·07
MiniMax Hub:一个桌面AI工作站,把多模态生成和Agent工作流塞进可视化画布里
MiniMax 今天在 Product Hunt 上发了第 8 个产品 MiniMax Hub,定位是桌面 AI 创意工作站。核心卖点是“Agent 驱动的可视化画布”——你可以在一个界面里同时生成和编辑图片、视频、音频、文字,还能让 AI 帮你处理本地文件、用自然语言编排创意工作流。说白了就是把多模态生成、Agent 自动化和低代码工作流打包成一个桌...
#Agent#Vision#Tools#MiniMax
精选理由
HKR-H 靠 agent 视觉画布工作站这个角度勉强过关,但 K 和 R 都挂了——定价、配置、上线时间全没披露,从业者没法判断要不要跟进。这只是一个 Product Hunt 上的小产品更新,不是值得关注的信号。
一句话点评
MiniMax 在 Product Hunt 上发了第 8 个产品 Hub,定位是桌面 AI 创意工作站。核心卖点是“Agent 驱动的可视化画布”——一个界面里同时生成和编辑图片、视频、音频、文字,还能让 AI 帮你处理本地文件、用自然语言编排创意工作流。说白了就是把多模态生成、Agent 自动化和低代码工作流打包成一个桌面应用。 目前只有 Product Hunt 页面信息,正文没披露...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
11:19
38d ago
FT · 科技· rssEN11:19 · 05·07
AI巨头财报里神秘的530亿美元“其他收入”
FT爆料,几家AI超大规模云厂商的财报里藏了一笔约530亿美元的“其他收入”,来源和归属都没说清。正文被付费墙挡住,没披露具体是哪几家公司、这笔钱怎么算出来的、又是谁给的。数字很大——530亿,比多数AI公司的年营收还高,但信息缺口也大:不知道是一次性收益(比如投资升值)还是可持续的运营外收入。这点先别太激动,等FT放出全文再看明细。
#Financial Times#Commentary
精选理由
FT的标题有权威性,530亿美元这个数字也够扎眼,所以H、K、R三个钩子都成立。但RSS正文只有“Quantum entanglement”四个字,没披露具体公司、会计口径和收益归属机制,信息量太少,只能给到60-71这个区间。
一句话点评
FT爆料AI云厂商财报藏了530亿美元“其他收入”,但全文被付费墙挡住,来源和归属都没说清。
锐评
FT这篇标题很炸——530亿美元,比多数AI公司年营收还高,藏在几家AI超大规模云厂商的财报里,归类为“其他收入”。但正文被付费墙完全挡住,RSS只给了“Quantum entanglement”几个字,等于没披露具体是哪几家公司、这笔钱怎么算出来的、又是谁给的。 这个数字大得可疑:如果是投资升值或资产出售,那是一次性收益,不能算运营能力;如果是客户预付款或政府补贴,那可持续性完全不同。正文没披露任何会计处理细节,也没说这笔钱是否已经到账。 这点先别太激动。530亿可能是多个季度累计、也可能是几家公司的合计,甚至可能是FT自己估算的。等全文放出再看明细,现在信息缺口太大,没法判断是利好还是会计魔术。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
11:03
38d ago
Product Hunt · AI· rssEN11:03 · 05·07
APIEval-20:给测接口的AI智能体准备的公开测试集
KushoAI 今天在 Product Hunt 上发布了 APIEval-20,一个专门用来评估“AI 智能体测 API 能力”的公开基准。每个智能体只给一个 JSON 结构描述和一个示例请求,然后让它自己生成测试用例,去测那些故意埋了 bug 的参考接口。评分完全客观——bug 抓到就是抓到,不用大模型当裁判。任务覆盖了鉴权、报错处理、翻页、结构校...
#Agent#Tools#Benchmarking#Benchmark
精选理由
可浏览但价值低:HKR-R 靠 Agent 评测痛点勉强成立,HKR-H 和 HKR-K 都不达标。一条 Product Hunt 发布动态,没任务数、没方法、没结果,不值得上推荐位。
一句话点评
KushoAI 发了个专门测 API 测试智能体的公开基准 APIEval-20。每个智能体只给一个 JSON 结构和一个示例请求,让它自己生成测试用例去测埋了 bug 的接口。评分完全客观,不用大模型当裁判,bug 抓到就是抓到。任务覆盖鉴权、报错、翻页、结构校验和多步流程。20 个任务不算多,但胜在场景贴近真实开发。正文没披露任何模型跑分,也没说成本,这点先别太激动。如果后续能跑几个主流...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
10:45
38d ago
Hacker News 首页· rssEN10:45 · 05·07
Agent-harness-kit:一键给项目搭多智能体协作脚手架
一个叫 agent-harness-kit 的开源工具,号称是 AI 智能体编排领域的 Vite。你只要在项目根目录跑一句 npx @cardor/agent-harness-kit init,回答三个问题(项目名、用哪个模型供应商、要几个智能体),它就会自动生成一套完整的多智能体协作基础设施:AGENTS.md 角色说明、TypeScript 类型配...
#Agent#Tools#Product update
精选理由
HKR-R 通过,但 HKR-H 是常规脚手架标题,HKR-K 缺乏可复现细节。没有硬排除条件,所以归为低价值工具线索。
一句话点评
跑一句命令就能生成多智能体协作脚手架,适合快速搭原型。
锐评
这个叫 agent-harness-kit 的开源工具,定位是 AI 智能体编排领域的 Vite。你在项目根目录跑一句 npx @cardor/agent-harness-kit init,回答三个问题(项目名、用哪个模型供应商、要几个智能体),它就会自动生成一套完整的多智能体协作基础设施:AGENTS.md 角色说明、TypeScript 类型配置、SQLite 状态数据库、每个智能体的指令文件,以及健康检查脚本。内置四个预设角色:Lead 负责分配任务、Explorer 只读代码、Builder 写 src/ 和 tests/、Reviewer 把关测试。支持 Claude Code 和 OpenCode 两个供应商,还自带 MCP 服务器和 Web 监控面板。目前 v0.18.0,MIT 协议,月下载量 2343,算早期项目。正文没披露实际跑复杂任务时的延迟和 token 消耗,也没给端到端 demo 对比单智能体效果提升多少。如果是快速验证多智能体流程的原型,值得一试;但生产环境稳定性、错误恢复、大规模任务编排能力都还没数据支撑,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
10:00
38d ago
● P1OpenAI 博客· rssEN10:00 · 05·07
OpenAI在API中推出新的实时语音模型
OpenAI 这次发了三个新模型:GPT‑Realtime‑2 是带 GPT‑5 级推理能力的语音模型,能处理更复杂的请求,说话中间可以插话、改主意,它还能边想边回一句“我查一下”,同时调用多个工具;GPT‑Realtime‑Translate 做实时翻译,支持 70 多种输入语言转 13 种输出语言,语速跟得上说话人;GPT‑Realtime‑Whi...
#Audio#Reasoning#OpenAI#Product update
精选理由
OpenAI 官方放出了语音 API 更新,方向明确但信息不全。能推理、翻译、转写,听着挺全,可没给价格、没给延迟、没给上下文限制,我会先打个折。如果是真的省钱又低延迟,那对语音应用开发者是直接利好;现在只能说方向对了,落地还得等更多参数。
一句话点评
OpenAI 在 API 里发了三个新语音模型,最狠的是把 GPT-5 级推理塞进实时语音,同传翻译成本直接砍到地板价。
锐评
OpenAI 这次一口气发了三个模型:GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper。核心是把 GPT-5 级别的推理能力装进了实时语音管道里,让语音助手不再只是“你说一句我回一句”,而是能边聊边想、边调工具、边处理打断和纠错。 几个值得看的点:一是“Preambles”功能,模型在正式回答前会先说“让我查一下”之类的垫话,减少干等感;二是支持并行调用多个工具,比如同时查日历和发邮件,并且会把动作说出来,让用户知道它在干嘛;三是出错恢复更体面,不会直接沉默或崩掉。翻译模型覆盖 70+ 种输入语言和 13 种输出语言,主打低延迟同传。 官方博客给了不少企业合作案例(Zillow、Priceline、德国电信),但都是“正在构建”或“未来方向”,没有落地数据和用户反馈。定价和具体延迟数字在正文里没展开,这点先别太激动。另外,实时翻译在嘈杂环境或口音重的场景下表现如何,也没披露测试结果。整体看,能力升级方向是对的,但实际省多少钱、稳不稳定,还得等开发者上手跑过才知道。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
08:56
38d ago
Hacker News 首页· rssEN08:56 · 05·07
ZAYA1-8B:8B参数MoE模型,760M活跃参数,数学追上DeepSeek-R1
Zyphra新出的ZAYA1-8B,一个8B总参数的MoE(混合专家)模型,每次推理只激活760M参数,数学能力就追平了DeepSeek-R1,推理接近Claude Sonnet 4.5,编程接近Gemini 2.5 Pro。关键点:760M活跃参数意味着推理成本极低,部署门槛也低。另一个亮点是全程用AMD MI300X训练(1024节点),没碰NVI...
#Reasoning#Code#Benchmarking#ZAYA1-8B
精选理由
HKR三项都过,但正文只有RSS片段,没披露基准名称、许可证、代码结果或复现设置。效率声称有意思,但证据密度不够,所以分数压在60–71区间。
一句话点评
8B总参数、每次只激活7.6亿参数,数学追平DeepSeek-R1,推理接近Claude Sonnet 4.5,编程接近Gemini 2.5 Pro。
锐评
Zyphra的ZAYA1-8B是个MoE(混合专家)模型,总参数量8B,但每次推理只激活7.6亿参数——这意味着推理成本极低,部署门槛也低。数学能力追平DeepSeek-R1,推理接近Claude Sonnet 4.5,编程接近Gemini 2.5 Pro,如果这些数字属实,那确实很能打。另一个亮点是全程用AMD MI300X训练(1024节点),没用NVIDIA,这对想绕开N卡生态的团队是个信号。 但正文没披露具体跑在哪个benchmark上、分数多少,也没说开源协议和复现设置。所以“追平”到底是在哪个测试集、什么精度下比的,还不清楚。如果是真的,760M活跃参数做到这个水平,成本优势非常明显;但建议等官方放出详细评测和权重再下结论。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
08:49
38d ago
AI HOT 精选· aihot-apiZH08:49 · 05·07
开源20B MoE模型量化后能在MacBook本地跑,131K上下文
OpenAI开源的20B参数MoE模型,被社区用TurboQuant 3-bit量化加MLX优化后,能在M系列Mac上本地运行,不用联网也不用交月费。支持131K超长上下文,日常聊天、写作、写代码够用。但正文没披露具体速度、内存占用和跑分,实际体验和性能边界还不清楚。
#Inference-opt#Code#OpenAI#Hugging Face
精选理由
HKR三项都过,但正文没披露速度、内存占用和基准分数,信息缺口明显。这是一个有用的社区量化/本地部署线索,不是重磅发布,先别太激动。
一句话点评
OpenAI 开源的 20B MoE 模型,社区用 TurboQuant 3-bit 量化加 MLX 优化后,能在 M 系列 Mac 本地跑,不用联网和月费,支持 131K 上下文。日常聊天、写作、写代码够用。但正文没披露具体速度、内存占用和跑分,实际体验和性能边界还不清楚。短评:本地跑 20B MoE 挺省钱,但速度、内存、跑分都没说,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:53
38d ago
r/LocalLLaMA· rssEN07:53 · 05·07
llama.cpp 为什么不能同时用两种推测解码?
一位用户在 Reddit 上问 llama.cpp 能不能把 MTP(多头预测)和 n-gram 推测解码一起用。他实测了 Qwen3.6 27B 的 MTP,说在写代码的重复片段时 n-gram 更快。正文没披露维护者的回复、具体 benchmark 或限制原因,所以目前只能当用户经验看,不是官方结论。
#Agent#Code#Inference-opt#llama.cpp
精选理由
HKR-K 通过,因为给出了可复现的 llama.cpp 配置;但 HKR-H 和 HKR-R 弱。帖子缺少维护者回应、性能数字或实现细节,属于低价值技术讨论。
一句话点评
用户实测Qwen3.6 27B的MTP,写重复代码时n-gram更快,但官方没确认能否混用。
锐评
一位用户实测了Qwen3.6 27B的MTP(多头预测,让模型一次猜多个后续token),发现写代码的重复片段时,n-gram推测解码(基于历史文本匹配)反而更快。这暗示两种加速方法可能冲突,但正文没披露llama.cpp维护者的回复、具体benchmark数据或限制原因,目前只能当用户经验看,不是官方结论。关键信息缺口:没说明MTP和n-gram能否在llama.cpp里同时启用,也没给延迟或吞吐量对比。如果真能混用,对长代码生成场景挺省钱,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K1·R0
07:25
38d ago
AI HOT 精选· aihot-apiZH07:25 · 05·07
GitHub Repo Stats:一个看仓库提交数的轻量工具
Simon Willison 写了个小工具,输入 GitHub 仓库名或 URL,就能看到提交数、贡献者、语言分布、版本发布等统计。他本人最在意的是提交数,但 GitHub 手机版不显示这个数字,所以自己动手用 REST 或 GraphQL API 抓了数据。工具在浏览器里直接跑,不经过后端。不登录的话每小时只能请求 60 次,登录后能到 5000 次...
#Tools#GitHub#Simon Willison#Product update
精选理由
正文介绍了一个 GitHub 仓库统计工具,输入仓库地址就能看提交总数等数据,用了 REST 或 GraphQL API。两个示例是 simonw/datasette 和 simonw/llm。工具本身跟 AI 关系很弱,没有模型、智能体、成本或安全方面的信息,对 AI 从业者参考价值有限。
一句话点评
Simon Willison 写了个浏览器端小工具,输入 GitHub 仓库名就能看提交数、贡献者、语言分布等统计。他本人最在意提交数,但 GitHub 手机版不显示,所以自己动手用 API 抓。工具纯前端运行,不登录每小时只能请求 60 次,登录后 5000 次。对经常在手机上快速评估仓库的人来说挺实用,但功能本身不复杂,就是个 API 封装。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
07:15
38d ago
Hacker News 首页· rssEN07:15 · 05·07
Unsloth 和 NVIDIA 合作,让消费级显卡微调大模型再快 25%
Unsloth 和 NVIDIA 联合宣布,在消费级 GPU 上微调大模型的速度能再提升约 25%。他们主要干了三件事:一是缓存打包序列的元数据,避免每层都重复算一遍;二是用双缓冲区做梯度检查点,让激活值重算和反向传播并行起来;三是优化了 MoE 路由,用 argsort 和 bincount 一次性分组 token。实测 Qwen3-14B 的 QL...
#Fine-tuning#Inference-opt#Unsloth#Nvidia
精选理由
标题说消费级GPU训练提速25%,但正文只有RSS摘要,没披露具体GPU型号、模型规模、训练方法或优化细节。这个数字本身有吸引力,但缺乏可复现条件,所以评分压在60-71区间。
一句话点评
Unsloth 和 NVIDIA 合作,在消费级 GPU 上把大模型微调速度再提 25%,主要靠缓存元数据、并行计算和优化路由。
锐评
Unsloth 和 NVIDIA 联合宣布,在消费级 GPU 上微调大模型的速度能再提升约 25%。他们主要干了三件事:一是缓存打包序列的元数据,避免每层都重复算一遍;二是用双缓冲区做梯度检查点,让激活值重算和反向传播并行起来;三是优化了 MoE 路由,用 argsort 和 bincount 一次性分组 token。实测 Qwen3-14B 的 QLoRA SFT,前向加速 43%,反向加速 5.8%,整体每批快 14.3%。 不过正文没披露具体用的哪款消费级 GPU、训练超参和对比基线,25% 是峰值还是均值也不清楚。如果是真的,对个人开发者挺省钱,但复现门槛还在。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
07:11
38d ago
r/LocalLLaMA· rssEN07:11 · 05·07
Reddit 用户实测:GLM 在 77 道题里答对 58 道,但经常对空白输入过度解释
Reddit 用户 No_Run8812 自己搞了个 77 题的本地模型测试,分四类任务。zai-org/glm-4.7-flash 得了 58/77,低于 qwen3-coder-next 的 66/77。作者说 GLM 在 4 条审计提示上解释不足,但对空白和单字符输入反而过度解读,像“精神分裂”。正文没披露具体测试题和评分标准,所以这个对比只能当...
#Agent#Tools#Benchmarking#GLM
精选理由
HKR 三项都达标,但这是单个 Reddit 用户的实验,77 项用例的设计细节和可复现性正文没披露,分数有参考价值但不足以进精选。
一句话点评
GLM 在空白输入上过度解读,像精神分裂,但测试只有77题,样本太少。
锐评
Reddit 用户自己搞了个77题本地模型测试,GLM-4.7-flash 得分58/77,低于 Qwen3-coder-next 的66/77。作者说 GLM 在4条审计提示上解释不足,但对空白和单字符输入反而过度解读,像“精神分裂”。这个测试样本量只有77题,且正文没披露具体题目和评分标准,所以对比只能当个参考,不能当真。另外,测试是个人行为,不是官方评测,权威性有限。如果真要做模型对比,建议用更大、更公开的基准,比如 MMLU 或 HumanEval。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
06:51
38d ago
AI HOT 精选· aihot-apiZH06:51 · 05·07
阿里千问 PC 端上线语音输入:按住说话、双击下指令,免费开放
阿里千问在 PC 端上线了 AI 语音输入功能,所有用户免费使用。核心操作就两套快捷键:按住右 Alt(Mac 是右 Command)说话,系统会自动去掉语气词、纠正口误,把语音转成规整的文字输出;双击同一个键则进入 AI 指令模式,可以直接说“帮我查资料”“写个文档”“翻译这段话”,不用切窗口。设计思路是把语音输入法做成一个跨应用的 AI 调度入口,...
#Audio#Agent#Tools#Alibaba
精选理由
HKR-H和HKR-K成立:阿里千问PC端新增免费语音输入,支持快捷键和AI指令模式切换。HKR-R偏弱:正文未披露语音识别的延迟、模型参数或跨应用调度的具体机制,信息缺口明显,因此评分落在60–71区间。
一句话点评
阿里千问PC端上线语音输入,按住右Alt说话能自动去语气词、纠口误,双击则进入AI指令模式,直接说“写文档”“查资料”不用切窗口。免费开放,但正文没披露延迟和模型规格,实际响应速度存疑。设计思路是把语音做成跨应用调度入口,比单纯语音打字更有想象力,但体验好坏取决于识别准确率和指令执行稳定性。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
06:50
38d ago
r/LocalLLaMA· rssEN06:50 · 05·07
试了 Pi 这个开源编程助手,5 个设计特点值得看
Reddit 用户 OrewaDeveloper 试了 Pi 编程助手,总结了 5 个设计特点。Pi 支持替换 system.md、树状会话,工具只有四个:读、写、编辑、跑 bash。登录 Anthropic 后按 token 额外计费,正文没披露具体价格。
#Agent#Code#Tools#Pi
精选理由
HKR 三项都过:试用帖给出了具体机制和成本/控制方面的共鸣点。影响落在 60–71 区间,因为正文没披露任务结果、速度、成功率以及具体定价。
一句话点评
Pi 编程助手开源,工具极简但依赖 Anthropic 按 token 计费,成本未知。
锐评
Pi 是一个开源编程助手,设计上刻意保持工具极简:只有读、写、编辑和跑 bash 四个工具,支持替换 system.md 和树状会话。这种设计让模型不容易跑偏,适合需要稳定执行简单编程任务的场景。但注意,Pi 登录 Anthropic 后按 token 额外计费,正文没披露具体价格,实际使用成本可能不低。另外,来源是 Reddit 用户个人体验,不是官方评测,验证强度弱。目前缺的是:Pi 在复杂项目或长链任务上的表现对比、与 Claude Code 等竞品的成本差异、以及是否支持本地模型替换。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
06:12
38d ago
Hacker News 首页· rssEN06:12 · 05·07
Agent Skills 评测工具:给模型加技能到底有没有用?
这个开源项目提供了一个测试框架,用来验证给 AI Agent 加上特定技能(比如调用工具、多步推理)后,输出质量是否真的提升了。作者没有公布具体的评测任务、指标和模型配置,所以目前只能看到工具本身,看不到任何实测结果。对于想评估 Agent 能力的团队来说,这个架子搭好了,但数据还没填上。
#Agent#Benchmarking#darkrishabh#GitHub
精选理由
HKR-H 和 HKR-R 通过:Agent Skills 评测是实操者关心的真问题。HKR-K 不通过,因为任务、指标和模型配置都没披露,所以分数压在 60–71 区间。
一句话点评
一个测 Agent 技能有没有用的空架子,代码开源但没跑出任何数据。
锐评
这个项目提供了一个测试框架,用来验证给 AI Agent 加上特定技能(比如调用工具、多步推理)后,输出质量是否真的提升了。作者没有公布具体的评测任务、指标和模型配置,所以目前只能看到工具本身,看不到任何实测结果。对于想评估 Agent 能力的团队来说,这个架子搭好了,但数据还没填上。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
04:40
38d ago
FT · 科技· rssEN04:40 · 05·07
三星市值破万亿美元,工会要求分AI红利
三星市值达到1万亿美元,韩国工会威胁罢工,要求将AI带来的利润增长用于提高奖金和工资。正文没披露具体奖金数额、谈判进展或罢工时间表,但这件事本身说明:AI赚钱了,员工也想分一杯羹。
#Samsung#South Korean unions#Incident
精选理由
HKR三项都过,但正文只有RSS摘要,没披露奖金数额、谈判进度和罢工时间表。这是AI供应链的劳资新闻,不是模型或产品更新,所以分数压在60–71区间。
一句话点评
三星市值破万亿,工会拿AI利润当筹码要加薪。
锐评
三星市值达到1万亿美元,韩国工会威胁罢工,要求把AI带来的利润增长用于提高奖金和工资。这件事本身说明:AI赚钱了,员工也想分一杯羹。但正文没披露具体奖金数额、谈判进展或罢工时间表,所以目前更像一个信号——AI红利分配问题开始摆上台面,而不是马上要停产的危机。对AI从业者来说,这提醒你:技术落地后,利益分配是绕不开的议题,尤其在高人力成本的制造业。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:28
38d ago
Product Hunt · AI· rssEN04:28 · 05·07
Memoket Gem:全天候佩戴的 AI 录音笔,帮你记住每一句对话
Memoket Gem 是一款 AI 可穿戴设备,主打全天候记录对话,然后自动生成摘要、待办事项和后续跟进,还能把不同对话的上下文串起来。产品页没说价格、续航、存储方式和隐私怎么处理——这些是买这类设备前最该问清楚的事。目前开放了 50 个免费名额给创始人和小企业主做早期测试,算是个低成本尝鲜的机会,但样本量太小,验证意义有限。
#Audio#Memory#Memoket Gem#Product update
精选理由
小厂AI可穿戴设备发布,HKR的H和R成立,但K很弱。正文没披露价格、续航、存储和隐私机制,只能算低价值的产品更新,不值得投入精力深挖。
一句话点评
Memoket Gem 是一款全天候录音的 AI 可穿戴设备,能自动把对话转成摘要、待办和后续跟进,还能跨对话串上下文。目前开放 50 个免费名额给创始人和小企业主做早期测试,算是个低成本尝鲜的机会。但产品页没披露价格、续航、存储方式和隐私处理——这些是买这类设备前最该问清楚的事。50 人的样本量太小,验证意义有限,这点先别太激动。如果是真的,能省去手动记笔记的麻烦,但隐私和续航是硬伤。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
04:02
38d ago
● P1新智元 · 公众号· rssZH04:02 · 05·07
Claude 托管智能体新增“做梦”功能,Harvey 实测任务完成率暴涨约 6 倍
Anthropic 给 Claude 的托管智能体加了三个新能力:Dreaming(做梦)、Outcomes(结果校验)和多智能体协作。其中“做梦”是指让 Claude 在后台读取最多 100 段历史会话,自己总结规则来改进表现,一次演示里它把 530 万 token 的对话提炼成了 98 条规则。法律 AI 公司 Harvey 实测后,任务完成率比之...
#Agent#Memory#Benchmarking#Anthropic
精选理由
Anthropic 给 Claude 托管 Agent 加了三个东西:Dreaming 让模型事后翻历史会话自己总结规则,Outcomes 用偏好样本教模型对齐目标,多 Agent 编排让多个 Claude 协作干活。Harvey 说任务完成率大约翻了 6 倍,Outcomes 内部测试最高能提 10 个百分点。运行时另收 0.08 美元/会话小时,正文没披露这个定价的横向对比。我会先打个折:6 倍是合作方数据,没看到独立复现,但 Dreaming 从 530 万 token 压到 98 条规则这个例子确实说明能省不少上下文成本。
一句话点评
Claude 现在能自己翻聊天记录总结规则了,Harvey 实测任务完成率涨了约 6 倍,但正文没给具体基线和测试集,这点先别太激动。
锐评
Anthropic 给 Claude 的托管智能体加了三个新能力,最值得看的是“做梦”——让模型在后台读最多 100 段历史对话,自己提炼行为规则。一次演示里,它把 530 万 token 的对话压成了 98 条规则,相当于模型自己给自己写了个操作手册。法律 AI 公司 Harvey 实测后说任务完成率涨了约 6 倍,另一个叫“结果校验”的功能把成功率又拉了 10 个百分点。 不过 Harvey 的数据得打个折。正文没披露原来的完成率是多少,也没说测试任务长什么样、样本量多大。从 10% 提到 60% 和从 80% 提到 85% 完全是两回事,前者是能用,后者是锦上添花。另外,这些功能目前只开放给 Opus 4.7 和 Sonnet 4.6,还要额外收每小时 0.08 美元的运行时费,小团队用起来成本不低。 还缺几个关键信息:100 段历史对话够不够覆盖长尾场景?模型自己总结的规则会不会越学越偏?多智能体协作具体怎么分工、有没有冲突处理机制?这些都没说清楚。整体看,方向有意思,但离“睡一觉就进化”还差不少验证。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
04:02
38d ago
新智元 · 公众号· rssZH04:02 · 05·07
中国医疗AI登顶全球榜单,WiseDiag发布院外场景Agent OS
WiseDiag 发布 WiseClaw 2.0,一个面向体检、慢病、设备、家庭医生、保险/养老五个院外场景的医疗 Agent OS。系统分导诊、临床、评估三个阶段,并记录工具调用、知识版本和风险检查的 trace。模型 WiseDiag-v2 在 DoctorBench 上拿了第一,公司刚融了 6500 万人民币天使轮。正文没披露具体评测指标和对比基...
#Agent#Tools#Memory#WiseDiag
精选理由
这篇是智诊科技的发布稿,核心信息是WiseClaw 2.0医疗Agent OS面向体检、慢病等5类院外场景,采用分诊、临床、评估三层链路,并记录对话、工具调用和风险判断。另外WiseDiag-v2在DoctorBench上拿了第一,公司刚融了6500万天使轮。标题有点夸张,但正文提供了具体场景、技术架构和融资数据,对关注医疗AI落地的从业者来说有参考价值。不过DoctorBench的权威性、评测细节和实际部署成本正文都没提,所以分数压在70以内。
一句话点评
医疗Agent OS,但评测细节和对比模型都没说。
锐评
WiseDiag 把 WiseClaw 2.0 包装成面向体检、慢病、设备、家庭医生、保险/养老五个院外场景的医疗 Agent OS,思路清晰:让模型进业务流程干活,而不是只做问答。系统分导诊、临床、评估三个阶段,还记录工具调用、知识版本和风险检查的 trace,这对医疗合规和审计是加分项。模型 WiseDiag-v2 号称在 DoctorBench 上拿了全球第一,公司刚融了 6500 万人民币天使轮。但正文没披露具体评测指标和对比基线,也没说跟谁比、差多少,这个“第一”要打折。6500 万天使轮在医疗 AI 里不算小,但也没大到能烧出壁垒。缺的是:评测细节、对比模型、临床落地案例。如果是真的,这个架构比单点模型更值得关注。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
03:57
38d ago
彭博科技· rssEN03:57 · 05·07
阿里股价跑赢腾讯,因为投资者更看好它的芯片业务
阿里股价涨幅超过腾讯,原因是亚洲芯片股集体上涨,而阿里旗下有半导体业务,投资者更愿意押注有芯片概念的公司。正文没披露阿里芯片业务的具体涨幅、估值或收入,所以这点先别太激动,信息还不够判断实际价值。
#Alibaba#Tencent#Bloomberg#Commentary
精选理由
这是AI相关的市场报道:HKR-H靠阿里vs腾讯的芯片角度过关,但HKR-K缺数字,HKR-R缺云成本或供应链细节。低价值区间,没有硬排除理由。
一句话点评
阿里涨得比腾讯猛,因为市场在炒芯片概念,但正文没披露阿里芯片业务的具体收入或估值,这点先别太激动。
锐评
阿里股价跑赢腾讯,直接原因是亚洲芯片股集体上涨,而阿里旗下有半导体业务,投资者更愿意押注有芯片概念的公司。但正文没披露阿里芯片业务的具体涨幅、估值或收入,所以信息还不够判断实际价值。如果阿里芯片业务体量很小,这波涨幅可能只是情绪驱动,缺乏基本面支撑。对于AI从业者来说,这条新闻的参考价值有限——它更多是市场情绪和板块轮动的信号,而不是技术或业务层面的突破。需要关注的是阿里芯片业务后续是否有实质性进展披露,比如客户、订单或技术路线。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
03:57
38d ago
彭博科技· rssEN03:57 · 05·07
数据中心老板:AI 热潮让我不用睡觉
澳大利亚数据中心运营商 NEXTDC 的老板说,AI 热潮让他忙到没空睡觉,但公司现金流充裕。正文没披露具体融资规模、客户名单或扩建计划,所以这点先别太激动——有钱和有地建数据中心是两回事。
#NEXTDC#Bloomberg#Funding#Commentary
精选理由
HKR-H靠'AI vs 睡眠'这个反差钩子过关,但HKR-K和HKR-R都挂了:正文没披露融资金额、客户名单或扩建计划。只能当一篇信息很薄的数据中心行业侧写,不是AI基础设施的硬新闻。
一句话点评
NEXTDC 老板说 AI 忙到没空睡觉,但有钱。
锐评
NEXTDC 老板说 AI 热潮让他忙到没空睡觉,但公司现金流充裕。这句话本身没什么信息量——有钱和有地建数据中心是两回事。正文没披露具体融资规模、客户名单或扩建计划,所以这点先别太激动。Bloomberg 的报道通常有独家信源,但这篇更像高管软性表态,缺乏可验证的硬数据。对 AI 从业者来说,这条新闻的价值在于侧面印证数据中心需求确实在涨,但别拿它当投资或选址依据。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
03:46
38d ago
Hacker News 首页· rssEN03:46 · 05·07
ProgramBench:让语言模型从零重建整个程序,结果全军覆没
现有编程评测只测修一个 bug 或写一个函数,但实际场景里 agent 要自己搭整个项目的架构。ProgramBench 把 200 个任务(从命令行小工具到 FFmpeg、SQLite、PHP 解释器)扔给模型,只给源码和文档,要求重建出行为完全一致的程序。评测用 agent 自动生成测试用例,不限制实现方式。结果最好的模型也只让 3% 的任务通过了...
#Code#Benchmarking#ProgramBench#Research release
精选理由
HKR-H 通过,因为“从零重建程序”这个角度比普通代码评测更有话题性。HKR-K 只限于评测机制本身;规模、模型名单和结果都没公开,所以放在 all 层级就够了。
一句话点评
给模型源码和文档,让它从头重建出行为一致的程序,结果最好的模型也只让3%的任务全过。
锐评
ProgramBench 把编程评测从修 bug 或写函数升级到“搭整个项目架构”。200 个任务从命令行小工具到 FFmpeg、SQLite、PHP 解释器,只给源码和文档,要求模型重建出行为完全一致的程序。评测用 agent 自动生成测试用例,不限制实现方式。结果:9 个模型没有一个能完全解决任何任务,最好的模型也只让 3% 的任务通过了全部测试(95% 的测试用例)。模型倾向于写单文件、大而全的实现,跟人类写的代码结构差很远。 这个基准的难度确实高,但也要注意:它测的是“行为一致”,不是“代码质量一致”,而且 200 个任务里包含像 PHP 解释器这种大型项目,模型失败不意外。正文没披露每个任务的测试用例数量和质量,也没说 agent 生成测试用例的覆盖率,这点先别太激动。如果是真的,这个基准比 SWE-bench 更贴近“让 agent 独立干活”的终极场景。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
03:29
38d ago
● P1彭博科技· rssEN03:29 · 05·07
Moonshot AI 在美团领投融资轮中估值达 200 亿美元
月之暗面(Moonshot AI)又拿钱了,这次大约融了 20 亿美元,估值直接拉到 200 亿美元。标题说美团是领投方,但正文没披露具体投资人名单、各自投了多少、出让了多少股份,也没说钱打算怎么花。这个估值信号很直接——市场对中国 AI 创业公司的胃口还很大,但信息缺口也不小,先别急着下结论。
#Agent#Moonshot AI#Meituan#Kimi
精选理由
Bloomberg 的消息,Moonshot AI 拿了约 20 亿美元,估值干到 200 亿,标题说美团领投。我会先打个折:正文没写美团之外还有谁、股权怎么分、资金用途也没提,所以这轮到底多“美团”还看不清。但不管怎样,这个估值数字本身就说明资本还在往头部模型公司猛灌,对国内 AI 圈的资金流向和算力竞争是个明确注脚。
一句话点评
Moonshot AI 拿了美团领投的新钱,估值冲到 200 亿美元,但两家报道都没说清楚这轮融了多少钱、钱要花在哪。
锐评
Moonshot AI 这轮融资由美团领投,估值到了 200 亿美元。TechCrunch 说融了 20 亿美元,但 Bloomberg 的正文没提具体金额,两边数字对不上,先别急着当定论。200 亿这个估值放在国内大模型创业公司里已经很高了,说明资本还在押注 Kimi 聊天机器人能跑出来。 不过两篇报道都没披露 Moonshot 现在的收入、用户规模或者模型性能对比,也没说美团这笔投资是纯财务还是带业务绑定。开源需求在涨这个说法来自 TechCrunch 的标题,正文里没有展开,缺细节支撑。 还缺的关键信息:这轮融资后 Moonshot 的现金流能撑多久,以及 Kimi 跟字节豆包、百度文心这些竞品相比到底差在哪、好在哪。
HKR 分解
hook knowledge resonance
打开信源
97
SCORE
H1·K1·R1
03:26
38d ago
AI HOT 精选· aihot-apiZH03:26 · 05·07
卡兹克公开自己的AI信息源,免费追踪平台上线
公众号顶流博主卡兹克(@Khazix0918)公开了他日常用的AI信息源,并上线了免费追踪平台 aihot.virxact.com,无需登录就能用。平台按时间线展示,分类整合了官方信源、优质博主、推友、公众号监测和AI日报。想跟顶流博主保持信息同步,直接看这个站就行。正文没披露具体收录了多少源、更新频率多快、以及维护规则。
#Khazix#Product update
精选理由
HKR三项都勉强通过:这是一个小型的AI信息追踪工具,不是核心模型或平台更新。数据源数量、刷新频率和维护模式都没披露,所以分数压在60–71区间。
一句话点评
卡兹克把他日常刷的AI信息源整理成了一个免费追踪站,不用登录就能看,按时间线排好,分了官方、博主、公众号和日报几类。对想省时间找高质量AI信息的人来说挺实用。但正文没披露收录了多少源、更新频率多快、以及维护规则,长期能不能保持质量还不确定。短评:信息源聚合站,省了你自己筛,但维护力度未知。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
02:59
38d ago
r/LocalLLaMA· rssEN02:59 · 05·07
Qwen3.6 27B 去审查版 v2 发布:拒绝率降到 6%,保留完整 15 步 MTP
一个基于 Qwen3.6 27B 的去审查微调版 v2 发布了,核心指标是 KLD 0.0021(分布偏移很小,基本没破坏原模型能力),拒绝回答敏感问题的比例只有 6/100(原版通常更高)。还保留了完整的 15 步 MTP(多 token 预测,生成速度更快)。格式有 Safetensors、GGUF 和 NVFP4(适合低显存推理)。但正文被 Re...
#Inference-opt#Safety#Qwen#Reddit
精选理由
这是一条LocalLLaMA社区的小众模型发布,标题信息完整但正文因Reddit 403没披露下载地址和评测方法,验证门槛高,所以分数压在60以下。
一句话点评
去审查版 Qwen3.6 27B,拒绝率仅 6%,能力几乎无损。
锐评
这是一个基于 Qwen3.6 27B 的去审查微调版 v2,核心卖点是 KLD 仅 0.0021(分布偏移极小,基本没破坏原模型能力),拒绝回答敏感问题的比例只有 6/100(原版通常更高)。还保留了完整的 15 步 MTP(多 token 预测,生成速度更快)。格式提供 Safetensors、GGUF 和 NVFP4(适合低显存推理)。 但正文被 Reddit 屏蔽(403),没有披露下载链接、训练数据、评估方法,也没说用了什么偏好算法。KLD 0.0021 这个数字很漂亮,但没说明是在什么测试集上算的,可能只是某个窄分布下的结果。6% 的拒绝率也需要看具体 prompt 集——如果全是简单问题,这个数字意义不大。 对本地部署玩家来说,如果真能保持原模型能力同时大幅降低拒绝率,那确实省事。但信息缺口太大,建议等第三方评测或作者补全细节再决定是否下载。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R1
02:59
38d ago
彭博科技· rssEN02:59 · 05·07
特朗普幕僚长表态:美国政府不会在AI竞赛里“选冠军”
白宫幕僚长苏西·威尔斯说,美国不会在AI竞赛中指定赢家或输家。文章提到有AI政策指令正在路上,但没披露具体内容、发布时间和执行机制——也就是说,目前只有一句表态,没有落地细节。对从业者来说,这意味着短期内美国政府不会用行政手段直接扶持某家公司或某个技术路线,但“不选冠军”不等于不监管,具体怎么管还得等后续文件。
#Susie Wiles#Donald Trump#White House#Policy
精选理由
彭博社信源权威,白宫幕僚长给出明确的 AI 竞争立场,所以 HKR 三项勉强过关。但正文缺指令原文、时间表和执行细节,只能算一条常规政策报道,信息密度不够高。
一句话点评
白宫表态不指定AI赢家,但没给具体政策,先别当利好。
锐评
白宫幕僚长苏西·威尔斯说美国不会在AI竞赛里指定赢家或输家,意思是短期内政府不会用行政手段直接扶持某家公司或某个技术路线。但这句话目前只有表态,正文没披露任何具体政策内容、发布时间和执行机制——信息缺口很大。对从业者来说,“不选冠军”不等于不监管,出口管制、芯片法案、反垄断这些工具都还在桌上。后续要看真正的政策指令长什么样,现在只能算一个方向性信号,落地细节为零。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
02:05
38d ago
● P1机器之心 · 公众号· rssZH02:05 · 05·07
马斯克宣布 xAI 解散,Grok 并入 SpaceXAI,22 万张 GPU 算力租给 Anthropic
马斯克确认 xAI 解散,Grok 和 X 平台相关业务全部并入新实体 SpaceXAI。同时,SpaceX 和 Anthropic 签了协议,Claude 将接入 Colossus 1 超算——超过 22 万张 Nvidia GPU、300 兆瓦的算力集群。对用户来说最直接的变化是配额:Claude Code 的五小时速率限制翻倍,Pro 和 Max...
#Code#Inference-opt#xAI#SpaceX
精选理由
我会先打个折:目前只有单一信源,还没看到 Anthropic 或 SpaceX 的官方公告,所以先不拉满。但消息本身冲击力很强——xAI 解散、Grok 并入 SpaceXAI,Colossus 1 那 22 万张 GPU 和 300 兆瓦算力直接租给 Anthropic,等于把自家训练底座送给了对手。对开发者来说,Claude Code 五小时速率翻倍、Pro 和 Max 高峰配额限制移除是马上能感知的变化。正文没披露租约时长和价格,也没说 Grok 后续怎么迭代,这些缺口让消息还差一口气,但已经够格进 p1。
一句话点评
马斯克把 xAI 解散并入 SpaceXAI,22 万张 GPU 租给 Anthropic,Claude 用户配额直接翻倍。但正文被微信验证页挡了,具体条款和价格都没看到。
锐评
这条消息的核心就一件事:xAI 不玩了,家当全给了 SpaceXAI,而最值钱的家当——Colossus 1 超算那 22 万多张 GPU、300 兆瓦的算力——转手租给了 Anthropic。对 Claude 用户来说,最直接的好处是 Claude Code 的五小时速率限制翻倍,Pro 和 Max 套餐的高峰期限流也取消了。这等于 Anthropic 一夜之间拿到了顶级算力,不用自己建数据中心就能大幅提升服务容量。 但这条新闻有个硬伤:原文被微信的环境验证页挡住了,我只能看到摘要里的信息。摘要没提这笔租约的期限、价格,也没说 SpaceXAI 接手后 Grok 和 X 平台的业务会怎么调整。22 万张 GPU 是个很大的数字,但租出去多少、留多少自用,正文没披露。另外,xAI 解散是彻底关门还是换壳,人员怎么安置,这些关键细节都看不到。 我会先打个折:配额翻倍听起来不错,但得看实际高峰时段能不能稳住。算力租赁这种事,签了协议和真正跑起来是两码事。等看到完整条款和用户实测数据再下判断。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
01:58
38d ago
r/LocalLLaMA· rssEN01:58 · 05·07
DeepSeek v4 Pro 搭 Roo Code 跑几小时烧掉 10 美元,跟 Opus 差不多贵了
Reddit 用户说 DeepSeek v4 Pro 配合 Roo Code(一个在 VS Code 里让模型自动写代码的工具),开了“高思考”模式,两三个小时就花了 10 美元,成本几乎赶上 Claude Opus。正文没披露具体用了多少 token、单价多少、跑的是什么任务,所以没法判断是模型本身贵还是调用太频繁。如果真是这个价,那 DeepSee...
#Code#Tools#Reasoning#DeepSeek
精选理由
HKR-H 和 HKR-R 理由充分:DeepSeek 这种预算模型花到接近 Opus 的价格,标题本身就有点击价值,而且对用 agent 写代码的人成本敏感。HKR-K 偏弱,因为只披露了两小时 10 美元,token 用量、单价和具体任务都没给,没法验证成本到底高在哪。
一句话点评
DeepSeek v4 Pro 开高思考模式,两三个小时烧掉10美元,成本直逼Opus。
锐评
Reddit 用户实测,DeepSeek v4 Pro 配合 Roo Code(VS Code 里让模型自动写代码的工具)并开启“高思考”模式,两三个小时就花了 10 美元,成本几乎赶上 Claude Opus。正文没披露具体用了多少 token、单价多少、跑的是什么任务,所以没法判断是模型本身贵还是调用太频繁。如果真是这个价,那 DeepSeek 的性价比优势就大打折扣了。目前信息缺口明显:没有 token 消耗量、没有任务类型、没有对比基准。建议等更多用户晒出账单明细再下结论,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
01:33
38d ago
AI HOT 精选· aihot-apiZH01:33 · 05·07
用 Chrome 调试 Codex App 的 3 步技巧
退出 Codex App,在命令行加参数 `--remote-debugging-port=8315` 启动,然后 Chrome 打开 `chrome://inspect` 就能连上调试工具。正文没提支持哪些版本或有没有安全限制,自己试的时候注意下。
#Code#Tools#dotey#Chrome
精选理由
HKR-H 和 HKR-K 通过:这是一个具体的 Codex 调试技巧,给了端口号和入口地址,开发者能照着做。HKR-R 不通过:正文没披露版本范围、安全限制或更大的产品变化,信息缺口明显,所以留在 all 层级。
一句话点评
短评:给 Codex 套上 Chrome 调试器,适合想扒 AI 编程工具内部逻辑的人。 点评:dotey 分享了一个实用技巧:退出 Codex App 后,用命令行加参数 `--remote-debugging-port=8315` 启动,再在 Chrome 打开 `chrome://inspect` 就能连上 DevTools。这对想观察 Codex 如何调用模型、处理代码上下文的开发...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
01:29
38d ago
AI HOT 精选· aihot-apiZH01:29 · 05·07
Flue框架:用TypeScript写Claude Code风格智能体
Flue是一个新的TypeScript框架,帮你搭建类似Claude Code那种能自己跑流程的智能体。安装方式很特别:直接fetch一个start.md文件就能开始。但正文没披露许可证、版本号、维护者是谁,也没有跑分或对比数据,所以想用在生产环境还得再观望。
#Agent#Code#Flue#Claude
精选理由
HKR-R 通过,因为 TypeScript 智能体和 Claude Code 风格工作流对开发者有实际吸引力。HKR-H/K 不通过:正文只有一个安装入口,没有维护方、许可证、版本或可复现的测试结果。
一句话点评
短评:安装方式很酷,但信息太少,生产慎用。 Flue 是一个新的 TypeScript 框架,号称能帮你搭出类似 Claude Code 那种能自己跑流程的智能体。亮点是安装方式:直接 fetch 一个 start.md 文件就能开始,挺有 Geek 范儿。但正文没披露许可证、版本号、维护者是谁,也没有任何跑分或对比数据,所以想用在生产环境还得再观望。如果是真的,对喜欢 TypeScrip...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
01:15
38d ago
彭博科技· rssEN01:15 · 05·07
韩国股市超越加拿大,升至全球第七
韩国股市总市值超过加拿大,成为全球第七大股票市场。彭博提到AI芯片需求是推手之一,但正文没披露具体市值数字、超越发生的时间点,也没点名哪些公司受益。
#South Korea#Canada#Bloomberg#Commentary
精选理由
HKR-H靠位次变化过关,但HKR-K缺市值、时间点和公司层面的证据,信息缺口明显。HKR-R弱,因为故事停留在市场指数层面,没有落到AI实践上。
一句话点评
韩国股市总市值超过加拿大,升至全球第七,AI芯片需求是推手之一。
锐评
韩国股市总市值超过加拿大,升至全球第七,彭博把原因部分归到AI芯片需求上。这个排名变动本身不算意外——韩国半导体出口一直强劲,三星、SK海力士又是英伟达供应链上的关键角色。但正文没披露具体市值数字、超越发生的时间点,也没点名哪些公司受益,信息缺口不小。如果只看这个标题,容易误读成“韩国AI概念股全面爆发”,实际更可能是几家头部芯片厂撑起大盘。对关注亚太市场轮动的人是个信号:韩国正在吃掉一部分原本流向台湾或日本的半导体资金。但缺少数据支撑前,建议把它当趋势线索,别当交易依据。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
01:05
38d ago
彭博科技· rssEN01:05 · 05·07
AI芯片需求推高股价,澜起科技超越宁德时代成最贵两地上市股
澜起科技(Montage Technology)在AI芯片需求推动下股价大涨,超越宁德时代成为A+H两地上市股中估值最贵的公司。正文没披露具体溢价幅度、股价涨幅和时间窗口,但信号很直接:AI芯片概念在A股的热度已经压过了新能源龙头。
#Montage Technology#CATL#Commentary
精选理由
来源是彭博,有权威性;HKR-H靠“超越宁德时代”这个对比落地。HKR-K很薄:没给溢价、股价变动或时间窗口;AI角度只停留在芯片需求估值上,属于低价值市场快讯。
一句话点评
AI芯片概念在A股的热度已经压过了新能源龙头宁德时代。
锐评
澜起科技超越宁德时代,成为A+H两地上市股中估值最贵的公司。信号很直接:AI芯片概念在A股的热度已经压过了新能源龙头。正文没披露具体溢价幅度、股价涨幅和时间窗口,所以这个“最贵”到底贵多少、持续了多久,目前只能当风向标看,不能直接当交易信号。如果是真的,说明资金正在从确定性高的新能源切换到想象空间更大的AI芯片,但缺乏交易细节意味着短期情绪可能被放大。对从业者来说,这条信息更值得关注的是市场定价权的转移,而不是澜起本身的基本面变化。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
00:40
38d ago
r/LocalLLaMA· rssEN00:40 · 05·07
useknockout:开源去背景+超分API,MIT协议,跑在Modal上
useknockout 发了 v0.6.0,一个 FastAPI 服务包了 20 个接口。去背景用的是 BiRefNet 加 pymatting,超分支持 Swin2SR 或 Real-ESRGAN,能放大 2 倍或 4 倍。模型权重直接打包进 Docker 镜像,方便自己用 GPU 部署,还提供了一个免费测试接口。正文没披露具体延迟和成本,但跑在 M...
#Vision#Tools#useknockout#Modal
精选理由
一个开源的去背景+超分工具,MIT 协议,能自托管,Beta 期还免费调用,对开发者很友好。但正文没披露用户量、基准测试成绩,也没和 remove.bg/Topaz 做量化对比,所以分数压在 60–71 区间。
一句话点评
去背景和超分二合一的开源API,模型权重直接打包进Docker,适合自部署。
锐评
useknockout v0.6.0 把去背景(BiRefNet + pymatting)和超分(Swin2SR / Real-ESRGAN,2x/4x)打包成一个 FastAPI 服务,20 个接口,模型权重直接塞进 Docker 镜像,省去下载步骤。跑在 Modal 上,还提供了一个免费测试接口。对需要自建去背景/超分 API 的团队来说,省了整合多个模型的工作量。但正文没披露具体延迟和单次推理成本,跑在 Modal 上按秒计费,如果超分用 Real-ESRGAN 的 4x 模式,显存和耗时都不低。另外 BiRefNet 对复杂前景(头发丝、透明物体)的抠图效果不如商业方案,这点先别太激动。如果是高频调用,建议先压测再上生产。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
00:34
38d ago
r/LocalLLaMA· rssEN00:34 · 05·07
RTX 5090 vs M5 Max 128GB:本地跑智能体编程,选速度还是选内存?
Reddit 用户在纠结买 RTX 5090 还是 M5 Max 128GB 来本地跑 Qwen 3.6 27B 做智能体编程。5090 速度大约是 M5 Max 的三倍,但显存只有 32GB,只能塞下 Q4/Q5 量化模型,上下文窗口约 20 万 token;M5 Max 内存 128GB,可以跑更高精度的量化,还能同时驻留多个模型,但一次编码任务跑...
#Agent#Code#Inference-opt#Qwen
精选理由
这是一条 Reddit 买硬件求助帖,不是发布或可复现测试。价值在于给出了本地跑智能体时 RTX 5090 和 M5 Max 的实用取舍:5090 快但显存只有 32GB,只能跑 Q4/Q5 量化;M5 Max 内存 128GB 能上更高量化或同时挂多个模型。作者实测 M4 Max 一次功能实现花了 1 小时 20 分钟,5090 速度大约是它的 3 倍。信息够具体,但来源是个人经验,不是严谨评测,所以分数压在 60–71 区间合理。
一句话点评
5090快三倍但显存小,M5 Max内存大但慢,选哪个看你要速度还是容量。
锐评
Reddit用户纠结本地跑Qwen 3.6 27B做智能体编程,在RTX 5090和M5 Max 128GB之间二选一。5090速度大约是M5 Max的三倍,但显存只有32GB,只能塞Q4/Q5量化模型,上下文窗口约20万token;M5 Max内存128GB,可以跑更高精度量化,还能同时驻留多个模型,但一次编码任务跑了1小时20分钟。 关键数字:速度差3倍、内存差4倍、32GB vs 128GB。这个对比对本地跑模型的开发者很实用——如果你主要跑单模型、追求响应速度,5090更合适;如果需要同时加载多个模型或跑长上下文,M5 Max的大内存是刚需。 缺什么:正文没披露具体任务复杂度、量化精度对比、功耗和散热表现,也没说M5 Max跑的是哪个量化等级。另外,5090的32GB显存跑27B模型,Q4量化下实际可用上下文长度可能比宣称的20万token更短,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
00:13
38d ago
彭博科技· rssEN00:13 · 05·07
Anthropic 想让 Claude 更讨消费者喜欢
Bloomberg 报道 Anthropic 正在把 Claude 从企业工具往日常消费场景推,说 Claude 在消费者端已经有了一些进展。但正文没披露具体功能、定价、上线时间或用户规模。关键看点其实是记忆、工具调用和移动端体验——这些才是决定一个聊天机器人能不能被普通人日常用起来的门槛。信息缺口挺大,目前只能当方向信号看。
#Agent#Tools#Memory#Anthropic
精选理由
Bloomberg 的报道权威性够,加上 Anthropic 明确转向消费者市场,所以 H 和 R 都成立。但正文几乎没给实质信息——没有功能、没有数字、没有定价、没有发布时间,所以 K 不成立,分数只能压在 60–71 这个区间。真正值得盯的是 Claude 会不会补齐记忆、工具和移动端体验,但正文没提,这点先别太激动。
一句话点评
Anthropic 想把 Claude 从企业工具推向日常消费场景,但正文没披露具体功能、定价或上线时间。
锐评
Bloomberg 这条消息更像一个方向信号,不是产品公告。Anthropic 要做消费端,关键看三个门槛:记忆(Claude 能不能记住用户偏好)、工具调用(能不能替用户执行操作)、移动端体验(App 好不好用)。正文没披露任何用户规模或留存数据,也没说 Claude 目前在消费者端到底做了什么。如果是真的,这意味着 Anthropic 在跟 ChatGPT 抢日常使用场景,但信息缺口太大,目前只能当战略意图看,不能当产品判断。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
00:00
38d ago
● P1OpenAI 博客· rssEN00:00 · 05·07
OpenAI 在 ChatGPT 推出 Trusted Contact 安全功能
OpenAI 给 ChatGPT 加了一个可选的安全功能。成年人可以在设置里指定一位信任的联系人,比如家人或朋友。当系统自动监测和人工审核都判定你的对话里出现了严重的自我伤害倾向时,ChatGPT 会通知这位联系人。通知内容很克制,只说出现了需要关心的自伤话题,不会透露聊天细节。正文没披露具体的检测机制和误报率,只说审核团队会争取在一小时内完成判断。这...
#Safety#OpenAI#ChatGPT#Product update
精选理由
H、K、R 三条都站得住:ChatGPT 的安全钩子很具体,也容易引发讨论。重要性给到 73 分、放在 featured 里是合适的,因为功能本身有话题性,但检测方式、配置流程和上线范围全是空白,没法往更高里打。
一句话点评
OpenAI 给 ChatGPT 加了个“信任联系人”功能,用户可指定一位亲友,当系统判定对话涉及严重自伤风险时,经人工审核后会通知对方。
锐评
这个功能本质上是把危机干预里的“社会支持”做成产品开关。用户自愿设一个信任联系人,系统用自动化监控加人工复核来判断是否触发通知。通知内容很克制,只说可能涉及自伤,不给聊天记录,还附上怎么聊敏感话题的指南。OpenAI 说审核团队争取在一小时内完成复核,但正文没披露误报率、审核团队规模和实际响应时间的中位数。这点先别太激动——它不替代专业危机服务,只是多一层提醒。还缺的关键信息是:触发阈值怎么定、人工审核的标准一致性如何保证,以及用户会不会因为担心被通知而不敢在对话里说真话。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
00:00
38d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·07
OpenAI 和 Cursor 都从 Skill 转向 Plugin,但一个想锁工作流,一个想防被替代
OpenAI 和 Cursor 在 2026 年 4-5 月几乎同时把重心从 Skill 转向 Plugin。Skill 的盈利死结在于:它是明文文件,买家付完就能贴到 GitHub 上,复制成本为零,定价权也为零;做成托管服务等于卖 AWS 转售;数据飞轮也走不通。Plugin 比 Skill 多了三样东西:运行环境绑定、认证凭证、分发渠道,本质是把...
#Agent#Tools#OpenAI#Cursor
精选理由
HKR-H 和 HKR-R 通过:对比钩子清晰,OpenAI 和 Cursor 的盈利转向直接击中从业者焦虑。HKR-K 偏弱,因为时间、规格、条款都没披露,所以落在 60-71 的评论区间。
一句话点评
OpenAI 和 Cursor 几乎同时从 Skill 转向 Plugin,但动机不同:OpenAI 怕模型变商品,想用 Codex 执行层锁住工作流;Cursor 怕被上游模型商(如 Anthropic)替代,想用 Plugin 生态建差异化。文章拆得清楚:Skill 是明文文件,复制零成本,没法收钱;Plugin 加了运行环境、认证和分发,把知识变成可收费的服务。关键数字:Codex 周...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
2026-05-06 · 星期三2026年5月6日
23:37
38d ago
The Verge · AI· rssEN23:37 · 05·06
马斯克最忠诚的人,成了他最大的软肋
Shivon Zilis 在 Musk 诉 Altman 案中出庭作证,确认自己是马斯克四个孩子的母亲。她曾在 2017 年起同时在 Tesla、Neuralink 和 OpenAI 工作。正文未披露完整证词内容及对案件走向的具体影响。
#Elon Musk#Sam Altman#Shivon Zilis#Commentary
精选理由
正文只交代了 Zilis 作证的事实,没有披露完整证词、对案件走向的影响,也没有涉及产品层面的后果,所以信息量够但深度不足,不上精选。
一句话点评
Shivon Zilis 出庭确认自己是马斯克四个孩子的母亲,并透露2017年起同时在特斯拉、Neuralink和OpenAI工作。
锐评
这条新闻的核心不是AI技术,而是Musk诉Altman案中一个关键证人的证词。Zilis是Musk的长期盟友,她的身份和跨公司工作经历可能成为法庭上质疑OpenAI早期治理结构的重要证据。正文未披露完整证词内容,所以目前只能确认她说了什么,无法判断对案件走向的具体影响。对于关注AI行业权力斗争的人,这是一条值得追踪的线索;但如果你只关心模型能力或产品,这条新闻暂时没有直接信息。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
23:16
38d ago
Product Hunt · AI· rssEN23:16 · 05·06
Unabyss:给 AI 装一个自动更新的“记忆层”,不用每次重新交代背景
Unabyss 是一个 MCP 原生的上下文层,能自动从你日常用的应用里提取、整理信息,然后通过 MCP 协议共享给任何 AI 工具。说白了就是:你设一次,以后 AI 就记住你的背景了,不用每次对话都重新说一遍“我是谁、我在做什么”。它支持细粒度权限控制,可以限制每个 AI 能看到哪些内容。目前标价免费,但正文没披露更新机制、支持哪些应用集成、上下文窗...
#Tools#Memory#Unabyss#Product update
精选理由
HKR-H 靠 MCP 原生自更新上下文这个钩子勉强过关,但 HKR-K 和 HKR-R 都不行:没机制、没定价、没上下文窗口大小、没测试数据。属于低价值的产品更新信息。
一句话点评
一个MCP原生的上下文层,自动从日常应用提取信息并共享给AI工具,省去每次重复交代背景。支持细粒度权限控制,标价免费。但正文没披露更新机制、支持哪些应用集成、上下文窗口大小,实际效果和兼容性待验证。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
23:04
38d ago
Hacker News 首页· rssEN23:04 · 05·06
DeepSeek V4 Pro 打75折,到5月31日
DeepSeek 把 V4 Pro 的 API 价格打了75%的折扣,持续到5月31日。打折后,输入(缓存命中)每百万 tokens 只要0.0036美元,缓存未命中0.435美元,输出0.87美元。对比原价,输入缓存命中从0.0145美元降到0.0036美元,缓存未命中从1.74美元降到0.435美元,输出从3.48美元降到0.87美元。这个价格在主...
#DeepSeek#Hacker News#Product update
精选理由
HKR三项都过:折扣钩子、截止日期、成本压力都到位。但正文只有HN摘要,没披露原价、折后价、上下文窗口和计费细则,信息量不足,所以不上精选。
一句话点评
DeepSeek V4 Pro API 打75折到5月底,输出每百万tokens只要0.87美元。
锐评
DeepSeek 把 V4 Pro 的 API 价格打了75%的折扣,持续到5月31日。打折后,输出每百万 tokens 只要0.87美元,输入缓存命中更是低到0.0036美元。对比原价,输出从3.48美元降到0.87美元,缓存未命中从1.74美元降到0.435美元。这个价格在主流模型中算很低了,尤其是缓存命中价格几乎可以忽略。不过要注意,这是限时折扣,不是永久降价。另外,V4 Pro 支持1M上下文窗口,最大输出384K tokens,功能上支持 JSON 输出、工具调用等。但正文没披露具体上下文窗口的计费细节,也没说折扣结束后价格会恢复到多少。如果是高频调用且能命中缓存,成本确实能压得很低。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
22:55
38d ago
彭博科技· rssEN22:55 · 05·06
新加坡议会承诺AI时代不搞“无就业增长”
新加坡议会全票通过一项动议,承诺在AI转型期间不会出现经济增长但就业不增长的局面。动议本身是政治表态,正文没披露具体就业指标、执行机制或时间表,所以目前更像一个方向性承诺,不是可追踪的政策。
#Singapore Parliament#CNA#Policy
精选理由
核心看点是新加坡国会用政治承诺回应AI替代焦虑,但正文只给了动议结果,没有就业指标、执行机制或时间表,信息密度偏低。对从业者来说,政策方向值得留意,但缺乏落地细节,暂时只能当信号看,不能当行动依据。
一句话点评
新加坡议会全票通过动议,承诺AI时代不会出现“有增长无就业”。目前只是政治表态,没有具体指标和执行机制。
锐评
新加坡议会全票通过一项动议,承诺在AI转型期间不会出现经济增长但就业不增长的局面。这本质上是一个政治表态,不是可追踪的政策。正文没有披露任何具体就业指标、执行机制或时间表,所以目前更像一个方向性承诺。对于AI从业者来说,这条新闻的信号意义大于实际约束力——新加坡政府至少在公开层面把“就业不增长”列为不可接受的结果,后续可能会影响企业部署AI时的合规预期。但缺的东西很多:没有说怎么衡量“就业不增长”,没有说企业如果裁员会有什么后果,也没有说政府会拿什么预算来兜底。如果后续配套细则出来,比如要求企业提交AI替代岗位的评估报告,那才是真正值得关注的政策落地。目前先当风向标看,别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R1
22:38
38d ago
Hacker News 首页· rssEN22:38 · 05·06
特朗普政府AI监管政策转向引发争议
The Verge 专栏说特朗普政府的 AI 监管态度来了个 180 度大转弯,从之前放松管制变成要加码,这让白宫 AI 与加密货币主管 David Sacks 很难受。文章标题用了“crash and burn”,但正文没披露具体翻车事件或细节,只说是政策转向导致他“噩梦成真”。目前 HN 上有 30 分和 6 条评论,讨论热度不高。
#David Sacks#The Verge#Trump administration#Policy
精选理由
H和R通过:标题把David Sacks放在白宫受挫的冲突框架里,且涉及AI模型审查与政府任命,对关注政策的人有吸引力。K不通过:正文只有RSS摘要,没披露任何审查机制、文件或具体事件,信息量不足。
一句话点评
政策转向让Sacks在内部失势,但正文没给具体翻车事件。
锐评
The Verge专栏标题用了“crash and burn”,但正文没披露任何具体翻车事件或细节,只说特朗普政府对AI监管态度从放松转向加码,让白宫AI主管David Sacks“噩梦成真”。目前HN上只有30分和6条评论,讨论热度不高。这篇更像一篇政策转向的评论,而非独家爆料。如果你关心美国AI监管风向,可以留意这个信号——但别指望从这篇文章里看到Sacks具体怎么栽跟头的。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
22:31
38d ago
Product Hunt · AI· rssEN22:31 · 05·06
Basedash 把数据分析能力打包成 MCP 服务器,让 Claude、Cursor 等 AI 工具直接查你的数据库
Basedash 上线了一个 MCP 服务器,本质上是把它的 BI 平台包装成一个标准接口,让 Claude、Cursor、ChatGPT 等支持 MCP 的 AI 客户端能直接查询你已连到 Basedash 的数据库、数仓和 SaaS 工具。用户用自然语言就能拉实时数据、对比用户群、生成图表。官方说权限沿用团队已有的访问控制,但正文没披露具体的数据源...
#Agent#Tools#Basedash#Product Hunt
精选理由
一个很小的Product Hunt产品更新:只披露了数据分析走MCP接入。HKR-R靠权限/审计焦虑过关,HKR-H/K因为没具体机制或上线细节而不过关。
一句话点评
BI 工具 Basedash 把数据查询包装成 MCP 接口,让 Claude 等 AI 直接问数据库。
锐评
Basedash 把自家 BI 平台包装成 MCP 服务器,等于给 Claude、Cursor 这些 AI 客户端开了一个“数据后门”——用户用自然语言就能查已连到 Basedash 的数据库、数仓和 SaaS 工具,拉实时数据、对比用户群、生成图表。官方说权限沿用团队已有的访问控制,这点先别太激动,因为正文没披露具体支持哪些数据源、有没有额外计费、以及 MCP 驱动的查询是否走独立审计日志。对团队来说,好处是省了来回切工具和写 SQL 的时间;风险是自然语言查询容易产生模糊或错误的 SQL,且权限边界在 MCP 场景下可能被绕过。如果是小团队快速看数,这个方案挺省钱;但金融、医疗等需要严格审计的场景,建议等官方补上查询日志和源列表再上生产。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
22:14
38d ago
FT · 科技· rssEN22:14 · 05·06
马斯克曾想挖奥特曼去特斯拉,后来在OpenAI闹翻了
据Shivon Zilis(马斯克旗下公司高管)在法庭证词中透露,马斯克在跟奥特曼闹翻之前,曾试图挖他去特斯拉任职。这篇FT报道把这件事跟两人后来在OpenAI发展方向上的争执以及马斯克起诉OpenAI联系了起来。但正文被付费墙挡住了,没披露具体是什么职位、什么时间、什么条件。
#Elon Musk#Sam Altman#Shivon Zilis#Personnel
精选理由
核心看点是马斯克挖Altman这个八卦钩子,加上Zilis证词提供了一个新事实。但正文没披露职位、时间、条件,也没有产品或治理层面的影响,所以分数压在60-71区间。信息缺口明显,先别过度解读。
一句话点评
法庭证词爆料,但正文被付费墙挡住,缺关键细节。
锐评
FT这篇报道的核心信息来自Shivon Zilis的法庭证词:马斯克在跟奥特曼闹翻之前,曾试图挖他去特斯拉任职。但正文被付费墙完全挡住,没披露具体是什么职位、什么时间、什么条件。所以这条新闻目前只能当八卦看——它把这件事跟两人后来在OpenAI发展方向上的争执以及马斯克起诉OpenAI联系了起来,但缺少支撑判断的细节。对AI从业者来说,这条信息本身没有技术或商业启示,更多是人物关系背景。如果后续有更多证词或文件披露具体职位和条件,才可能看出马斯克当时对AI人才的布局思路。目前信息缺口太大,不值得据此做任何判断。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
21:57
38d ago
TechCrunch AI· rssEN21:57 · 05·06
Barry Diller 说信任 Sam Altman,但 AGI 快来了,信任没用
IAC 主席 Barry Diller 公开力挺 OpenAI CEO Sam Altman,但他同时警告:AGI 一旦接近,信任就变得无关紧要,必须提前装好护栏。Diller 没有具体说护栏是什么、什么时候装、怎么验证效果。正文没披露他是否了解 OpenAI 内部的安全流程,也没给出 AGI 的时间表。
#Safety#Alignment#Barry Diller#Sam Altman
精选理由
H和R通过:标题有冲突,话题踩中AGI治理焦虑。K不通过:只有一句摘要级引语,没有机制或可验证的数字。
一句话点评
IAC主席Diller挺Altman,但说AGI快来了,信任没用,得提前装护栏。
锐评
Barry Diller(IAC主席)在WSJ活动上公开力挺Sam Altman,但他真正想说的是:AGI一旦接近,信任就无关紧要了,必须提前装好护栏。这话本身没错,但问题在于全文没披露任何具体方案——护栏是什么、谁来装、什么时候装、怎么验证效果,一概没提。Diller也没说他是否了解OpenAI内部的安全流程,更没给出AGI的时间表。所以这条新闻的价值在于:一个非AI圈的老牌商业大佬开始公开喊“AGI需要硬约束”,说明安全议题正在从技术圈扩散到董事会层面。但如果你指望从中读到可操作的安全方法论,正文给不了。信息缺口很明显:没有具体技术方案、没有时间线、没有验证机制。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
21:51
38d ago
r/LocalLLaMA· rssEN21:51 · 05·06
Unsloth 给 Qwen3.6 嫁接 MTP 模块,本地推理速度提升 6%-50%
Reddit 用户 havenoammo 上传了嫁接 MTP(多 token 预测)模块的 Qwen3.6-35B-A3B 模型 GGUF 版,并晒出本地跑分。在单张 5090 FE 上,Q4 量化从 215 涨到 228 token/秒,提升约 6%;5090+3090 组合下 Q8 从 148 涨到 152 token/秒;另一用户用 2 张 50...
#Inference-opt#Qwen#Hugging Face#llama.cpp
精选理由
这是一条 Reddit 上传帖,不是官方 Qwen 发布。核心看点是 MTP 嫁接后的本地速度变化,数字具体但范围窄:只测了 5090 FE 和混合显卡两种配置,Q4 涨 6% 不算惊艳,Q8 在混合卡上跳 50% 但正文没解释为什么。对想自己跑 GGUF 的人有参考价值,但别当通用结论。
一句话点评
单卡5090跑Qwen3.6-35B,MTP模块白送6%速度,几乎零成本。
锐评
Reddit用户havenoammo把MTP(多token预测,即模型一次猜多个词)嫁接到Qwen3.6-35B-A3B上,放出GGUF量化版并晒了本地跑分。单张5090上Q4量化从215涨到228 token/秒,提升约6%;5090+3090组合下Q8从148涨到152 token/秒。另一用户用2张5070 Ti+3090更夸张,从110跳到165 token/秒,但原文没解释配置差异,这点先别太激动。MTP原本是训练阶段的技巧,现在被强行塞进推理,效果居然正向,说明Qwen3.6的架构对这类嫁接容忍度高。不过正文没披露显存占用变化、生成质量是否下降,也没说MTP模块本身有多大。如果只是白嫖6%且不影响输出,那对本地部署用户挺划算。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
21:43
38d ago
TechCrunch AI· rssEN21:43 · 05·06
Snap 与 Perplexity 的 4 亿美元合作悄悄终止
Snap 在季度财报里提了一句,去年 11 月宣布的那笔 4 亿美元交易已经“友好结束”。按原计划,Perplexity 的 AI 搜索会直接嵌进 Snapchat,Perplexity 要在一年内付给 Snap 4 亿美元的现金加股权。现在合作在 Q1 就停了,双方都没说具体原因。我会先打个折:公告里只给了“友好结束”这四个字,没披露是谁先叫停、钱付...
#Tools#Snap#Perplexity#Snapchat
精选理由
4亿美元的合作说友好终止就终止,正文连个原因都没给,信息缺口很明显。对AI搜索公司来说,分销渠道是命门,这笔deal黄了说明抢入口没那么简单。分数卡在60-71的商务更新区间,因为缺终止原因、用户影响和替代方案。
一句话点评
4亿美元合作黄了,双方都说“友好分手”,但没提谁先撤。
锐评
Snap 在季度财报里轻描淡写一句:去年11月宣布的4亿美元合作已经“友好结束”。原计划是把 Perplexity 的 AI 搜索直接嵌进 Snapchat,Perplexity 一年内付给 Snap 4亿美元现金加股权。现在Q1就停了,双方都没说具体原因。 我会先打个折:公告里只给了“友好结束”四个字,没披露是谁先叫停、钱付了多少、有没有分手费。4亿美元对 Perplexity 这种估值几十亿的搜索公司不算小数目,但如果是分期付,实际损失可能没那么大。 缺的信息不少:合作终止是 Snap 觉得搜索嵌入效果不好,还是 Perplexity 觉得不值这个价?Snapchat 的 AI 功能(比如 My AI)会不会受影响?正文都没提。如果是 Perplexity 主动退出,说明它可能找到了更便宜的获客渠道;如果是 Snap 叫停,那它的 AI 战略可能又变了。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:26
38d ago
Hacker News 首页· rssEN21:26 · 05·06
苹果拿一条老规矩卡新软件:AI 生成的 App 算谁的?
苹果从今年 1 月开始用 App Store 审核条款 2.5.2 卡 AI 编程应用,Replit 和 Vibecode 的更新被拒,一个叫 Anything 的 App 直接被下架。核心矛盾是:AI 生成的代码在用户手机上才跑出来,苹果审核时看不到,没法保证安全。Replit 试过把生成的 App 预览放到外部浏览器里,苹果还是没放行。这事不只是 ...
#Apple#Policy#Commentary
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过。标题说苹果用旧规则卡新软件,但正文只给了 HN 的 13 分和 2 条评论,没有披露具体应用、规则条文或执行时间线,信息缺口太大,无法判断事件真实性和影响范围。
一句话点评
苹果用一条老规矩卡住了AI编程App,Replit和Vibecode更新被拒,Anything直接被下架。
锐评
苹果从1月开始用App Store审核条款2.5.2卡AI编程应用,Replit和Vibecode的更新被拒,一个叫Anything的App直接被下架。核心矛盾是:AI生成的代码在用户手机上才跑出来,苹果审核时看不到,没法保证安全。Replit试过把生成的App预览放到外部浏览器里,苹果还是没放行。 这事不只是App Store的审核问题。版本号、发布说明、bug报告、文档截图——整个软件分发体系都假设“软件发出去就不动了”。但AI编程App生成的代码每个用户都不一样,而且随时在变。苹果的审核流程没法检查一个“运行时才决定行为”的东西。 正文没披露苹果是否会推出针对AI生成代码的新审核规则,也没说Replit和Vibecode后续的应对方案。如果苹果坚持用旧规则卡新形态,这类App在iOS上基本没法正常更新。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
21:14
38d ago
Hacker News 首页· rssEN21:14 · 05·06
迪士尼乐园部署人脸识别入园
《卫报》报道迪士尼乐园在入口启用了人脸识别,标题玩了个“米老鼠在看着你”的梗。但正文没披露具体部署在哪个入口、用了哪家供应商、人脸数据保留多久、是否征得游客同意,以及覆盖范围有多大。对做AI或生物识别的人来说,关键缺口是缺乏任何生物特征治理细节——比如存储策略、脱敏方式、退出机制。这些信息缺失意味着目前只能当社会新闻看,没法评估技术合规性或隐私风险。
#Vision#The Guardian#Disneyland#Policy
精选理由
H 和 R 通过:迪士尼监控角度有话题性,隐私治理相关性强。K 不通过:范围、供应商、保存期限、同意机制都没披露,信息不足以支撑精选。
一句话点评
迪士尼乐园入口启用人脸识别,但正文没披露供应商、数据存多久、游客能否退出。
锐评
《卫报》报道迪士尼乐园入口启用了人脸识别,标题玩了个“米老鼠在看着你”的梗。但正文没披露具体部署在哪个入口、用了哪家供应商、人脸数据保留多久、是否征得游客同意,以及覆盖范围有多大。对做AI或生物识别的人来说,关键缺口是缺乏任何生物特征治理细节——比如存储策略、脱敏方式、退出机制。这些信息缺失意味着目前只能当社会新闻看,没法评估技术合规性或隐私风险。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
21:05
38d ago
彭博科技· rssEN21:05 · 05·06
马斯克曾考虑让奥特曼进特斯拉董事会,庭审爆料
庭审中陪审团得知,马斯克曾考虑拉拢Sam Altman加入特斯拉董事会。这是两人恩怨官司的最新爆料,但正文没披露具体时间、条件或Altman的回应。
#Elon Musk#Sam Altman#Tesla#Personnel
精选理由
HKR三项都达标,但正文只有一条RSS级别的法庭细节:一个没有时间、条件或回应的董事会席位想法。彭博社的权威性有帮助,但这仍然是纠纷中的花絮,算不上重大AI行业事件。
一句话点评
马斯克曾考虑拉Sam Altman进特斯拉董事会,这是两人官司的新料。
锐评
庭审爆料,马斯克曾考虑让Sam Altman进特斯拉董事会。这是两人恩怨官司的最新进展,但正文被Bloomberg paywall挡住,没披露具体时间、条件或Altman的回应。信息缺口很大:是收购OpenAI前的拉拢,还是后来和解的筹码?Altman是否接洽过?这些都没说。目前只能确认这是个法庭上的单方说法,未经交叉质证,可信度要打折。对AI从业者来说,这条新闻本身信息量有限,但反映了两人关系从合作到对簿公堂的戏剧性转折,以及科技圈高层人事博弈的复杂性。如果后续有更多细节流出,比如时间线和具体条件,才值得深入分析。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
20:47
38d ago
r/LocalLLaMA· rssEN20:47 · 05·06
Qwen3.6-35B-A3B 跑在 AMD 单卡上,VS Code 写 React 一次跑通
Reddit 用户用一块 AMD R9700 跑 Qwen3.6-35B-A3B-UD-Q5_K_XL 模型,在 VS Code 里配合 Copilot 写代码。上下文窗口开到 262144 token,一次喂了 18 万 token 的输入、生成 1 万 token,还调了工具函数。Vite React 应用第一次运行就成功,只有一个 Playwri...
#Code#Tools#Inference-opt#Qwen
精选理由
这是一个 Reddit 用户的单次实验报告,不是官方发布或基准测试,所以没给到 featured。但配置和速度数据具体,硬件门槛低,对想本地跑编码模型的用户有直接参考意义。正文没披露模型量化精度对质量的影响,也没对比其他本地方案。
一句话点评
35B模型跑出94-105 token/s,本地写代码够用了。
锐评
Reddit用户用一块AMD R9700跑Qwen3.6-35B-A3B-UD-Q5_K_XL,在VS Code里配合Copilot写代码,上下文窗口开到262k,一次喂了18万token输入、生成1万token,还调了工具函数。Vite React应用第一次运行就成功,只有一个Playwright测试需要手动修正。速度约94-105 token/s,对35B模型来说相当快,说明量化(Q5_K_XL)和MoE架构(A3B)在消费级显卡上确实能跑。但注意这是单用户单任务场景,生产环境并发或长上下文持续推理时性能会打折。正文没披露具体显存占用和功耗,也没说是否用到Flash Attention等优化。如果是真的,这个配置对个人开发者做代码辅助挺省钱,但离企业级部署还有距离。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
20:39
38d ago
r/LocalLLaMA· rssEN20:39 · 05·06
Zyphra 发了款 8B MoE 推理模型,活跃参数不到 1B,号称数学推理比肩 DeepSeek-V3.2 和 GPT-5-High
Zyphra 刚放出 ZAYA1-8B,一个混合专家(MoE)推理模型,每次推理只激活不到 10 亿参数。官方说它数学和推理能力超过很多更大的开源模型,甚至接近 DeepSeek-V3.2 和 GPT-5-High(配合测试时计算)。但正文没披露训练数据集、具体跑分和许可证,所以这些对比结论暂时没法验证。如果真能做到,那成本会非常低——毕竟活跃参数少,...
#Reasoning#Inference-opt#Zyphra#AMD
精选理由
HKR全过:小MoE做推理、活跃参数不到10亿、test-time compute,这些对本地模型玩家很有吸引力。分数保留64,因为训练集、评测表和许可证都没披露,信息缺口太大,没法给更高分。
一句话点评
一个只激活不到10亿参数的MoE模型,声称数学推理接近DeepSeek-V3.2和GPT-5-High,但没给训练数据、跑分和许可证,先别太激动。
锐评
Zyphra 新出的 ZAYA1-8B 是个混合专家(MoE)推理模型,每次推理只激活不到 10 亿参数。官方说它数学和推理能力超过很多更大的开源模型,甚至接近 DeepSeek-V3.2 和 GPT-5-High(配合测试时计算)。如果真能做到,那成本会非常低——毕竟活跃参数少,推理时显存和算力需求都小很多。但正文没披露训练数据集、具体跑分和许可证,所以这些对比结论暂时没法验证。另外,帖子来源是 Reddit 的 LocalLLaMA 板块,属于社区讨论,不是官方正式发布,信息可信度要打折。还缺什么?缺独立第三方跑分、模型权重下载链接、以及更详细的架构说明。如果是真的,对本地部署和低成本推理是个好消息,但建议等更多证据再下结论。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
20:07
38d ago
彭博科技· rssEN20:07 · 05·06
Arm 警告手机市场疲软,AI 数据中心增长勉强补坑
Arm 最新财报显示,智能手机业务拖累收入,但 AI 数据中心业务增长抵消了部分下滑。正文没披露具体销售指引、数据中心增速或手机业务占比,所以没法判断这个“抵消”到底能补多少。对 AI 从业者来说,Arm 在数据中心靠的是 CPU 架构授权,不是 GPU,这意味着它吃的是 AI 服务器里“配套”的份额,不是算力核心。手机疲软是长期趋势,AI 这块能撑多...
#Inference-opt#Arm#Commentary
精选理由
Bloomberg来源有权威性,H和R都过线,但正文是RSS摘要,缺预测数字、数据中心增速和手机业务占比。这是AI基础设施的商业信号,不是模型或产品更新,所以落在60–71区间。
一句话点评
Arm 靠 AI 数据中心拉业绩,但手机业务拖后腿,具体能补多少正文没给数。
锐评
Arm 最新财报说 AI 数据中心业务增长抵消了手机疲软,但正文没披露具体销售指引、数据中心增速或手机业务占比,所以没法判断这个“抵消”到底能补多少。对 AI 从业者来说,Arm 在数据中心靠的是 CPU 架构授权,不是 GPU,这意味着它吃的是 AI 服务器里“配套”的份额,不是算力核心。手机疲软是长期趋势,AI 这块能撑多久、撑多大,取决于服务器出货量,而服务器出货量又受资本开支节奏影响。如果数据中心增速只有个位数,那“抵消”可能只是杯水车薪。缺的是分业务线的收入占比和增速,以及管理层对下季度的具体指引。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
18:23
38d ago
TechCrunch AI· rssEN18:23 · 05·06
Greg Brockman 亲述:Elon Musk 当年是怎么离开 OpenAI 的
OpenAI 联合创始人 Greg Brockman 在法庭上回忆了 2017 年 8 月的一次关键会议:当时 OpenAI 还是个小非营利研究实验室,正讨论成立营利实体来筹钱做 AGI。Musk 要求完全控制公司,还刚给每位联合创始人送了辆 Model 3——Brockman 觉得这是在拉拢人心。与此同时,Sam Altman 也在争取支持。研究负责...
#Greg Brockman#Elon Musk#OpenAI#Personnel
精选理由
HKR-H/R 通过:马斯克离开 OpenAI 的故事有流量和治理话题性。HKR-K 不通过:正文只有 Brockman 单方面叙述,没有时间、条款或具体分歧,信息量不足。
一句话点评
Musk 要完全控制 OpenAI,Altman 在拉人,Brockman 觉得送 Model 3 是收买。
锐评
这是 Greg Brockman 在法庭上回忆的 2017 年 8 月内幕:当时 OpenAI 还是个小非营利实验室,正讨论成立营利实体筹钱做 AGI。Musk 要求完全控制公司,还刚给每位联合创始人送了辆 Model 3——Brockman 觉得这是在拉拢人心。同时 Sam Altman 也在争取支持。最终 Musk 退出,但这段谈判细节很少公开。正文没披露 Musk 具体要什么控制权、Altman 怎么拉的人,也没说当时营利实体的股权结构。看点在于创始人撕逼的罕见公开记录,但信息量有限,更像法庭证词节选,不是完整决策复盘。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
17:55
38d ago
● P1The Verge · AI· rssEN17:55 · 05·06
Mira Murati 作证称 Sam Altman 就 AI 模型安全流程误导她
Mira Murati 在 Musk 诉 Altman 案中宣誓作证,说 Altman 曾就一个新模型的安全流程对她撒谎。Altman 声称法务部门已批准跳过部署安全委员会的审查,但 Murati 发现事实并非如此。报道没透露具体是哪个模型。这件事的核心争议点在于 OpenAI 内部的安全治理到底有没有人真正在把关。
#Safety#Alignment#Mira Murati#OpenAI
精选理由
Murati 的证词把 OpenAI 内部安全流程的争议从传闻变成了法庭记录。她说 Altman 对她谎称一个未具名新模型不需要经过部署安全委员会,理由是法务已经认定——如果属实,等于安全委员会被架空了一次。正文没披露模型名称,也没说这个模型最终是否部署了,所以实际影响还判断不了。但“CEO 对 CTO 撒谎来绕过安全流程”这件事本身,比模型能力分数更值得从业者留意。我会先打个折,因为关键细节缺失,没法确认是单次事件还是系统性操作。
一句话点评
OpenAI前CTO在法庭上直接说“没法信Altman的话”,这是高管层信任崩塌的实锤,不是传闻。
锐评
Mira Murati 在马斯克诉 Altman 案中的证词把 OpenAI 2023 年“政变之夜”的内伤摊开了。她作证说 Altman 在模型安全流程上对她撒谎,导致她“无法信任他说的话”。这不是管理风格摩擦,而是直接指向安全决策信息被扭曲。结合之前曝光的内部短信,董事会当时罢免 Altman 的核心指控之一就是沟通不诚实,Murati 的证词等于给这个指控盖了章。 不过得注意,目前公开的报道只引用了证词片段,没披露 Murati 具体指哪次安全流程、涉及哪个模型版本。没有这些细节,我们只能确认信任关系破裂,但没法判断是单次隐瞒还是系统性欺瞒。另外,Murati 在 Altman 被罢免后短暂担任过临时 CEO,后来又离开 OpenAI 创立新公司,她的立场是否会影响证词倾向,正文也没展开讨论。这点先别急着下结论,等完整庭审记录出来再看。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
17:52
38d ago
彭博科技· rssEN17:52 · 05·06
美国最大电网CEO:数据中心用电太猛,电网得重新设计
美国最大电网的CEO David Mills说,数据中心带来的用电需求暴涨,电网必须重新设计才能扛住。正文没披露具体是哪个电网、用电量涨了多少、预算多少、什么时候动工。
#David Mills#Bloomberg#Commentary
精选理由
H 和 R 通过:AI 数据中心用电激增迫使电网改造,这是算力成本故事的关键一环。K 不通过:全文只有 CEO 的单一说法,没有电网名称、新增负荷、预算或时间表,信息缺口太大,无法验证判断。
一句话点评
电网要重新设计才能扛住AI用电潮,但正文没提具体涨了多少、预算多少。
锐评
一句话:美国最大电网CEO说电网得重新设计才能扛住数据中心带来的用电暴涨。关键信息缺口:没说是哪个电网(PJM?CAISO?)、用电量具体涨了多少、预算多少、什么时候动工。这相当于只给了个方向性警告,没有落地细节。对AI从业者来说,这信号意味着算力扩张可能遇到物理瓶颈——如果电网不改,新建数据中心并网周期会拉长、成本会上升。但正文没披露任何数字支撑,所以这点先别太激动,等具体方案出来再评估影响。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
17:11
38d ago
r/LocalLLaMA· rssEN17:11 · 05·06
DeepSeek V3.2 本地跑起来了,llama.cpp 新分支支持 404GB 量化版
开发者 fairydreaming 在 llama.cpp 上提交了一个 DeepSeek V3.2 的 PR,专门开了一个 deepseek-dsa 分支,一行 git clone 就能试。目前支持三种 GGUF 量化:Q4_K_M 约 404GB,Q8_0 约 714GB。如果你用 CUDA 跑 ggml_top_k() 爆显存,可以试试降低 ub...
#Inference-opt#Tools#fairydreaming#llama.cpp
精选理由
HKR 三项都过,但这是社区 PR 而非官方发布或主线合并,具体细节(分支、GGUF 大小、OOM 调参)对本地推理用户有参考价值,不过受众面窄,所以落在 60–71 区间。
一句话点评
社区开发者给 DeepSeek V3.2 做了 llama.cpp 支持,一行命令就能跑,但显存门槛极高。
锐评
fairydreaming 在 llama.cpp 上提交了 DeepSeek V3.2 的 PR,专门开了 deepseek-dsa 分支,git clone 即可试用。目前支持两种 GGUF 量化:Q4_K_M 约 404GB,Q8_0 约 714GB。这意味着跑 Q4 量化也需要至少 4 张 80GB A100 或 8 张 48GB 显卡,个人玩家基本没戏。正文没披露推理速度或显存优化细节,只提到 CUDA 下 ggml_top_k() 可能爆显存,建议降低 ubatch 或调高 -fitt。这点先别太激动:PR 还在早期,社区验证和 benchmark 都缺。对从业者来说,价值在于 llama.cpp 生态终于有人接 DeepSeek V3.2 了,后续如果能压到单卡可跑,本地部署才有意义。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:08
38d ago
Product Hunt · AI· rssEN17:08 · 05·06
iOrchestra AI 硬件工程师:用文字描述就能生成可生产的硬件设计
iOrchestra 在 Product Hunt 上发布了一个 AI 硬件工程师工具,号称从文字描述到可生产的硬件设计只需几分钟,而不是几周。它用多个 AI agent 自动生成 PCB 布局、原理图、机械和工业设计,还能仿真、迭代、自动生成物料清单(BOM)并直接送去生产。不过,正文没披露它支持哪些元器件、输出什么格式、如何做可制造性检查、定价多少...
#Agent#Tools#iOrchestra#Product Hunt
精选理由
Product Hunt 上发了个产品,号称输入提示就能出可制造的硬件设计,但正文没披露支持哪些器件、输出什么EDA格式、有没有样品或定价。HKR 只有 H 通过,属于低价值的产品更新类信息。
一句话点评
短评:从文字到可生产硬件设计,几分钟 vs 几周,听着很猛,但正文没披露支持哪些元器件、输出格式和定价,先别太激动。 点评:iOrchestra 在 Product Hunt 上推了个 AI 硬件工程师,号称从文字描述到可生产的硬件设计只需几分钟,而不是几周。它用多个 AI agent 自动生成 PCB 布局、原理图、机械和工业设计,还能仿真、迭代、自动生成物料清单(BOM)并直接送去生产...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
16:34
38d ago
● P1彭博科技· rssEN16:34 · 05·06
Anthropic 与 SpaceX 签署算力协议满足 Claude 需求增长
Anthropic 和马斯克的 SpaceX 签了一份算力合同,目的是撑住 Claude 越来越大的用量。报道没披露具体算力规模、合同金额、上线时间,也没说这批算力是拿来训练新模型还是跑线上推理。SpaceX 能不能挤进 Anthropic 的长期供应链,目前还看不出来。
#Inference-opt#Anthropic#SpaceX#Elon Musk
精选理由
我会先打个折,这条消息的新闻性在于“谁跟谁合作”,而不是合作本身有多扎实。Anthropic 把 SpaceX 拉进算力供应商名单,对缓解 Claude 的推理压力可能有帮助,但正文没披露任何具体数字或部署细节,所以现在还判断不了这是短期补缺还是长期供应链调整。真正值得盯的是后续会不会有训练或推理负载真的跑在 SpaceX 的设施上,以及合同规模能不能跟 AWS、Google Cloud 的量级比一比。目前只能当作一个信号来看,别太激动。
一句话点评
Anthropic 找 SpaceX 租数据中心来跑 Claude,说明自家算力已经跟不上用户增长了。但别急着喊“马斯克入局”,这只是商业租赁,不是技术合作。
锐评
Anthropic 跟 SpaceX 签了份算力租赁合同,把 Claude 的部分计算任务搬到 SpaceX 的数据中心去跑。Bloomberg 和 FT 都报了这事,但都没披露具体金额和租了多少台服务器。Latent Space 的社区消息提了个数字:300 兆瓦的电力容量,一年可能要花 50 亿美元——这个数如果属实,相当于 Anthropic 每年在算力上烧掉一笔巨款,侧面说明 Claude 的用户量和调用次数涨得很快,ARR 年化增长率被曝达到 8000%。 不过,300MW 和 50 亿美元这两个数字来自社区传闻,不是官方确认,我会先打个折。SpaceX 的数据中心业务本身也不是主业,它能提供多少稳定的 GPU 集群、网络延迟怎么样,正文都没交代。Anthropic 选 SpaceX 而不是 AWS 或 Google Cloud,可能是为了分散供应商风险,也可能是因为传统云厂商的 GPU 排期太满。但跟一家火箭公司租服务器,运维和扩展性上会不会有坑,现在还看不出来。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K0·R1
15:58
38d ago
Hacker News 首页· rssEN15:58 · 05·06
Tilde.run:给AI Agent一个可回滚的沙箱,跑在真实数据上也不怕
Tilde.run 是一个面向 AI Agent 的沙箱平台,核心卖点是“事务化、版本化的文件系统”。每个 Agent 运行都被当作一次数据库事务:跑完可以原子提交,也可以一键回滚。它把 GitHub 代码、S3 数据、Google Drive 文档挂载成一个统一的 ~/sandbox 目录,Agent 在里面读写,所有变更都被版本记录。网络默认隔离,...
#Agent#Tools#Tilde.run#Product update
精选理由
Tilde.run 这个 Agent 沙箱的卖点很直接:事务化、版本化的文件系统,听起来像是给 Agent 干活时能随时回滚、不怕搞乱环境。但正文只有 HN 上的 7 分和 1 条评论,没提隔离怎么做的、API 长什么样、要不要钱、开不开源。所以分数压在 60–71 的小更新区间,信息太少,先别太激动。
一句话点评
把Agent跑成数据库事务,能一键回滚,适合敢让AI动生产数据但怕搞砸的团队。
锐评
Tilde.run 的核心是把每个 Agent 运行当作数据库事务——跑完原子提交,出问题一键回滚,不用恢复备份。它把 GitHub 代码、S3 数据、Google Drive 文档挂载成一个统一目录,Agent 在里面读写,所有变更都被版本记录。网络默认隔离,出站请求被策略检查和审计,能防数据泄露和凭证滥用。 关键判断:这个思路对“让 Agent 动真实数据但怕搞砸”的场景很实用。回滚和审计是刚需,比事后补救强。但正文没披露隔离实现细节(是容器还是微VM)、API 延迟、定价模式,也没说是否开源。如果是真的,对做 Agent 工作流和自动化运维的团队是个省心工具。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:46
39d ago
TechCrunch AI· rssEN15:46 · 05·06
Genesis AI 发布首个机器人模型 GENE-26.5,还秀了一双能拧魔方的手
Genesis AI 今天公开了它的第一个机器人基础模型 GENE-26.5,同时放出一段演示:几台机械手在完成拧魔方、叠积木这类精细操作。这家公司刚拿了 Khosla 领投的 1.05 亿美元种子轮,但正文没披露模型参数量、训练数据来源,也没说什么时候落地。演示看起来挺唬人,但没给任何成功率或延迟数据,这点先别太激动。
#Robotics#Genesis AI#Khosla#Product update
精选理由
Genesis AI 拿了 1.05 亿美元种子轮(Khosla 投的),刚发了首个模型 GENE-26.5,还放了一段机械手做复杂任务的演示。全栈做机器人基础 AI 这个定位本身有看点,但正文没提模型参数、训练数据、上线计划,信息缺口明显。演示视频能说明一定能力,但离产品化还远,这点先别太激动。
一句话点评
Khosla 投了 1.05 亿美元种子轮,Genesis AI 发了机器人模型 GENE-26.5 和一段拧魔方、叠积木的演示。但没给成功率、延迟,也没说参数量和训练数据,先别太激动。
锐评
Genesis AI 今天公开了它的第一个机器人基础模型 GENE-26.5,同时放出一段演示:几台机械手在完成拧魔方、叠积木这类精细操作。这家公司刚拿了 Khosla 领投的 1.05 亿美元种子轮,金额在种子轮里算很大,说明资本对“机器人基础模型”这个方向押注很重。但正文没披露模型参数量、训练数据来源,也没说什么时候落地。演示看起来挺唬人,但没给任何成功率或延迟数据,这点先别太激动。如果是真的,这个模型能直接控制多台机械手做精细活,比传统写死程序灵活很多,成本也可能更低。但缺的东西太多:模型多大、用了多少真实机器人数据、有没有仿真数据、泛化能力如何——这些都没说。种子轮 1.05 亿,估值估计不低,但产品成熟度还看不清。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
15:27
39d ago
TechCrunch AI· rssEN15:27 · 05·06
Tinder 母公司 Match Group 放缓招聘,因为 AI 工具太烧钱
Match Group 说今年剩下时间要放慢招人,因为 AI 工具“花了很多钱”。正文没披露具体用了哪些 AI 工具、花了多少钱、也没说裁员。关键信号是:AI 的运营成本开始直接跟人头预算抢资源。
#Tools#Match Group#Tinder#Commentary
精选理由
HKR三项都过,但事实止于Match Group因AI工具成本高而放缓招聘;预算规模、供应商、是否裁员都没披露。这是一个有用的成本信号,不是模型或产品层面的故事。
一句话点评
AI 工具太烧钱,Tinder 母公司 Match Group 宣布放缓招聘。
锐评
Match Group 说今年剩下时间要放慢招人,因为 AI 工具“花了很多钱”。正文没披露具体用了哪些 AI 工具、花了多少钱、也没说裁员。关键信号是:AI 的运营成本开始直接跟人头预算抢资源。 这跟之前“AI 能降本增效”的叙事不太一样——至少短期看,AI 的投入是实打实的成本项,而且可能比招人还贵。对于做 AI 应用的公司来说,这是个值得关注的信号:如果连 Match 这种成熟平台都觉得 AI 贵,那创业公司更得算清楚账。 缺的信息不少:到底哪些 AI 功能在烧钱?是推荐模型、聊天机器人还是审核系统?成本大头是算力还是 API 调用?这些都没说。另外,放缓招聘不等于不招,也不等于裁员,所以“AI 替代人类”的结论还下不了。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:21
39d ago
r/LocalLLaMA· rssEN15:21 · 05·06
本地模型+智能体框架已经能顶替初级IT运维了
Reddit用户Porespellar用Qwen3.6 27b搭配Hermes Agent跑了一周初级IT运维任务。他让智能体给系统打补丁、装Docker、配置5个GitHub仓库并启动服务,结果1.5小时干完,他自己估摸初级运维得花3小时。关键瓶颈不在模型能力,而是工具权限、审批流程和失败恢复——智能体遇到小问题能自己解决或请求批准,基本不用人插手。...
#Agent#Tools#Code#Qwen
精选理由
HKR 三项全过:有具体的第一人称测试,给出了模型、工具、任务和时间的细节。封顶 71 是因为这只是 Reddit 上的单次测试,没有完整日志、失败案例或可复现步骤。
一句话点评
本地模型+智能体框架已经能顶初级运维了,实测1.5小时干完3小时的活。
锐评
Reddit用户Porespellar用Qwen3.6 27b搭配Hermes Agent跑了一周初级IT运维任务。他让智能体给系统打补丁、装Docker、配置5个GitHub仓库并启动服务,结果1.5小时干完,他自己估摸初级运维得花3小时。关键瓶颈不在模型能力,而是工具权限、审批流程和失败恢复——智能体遇到小问题能自己解决或请求批准,基本不用人插手。 这个测试用的是27B参数模型,跑在DGX Spark克隆机上,算力门槛不高。但注意这是单次任务,不是长期稳定运行,正文也没披露失败率、安全审计结果或复杂场景(比如多系统联动、权限冲突)的表现。如果真能规模化,初级运维的配比可能会从1人管N台变成1人管更多台,但直接说“替代”还早。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
15:07
39d ago
r/LocalLLaMA· rssEN15:07 · 05·06
llama.cpp 跑 150K 上下文,内存从 108GB 涨到 120GB,疑似内存泄漏
Reddit 用户用 128GB Strix Halo 机器跑 Step-3.5-flash,加载 105GB 的 bartowski Q4_XS 模型,上下文开到 150K,内存占用从 108GB 一路爬到 120GB。用的是 llama.cpp 2.13.0 Vulkan 版和 LM Studio。帖子没贴日志,也没给最小复现步骤,所以没法确认是模...
#Memory#Inference-opt#llama.cpp#LM Studio
精选理由
这是一条Reddit上的单次故障报告,有具体的复现步骤(opencode --continue、多轮查询、htop监控),但正文没贴日志或最小复现代码,也没给issue链接。信息够用但验证弱,所以放在all而不是featured。
一句话点评
llama.cpp 疑似内存泄漏,跑 150K 上下文时内存从 108GB 涨到 120GB。
锐评
Reddit 用户用 128GB Strix Halo 机器跑 Step-3.5-flash,加载 105GB 的 Q4_XS 模型,上下文开到 150K,内存占用从 108GB 一路爬到 120GB。用的是 llama.cpp 2.13.0 Vulkan 版和 LM Studio。12GB 的涨幅在 150K 长上下文下不算离谱,但如果是持续增长而非稳定在高位,就可能是泄漏。帖子没贴日志,也没给最小复现步骤,所以没法确认是模型、量化格式还是推理框架的问题。如果是泄漏,跑超长上下文或服务部署时影响大;如果只是正常缓存增长,那问题不大。缺复现步骤和对比实验(比如换短上下文或换模型是否复现),目前只能标记为待验证。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:00
39d ago
TechCrunch AI· rssEN15:00 · 05·06
Ethos 获 a16z 2275 万美元融资,用语音注册专家网络
Ethos 从 a16z 拿了 2275 万美元,做的是专家网络——就是帮企业找行业专家咨询那种。它主打语音注册,专家不用填表,直接说话就能入驻。目前每周能上 3.5 万个专家,这个量级说明语音流程可能确实比填表快。但正文没披露估值、轮次、语音具体怎么工作,也没说定价,所以先别急着判断它是不是比 GLG、Third Bridge 那些老玩家便宜或好用。
#Audio#Ethos#a16z#Funding
精选理由
a16z 和语音注册让这条融资新闻有传播点,2275 万美元和每周 3.5 万专家注册也提供了基础数据。但正文没披露估值、轮次、语音具体怎么用、专家怎么收费,对 AI 从业者来说信息缺口太大,只能当常规融资消息处理。
一句话点评
a16z 投了 2275 万美元给专家网络平台 Ethos,主打语音注册,专家说话就能入驻。
锐评
Ethos 做的是帮企业找行业专家咨询的生意,和 GLG、Third Bridge 竞争。它拿语音注册当卖点:专家不用填表,直接说话就能入驻,目前每周能上 3.5 万个专家。这个量级说明语音流程可能确实比填表快,但正文没披露估值、轮次、语音具体怎么工作,也没说定价。所以先别急着判断它是不是比老玩家便宜或好用。a16z 领投算一个信号,但专家网络这个赛道不缺钱,缺的是差异化。如果语音注册真能大幅降低专家入驻门槛,那它可能切到更多长尾专家,但正文没给验证数据,比如入驻后专家被预约的比例、客户留存率。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K1·R0
14:05
39d ago
● P1r/LocalLLaMA· rssEN14:05 · 05·06
Qwen3.6 27B量化模型在单张RTX 5090上运行200k上下文
一位 Reddit 用户在单张 32GB 显存的 RTX 5090 上,用 vLLM 跑通了 Qwen3.6 27B 的 NVFP4 量化版,并验证了 200k 上下文长度。配置上用了 fp8_e4m3 的 KV 缓存、FlashInfer 和 3 个投机 token 的 MTP。10 次 200k 上下文跑分平均生成速度 73.6 tok/s,首 t...
#Inference-opt#Reasoning#Tools#Qwen
精选理由
我会先打个折:来源是 Reddit 用户自测,不是官方报告,但配置和日志都贴出来了,可复现性不低。真正值得盯的是显存边界——KV 缓存占了 8.3GiB,整卡吃到约 30478MiB,几乎榨干 32GB。这说明 NVFP4 量化确实把 27B 模型压进了消费级显卡,而且 200k 上下文不是摆设,十次都跑稳了。不过 TTFT 70 秒意味着首 token 要等一分多钟,实际用起来体验会打折扣。这点先别太激动,等更多卡型验证。
一句话点评
单张 RTX 5090 跑通 Qwen 3.6 27B 的 200k 上下文,80 TPS 够用,但来源是 Reddit 用户自测,没官方背书。
锐评
这条消息的核心看点很直接:一张消费级显卡(RTX 5090,48GB 显存)就能把 Qwen 3.6 这个 270 亿参数的模型跑起来,还带上了 20 万 token 的上下文窗口。这意味着处理一整本小说的长度,不需要昂贵的多卡服务器了。用户报告里提到用 FP8 精度加载模型,BF16 格式存 KV 缓存,推理速度能到每秒 80 个 token,这个速度日常聊天或做长文档摘要完全够用。 不过得先打个折。信息全部来自 Reddit 的 r/LocalLLaMA 板块,属于社区玩家的自发测试,正文甚至因为反爬机制没抓到完整内容。我们看不到具体的延迟波动、显存占用的峰值细节,也不知道这个 80 TPS 是生成第一个 token 的速度还是稳定输出速度。另外,用 FP8 量化后模型能力会损失多少,在超长上下文里会不会出现注意力衰减,这些关键指标都没披露。 如果你手头正好有这张卡,这条消息值得跟进验证。但做生产部署决策的话,还得等更严谨的基准测试,尤其是长文本召回率和推理稳定性的数据。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1

更多

频道

后台