ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-18

104 items · updated 3m ago
RSS live
2026-05-18 · 星期一2026年5月18日
23:53
25d ago
r/LocalLLaMA· rssEN23:53 · 05·18
Reddit 用户实测:Pi 这个编程助手系统提示不到 2K token,本地跑 Qwen 27B 只差一个联网搜文档
Reddit 用户对比了 Codex CLI、Claude Code、Gemini CLI、OpenCode 和 Pi,重点推荐 Pi。Pi 只用了读、写、编辑和 bash 四个工具,系统提示控制在 2K token 以内,意味着上下文占用少、成本低。用户用 Qwen 27B-MXFP8 本地跑了一遍,唯一缺的是内置的联网搜文档功能。正文没披露 Pi ...
#Agent#Code#Tools#Codex CLI
精选理由
H/K/R 都达标,但来源是单个 Reddit 用户的测试,证据链偏弱,除了几个具体数字外缺少更系统的评测。放在 all 层合适,不到 featured 的 72 分门槛。
一句话点评
Pi 用四个工具(读、写、编辑、bash)和 2K token 系统提示,上下文占用少、成本低。用户本地跑 Qwen 27B-MXFP8 实测可行,缺内置联网搜文档。正文没披露 Pi 的准确率和延迟,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
23:00
25d ago
● P1彭博科技· rssEN23:00 · 05·18
Meta转岗7000名员工至AI岗位并启动全球裁员
Meta 内部发了份备忘录,要把 7000 人调到 AI 相关的岗位上。这波调整不是单纯的转岗,更大的背景是公司这周晚些时候会启动新一轮裁员。具体哪些部门被裁、裁多少人,正文没披露。转去做 AI 的 7000 人具体干什么也没细说,是去搞模型研发、做 AI 产品还是负责内容审核的自动化,目前都不清楚。
#Meta#Personnel
精选理由
这条消息的冲击力在于数字和时机:7000人不是小数目,而且是在裁员前集中转岗,说明Meta在AI上的投入是动真格的,但代价是其他部门的人可能要走。对从业者来说,这比单纯吹AI前景更实在,因为它直接告诉你大厂内部的人力资源正在发生什么级别的挪移。我会先打个折,这毕竟只是内部调动,不是新增岗位,但作为行业风向标已经够分量了。
一句话点评
Meta一边把7000人转去做AI,一边裁掉8000人,这不是转型,是用AI换人。
锐评
扎克伯格这次动作很直接:先在公司内部把7000名员工调到AI相关岗位,紧接着在全球裁掉8000人,新加坡的亚洲总部已经开始动手。Bloomberg的报道点出了时间线——调岗在前,裁员在后,说明这不是临时起意,而是算过账的。Meta刚赚了创纪录的钱,转头就裁人,逻辑上说得通:把人力成本省下来,砸进算力和模型训练里。 但报道没讲清楚那7000人转去AI岗具体做什么。是去做数据标注、模型评估,还是真的进研究团队?这两者差别很大。如果是前者,本质上是用内部人力替代外包,成本是降了,但对技术突破帮助有限。另外,8000人的裁员规模不小,文章没披露涉及的部门和地区分布,也没说遣散成本会不会吃掉一部分省下来的钱。 我会先打个折:这更像是一次财务驱动的资源腾挪,而不是技术路线上的重大转向。真正值得盯的,是接下来几个季度Meta的AI产品能不能把裁掉的人头价值赚回来。
HKR 分解
hook knowledge resonance
打开信源
99
SCORE
H1·K1·R1
22:33
25d ago
● P1FT · 科技· rssEN22:33 · 05·18
NextEra与Dominion达成4200亿美元公用事业合并交易
这篇 FT 报道正文被付费墙挡住了,只露出标题和摘要片段。标题里提到的“Project Astra”是一桩 4200 亿美元的并购案,由 NextEra 和 Dominion 两家电力公司主导,目标是拿下美国“数据中心走廊”的供电控制权。但具体怎么合并、钱怎么分、监管批不批、成本最终会转嫁给 AI 客户还是普通用户,这些关键信息正文都没披露。我会先打个...
#NextEra#Dominion#Partnership#Policy
精选理由
FT 这篇把 AI 基建的真实成本问题摆上台面,不是讲模型而是讲电费账单。NextEra 和 Dominion 的交易会进一步锁死美国数据中心密集区的电力供应,从业者读到这里会立刻联想到自家云账单和选址风险。我会先打个折:正文没披露价格、交割时间和监管门槛,所以只能算一个信号而非定论。但'控制走廊'这个事实本身就够让做 AI infra 的人警觉,推荐给关注算力成本和地缘布局的读者。
一句话点评
NextEra和Dominion合并成一家4200亿美元的电力公司,直接原因是AI数据中心太耗电了。但FT这篇正文被付费墙挡了,具体交易结构和监管风险都没看到。
锐评
这笔交易的核心逻辑很直白:AI算力中心正在疯狂吞噬美国电网的负荷,电力公司与其各自为战,不如抱团抢下这块增量蛋糕。4200亿美元的合并体量,说明市场已经把电力供应看作AI基建的硬瓶颈,不再是配角。但FT的报道正文被锁在付费墙后面,我们看不到交易的具体条款、股权结构,也不知道监管机构会从哪个角度审查——是反垄断,还是电价上涨对居民用户的冲击。标题里提到“会引发一场关于AI繁荣成本的争斗”,这个判断很关键,但缺少细节支撑。目前能确认的只有合并规模和两家公司的名字,至于这笔交易最终会让数据中心用上更便宜的电,还是把成本转嫁给普通家庭,正文没披露,这点先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
22:32
25d ago
r/LocalLLaMA· rssEN22:32 · 05·18
前三星高管预测:中国扩产可能让内存价格在2027下半年降价
一位前三星芯片高管认为,中国在内存上的大笔投资可能让RAM价格在2027年下半年降下来。他提到长鑫存储(CXMT)计划在上海IPO募资42亿美元,月产能从28万片晶圆提升到30万片以上,到2026年底还能每月产出3万片HBM晶圆。如果这些新产能真能落地,供应多了价格自然会松动。不过正文没披露中国产能爬坡的具体良率和验证进度,这点先别太激动——扩产到真正...
#Samsung#CXMT#ChangXin Memory Technologies#Commentary
精选理由
HKR三项全过,但这是Reddit上转的内存价格预测,不是AI模型或产品更新。产能和IPO数字具体,够上high all,不到featured。
一句话点评
前三星高管说中国内存扩产可能让RAM在2027下半年降价。长鑫存储计划IPO募42亿美元,月产能从28万片提到30万片以上,2026年底还能产3万片HBM。产能落地确实能压价,但正文没披露良率和验证进度,扩产到真正出货有距离。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
21:48
25d ago
NVIDIA 博客· rssEN21:48 · 05·18
Vera 来了:英伟达首款为 AI 智能体设计的 CPU 已送到顶级实验室
英伟达官宣其首款专为 AI 智能体(让模型进业务流程干活的 agent)打造的 CPU——Vera,已经交付给顶级 AI 实验室。但正文只放了标题和导航栏,没有披露具体交付给了哪些实验室、交付了多少颗、芯片规格、跑分、定价或部署时间表。信息缺口很大,目前只能确认产品已进入客户手中,但实际性能和市场影响还无法判断。
#Agent#NVIDIA#Vera#Product update
精选理由
NVIDIA 硬件消息本身有行业关注度,标题里“Agent CPU 进顶级实验室”这个钩子够具体,过了 H 和 R。K 不过是因为正文为空,规格、交付量、时间表全没给,只能算有趣但不够扎实。
一句话点评
英伟达首款AI智能体CPU Vera已交付给顶级实验室,但正文只有标题和导航栏,没披露交付对象、数量、规格、跑分或定价。目前只能确认产品已到客户手中,实际性能和市场影响无法判断。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
21:29
25d ago
TechCrunch AI· rssEN21:29 · 05·18
SandboxAQ 把药物发现模型搬进 Claude,不用会写代码也能用
SandboxAQ 把自家的药物发现和材料科学模型接入了 Claude,用户用自然语言就能调用,不需要懂编程或搭服务器。公司认为当前瓶颈不是模型质量,而是使用门槛太高——其他竞品(比如 Chai Discovery 和 Isomorphic Labs)都在拼模型效果,SandboxAQ 赌的是让生物学家直接对话就能用。正文没披露模型参数、定价、上线时间...
#Tools#SandboxAQ#Claude#Chai Discovery
精选理由
HKR-H 和 HKR-R 通过:Claude 作为药物发现模型的前端入口,是个清晰的钩子,也触及分发竞争。HKR-K 不通过,因为参数、定价、上线条件都没披露,这只能算一个小产品更新。
一句话点评
SandboxAQ 把药物发现模型接入了 Claude,生物学家用自然语言就能调用,不用写代码或搭服务器。公司赌的是使用门槛比模型质量更卡脖子,跟 Chai Discovery、Isomorphic Labs 拼效果的路子不一样。但正文没披露模型参数、定价、上线时间,也没说 Claude 具体怎么调用这些模型——是工具调用还是 API 后端?这点先别太激动,等实测。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
21:29
25d ago
Hacker News 首页· rssEN21:29 · 05·18
对齐预训练:AI 讨论会让模型自我实现(错误)对齐
这篇论文发现,预训练语料里关于 AI 行为的讨论,会直接影响模型学出来的对齐程度。作者用 69 亿参数的模型做实验:如果多喂一些说 AI 会出问题的文章,模型就更容易表现出问题行为;反过来,多喂说 AI 表现好的文章,模型的不对齐率从 45% 降到 9%。这个效果在后续微调里会减弱,但不会消失。简单说,你让模型读什么,它就更容易变成什么——有点像自我实...
#Alignment#Safety#Research release#Safety/alignment
精选理由
标题有钩子,但正文信息量几乎为零——只给了论文标题、arXiv 链接和 HN 上的 10 分、3 条评论。没披露任何方法、样本或实验结果,无法判断‘对齐预训练’具体怎么做的、效果如何。建议等论文全文出来再评估,现在只能标记为‘值得关注但信息不足’。
一句话点评
预训练语料里关于AI行为的讨论,会直接影响模型学出来的对齐程度。作者用69亿参数模型做实验:多喂说AI会出问题的文章,模型更容易表现出问题行为;多喂说AI表现好的文章,不对齐率从45%降到9%。这个效果在后续微调里会减弱但不会消失。简单说,你让模型读什么,它就更容易变成什么。 关键数字:45%→9%的降幅,69亿参数模型,效果在微调后仍残留。来源是arXiv预印本,未经同行评审。正文没披露...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
21:19
25d ago
彭博科技· rssEN21:19 · 05·18
英特尔和高通都想买这家AI芯片初创公司Tenstorrent
彭博消息,英特尔和高通都对AI芯片初创公司Tenstorrent表达了早期收购意向。Tenstorrent是挑战英伟达和AMD的新一波玩家之一,但正文没披露估值、报价条款或交易时间表。
#Inference-opt#Tenstorrent#Intel#Qualcomm
精选理由
HKR-H 和 HKR-R 较强,因为 Intel 和 Qualcomm 同时出现在 Tenstorrent 收购传闻中,话题性足。HKR-K 偏弱:没有估值、报价或时间表,信息密度有限,评分落在 60-71 区间合理。
一句话点评
英特尔和高通看上AI芯片初创Tenstorrent,想买。Tenstorrent做推理优化芯片,挑战英伟达和AMD。但正文没披露估值、报价或时间表,目前只是早期意向,这点先别太激动。如果真成交,对英特尔补齐AI硬件、高通拓展数据中心都是关键一步。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:01
25d ago
r/LocalLLaMA· rssEN21:01 · 05·18
MTP多token预测:AMD新硬件上推理速度翻倍,写代码场景尤其明显
MTP(多token预测)号称能让大模型生成速度翻倍,实测跑Qwen 3.6,硬件是AMD Strix Halo和双Radeon 9700。原理是一次预测多个token,减少串行等待,对写代码这类需要连续输出的任务特别友好。不过正文没披露具体测试设置和完整硬件参数,2倍加速是在什么条件下测的、有没有牺牲质量,这些都不清楚。如果是真的,本地跑模型能省不少时间。
#Inference-opt#Code#Agent#AMD
精选理由
这是一条 Reddit 帖子,声称 MTP 技术能让 AMD 本地推理硬件(Strix Halo 和双 Radeon 9700)上的 token 生成速度翻倍。数字很诱人,但正文没披露测试配置细节,比如 batch size、量化精度、是否可复现。先打个折看待,当作一个有趣的本地推理性能传闻,重要性压在 60–71 区间比较合理。
一句话点评
MTP(多token预测)号称让模型生成速度翻倍,原理是一次预测多个token,减少串行等待,对写代码这类连续输出任务特别友好。实测跑Qwen 3.6,硬件是AMD Strix Halo和双Radeon 9700。但正文没披露具体测试设置和完整硬件参数,2倍加速是在什么条件下测的、有没有牺牲质量,都不清楚。如果是真的,本地跑模型能省不少时间。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
20:55
25d ago
r/LocalLLaMA· rssEN20:55 · 05·18
Lemonade v10.5.1:三行命令在 Strix Halo 上跑通 MTP 模型
Lemonade 更新到 v10.5.1,给 AMD Strix Halo 芯片做了一个快速启动方案:三条命令就能拉下 Qwen3.6-27B-MTP-GGUF 模型、装好 ROCm 7.13 后端、然后自动带上 MTP(多 token 预测)参数加载模型。MTP 是让模型一次预测多个 token 来加速推理,这里直接帮你配好参数,省得自己调。视频里演...
#Inference-opt#Tools#Lemonade#Qwen
精选理由
这是一条实用的工具更新,3 条命令就能在 Strix Halo 上跑 Qwen3.6-27B-MTP-GGUF,对 AMD 用户很友好。但受众面窄,只针对特定硬件组合,达不到头条标准。
一句话点评
Lemonade v10.5.1 给 AMD Strix Halo 芯片做了个一键脚本:三条命令拉模型、装 ROCm 7.13、自动配好 MTP(多 token 预测,让模型一次猜多个词来加速推理)。视频演示了 Pi agent 调用摄像头看镜子。对 Strix Halo 用户省事,但加速效果和兼容性正文没披露,实际收益得自己跑分。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
20:00
25d ago
● P1彭博科技· rssEN20:00 · 05·18
Meta 在路易斯安那州砸 2000 亿美元建数据中心,靠 10 座天然气电厂供电
Meta 在路易斯安那州 Richland Parish 搞了一个 AI 数据中心,钱不是自己全掏,而是通过一笔 2000 亿美元的私募融资来支撑。这个园区的总电力需求最高能到 7.5 吉瓦,其中 5 吉瓦专门给计算设备用。为了喂饱这些机器,他们计划新建 10 座天然气发电厂来供电。这个规模非常夸张,相当于把未来几年的算力扩张押注在化石能源上。不过视频...
#Inference-opt#Meta#Bloomberg#Funding
精选理由
Meta这个数据中心项目把AI基建的烧钱程度又拉高了一个量级。2000亿美元融资和7.5吉瓦电力需求是实打实的硬数字,5吉瓦专供计算说明他们押注的是推理和训练长期需求,不是短期炒作。我会先打个折:正文没披露电力来源和具体时间表,7.5吉瓦能不能落地还得看当地电网和审批。如果是真的,这个单点耗电量已经超过很多小国家的总用电,能源成本会直接决定这个数据中心的经济账能不能算过来。
一句话点评
Meta 在路易斯安那砸 2000 亿美元建 AI 数据中心,钱是私募出的,电靠新建 10 座天然气电厂,这相当于把未来算力扩张押注在化石能源上。
锐评
这条消息最值得关注的是融资结构和能源选择。2000 亿美元不是 Meta 自己掏腰包,而是通过私募融资来支撑,说明现在建 AI 基础设施的资本门槛已经高到连 Meta 都要拉外部资金了。园区总电力需求最高 7.5 吉瓦,其中 5 吉瓦专门给计算设备用——这个数字什么概念?大概相当于五个中等规模城市的居民用电量。为了喂饱这些机器,他们计划新建 10 座天然气发电厂,等于把未来几年的算力扩张直接绑在化石能源上,跟科技公司嘴上说的碳中和目标形成鲜明对比。 不过视频是 Bloomberg 的付费内容,正文只给了摘要,没披露融资的具体条款、建设时间表、以及 Meta 自己到底出了多少钱。另外,7.5 吉瓦是峰值需求还是常态负载,也没说清楚。这些缺口意味着我们现在只能看到这笔交易的轮廓,没法判断它的财务风险和实际落地节奏。如果后续有更多细节,我会先打个折看——这种规模的基建项目,从宣布到真正跑起来,中间变数通常不小。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
19:43
25d ago
彭博科技· rssEN19:43 · 05·18
IREN 与英伟达签下 21 亿美元 AI 基建合作,CEO 称与戴尔关系也很好
比特币矿商转型 AI 算力服务商 IREN 宣布与英伟达达成战略合作,合同总价值最高 21 亿美元,用于加速 AI 基础设施建设。这个数字说明 IREN 在从挖矿转向卖算力这件事上拿到了大单,不是小打小闹。CEO 在采访里还提到与戴尔关系很好,但正文没披露具体合作条款,所以戴尔那边到底出什么角色——服务器代工还是联合交付——目前不清楚。整体来看,IRE...
#Inference-opt#IREN#Nvidia#Dell
精选理由
HKR-K和HKR-R通过,因为21亿美元的Nvidia合作是实打实的商业新闻,能反映AI基础设施投入规模;但HKR-H不通过,因为全文来自一段CEO视频,内容单薄,Dell合作细节缺失,缺乏惊喜或独家判断。适合作为行业动态推送,不值得置顶。
一句话点评
比特币矿商 IREN 拿到英伟达最高 21 亿美元合同,转型卖算力不是画饼。但合同是“最高”值,实际能落多少要看交付;戴尔具体角色没披露,是代工还是联合交付不清楚。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
19:36
25d ago
彭博科技· rssEN19:36 · 05·18
英伟达本周发财报;AI数据中心催生史上最大电力交易
彭博科技节目预告本周英伟达财报,同时提到AI数据中心热潮促成了一笔史上最大规模的电力交易。正文没披露交易金额、交易对手和电力容量,所以这点先别太激动,具体规模有多大还得等更多信息。
#Bloomberg#Nvidia#SpaceX#Commentary
精选理由
HKR 的 H 和 R 通过:标题的“史上最大电力交易”和 Nvidia/电力角度对 AI 基础设施观察者有价值。K 不通过:交易金额、参与方和电力规模都没披露,所以归入 all 层级。
一句话点评
彭博科技节目预告本周英伟达财报,并称AI数据中心热潮促成了史上最大电力交易。但正文没披露交易金额、对手和电力容量,这点先别太激动,具体规模还得等更多信息。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
19:01
25d ago
● P1r/LocalLLaMA· rssEN19:01 · 05·18
llama.cpp 合入 MTP speculative decoding 加速 Qwen3.6
llama.cpp 在 PR #22673 里正式合并了 MTP(多 token 预测)投机解码支持。实测 Qwen3.6 27B 用 Q8_0 量化,在 Strix Halo 上从 7.4 tok/s 提到 18.1 tok/s,速度翻了 2.44 倍;双 RTX 3090 的 Q8_0 方案也从 25.7 tok/s 涨到 55.9 tok/s,约...
#Inference-opt#Code#Benchmarking#llama.cpp
精选理由
HKR 三项都满足:llama.cpp 合入了 MTP 投机解码,用 Qwen3.6 27B 在 Strix Halo 和 RTX 3090 上跑出了实打实的加速数字。范围限定在本地推理优化,不是大模型发布,78 分放在 featured 合适。
一句话点评
llama.cpp 正式支持 MTP 投机解码,Qwen3.6 27B 在 Strix Halo 上跑到 2.44 倍速,但小显存设备上效果打折甚至没用。
锐评
llama.cpp 合入了 MTP(多 token 预测)投机解码,专门给 Qwen3.6 系列加速。社区实测数据出来了:在 Strix Halo 上跑 Qwen3.6 27B 能到 2.44 倍速,RTX 3090 上约 2.17 倍,这提升挺实在的。但别急着高兴,有用户拿 6GB 显存笔记本跑 35B MoE 模型,结论是“不值得”,RTX 5080 16GB 跑 128k 长上下文时 MTP 也没帮上忙。这说明加速效果很吃硬件配置,显存紧张或上下文极长时,MTP 额外占用的资源可能抵消掉收益。目前信息都来自 Reddit 用户自发测试,正文被屏蔽看不到原始帖子的详细设置和误差范围,缺少官方基准或更系统的消融实验。想判断自己设备值不值得开 MTP,最好等更多不同配置的对比数据出来。
HKR 分解
hook knowledge resonance
打开信源
95
SCORE
H1·K1·R1
18:56
25d ago
AI HOT 精选· aihot-apiZH18:56 · 05·18
xAI 在 OpenRouter 上线三款 Grok 创意模型:图像、视频、语音
xAI 把 Grok 创意套件里的三款新模型放到了 OpenRouter 上,开发者可以直接调用。Grok Imagine Image Quality 主打照片级真实感的图像生成和编辑;Grok Imagine Video 能从文字、图片或参考素材生成短视频;Grok Voice TTS 1.0 支持 20 多种语言、5 种语音。目前正文没披露定价和生...
#Multimodal#Vision#Audio#xAI
精选理由
H 和 K 成立:xAI 三款 Grok 创意模型同时上线 OpenRouter,TTS 规格具体。R 不成立:缺定价、基准和限频,从业者没法评估落地成本,所以留在 upper all 层。
一句话点评
xAI 把 Grok 的三款新模型放到了 OpenRouter 上,开发者可以直接调用了。Grok Imagine Image Quality 主打照片级真实感的图像生成和编辑;Grok Imagine Video 能从文字、图片或参考素材生成短视频;Grok Voice TTS 1.0 支持 20 多种语言、5 种语音。目前正文没披露定价和生成速度,所以实际调用成本、延迟和效果都还是未知数...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
18:31
25d ago
AI HOT 精选· aihot-apiZH18:31 · 05·18
Mac 跑 Codex,手机接着干
OpenAI 说 Codex 桌面版支持远程连接:Mac 开机、插电、不睡眠,就能在 ChatGPT 手机 App 上继续用 Codex 写代码。正文没提延迟和安全性,实际体验要看网络和权限配置。
#Agent#Code#Tools#OpenAI
精选理由
正文只给了设置条件,没提新模型能力、定价或更深层的自动化机制,属于一个小产品更新,所以分数压在 60–71 区间。
一句话点评
OpenAI 让 Codex 桌面版支持远程连接:Mac 开机插电不睡眠,就能在手机 ChatGPT 上继续写代码。正文没提延迟和安全性,实际体验要看网络和权限配置。短评:手机远程写代码,听起来方便,但延迟和安全是未知数。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:56
25d ago
Hacker News 首页· rssEN17:56 · 05·18
Modal 把推理冷启动砍了 40 倍:GPU 不用等,模型秒上线
Modal 发了一篇技术博客,讲怎么把推理服务的冷启动时间从几分钟甚至几小时压到几十秒。核心是四招:GPU 缓冲池(提前备好空闲卡)、自定义文件系统(按需加载容器镜像,不用等整个镜像下载)、进程快照恢复(跳过 CPU 端初始化)、CUDA 上下文快照恢复(跳过 GPU 端初始化)。他们没披露基线是什么模型、多大、什么负载下测的,所以 40 倍这个数字先...
#Inference-opt#Modal#Product update
精选理由
Modal 这篇标题很抓人,40 倍冷启动加速加上一堆技术缩写,看起来像有干货。但 RSS 正文没披露基线(对比什么?)、模型规模(小模型还是大模型?)和复现条件,这点先别太激动。LP、FUSE、C/R 和 CUDA-checkpoint 这几个词翻译成人话就是:用线性规划调度、用户态文件系统、检查点恢复和 CUDA 级快照来省掉模型加载时间。如果真能落地,对 serverless 推理的成本和延迟是实打实的利好。但 vendor 博客常见套路是挑最好看的数据说,所以重要性压在 68,不推 featured。
一句话点评
Modal 把推理冷启动从几分钟压到几十秒,靠四招:GPU 缓冲池、自定义文件系统(按需加载镜像)、进程快照和 CUDA 上下文快照。40 倍提速很亮眼,但正文没披露基线模型大小、负载类型和具体延迟,这个数字先打个折。如果真能在几十秒内拉起大模型服务,对弹性扩缩场景挺实用。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:40
25d ago
● P1彭博科技· rssEN17:40 · 05·18
Elon Musk 败诉 Sam Altman 和 OpenAI 重组案
陪审团驳回了马斯克对 Sam Altman 和 OpenAI 的指控,核心理由是马斯克拖得太久才起诉。马斯克原本想通过诉讼阻止 OpenAI 转向营利性架构,但报道没披露具体在哪个法院打的官司、马斯克要求了哪些补救措施,也没说 OpenAI 这次重组的具体条款是什么。
#Elon Musk#Sam Altman#OpenAI#Policy
精选理由
马斯克输掉这场官司,核心就一句话:陪审团觉得他告晚了。正文没写具体在哪个法院、马斯克要了多少赔偿、OpenAI 重组方案到底怎么改,所以信息缺口不小。但光是“起诉过晚被驳回”这个结果,已经够让关注 AI 圈权力格局的人讨论一阵了。我会先打个折,因为细节太少,没法判断后续会不会上诉或者对 OpenAI 架构产生实质影响。
一句话点评
马斯克告 OpenAI 重组案败诉,陪审团一致认为他起诉太晚了,核心指控根本没进入实质审理。
锐评
这场被炒成“AI 世纪审判”的官司,最后倒在一个程序问题上:9 名加州陪审员一致认定马斯克起诉的时间超过了法律允许的期限,所以法庭没去判断 OpenAI 从非营利转向营利是否真的“偷了慈善机构”。TechCrunch 的报道提到,庭审虽然挖出不少硅谷大佬的证词和 OpenAI 早期的狗血历史,但陪审团要回答的问题其实很窄——就是看时效过没过。 换句话说,马斯克在法律上输了,但 OpenAI 的重组是否合理、有没有辜负最初的使命,这个实质争议在法庭上并没有得到答案。报道也没披露陪审团具体依据哪几条证据认定超时,以及马斯克方面会不会上诉。如果你关心的是 OpenAI 的治理结构到底有没有问题,这场判决给不了结论,它只说明马斯克动手晚了。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
17:07
25d ago
r/LocalLLaMA· rssEN17:07 · 05·18
oMLX 在 MLX 引擎对比中排第一,但评测细节全没公开
Reddit 用户发帖说 oMLX 在 MLX 引擎对比里拿了第一,测试环境是 M5 Max 64GB 和 mlx-community/Qwen3.6-35B-A3B-4bit 模型。但正文被屏蔽了,没披露吞吐量、延迟或评分标准,所以这个“第一”含金量未知。如果你在选 MLX 推理引擎,这点先别太激动,等有具体数据再说。
#Inference-opt#Reddit#Qwen#oMLX
精选理由
价值偏低但不算噪音:它给出了硬件和模型条件,但没披露吞吐、延迟或评分方法来支撑oMLX最优的结论。HKR-R对本地推理用户成立;HKR-H和K不满足,所以落在40–59区间。
一句话点评
oMLX 在 Reddit 上自称 MLX 引擎对比第一,跑在 M5 Max 64GB 和 Qwen3.6-35B-A3B-4bit 上。但正文被屏蔽,没披露吞吐量、延迟或评分标准,这个“第一”含金量未知。如果你在选 MLX 推理引擎,这点先别太激动,等有具体数据再说。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
17:03
25d ago
Product Hunt · AI· rssEN17:03 · 05·18
Starchild-1:号称首个实时多模态世界模型,能边看边听边回应
Odyssey 在 Product Hunt 上发布了 Starchild-1,号称是第一个实时多模态世界模型——能同步生成视频和音频,并且实时响应你的输入。说白了,它不像传统模型那样离线生成一段固定视频,而是你给指令它就能边生成边跟你互动,有点像让 AI 进入一个“活着的”模拟世界。官方说可以用在游戏、机器人、教育等领域。但注意,正文没披露模型参数量...
#Multimodal#Odyssey#Product update
精选理由
这篇只有产品发布摘要,核心卖点“实时多模态世界模型”缺乏任何技术细节支撑——没参数、没延迟、没评测条件,从业者无法复现或评估。HKR 里只有标题钩子能过,信息完整度和实用性都不够,属于低价值产品发布。
一句话点评
Odyssey 发了 Starchild-1,号称首个实时多模态世界模型——能边生成视频+音频边响应你的输入,像让 AI 进入一个活着的模拟世界。但正文没披露参数量、延迟、API 价格和评测条件,目前只有 Product Hunt 上一句话描述。如果是真的,游戏和机器人场景会很香,但这点先别太激动,等跑分和 demo 出来再说。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
16:54
25d ago
Product Hunt · AI· rssEN16:54 · 05·18
Manus 定时任务 2.0:让同一个 AI 干活流程按计划自动跑
Manus 发布了 Scheduled Tasks 2.0,核心是让同一个任务上下文(task context)里能设置重复执行的 AI 工作流。说白了,就是你把一个项目配置好,告诉 Manus“每天/每周按这个套路跑一遍”,它就能自动干活,不用你每次手动点。这次还支持把定时动作加到 Manus 自己建的网页应用里。对知识工作者和团队来说,省掉了重复搭...
#Agent#Memory#Manus#Product update
精选理由
Manus 发了个小版本更新,核心卖点是重复任务能跑在同一个任务上下文里——相当于让 Agent 记住上一轮干了什么,接着干下一轮。这对做自动化流程的人有点用,但正文没披露频率怎么设、权限怎么管、价格多少,所以信息缺口不小。我会先打个折,不算大新闻,但关注 Agent 持久化的人可以瞄一眼。
一句话点评
Manus 的 Scheduled Tasks 2.0 让同一个任务上下文里能设重复执行的 AI 工作流,相当于把项目配置好,告诉它“每天按这个套路跑一遍”就能自动干活。这次还支持把定时动作加到 Manus 自己建的网页应用里。对知识工作者和团队来说,省掉了重复搭建的麻烦。不过正文没披露调度频率、权限控制、定价和上线条件,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
16:48
25d ago
r/LocalLLaMA· rssEN16:48 · 05·18
特斯拉 P40 跑通 Qwen 3.6,速度还行但量化踩坑
有用户在特斯拉 P40 上跑 Qwen 3.6 27B MTP 模型,Q5 量化下速度达到 20 token/s,对一张老卡来说算不错了。但踩了个坑:用 q4_0 或 turbo3 量化 K cache 会输出乱码,换成 F16 K cache 才正常。正文没解释为什么这两种量化会崩,可能是精度损失太大或实现有 bug。如果你手头有 P40 想跑大模型...
#Inference-opt#Qwen#NVIDIA#llama.cpp
精选理由
HKR 三项都过,但来源是 Reddit 单用户实验,影响力有限。20 t/s 这个数字和 K cache 乱码的失败模式对本地部署有实际参考价值,所以定 all 而非 featured。
一句话点评
Tesla P40 跑 Qwen 3.6 27B,Q5 量化下 20 token/s,对一张老卡算不错了。但踩坑:用 q4_0 或 turbo3 量化 K cache 会输出乱码,换 F16 才正常。正文没解释原因,可能是精度损失太大或实现有 bug。如果你手头有 P40 想跑大模型,记得避开这两个量化选项。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
16:45
25d ago
彭博科技· rssEN16:45 · 05·18
戴尔一个季度卖了1000台AI服务器,主攻企业客户
戴尔上个季度新增了1000个AI服务器客户,目标群体是企业用户。正文没披露具体服务器型号、用了哪款英伟达芯片,也没说企业买了多少台。1000这个数字本身不算小,但缺少单价和配置信息,没法判断这笔生意到底赚不赚钱。
#Dell Technologies#Nvidia#Product update
精选理由
HKR-K有1000家客户这个具体数字,HKR-R触及企业AI基础设施需求。但正文没披露服务器型号、英伟达芯片配置和订单规模,信息缺口明显,所以分数压在60–71区间。
一句话点评
戴尔上季度新增1000个AI服务器客户,目标企业用户。但正文没披露具体型号、芯片配置和单价,1000这个数字看着热闹,实际赚多少不清楚。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
16:31
25d ago
Hacker News 首页· rssEN16:31 · 05·18
一个人花10年写了操作系统、区块链、AI Agent和编程语言
GitHub用户Ionablokchain声称独自用10年造了一套完整的“主权数字生态”,包括x86_64内核、ARM64手机操作系统、L1区块链、两种编程语言,以及设备端AI。GitHub组织下放了8个仓库,50多个测试。目前没有第三方审计或社区验证,代码规模、运行截图、性能数据都未披露。如果是真的,这相当于一个人干了几个团队的事,但这点先别太激动—...
#Agent#Code#IONA#Open source
精选理由
H和K成立是因为独立全栈的噱头够怪,且GitHub上有可查的代码和测试记录。但AI部分信息太薄,没讲agent怎么工作、能干什么、效果如何,所以分数压在60–71区间。
一句话点评
一个人花10年造了操作系统、手机OS、L1区块链、两种编程语言和端侧AI,GitHub上放了8个仓库和50多个测试。如果是真的,这相当于一个人干了几个团队的事。但正文没披露代码规模、运行截图或性能数据,也没有第三方审计或社区验证。这点先别太激动——项目可能只是骨架或实验原型,离可运行系统还有距离。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
16:24
25d ago
● P1Hacker News 首页· rssEN16:24 · 05·18
Qwen 3.7 Preview 发布
阿里 Qwen 团队在 X 上发了 Qwen 3.7 预览版的链接,但正文只贴了 Twitter 和 Hacker News 地址,没披露模型参数量、能力变化、定价或发布时间。目前 HN 上只有 9 分和 1 条评论,信息量约等于零。想了解具体升级点还得等后续公告。
#Qwen#Alibaba#Product update
精选理由
HKR-H 和 HKR-R 成立,因为官方 Qwen 版本预告确实有模型竞赛的钩子。HKR-K 不成立:正文没披露任何参数、能力差异、基准测试或访问条件,所以分数落在 60–71 区间。
一句话点评
Qwen 3.7 预览版来了,社区等得挺急,但正文没披露具体模型参数和性能跑分,先别太激动。
锐评
Qwen 放出了 3.7 的预览版,社区反应很热烈,Reddit 上甚至有人用梗图表达等待的焦急。不过目前公开的信息非常有限,只有“预览版”这个状态,没有给出模型规模、架构变化、基准测试成绩或具体的发布时间表。从社区讨论看,大家期待的是 Qwen 系列一贯的开放权重和中文能力,但这次预览到底开放到什么程度、是完整模型还是蒸馏版,正文都没说。对从业者来说,现在能判断的只有两点:一是 Qwen 团队在持续迭代,二是社区对它的期待值很高。至于这个版本是否值得立刻上手测试,得等官方放出技术报告和权重再说。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K0·R1
16:00
25d ago
AI HOT 精选· aihot-apiZH16:00 · 05·18
OpenRouter 发了一篇讲长期代理基础要素的文章
OpenRouter 分享了一个链接,标题是“构建长期代理的基础要素”,但正文只给了 URL,没披露代理架构、评估方法、记忆机制、工具接口、基准数据或实现限制。目前信息不足以判断这套方案是否靠谱,比如延迟多高、样本效率如何、验证是否充分,这些关键点都缺失。
#Agent#Memory#Tools#OpenRouter
精选理由
HKR三项全不触发:标题泛泛,正文只有链接,没有数据、机制、实验或具体案例。加上零信源,直接排除。
一句话点评
OpenRouter 扔了个链接,标题说“构建长期代理的基础要素”,但正文就一行 URL,没给任何架构、记忆机制、工具接口或评估数据。目前信息等于零,没法判断这套方案延迟多高、样本效率如何、验证是否充分。先别激动,等正文出来再聊。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
15:56
25d ago
AI HOT 精选· aihot-apiZH15:56 · 05·18
Claude Code 大代码库部署指南:百万行单体仓库实战经验
ClaudeDevs 发了一篇博客,讲怎么在大规模代码库(百万行单体仓库、遗留老系统、分布式微服务)里跑 Claude Code。正文没披露具体配置参数或基准测试结果,但提到了团队的实际经验。如果你在折腾大项目接入 AI 编程助手,这篇可以当个参考,不过具体效果还得自己试。
#Code#Agent#Tools#ClaudeDevs
精选理由
HKR-H 和 HKR-R 成立,因为大规模部署角度确实能吸引有类似痛点的团队;但 HKR-K 不成立,因为缺少可复现的参数、基准或步骤。整体属于'有趣'档的上沿,不到'精选'。
一句话点评
ClaudeDevs 发了篇博客,讲 Claude Code 在百万行单体仓库、遗留老系统和分布式微服务里的实战经验。正文没披露具体配置或基准测试,但团队踩过的坑有参考价值。短评:大项目接入 AI 编程助手,这篇可以当个起点,具体效果还得自己试。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
15:50
25d ago
r/LocalLLaMA· rssEN15:50 · 05·18
Qwen 35B A3B 在本地跑 agent 编码任务,效果比网页版还好
一位 Reddit 用户用 RTX 4090 加 5060 Ti 跑 Qwen 35B A3B,量化到 q80、KV 缓存用 q8_0、上下文拉到 262k,在 llama.cpp 上跑 agent 编码任务,结果比官方网页版输出更强。不过正文没披露具体跑分或大代码库测试结果,所以这个“更强”目前只是个人体验,不能直接当结论。亮点是 35B 参数里只有...
#Agent#Code#Inference-opt#Qwen
精选理由
这篇 Reddit 帖子有具体硬件配置和量化参数,不是空谈感受,但缺少可复现的 benchmark 和任务集,也没有其他来源交叉验证。分数 68 合理:信息密度够,但验证强度弱,适合关注本地部署和 agent 效率的读者先看一眼,别直接当结论用。
一句话点评
一位用户用 RTX 4090 + 5060 Ti 本地跑 Qwen 35B A3B,量化到 q80,上下文拉到 262k,在 llama.cpp 上做 agent 编码任务,说效果比官方网页版还强。35B 参数但只有 3B 激活,推理成本低,本地跑得动。不过正文没披露具体跑分或大代码库测试结果,这个“更强”目前只是个人体验,不能直接当结论。亮点是激活参数少、长上下文可行,但验证弱,建议等社区复现。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:40
25d ago
r/LocalLLaMA· rssEN15:40 · 05·18
Hugging Face 文件下载器:一个 Tampermonkey 脚本帮你省去手动拼命令的麻烦
Reddit 用户 Spotty_Weldah 分享了一个 Greasy Fork 上的 Tampermonkey 脚本,专门用来下载 Hugging Face 上的模型文件。装上之后,Hugging Face 文件列表下面会多出一张表格,你勾选需要的文件,脚本就自动生成对应的下载命令,不用再手动拼 `huggingface-cli` 或 `wget`...
#Tools#Spotty_Weldah#Hugging Face#Greasy Fork
精选理由
HKR-K/R 通过,因为这是一个具体的 HF 下载工作流辅助工具,但影响面窄,来源权威性低。正文只给出了基本机制;使用方式、维护者记录和兼容性均未披露。
一句话点评
一个 Tampermonkey 脚本,在 Hugging Face 模型页面文件列表下自动生成下载命令,勾选文件就能拿到对应的 `huggingface-cli` 或 `wget` 命令,省去手动拼 URL 的麻烦。作者是 Reddit 用户 Spotty_Weldah,脚本托管在 Greasy Fork,安装即用。适合经常从 HF 下模型但懒得记命令的人。不过脚本只生成命令,不负责断点续传...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1
15:24
25d ago
Hacker News 首页· rssEN15:24 · 05·18
用 Git --author 标记拦住 AI 灌水机器人
Archestra 团队在 GitHub 仓库里被 AI 机器人刷屏刷到受不了——一个 issue 堆了 253 条无意义评论,27 个 PR 大部分没测试,每周要花半天清理。他们试过算贡献者信誉分、搞 AI 审查机器人,但都误伤真人。最后上了狠招:开启 GitHub 的“仅限历史贡献者”设置,新人必须先在官网过 CAPTCHA 和伦理规则,然后团队用...
#Tools#Code#Archestra#GitHub
精选理由
HKR 的 H 和 R 通过:一个低技术含量的 Git 小技巧反 AI 机器人灌水,标题有吸引力,也切中维护者被 AI 垃圾 PR 骚扰的痛点。K 不通过:正文只提了 HN 热度,没披露具体的拦截流程,信息不够,所以留在 all 层级。
一句话点评
Archestra 被 AI 机器人刷爆 GitHub:一个 issue 堆了 253 条无意义评论,27 个 PR 大多没测试,每周花半天清理。他们试过信誉分和 AI 审查,都误伤真人。最后开了 GitHub 的“仅限历史贡献者”开关,新人得先过 CAPTCHA 和伦理规则才能提交。代价是开源贡献门槛变高,但团队说宁可牺牲指标也要保质量。正文没披露具体怎么用 --author 字段做白名单...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
15:02
25d ago
r/LocalLLaMA· rssEN15:02 · 05·18
Qwen 3.7 悄悄上线了?Reddit 帖子只放了一张截图
Reddit 用户 Foxiya 发帖称 Qwen 3.7 已在 Qwen Chat 上线,但正文只有一张截图和“Title”字样,没有透露模型参数量、发布时间或开放范围。目前无法确认这是正式版本、灰度测试还是误传,建议等官方消息再下判断。
#Qwen#Reddit#Product update
精选理由
一条 Reddit 帖子只靠标题说 Qwen 3.7 出现在 Qwen Chat,正文只有图片链接,没有参数、能力说明或官方发布细节。HKR-H 和 HKR-R 成立,但 HKR-K 太薄,所以留在 all 层级。
一句话点评
Reddit 用户 Foxiya 发帖称 Qwen 3.7 已在 Qwen Chat 上线,但正文只有一张截图和“Title”字样,没有透露模型参数量、发布时间或开放范围。目前无法确认这是正式版本、灰度测试还是误传,建议等官方消息再下判断。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
15:02
25d ago
AI HOT 精选· aihot-apiZH15:02 · 05·18
Benedict Evans 2026春季报告:AI资本狂潮与部署瓶颈
Benedict Evans 发布79页报告,核心观点是AI正经历一场史无前例的资本投入和部署瓶颈。四大科技巨头2026年资本支出合计达7000亿美元,超过全球电信业(约3000亿)和油气行业(约1万亿)。英伟达收入已远超英特尔,但产能仍跟不上需求。美国数据中心建设支出已超过办公楼建设。OpenAI和Anthropic月收入增长迅猛,但商业模式远未稳定...
#Hacker News#Commentary
精选理由
H、K、R三项都不达标:只有一份PDF标题和HN热度,没有作者、方法或可验证的结论,直接排除。
一句话点评
Benedict Evans 的79页报告核心就一句话:AI 基建烧钱速度史无前例,但部署卡在瓶颈。四大巨头2026年资本支出合计7000亿美元,超过全球电信业(约3000亿)和油气(约1万亿)。英伟达收入已远超英特尔,但产能仍跟不上需求。美国数据中心建设支出已超过办公楼。OpenAI和Anthropic月收入增长迅猛,但商业模式远未稳定。报告数据详实,但来源主要是公开财报和新闻,缺少一手调...
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
14:30
25d ago
AI HOT 精选· aihot-apiZH14:30 · 05·18
Krea 2 全面开放,订阅用户可免费无限生成一周
Krea 2 今天向所有用户开放,订阅用户还能享受一整周的无限次生成。正文没披露模型参数、定价或免费试用额度,所以具体效果和成本还不清楚。
#Multimodal#Krea#Product update
精选理由
HKR-H和HKR-K靠开放和订阅福利通过,但HKR-R只限于Krea用户,没有硬伤但细节单薄,卡在60-71分区间。
一句话点评
Krea 2全面开放,订阅用户享一周无限生成。短评:无限生成一周,但没说模型参数和定价,先别急着冲。 点评:Krea 2今天向所有用户开放,订阅用户还能享受一整周的无限次生成。这波操作挺大方,但正文没披露模型参数、定价或免费试用额度,所以具体效果和成本还不清楚。无限生成听起来爽,但如果是低质量输出,一周后可能就腻了。建议先观望,等实测或官方补全信息再决定是否订阅。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
14:27
25d ago
r/LocalLLaMA· rssEN14:27 · 05·18
Llama.cpp 几天没更新?MTP 速度可能掉一半,更新后能提 1.5–1.8 倍
Reddit 用户 Borkato 提醒,如果你几天没更新 Llama.cpp,会发现 MTP(多 token 预测)跑得慢。他昨天更新后,token 生成速度直接提升了 1.5 到 1.8 倍,而且之前 pp(prompt processing,提示处理)阶段的问题也基本修好了。简单说:不更新等于白亏一半速度,更新一下就能白嫖提速。
#Inference-opt#Llama.cpp#Borkato#Product update
精选理由
一条 Reddit 用户发的 PSA,说昨天更新 Llama.cpp 后 MTP 速度提升了 1.5-1.8 倍,pp 问题也基本修了。对跑本地模型的人来说,这个提升幅度很诱人,相当于白嫖推理加速。但正文没披露具体版本号、测试配置或基准设置,也没有官方发布说明,所以只能当社区经验分享看,不能当正式 benchmark。分数卡在 60-71 合理,信息有用但验证弱。
一句话点评
Llama.cpp 几天不更新,MTP(多 token 预测)速度可能白亏一半。Reddit 用户实测更新后 token 生成快了 1.5-1.8 倍,prompt 处理问题也基本修好。来源是单一用户自述,未披露测试模型、硬件和具体版本,效果可能因配置而异。但 Llama.cpp 迭代快,这类优化常有,建议本地用户顺手更新试试。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:14
25d ago
r/LocalLLaMA· rssEN14:14 · 05·18
Kokoro 82M 和 Supertonic 3 TTS 在 CPU 上的跑分对比
有人在 4 核 CPU、16GB 内存、无 GPU 的机器上跑了 Kokoro 82M 和 Supertonic 3 两个 TTS 模型,测了 6 种文本长度,总共跑了 120 次。Supertonic 3 只用 2 步推理,实时率(RTF)0.165,也就是生成 1 秒音频只需约 0.165 秒,基本能实时用。Kokoro 82M 用 PyTorch...
#Audio#Benchmarking#Inference-opt#Kokoro
精选理由
HKR 三项都通过,因为这是一次具体的 CPU TTS 基准测试,有 RTF 数字。但只是单个 Reddit 用户的测试,正文没披露重复运行次数、音频质量评分或完整脚本,所以分数压在 60–71 区间。
一句话点评
有人在4核CPU、16GB内存、无GPU的机器上测了Kokoro 82M和Supertonic 3两个TTS模型。Supertonic 3只用2步推理,实时率0.165,生成1秒音频只需0.165秒,基本能实时用。Kokoro 82M用PyTorch跑实时率0.469,慢一些但也能用。测试覆盖6种文本长度,总共跑了120次,数据可信。但正文没披露音质评测,只测了速度,这点先别太激动。如果音质...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:12
25d ago
Hugging Face 博客· rssEN14:12 · 05·18
IBM 和 Hugging Face 搞了个开源智能体排行榜
IBM 研究院和 Hugging Face 联合推出了一个开源智能体排行榜,用来评估 AI 智能体(能自己调用工具、执行多步任务的程序)的表现。但正文目前只显示了 Hugging Face 的 429 限流页面,没有给出任何评测指标、上榜模型、具体任务或发布时间。想了解排行榜怎么打分、哪些智能体上榜,还得等官方放出完整内容。
#Agent#Benchmarking#Hugging Face#IBM Research
精选理由
HKR-R 通过是因为 Agent 评测影响从业者选工具和判断榜单可信度;HKR-H 和 HKR-K 不通过:正文只披露了榜单名称,没有指标、任务、模型或结果。
一句话点评
IBM 和 Hugging Face 说要搞一个开源智能体排行榜,但目前点进去只有 429 限流页面,正文一个字都没披露。所以这篇目前只有标题有价值,具体怎么打分、哪些智能体上榜、任务是什么,全得等官方补上。先别太激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
13:37
26d ago
● P1Hacker News 首页· rssEN13:37 · 05·18
Cloudflare 用 Mythos 模型在内部代码库测试漏洞挖掘和攻击链生成
Cloudflare 在 Project Glasswing 里测试了 Anthropic 的 Mythos Preview 模型,把它丢到 50 多个内部代码仓库上跑。这个模型跟之前通用大模型最大的区别是:它能自己把几个小漏洞串成一条完整的攻击链,并写出验证代码在沙箱里编译运行,跑不通就自己改假设再试,直到证明漏洞真的可利用。不过,这个预览版没有正式...
#Reasoning#Code#Safety#Cloudflare
精选理由
HKR 三项全中。Cloudflare 拿自己的代码库做了一手测试,跑出可执行漏洞利用链,还记录了不一致拒答的问题,信号很强。但这不是 Anthropic 官方模型发布,只是第三方试用报告,所以分数停在 84 这个区间是合理的。
一句话点评
Cloudflare 拿 Anthropic 的 Mythos 模型扫了自己五十多个代码库,发现它能自动把几个小漏洞串成完整攻击链,还会自己写代码验证漏洞是否真的能用。
锐评
Cloudflare 这篇博客讲的是他们内部测试 Mythos Preview 的真实体验,不是第三方评测,所以结论要打点折——他们只测了自己的代码库,不代表对所有项目都有效。但信息量很足:Mythos 最大的进步不是找漏洞,而是能把几个原本不起眼的小问题(比如内存释放后还能访问)串成一条完整的攻击路径,并且自己写验证代码、编译、运行,失败了还会调整假设再试。这个闭环能力让之前只停在“可能有问题”的发现变成了“确实能打穿”的证明。 另一个值得注意的点是模型会“拒绝干活”。即使 Anthropic 给的是去掉额外安全限制的版本,Mythos 有时还是会拒绝写漏洞利用代码,但换个问法或改个环境变量就又同意了。这种不一致说明模型自带的护栏不可靠,不能当安全策略用。 博客没给出具体的漏洞发现数量、误报率,也没说扫一次要花多少钱、跑多久。这些数据对判断它能不能规模化用很关键,目前只能看到能力演示,离生产环境的成本收益评估还差一截。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
13:26
26d ago
Hacker News 首页· rssEN13:26 · 05·18
华盛顿大学曾计划让幼师戴摄像头录课,用来训练AI
华盛顿大学研究人员曾计划让幼儿园老师佩戴第一人称摄像头,或教室架设固定摄像头,每次最多录150分钟、一个月4次,把录到的师生互动画面拿去训练AI模型,用来评估课堂互动质量。家长收到的通知是“opt-out”模式——不主动拒绝就等于同意,而且只有英文版,非英语母语家庭很难真正知情。有家长看到后表示“被吓到”,担心孩子影像被用到未知AI工具里。报道说,家长...
#Vision#Multimodal#Research release
精选理由
HKR的H和R都满足,但K不满足:RSS只给了标题和HN的39分、8条评论,没有机构、数据用途或采集规模。话题本身有讨论价值,但信息量不够上精选。
一句话点评
华盛顿大学曾计划让幼儿园老师戴摄像头录课堂互动,每次最长150分钟、一月4次,用来训练AI评估教学质量。家长收到的是“不拒绝=同意”的opt-out通知,且只有英文版,非英语母语家庭很难真正知情。有家长看到后“被吓到”,担心孩子影像被用到未知AI工具。报道说校方已搁置计划。关键缺口:正文没披露具体用什么模型架构、训练数据量多大、评估指标是什么,也没说影像是否会上传云端或本地处理。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
12:49
26d ago
Hacker News 首页· rssEN12:49 · 05·18
Benedict Evans 春季报告:AI 吃掉世界
这是一份 79 页的 PDF,Benedict Evans 在 2026 年 5 月更新了他对 AI 行业的全景判断。核心论点是:AI 正经历一场平台级迁移,类似 PC 到智能手机的切换。报告用大量数据说明资本投入爆炸——四大科技公司 2026 年计划资本开支 7000 亿美元,超过全球电信业总和;Nvidia 收入已远超 Intel,数据中心建设支出...
#Benedict Evans#Hacker News#Commentary
精选理由
这是一篇只有标题的 PDF 链接,来自知名分析师 Benedict Evans 的年度 AI 报告,所以 H 项勉强通过。但正文没披露任何论点、数据或框架,K 和 R 项都不满足——从业者看完不知道报告在说什么,更谈不上触发讨论或争议。
一句话点评
Benedict Evans 的 79 页春季报告核心判断:AI 正经历类似 PC 到智能手机的平台迁移。关键数字:四大科技公司 2026 年资本开支 7000 亿美元,超过全球电信业总和;Nvidia 收入已远超 Intel。报告用大量数据说明资本投入爆炸,但没披露具体应用落地和 ROI 验证。短评:数据堆得扎实,但缺“钱花出去换回了什么”的判断。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0
12:21
26d ago
r/LocalLLaMA· rssEN12:21 · 05·18
Continue.dev 接 Qwen 3.6 出 bug:编码调用在思考块后卡死
Reddit 用户 Jorlen 发现,用 Continue.dev 对接 Qwen 3.6 dense 27B 和 35B/A3B 时,简单聊天正常,但一涉及编码调用或读文件,模型输出到思考块(thinking block)就停住不动。llama.cpp 的 reasoning budget 参数会复现一个 1024 token 截断问题,但正文没披...
#Code#Reasoning#Tools#Continue.dev
精选理由
这是一条 Reddit 上的单一用户求助帖,有复现步骤和截断现象,但正文没披露根因,也没有修复方案或官方确认。作为 niche 事件信号放进 all 层合适,不值得上 featured。
一句话点评
Qwen 3.6 在 Continue.dev 里一跑编码任务就卡在思考块,llama.cpp 的 reasoning budget 参数会复现 1024 token 截断。正文没披露根因,可能是工具链对长思考链的兼容问题。如果是高频编码用户,建议先降级或换后端。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K1·R1
12:20
26d ago
Hacker News 首页· rssEN12:20 · 05·18
Linus 吐槽:AI 挖漏洞的人太多,Linux 安全邮件列表快被搞崩了
Linus Torvalds 说,现在一堆人用 AI 工具找 Linux 内核漏洞,结果大家用的工具差不多,报的 bug 也差不多,导致安全邮件列表里全是重复报告,几乎没法管理。他原话是“almost entirely unmanageable”,还补了一句“不必要的痛苦和毫无意义的工作”。正文没披露具体有多少重复报告、邮件量涨了多少,也没说用的是哪些...
#Code#Tools#Safety#Linus Torvalds
精选理由
HKR-H 和 HKR-R 成立:Linus 把 AI 漏洞猎手和 Linux 安全列表失控挂钩,冲突直接。HKR-K 弱:没给邮件增幅、样本量或具体案例,信息不足,所以落在 60–71 的 all 档。
一句话点评
Linus Torvalds 吐槽 AI 找 bug 工具让 Linux 安全邮件列表“几乎完全没法管”——大家用差不多的工具报差不多的漏洞,全是重复报告。他原话是“不必要的痛苦和毫无意义的工作”。正文没披露具体重复量或邮件增幅,也没点名是哪些工具。这点先别太激动:问题出在工具同质化,不是 AI 找 bug 本身没用。如果团队只用一两种公开模型跑静态分析,结果必然撞车。真正该关注的是:开源社...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
11:52
26d ago
r/LocalLLaMA· rssEN11:52 · 05·18
给 MTP 的 KV 缓存降精度,几乎白捡性能
有人在 Qwen3.7-27B-Q8_0 上试了试把 MTP(多 token 预测)模块的 KV 缓存从 fp16 压到 q8_0,9 次请求的接受率(0.735)纹丝不动,总耗时从 49.46 秒降到 49.32 秒。省了不到 0.3%,但内存占用降了——对显存吃紧的本地部署来说,这点优化不亏。正文没披露具体显存节省量,也没说更长序列下的效果。
#Inference-opt#Benchmarking#Qwen#llama.cpp
精选理由
这篇帖子样本量太小(9个请求),只在单模型单量化配置上跑了一次,没有跨硬件或跨模型验证,所以“免费午餐”的结论要打个折。但数字具体、钩子清晰,对关注量化推理成本的从业者来说有参考价值。正文没披露量化前后的显存占用变化,这点先别太激动。
一句话点评
有人在 Qwen3.7-27B-Q8_0 上把 MTP(多 token 预测)模块的 KV 缓存从 fp16 压到 q8_0,9 次请求的接受率(0.735)纹丝不动,总耗时从 49.46 秒降到 49.32 秒。省了不到 0.3%,但内存占用降了——对显存吃紧的本地部署来说,这点优化不亏。正文没披露具体显存节省量,也没说更长序列下的效果。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
11:51
26d ago
Hacker News 首页· rssEN11:51 · 05·18
隐藏音频信号能劫持AI语音系统
IEEE Spectrum报道了一种针对语音AI系统的攻击方式:攻击者可以在正常音频里嵌入人耳听不到的隐藏信号,让AI语音助手执行非预期的操作。文章标题说“能劫持”,但正文没有披露具体的攻击机制、复现条件或受影响的产品型号。目前只有30个Hacker News点赞和4条评论,信息量有限,建议等更详细的技术分析出来再评估实际威胁。
#Audio#Safety#IEEE Spectrum#Hacker News
精选理由
HKR-H 和 HKR-R 通过:隐藏攻击语音 AI 这个点有新闻性和安全相关性。HKR-K 不通过:正文只有 HN 热度(30 分、4 条评论)和标题复述,没有机制或可测试的细节,信息缺口大。
一句话点评
攻击者能在正常音频里藏人耳听不到的信号,让语音助手干坏事。但正文没披露攻击机制、复现条件或受影响产品,只有30个HN点赞和4条评论,信息量太少。建议等详细技术分析出来再评估实际威胁。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
11:35
26d ago
r/LocalLLaMA· rssEN11:35 · 05·18
OpenBMB 发了三个 BitNet 模型,8B/3B/1B,但还没人跑过评测
Reddit 上有人贴了 OpenBMB 的三个 BitNet 模型链接(BitCPM4-CANN 8B、3B、1B),说自己在等 llama.cpp 更新支持才能跑。BitNet 是微软搞的 1-bit 大模型路线,理论上能把显存和计算量压到极低,但这次发的模型没有放出任何 benchmark、许可证或发布时间。正文没披露训练数据、精度损失或实际推理...
#Inference-opt#OpenBMB#Hugging Face#llama.cpp
精选理由
HKR-K 成立,因为三个具体尺寸的 BitCPM4-CANN 权重链接是实打实的信息。HKR-R 对 LocalLLaMA 用户有价值,但缺少基准测试、许可证和 llama.cpp 支持时间表,所以分数压在 60–71 区间。
一句话点评
OpenBMB 发了三个 BitNet 模型(8B/3B/1B),走的是微软 1-bit 路线,理论上能把显存和计算量压到极低。但正文没放任何 benchmark、许可证或发布时间,连训练数据、精度损失都没提。目前只能等 llama.cpp 更新才能跑,实际效果未知。短评:饼画得大,但缺实测数据,先别激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R1
11:00
26d ago
TechCrunch AI· rssEN11:00 · 05·18
韩国公司LetinAR在做AI眼镜的光学镜片,指甲盖大小
LetinAR开发了一款拇指甲大小的镜片,用于AI眼镜的光学显示。文章提到这项技术今年就会在欧洲摩托头盔上落地——导航箭头直接浮现在路面上,不用看手机。但正文没披露量产时间、客户名单、价格或具体光学参数,所以离消费级眼镜还有多远不好说。
#Vision#LetinAR#Product update
精选理由
HKR-H和HKR-K靠拇指大小镜片这个具体硬件钩子过关,但HKR-R不行:缺规格、客户和量产时间,对从业者来说只是供应链背景信息,不是当天能用的情报。
一句话点评
韩国LetinAR做了个拇指甲大小的镜片,能让导航箭头直接浮现在路面上,今年先装在欧洲摩托头盔上。光学方案是“针孔镜片”,比传统方案薄很多,适合塞进眼镜框。但正文没披露量产时间、客户名单、价格或具体光学参数,所以离消费级眼镜还有多远不好说。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
10:50
26d ago
Hacker News 首页· rssEN10:50 · 05·18
施密特在亚利桑那大学毕业典礼谈AI遭学生喝倒彩
施密特在亚利桑那大学毕业典礼上把AI比作当年计算机带来的技术变革,结果被台下学生喝倒彩。正文没披露他具体说了什么惹毛了观众,也没提学校和学生为什么反应这么大。只知道不止他一个演讲者因为AI话题被嘘——NBC新闻的视频标题提到“多位毕业典礼演讲者因AI言论被嘘”。
#Eric Schmidt#Google#NBC News#Incident
精选理由
HKR-H和R通过:知名科技人物因AI话题当众被嘘,有场景感和从业者情绪价值。HKR-K不通过:正文没披露学校、具体言论、现场原因,也没有数据或引用,只能算低价值线索。
一句话点评
前Google CEO施密特在亚利桑那大学毕业典礼上谈AI,被台下学生喝倒彩。正文没说他具体讲了什么惹毛观众,也没提学校和学生为何反应这么大。只知道不止他一个演讲者因AI话题被嘘。这事本身信息量有限,但说明AI在公众舆论里已经成了敏感词——尤其对即将进入职场的毕业生来说,AI更多意味着岗位替代而非技术乐观。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K0·R1
10:09
26d ago
新智元 · 公众号· rssZH10:09 · 05·18
GPT-5.5 被曝用上全球最快芯片,每秒吐 2000 个 token
新智元转述,Cerebras 的 WSE-3 芯片跑 120B 参数的 GPT-5.3-Codex-Spark,推理速度冲到 2000 token/秒,比普通 GPU 快一个量级。但别急着激动:Cerebras 公有云上跑的最大生产模型还是 120B,没提更大规模;上下文窗口只有 128K,实测里近一半请求会超限。芯片快是真的,但场景受限,离替代主流推...
#Inference-opt#Code#Agent#Cerebras
精选理由
这篇是传闻性质,新智元爆料Cerebras芯片把120B模型跑到2000 token/秒,但正文没披露任何OpenAI或Anthropic的官方确认,也没说GPT-5.5到底是不是真的。速度数字很唬人,但128K上下文限制意味着近一半的真实请求可能塞不进去,这点先别太激动。整体信息有钩子也有缺口,适合推给所有人看,但不够硬到上头条。
一句话点评
Cerebras WSE-3芯片跑120B模型推理速度冲到2000 token/秒,比普通GPU快一个量级。但别急着激动:Cerebras公有云上最大生产模型还是120B,没提更大规模;上下文窗口只有128K,实测近一半请求会超限。芯片快是真的,但场景受限,离替代主流推理还远。正文没披露具体功耗和成本对比,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
10:09
26d ago
新智元 · 公众号· rssZH10:09 · 05·18
多模态大模型别盲目刷题:诊断-生成-强化闭环,找准盲点
北大和山大提出 DPE 方法,给多模态大模型做“体检”:先诊断出 12 个能力维度的短板,每轮只用 200 个样本,再用多智能体生成针对性训练数据,最后用 GRPO 强化学习更新。在 Qwen2.5-VL-7B-Instruct 上跑三轮,平均分从 57.29 涨到 59.29。提升幅度不大,但样本量极小,适合低成本快速迭代。正文没披露具体哪些维度提升...
#Multimodal#Agent#Fine-tuning#Peking University
精选理由
一篇ICML论文,方法叫DPE,核心思路是诊断-生成-强化闭环:先测模型在12个维度上的短板,再针对短板生成训练样本,最后用GRPO(一种强化学习更新方式)来微调。Qwen2.5-VL-7B平均分从57.29提到59.29,涨了2分。分数不高,但思路有意思——不是无脑刷题,而是先找盲点再补。不过正文没披露这12个维度具体是什么、诊断样本怎么选,以及GRPO相比传统微调的成本差异。适合关注多模态微调策略的人看一眼,但别太激动,涨分幅度和验证规模都有限。
一句话点评
北大和山大给多模态大模型做了套“体检+补课”流程:先诊断12个能力维度的短板,每轮只用200个样本,再用多智能体生成针对性数据,最后用GRPO强化学习更新。在Qwen2.5-VL-7B上跑三轮,平均分从57.29涨到59.29——提升不大,但样本量极小,适合低成本快速迭代。正文没披露具体哪些维度提升最多,也没说诊断本身是否可靠。短评:样本少是亮点,但涨分幅度小,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
10:09
26d ago
新智元 · 公众号· rssZH10:09 · 05·18
AnySearch 号称能搜到谷歌找不到的 80% 互联网,开发者已经在接入了
AnySearch 5月11日上线后冲上 skills.sh 热榜第一。它用一个统一的接口去调 Reddit、代码仓库、股票数据等来源,相当于给大模型配了个能翻墙的搜索助手。正文没披露具体支持多少数据源、延迟多高,但如果是真的,等于把谷歌搜不到的论坛帖、代码片段、实时行情都拉进了对话里。
#Agent#RAG#Tools#AnySearch
精选理由
标题的80%和连夜接入是典型的钩子,但正文确实有上线日期、排名和覆盖的数据源,信息够用。没有定价、基准测试或规模数据,所以分数在60-71区间合理。
一句话点评
AnySearch 上线即冲热榜第一,号称能调 Reddit、代码库、股票数据等谷歌搜不到的 80% 互联网。相当于给大模型配了个能翻墙的搜索助手,开发者连夜接入。但正文没披露具体支持多少数据源、延迟多高,这点先别太激动。如果是真的,等于把论坛帖、代码片段、实时行情都拉进了对话里,挺省钱。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
08:32
26d ago
AI HOT 精选· aihot-apiZH08:32 · 05·18
阿里云 AgentScope Java 1.1 发布,主打企业级 Agent 的持久化与沙箱编排
阿里云发了 AgentScope Java 1.1,核心是让企业用 Java 搭 Agent 时能自动管理上下文、挂不同的文件系统,还能在安全沙箱里编排任务。说白了就是让 Agent 跑得更稳、更可控,适合放进生产环境。不过正文没披露定价和具体发布时间线,想上手的得自己去翻文档。
#Agent#Tools#Memory#Alibaba Cloud
精选理由
HKR-K和HKR-R通过,因为文章点名了具体的企业级Agent机制和生产痛点。HKR-H不通过;这是厂商版本更新,没有基准测试、采用数据、定价或路线图,所以分数落在60–71区间。
一句话点评
阿里云把 AgentScope Java 1.1 定位成企业级 Agent 框架,核心加了工作区持久化、可插拔文件系统和安全沙箱编排,说白了就是让 Java 搭的 Agent 能自动管上下文、挂不同存储、在沙箱里跑任务,更适合放进生产环境。但正文没披露定价和发布时间线,想评估成本或排期的得自己去翻文档。短评:企业 Java Agent 框架更新,主打稳和可控,但定价和时间线都没说。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
06:31
26d ago
r/LocalLLaMA· rssEN06:31 · 05·18
一个开源记忆工具让14B模型跨会话问答准确率从4%飙到97%
rtk-ai 开源的 ICM(上下文记忆模块)在本地跑了个测试:让 qwen2.5:14b 先读一篇密集的技术文档,然后关掉原文,在后续会话里回答10个事实性问题。不加 ICM 时准确率只有4%,加上后直接跳到97%。这个提升幅度很大,但正文没披露测试集规模、问题难度分布,也没说是否只测了单文档。如果效果稳定,等于给本地小模型装了个外挂记忆,不用每次重...
#Agent#RAG#Memory#rtk-ai
精选理由
HKR 三项都过,但这是一条单篇 Reddit 帖子,只有一个小型本地基准测试;复现细节和独立验证都没披露,所以不上精选。
一句话点评
rtk-ai 开源的 ICM 让 qwen2.5:14b 在跨会话记忆测试中从 4% 跳到 97%,相当于给本地小模型装了个外挂记忆,不用每次重读原文。但正文没披露测试集大小、问题难度分布,也没说是否只测了单文档,效果得打个折。如果稳定,对本地 agent 和 RAG 场景很实用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
06:28
26d ago
Product Hunt · AI· rssEN06:28 · 05·18
Voiser AI:140多种语言的AI配音,号称“真人感”
Voiser AI 是一个文本转语音工具,主打140多种语言和1000多种声音,还支持情感风格和自定义指令。它说自己生成速度快、听起来像真人,适合做视频、广告、播客的配音。不过正文没披露具体价格、API接口、延迟数据,也没说部署方式。有免费选项,但不知道免费额度够不够用。跟ElevenLabs、HeyGen这些竞品比,它多语言覆盖更广,但技术细节和成本...
#Audio#Voiser AI#Product update
精选理由
这是Product Hunt上一个普通的AI配音工具,唯一可验证的事实是140+语言。HKR-K通过,HKR-H和HKR-R不通过,因为缺少价格、API、延迟和质量细节。
一句话点评
Voiser AI 号称支持140多种语言、1000多种声音,还带情感风格和自定义指令,听起来挺全。但正文没披露具体价格、API接口、延迟数据和部署方式,只有个“免费选项”和70%折扣,不知道免费额度够不够用。跟ElevenLabs、HeyGen比,多语言覆盖是优势,但技术细节和成本都藏着,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
04:49
26d ago
Product Hunt · AI· rssEN04:49 · 05·18
Krea 2:一个主打风格控制和情绪板的AI图像模型
Krea 推出了自研的底层图像模型 Krea 2,核心卖点是风格控制和情绪板(moodboard)功能,适合做创意素材和设计灵感探索。产品页展示了大量视频样片,但正文没披露模型参数量、定价、是否开放API,也没有任何基准测试对比。目前有免费选项,但具体限制不清楚。如果你需要快速出图、对风格一致性有要求,可以试试,但想评估它跟 Midjourney 或 ...
#Vision#Krea#Product update
精选理由
这是一个小型的视觉产品更新,HKR-H 和 HKR-K 都偏弱;feed 只给了能力方向,没有参数、价格、上线范围或基准数据,所以够不上有趣更新的门槛。
一句话点评
Krea 2 是 Krea 自研的底层图像模型,主打风格控制和情绪板功能,适合做创意素材和设计灵感探索。产品页展示了大量视频样片,但正文没披露模型参数量、定价、是否开放API,也没有任何基准测试对比。目前有免费选项,但具体限制不清楚。如果你需要快速出图、对风格一致性有要求,可以试试,但想评估它跟 Midjourney 或 Flux 的差距,信息还不够。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R0
04:47
26d ago
● P1机器之心 · 公众号· rssZH04:47 · 05·18
openJiuwen 开源多智能体蜂群框架 JiuwenSwarm
openJiuwen 社区在「虾马」之后又开源了一个叫 JiuwenSwarm 的多智能体框架,把多个 AI 模型组织成“蜂群”来协作。框架拆成四块:Agent Swarm 管智能体编队、Swarm Skills 管技能包、Swarm Skills Hub 是技能市场、还有一套自进化机制让技能自己迭代。他们拿 PinchBench 跑了个分,Jiuwe...
#Agent#Tools#Memory#openJiuwen
精选理由
我会先打个折:openJiuwen 不是一线实验室,这篇又缺复现细节和基线对比,所以分数停在 78。但 HKR 三项都踩中了——“养蜂”说法有传播力,四个组件加 PinchBench 94.2% 给了硬信息,开源蜂群架构对做智能体编排的人确实有吸引力。正文没披露许可证和复现配置,这点先别太激动。
一句话点评
openJiuwen 社区开源了一个叫 JiuwenSwarm 的多智能体框架,主打“蜂群”式协作。但两篇来源文章都因环境异常无法读取正文,具体架构、性能数据和实际效果目前全看不到。
锐评
这条消息目前只能看个标题,两篇来源(机器之心和量子位)的微信文章都触发了环境异常验证,正文内容完全缺失。从标题判断,openJiuwen 社区在之前“虾马”项目之后,又推出了 JiuwenSwarm,定位是多智能体蜂群框架,强调群体智能和“养蜂”概念。 “蜂群”这个比喻在智能体领域不算新,通常指大量简单 agent 通过简单规则涌现出复杂行为,类似蚂蚁或蜜蜂的群体智能。但这类框架的落地难点一直在于:任务拆解是否可靠、agent 间通信开销多大、整体行为是否可控。正文没披露,这些关键点一个都验证不了。 我会先打个折。开源框架的新闻,如果连代码仓库链接、架构图、基准测试结果都没放出来,光靠标题里的“重磅”“引领”撑不起判断。等正文能读了,或者社区放出实际跑通的 demo 和对比数据,再评估不迟。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
04:00
26d ago
● P1FT · 科技· rssEN04:00 · 05·18
Musk 诉 Altman 案陪审团就 OpenAI 归属权作出裁决
FT 这篇付费文章只露了个标题和摘要,正文被订阅墙挡了。标题说 OpenAI 的 IPO 估值可能到 1 万亿美元,但 Elon Musk 的法律挑战可能搅黄它的商业化计划。具体开庭时间、IPO 条款、Musk 的诉求是什么,正文没披露。
#OpenAI#Elon Musk#Funding#Policy
精选理由
FT 这篇标题把 OpenAI 的万亿美元 IPO 和奥克兰陪审团直接挂钩,冲突感很强,但正文其实只说了马斯克的法律挑战可能阻碍其商业计划,审理时间表、IPO 具体条款都没披露。我会先打个折:钩子够猛,信息密度不够,所以放在 78 分这档,不是必写级别。
一句话点评
Altman 出庭作证了,但这场官司的核心不是谁更会说话,而是陪审团信谁的旧邮件和聊天记录。
锐评
这场审判走到陪审团阶段,说明双方都没能在庭前和解,现在把 OpenAI 的归属权交给 8 个普通人决定。Altman 出庭的表现被描述为“占上风”,但报道也提醒,证人席上的表现不一定能赢官司——陪审团最终看的是证据,不是口才。Musk 和 Altman 都在攻击对方可信度,这本身就说明书面协议存在模糊地带,否则不用打到这个地步。 FT 的报道点出了一个很实际的背景:OpenAI 正盯着千亿美元级别的 IPO,而这场在奥克兰陪审团房间里做出的裁决,会直接决定这家公司到底属于谁、以什么结构上市。Verge 的评论更直接,认为无论谁赢,都证明 AI 行业被错误的人领导。 目前公开报道主要围绕庭审戏剧性展开,对 Musk 当初到底承诺了什么、有没有书面协议、OpenAI 非营利转营利的具体条款这些关键事实披露有限。判决出来之前,所有“谁更有理”的判断都得先打个折。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
04:00
26d ago
FT · 科技· rssEN04:00 · 05·18
扫雷公司准备清理海湾航道
FT报道称,一批公司正在准备清理海湾地区的水雷,新一代无人艇可能帮助恢复这条重要航线的交通。正文没披露公司名称、部署时间、船只数量或技术细节。
#Robotics#Product update
精选理由
FT 来源有权威性,但 RSS 正文只给了无人扫雷概念和恢复航线的结论,没披露具体公司、部署规模或自主扫雷的技术机制。HKR 里只有 H 勉强成立,K 和 R 都缺信息,所以这条价值低,适合 all 分发。
一句话点评
FT报道称有公司准备用无人艇清理海湾水雷,但正文被墙,没披露公司名、部署时间、船只数量或技术细节。信息缺口太大,无法判断这是真进展还是画饼。短评:标题说无人艇扫雷,但正文被墙,信息为零。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
03:30
26d ago
FT · 科技· rssEN03:30 · 05·18
商学院开始教学生怎么跟AI协作,不只是教工具怎么用
FT这篇报道说商学院正在从教基础AI操作转向教人跟AI协作。正文被墙了,看不到具体开了哪些课、哪些学校在改、怎么教。标题透露的信息是:以前教的是“怎么用AI”,现在教的是“怎么跟AI一起干活”——后者更强调判断力、分工和决策,而不是点按钮。如果课程真落地,对AI从业者是个信号:企业对“人机协作”的需求已经大到商学院要专门开课了。但正文没披露课程规模、学...
#Commentary
精选理由
标题有趋势感,但正文信息量太少,既没有具体学校、课程数量,也没讲怎么教AI协作,只能算一个低价值的风向标。
一句话点评
商学院从教AI操作转向教人跟AI协作,核心是判断力、分工和决策,而非点按钮。但正文被FT墙了,看不到具体开了哪些课、哪些学校在改、怎么教。如果课程真落地,说明企业对“人机协作”的需求已大到商学院专门开课。缺课程规模、学员反馈和实际效果数据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
02:48
26d ago
r/LocalLLaMA· rssEN02:48 · 05·18
开源模型知识截止日期实测:Qwen 3.6-27B 和 Gemma4 都不知道 RTX 5060 Ti 存在
一位 Reddit 用户拿 RTX 5060 Ti 去问 Qwen 3.6-27B 和 Gemma4,两个模型都说这张卡不存在。帖子指出它们的知识截止日期是 2025 年初,但没透露具体用了哪个版本的数据训练。实测暴露的问题是:模型对 2025 年中期的新硬件信息完全空白,如果你依赖它们做选型或采购建议,这点先别太激动——它们可能连你刚发布的显卡都不认...
#Tools#Qwen#Gemma#ECrispy
精选理由
Reddit 用户拿一张不存在的显卡去问两个模型,结果它们都一本正经说没有,说明知识截止日期确实早于 5060 Ti 发布。但正文没披露具体训练数据版本,也没说测试了多少次、是不是单次偶然。信息量就这么多,不算重磅,但够当个趣闻。
一句话点评
实测 Qwen 3.6-27B 和 Gemma4 不认识 RTX 5060 Ti,因为知识截止在 2025 年初。如果你拿模型做硬件选型,这点先别太激动——它连你刚发布的显卡都不认。正文没披露具体用了哪个版本的数据训练,但暴露的问题是:模型对 2025 年中期的新硬件信息完全空白。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R1
02:23
26d ago
AI HOT 精选· aihot-apiZH02:23 · 05·18
上传自拍一键生成韩国棒球视频,PixVerse模板火了
PixVerse 的 K-Baseball Sprint 模板让你上传一张自拍,点一下就能生成一段韩国棒球风格的 AI 视频,不需要写提示词也不需要剪辑。这个模板在 X 上被疯转,但正文没披露具体播放量、定价或模型参数,所以热度到底多大、成本多低还不清楚。
#Multimodal#Vision#PixVerse#Product update
精选理由
HKR-H 靠视频模板的病毒钩子过关,但 HKR-K 缺数据、定价和模型细节,HKR-R 没打到从业者痛点。这只是一个产品/模板小更新,所以留在较低的 all 档。
一句话点评
PixVerse 搞了个韩国棒球风 AI 视频模板,上传自拍一键生成,不用写提示词,在 X 上被疯转。这种“零门槛”玩法确实容易出圈,但正文没披露播放量、定价或模型参数,热度多大、成本多低还不清楚。短评:模板化降低使用门槛,但没数据支撑前先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R0
01:51
26d ago
r/LocalLLaMA· rssEN01:51 · 05·18
FlashLM v9.7:用4个免费CPU核训2小时,模型100个token后就崩了
作者用4个免费CPU核心在TinyStories数据集上训了2小时,得到一个247万参数的小模型,验证集困惑度10.23。但所有FlashLM模型都无法保持连贯,大约输出100个token后就开始胡言乱语。成本确实低,但效果也基本不可用。正文没披露具体架构或训练细节,所以不清楚问题出在数据量太小还是训练方法本身有缺陷。
#Reasoning#Memory#Benchmarking#FlashLM
精选理由
HKR-K通过,因为帖子给出了具体的训练条件和验证指标。HKR-H和HKR-R偏弱:标题太干,而且一个100 token后就跑偏的小模型,受众面很窄。
一句话点评
用4个免费CPU核在TinyStories上训2小时,247万参数模型验证集困惑度10.23——成本极低,但输出约100个token后就开始胡言乱语,所有FlashLM模型都无法保持连贯。正文没披露具体架构或训练细节,所以不清楚问题出在数据量太小还是训练方法本身有缺陷。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H0·K1·R0
00:39
26d ago
AI HOT 精选· aihot-apiZH00:39 · 05·18
人机分拣直播:人类暂时领先,但机器人没掉链子
Figure 直播了一场机器人与人类比快递分拣的挑战,目前人类稍稍领先。正文没披露分拣件数、计时规则和机器人型号,所以这个“领先”有多大参考价值不好说。看点在于直播形式本身——敢把实时对比放出来,说明机器人至少能稳定跑完全流程,不会中途卡住或出错。
#Robotics#Figure#Benchmark
精选理由
HKR-H/R 通过:Figure 的人机分拣对决直播有竞争噱头,且触及仓库自动化焦虑。HKR-K 不通过:分拣件数、计时规则和机器人型号均未披露,信息缺口大,因此落在 60–71 分区间。
一句话点评
Figure 直播机器人和人类比快递分拣,目前人类稍稍领先。正文没披露分拣件数、计时规则和机器人型号,所以这个“领先”有多大参考价值不好说。看点在于直播形式本身——敢把实时对比放出来,说明机器人至少能稳定跑完全流程,不会中途卡住或出错。 短评:直播比输赢,信息太少先打折。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
00:29
26d ago
AI HOT 精选· aihot-apiZH00:29 · 05·18
Hermes 一个指令切换国内外大模型,支持 GPT-5.5、Grok-4.3、DeepSeek V4 等七家
Hermes 是一个模型切换工具,支持 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini、DeepSeek V4、智谱 GLM-5、Kimi K2.6 和小米 Mimo V2.5-pro 共七家模型。用户需要自己有对应服务的订阅或 API 密钥,配置好后用 /model 指令就能切换,比如输入 /model gpt-5.5 -...
#Tools#Hermes#OpenAI#xAI
精选理由
这是一条轻量级的工具配置提示,包含了/model切换和7类模型等可用细节,但来源和正文内容单薄。HKR仅K通过,因此落在60分区间。
一句话点评
Hermes 是个模型切换工具,支持 OpenAI GPT-5.5、xAI Grok-4.3、谷歌 Gemini、DeepSeek V4、智谱 GLM-5、Kimi K2.6 和小米 Mimo V2.5-pro 共七家。用户需自备订阅或 API 密钥,配置后用 /model 指令切换。好处是省去手动换平台,但正文没披露切换延迟、是否支持流式输出、以及各家 API 成本对比。如果只是命令行切模...
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K1·R0
00:00
26d ago
● P1AI HOT 精选· aihot-apiZH00:00 · 05·18
Cursor 发布编程模型 Composer 2.5
Cursor 把代码助手 Composer 升级到了 2.5 版,底层还是基于月之暗面的 Kimi K2.5 开源模型。这次主要做了三件事:一是用“文字反馈强化学习”,在模型犯错的地方直接插一句提示(比如“提醒:可用工具有这些”),让模型在那个点上学会纠正,而不是靠最后的总分去猜哪里做错了;二是把合成训练数据的量提到了上一代的 25 倍,并且动态生成更...
#Agent#Code#Fine-tuning#Cursor
精选理由
HKR 三项都踩中了:Cursor 本身就是编程助手的核心入口,文章又给了 Moonshot 基座、25 倍合成数据、文本反馈 RL 和分片 Muon 这些实打实的训练细节。我会先打个折——正文没给基准测试、没提价格,也没说用户端能力边界,所以分数卡在 78–84 这个区间是合理的。
一句话点评
Cursor 把编程模型 Composer 2.5 放出来了,跑分涨了,还专门训了模型的沟通风格和“别瞎忙活”的节奏。
锐评
Cursor 这次更新 Composer 2.5,核心不是换了个更强的底座模型,而是把训练方法做了升级。它还是基于 Kimi K2.5 的开源检查点,但用了两个新招:一是“带文字反馈的定向强化学习”,说白了就是模型在干活过程中哪句话说错了、哪个工具用错了,直接在出错的地方插一句提示当老师,让模型只改那个点,而不是等整件事干完再给个模糊的总分。这对纠正代码风格、减少无效工具调用这类局部毛病很管用。二是用 25 倍于上一代的合成任务来练,动态挑更难的题,防止模型刷分刷到天花板。 官方给的跑分表确实涨了,但更值得看的是他们放出的“努力曲线”图——模型在长任务里更稳,不会干到一半开始摸鱼或过度折腾。正文没披露具体延迟和成本变化,也没说这个模型在真实项目里的通过率比 2.0 高多少。另外,他们提到正和 SpaceXAI 用百万张 H100 级别的算力从头训一个更大的模型,那才是真正的下一代,2.5 更像是一次训练工程上的中期升级。
HKR 分解
hook knowledge resonance
打开信源
97
SCORE
H1·K1·R1
00:00
26d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·18
AI 模型公司的两条死路与一条活路
AI21 Labs 裁员 60% 并停止卖模型,Meta 则把 7000 人调去搞 AI、再裁 8000 人。文章把这两件事放在一起看:独立卖模型的路已经走不通了,模型层正在商品化——GPT-5.5、Claude、Gemini 等顶级模型差距缩小,token 价格两年跌了 100 倍。能活下来的要么有主权背书(Mistral、Cohere)、要么有分销...
#AI21 Labs#Meta#Commentary#Personnel
精选理由
HKR三项都达标,但正文只有RSS摘要,没披露两家公司的时间表、成本结构或执行细节。适合作为一篇有意思的评论,不值得上头条。
一句话点评
AI21 Labs 裁员 60% 并停售模型,Meta 则强制调动 7000 人搞 AI、再裁 8000 人。文章把两件事放一起看:独立卖模型的路走不通了,模型层正在商品化——GPT-5.5、Claude、Gemini 等顶级模型差距缩小,token 价格两年跌了 100 倍。能活下来的要么有主权背书(Mistral、Cohere)、要么有分销渠道(Anthropic 嵌入三大云)。但正文没...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
00:00
26d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·18
Pi:一个更好的 AI 编程工具,被挡在了门外
Mario Zechner 做了一个极简的 AI 编程 agent Pi,system prompt 不到 1000 token,只有四个工具,但 benchmark 不输 Claude Code 和 Cline。Pi 的核心设计是“缺什么比有什么更重要”:没有 MCP(外挂工具协议)、没有 sub-agent(子任务黑盒)、没有权限弹窗、没有 con...
#Code#Tools#Pi#Anthropic
精选理由
HKR-H 和 HKR-R 通过:访问冲突的钩子对重度用 Claude 的开发者成立。HKR-K 不通过:价格、API 细节和限制机制正文都没披露,信息量不足,属于低价值区间。
一句话点评
Pi 是一个极简 AI 编程工具,system prompt 不到 1000 token,只有四个工具,benchmark 不输 Claude Code 和 Cline。设计哲学是“缺什么比有什么更重要”:没有 MCP、sub-agent、权限弹窗,用 tmux 和文件替代。亮点是 session trees(可分支回退)和 extensions 系统(agent 自己写插件)。但 adop...
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1

更多

频道

后台