ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-07

132 items · updated 3m ago
RSS live
2026-05-07 · 星期四2026年5月7日
23:49
36d ago
AI HOT 精选· aihot-apiZH23:49 · 05·07
Claude Code v2.1.133 更新:新增三个配置项,修复并行会话死锁
Anthropic 发布了 Claude Code 的 v2.1.133 版本,主要加了三个配置项和一堆修复。新增的配置包括 worktree.baseRef(指定 Git 工作树的基础分支)、sandbox.bwrapPath(自定义沙箱路径)和 parentSettingsBehavior(控制子进程是否继承父配置)。修复方面,解决了并行会话死锁、...
#Code#Agent#Tools#Anthropic
精选理由
HKR-K/R 通过:三个新配置项和死锁、代理失效、VSCode 错误修复,对日常使用者有价值。HKR-H 不通过:这只是一个小版本补丁,不是模型或核心能力发布,标题吸引力弱。正文没披露新配置的具体用法和修复细节,信息量有限。
一句话点评
Claude Code v2.1.133 是个小版本,加了三个配置项:worktree.baseRef 指定 Git 工作树的基础分支,sandbox.bwrapPath 自定义沙箱路径,parentSettingsBehavior 控制子进程是否继承父配置。修复了并行会话死锁、代理失败和 VSCode 扩展报错。 对日常用户影响不大,主要是给团队协作和沙箱隔离场景用的。正文没披露性能提升...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H0·K1·R1
23:25
36d ago
AI HOT 精选· aihot-apiZH23:25 · 05·07
OpenAI 发布 GPT-Realtime-2 语音应用提示指南
OpenAI Devs 发布了针对 GPT-Realtime-2 的提示指南,专门给语音应用开发者用。指南讲了怎么调推理强度(让模型多想或少想)、写前导说明(开场白)、设计工具调用行为、处理听不清的音频、准确抓取实体信息,以及在长对话里保持状态。正文没披露具体参数或定价,但如果你在做语音助手,这份指南能省不少试错时间。
#Audio#Tools#Reasoning#OpenAI
精选理由
HKR-K 和 HKR-R 通过:GPT-Realtime-2 指南给出了语音应用可复用的提示机制。HKR-H 偏弱,且正文未披露参数、价格或能力变化,因此归为实用更新档位。
一句话点评
OpenAI 发了 GPT-Realtime-2 的提示指南,专治语音应用开发里的坑:怎么调推理强度(让模型多想或少想)、写开场白、处理听不清的音频、抓实体、保持长对话状态。正文没披露具体参数或定价,但如果你在做语音助手,这份指南能省不少试错时间。短评:官方补课,省得自己踩坑。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
23:20
36d ago
AI HOT 精选· aihot-apiZH23:20 · 05·07
Grok语音助手能处理复杂客服流程
xAI 发了条推,说 Grok Voice Think Fast 1.0 能搞定复杂客服场景,比如嘈杂环境下的多步骤故障排查和频繁调用工具。但正文没披露延迟、准确率和价格,所以实际好不好用、贵不贵还不清楚。
#Agent#Audio#Tools#xAI
精选理由
HKR 三项都过,因为 xAI 的语音助手更新给出了具体的复杂工作流条件(嘈杂环境、多步骤排障、高频工具调用),不是画饼。但正文没披露延迟、准确率或价格,验证力度不够,所以分数压在 60–71 区间。
一句话点评
xAI 说 Grok 语音助手能处理嘈杂环境下的多步骤客服流程,还频繁调工具。但没披露延迟、准确率和价格,实际好不好用、贵不贵都不清楚。如果是真的,挺省钱,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
23:13
36d ago
r/LocalLLaMA· rssEN23:13 · 05·07
MiniMax M2.7 的混合精度量化版,74GB 硬盘占用
JANGQ-AI 放出了 MiniMax M2.7 的混合精度量化版,硬盘占用 74GB。正文没披露具体量化方案、精度损失或推理硬件需求,所以暂时没法判断实际效果。如果你手头有 80GB 以上显存的卡,可以自己拉下来跑跑看。
#Inference-opt#JANGQ-AI#MiniMax#Hugging Face
精选理由
74GB 的 MiniMax M2.7 量化版对本地部署用户有吸引力,但正文只给了 Reddit 和 Hugging Face 链接,没披露量化方法、精度损失或推理硬件条件。信息缺口太大,只能算低价值更新,分数压在 52 合理。
一句话点评
MiniMax M2.7 的混合精度量化版,硬盘占用 74GB,但没披露精度损失和推理硬件需求。
锐评
JANGQ-AI 放出了 MiniMax M2.7 的混合精度量化版,硬盘占用 74GB。这个体积意味着它可能适合 80GB 以上显存的显卡(如 A100/H100)本地运行,但正文没披露具体量化方案(比如是 4-bit 还是混合精度)、精度损失多少,也没说推理需要多大显存。所以暂时没法判断实际效果——可能跑得动但质量打折,也可能需要双卡。如果你手头有 80GB 以上显存的卡,可以自己拉下来跑跑看,否则建议等更详细的评测。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R1
23:06
36d ago
r/LocalLLaMA· rssEN23:06 · 05·07
i5-14400F + RTX 4060 跑 Qwen 35B 模型,输出速度 30 token/s 算快吗?
Reddit 用户问怎么让 llama-server 跑得更快。配置是 i5-14400F、32GB DDR4、RTX 4060,跑 Qwen3.6-35B-A3B 的 GGUF 量化版,当前输出速度 30 token/s,预填充 500 token/s,开了 65535 上下文、-ngl 999(尽量把层塞进显存)、连续批处理和 Flash Atte...
#Inference-opt#Reddit#Qwen#Claude
精选理由
HKR-K 和 HKR-R 勉强过关,因为帖子给出了硬件和吞吐量数字。没有修复方案、量化对比或延迟曲线,所以这仍是低价值闲聊而非新闻。
一句话点评
30 token/s 对 35B 模型来说其实不慢,但显存可能已经爆了。
锐评
用户用 RTX 4060(8GB 显存)跑 Qwen3.6-35B-A3B 的 GGUF 量化版,30 token/s 的输出速度对 35B 参数模型来说已经算不错了——这得益于 MoE 架构只激活 3B 参数。但 65535 上下文窗口和 -ngl 999(尽量把层塞进显存)很可能导致显存溢出,触发 CPU offloading 拖慢速度。正文没披露显存占用和具体量化精度(如 Q4_K_M 还是 Q8_0),也没说延迟曲线。想提速可以:降低上下文长度、用更小的量化(如 Q4_K_M)、或者关掉连续批处理减少显存争抢。如果是单用户场景,30 tps 已经够用,不用太纠结。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R1
23:00
36d ago
AI HOT 精选· aihot-apiZH23:00 · 05·07
GitHub 给 PR 上的 Agent 工作流省 Token,但没公布省了多少
GitHub 在每次 Pull Request 都会跑 Agent 工作流(让模型进业务流程干活),发现有些步骤 Token 消耗太高,于是专门写了一个优化 Agent 来砍成本。正文没披露具体省了多少 Token、用了哪个模型、基线是多少,也没给可复现的配置。做法是监控线上流程,找出低效环节,再让一个专用 Agent 去修。思路对,但缺关键数字,没法...
#Agent#Inference-opt#GitHub#Product update
精选理由
GitHub 在自家 PR 智能体工作流里抓低效环节,专门造了个优化智能体来省 Token 钱。方向对,但正文没披露省了多少、调了哪个模型、Token 基线是多少,也没给复现配置。信息缺口太大,够不上精选。
一句话点评
GitHub 给每次 PR 都跑 Agent 工作流(让模型进业务流程干活),发现 token 烧得太快,于是写了个专用 Agent 来砍成本。思路是监控线上流程、找出低效环节、让另一个 Agent 去修。正文没披露省了多少 token、用了哪个模型、基线是多少,也没给可复现配置。方向对,但缺关键数字,没法判断是真省钱还是公关叙事。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
22:50
36d ago
r/LocalLLaMA· rssEN22:50 · 05·07
ZAYA1-74B-Preview:用AMD集群训了个74B模型,但细节基本没提
Zyphra放出了ZAYA1-74B-Preview,标题说是在AMD上做的预训练。74B参数规模不算小,如果AMD集群能稳定跑通这个量级的训练,对想绕开NVIDIA的团队是个好消息。但正文几乎没披露任何关键信息:用了什么数据集、多少张卡、训了多少token、花了多少钱、模型用什么协议发布,全都没说。最核心的“AMD训练栈能不能复现”也没提。所以这条消...
#Zyphra#AMD#Research release
精选理由
HKR 三项都是弱正面:74B 跑在 AMD 上确实有话题、有数字、能引起从业者共鸣。但正文只有 Reddit RSS 片段,没给训练集、加速卡型号、token 数、成本或权重许可,信息缺口太大,只能放在低价值区间的上沿。
一句话点评
标题说在AMD上训了74B模型,但正文啥都没披露,等于只放了个标题。
锐评
Zyphra 放了个 ZAYA1-74B-Preview,标题最值钱:74B 参数在 AMD 集群上跑通预训练。如果属实,对想绕开 NVIDIA 的团队是个信号——AMD 生态至少能撑起这个量级。但正文几乎为零:没提用了多少张卡、训了多少 token、花了多少钱、数据集是什么、模型用什么协议发布。最关键的“AMD 训练栈能不能复现”也没说。所以这条消息目前只能当“有人声称做到了”来听,不能当技术参考。如果后续补上 token 效率、成本对比和硬件配置,才有实际价值。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
22:39
36d ago
r/LocalLLaMA· rssEN22:39 · 05·07
有人攒了台 2.3TB 内存的本地集群,自称集齐了无限宝石
Reddit 用户 Street-Buyer-2428 晒了一台本地集群:2.3TB 内存、400 多个 vCores,计划用 Blackwell 做 prefill(首 token 生成),再通过 RDMA 连到 studio mesh 做 decode(续写)。内存和核心数确实大,但正文没披露用了多少张 GPU、实际吞吐多少,也没给可复现的配置清单...
#Inference-opt#Tools#Street-Buyer-2428#Blackwell
精选理由
HKR 三项全过,因为这是一套具体的本地推理集群方案,能引发 DIY 社区共鸣。重要性压在 60–71 区间,因为 GPU 数量、实际吞吐和可复现配置都没披露,信息缺口明显。
一句话点评
2.3TB 内存、400+ vCores,但没提 GPU 数量和实际吞吐,配置清单也不完整。
锐评
Reddit 用户 Street-Buyer-2428 晒了一台本地集群,内存 2.3TB、vCores 超过 400 个,计划用 Blackwell 做 prefill(首 token 生成),再通过 RDMA 连到 studio mesh 做 decode(续写)。内存和核心数确实大,但正文没披露用了多少张 GPU、实际吞吐多少,也没给可复现的配置清单。这种规模如果跑大模型推理,prefill 阶段可能快,但 decode 的延迟和带宽瓶颈未知。另外,Blackwell 和 studio mesh 的具体型号、网络拓扑都没说,验证成本很高。对于想抄作业的从业者,信息缺口太大,只能当个概念参考。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
22:39
36d ago
彭博科技· rssEN22:39 · 05·07
谷歌垄断案:法官驳回暂停数据共享令,上诉期间照常执行
联邦法官拒绝了Alphabet(谷歌母公司)在反垄断上诉期间暂停搜索数据访问令的请求。这意味着谷歌必须继续向竞争对手开放搜索数据,不能等上诉结果出来再执行。正文没披露具体要开放哪些数据、涉及哪些对手、以及执行时间表,所以实际影响范围还不清楚。
#Alphabet#Google#DOJ#Policy
精选理由
HKR-K和R通过,H不通过:这是一条Google搜索反垄断的程序性进展。搜索数据开放令对平台竞争有实质影响,但正文没交代数据范围、时间表和具体对手,信息缺口明显,所以落在60–71分区间。
一句话点评
法官驳回了谷歌在上诉期间暂停执行数据开放令的请求,谷歌得继续向对手开放搜索数据。
锐评
联邦法官明确拒绝谷歌在上诉期间暂停执行搜索数据开放令,意味着反垄断补救措施不会因上诉而推迟。谷歌必须继续向竞争对手开放搜索数据,不能等上诉结果出来再执行。这对依赖搜索数据的AI公司和搜索引擎厂商是短期利好,但正文没披露具体开放哪些数据、涉及哪些对手、以及执行时间表,所以实际影响范围还不清楚。Bloomberg来源可靠,但信息缺口明显——没有数据量级、开放方式(API还是原始数据)、以及是否包含用户行为信号等关键细节。这点先别太激动,等具体执行方案出来再评估对搜索生态的实际冲击。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
22:00
36d ago
彭博科技· rssEN22:00 · 05·07
软银股价能不能继续涨,全看OpenAI能不能帮它把账做平
软银这一波股价上涨,下周就要面对一次关键考验——市场要看它投OpenAI那几百亿美元到底值不值。投资者想要的是软银能拿出证据,证明这笔投资不会把资产负债表拖垮。但正文没披露软银具体持有多大的OpenAI股份,也没给出任何财务指标或下周要公布什么事件。简单说,软银的AI赌注能不能撑住股价,现在还缺硬数据。
#SoftBank#OpenAI#Funding#Commentary
精选理由
彭博的权威性加分,但事实信息太薄:软银股价涨、OpenAI敞口、投资者施压,就这三条。HKR的h和r过关,k不达标,所以这条有意思但不够头条。
一句话点评
软银股价下周面临考验,市场要看它投OpenAI的几百亿值不值。
锐评
软银这一波股价上涨,下周就要面对一次关键考验——市场要看它投OpenAI那几百亿美元到底值不值。投资者想要的是软银能拿出证据,证明这笔投资不会把资产负债表拖垮。但正文没披露软银具体持有多大的OpenAI股份,也没给出任何财务指标或下周要公布什么事件。简单说,软银的AI赌注能不能撑住股价,现在还缺硬数据。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
21:18
36d ago
r/LocalLLaMA· rssEN21:18 · 05·07
把 AI 代理塞进终端,它能帮你跑交互式程序了
Reddit 用户 zoomaaron 花了一个月做了个开源项目 agent-sh,把 AI 代理直接嵌进 shell 里。代理能实时感知终端里发生的一切,不用你再手动复制粘贴报错信息给别的编码助手。演示里有个浮动覆盖层扩展,代理能读取终端内容并自动敲命令,适合处理交互式安装或远程 SSH 场景。项目 MIT 协议,支持本地和云端模型。注意:浮动覆盖层...
#Agent#Code#Tools#zoomaaron
精选理由
HKR 三项都过,但这是个人 Reddit 项目,正文没披露沙箱、权限流程和任务成功率,所以分数卡在 60–71 区间,不上推荐位。
一句话点评
把 AI 塞进终端,让它自己看报错、自己敲命令,省去复制粘贴的麻烦。
锐评
Reddit 用户 zoomaaron 花了一个月做了个开源项目 agent-sh,把 AI 代理直接嵌进 shell 里。代理能实时感知终端里发生的一切,不用你再手动复制粘贴报错信息给别的编码助手。演示里有个浮动覆盖层扩展,代理能读取终端内容并自动敲命令,适合处理交互式安装或远程 SSH 场景。项目 MIT 协议,支持本地和云端模型。注意:浮动覆盖层还在 example 文件夹里,属于实验功能,正文没披露沙箱或权限控制,直接让代理敲命令有安全风险,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:14
36d ago
AI HOT 精选· aihot-apiZH21:14 · 05·07
开源了一个给 AI Agent 用的网盘 NeuDrive,能自动同步记忆、技能和文件
NeuDrive 是一个专门给 AI Agent 用的网盘,能自动同步 Agent 的记忆、技能和文件,支持 Claude Code、Codex、Cursor 这些主流开发工具和网页应用。项目已经在 GitHub 开源,也提供了可以直接用的部署版本。免费版覆盖大部分场景,付费版输入优惠码“vivo50”能换三个月免费。正文没披露同步协议、权限模型和自己...
#Agent#Tools#Memory#NeuDrive
精选理由
HKR 三项都过,但这是个人开发者开源项目,正文没披露同步协议、权限模型和自托管成本,验证力度弱。按小产品更新处理:70 分,all 层级。
一句话点评
短评:Agent 专用网盘,自动同步记忆和文件,免费版够用,但同步协议和权限模型没披露。 点评:NeuDrive 定位很实用——Agent 的记忆、技能、文件自动同步,省去手动搬运。支持 Claude Code、Cursor 等主流工具,免费版覆盖大部分场景,付费码“vivo50”能换三个月免费,诚意够。但正文没披露同步协议(是 WebDAV 还是自定义?)、权限模型(多 Agent 读写...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:02
36d ago
TechCrunch AI· rssEN21:02 · 05·07
Voi 创始人新公司 Pit 拿到 a16z 领投的 1600 万美元种子轮
欧洲滑板车公司 Voi 的创始人又搞了个 AI 公司叫 Pit,a16z 领投了 1600 万美元种子轮。正文没披露产品细节、模型能力或客户数据,所以目前只能知道团队背景和融资额——1600 万在种子轮算大钱,但具体做什么还不清楚。
#Pit#Voi#a16z#Funding
精选理由
早期融资消息:K 项靠 1600 万种子轮和 a16z 领投过关;H 项偏弱,R 项缺产品、模型能力或客户数据。没有硬排除理由,但事实单薄,分数压在低位。
一句话点评
Voi创始人新公司Pit拿了a16z 1600万美元种子轮,但产品细节全没披露。
锐评
Pit是欧洲滑板车公司Voi的创始人再创业,a16z领投1600万美元种子轮。1600万在种子轮算大钱,说明a16z对团队背景很认可。但正文没披露Pit具体做什么——是AI应用、模型还是中间件?模型能力、客户数据一概不知。目前能判断的只有两点:一是斯德哥尔摩又出了一个被a16z押注的AI公司,延续了当地创业生态的热度;二是种子轮金额大不等于产品靠谱,这点先别太激动。缺的是产品形态、技术路线和首批客户信息,这些才是判断Pit是否真值得关注的关键。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
20:56
36d ago
● P1彭博科技· rssEN20:56 · 05·07
Cloudflare 宣布裁员1100人 转向AI优先运营模式
Cloudflare 计划在全球裁掉超过 1,100 个岗位,相当于每五个员工里就有一个要走人。公司把这轮裁员和转向“agentic AI-first”运营模式直接挂钩——也就是让 AI 代理接管一部分业务流程里的活。不过正文没披露具体砍掉哪些部门、什么时候执行,也没说省下来的成本目标是多少。我会先打个折:这更像是一个组织调整信号,但实际用 AI 替代...
#Agent#Cloudflare#Personnel#Product update
精选理由
Cloudflare 宣布全球裁员超 1100 人,占员工五分之一,理由是要转向 agentic AI-first 运营模式。这个信号很硬——不是用 AI 辅助现有流程,而是直接动组织架构。不过正文没给岗位分布、时间表和成本目标,所以省钱效果到底多大、裁的是哪些职能,现在全是缺口。光凭“压缩 90% Token 精度不掉”和“裁 20% 人做 AI-first”这两条,已经够上 featured,但信息密度还撑不起 P1。
一句话点评
Cloudflare 一边营收创新高,一边裁掉 20% 员工,理由是 AI 让这些岗位没必要了。这个说法先打个折,正文没披露具体哪些岗位被 AI 替代、替代到什么程度。
锐评
Cloudflare 宣布裁掉 1100 人,占员工总数五分之一,同时公司营收刚创了新高。CEO 的说法是转向“AI 优先”运营模式,AI 让部分岗位变得多余。 这个时间点很微妙:营收新高时裁员,通常说明公司想趁业绩好把成本结构调得更轻,AI 是个现成的理由。但两篇报道都没给出关键细节——到底是客服、销售、还是技术岗被砍?AI 替代是指完全自动化,还是用工具把一个人的活压成半个人的活?没有这些信息,很难判断这是真转型还是借 AI 之名做常规瘦身。 对从业者来说,这更像一个信号:上市公司开始公开把裁员和 AI 挂钩,以后这类公告会越来越多。但具体到 Cloudflare 这次,缺的信息太多,先别急着当 AI 替代人的标杆案例看。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
20:46
36d ago
r/LocalLLaMA· rssEN20:46 · 05·07
Gemma 4 26B 的 4bit 量化版来了,但暂时跑不起来
网友 catlilface69 把 Google 的 Gemma 4 26B A4B(混合专家模型,每次推理只激活 4B 参数)转成了 NVFP4 格式的 GGUF 量化版,文件体积更小,适合本地部署。但注意:目前 llama.cpp 主线还不支持这个格式,得用他提供的 Docker 镜像才能跑。测试只用了 RTX 5070Ti(12GB 显存),如果...
#Inference-opt#NVIDIA#Gemma#llama.cpp
精选理由
HKR-K/R 通过:帖子给出了一个不支持的 GGUF 路径、Docker 镜像和仅 5070Ti 的测试。HKR-H 不通过,因为这只是一个小众的打包更新,不是模型或框架发布。
一句话点评
社区把Gemma 4 26B转成NVFP4量化版,但主线llama.cpp跑不了,得用作者提供的Docker。
锐评
网友catlilface69把Google的Gemma 4 26B A4B(混合专家模型,每次推理只激活4B参数)转成了NVFP4格式的GGUF量化版,文件更小,适合本地部署。但注意:目前llama.cpp主线不支持这个格式,得用他提供的Docker镜像才能跑。测试只用了RTX 5070Ti(12GB显存),如果CPU卸载会有性能问题。正文没披露具体推理速度或显存占用对比,这点先别太激动。如果是真的,NVFP4量化能降低本地部署门槛,但兼容性差、验证弱,目前更像一个实验性玩具。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
20:25
36d ago
AI HOT 精选· aihot-apiZH20:25 · 05·07
Luma Agents:输入一句标语,自动生成广告视频
Luma Labs 发布 Luma Agents,用户只需输入一句标语并选择美学风格,系统就能自动生成对应的广告视频。正文没披露模型规格、定价和生成耗时,所以实际可用性和成本还不清楚。如果生成质量过得去,这相当于把广告创意从“写脚本+拍素材”压缩成“写一句话”,对预算有限的小团队可能挺省钱。
#Agent#Multimodal#Tools#Luma Labs
精选理由
HKR-H 和 HKR-R 通过:标语生成广告这个点有视觉冲击力,也切中创意自动化成本焦虑。HKR-K 不通过:价格、延迟、模型细节、评测全没披露,所以分数压在 60–71 区间。
一句话点评
Luma 说输入一句标语、选个风格就能自动生成广告视频。正文没披露模型规格、定价和生成耗时,所以实际可用性和成本还不清楚。如果生成质量过得去,这相当于把广告创意从“写脚本+拍素材”压缩成“写一句话”,对预算有限的小团队可能挺省钱。 短评:一句话生成广告视频,省脚本和拍摄成本,但没披露定价和耗时,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
20:19
36d ago
彭博科技· rssEN20:19 · 05·07
Block 靠 AI 裁员后上调全年利润预期
Jack Dorsey 的 Block(前 Square)在搞了一轮 AI 驱动的裁员之后,上调了全年利润和增长预期。Bloomberg 说裁员力度不小,但正文没披露具体裁了多少人、利润指引上调了多少、增长数字是多少。结论就是:公司用 AI 替代人力省成本,资本市场暂时买账,但具体省了多少、能不能持续,信息还不够判断。
#Block Inc.#Jack Dorsey#Product update#Personnel
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 缺少裁员人数、利润指引或增长数字。来源是 Bloomberg,有权威性,但这是 AI 相关的财报新闻,不是技术突破,所以分数落在 60–71 区间。
一句话点评
Block 用 AI 裁员换利润上调,但具体裁了多少、利润涨了多少都没说。
锐评
Jack Dorsey 的 Block 在搞了一轮 AI 驱动的裁员后,上调了全年利润和增长预期,资本市场暂时买账。但正文没披露具体裁了多少人、利润指引上调了多少、增长数字是多少。结论就是:公司用 AI 替代人力省成本,资本市场暂时买账,但具体省了多少、能不能持续,信息还不够判断。如果裁员规模不大,利润上调可能更多来自其他业务改善,而非 AI 降本。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
19:45
36d ago
彭博科技· rssEN19:45 · 05·07
Arm 警告手机市场疲软,Anthropic 与 SpaceX 签算力协议
Arm CEO 说手机市场还在低迷,但 AI 数据中心的需求在涨。Anthropic 跟马斯克的 SpaceX 签了算力接入协议,但正文没披露规模、价格和期限,所以这笔交易到底多大、划不划算还不好说。另外,卫星情报公司 HawkEye 360 以 4.16 亿美元 IPO 上市。
#Inference-opt#Arm#Anthropic#SpaceX
精选理由
Anthropic 找 SpaceX 买算力是个新事实,有话题性,但正文没披露规模、价格和期限,信息缺口大。Bloomberg 这期还混了 Arm 谈手机疲软和 HawkEye 360 的 IPO 募资 4.16 亿美元,内容杂,所以重要性压在 68 分,覆盖全行业读者。
一句话点评
Anthropic 找 SpaceX 买算力,但价格和规模都没说,先别太激动。
锐评
Arm CEO 说手机市场还在低迷,但 AI 数据中心需求在涨,这基本是行业共识,没什么新信息。真正值得点的是 Anthropic 跟 SpaceX 签了算力接入协议——一家 AI 公司找火箭公司买算力,说明算力紧缺到什么程度了。但正文没披露规模、价格和期限,所以这笔交易到底多大、划不划算还不好说。如果是真的,Anthropic 可能拿到了 SpaceX 星链或地面数据中心的闲置算力,成本或许比 AWS 便宜,但延迟和稳定性存疑。另外,卫星情报公司 HawkEye 360 以 4.16 亿美元 IPO 上市,这个数字不算大,说明商业遥感赛道还没到爆发期。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
19:38
36d ago
Hacker News 首页· rssEN19:38 · 05·07
南非内政部两名官员因AI“幻觉”被停职
南非内政部两名官员被停职,原因是他们起草的一份政策文件里出现了AI“幻觉”——也就是模型编造了不存在的事实。报道没说是哪个AI系统、具体编了哪些内容,也没披露调查流程和复核机制。这件事的看点在于:政府用AI写正式文件,出了错直接追责到人,而不是怪模型。如果AI输出没有人工审核流程兜底,这类事件会越来越多。
#Safety#Home Affairs#Incident
精选理由
HKR-H和HKR-R通过:停职这个处理结果很实在,直接关联AI幻觉的责任问题。HKR-K不通过:RSS摘要只说了停职两人,没有系统名称、错误细节和复核机制,信息量不够支撑知识性判断。
一句话点评
南非内政部两名官员因AI编造事实被停职,但报道没说是哪个AI系统、编了啥。
锐评
南非内政部两名官员被停职,因为他们起草的政策文件里出现了AI“幻觉”——模型编造了不存在的事实。报道没披露用的是哪个AI系统、具体编了哪些内容,也没说调查流程和复核机制。这件事的看点在于:政府用AI写正式文件,出了错直接追责到人,而不是怪模型。如果AI输出没有人工审核流程兜底,这类事件会越来越多。目前信息缺口很大:不知道是哪个模型、幻觉比例多高、文件是否已外发。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
19:36
36d ago
Hacker News 首页· rssEN19:36 · 05·07
Mozilla 说 Mythos 找到了 271 个漏洞,而且几乎没有误报
Mozilla 宣称其内部工具 Mythos 挖出了 271 个漏洞,且误报率极低。但正文只给了链接和 Hacker News 上的 39 个点赞、9 条评论,没披露漏洞类型、验证流程、影响组件或复现条件。信息缺口很大,没法判断这 271 个漏洞的严重性,也没法验证“几乎无误报”这个说法靠不靠谱。
#Code#Tools#Safety#Mozilla
精选理由
核心看点是Mythos扫出271个漏洞且误报率极低,但正文只给了URL和HN讨论,没披露漏洞分类、验证流程、受影响组件和复现条件,信息缺口太大。分数卡在60-71之间,够不上精选。
一句话点评
Mozilla 说自家工具 Mythos 挖了 271 个漏洞,几乎零误报,但正文只给了个链接和 39 个 HN 赞,信息缺口太大,先别信。
锐评
Mozilla 宣称内部工具 Mythos 挖出 271 个漏洞,且“几乎无误报”。但正文只贴了 Ars Technica 链接和 Hacker News 上的 39 个点赞、9 条评论,没披露任何漏洞类型、影响组件、验证流程或复现条件。271 这个数字看着大,但没说明严重性——是高危远程代码执行还是低危信息泄露?误报率“几乎为零”也没给具体百分比或测试集规模。来源是 Mozilla 自家宣传,缺乏第三方审计或公开 PoC。对从业者来说,这条信息目前只能当个线索,没法直接用于评估 Mythos 的实用性。想跟进的话,得等 Mozilla 放出详细报告或独立验证结果。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:26
36d ago
● P1The Verge · AI· rssEN19:26 · 05·07
SpaceX 计划在得州投资逾 550 亿美元建设芯片工厂
SpaceX 在奥斯汀的“Terafab”芯片工厂计划投资至少 550 亿美元,一份听证会文件显示后期总投资可能拉到 1190 亿美元。马斯克 3 月说过目标是年产能支撑 200GW 算力的芯片,但正文没披露具体用哪种制程工艺。
#Inference-opt#SpaceX#Elon Musk#The New York Times
精选理由
这条消息的钩子就是 SpaceX 跨界造芯片,数字大得离谱,所以 HKR 全中。我会先打个折:正文没披露工艺节点、时间表和已签约客户,没法判断是动真格还是画饼。550 亿到 1190 亿的投资区间,以及 200GW 算力目标,如果是真的挺省钱——但前提是得先有厂、有客户、有产能爬坡,这些信息目前全是缺口。
一句话点评
SpaceX 要在得州砸 550 亿美元建芯片厂,但这是申请税收减免的预估上限,实际花多少、能不能成还两说。
锐评
SpaceX 向得州格里姆斯县提交了一份税收减免申请,计划在当地建一座叫“Terafab”的芯片制造厂。文件里写的总投资上限是 1190 亿美元,但第一阶段预估投入是 550 亿美元。这个数字是公司自己报的,目的是争取税收优惠,不是已经落地的投资额,我会先打个折看。 马斯克的说法是,现有的芯片厂产能跟不上他旗下公司(SpaceX、xAI、特斯拉)对 AI 和机器人的需求,所以必须自己造。工厂定位是“垂直整合”,也就是从设计到制造一条龙全包,目标未来年产芯片能提供 1 太瓦的算力。英特尔也被拉了进来,负责提供制造技术。 目前公开信息只有这份申请文件,没有披露资金来源、技术路线、建设时间表,也没有第三方验证。550 亿美元是什么概念——差不多是台积电一年资本开支的 1.5 倍。如果是真的,确实挺省钱(省去了外购芯片的溢价),但前提是 SpaceX 能搞定芯片制造这个极其烧钱、技术壁垒又高的行当。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
19:21
36d ago
Hacker News 首页· rssEN19:21 · 05·07
Dirtyfrag:通用Linux本地提权漏洞公开披露
安全研究员公开了一个叫 Dirty Frag 的本地提权漏洞,影响所有主流 Linux 发行版。它把两个内核漏洞串起来用,攻击者只要能在机器上跑代码就能直接拿到 root 权限。作者说影响范围和之前的 Copy Fail 差不多。因为保密期被提前打破,目前没有任何官方补丁或 CVE 编号。临时缓解办法是禁用 esp4、esp6 和 rxrpc 这三个内...
#Linux#Openwall#Hacker News#Incident
精选理由
硬排除的技术可及性失败:这是一个 Linux 本地提权线索,但没给受影响版本、复现条件或补丁状态。AI 相关性仅限于基础设施安全,所以 35 分。
一句话点评
Dirty Frag 是一个通用 Linux 本地提权漏洞,组合了两个内核漏洞,影响所有主流发行版。由于披露流程被打破,目前没有补丁和 CVE 编号。官方给出的缓解措施是禁用 esp4、esp6 和 rxrpc 三个内核模块。漏洞利用代码已公开,可覆盖 /usr/bin/su 文件写入一个 192 字节的 root shell ELF。正文没披露漏洞被利用的活跃程度,但 PoC 已出,风险很高。
HKR 分解
hook knowledge resonance
打开信源
47
SCORE
H1·K0·R1
19:06
36d ago
TechCrunch AI· rssEN19:06 · 05·07
Bumble 要取消左滑右滑,CEO 说靠 AI 来配对
Bumble 的 CEO 宣布将移除传统的滑动匹配机制,转向 AI 驱动。公司正在开发一个叫 Bee 的 AI 约会助手,CEO 曾称 AI 会是“爱情的超强加速器”。但正文没披露 Bee 的上线时间、具体功能或收费方式,目前只是方向性表态。
#Agent#Bumble#Whitney Wolfe Herd#Bee
精选理由
H 和 R 通过:Bumble 取消滑动是个强产品钩子,也引出了 AI 代理改变用户体验的问题。K 偏弱:文章只给了 Bee 的方向,没有机制、时间或商业条款,所以分数落在 60–71。
一句话点评
Bumble 要砍掉左滑右滑,改让AI帮你挑对象。
锐评
Bumble CEO 宣布要砍掉经典的左滑右滑匹配,转向 AI 驱动。公司正在做的 AI 约会助手叫 Bee,CEO 曾放话 AI 会是“爱情的超强加速器”。但正文只给了方向,没披露 Bee 什么时候上线、具体能干什么、怎么收费——目前就是个表态。如果 Bee 真能根据用户偏好自动筛选和发起对话,确实能省掉大量手动刷人的时间,对用户留存和匹配效率都是好事。但这点先别太激动:AI 约会助手之前也有产品试过,效果参差不齐,核心难点在于模型能不能理解真实的人类暧昧信号,而不是简单按标签匹配。正文没披露 Bee 的推荐逻辑、隐私方案或任何实测数据,验证还很弱。Bumble 股价之前承压,这个方向性喊话更像给市场画饼,实际落地还得看后续产品细节。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
18:20
36d ago
● P1彭博科技· rssEN18:20 · 05·07
Apple 配摄像头 AirPods 进入后期开发测试阶段
彭博社拿到消息,苹果把带摄像头的 AirPods 推进到了后期开发阶段。这可能是苹果第一款明确为 AI 场景设计的穿戴设备,但报道没公布摄像头具体参数、工作原理和发布时间。我会先打个折:目前只有进度信息,产品能不能落地、怎么用 AI 都还是未知数。
#Vision#Multimodal#Apple#Product update
精选理由
消息来自彭博,加上带摄像头的 AirPods 这个设定,H、K、R 都站得住。分数定在 72–77 区间,是因为只说了后期测试,没给规格、没讲 AI 怎么跑、也没提什么时候发,信息密度有限。
一句话点评
苹果带摄像头的 AirPods 已进入量产前的 DVT 测试,但别急着下单——它主要靠红外摄像头给 AI 当“眼睛”,不是用来拍照的。
锐评
这条消息的核心是:苹果把 AirPods 做成了 AI 的传感器。耳机上装的不是常规摄像头,而是红外摄像头,用来感知周围环境,再配合新 Siri 做实时信息处理。Bloomberg 说产品已进入 DVT(设计验证测试)阶段,这是量产前的最后几道关卡之一,说明硬件方案基本定型了。 但文章没提电池能撑多久、红外摄像头在强光下效果如何,也没说这功能是本地跑还是依赖手机。这些直接决定它到底是“有用的 AI 耳朵”还是“又一个小众实验品”。另外,最快 9 月亮相的说法来自供应链推测,苹果自己没确认,时间上可以先打个折。 对从业者来说,这代表苹果在 AI 可穿戴上的路线选择:不做眼镜,先改造耳机。如果跑通,会推动一波“耳机+传感器+端侧模型”的落地尝试。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
18:13
36d ago
r/LocalLLaMA· rssEN18:13 · 05·07
怎么把 PDF 喂给 Gemma-4?Reddit 用户问了一圈没标准答案
有人在 Reddit 问怎么把 PDF(含文字、公式、表格、图片)喂给 Gemma-4。llama.cpp 几个月前就加了 PDF 支持,但只是把 PDF 当纯文本或图片处理,没有专门解析公式和表格的逻辑。帖子没给出官方 API、参数设置或可复现的工作流,所以目前没有标准做法。如果你要处理带公式和表格的 PDF,得自己搭解析管线,Gemma-4 本身没...
#Multimodal#Vision#Tools#Gemma-4
精选理由
HKR-K/R 通过:帖子点出了具体的 PDF 解析痛点,并给出了 llama.cpp 的处理细节。HKR-H 不通过:这是一个常规求助帖,正文未披露 Gemma-4 的官方接口、参数或可复现流程。
一句话点评
PDF喂给Gemma-4没有标准做法,得自己搭管线。
锐评
有人在Reddit问怎么把带公式、表格、图片的PDF喂给Gemma-4。llama.cpp几个月前就加了PDF支持,但只是当纯文本或图片处理,没有专门解析公式和表格的逻辑。帖子没给出官方API、参数设置或可复现的工作流,所以目前没有标准做法。如果你要处理带公式和表格的PDF,得自己搭解析管线,Gemma-4本身没内置PDF解析器。正文没披露任何实测效果或性能数据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K1·R1
17:46
36d ago
AI HOT 精选· aihot-apiZH17:46 · 05·07
Replit 安全中心2.0:批量管理应用安全,Agent 自动修漏洞
Replit 发布了安全中心2.0,主要功能是让开发者批量查看和管理自己所有 Replit 应用的安全状态。亮点是能一键标记高风险应用,并用 Agent 在几秒内自动修复关键漏洞,还能批量通知应用所有者或直接下架。另外支持导出 SBOM(软件物料清单),方便对接外部安全工具。正文没披露这个功能覆盖多少应用、具体定价以及上线范围,所以实际能管多大规模还不清楚。
#Agent#Tools#Safety#Replit
精选理由
HKR 三项都过,但只是 Replit 安全中心 2.0 一个产品更新。覆盖多少应用、怎么定价、哪些地区上线,正文都没说,所以压在 60–71 这个区间。
一句话点评
Replit 安全中心2.0 让开发者批量管理所有应用的安全状态,亮点是用 Agent 几秒自动修关键漏洞,还能一键下架或通知所有者。支持导出 SBOM 对接外部工具。正文没披露覆盖应用数、定价和上线范围,实际能管多大规模还不清楚。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
17:43
36d ago
AI HOT 精选· aihot-apiZH17:43 · 05·07
Gemini 3.1 Flash Lite 上线 OpenRouter,百万上下文只要 0.25 美元
Google DeepMind 的 Gemini 3.1 Flash Lite 今天在 OpenRouter 上架。它支持文本、图片、视频、音频和 PDF 转文字,上下文窗口拉到 100 万 token(相当于一次塞进好几本书)。价格很便宜:输入每百万 token 0.25 美元,输出每百万 1.5 美元。另外 OpenRouter 新加了一个 ser...
#Multimodal#Vision#Audio#OpenRouter
精选理由
这是OpenRouter上架更新,不是Google DeepMind原生发布。具体价格、百万上下文和service_tier参数让这条消息有用,但属于小版本更新,所以落在60–71分区间。
一句话点评
短评:百万上下文+多模态,价格确实低,但延迟和效果未知,先别急着换。 点评:Google DeepMind 的 Gemini 3.1 Flash Lite 今天在 OpenRouter 上架,主打便宜和大胃口:输入每百万 token 0.25 美元,输出 1.5 美元,比很多模型便宜一个量级。上下文窗口拉到 100 万 token,能一次塞进好几本书,还支持文本、图片、视频、音频和 PDF...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:27
36d ago
FT · 科技· rssEN17:27 · 05·07
IMF警告:新AI模型可能引发金融系统级风险
国际货币基金组织(IMF)发报告说,金融机构用上新一代AI模型后,如果出现AI驱动的安全漏洞,可能造成系统性金融冲击。报告要求企业为“不可避免”的网络故障做准备。正文没披露具体是哪种模型、攻击怎么运作,也没给出可能的损失金额。
#Safety#IMF#Policy#Safety/alignment
精选理由
FT加IMF,来源权威。HKR的h和r靠“系统性金融冲击”这个框架过关,但k项扣分——正文没讲模型类型、攻击路径或量化损失,所以分数压在60–71区间。
一句话点评
IMF警告金融机构用新AI模型可能引发系统性风险,但没说是哪种模型、攻击怎么运作,也没给损失金额。
锐评
IMF这份报告的核心判断是:金融机构大规模部署新一代AI模型后,如果出现AI驱动的安全漏洞,可能造成系统性金融冲击。报告要求企业为“不可避免”的网络故障做准备。但正文没披露具体是哪种模型(比如是推理模型还是Agent)、攻击怎么运作(是数据投毒、对抗样本还是供应链攻击),也没给出可能的损失金额。这点先别太激动——没有攻击路径和损失估算,警告更像原则性表态。对AI从业者来说,值得关注的是“系统性”这个定性:如果多家机构用同一套AI基础设施(比如同一个基础模型或外挂资料库),一个漏洞就能连锁传染。但报告没提监管该怎么做,也没说现有安全测试够不够。信息缺口明显:缺模型类型、攻击场景、损失量级。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
17:03
36d ago
r/LocalLLaMA· rssEN17:03 · 05·07
DIY装机市场在缩水,因为内存太贵了
Reddit 帖子引用数据说,华硕 2025 年出货了 1500 万块主板,2026 年预计只出 1000 万块,降了三分之一。CPU 也在涨价,但帖子没披露具体涨了多少。对本地跑 AI 的人来说,硬件物料清单(BOM)的压力是实打实的——内存贵了,装机的人就少了,买来跑大模型的人更得掂量预算。正文没披露内存和 CPU 的具体涨幅,这点先别太激动。
#Asus#DigiTimes#Commentary
精选理由
HKR 三项都过:内存涨价是本地推理的成本痛点,华硕出货量从 1500 万降到 1000 万是硬数字。正文没披露 RAM、CPU 涨价幅度和统计口径,信息缺口明显,所以分数压在 60–71 区间。
一句话点评
内存涨价,DIY 装机市场凉了三分之一。
锐评
Reddit 帖子引用 DigiTimes 数据:华硕 2025 年出货 1500 万块主板,2026 年预计只出 1000 万块,降了三分之一。CPU 也在涨,但正文没披露具体涨幅。对本地跑 AI 的人来说,硬件物料清单(BOM)的压力是实打实的——内存贵了,装机的人就少了,买来跑大模型的人更得掂量预算。如果是真的,这波涨价会直接推高本地推理的入门门槛。不过数据来源是 DigiTimes 的行业预测,不是华硕官方财报,且帖子本身被 Reddit 屏蔽了,原始出处无法直接验证。还缺内存和 CPU 的具体涨幅数字,以及这是短期供需波动还是长期趋势。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:03
36d ago
FT · 科技· rssEN17:03 · 05·07
老牌IT公司也想蹭AI,但正文没说是谁、卖什么、赚多少
FT一篇付费文章讲传统IT厂商(服务器、通用芯片、软件公司)正在努力让自己跟AI沾上边。文章标题挺有画面感,但正文被付费墙挡住了,看不到具体公司名字、营收数字、产品路线图或交易条款。简单说就是:老玩家不想被新贵甩开,但这条链接给不出更多干货。
#Inference-opt#Commentary
精选理由
FT 的牌子加分,H 和 R 靠“旧 IT 翻盘”这个角度勉强过关。K 直接挂掉,因为现有文本里没有名字、数字、机制或条款,纯粹是泛泛的评论,没法用。
一句话点评
付费墙挡住了,看不到具体公司、数字和产品路线图。
锐评
FT这篇讲传统IT厂商(服务器、通用芯片、软件公司)正拼命往AI上靠,标题挺有画面感,但正文被付费墙完全挡住。没有具体公司名字、营收数字、产品路线图或交易条款,信息量约等于零。老玩家不想被新贵甩开是常识,但这条链接给不出任何可验证的判断。如果你在关注传统IT转型,建议直接搜Dell、Intel、Oracle的财报或产品发布,比这篇有干货。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
16:54
36d ago
r/LocalLLaMA· rssEN16:54 · 05·07
AMD 要出插槽式 GPU,本地跑模型可能不用再折腾外接供电了
Reddit 用户发帖称 AMD 将推出 slottable GPU,链接指向一款基于 PCIe 的 Instinct 显卡。这意味着它可以直接插在主板上,不用额外供电线或外置显卡坞,对本地 LLM 玩家来说部署门槛更低。但帖子正文被屏蔽,没披露价格、显存、功耗和发布时间——这些才是决定能不能跑大模型的关键。目前信息只够确认“有这回事”,具体规格还得等官方。
#Inference-opt#AMD#The Register#Product update
精选理由
HKR-H和HKR-R成立,因为硬件角度对本地推理有实际意义,且触及替代NVIDIA的采购决策。但HKR-K不成立:正文只有一条评论和一个链接标题,没有一手规格或官方确认,来源太单薄。所以重要性55、tier all是合理的——方向对但证据不足,适合所有人扫一眼,不值得深度跟进。
一句话点评
AMD 要出插槽直插的 Instinct 显卡,不用外接供电和显卡坞,本地跑模型部署门槛更低。但帖子正文被屏蔽,价格、显存、功耗、发布时间全没披露——这些才是决定能不能跑大模型的关键。目前只能确认有这回事,具体规格等官方。
锐评
这条消息来自 Reddit 用户发帖,链接指向一款基于 PCIe 的 Instinct 显卡,标题说 AMD 要出 slottable GPU。对本地 LLM 玩家来说,直插主板、不用额外供电线和外置显卡坞,部署门槛确实更低。但帖子正文被屏蔽,关键信息全缺:价格、显存、功耗、发布时间——这些才是决定能不能跑大模型的核心。目前只能确认“有这回事”,具体规格得等官方。来源是 Reddit 用户,不是 AMD 官方,权威性打折。如果真能像普通显卡一样插上就用,对个人开发者和小团队是好事,但显存和功耗没出来前别太激动。正文没披露任何数字,没法判断性价比和实际性能。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
16:33
36d ago
r/LocalLLaMA· rssEN16:33 · 05·07
Meera:一个完全离线的 Linux 桌面助手,1.2GB 模型就能干活
开发者发布了一个叫 Meera 的 Linux Gnome 本地助手,核心是 Qwen3.5-2B-Q4_K_M 模型,只有 1.2GB,通过 llama-cpp 跑在 Vulkan 上,完全离线。它能调日历、控制系统、搜文件。关键设计是工具路由:先用一个更小的嵌入模型把候选工具和“外挂资料库”(RAG)片段筛一遍,再让主模型调用。这样 2B 模型也能...
#Agent#RAG#Tools#Meera
精选理由
H/K/R三项都达标,但这是个人项目,正文没披露用户量、可靠性测试或成熟开源信号。它更像一份可复现的本地agent配方,不是当天必须追的热点。
一句话点评
1.2GB 的本地助手,能调日历搜文件,但别指望它写代码。
锐评
Meera 是一个完全离线的 Linux Gnome 本地助手,核心是 Qwen3.5-2B-Q4_K_M 模型,仅 1.2GB,通过 llama-cpp 跑在 Vulkan 上。关键设计是工具路由:先用一个更小的嵌入模型把候选工具和“外挂资料库”(RAG)片段筛一遍,再让主模型调用。这样 2B 模型也能完成日历、系统控制、文件搜索等任务,成本极低。但正文没披露工具调用的准确率或延迟数据,2B 模型在复杂指令下的理解能力存疑。另外,它只支持 Linux Gnome 环境,Windows 和 macOS 用户暂时用不了。整体看,这是一个轻量级本地 Agent 的有益尝试,但验证还很初步。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:26
36d ago
FT · 科技· rssEN16:26 · 05·07
Meta 起诉英国通信管理局,称其罚款权“史无前例”且违法
Meta 对英国《在线安全法》发起法律挑战,核心指控是监管机构 Ofcom 的罚款权力过大且缺乏法律依据。正文未披露具体罚款上限、涉及案例数量或相关法律条款,信息缺口明显。目前只能确认这是一起科技巨头与英国监管之间的法律对抗,具体影响和风险等级尚不明确。
#Safety#Meta#Ofcom#Policy
精选理由
FT来源扎实,Meta与Ofcom的冲突让H成立;但K因为缺少法律细节而扣分;R弱在文章讲的是平台政策,不是AI产品或模型监管。
一句话点评
Meta 告英国监管罚款权过大,但正文被墙,具体罚多少、依据哪条法都没说。
锐评
Meta 对英国《在线安全法》发起法律挑战,核心指控是 Ofcom 罚款权“史无前例”且缺乏法律依据。但 FT 正文被付费墙挡住,没披露具体罚款上限、涉及案例数量或相关法律条款,信息缺口明显。目前只能确认这是一起科技巨头与英国监管之间的法律对抗,具体影响和风险等级尚不明确。对 AI 从业者来说,这事可能影响未来模型在英国的部署合规成本,但正文没给细节,暂时没法判断 Meta 胜算或罚款对业务的实际冲击。建议等 Ofcom 回应或法院文件公开后再评估。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H1·K0·R0
16:16
36d ago
AI HOT 精选· aihot-apiZH16:16 · 05·07
NBC报道Suno短信转歌功能走红
NBC新闻刚报道了Suno的一个新玩法:把短信聊天记录直接转成歌,正在社交媒体上病毒式传播。正文只给了一个NBC视频链接,没披露用户量、生成机制或Suno的具体参数,所以不清楚是免费功能还是付费玩法,也不确定生成一首歌要多久。
#Audio#NBC News#Suno#Commentary
精选理由
HKR-H靠“短信转歌”这个玩法过关,但HKR-K和HKR-R都不行:全文只指向一条NBC视频,没有规模、机制或可复现的细节。当成一条信息量很薄的媒体转载处理。
一句话点评
Suno 把短信聊天记录直接转成歌,NBC 刚报道了这波病毒式传播。正文只给了一个视频链接,没披露用户量、生成时长或是否免费,所以先别太激动。如果真能秒级生成且音质不崩,这玩法比写 prompt 门槛低得多,适合社交裂变。但信息缺口太大:Suno 没公布参数,不清楚是免费功能还是付费玩法,生成一首歌要多久也没说。建议等实测或官方数据再判断。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
16:12
36d ago
AI HOT 精选· aihot-apiZH16:12 · 05·07
AI 助手一键生成 70 多种公众号排版风格
这个 AI 助手能根据 Design md 参考,直接生成公众号文章的 CSS 排版,支持 70 多个知名网站的风格。你告诉它想要哪种风格,它就能自动套用。不过原文没透露这个 Agent 的具体实现、生成质量如何,也没说测试环境,所以实际效果得自己试。
#Agent#Code#VoltAgent#Product update
精选理由
一个开源小工具/资源:公开了70多种参考排版样式,但Agent设计、输出质量和可复现测试都没提。HKR-H和弱HKR-K通过,HKR-R不通过。
一句话点评
一个Agent能直接套70多种公众号排版风格,省了手动调CSS的功夫。但正文没披露生成质量、测试环境,实际效果得自己试。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K1·R0
16:05
36d ago
TechCrunch AI· rssEN16:05 · 05·07
Anthropic 的 Mythos 帮 Firefox 挖出一堆高危漏洞
Mozilla 安全团队说,Anthropic 的 Mythos 模型在 Firefox 里找到了多个高危 bug。正文没披露具体数量、复现步骤、修没修,也没说 Mythos 是怎么工作的。
#Agent#Code#Safety#Anthropic
精选理由
TechCrunch 报道加上 Anthropic 和 Firefox 的安全合作,H 和 R 都成立。K 不成立是因为正文信息缺口太大——没给漏洞数、复现步骤、修复状态和 Mythos 机制,所以分数压在 60–71 区间。
一句话点评
Anthropic 的 Mythos 模型在 Firefox 里挖出多个高危 bug,但具体数量、复现步骤和修复情况都没说。
锐评
Mozilla 安全团队说 Anthropic 的 Mythos 模型在 Firefox 里找到了多个高危 bug,但正文没披露具体数量、复现步骤、修没修,也没说 Mythos 是怎么工作的。这相当于只给了个结论,没有验证细节。如果 Mythos 真能稳定挖到浏览器级漏洞,那对安全测试自动化是个好消息——省人工、提效率。但这点先别太激动,因为 Mozilla 没公开任何可复现的证据,也没说 Mythos 是独立发现还是辅助人工。另外,Mythos 本身是闭源模型,外部无法复现实验,验证链条是断的。缺的是:漏洞编号、CVE 状态、Mythos 的召回率和误报率,以及和传统 fuzzing 工具的对比。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
16:05
36d ago
Hacker News 首页· rssEN16:05 · 05·07
Mozilla 用 Claude Mythos Preview 给 Firefox 做了一次深度安全加固
Mozilla 公开了用 Claude Mythos Preview 等 AI 模型在 Firefox 里挖到的一批潜伏安全漏洞,数量前所未有。文章列出了 12 个已修复的 bug,包括 JIT 编译优化跳过初始化、15 年历史的 <legend> 元素 bug、IPC 竞争条件导致沙箱逃逸、20 年历史的 XSLT 哈希表重入问题等。这些漏洞很多是沙...
#Code#Safety#Mozilla#Claude
精选理由
H 和 R 都够格,但 K 不通过:正文没披露加固机制、评估指标或可复现条件,只有一条链接和评论区入口。Hacker News 的 99 分和 64 条评论说明讨论热度不低,但故事本身信息量撑不起更高分,卡在 60–71 这个区间合理。
一句话点评
Mozilla 用 Claude 挖出 12 个 Firefox 潜伏漏洞,包括 15 年和 20 年历史的老 bug,但没公开具体用了多少模型算力、花了多少钱。
锐评
Mozilla 这篇博客最值钱的信息是:AI 模型(Claude Mythos Preview)真的能挖到传统 fuzzing 漏掉的深层漏洞,比如 JIT 编译优化跳过初始化、IPC 竞争条件导致沙箱逃逸、XSLT 哈希表重入问题——有些 bug 活了 15 到 20 年。文章列了 12 个已修复的 CVE,但没披露用了多少模型调用、花了多少推理成本、以及误报率。如果成本可控,这对浏览器安全是实打实的提升,因为传统 fuzzing 很难覆盖跨组件、跨进程的复杂路径。但正文没说明这些漏洞是否已有野外利用,也没给出可复现的评估基准。对于想跟进的团队,建议先关注 Mozilla 后续是否开源其 prompt 工程和过滤 pipeline。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
15:56
36d ago
Hacker News 首页· rssEN15:56 · 05·07
Chrome 删掉了“设备端 AI 不上传数据”的声明
Chrome 悄悄移除了之前声称“设备端 AI 不会向 Google 服务器发送数据”的说明。这意味着你本地的 AI 功能可能并不完全本地——至少 Google 不再承诺这一点。正文没披露具体是哪个 Chrome 版本、哪个 AI 功能、传了什么数据、以及什么时候改的。如果你在用 Chrome 的 AI 特性(比如智能选词或页面总结),这点先别太激动,...
#Inference-opt#Safety#Google#Chrome
精选理由
标题本身有隐私反转钩子,H 和 R 都成立。但正文信息严重不足——没提版本、功能名、数据类型和生效时间,K 不通过。建议等更完整的报道再深入分析。
一句话点评
Google 悄悄删了“设备端AI不上传数据”的承诺,但没说哪个功能、传了什么、何时改的。
锐评
Chrome 移除了“设备端 AI 不会向 Google 服务器发送数据”的说明。这意味着你本地的 AI 功能可能并不完全本地——至少 Google 不再承诺这一点。正文没披露具体是哪个 Chrome 版本、哪个 AI 功能、传了什么数据、以及什么时候改的。如果你在用 Chrome 的 AI 特性(比如智能选词或页面总结),这点先别太激动,因为信息缺口很大:没有版本号、没有功能名、没有数据类型。来源是 Reddit 用户发帖,非官方公告,可信度要打折。缺的是 Google 的官方回应、变更日志链接、以及受影响功能的清单。对于做隐私合规或依赖本地推理的团队,这是个信号:设备端 AI 的隐私承诺可能随时撤回,建议自己抓包验证流量,别只看宣传文案。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
15:40
36d ago
● P1Hacker News 首页· rssEN15:40 · 05·07
DeepSeek 4 Flash 的 Metal 本地推理引擎发布
Redis 作者 antirez 开源了一个叫 ds4 的项目,专门在 Mac(Metal 框架)上本地跑 DeepSeek 4 Flash。目前 GitHub 上 164 个星、10 个 fork,讨论热度一般。项目刚发布,正文没披露推理速度、模型规格或部署步骤,所以实际能跑多快、显存吃多少都还不清楚。如果你是 Mac 用户想本地试 DeepSeek...
#Inference-opt#DeepSeek#GitHub#Hacker News
精选理由
HKR 三项都过,但正文只披露了项目名和 Metal 本地推理这个条件。没有速度、显存占用、模型规格或安装步骤,所以只能算一个小型开源推理项目。
一句话点评
Redis 作者写了个专供 DeepSeek 4 Flash 在 Mac 上跑的推理引擎,128GB 内存能跑,但正文没给速度或显存占用数据。
锐评
antirez(Redis 创始人)放出了一个叫 ds4 的项目,是一个专门为 DeepSeek 4 Flash 模型定制的本地推理引擎,跑在苹果的 Metal 图形框架上。这意味着你可以在自己的 Mac 上运行这个模型,不用联网。项目 README 里特别提到目标硬件是 128GB 内存的 MacBook,说明这个模型对内存要求不低,不是随便一台机器就能流畅跑。 目前项目刚公开,GitHub 上只有 164 个星标,10 个复刻,2 个待合并的代码请求。但正文没披露任何性能数据,比如生成速度有多快、内存实际占用多少、跟官方推理库比有没有优势。这些关键信息缺失,现在只能把它看作一个技术极客的早期实验品。 另外,这个引擎只针对 DeepSeek 4 Flash 这一个模型,通用性为零。如果你手头正好有高配 Mac 又想折腾本地部署,可以关注;否则先别急着激动,等社区跑出实测数据再说。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
15:38
36d ago
Hacker News 首页· rssEN15:38 · 05·07
Stage CLI:把 AI 生成的代码改动拆成章节,方便人审
Stage 开源了一个命令行工具 Stage CLI,能把当前 Git 分支的改动按逻辑拆成章节,在本地浏览器里逐段审阅。它不挑 AI 编程助手,只要给个 skill 就能把 diff 切块。核心卖点是审阅结构,不是换个 diff 界面。正文没披露许可证和安装步骤,想试还得自己翻仓库。
#Agent#Code#Tools#Stage
精选理由
小团队的开源工具,HKR 三个维度都沾边:痛点真实、机制有新意、切中成本焦虑。但正文没披露许可证和安装方式,也没有用户数据或评测,信息缺口明显。属于 60-71 分的小产品更新区间,不往上调。
一句话点评
把 AI 生成的代码改动按逻辑拆成章节,在本地浏览器里逐段审阅,不挑 AI 工具。
锐评
Stage 开源了一个命令行工具,核心是把当前 Git 分支的 diff 按逻辑拆成章节,在本地浏览器里逐段审阅,而不是只给一个平铺的 diff 界面。它不挑 AI 编程助手,只要配个 skill 就能把改动切块。这点对用 Cursor、Copilot 等工具的人挺实用——AI 经常一次改很多文件,逐行看 diff 容易漏逻辑。正文没披露许可证和安装步骤,想试还得自己翻仓库。另外,工具只负责展示,不负责生成改动,所以它解决的是“审阅结构”问题,不是“改得对不对”的问题。如果团队里 AI 代码占比高,这个工具能降低 review 负担,但前提是 AI 生成的 diff 本身质量还行。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
15:23
36d ago
Hacker News 首页· rssEN15:23 · 05·07
主板销量暴跌25%以上,芯片厂把产能都拿去造AI芯片了
Tom's Hardware报道,主板销量正在崩盘,跌幅超过25%。原因是芯片厂把产能优先给了AI芯片,导致PC主板芯片组供应紧张。华硕2025年预计少卖500万块主板,技嘉、微星、华擎也都在下滑。正文没披露具体季度数据或各厂商的详细损失,但趋势很明确:AI在挤占消费级硬件的产能。对DIY玩家来说,接下来买主板可能更贵、选择更少。
#Tom's Hardware#Commentary
精选理由
HKR三项都过,但正文太薄:关键数字只出现在URL里,没有预测来源或厂商确认。这是AI供应链外溢的关联信息,不是AI行业核心事件。
一句话点评
AI 芯片挤占产能,主板销量崩了 25% 以上,华硕一家就少卖 500 万块。
锐评
Tom's Hardware 报道,芯片厂把产能优先给了 AI 芯片,导致 PC 主板芯片组供应紧张,主板销量跌幅超过 25%。华硕 2025 年预计少卖 500 万块主板,技嘉、微星、华擎也都在下滑。数字很直观:500 万块不是小数目,说明 AI 对消费级硬件的挤压已经不只是涨价,而是直接砍出货量。对 DIY 玩家来说,接下来主板选择更少、价格更高。不过正文没披露具体季度数据或各厂商的详细损失,跌幅 25% 是整体还是某区域也不清楚。另外,芯片厂到底挪了多少产能给 AI、是否长期如此,文章没展开。结论方向没问题,但缺细节支撑,建议当趋势信号看,别直接拿来做投资或采购决策。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:56
36d ago
r/LocalLLaMA· rssEN14:56 · 05·07
本地跑 35B 模型,上下文一满缓存就废,200k token 重算太慢
一位用户在本地用 llama.cpp 跑 Qwen 3.6 35B(配置:5800X、96GB DDR4、RX 6800XT),生成速度 15-22 tok/s,提示词处理能到 1000+ tps。问题出在上下文压缩上:opencode、pi、kilo 这些编程智能体在压缩超过 200k token 的上下文后,会清空整个缓存,导致必须重新处理全部提示...
#Agent#Code#Inference-opt#llama.cpp
精选理由
帖子提供了一个本地 Qwen 3.6 35B 跑 23 万上下文的真实配置和性能数据,并暴露了 opencode、pi、kilo 等工具压缩超 20 万 token 后缓存全失效、提示重算的痛点。信息具体、场景真实,但缺少已验证的修复方案、可复现步骤或权威来源,所以落在 60-71 分区间。
一句话点评
本地跑编程智能体,上下文一超200k就清缓存重算,等得心累。
锐评
一位用户在5800X+96GB内存+RX 6800XT上本地跑Qwen 3.6 35B,生成速度15-22 tok/s,提示词处理能到1000+ tps,配置算中高端。问题在于opencode、pi、kilo这些编程智能体在压缩超过200k token的上下文后,会清空整个缓存,导致必须重新处理全部提示词——即使提示词处理快,200k token重算也要等很久。核心矛盾是:本地推理的缓存机制和智能体的上下文压缩策略不兼容,压缩完等于没缓存。正文没披露这些智能体具体用了什么压缩算法(是KV cache量化还是摘要替换),也没说llama.cpp的缓存验证逻辑是否可配置。如果只是缓存被粗暴清空,那优化方向可能是让智能体在压缩时保留部分缓存,或者llama.cpp支持增量缓存更新。这点对本地跑长上下文编程任务的用户很关键,但目前没有现成解法。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
14:46
36d ago
r/LocalLLaMA· rssEN14:46 · 05·07
SurrealDB 的混合搜索方案:BM25 + HNSW 向量 + RRF 融合,专治精确术语召回
SurrealDB 团队分享了一个内部文档搜索方案:同时用 BM25(传统关键词匹配)和 HNSW(向量近似搜索),最后用 RRF(倒数排序融合)把两路结果合并。关键卖点是向量搜索经常漏掉精确术语匹配(比如 API 函数名、版本号),加 BM25 能兜底。参数给了:每路取 top 30,向量搜索的 ef 设 100,RRF 的常数分别是 60 和 80...
#RAG#Embedding#Tools#SurrealDB
精选理由
这篇来自 Reddit 的教程本身中规中矩,但作者点出了一个真实问题:开发者文档里搜技术关键词,纯向量搜索会漏。这个判断让文章从普通教程变成了有实操价值的参考。HKR-K 和 HKR-R 靠具体的检索参数和 RAG 痛点通过,HKR-H 不通过,来源是 Reddit 教程,所以分数压在 60–71 区间。
一句话点评
向量搜不到精确术语时,加个BM25兜底,方案简单实用。
锐评
SurrealDB 团队分享的内部文档搜索方案:同时跑 BM25(传统关键词匹配)和 HNSW(向量近似搜索),再用 RRF(倒数排序融合)合并两路结果。核心痛点:纯向量搜索经常漏掉 API 函数名、版本号这类精确术语,BM25 正好兜底。参数给了:每路取 top 30,向量搜索的 ef 设 100,RRF 常数分别是 60 和 80。融合直接在数据库内用 FULLTEXT、HNSW 和 search::rrf() 完成,省掉外部编排。 值得参考的是方案本身轻量,不依赖外部 reranker,适合文档站快速落地。但正文没披露评测指标(比如召回率提升多少、延迟多高),也没说 BM25 索引的构建成本和更新策略。如果数据量大或查询频繁,ef=100 的 HNSW 延迟可能偏高,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
14:34
36d ago
AI HOT 精选· aihot-apiZH14:34 · 05·07
OpenRouter 新增语音端点,TTS 和语音识别直接调用
OpenRouter 上线了两个音频 API 端点:/api/v1/audio/speech 做文本转语音(TTS),/api/v1/audio/transcriptions 做语音转文本。好处是复用已有的路由、计费和密钥体系,不用额外配置。如果你已经在用 OpenRouter 调文本或图像模型,现在可以直接加语音功能,不用换平台。正文没披露具体支持哪...
#Audio#OpenRouter#Product update
精选理由
OpenRouter 新增了两个音频端点,一个做语音合成,一个做语音转文字。对开发者来说,好处是延续了文本、图像那套路由和计费逻辑,不用再单独接其他语音 API。但正文没披露具体支持哪些模型、定价多少、延迟如何,所以目前只能算一个常规的产品补全,不是突破性更新。
一句话点评
OpenRouter 把 TTS 和语音识别做成了标准 API 端点,复用已有的路由和计费,对已经在用他们文本/图像接口的团队来说,加语音功能不用换平台。正文没披露具体支持哪些模型、延迟和价格,如果是走第三方模型转接,延迟和成本可能比专用服务高。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
14:24
36d ago
TechCrunch AI· rssEN14:24 · 05·07
Aurora CEO:无人卡车终于能规模化了,今年从几辆扩到几百辆
Aurora 去年4月就开始了商业无人驾驶运营,现在要把车队从几辆卡车扩到几百辆,跑达拉斯到休斯顿的货运路线。CEO Chris Urmson 说时机到了,但正文没披露具体成本、安全指标或人工干预率——这点先别太激动,规模化的前提是这些数字能打平有人驾驶。
#Robotics#Aurora#Chris Urmson#TechCrunch
精选理由
H/K/R 都达标,但正文没披露单车成本、安全指标或接管率,信息缺口明显。这是一篇不错的自动驾驶商业化访谈,不是核心 AI 能力发布,所以分数压在 70 档。
一句话点评
Aurora 要把无人卡车从几辆扩到几百辆,但没给成本和安全数据,先别激动。
锐评
Aurora CEO Chris Urmson 说无人驾驶卡车终于能规模化了。事实是:去年4月已开始商业运营,今年车队从几辆扩到几百辆,跑达拉斯到休斯顿的固定路线。但正文没披露三个关键数字:每英里运营成本是否低于有人驾驶、安全指标(如人工干预率)、以及几百辆车的具体交付时间表。没有这些,规模化只是愿景。另外,Aurora 走的是“限定路线+编队行驶”路线,不是全场景无人驾驶,这点先别太激动。如果是真的,几百辆无人卡车跑固定干线,成本确实能打平甚至低于人类司机——但前提是安全验证足够硬。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:14
36d ago
r/LocalLLaMA· rssEN14:14 · 05·07
同一个问题换个问法,Qwen 3.5 和 Gemma 4 就答不对了
Reddit 用户拿两个相似问题测了 Qwen 3.5、Gemma 4 和 Qwen 3.6,每个组合跑了 10 次。正确答案是 300,常见错误答案是 150。Qwen 3.6 在长提示词下即使跑 Q8 量化也经常翻车。关键信号是:模型对提示词风格很敏感,不是光看版本号就行。正文没披露具体提示词和测试环境,所以这个结论的泛化性要打个折。
#Reasoning#Benchmarking#Qwen#Gemma
精选理由
HKR 三项全过:一个具体的 Reddit 提示测试报告了运行次数和失败模式。范围窄:完整提示和统计显著性未披露,所以落在 60–71 分区间。
一句话点评
提示词风格比模型版本更影响结果,Qwen 3.6 在长提示下 Q8 量化也常翻车。
锐评
Reddit 用户用两个相似问题测了 Qwen 3.5、Gemma 4 和 Qwen 3.6,每个组合跑 10 次。正确答案是 300,常见错误答案是 150。Qwen 3.6 在长提示词下即使跑 Q8 量化也经常答错,说明它对提示词风格很敏感,不是版本号越高就越稳。 这个测试样本量小(每组合仅 10 次),且正文没披露具体提示词和测试环境,所以结论的泛化性要打折。不过它提醒了一个实用点:换模型时别只看跑分,先拿自己的典型提示词试几轮,尤其是长提示或带推理链的场景。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:00
36d ago
The Verge · AI· rssEN14:00 · 05·07
谷歌 Fitbit Air 发布:99 美元的屏幕无屏手环,主打 AI 健康教练
谷歌推出了 99 美元的 Fitbit Air,一款没有屏幕的健康手环,外观很像 Whoop 的绑带款。机身用金属织物搭扣固定,可以夹在衣服上或当吊坠戴。正文没披露具体用了什么传感器、AI 教练怎么工作、以及要不要额外订阅。目前看更像一个低成本的心率/运动追踪器,AI 部分还没落地。
#Google#Fitbit#Whoop#Product update
精选理由
HKR-H 和 HKR-K 成立:Google 做健康 AI 硬件的角度和 99 美元无屏手环是实打实的信息。传感器、模型机制、订阅价格都没披露,所以不上 featured。
一句话点评
99 美元的 Fitbit Air 没屏幕,像 Whoop 但更便宜,AI 教练还没影。
锐评
谷歌出了个 99 美元的 Fitbit Air,没屏幕,靠金属织物搭扣固定,能夹衣服上当吊坠。外形像 Whoop,但价格只有 Whoop 订阅一年的一半左右。正文没披露具体用了什么传感器,只说是个“模块化传感器”,大概率还是心率加运动追踪。AI 教练部分只提了个概念,怎么工作、要不要额外付费都没说。目前看就是个低成本的心率手环,AI 功能还没落地。如果传感器精度跟 Charge 6 差不多,那 99 美元买基础追踪还行;但如果 AI 教练要额外订阅,性价比就不好说了。信息缺口:传感器型号、AI 教练的具体能力、订阅价格——这些都没披露,建议等实测再判断值不值得买。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
13:52
36d ago
AI HOT 精选· aihot-apiZH13:52 · 05·07
ColaMD 1.5 把 Markdown 当数据库用,一份内容换多套皮肤
ColaMD 1.5 把 .md 文件当作内容层,HTML 模板当作视图层,改 Markdown 就能同时生成幻灯片、博客等不同输出。作者受“Markdown as Database”启发,解决了做演示文稿时改内容要改多处的麻烦。功能已内置,模板可以开源或让 AI 扩展。正文没披露模板 API 怎么写、渲染机制和兼容范围,想自己接模板的话得等更多文档。
#Tools#ColaMD#Product update#Open source
精选理由
HKR-K 因为版本更新中的内容-模板分离这个新事实通过,但 HKR-H 和 HKR-R 都不满足。文章跟AI工作流的关联很弱,而且没披露模板接口、渲染机制或兼容范围,信息缺口太大,所以分数低于40。
一句话点评
ColaMD 1.5 把 .md 当数据库,HTML 当皮肤,改一份 Markdown 就能同时出幻灯片和博客,省得每改一次内容要调多个文件。作者受“Markdown as Database”启发,功能已内置,模板可开源或让 AI 扩展。但正文没披露模板 API 怎么写、渲染机制和兼容哪些 Markdown 方言,想自己接模板得等文档。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K1·R0
13:47
36d ago
r/LocalLLaMA· rssEN13:47 · 05·07
AMD 发布 MI350P 加速卡:CDNA 4 终于做成 PCIe 插卡了
AMD 正式推出 Instinct MI350P 加速器,核心看点是 CDNA 4 架构终于做成了 PCIe 插卡形态,可以直接插进普通服务器。正文没披露定价和上市时间,所以实际部署成本未知。对跑本地模型的人来说,这意味着以后可能不用买整台专用机器,直接插卡就能用上新一代 AMD 计算单元,但具体能跑多大模型、延迟如何,还得等实测。
#Inference-opt#AMD#Product update
精选理由
HKR 全过,核心钩子是 CDNA 4 出 PCIe 卡了,事实是明确的 SKU 和形态,共鸣点在于 AI 服务器改造成本。正文没披露性能、价格和供货,所以分数压在 60–71 区间合理。
一句话点评
AMD 把 CDNA 4 塞进了 PCIe 卡,本地跑模型不用买整机了。
锐评
AMD 正式推出 Instinct MI350P,核心看点是 CDNA 4 架构终于做成了 PCIe 插卡形态,可以直接插进普通服务器。对跑本地模型的人来说,这意味着以后可能不用买整台专用机器,直接插卡就能用上新一代 AMD 计算单元。但正文没披露定价和上市时间,实际部署成本未知。具体能跑多大模型、延迟如何,也得等实测。另外,Reddit 原文被屏蔽,信息来自标题和摘要,细节有限。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:36
37d ago
量子位 · 公众号· rssZH13:36 · 05·07
原生Agent杀入画布:一站式搞定专业创作,全程可控、不抽卡
RunningHub 发布 RHTV,把 Agent 直接塞进画布,用户可以在一个界面里规划工作流、生成分镜、批量出素材、剪辑、记忆和复用流程。它接了 170 多个标准模型 API、10 万多个社区应用接口和 13681 个可用节点,覆盖图、视频、音频、3D 和文字。正文没披露定价,只说 Seedance 2.0 年费会员能打六折。
#Agent#Multimodal#Tools#RunningHub
精选理由
HKR三项全过:画布内嵌Agent和“不抽卡”的卖点有具体工作流钩子;API和节点数提供了可验证的规模信号;选题踩中了创作者工具焦虑。但这是一家小厂的单方产品发布,没有披露定价、基准测试或用户采用数据,所以分数卡在60–71区间。
一句话点评
短评:一站式创作画布,Agent 直接嵌入流程,省去来回切换。但正文没披露定价,六折优惠也仅限 Seedance 2.0 年费会员。 点评:RunningHub 把 Agent 塞进画布,用户在一个界面里就能规划工作流、生成分镜、批量出素材、剪辑,还能记忆和复用流程。接了 170 多个标准模型 API、10 万多个社区应用接口和 13681 个可用节点,覆盖图、视频、音频、3D 和文字,生...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:28
37d ago
Product Hunt · AI· rssEN13:28 · 05·07
Warp 开源了:一个让社区用 AI 代理一起写代码的开发环境
Warp 把自己那个带 AI 的终端开发环境开源了。核心思路是让 Oz 这个 AI 代理(可以理解为一个自动写代码、做计划、跑测试的机器人)干重活,社区成员只负责提想法、定方向、做验证。上线第一周就收获了 2.5 万以上的 GitHub Star 和 500 多个贡献者,社区热度很高。不过正文没披露具体用的什么开源许可证、仓库地址在哪、以及到底开源了哪...
#Agent#Code#Warp#Product Hunt
精选理由
标题说开源,正文没披露仓库、许可证和发布时间,信息缺口明显。产品更新类内容,价值偏低,所以维持低分。
一句话点评
Warp 把终端开发环境开源了,核心是让 AI 代理 Oz 自动写代码、做计划、跑测试,社区成员只负责提想法和验证。上线一周 GitHub 星标超 2.5 万,贡献者 500+,热度很高。但正文没披露具体开源许可证、仓库地址和开源范围,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
13:00
37d ago
● P1OpenAI 博客· rssEN13:00 · 05·07
OpenAI 扩大 GPT-5.5 网络安全可信访问范围
OpenAI 把“可信网络访问”机制扩展到了 GPT-5.5 和 GPT-5.5-Cyber 上。简单说,就是给经过身份验证的安全从业者开绿灯,让他们能用更强的模型做防御类工作,比如漏洞分析、恶意软件排查、写检测规则,同时继续拦截攻击性操作。GPT-5.5 加上这个权限后,对大多数防御任务就够用了;GPT-5.5-Cyber 则更激进,只开放给做授权渗...
#Code#Tools#Safety#OpenAI
精选理由
OpenAI 把可信网络访问从旧模型扩展到了 GPT-5.5 和 GPT-5.5-Cyber,只给验证过的防御者用,做漏洞研究和关键基础设施防护。我会先打个折:正文没披露怎么申请、要不要付费、模型在漏洞挖掘或攻防场景下的评测数据也没给,所以没法判断实际能力有多强。这点先别太激动,等有可复现的测试再下结论。
一句话点评
OpenAI 给 GPT-5.5 加了身份审核通道,让安全人员能拿模型做漏洞验证和恶意软件分析,但普通用户还是会被拦。
锐评
OpenAI 这次不是发新模型,而是给 GPT-5.5 套了一层身份验证机制,叫“可信网络访问”。简单说,就是安全从业者通过审核后,模型会少拦你,让你能做漏洞复现、恶意软件分析、补丁验证这些活;没审核的普通用户问同样的问题,模型直接拒。 文章举了个例子:同一个漏洞利用请求,默认 GPT-5.5 会拒绝或只给防御建议,开了 TAC 的版本直接生成漏洞利用代码和 README。他们还分了两档——TAC 给大多数防御工作用,GPT-5.5-Cyber 更宽松,给红队和渗透测试用,但要求更强的账号安全措施,比如防钓鱼认证,6 月 1 日起强制。 正文没披露审核门槛、通过率、误拦率,也没说这套机制对模型本身能力有没有削弱。性能数据只提了“已经交付强大能力”,没有具体基准测试或对比数字。这点先别太激动,更像是一次权限管理更新,而不是安全能力本身的突破。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
12:21
37d ago
AI HOT 精选· aihot-apiZH12:21 · 05·07
《AI营销》作者把25个提示词全开源了
作者 @yaojingang 把新书《AI营销:从SEO到GEO》配套的25个AI营销与GEO提示词开源到了GitHub,还额外补了短视频和文案类提示词。两个仓库链接已放出,可以直接下载或拉取。正文没披露许可证类型、维护计划或实际效果,所以商用前最好自己先测一轮。
#Tools#yaojingang#vista8#GitHub
精选理由
HKR-K通过:25个提示词和仓库链接是新事实。HKR-H/R弱:许可证、示例输出、维护计划未披露,所以这条属于低价值开源资源。
一句话点评
作者把新书配套的25个AI营销和GEO提示词全开源了,还额外补了短视频和文案类。两个GitHub链接已放出,直接就能用。但正文没提许可证类型、维护计划或实际效果,商用前最好自己先测一轮。短评:开源是好事,但没许可证和效果数据,商用前得自己踩坑。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
12:20
37d ago
AI HOT 精选· aihot-apiZH12:20 · 05·07
PixVerse 上线 4K 超分,限时免费试用 3 次
PixVerse 推出了 4K 超分辨率功能,可以在一个工作流里同时增强图片和视频。每个用户免费试用 3 次,之后用积分支付可享 35% 折扣,活动时间是 5 月 7 日至 14 日 UTC 8:00。转发、关注、回复后还能通过私信领 300 积分(限 72 小时)。正文没披露用了什么模型、分辨率上限或生成速度,免费额度不多,但折扣力度还行,适合想低成...
#Vision#Multimodal#PixVerse#Product update
精选理由
HKR-K/R通过:帖子给出了具体的获取条件和折扣,并触及创作者的成本和分辨率关切。HKR-H不通过:这是一条常规促销式的功能通知,没有模型参数、处理上限或质量对比。
一句话点评
PixVerse 上线了 4K 超分功能,图片和视频能在一个工作流里一起增强。每个用户免费试用 3 次,之后用积分支付打 65 折,活动到 5 月 14 日。转发关注回复还能领 300 积分(限 72 小时)。 短评:免费额度少,但折扣力度还行,适合低成本试水。 点评:功能本身不新鲜,但把图片和视频超分做到一个流程里算个小便利。3 次免费试用基本只够测效果,想批量用就得买积分。35% 折...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
12:20
37d ago
TechCrunch AI· rssEN12:20 · 05·07
Spotify AI DJ 新增法语、德语、意大利语和巴西葡语
Spotify 的 AI 主播功能现在能讲四门新语言:法语、德语、意大利语和巴西葡萄牙语。正文没披露具体在哪些地区上线、是否需要付费订阅、语音是合成还是真人录制,以及支持哪些设备。
#Audio#Spotify#Product update
精选理由
HKR-K 靠新增四种语言通过,但 HKR-H 和 HKR-R 很弱:这是 Spotify AI DJ 的常规本地化更新,正文没披露上线地区、订阅条件、语音机制或可用平台。
一句话点评
Spotify AI 主播新增四门语言,但没说在哪能用、要不要付费。
锐评
Spotify 的 AI 主播(AI DJ)现在能讲法语、德语、意大利语和巴西葡萄牙语了。功能本身不新,就是让一个 AI 声音在歌曲之间插话、推荐音乐,类似一个会聊天的电台主持人。这次只是语言扩展,正文没披露具体在哪些国家上线、是否需要 Premium 订阅、语音是合成还是真人录制,以及支持哪些设备。如果是合成语音,成本低但听感可能偏机械;如果是真人录制,成本高但更自然。目前信息缺口太多,没法判断这个更新对用户的实际价值。对从业者来说,值得关注的是 Spotify 在多语言场景下如何平衡语音自然度和延迟——如果延迟高或口音不准,用户可能直接关掉。建议等更多细节出来再评估。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
12:10
37d ago
MIT 科技评论· rssEN12:10 · 05·07
MIT Technology Review 汇总:AI 优化体外受精、阳台太阳能立法、Anthropic GPU 合作
MIT 技术评论今日摘要:AI 正被用于 IVF(试管婴儿)中筛选有潜力的精子和胚胎,并开发机器人来自动化部分流程,甚至探索基因编辑来预防遗传病——这些技术可能让 IVF 更有效、更便宜,但也引发伦理争议。美国数十个州正在考虑立法允许安装“阳台太阳能”(即插即用的小型光伏板),几乎无需安装就能省电费、减排放,但专家提醒有安全隐患。Anthropic 与...
#Robotics#Safety#Agent#MIT Technology Review
精选理由
这是一篇MIT Technology Review的周报汇总,AI部分只有Anthropic用SpaceX GPU和Claude Code额度翻倍两条硬信息。额度翻倍对重度用户是实打实的利好,但文章主体是IVF和阳台太阳能,整体信息密度对AI从业者一般,属于可看可不看的级别。
一句话点评
MIT Tech Review 的每日汇总,核心是两篇长文:一篇讲公众对 AI 的普遍焦虑(AI malaise),另一篇讲 AI 和机器人如何改变 IVF(体外受精)流程,比如用 AI 筛选胚胎、机器人操作显微注射。短评:AI 焦虑是情绪观察,IVF 那篇有具体技术落地,但正文没披露任何临床数据或成本对比,所以“AI 优化 IVF”目前还是概念大于证据。适合当行业风向标,别当技术验证报告。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
11:23
37d ago
r/LocalLLaMA· rssEN11:23 · 05·07
llama.cpp 社区 PR 给 MiMo v2.5 加上了本地推理支持
llama.cpp 的 #22493 PR 加入了 MiMo v2.5 模型支持。MiMo v2.5 是一个稀疏 MoE,总参数量 310B,但每次推理只激活 15B,所以本地跑得动。它还支持 100 万 token 的超长上下文,能同时处理文字、图片、视频和音频。不过这个 PR 还没说是否已经合并进主分支,想尝鲜得自己编译。
#Multimodal#Vision#Audio#ggml-org
精选理由
HKR 全过:钩子是 llama.cpp 支持 310B 多模态 MoE,规格明确(310B/15B 激活/1M 上下文)。重要性压在 60–71 是因为这只是个兼容性 PR,且合并状态正文没披露。
一句话点评
310B 总参数但只激活 15B,本地能跑多模态大模型了。
锐评
llama.cpp 的 PR 加入了小米 MiMo v2.5 支持。这是一个稀疏 MoE 模型,总参数量 310B,但每次推理只激活 15B,所以消费级显卡也能本地跑。它还支持 100 万 token 超长上下文,能同时处理文字、图片、视频和音频。不过 PR 正文没披露是否已合并进主分支,想尝鲜得自己编译。另外,15B 激活参数跑多模态任务的实际效果(比如视频理解精度、音频识别延迟)也没有 benchmark 数据,这点先别太激动。如果是真的,本地部署一个能看视频、听语音的模型,成本确实很低。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
11:21
37d ago
Product Hunt · AI· rssEN11:21 · 05·07
MiniMax Hub:一个桌面AI工作站,把多模态生成和Agent工作流塞进可视化画布里
MiniMax 今天在 Product Hunt 上发了第 8 个产品 MiniMax Hub,定位是桌面 AI 创意工作站。核心卖点是“Agent 驱动的可视化画布”——你可以在一个界面里同时生成和编辑图片、视频、音频、文字,还能让 AI 帮你处理本地文件、用自然语言编排创意工作流。说白了就是把多模态生成、Agent 自动化和低代码工作流打包成一个桌...
#Agent#Vision#Tools#MiniMax
精选理由
HKR-H 靠 agent 视觉画布工作站这个角度勉强过关,但 K 和 R 都挂了——定价、配置、上线时间全没披露,从业者没法判断要不要跟进。这只是一个 Product Hunt 上的小产品更新,不是值得关注的信号。
一句话点评
MiniMax 在 Product Hunt 上发了第 8 个产品 Hub,定位是桌面 AI 创意工作站。核心卖点是“Agent 驱动的可视化画布”——一个界面里同时生成和编辑图片、视频、音频、文字,还能让 AI 帮你处理本地文件、用自然语言编排创意工作流。说白了就是把多模态生成、Agent 自动化和低代码工作流打包成一个桌面应用。 目前只有 Product Hunt 页面信息,正文没披露...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
11:19
37d ago
FT · 科技· rssEN11:19 · 05·07
AI巨头财报里神秘的530亿美元“其他收入”
FT爆料,几家AI超大规模云厂商的财报里藏了一笔约530亿美元的“其他收入”,来源和归属都没说清。正文被付费墙挡住,没披露具体是哪几家公司、这笔钱怎么算出来的、又是谁给的。数字很大——530亿,比多数AI公司的年营收还高,但信息缺口也大:不知道是一次性收益(比如投资升值)还是可持续的运营外收入。这点先别太激动,等FT放出全文再看明细。
#Financial Times#Commentary
精选理由
FT的标题有权威性,530亿美元这个数字也够扎眼,所以H、K、R三个钩子都成立。但RSS正文只有“Quantum entanglement”四个字,没披露具体公司、会计口径和收益归属机制,信息量太少,只能给到60-71这个区间。
一句话点评
FT爆料AI云厂商财报藏了530亿美元“其他收入”,但全文被付费墙挡住,来源和归属都没说清。
锐评
FT这篇标题很炸——530亿美元,比多数AI公司年营收还高,藏在几家AI超大规模云厂商的财报里,归类为“其他收入”。但正文被付费墙完全挡住,RSS只给了“Quantum entanglement”几个字,等于没披露具体是哪几家公司、这笔钱怎么算出来的、又是谁给的。 这个数字大得可疑:如果是投资升值或资产出售,那是一次性收益,不能算运营能力;如果是客户预付款或政府补贴,那可持续性完全不同。正文没披露任何会计处理细节,也没说这笔钱是否已经到账。 这点先别太激动。530亿可能是多个季度累计、也可能是几家公司的合计,甚至可能是FT自己估算的。等全文放出再看明细,现在信息缺口太大,没法判断是利好还是会计魔术。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
11:03
37d ago
Product Hunt · AI· rssEN11:03 · 05·07
APIEval-20:给测接口的AI智能体准备的公开测试集
KushoAI 今天在 Product Hunt 上发布了 APIEval-20,一个专门用来评估“AI 智能体测 API 能力”的公开基准。每个智能体只给一个 JSON 结构描述和一个示例请求,然后让它自己生成测试用例,去测那些故意埋了 bug 的参考接口。评分完全客观——bug 抓到就是抓到,不用大模型当裁判。任务覆盖了鉴权、报错处理、翻页、结构校...
#Agent#Tools#Benchmarking#Benchmark
精选理由
可浏览但价值低:HKR-R 靠 Agent 评测痛点勉强成立,HKR-H 和 HKR-K 都不达标。一条 Product Hunt 发布动态,没任务数、没方法、没结果,不值得上推荐位。
一句话点评
KushoAI 发了个专门测 API 测试智能体的公开基准 APIEval-20。每个智能体只给一个 JSON 结构和一个示例请求,让它自己生成测试用例去测埋了 bug 的接口。评分完全客观,不用大模型当裁判,bug 抓到就是抓到。任务覆盖鉴权、报错、翻页、结构校验和多步流程。20 个任务不算多,但胜在场景贴近真实开发。正文没披露任何模型跑分,也没说成本,这点先别太激动。如果后续能跑几个主流...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
10:45
37d ago
Hacker News 首页· rssEN10:45 · 05·07
Agent-harness-kit:一键给项目搭多智能体协作脚手架
一个叫 agent-harness-kit 的开源工具,号称是 AI 智能体编排领域的 Vite。你只要在项目根目录跑一句 npx @cardor/agent-harness-kit init,回答三个问题(项目名、用哪个模型供应商、要几个智能体),它就会自动生成一套完整的多智能体协作基础设施:AGENTS.md 角色说明、TypeScript 类型配...
#Agent#Tools#Product update
精选理由
HKR-R 通过,但 HKR-H 是常规脚手架标题,HKR-K 缺乏可复现细节。没有硬排除条件,所以归为低价值工具线索。
一句话点评
跑一句命令就能生成多智能体协作脚手架,适合快速搭原型。
锐评
这个叫 agent-harness-kit 的开源工具,定位是 AI 智能体编排领域的 Vite。你在项目根目录跑一句 npx @cardor/agent-harness-kit init,回答三个问题(项目名、用哪个模型供应商、要几个智能体),它就会自动生成一套完整的多智能体协作基础设施:AGENTS.md 角色说明、TypeScript 类型配置、SQLite 状态数据库、每个智能体的指令文件,以及健康检查脚本。内置四个预设角色:Lead 负责分配任务、Explorer 只读代码、Builder 写 src/ 和 tests/、Reviewer 把关测试。支持 Claude Code 和 OpenCode 两个供应商,还自带 MCP 服务器和 Web 监控面板。目前 v0.18.0,MIT 协议,月下载量 2343,算早期项目。正文没披露实际跑复杂任务时的延迟和 token 消耗,也没给端到端 demo 对比单智能体效果提升多少。如果是快速验证多智能体流程的原型,值得一试;但生产环境稳定性、错误恢复、大规模任务编排能力都还没数据支撑,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
10:00
37d ago
● P1OpenAI 博客· rssEN10:00 · 05·07
OpenAI在API中推出新的实时语音模型
OpenAI 这次发了三个新模型:GPT‑Realtime‑2 是带 GPT‑5 级推理能力的语音模型,能处理更复杂的请求,说话中间可以插话、改主意,它还能边想边回一句“我查一下”,同时调用多个工具;GPT‑Realtime‑Translate 做实时翻译,支持 70 多种输入语言转 13 种输出语言,语速跟得上说话人;GPT‑Realtime‑Whi...
#Audio#Reasoning#OpenAI#Product update
精选理由
OpenAI 官方放出了语音 API 更新,方向明确但信息不全。能推理、翻译、转写,听着挺全,可没给价格、没给延迟、没给上下文限制,我会先打个折。如果是真的省钱又低延迟,那对语音应用开发者是直接利好;现在只能说方向对了,落地还得等更多参数。
一句话点评
OpenAI 在 API 里发了三个新语音模型,最狠的是把 GPT-5 级推理塞进实时语音,同传翻译成本直接砍到地板价。
锐评
OpenAI 这次一口气发了三个模型:GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper。核心是把 GPT-5 级别的推理能力装进了实时语音管道里,让语音助手不再只是“你说一句我回一句”,而是能边聊边想、边调工具、边处理打断和纠错。 几个值得看的点:一是“Preambles”功能,模型在正式回答前会先说“让我查一下”之类的垫话,减少干等感;二是支持并行调用多个工具,比如同时查日历和发邮件,并且会把动作说出来,让用户知道它在干嘛;三是出错恢复更体面,不会直接沉默或崩掉。翻译模型覆盖 70+ 种输入语言和 13 种输出语言,主打低延迟同传。 官方博客给了不少企业合作案例(Zillow、Priceline、德国电信),但都是“正在构建”或“未来方向”,没有落地数据和用户反馈。定价和具体延迟数字在正文里没展开,这点先别太激动。另外,实时翻译在嘈杂环境或口音重的场景下表现如何,也没披露测试结果。整体看,能力升级方向是对的,但实际省多少钱、稳不稳定,还得等开发者上手跑过才知道。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
08:56
37d ago
Hacker News 首页· rssEN08:56 · 05·07
ZAYA1-8B:8B参数MoE模型,760M活跃参数,数学追上DeepSeek-R1
Zyphra新出的ZAYA1-8B,一个8B总参数的MoE(混合专家)模型,每次推理只激活760M参数,数学能力就追平了DeepSeek-R1,推理接近Claude Sonnet 4.5,编程接近Gemini 2.5 Pro。关键点:760M活跃参数意味着推理成本极低,部署门槛也低。另一个亮点是全程用AMD MI300X训练(1024节点),没碰NVI...
#Reasoning#Code#Benchmarking#ZAYA1-8B
精选理由
HKR三项都过,但正文只有RSS片段,没披露基准名称、许可证、代码结果或复现设置。效率声称有意思,但证据密度不够,所以分数压在60–71区间。
一句话点评
8B总参数、每次只激活7.6亿参数,数学追平DeepSeek-R1,推理接近Claude Sonnet 4.5,编程接近Gemini 2.5 Pro。
锐评
Zyphra的ZAYA1-8B是个MoE(混合专家)模型,总参数量8B,但每次推理只激活7.6亿参数——这意味着推理成本极低,部署门槛也低。数学能力追平DeepSeek-R1,推理接近Claude Sonnet 4.5,编程接近Gemini 2.5 Pro,如果这些数字属实,那确实很能打。另一个亮点是全程用AMD MI300X训练(1024节点),没用NVIDIA,这对想绕开N卡生态的团队是个信号。 但正文没披露具体跑在哪个benchmark上、分数多少,也没说开源协议和复现设置。所以“追平”到底是在哪个测试集、什么精度下比的,还不清楚。如果是真的,760M活跃参数做到这个水平,成本优势非常明显;但建议等官方放出详细评测和权重再下结论。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
08:49
37d ago
AI HOT 精选· aihot-apiZH08:49 · 05·07
开源20B MoE模型量化后能在MacBook本地跑,131K上下文
OpenAI开源的20B参数MoE模型,被社区用TurboQuant 3-bit量化加MLX优化后,能在M系列Mac上本地运行,不用联网也不用交月费。支持131K超长上下文,日常聊天、写作、写代码够用。但正文没披露具体速度、内存占用和跑分,实际体验和性能边界还不清楚。
#Inference-opt#Code#OpenAI#Hugging Face
精选理由
HKR三项都过,但正文没披露速度、内存占用和基准分数,信息缺口明显。这是一个有用的社区量化/本地部署线索,不是重磅发布,先别太激动。
一句话点评
OpenAI 开源的 20B MoE 模型,社区用 TurboQuant 3-bit 量化加 MLX 优化后,能在 M 系列 Mac 本地跑,不用联网和月费,支持 131K 上下文。日常聊天、写作、写代码够用。但正文没披露具体速度、内存占用和跑分,实际体验和性能边界还不清楚。短评:本地跑 20B MoE 挺省钱,但速度、内存、跑分都没说,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:53
37d ago
r/LocalLLaMA· rssEN07:53 · 05·07
llama.cpp 为什么不能同时用两种推测解码?
一位用户在 Reddit 上问 llama.cpp 能不能把 MTP(多头预测)和 n-gram 推测解码一起用。他实测了 Qwen3.6 27B 的 MTP,说在写代码的重复片段时 n-gram 更快。正文没披露维护者的回复、具体 benchmark 或限制原因,所以目前只能当用户经验看,不是官方结论。
#Agent#Code#Inference-opt#llama.cpp
精选理由
HKR-K 通过,因为给出了可复现的 llama.cpp 配置;但 HKR-H 和 HKR-R 弱。帖子缺少维护者回应、性能数字或实现细节,属于低价值技术讨论。
一句话点评
用户实测Qwen3.6 27B的MTP,写重复代码时n-gram更快,但官方没确认能否混用。
锐评
一位用户实测了Qwen3.6 27B的MTP(多头预测,让模型一次猜多个后续token),发现写代码的重复片段时,n-gram推测解码(基于历史文本匹配)反而更快。这暗示两种加速方法可能冲突,但正文没披露llama.cpp维护者的回复、具体benchmark数据或限制原因,目前只能当用户经验看,不是官方结论。关键信息缺口:没说明MTP和n-gram能否在llama.cpp里同时启用,也没给延迟或吞吐量对比。如果真能混用,对长代码生成场景挺省钱,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K1·R0
07:25
37d ago
AI HOT 精选· aihot-apiZH07:25 · 05·07
GitHub Repo Stats:一个看仓库提交数的轻量工具
Simon Willison 写了个小工具,输入 GitHub 仓库名或 URL,就能看到提交数、贡献者、语言分布、版本发布等统计。他本人最在意的是提交数,但 GitHub 手机版不显示这个数字,所以自己动手用 REST 或 GraphQL API 抓了数据。工具在浏览器里直接跑,不经过后端。不登录的话每小时只能请求 60 次,登录后能到 5000 次...
#Tools#GitHub#Simon Willison#Product update
精选理由
正文介绍了一个 GitHub 仓库统计工具,输入仓库地址就能看提交总数等数据,用了 REST 或 GraphQL API。两个示例是 simonw/datasette 和 simonw/llm。工具本身跟 AI 关系很弱,没有模型、智能体、成本或安全方面的信息,对 AI 从业者参考价值有限。
一句话点评
Simon Willison 写了个浏览器端小工具,输入 GitHub 仓库名就能看提交数、贡献者、语言分布等统计。他本人最在意提交数,但 GitHub 手机版不显示,所以自己动手用 API 抓。工具纯前端运行,不登录每小时只能请求 60 次,登录后 5000 次。对经常在手机上快速评估仓库的人来说挺实用,但功能本身不复杂,就是个 API 封装。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
07:15
37d ago
Hacker News 首页· rssEN07:15 · 05·07
Unsloth 和 NVIDIA 合作,让消费级显卡微调大模型再快 25%
Unsloth 和 NVIDIA 联合宣布,在消费级 GPU 上微调大模型的速度能再提升约 25%。他们主要干了三件事:一是缓存打包序列的元数据,避免每层都重复算一遍;二是用双缓冲区做梯度检查点,让激活值重算和反向传播并行起来;三是优化了 MoE 路由,用 argsort 和 bincount 一次性分组 token。实测 Qwen3-14B 的 QL...
#Fine-tuning#Inference-opt#Unsloth#Nvidia
精选理由
标题说消费级GPU训练提速25%,但正文只有RSS摘要,没披露具体GPU型号、模型规模、训练方法或优化细节。这个数字本身有吸引力,但缺乏可复现条件,所以评分压在60-71区间。
一句话点评
Unsloth 和 NVIDIA 合作,在消费级 GPU 上把大模型微调速度再提 25%,主要靠缓存元数据、并行计算和优化路由。
锐评
Unsloth 和 NVIDIA 联合宣布,在消费级 GPU 上微调大模型的速度能再提升约 25%。他们主要干了三件事:一是缓存打包序列的元数据,避免每层都重复算一遍;二是用双缓冲区做梯度检查点,让激活值重算和反向传播并行起来;三是优化了 MoE 路由,用 argsort 和 bincount 一次性分组 token。实测 Qwen3-14B 的 QLoRA SFT,前向加速 43%,反向加速 5.8%,整体每批快 14.3%。 不过正文没披露具体用的哪款消费级 GPU、训练超参和对比基线,25% 是峰值还是均值也不清楚。如果是真的,对个人开发者挺省钱,但复现门槛还在。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
07:11
37d ago
r/LocalLLaMA· rssEN07:11 · 05·07
Reddit 用户实测:GLM 在 77 道题里答对 58 道,但经常对空白输入过度解释
Reddit 用户 No_Run8812 自己搞了个 77 题的本地模型测试,分四类任务。zai-org/glm-4.7-flash 得了 58/77,低于 qwen3-coder-next 的 66/77。作者说 GLM 在 4 条审计提示上解释不足,但对空白和单字符输入反而过度解读,像“精神分裂”。正文没披露具体测试题和评分标准,所以这个对比只能当...
#Agent#Tools#Benchmarking#GLM
精选理由
HKR 三项都达标,但这是单个 Reddit 用户的实验,77 项用例的设计细节和可复现性正文没披露,分数有参考价值但不足以进精选。
一句话点评
GLM 在空白输入上过度解读,像精神分裂,但测试只有77题,样本太少。
锐评
Reddit 用户自己搞了个77题本地模型测试,GLM-4.7-flash 得分58/77,低于 Qwen3-coder-next 的66/77。作者说 GLM 在4条审计提示上解释不足,但对空白和单字符输入反而过度解读,像“精神分裂”。这个测试样本量只有77题,且正文没披露具体题目和评分标准,所以对比只能当个参考,不能当真。另外,测试是个人行为,不是官方评测,权威性有限。如果真要做模型对比,建议用更大、更公开的基准,比如 MMLU 或 HumanEval。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
06:51
37d ago
AI HOT 精选· aihot-apiZH06:51 · 05·07
阿里千问 PC 端上线语音输入:按住说话、双击下指令,免费开放
阿里千问在 PC 端上线了 AI 语音输入功能,所有用户免费使用。核心操作就两套快捷键:按住右 Alt(Mac 是右 Command)说话,系统会自动去掉语气词、纠正口误,把语音转成规整的文字输出;双击同一个键则进入 AI 指令模式,可以直接说“帮我查资料”“写个文档”“翻译这段话”,不用切窗口。设计思路是把语音输入法做成一个跨应用的 AI 调度入口,...
#Audio#Agent#Tools#Alibaba
精选理由
HKR-H和HKR-K成立:阿里千问PC端新增免费语音输入,支持快捷键和AI指令模式切换。HKR-R偏弱:正文未披露语音识别的延迟、模型参数或跨应用调度的具体机制,信息缺口明显,因此评分落在60–71区间。
一句话点评
阿里千问PC端上线语音输入,按住右Alt说话能自动去语气词、纠口误,双击则进入AI指令模式,直接说“写文档”“查资料”不用切窗口。免费开放,但正文没披露延迟和模型规格,实际响应速度存疑。设计思路是把语音做成跨应用调度入口,比单纯语音打字更有想象力,但体验好坏取决于识别准确率和指令执行稳定性。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
06:50
37d ago
r/LocalLLaMA· rssEN06:50 · 05·07
试了 Pi 这个开源编程助手,5 个设计特点值得看
Reddit 用户 OrewaDeveloper 试了 Pi 编程助手,总结了 5 个设计特点。Pi 支持替换 system.md、树状会话,工具只有四个:读、写、编辑、跑 bash。登录 Anthropic 后按 token 额外计费,正文没披露具体价格。
#Agent#Code#Tools#Pi
精选理由
HKR 三项都过:试用帖给出了具体机制和成本/控制方面的共鸣点。影响落在 60–71 区间,因为正文没披露任务结果、速度、成功率以及具体定价。
一句话点评
Pi 编程助手开源,工具极简但依赖 Anthropic 按 token 计费,成本未知。
锐评
Pi 是一个开源编程助手,设计上刻意保持工具极简:只有读、写、编辑和跑 bash 四个工具,支持替换 system.md 和树状会话。这种设计让模型不容易跑偏,适合需要稳定执行简单编程任务的场景。但注意,Pi 登录 Anthropic 后按 token 额外计费,正文没披露具体价格,实际使用成本可能不低。另外,来源是 Reddit 用户个人体验,不是官方评测,验证强度弱。目前缺的是:Pi 在复杂项目或长链任务上的表现对比、与 Claude Code 等竞品的成本差异、以及是否支持本地模型替换。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
06:12
37d ago
Hacker News 首页· rssEN06:12 · 05·07
Agent Skills 评测工具:给模型加技能到底有没有用?
这个开源项目提供了一个测试框架,用来验证给 AI Agent 加上特定技能(比如调用工具、多步推理)后,输出质量是否真的提升了。作者没有公布具体的评测任务、指标和模型配置,所以目前只能看到工具本身,看不到任何实测结果。对于想评估 Agent 能力的团队来说,这个架子搭好了,但数据还没填上。
#Agent#Benchmarking#darkrishabh#GitHub
精选理由
HKR-H 和 HKR-R 通过:Agent Skills 评测是实操者关心的真问题。HKR-K 不通过,因为任务、指标和模型配置都没披露,所以分数压在 60–71 区间。
一句话点评
一个测 Agent 技能有没有用的空架子,代码开源但没跑出任何数据。
锐评
这个项目提供了一个测试框架,用来验证给 AI Agent 加上特定技能(比如调用工具、多步推理)后,输出质量是否真的提升了。作者没有公布具体的评测任务、指标和模型配置,所以目前只能看到工具本身,看不到任何实测结果。对于想评估 Agent 能力的团队来说,这个架子搭好了,但数据还没填上。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
04:40
37d ago
FT · 科技· rssEN04:40 · 05·07
三星市值破万亿美元,工会要求分AI红利
三星市值达到1万亿美元,韩国工会威胁罢工,要求将AI带来的利润增长用于提高奖金和工资。正文没披露具体奖金数额、谈判进展或罢工时间表,但这件事本身说明:AI赚钱了,员工也想分一杯羹。
#Samsung#South Korean unions#Incident
精选理由
HKR三项都过,但正文只有RSS摘要,没披露奖金数额、谈判进度和罢工时间表。这是AI供应链的劳资新闻,不是模型或产品更新,所以分数压在60–71区间。
一句话点评
三星市值破万亿,工会拿AI利润当筹码要加薪。
锐评
三星市值达到1万亿美元,韩国工会威胁罢工,要求把AI带来的利润增长用于提高奖金和工资。这件事本身说明:AI赚钱了,员工也想分一杯羹。但正文没披露具体奖金数额、谈判进展或罢工时间表,所以目前更像一个信号——AI红利分配问题开始摆上台面,而不是马上要停产的危机。对AI从业者来说,这提醒你:技术落地后,利益分配是绕不开的议题,尤其在高人力成本的制造业。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:28
37d ago
Product Hunt · AI· rssEN04:28 · 05·07
Memoket Gem:全天候佩戴的 AI 录音笔,帮你记住每一句对话
Memoket Gem 是一款 AI 可穿戴设备,主打全天候记录对话,然后自动生成摘要、待办事项和后续跟进,还能把不同对话的上下文串起来。产品页没说价格、续航、存储方式和隐私怎么处理——这些是买这类设备前最该问清楚的事。目前开放了 50 个免费名额给创始人和小企业主做早期测试,算是个低成本尝鲜的机会,但样本量太小,验证意义有限。
#Audio#Memory#Memoket Gem#Product update
精选理由
小厂AI可穿戴设备发布,HKR的H和R成立,但K很弱。正文没披露价格、续航、存储和隐私机制,只能算低价值的产品更新,不值得投入精力深挖。
一句话点评
Memoket Gem 是一款全天候录音的 AI 可穿戴设备,能自动把对话转成摘要、待办和后续跟进,还能跨对话串上下文。目前开放 50 个免费名额给创始人和小企业主做早期测试,算是个低成本尝鲜的机会。但产品页没披露价格、续航、存储方式和隐私处理——这些是买这类设备前最该问清楚的事。50 人的样本量太小,验证意义有限,这点先别太激动。如果是真的,能省去手动记笔记的麻烦,但隐私和续航是硬伤。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
04:02
37d ago
● P1新智元 · 公众号· rssZH04:02 · 05·07
Claude 托管智能体新增“做梦”功能,Harvey 实测任务完成率暴涨约 6 倍
Anthropic 给 Claude 的托管智能体加了三个新能力:Dreaming(做梦)、Outcomes(结果校验)和多智能体协作。其中“做梦”是指让 Claude 在后台读取最多 100 段历史会话,自己总结规则来改进表现,一次演示里它把 530 万 token 的对话提炼成了 98 条规则。法律 AI 公司 Harvey 实测后,任务完成率比之...
#Agent#Memory#Benchmarking#Anthropic
精选理由
Anthropic 给 Claude 托管 Agent 加了三个东西:Dreaming 让模型事后翻历史会话自己总结规则,Outcomes 用偏好样本教模型对齐目标,多 Agent 编排让多个 Claude 协作干活。Harvey 说任务完成率大约翻了 6 倍,Outcomes 内部测试最高能提 10 个百分点。运行时另收 0.08 美元/会话小时,正文没披露这个定价的横向对比。我会先打个折:6 倍是合作方数据,没看到独立复现,但 Dreaming 从 530 万 token 压到 98 条规则这个例子确实说明能省不少上下文成本。
一句话点评
Claude 现在能自己翻聊天记录总结规则了,Harvey 实测任务完成率涨了约 6 倍,但正文没给具体基线和测试集,这点先别太激动。
锐评
Anthropic 给 Claude 的托管智能体加了三个新能力,最值得看的是“做梦”——让模型在后台读最多 100 段历史对话,自己提炼行为规则。一次演示里,它把 530 万 token 的对话压成了 98 条规则,相当于模型自己给自己写了个操作手册。法律 AI 公司 Harvey 实测后说任务完成率涨了约 6 倍,另一个叫“结果校验”的功能把成功率又拉了 10 个百分点。 不过 Harvey 的数据得打个折。正文没披露原来的完成率是多少,也没说测试任务长什么样、样本量多大。从 10% 提到 60% 和从 80% 提到 85% 完全是两回事,前者是能用,后者是锦上添花。另外,这些功能目前只开放给 Opus 4.7 和 Sonnet 4.6,还要额外收每小时 0.08 美元的运行时费,小团队用起来成本不低。 还缺几个关键信息:100 段历史对话够不够覆盖长尾场景?模型自己总结的规则会不会越学越偏?多智能体协作具体怎么分工、有没有冲突处理机制?这些都没说清楚。整体看,方向有意思,但离“睡一觉就进化”还差不少验证。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
04:02
37d ago
新智元 · 公众号· rssZH04:02 · 05·07
中国医疗AI登顶全球榜单,WiseDiag发布院外场景Agent OS
WiseDiag 发布 WiseClaw 2.0,一个面向体检、慢病、设备、家庭医生、保险/养老五个院外场景的医疗 Agent OS。系统分导诊、临床、评估三个阶段,并记录工具调用、知识版本和风险检查的 trace。模型 WiseDiag-v2 在 DoctorBench 上拿了第一,公司刚融了 6500 万人民币天使轮。正文没披露具体评测指标和对比基...
#Agent#Tools#Memory#WiseDiag
精选理由
这篇是智诊科技的发布稿,核心信息是WiseClaw 2.0医疗Agent OS面向体检、慢病等5类院外场景,采用分诊、临床、评估三层链路,并记录对话、工具调用和风险判断。另外WiseDiag-v2在DoctorBench上拿了第一,公司刚融了6500万天使轮。标题有点夸张,但正文提供了具体场景、技术架构和融资数据,对关注医疗AI落地的从业者来说有参考价值。不过DoctorBench的权威性、评测细节和实际部署成本正文都没提,所以分数压在70以内。
一句话点评
医疗Agent OS,但评测细节和对比模型都没说。
锐评
WiseDiag 把 WiseClaw 2.0 包装成面向体检、慢病、设备、家庭医生、保险/养老五个院外场景的医疗 Agent OS,思路清晰:让模型进业务流程干活,而不是只做问答。系统分导诊、临床、评估三个阶段,还记录工具调用、知识版本和风险检查的 trace,这对医疗合规和审计是加分项。模型 WiseDiag-v2 号称在 DoctorBench 上拿了全球第一,公司刚融了 6500 万人民币天使轮。但正文没披露具体评测指标和对比基线,也没说跟谁比、差多少,这个“第一”要打折。6500 万天使轮在医疗 AI 里不算小,但也没大到能烧出壁垒。缺的是:评测细节、对比模型、临床落地案例。如果是真的,这个架构比单点模型更值得关注。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
03:57
37d ago
彭博科技· rssEN03:57 · 05·07
阿里股价跑赢腾讯,因为投资者更看好它的芯片业务
阿里股价涨幅超过腾讯,原因是亚洲芯片股集体上涨,而阿里旗下有半导体业务,投资者更愿意押注有芯片概念的公司。正文没披露阿里芯片业务的具体涨幅、估值或收入,所以这点先别太激动,信息还不够判断实际价值。
#Alibaba#Tencent#Bloomberg#Commentary
精选理由
这是AI相关的市场报道:HKR-H靠阿里vs腾讯的芯片角度过关,但HKR-K缺数字,HKR-R缺云成本或供应链细节。低价值区间,没有硬排除理由。
一句话点评
阿里涨得比腾讯猛,因为市场在炒芯片概念,但正文没披露阿里芯片业务的具体收入或估值,这点先别太激动。
锐评
阿里股价跑赢腾讯,直接原因是亚洲芯片股集体上涨,而阿里旗下有半导体业务,投资者更愿意押注有芯片概念的公司。但正文没披露阿里芯片业务的具体涨幅、估值或收入,所以信息还不够判断实际价值。如果阿里芯片业务体量很小,这波涨幅可能只是情绪驱动,缺乏基本面支撑。对于AI从业者来说,这条新闻的参考价值有限——它更多是市场情绪和板块轮动的信号,而不是技术或业务层面的突破。需要关注的是阿里芯片业务后续是否有实质性进展披露,比如客户、订单或技术路线。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
03:57
37d ago
彭博科技· rssEN03:57 · 05·07
数据中心老板:AI 热潮让我不用睡觉
澳大利亚数据中心运营商 NEXTDC 的老板说,AI 热潮让他忙到没空睡觉,但公司现金流充裕。正文没披露具体融资规模、客户名单或扩建计划,所以这点先别太激动——有钱和有地建数据中心是两回事。
#NEXTDC#Bloomberg#Funding#Commentary
精选理由
HKR-H靠'AI vs 睡眠'这个反差钩子过关,但HKR-K和HKR-R都挂了:正文没披露融资金额、客户名单或扩建计划。只能当一篇信息很薄的数据中心行业侧写,不是AI基础设施的硬新闻。
一句话点评
NEXTDC 老板说 AI 忙到没空睡觉,但有钱。
锐评
NEXTDC 老板说 AI 热潮让他忙到没空睡觉,但公司现金流充裕。这句话本身没什么信息量——有钱和有地建数据中心是两回事。正文没披露具体融资规模、客户名单或扩建计划,所以这点先别太激动。Bloomberg 的报道通常有独家信源,但这篇更像高管软性表态,缺乏可验证的硬数据。对 AI 从业者来说,这条新闻的价值在于侧面印证数据中心需求确实在涨,但别拿它当投资或选址依据。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
03:46
37d ago
Hacker News 首页· rssEN03:46 · 05·07
ProgramBench:让语言模型从零重建整个程序,结果全军覆没
现有编程评测只测修一个 bug 或写一个函数,但实际场景里 agent 要自己搭整个项目的架构。ProgramBench 把 200 个任务(从命令行小工具到 FFmpeg、SQLite、PHP 解释器)扔给模型,只给源码和文档,要求重建出行为完全一致的程序。评测用 agent 自动生成测试用例,不限制实现方式。结果最好的模型也只让 3% 的任务通过了...
#Code#Benchmarking#ProgramBench#Research release
精选理由
HKR-H 通过,因为“从零重建程序”这个角度比普通代码评测更有话题性。HKR-K 只限于评测机制本身;规模、模型名单和结果都没公开,所以放在 all 层级就够了。
一句话点评
给模型源码和文档,让它从头重建出行为一致的程序,结果最好的模型也只让3%的任务全过。
锐评
ProgramBench 把编程评测从修 bug 或写函数升级到“搭整个项目架构”。200 个任务从命令行小工具到 FFmpeg、SQLite、PHP 解释器,只给源码和文档,要求模型重建出行为完全一致的程序。评测用 agent 自动生成测试用例,不限制实现方式。结果:9 个模型没有一个能完全解决任何任务,最好的模型也只让 3% 的任务通过了全部测试(95% 的测试用例)。模型倾向于写单文件、大而全的实现,跟人类写的代码结构差很远。 这个基准的难度确实高,但也要注意:它测的是“行为一致”,不是“代码质量一致”,而且 200 个任务里包含像 PHP 解释器这种大型项目,模型失败不意外。正文没披露每个任务的测试用例数量和质量,也没说 agent 生成测试用例的覆盖率,这点先别太激动。如果是真的,这个基准比 SWE-bench 更贴近“让 agent 独立干活”的终极场景。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
03:29
37d ago
● P1彭博科技· rssEN03:29 · 05·07
Moonshot AI 在美团领投融资轮中估值达 200 亿美元
月之暗面(Moonshot AI)又拿钱了,这次大约融了 20 亿美元,估值直接拉到 200 亿美元。标题说美团是领投方,但正文没披露具体投资人名单、各自投了多少、出让了多少股份,也没说钱打算怎么花。这个估值信号很直接——市场对中国 AI 创业公司的胃口还很大,但信息缺口也不小,先别急着下结论。
#Agent#Moonshot AI#Meituan#Kimi
精选理由
Bloomberg 的消息,Moonshot AI 拿了约 20 亿美元,估值干到 200 亿,标题说美团领投。我会先打个折:正文没写美团之外还有谁、股权怎么分、资金用途也没提,所以这轮到底多“美团”还看不清。但不管怎样,这个估值数字本身就说明资本还在往头部模型公司猛灌,对国内 AI 圈的资金流向和算力竞争是个明确注脚。
一句话点评
Moonshot AI 拿了美团领投的新钱,估值冲到 200 亿美元,但两家报道都没说清楚这轮融了多少钱、钱要花在哪。
锐评
Moonshot AI 这轮融资由美团领投,估值到了 200 亿美元。TechCrunch 说融了 20 亿美元,但 Bloomberg 的正文没提具体金额,两边数字对不上,先别急着当定论。200 亿这个估值放在国内大模型创业公司里已经很高了,说明资本还在押注 Kimi 聊天机器人能跑出来。 不过两篇报道都没披露 Moonshot 现在的收入、用户规模或者模型性能对比,也没说美团这笔投资是纯财务还是带业务绑定。开源需求在涨这个说法来自 TechCrunch 的标题,正文里没有展开,缺细节支撑。 还缺的关键信息:这轮融资后 Moonshot 的现金流能撑多久,以及 Kimi 跟字节豆包、百度文心这些竞品相比到底差在哪、好在哪。
HKR 分解
hook knowledge resonance
打开信源
97
SCORE
H1·K1·R1
03:26
37d ago
AI HOT 精选· aihot-apiZH03:26 · 05·07
卡兹克公开自己的AI信息源,免费追踪平台上线
公众号顶流博主卡兹克(@Khazix0918)公开了他日常用的AI信息源,并上线了免费追踪平台 aihot.virxact.com,无需登录就能用。平台按时间线展示,分类整合了官方信源、优质博主、推友、公众号监测和AI日报。想跟顶流博主保持信息同步,直接看这个站就行。正文没披露具体收录了多少源、更新频率多快、以及维护规则。
#Khazix#Product update
精选理由
HKR三项都勉强通过:这是一个小型的AI信息追踪工具,不是核心模型或平台更新。数据源数量、刷新频率和维护模式都没披露,所以分数压在60–71区间。
一句话点评
卡兹克把他日常刷的AI信息源整理成了一个免费追踪站,不用登录就能看,按时间线排好,分了官方、博主、公众号和日报几类。对想省时间找高质量AI信息的人来说挺实用。但正文没披露收录了多少源、更新频率多快、以及维护规则,长期能不能保持质量还不确定。短评:信息源聚合站,省了你自己筛,但维护力度未知。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
02:59
37d ago
r/LocalLLaMA· rssEN02:59 · 05·07
Qwen3.6 27B 去审查版 v2 发布:拒绝率降到 6%,保留完整 15 步 MTP
一个基于 Qwen3.6 27B 的去审查微调版 v2 发布了,核心指标是 KLD 0.0021(分布偏移很小,基本没破坏原模型能力),拒绝回答敏感问题的比例只有 6/100(原版通常更高)。还保留了完整的 15 步 MTP(多 token 预测,生成速度更快)。格式有 Safetensors、GGUF 和 NVFP4(适合低显存推理)。但正文被 Re...
#Inference-opt#Safety#Qwen#Reddit
精选理由
这是一条LocalLLaMA社区的小众模型发布,标题信息完整但正文因Reddit 403没披露下载地址和评测方法,验证门槛高,所以分数压在60以下。
一句话点评
去审查版 Qwen3.6 27B,拒绝率仅 6%,能力几乎无损。
锐评
这是一个基于 Qwen3.6 27B 的去审查微调版 v2,核心卖点是 KLD 仅 0.0021(分布偏移极小,基本没破坏原模型能力),拒绝回答敏感问题的比例只有 6/100(原版通常更高)。还保留了完整的 15 步 MTP(多 token 预测,生成速度更快)。格式提供 Safetensors、GGUF 和 NVFP4(适合低显存推理)。 但正文被 Reddit 屏蔽(403),没有披露下载链接、训练数据、评估方法,也没说用了什么偏好算法。KLD 0.0021 这个数字很漂亮,但没说明是在什么测试集上算的,可能只是某个窄分布下的结果。6% 的拒绝率也需要看具体 prompt 集——如果全是简单问题,这个数字意义不大。 对本地部署玩家来说,如果真能保持原模型能力同时大幅降低拒绝率,那确实省事。但信息缺口太大,建议等第三方评测或作者补全细节再决定是否下载。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R1
02:59
37d ago
彭博科技· rssEN02:59 · 05·07
特朗普幕僚长表态:美国政府不会在AI竞赛里“选冠军”
白宫幕僚长苏西·威尔斯说,美国不会在AI竞赛中指定赢家或输家。文章提到有AI政策指令正在路上,但没披露具体内容、发布时间和执行机制——也就是说,目前只有一句表态,没有落地细节。对从业者来说,这意味着短期内美国政府不会用行政手段直接扶持某家公司或某个技术路线,但“不选冠军”不等于不监管,具体怎么管还得等后续文件。
#Susie Wiles#Donald Trump#White House#Policy
精选理由
彭博社信源权威,白宫幕僚长给出明确的 AI 竞争立场,所以 HKR 三项勉强过关。但正文缺指令原文、时间表和执行细节,只能算一条常规政策报道,信息密度不够高。
一句话点评
白宫表态不指定AI赢家,但没给具体政策,先别当利好。
锐评
白宫幕僚长苏西·威尔斯说美国不会在AI竞赛里指定赢家或输家,意思是短期内政府不会用行政手段直接扶持某家公司或某个技术路线。但这句话目前只有表态,正文没披露任何具体政策内容、发布时间和执行机制——信息缺口很大。对从业者来说,“不选冠军”不等于不监管,出口管制、芯片法案、反垄断这些工具都还在桌上。后续要看真正的政策指令长什么样,现在只能算一个方向性信号,落地细节为零。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
02:05
37d ago
● P1机器之心 · 公众号· rssZH02:05 · 05·07
马斯克宣布 xAI 解散,Grok 并入 SpaceXAI,22 万张 GPU 算力租给 Anthropic
马斯克确认 xAI 解散,Grok 和 X 平台相关业务全部并入新实体 SpaceXAI。同时,SpaceX 和 Anthropic 签了协议,Claude 将接入 Colossus 1 超算——超过 22 万张 Nvidia GPU、300 兆瓦的算力集群。对用户来说最直接的变化是配额:Claude Code 的五小时速率限制翻倍,Pro 和 Max...
#Code#Inference-opt#xAI#SpaceX
精选理由
我会先打个折:目前只有单一信源,还没看到 Anthropic 或 SpaceX 的官方公告,所以先不拉满。但消息本身冲击力很强——xAI 解散、Grok 并入 SpaceXAI,Colossus 1 那 22 万张 GPU 和 300 兆瓦算力直接租给 Anthropic,等于把自家训练底座送给了对手。对开发者来说,Claude Code 五小时速率翻倍、Pro 和 Max 高峰配额限制移除是马上能感知的变化。正文没披露租约时长和价格,也没说 Grok 后续怎么迭代,这些缺口让消息还差一口气,但已经够格进 p1。
一句话点评
马斯克把 xAI 解散并入 SpaceXAI,22 万张 GPU 租给 Anthropic,Claude 用户配额直接翻倍。但正文被微信验证页挡了,具体条款和价格都没看到。
锐评
这条消息的核心就一件事:xAI 不玩了,家当全给了 SpaceXAI,而最值钱的家当——Colossus 1 超算那 22 万多张 GPU、300 兆瓦的算力——转手租给了 Anthropic。对 Claude 用户来说,最直接的好处是 Claude Code 的五小时速率限制翻倍,Pro 和 Max 套餐的高峰期限流也取消了。这等于 Anthropic 一夜之间拿到了顶级算力,不用自己建数据中心就能大幅提升服务容量。 但这条新闻有个硬伤:原文被微信的环境验证页挡住了,我只能看到摘要里的信息。摘要没提这笔租约的期限、价格,也没说 SpaceXAI 接手后 Grok 和 X 平台的业务会怎么调整。22 万张 GPU 是个很大的数字,但租出去多少、留多少自用,正文没披露。另外,xAI 解散是彻底关门还是换壳,人员怎么安置,这些关键细节都看不到。 我会先打个折:配额翻倍听起来不错,但得看实际高峰时段能不能稳住。算力租赁这种事,签了协议和真正跑起来是两码事。等看到完整条款和用户实测数据再下判断。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
01:58
37d ago
r/LocalLLaMA· rssEN01:58 · 05·07
DeepSeek v4 Pro 搭 Roo Code 跑几小时烧掉 10 美元,跟 Opus 差不多贵了
Reddit 用户说 DeepSeek v4 Pro 配合 Roo Code(一个在 VS Code 里让模型自动写代码的工具),开了“高思考”模式,两三个小时就花了 10 美元,成本几乎赶上 Claude Opus。正文没披露具体用了多少 token、单价多少、跑的是什么任务,所以没法判断是模型本身贵还是调用太频繁。如果真是这个价,那 DeepSee...
#Code#Tools#Reasoning#DeepSeek
精选理由
HKR-H 和 HKR-R 理由充分:DeepSeek 这种预算模型花到接近 Opus 的价格,标题本身就有点击价值,而且对用 agent 写代码的人成本敏感。HKR-K 偏弱,因为只披露了两小时 10 美元,token 用量、单价和具体任务都没给,没法验证成本到底高在哪。
一句话点评
DeepSeek v4 Pro 开高思考模式,两三个小时烧掉10美元,成本直逼Opus。
锐评
Reddit 用户实测,DeepSeek v4 Pro 配合 Roo Code(VS Code 里让模型自动写代码的工具)并开启“高思考”模式,两三个小时就花了 10 美元,成本几乎赶上 Claude Opus。正文没披露具体用了多少 token、单价多少、跑的是什么任务,所以没法判断是模型本身贵还是调用太频繁。如果真是这个价,那 DeepSeek 的性价比优势就大打折扣了。目前信息缺口明显:没有 token 消耗量、没有任务类型、没有对比基准。建议等更多用户晒出账单明细再下结论,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
01:33
37d ago
AI HOT 精选· aihot-apiZH01:33 · 05·07
用 Chrome 调试 Codex App 的 3 步技巧
退出 Codex App,在命令行加参数 `--remote-debugging-port=8315` 启动,然后 Chrome 打开 `chrome://inspect` 就能连上调试工具。正文没提支持哪些版本或有没有安全限制,自己试的时候注意下。
#Code#Tools#dotey#Chrome
精选理由
HKR-H 和 HKR-K 通过:这是一个具体的 Codex 调试技巧,给了端口号和入口地址,开发者能照着做。HKR-R 不通过:正文没披露版本范围、安全限制或更大的产品变化,信息缺口明显,所以留在 all 层级。
一句话点评
短评:给 Codex 套上 Chrome 调试器,适合想扒 AI 编程工具内部逻辑的人。 点评:dotey 分享了一个实用技巧:退出 Codex App 后,用命令行加参数 `--remote-debugging-port=8315` 启动,再在 Chrome 打开 `chrome://inspect` 就能连上 DevTools。这对想观察 Codex 如何调用模型、处理代码上下文的开发...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
01:29
37d ago
AI HOT 精选· aihot-apiZH01:29 · 05·07
Flue框架:用TypeScript写Claude Code风格智能体
Flue是一个新的TypeScript框架,帮你搭建类似Claude Code那种能自己跑流程的智能体。安装方式很特别:直接fetch一个start.md文件就能开始。但正文没披露许可证、版本号、维护者是谁,也没有跑分或对比数据,所以想用在生产环境还得再观望。
#Agent#Code#Flue#Claude
精选理由
HKR-R 通过,因为 TypeScript 智能体和 Claude Code 风格工作流对开发者有实际吸引力。HKR-H/K 不通过:正文只有一个安装入口,没有维护方、许可证、版本或可复现的测试结果。
一句话点评
短评:安装方式很酷,但信息太少,生产慎用。 Flue 是一个新的 TypeScript 框架,号称能帮你搭出类似 Claude Code 那种能自己跑流程的智能体。亮点是安装方式:直接 fetch 一个 start.md 文件就能开始,挺有 Geek 范儿。但正文没披露许可证、版本号、维护者是谁,也没有任何跑分或对比数据,所以想用在生产环境还得再观望。如果是真的,对喜欢 TypeScrip...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
01:15
37d ago
彭博科技· rssEN01:15 · 05·07
韩国股市超越加拿大,升至全球第七
韩国股市总市值超过加拿大,成为全球第七大股票市场。彭博提到AI芯片需求是推手之一,但正文没披露具体市值数字、超越发生的时间点,也没点名哪些公司受益。
#South Korea#Canada#Bloomberg#Commentary
精选理由
HKR-H靠位次变化过关,但HKR-K缺市值、时间点和公司层面的证据,信息缺口明显。HKR-R弱,因为故事停留在市场指数层面,没有落到AI实践上。
一句话点评
韩国股市总市值超过加拿大,升至全球第七,AI芯片需求是推手之一。
锐评
韩国股市总市值超过加拿大,升至全球第七,彭博把原因部分归到AI芯片需求上。这个排名变动本身不算意外——韩国半导体出口一直强劲,三星、SK海力士又是英伟达供应链上的关键角色。但正文没披露具体市值数字、超越发生的时间点,也没点名哪些公司受益,信息缺口不小。如果只看这个标题,容易误读成“韩国AI概念股全面爆发”,实际更可能是几家头部芯片厂撑起大盘。对关注亚太市场轮动的人是个信号:韩国正在吃掉一部分原本流向台湾或日本的半导体资金。但缺少数据支撑前,建议把它当趋势线索,别当交易依据。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
01:05
37d ago
彭博科技· rssEN01:05 · 05·07
AI芯片需求推高股价,澜起科技超越宁德时代成最贵两地上市股
澜起科技(Montage Technology)在AI芯片需求推动下股价大涨,超越宁德时代成为A+H两地上市股中估值最贵的公司。正文没披露具体溢价幅度、股价涨幅和时间窗口,但信号很直接:AI芯片概念在A股的热度已经压过了新能源龙头。
#Montage Technology#CATL#Commentary
精选理由
来源是彭博,有权威性;HKR-H靠“超越宁德时代”这个对比落地。HKR-K很薄:没给溢价、股价变动或时间窗口;AI角度只停留在芯片需求估值上,属于低价值市场快讯。
一句话点评
AI芯片概念在A股的热度已经压过了新能源龙头宁德时代。
锐评
澜起科技超越宁德时代,成为A+H两地上市股中估值最贵的公司。信号很直接:AI芯片概念在A股的热度已经压过了新能源龙头。正文没披露具体溢价幅度、股价涨幅和时间窗口,所以这个“最贵”到底贵多少、持续了多久,目前只能当风向标看,不能直接当交易信号。如果是真的,说明资金正在从确定性高的新能源切换到想象空间更大的AI芯片,但缺乏交易细节意味着短期情绪可能被放大。对从业者来说,这条信息更值得关注的是市场定价权的转移,而不是澜起本身的基本面变化。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
00:40
37d ago
r/LocalLLaMA· rssEN00:40 · 05·07
useknockout:开源去背景+超分API,MIT协议,跑在Modal上
useknockout 发了 v0.6.0,一个 FastAPI 服务包了 20 个接口。去背景用的是 BiRefNet 加 pymatting,超分支持 Swin2SR 或 Real-ESRGAN,能放大 2 倍或 4 倍。模型权重直接打包进 Docker 镜像,方便自己用 GPU 部署,还提供了一个免费测试接口。正文没披露具体延迟和成本,但跑在 M...
#Vision#Tools#useknockout#Modal
精选理由
一个开源的去背景+超分工具,MIT 协议,能自托管,Beta 期还免费调用,对开发者很友好。但正文没披露用户量、基准测试成绩,也没和 remove.bg/Topaz 做量化对比,所以分数压在 60–71 区间。
一句话点评
去背景和超分二合一的开源API,模型权重直接打包进Docker,适合自部署。
锐评
useknockout v0.6.0 把去背景(BiRefNet + pymatting)和超分(Swin2SR / Real-ESRGAN,2x/4x)打包成一个 FastAPI 服务,20 个接口,模型权重直接塞进 Docker 镜像,省去下载步骤。跑在 Modal 上,还提供了一个免费测试接口。对需要自建去背景/超分 API 的团队来说,省了整合多个模型的工作量。但正文没披露具体延迟和单次推理成本,跑在 Modal 上按秒计费,如果超分用 Real-ESRGAN 的 4x 模式,显存和耗时都不低。另外 BiRefNet 对复杂前景(头发丝、透明物体)的抠图效果不如商业方案,这点先别太激动。如果是高频调用,建议先压测再上生产。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
00:34
37d ago
r/LocalLLaMA· rssEN00:34 · 05·07
RTX 5090 vs M5 Max 128GB:本地跑智能体编程,选速度还是选内存?
Reddit 用户在纠结买 RTX 5090 还是 M5 Max 128GB 来本地跑 Qwen 3.6 27B 做智能体编程。5090 速度大约是 M5 Max 的三倍,但显存只有 32GB,只能塞下 Q4/Q5 量化模型,上下文窗口约 20 万 token;M5 Max 内存 128GB,可以跑更高精度的量化,还能同时驻留多个模型,但一次编码任务跑...
#Agent#Code#Inference-opt#Qwen
精选理由
这是一条 Reddit 买硬件求助帖,不是发布或可复现测试。价值在于给出了本地跑智能体时 RTX 5090 和 M5 Max 的实用取舍:5090 快但显存只有 32GB,只能跑 Q4/Q5 量化;M5 Max 内存 128GB 能上更高量化或同时挂多个模型。作者实测 M4 Max 一次功能实现花了 1 小时 20 分钟,5090 速度大约是它的 3 倍。信息够具体,但来源是个人经验,不是严谨评测,所以分数压在 60–71 区间合理。
一句话点评
5090快三倍但显存小,M5 Max内存大但慢,选哪个看你要速度还是容量。
锐评
Reddit用户纠结本地跑Qwen 3.6 27B做智能体编程,在RTX 5090和M5 Max 128GB之间二选一。5090速度大约是M5 Max的三倍,但显存只有32GB,只能塞Q4/Q5量化模型,上下文窗口约20万token;M5 Max内存128GB,可以跑更高精度量化,还能同时驻留多个模型,但一次编码任务跑了1小时20分钟。 关键数字:速度差3倍、内存差4倍、32GB vs 128GB。这个对比对本地跑模型的开发者很实用——如果你主要跑单模型、追求响应速度,5090更合适;如果需要同时加载多个模型或跑长上下文,M5 Max的大内存是刚需。 缺什么:正文没披露具体任务复杂度、量化精度对比、功耗和散热表现,也没说M5 Max跑的是哪个量化等级。另外,5090的32GB显存跑27B模型,Q4量化下实际可用上下文长度可能比宣称的20万token更短,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
00:13
37d ago
彭博科技· rssEN00:13 · 05·07
Anthropic 想让 Claude 更讨消费者喜欢
Bloomberg 报道 Anthropic 正在把 Claude 从企业工具往日常消费场景推,说 Claude 在消费者端已经有了一些进展。但正文没披露具体功能、定价、上线时间或用户规模。关键看点其实是记忆、工具调用和移动端体验——这些才是决定一个聊天机器人能不能被普通人日常用起来的门槛。信息缺口挺大,目前只能当方向信号看。
#Agent#Tools#Memory#Anthropic
精选理由
Bloomberg 的报道权威性够,加上 Anthropic 明确转向消费者市场,所以 H 和 R 都成立。但正文几乎没给实质信息——没有功能、没有数字、没有定价、没有发布时间,所以 K 不成立,分数只能压在 60–71 这个区间。真正值得盯的是 Claude 会不会补齐记忆、工具和移动端体验,但正文没提,这点先别太激动。
一句话点评
Anthropic 想把 Claude 从企业工具推向日常消费场景,但正文没披露具体功能、定价或上线时间。
锐评
Bloomberg 这条消息更像一个方向信号,不是产品公告。Anthropic 要做消费端,关键看三个门槛:记忆(Claude 能不能记住用户偏好)、工具调用(能不能替用户执行操作)、移动端体验(App 好不好用)。正文没披露任何用户规模或留存数据,也没说 Claude 目前在消费者端到底做了什么。如果是真的,这意味着 Anthropic 在跟 ChatGPT 抢日常使用场景,但信息缺口太大,目前只能当战略意图看,不能当产品判断。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
00:00
37d ago
● P1OpenAI 博客· rssEN00:00 · 05·07
OpenAI 在 ChatGPT 推出 Trusted Contact 安全功能
OpenAI 给 ChatGPT 加了一个可选的安全功能。成年人可以在设置里指定一位信任的联系人,比如家人或朋友。当系统自动监测和人工审核都判定你的对话里出现了严重的自我伤害倾向时,ChatGPT 会通知这位联系人。通知内容很克制,只说出现了需要关心的自伤话题,不会透露聊天细节。正文没披露具体的检测机制和误报率,只说审核团队会争取在一小时内完成判断。这...
#Safety#OpenAI#ChatGPT#Product update
精选理由
H、K、R 三条都站得住:ChatGPT 的安全钩子很具体,也容易引发讨论。重要性给到 73 分、放在 featured 里是合适的,因为功能本身有话题性,但检测方式、配置流程和上线范围全是空白,没法往更高里打。
一句话点评
OpenAI 给 ChatGPT 加了个“信任联系人”功能,用户可指定一位亲友,当系统判定对话涉及严重自伤风险时,经人工审核后会通知对方。
锐评
这个功能本质上是把危机干预里的“社会支持”做成产品开关。用户自愿设一个信任联系人,系统用自动化监控加人工复核来判断是否触发通知。通知内容很克制,只说可能涉及自伤,不给聊天记录,还附上怎么聊敏感话题的指南。OpenAI 说审核团队争取在一小时内完成复核,但正文没披露误报率、审核团队规模和实际响应时间的中位数。这点先别太激动——它不替代专业危机服务,只是多一层提醒。还缺的关键信息是:触发阈值怎么定、人工审核的标准一致性如何保证,以及用户会不会因为担心被通知而不敢在对话里说真话。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
00:00
37d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·07
OpenAI 和 Cursor 都从 Skill 转向 Plugin,但一个想锁工作流,一个想防被替代
OpenAI 和 Cursor 在 2026 年 4-5 月几乎同时把重心从 Skill 转向 Plugin。Skill 的盈利死结在于:它是明文文件,买家付完就能贴到 GitHub 上,复制成本为零,定价权也为零;做成托管服务等于卖 AWS 转售;数据飞轮也走不通。Plugin 比 Skill 多了三样东西:运行环境绑定、认证凭证、分发渠道,本质是把...
#Agent#Tools#OpenAI#Cursor
精选理由
HKR-H 和 HKR-R 通过:对比钩子清晰,OpenAI 和 Cursor 的盈利转向直接击中从业者焦虑。HKR-K 偏弱,因为时间、规格、条款都没披露,所以落在 60-71 的评论区间。
一句话点评
OpenAI 和 Cursor 几乎同时从 Skill 转向 Plugin,但动机不同:OpenAI 怕模型变商品,想用 Codex 执行层锁住工作流;Cursor 怕被上游模型商(如 Anthropic)替代,想用 Plugin 生态建差异化。文章拆得清楚:Skill 是明文文件,复制零成本,没法收钱;Plugin 加了运行环境、认证和分发,把知识变成可收费的服务。关键数字:Codex 周...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1

更多

频道

后台