ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-19

167 items · updated 3m ago
RSS live
2026-05-19 · 星期二2026年5月19日
23:47
24d ago
r/LocalLLaMA· rssEN23:47 · 05·19
Claude Code 插件可能威胁本地开源生态
Reddit 用户指出,Claude Code 插件把技能、斜杠命令和子代理打包成一个基于 plugin.json 的目录,微软的 deep-wiki 项目大约 3500 行代码就实现了类似功能。但插件不是开放标准,作者说 Qwen Code 是唯一一个能从 Claude 市场安装 Code 插件的开源代理。这意味着如果 Claude 插件生态做大,本...
#Agent#Code#Tools#Anthropic
精选理由
这是一条 Reddit 帖子,不是官方发布或已验证的生态迁移,信息量有限——正文只提了一个兼容性例子(Qwen Code),没有披露其他插件或实际影响数据。作为生态评论,60–71 分合理。
一句话点评
Claude Code 插件把技能、斜杠命令和子代理打包成一个目录,微软的 deep-wiki 项目约 3500 行代码就实现了类似功能。但插件不是开放标准,作者说 Qwen Code 是唯一能从 Claude 市场装插件的开源代理。如果 Claude 插件生态做大,本地模型可能被边缘化。正文没披露插件协议细节,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
23:05
24d ago
AI HOT 精选· aihot-apiZH23:05 · 05·19
Ramp用Gemini托管代理功能做了个财务AI助手
Ramp利用Gemini API新出的托管代理功能,快速搭了一个高级财务代理,而且不用自己管后端基础设施。正文没披露上线时间、定价和评估指标,所以实际效果和成本还不清楚。
#Agent#Tools#Ramp#Google
精选理由
触发硬排除-云厂商推广和纯营销:这是一篇 Google/Ramp 的 Gemini API 托管代理客户案例,没有上线时间、定价、评测或独立结果,因此重要性上限低于 40。
一句话点评
Ramp 用 Gemini API 新出的托管代理功能,快速搭了一个高级财务代理,不用自己管后端基础设施。这点挺省事,但正文没披露上线时间、定价和评估指标,所以实际效果和成本还不清楚。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K1·R0
23:05
24d ago
彭博科技· rssEN23:05 · 05·19
松下、纽约人寿、Kyndryl、Citizens 高管聊人+AI 团队怎么搭
彭博一场活动上,四家公司高管聊了怎么让员工和 AI 一起干活。核心思路是“人机协作”而不是用 AI 换人,具体做法包括给员工做 AI 技能培训、重新设计岗位流程。但正文没披露任何一家公司的培训规模、预算或落地时间表,所以目前只能当方向性讨论看,不是可复用的方案。
#Agent#Panasonic#New York Life#Kyndryl
精选理由
HKR-R勉强通过,因为AI workforce training确实戳中打工人对岗位变化的担忧。HKR-H和HKR-K不通过:标题太泛,正文没有给出培训规模、预算、落地时间表或可复用的方法。
一句话点评
四家公司高管聊人机协作,方向是培训员工、重设流程,不是用AI换人。但正文没披露任何一家的培训规模、预算或落地时间表,目前只能当方向性讨论看,不是可复用方案。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
23:01
24d ago
FT · 科技· rssEN23:01 · 05·19
韩国股市18个月涨两倍,AI芯片热把Kospi推得比纳斯达克泡沫期还猛
韩国Kospi指数在18个月内涨了两倍,涨幅超过了纳斯达克在互联网泡沫时期的纪录。推动力来自三星和SK海力士,两家公司都搭上了AI芯片需求的快车。正文没披露当前估值水平、资金流向、指数权重变化,也没说明对比纳斯达克用的是哪个时间段,所以这个“超越”到底有多扎实,还得打个问号。
#Samsung#SK Hynix#Kospi#Commentary
精选理由
HKR三项都过,但正文只给了指数涨幅和两家公司名字,没披露估值水平、资金流向或成分股权重。这是AI基础设施的市场情绪信号,不是核心AI产业新闻。
一句话点评
韩国Kospi指数18个月涨了两倍,涨幅超过纳斯达克互联网泡沫时期。推动力是三星和SK海力士,两家都搭上AI芯片需求快车。但正文没披露当前估值、资金流向、指数权重变化,也没说对比纳斯达克用的是哪个时间段,这个“超越”到底多扎实得打个问号。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R1
22:30
24d ago
Hacker News 首页· rssEN22:30 · 05·19
一个能去掉 Gemini 可见水印和 SynthID 隐形水印的命令行工具
GitHub 上有个新项目,叫 remove-ai-watermarks,号称能去掉 AI 图片上的水印。它针对的是 Gemini 的可见水印,以及 SynthID、C2PA、EXIF 这类隐形水印。项目目前有 72 个星标和 12 个 fork,但正文没披露具体用什么方法、支持哪些模型、以及复现条件。这点先别太激动,效果和可靠性都还不清楚。
#Safety#GitHub#Hacker News#Open source
精选理由
H 和 R 通过:标题本身有对抗性钩子,且触及安全与信任议题。K 不通过:正文只有 HN 数据,没有方法、范围或可复现的声明,所以归入低价值 all 档。
一句话点评
GitHub 上一个新项目声称能去掉 Gemini 的可见水印和 SynthID、C2PA、EXIF 等隐形水印。目前只有 72 个星标和 12 个 fork,项目太小,方法、支持模型和复现条件都没披露。这点先别太激动,效果和可靠性都不清楚。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
22:16
24d ago
The Verge · AI· rssEN22:16 · 05·19
DeepMind CEO 说我们正站在“奇点”的山脚下,但没给时间表
Google DeepMind 的 Demis Hassabis 在 Google I/O 闭幕时称当前是“奇点的山脚”,并说 AGI 会放大人类智慧、开启科学发现新纪元。但整段发言没有披露 AGI 何时到来、需要多少算力或数据,也没有展示任何技术证据。正文没提产品参数或路线图,更像一个愿景宣言而非可验证的判断。
#Reasoning#Demis Hassabis#Google DeepMind#Google
精选理由
HKR-H 和 HKR-R 通过:Demis 在 Google I/O 用‘奇点的山麓’这个说法,有话题性,也容易引发从业者站队讨论。HKR-K 不通过:全文只有一句引述,没有时间表、规格或可验证的机制,信息量不足,所以定级为 all。
一句话点评
Demis Hassabis 在 Google I/O 闭幕时说现在是“奇点的山脚”,AGI 会放大人类智慧、开启科学黄金时代。但整段发言没给 AGI 时间表、算力需求或数据支撑,更像愿景宣言而非可验证判断。正文没披露任何产品参数或路线图,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
21:44
24d ago
r/LocalLLaMA· rssEN21:44 · 05·19
从 Claude 换到本地 Qwen,3 万行 Pygame 项目跑起来了
一位 Reddit 用户把自己约 3 万行、55 个模块的 Python Pygame 项目,从 Claude Sonnet 4.6 换到了 Qwen3.6-35B-A3B-UD-Q6_K 上跑。硬件是 RTX 5090 加 4000 Pro,56GB 显存,Cline 里开了 25 万 token 上下文窗口。正文没披露具体效果对比,但能跑通 3 万...
#Code#Tools#Claude#Qwen
精选理由
一个 Reddit 用户用 Qwen3.6-35B-A3B-UD-Q6_K 接手了原本 Claude 在跑的 3 万行 Pygame 项目,硬件是 5090 加 4000 Pro、56GB VRAM,在 Cline 里跑 25 万上下文。三个钩子都成立:替换关系明确(h),测试条件具体(k),戳中开发者对 Claude 成本和本地模型可行性的焦虑(r)。但证据只有一个 Pygame 项目,没有对比实验或失败率,所以放在 all 而不是 featured。
一句话点评
一位 Reddit 用户把 3 万行 Pygame 项目从 Claude 换到 Qwen3.6-35B 本地跑,硬件是 RTX 5090 + 56GB 显存,开了 25 万 token 上下文。正文没披露效果对比,但能跑通 3 万行代码本身说明本地模型在长上下文场景下已可用。不过 56GB 显存门槛太高,普通开发者暂时够不着。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
21:34
24d ago
r/LocalLLaMA· rssEN21:34 · 05·19
Reddit 上有人发了个 1B 模型号称新 SOTA,但啥证据都没给
Reddit 用户发帖讨论 HRM-Text-1B,标题直接写“新 SOTA 1B 模型”。但帖子只贴了 GitHub、Hugging Face 和 YouTube 链接,正文被 Reddit 屏蔽,看不到任何数据集、评测分数或可复现条件。目前没法判断它到底强在哪,甚至不知道它是不是真的跑过标准 benchmark。如果你打算试,建议先当个“声称”看,...
#Benchmarking#HRM-Text#Sapient#Reddit
精选理由
H和R两条成立:标题的SOTA宣称有吸引力,小模型性能也戳中本地部署痛点。但K很弱——正文没给任何分数、数据集或复现步骤,全靠Reddit用户一张嘴,所以这条线索信号低,只能当社区传闻看。
一句话点评
Reddit 上有人发帖说 HRM-Text-1B 是新的 SOTA 1B 模型,但正文被屏蔽了,只留了 GitHub、Hugging Face 和 YouTube 链接。目前看不到任何数据集、评测分数或可复现条件,没法判断它到底强在哪。如果你打算试,建议先当个“声称”看,等有人跑过标准 benchmark 再说。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
21:31
24d ago
AI HOT 精选· aihot-apiZH21:31 · 05·19
Claude Code v2.1.145:新增会话列表命令和追踪支持,修复权限绕过等漏洞
Anthropic 发布了 Claude Code 的 v2.1.145 版本,主要加了两个功能:一是 JSON 格式的会话列表命令,方便脚本或工具批量管理对话;二是给 agent 模式加上了 OTEL 父-子追踪,也就是把模型调用的链路串起来,方便排查多步任务中哪一步出了问题。修复方面比较关键:之前有用户发现可以绕过权限提示直接执行操作,这次堵上了;...
#Agent#Code#Tools#Anthropic
精选理由
HKR-K/R 通过,因为这次更新包含了具体的 CLI 命令、追踪功能和安全性修复。HKR-H 不通过:这只是 Claude Code 的一个常规补丁,范围比模型发布或重大 Agent 功能更新窄得多。
一句话点评
Claude Code 小版本更新,主要加了两个实用功能:JSON 格式的会话列表命令,方便脚本批量管理对话;agent 模式加了 OTEL 父-子追踪,把多步调用的链路串起来,排查问题更直观。修复了一个安全漏洞——之前有人能绕过权限提示直接执行操作,这次堵上了。另外修了终端 resize 后卡死、非 ASCII 文件名调用 API 失败等 bug。没有性能或成本数据,就是一次常规迭代。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
21:24
24d ago
The Verge · AI· rssEN21:24 · 05·19
Google 搜索框要包办一切:打字变长、AI 猜你想搜
Google 在 I/O 2026 上给搜索框加了两个功能:输入框会随着你打长句子自动拉宽,以及 AI 会给出比传统自动补全更“聪明”的搜索建议。说白了就是搜索框想替你多干点活,不只是补关键词,而是直接猜你真正想问什么。不过正文没披露什么时候上线、支持哪些地区、以及这个 AI 建议是不是默认打开的——所以这点先别太激动,可能只是演示阶段的功能。
#Agent#Tools#Google#The Verge
精选理由
H/K/R 都过线,但正文只给了 I/O 上的交互变化;上线时间、覆盖地区和默认开关都没披露。作为中等体量的 Google 产品更新,放在 featured 以下合适。
一句话点评
Google I/O 2026 给搜索框加了两个小更新:输入框随长句子自动拉宽,以及 AI 给出比自动补全更“聪明”的建议。说白了就是搜索框想替你多干点活,不只是补关键词,而是直接猜你真正想问什么。不过正文没披露什么时候上线、支持哪些地区、以及这个 AI 建议是不是默认打开的——所以这点先别太激动,可能只是演示阶段的功能。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
21:16
24d ago
TechCrunch AI· rssEN21:16 · 05·19
Google 推出“信息代理”:让 AI 在后台盯着你关心的话题,有变化主动通知你
Google 在 I/O 2026 上发布了新的 AI 信息代理,跟传统搜索不一样——你不用每次手动搜,它可以 24 小时在后台监控你设定的主题,比如竞品动态、政策变化,然后主动推送更新,还会帮你总结“为什么这事重要”以及不同角度的观点。说白了就是 Google Alerts 的 AI 升级版,但正文没披露具体什么时候上线、要不要额外付费,以及触发推送...
#Agent#Google#Product update
精选理由
HKR 三项都过,但这是一篇偏教程的 Google 产品介绍,缺少上线范围、定价和触发机制等关键信息,属于中等权重内容,落在 60–71 区间,不推荐 featured。
一句话点评
Google I/O 上发布了AI信息代理,相当于给Google Alerts装上大模型:设定主题(比如竞品动态),它24小时后台监控,主动推送更新并总结“为什么重要”和不同观点。不用再手动搜了。但正文没披露上线时间、是否额外付费,以及触发推送的灵敏度——是每天一次还是实时?这点先别太激动,等定价和延迟细节出来再说。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:09
24d ago
r/LocalLLaMA· rssEN21:09 · 05·19
Google AI Edge Gallery 更新:Gemma 4 支持一次预测多个 token,Pixel 手机也能跑 TPU 了
Google 的 AI Edge Gallery 发布了 v1.0.13 和 v1.0.14 两个版本,主要给手机端本地跑模型加了几个实用功能。Gemma 4 现在支持多 token 预测(一次生成多个词,理论上能提速),还开始支持 Pixel 手机的 TPU 芯片(本地推理延迟更低)。新增了实验性的 MCP(模型上下文协议,让模型能调用外部工具),以...
#Inference-opt#Tools#Memory#Google
精选理由
HKR 三项都过,因为更新提到了具体的端侧功能,但正文没披露参数、性能数字或可复现的设置细节。这属于普通产品更新档位,不值得加精。
一句话点评
Google 给手机端本地跑模型加了两个实用更新:Gemma 4 支持多 token 预测(一次生成多个词,理论上能提速),还开始支持 Pixel 手机的 TPU 芯片(本地推理延迟更低)。新增实验性 MCP(让模型能调用外部工具)和聊天记录保存。但正文被屏蔽,没披露具体参数、速度提升倍数或兼容机型范围,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:08
24d ago
TechCrunch AI· rssEN21:08 · 05·19
从少年黑客到铁穹研究员,他拿了2800万美元做AI反钓鱼邮件
Ocean 是一家主打“agentic email security”的创业公司,说白了就是让AI代理逐封分析邮件上下文,判断是不是钓鱼或冒充。创始人Shay Shwartz 16岁当黑客被抓,后来在以色列国防和情报部门干了近十年,参与过铁穹项目。这次融了2800万美元,金额不小,但正文没披露具体模型设计、客户数量、定价或检测准确率,所以产品到底多能打...
#Agent#Safety#Ocean#Iron Dome
精选理由
HKR三项都过:创始人故事有钩子,2800万融资和上下文分析算新信息,AI钓鱼安全方向踩中企业痛点。重要性压在60–71是因为正文没披露检测指标、客户数量和模型细节,判断只能挂在融资和产品宣称上,没法给更高分。
一句话点评
Ocean 拿了 2800 万美元做“代理式邮件安全”,让 AI 逐封分析邮件上下文来抓钓鱼和冒充。创始人 16 岁当黑客被抓,后来在以色列搞过铁穹,背景挺硬。但正文没披露模型设计、客户数、定价或检测准确率,产品到底多能打还不好说。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
21:00
24d ago
● P1彭博科技· rssEN21:00 · 05·19
SoftBank向OpenAI投资600亿美元引发内部担忧
软银已向 OpenAI 承诺投入超过 600 亿美元,部分内部人士对孙正义如此力挺 Sam Altman 感到不安。正文没披露具体交易条款、资金到位时间表,也没说有多少人表达了担忧,以及这些担忧在内部是否被正式讨论过。
#SoftBank#OpenAI#Sam Altman#Funding
精选理由
我会先打个折:正文没披露具体的投资条款、时间表,也没说内部到底有多少人反对,所以很多判断还悬着。但 Bloomberg 能拿到“内部人士担忧”这种料,本身就说明 SoftBank 这笔超过 600 亿美元的押注在内部有争议。孙正义对 Altman 的个人投入被单独拎出来说事,这比单纯报一个融资额更有信号意义——它暗示了决策可能不够冷静,也把 OpenAI 的资本结构风险又翻了出来。这点先别太激动,但值得盯着后续条款和反对声浪会不会公开化。
一句话点评
孙正义押注OpenAI超600亿美元,内部人怕他像当年迷信WeWork创始人一样迷信奥特曼,而且投了这么多连个董事会席位都没拿到。
锐评
这条新闻的核心不是钱多,而是权力结构和决策机制出了问题。软银对OpenAI的总投资承诺已超过600亿美元,持股超过10%,但既没有董事会席位,连观察员席位都没有。这意味着软银对这笔巨额押注几乎没有决策影响力,只能被动跟随奥特曼的节奏。内部人士向彭博社透露,孙正义曾多次不耐烦地驳回关于“OpenAI万一失败怎么办”的提问,下属后来干脆不再提了。 有几个数字值得注意:软银上一财年利润增长超过三倍,达到创纪录的320亿美元,大部分收益来自OpenAI估值上升。但这只是账面浮盈,OpenAI还没上市。而软银股价已从去年10月高点下跌超过20%,标普也下调了对软银的展望,担心这笔押注会消耗流动性。另外,软银已经缩减了一笔以OpenAI股份为担保的100亿美元保证金贷款计划,说明债权人也在犹豫。 文章没披露的是:OpenAI具体的上市时间表和估值依据、软银内部是否有正式的风险对冲方案、以及孙正义本人对Anthropic近期突破的具体看法。这些信息缺口让“高度信心”的说法显得更像表态而非论证。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
20:56
24d ago
彭博科技· rssEN20:56 · 05·19
ADI以15亿美元收购电源芯片公司Empower
ADI 宣布以 15 亿美元现金收购私有公司 Empower Semiconductor,这是一家做数据中心电源芯片的公司。15 亿全现金,说明 ADI 很想要这块业务,但正文没披露交易时间表、监管条件,也没说具体买了哪几款电源芯片产品。
#Inference-opt#Analog Devices#Empower Semiconductor#Funding
精选理由
HKR-K靠15亿美元现金收购通过。HKR-H和HKR-R不通过,因为正文缺少AI数据中心产品细节、时间表,以及从业者能感知的利害关系。
一句话点评
ADI 花 15 亿美元现金买下数据中心电源芯片公司 Empower,全现金说明志在必得。但正文没披露具体买了哪几款芯片、交易时间表和监管条件,信息缺口不小。对 AI 从业者来说,数据中心电源效率直接影响算力成本,这笔收购值得关注,但具体影响还得等细节。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H0·K1·R0
20:47
24d ago
● P1FT · 科技· rssEN20:47 · 05·19
Google 要出智能眼镜,还会在搜索引擎里塞进 AI 代理
Google 准备发布智能眼镜,同时给搜索引擎加上 AI 代理功能。CEO Sundar Pichai 说这些功能靠新的 Gemini 模型驱动,目标是缩小跟 Anthropic 和 OpenAI 的差距。不过这篇付费墙后面的正文没披露具体规格、上市时间和价格,所以眼镜长什么样、卖多少钱、什么时候能买到,现在都还不知道。
#Agent#Google#Sundar Pichai#Anthropic
精选理由
我会先打个折:正文没披露参数、时间表和价格,所以没法判断落地有多快。但 Google 把 Gemini agent 塞进搜索,再配上智能眼镜,等于在用户每天用的入口上同时推两个 AI 触点。Pichai 自己说新功能要缩小跟 Anthropic、OpenAI 的差距,这话本身就说明他们承认落后,也在用产品动作追。对从业者来说,看点不是技术多新,而是 Google 怎么用分发优势把 agent 推到普通人面前。这点先别太激动,等具体上线和实测再说。
一句话点评
Google 要发智能眼镜,还给搜索加了能替你干活的 AI 代理,但全文卡在付费墙后,规格、价格、上市时间一概没写。
锐评
这条消息本身挺重磅:Google 终于要出智能眼镜,同时把 AI 代理塞进搜索引擎,CEO 说靠新的 Gemini 模型来追赶 Anthropic 和 OpenAI。但尴尬的是,FT 这篇正文完全在付费墙后面,我们能看到的只有标题和摘要,所以眼镜长什么样、卖多少钱、什么时候能买到,现在全是问号。 我会先打个折:Google 在硬件上翻过车,智能眼镜能不能成,得看它解决了什么实际问题,而不是又画一个“未来生活”的饼。搜索加代理这事倒更值得关注——如果真能让模型直接帮你订机票、比价、填表,那是对现有搜索体验的改造,而不只是多一个聊天窗口。但正文没披露代理能调用哪些服务、权限边界在哪、出错谁兜底,这些才是落地时真正要命的问题。 还缺的关键信息:新 Gemini 模型在哪些指标上缩小了差距,是跑分、延迟还是实际任务完成率?眼镜的交互方式是语音、手势还是别的?这些 FT 都没给,只能等后续报道或 Google 自己公布。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
20:30
24d ago
NVIDIA 博客· rssEN20:30 · 05·19
英伟达和谷歌云为开发者社区推出新学习资源和推理优化教程
英伟达和谷歌云给联合社区的10万多名开发者加了新资源:一条JAX在英伟达GPU上的学习路径,和一个用Dynamo在GKE上做推理优化的codelab(手把手教程)。下个月上线,但正文没披露要不要额外付费或有没有使用限制。
#Agent#RAG#Inference-opt#NVIDIA
精选理由
触发硬排除规则cloud-vendor-promo:NVIDIA和Google Cloud在推广学习路径、GKE codelab和直播。HKR-K有具体资源和10万数字,但HKR-H和R不满足,因此上限为excluded。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
20:09
24d ago
AI HOT 精选· aihot-apiZH20:09 · 05·19
Gemini 3.5 Flash 拍个香蕉就能做游戏
Gemini 3.5 Flash 演示了一个新玩法:拍一张日常物品(比如 Nano Banana),用 Canvas 直接把它变成可互动的游戏,不需要 3D 建模。正文没披露模型参数、定价和上线时间,但这条路径对快速原型和创意验证挺实用——拍个东西就能跑起来,门槛很低。
#Multimodal#Vision#Tools#GeminiApp
精选理由
HKR-H 和 HKR-K 靠图片转游戏的 Canvas 工作流通过,但 HKR-R 偏弱。这只是个小产品演示,没有参数、定价、发布日期或一手实测数据。
一句话点评
拍个香蕉就能变游戏,Gemini 3.5 Flash 这个演示门槛极低,适合快速原型验证。但正文没披露模型参数、定价和上线时间,实际延迟和成本未知,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
19:35
24d ago
AI HOT 精选· aihot-apiZH19:35 · 05·19
Google 推了个叫 Antigravity 的智能体开发平台
Google 在 I/O 上发布了 Antigravity 生态系统,定位是“智能体优先的开发平台”,面向需要构建或编排智能体的开发者。目前正文没披露具体组件、定价、API 或发布时间线,所以暂时只能当个概念预告看。
#Agent#Tools#Google#Antigravity
精选理由
HKR-R 通过是因为 Google 进入智能体工具领域对从业者有意义,但 HKR-H/K 不通过:没有具体组件、API、价格或发布时间表。这更像定位宣示而非实质性产品更新。
一句话点评
Google I/O 上画了个叫 Antigravity 的智能体开发平台大饼,定位是“智能体优先”。但正文没披露任何具体组件、定价或发布时间线,目前就是个概念预告。短评:饼很大,但没馅,先别激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
19:34
24d ago
● P1Hacker News 首页· rssEN19:34 · 05·19
OpenAI为生成图片采用Google SynthID水印技术并推出验证工具
OpenAI 宣布给 ChatGPT、Codex 和 API 生成的图片加上 Google DeepMind 的 SynthID 隐形水印,同时把自家的内容来源信息正式对齐 C2PA 标准。简单说,C2PA 像给图片贴了个带签名的数字标签,记录谁生成的、怎么改过,但截图或转格式时容易丢;SynthID 则是在像素层面埋信号,更扛得住截图和压缩。两者互补...
#Safety#Vision#OpenAI#Google
精选理由
我会先打个折:正文只给了 55 分、23 条评论,没写覆盖哪些模型、什么时候上线、验证机制怎么跑,信息缺口不小。但 OpenAI 接 Google 的水印方案这件事本身够具体,不是画饼,对做内容溯源和合规的从业者来说是个可追踪的信号。这点先别太激动,等上线细节出来再判断实际效果。
一句话点评
OpenAI 用上了 Google 的 SynthID 给生成图片打隐形水印,还接入了 C2PA 元数据标准,以后查图来源会方便一点,但只对自家产品有效。
锐评
OpenAI 这次做了两件事:一是加入 C2PA 开放标准,在图片的元数据里直接写明“这是 AI 生成的”;二是把 Google 的 SynthID 水印技术集成进自己的产品。SynthID 相当于给图片像素里藏了一个肉眼看不见的记号,就算截图、压缩也很难去掉,比单纯看元数据更扛造。 不过,这两招目前只覆盖 OpenAI 自己模型生成的图片。正文没提 DALL·E 以外的产品,也没说第三方工具或截图后还能不能验出来。另外,验证工具具体怎么用、准确率多少、会不会误判,文章都没给数字。 这点先别太激动。水印能增加造假成本,但挡不住决心够大的攻击者。真正缺的是一套跨平台、跨模型的通用验证机制,以及平台愿意强制执行的动力。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
19:26
24d ago
r/LocalLLaMA· rssEN19:26 · 05·19
Intel 新 GPU 谍照:160GB 显存、不用 HBM 改用 LPDDR5X
Reddit 上流出一张 Intel Crescent Island 的 PCB 谍照,核心是一颗 Xe3P 数据中心 GPU,配了 20 颗 8GB LPDDR5X 颗粒,总共 160GB 显存。Intel 这次绕开了 HBM 短缺的问题,直接用 LPDDR5X,成本更低但带宽也低——按 32-bit 接口和 8800-9500MT/s 估算,带宽约...
#Inference-opt#Intel#Product update
精选理由
这是一条 Reddit 泄露的 PCB 图,没有官方确认、跑分或定价,所以分数卡在 60-71 区间,上不了精选。亮点是 Intel 用 LPDDR5X 替代 HBM,160GB 显存对推理场景够用,但带宽只有 700GB/s 级别,比 HBM 低一个数量级,适合对延迟不敏感的离线推理。正文没披露功耗、散热方案和量产时间,这些缺口让信息价值打折扣。
一句话点评
Intel 新曝光的 Crescent Island 显卡 PCB 用了 160GB LPDDR5X 显存,绕开 HBM 短缺,成本更低但带宽只有 704-760GB/s,比 HBM 差一截。适合跑大模型推理,训练就别想了。谍照来源是 Reddit,官方没确认,信息有限。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:14
24d ago
Hacker News 首页· rssEN19:14 · 05·19
Mistral 收购 Emmi,想凑一套完整的 AI 技术栈
Mistral AI 收购了 Emmi AI,官方说法是要打造“领先的 AI 技术栈”。但正文没披露交易金额、团队去向,也没说具体要整合哪些组件。目前只有 HN 上 19 个点赞和 1 条评论,信息量很少。如果你关心的是“Mistral 是不是在补短板”,目前只能确认它在买公司,但买来怎么用、值不值,还得等后续披露。
#Mistral AI#Emmi AI#Hacker News#Partnership
精选理由
这条新闻在 H 和 K 上勉强过关,因为 Mistral 收购确实是个信号,但 R 很弱——关键的交易和产品细节全缺,属于 60–71 分段的普通公司新闻,不值得上推荐位。
一句话点评
Mistral AI 收购了 Emmi AI,说要打造“领先的 AI 技术栈”。但正文没披露交易金额、团队去向和具体整合哪些组件,HN 上只有 19 个点赞和 1 条评论,信息量很少。目前只能确认它在买公司,但买来怎么用、值不值,还得等后续披露。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
19:08
24d ago
彭博科技· rssEN19:08 · 05·19
交易员怎么看中美AI模型差距:Bloomberg Odd Lots 聊了一期
Bloomberg 的播客 Odd Lots 请了德意志银行的两位分析师聊中美 AI 模型的分化。正文没披露具体模型名称、资本金额或评估指标,所以信息密度不高。核心观点是交易员在关注两边模型的能力差距,但没给出明确的判断标准或结论。如果你想知道他们到底怎么量化这个“divergence”,这篇给不了答案。
#Bloomberg#Deutsche Bank#Ozan Tarman#Commentary
精选理由
HKR-H和HKR-R通过,但HKR-K偏弱:没有模型名称、估值方法或交易指标。这是一条普通的彭博评论,不到精选门槛。
一句话点评
Bloomberg Odd Lots 请德银分析师聊中美 AI 模型分化,但全程没提具体模型名、资本金额或评估指标,信息密度极低。交易员关注能力差距,但没给出量化标准或结论。适合当背景讨论听,别指望拿到可用的判断依据。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
19:07
24d ago
FT · 科技· rssEN19:07 · 05·19
Cerebras 融资 64 亿美元,华尔街开始押注下一波 AI 公司 IPO
Cerebras 成功融了 64 亿美元,华尔街觉得这是个信号:接下来 SpaceX、OpenAI、Anthropic 这些大牌可能也要排队上市。正文没披露具体上市时间、估值或文件细节,所以这点先别太激动,但至少说明投资者现在对 AI 硬件和模型公司愿意掏钱。
#Cerebras#SpaceX#OpenAI#Funding
精选理由
FT 报道,Cerebras 以 64 亿美元估值融资,市场认为这为 OpenAI、Anthropic 等大型 AI 公司的上市铺了路。但正文没披露任何一家公司的上市时间表、定价或估值细节,所以只能放在 all 层级,提醒从业者关注资本退出信号,但别急着下注。
一句话点评
Cerebras 融了 64 亿美元,华尔街觉得这是 AI 公司上市潮的信号。SpaceX、OpenAI、Anthropic 被点名可能排队,但正文没披露上市时间、估值或文件细节,这点先别太激动。至少说明投资者现在对 AI 硬件和模型公司愿意掏钱。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
18:55
24d ago
r/LocalLLaMA· rssEN18:55 · 05·19
有人吐槽:花在维护 AI 提示文件上的时间比写代码还多
一位 Reddit 用户抱怨,用 Cursor 做编码 agent 时,每天要手动维护三个步骤:改 .cursorrules、睡前写 SESSION_STATE.md、第二天早上再把摘要贴回提示框。正文被 Reddit 屏蔽了,没披露具体项目规模或团队人数,但核心槽点很直接——AI 辅助编码的“上下文管理”本身已经变成一种新杂活。
#Agent#Code#Memory#Reddit
精选理由
H/K/R 都达标,但只是一条 Reddit 工作流吐槽,没有样本量、版本号或效果数据,所以放在 60-71 分区间当可浏览信号,不上推荐位。
一句话点评
用 Cursor 写代码,结果每天花在写 .cursorrules 和 SESSION_STATE.md 上的时间比写代码还多。睡前要手动记状态,第二天再贴回去——上下文管理成了新杂活。正文被 Reddit 屏蔽,没披露项目规模或团队人数,但槽点很真实:AI 编码 agent 的“记忆”问题还没解决,工具链反而更重了。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
18:47
24d ago
AI HOT 精选· aihot-apiZH18:47 · 05·19
Google DeepMind 推出 Gemini for Science:帮科学家跑假设、筛文献
Google DeepMind 发布了实验性工具套件 Gemini for Science,主要帮科学家做三件事:探索更多假设、大规模验证实验、快速解析文献。目前正文没披露模型参数、开放范围、定价或发布时间表,所以暂时只能当概念看。
#Agent#Tools#RAG#Google DeepMind
精选理由
Google DeepMind 发了 Gemini for Science 实验工具包,功能上覆盖假设探索、大规模验证和文献解析,算是把 Agent 和 RAG 往科研场景推了一步。但正文没披露模型参数、开放范围或时间表,信息缺口大。HKR 里 K 和 R 能过,因为功能描述具体,且触及'科学Agent能否落地'的从业者关切;H 弱,标题像营销话术,没有意外钩子。整体信息密度偏低,不够上 featured。
一句话点评
Google DeepMind 发了个叫 Gemini for Science 的实验工具包,帮科学家想假设、跑验证、读文献。听着挺大,但正文没提模型参数、开放范围、定价或发布时间,目前就是个概念展示。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
18:44
24d ago
r/LocalLLaMA· rssEN18:44 · 05·19
PrivateScribe.ai 一年更新:全本地、MIT 协议、免费 AI 转录,带 HIPAA 级安全
一个叫 PrivateScribe.ai 的开源项目发了年度更新,GitHub 上 74 颗星。它主打全本地运行,不用联网,转录数据不出设备。这次加了 macOS 签名版、说话人分离(能区分谁在说话)、SQLCipher 256 位数据库加密、可选的加密音频存储、哈希链审计日志,还有一个本地转录的管理后台。项目用 MIT 协议,免费,设计上考虑了 HI...
#Audio#Tools#PrivateScribe.ai#Ollama
精选理由
一个本地转录工具的小版本更新,74 个 star 说明用户群不大,但合规功能和开源协议让它在特定场景(医院、律所)有实用价值。适合推给关注数据隐私的从业者,但影响力有限,不值得上首页。
一句话点评
一个 74 星的开源项目,主打全本地转录,数据不出设备。这次更新加了说话人分离、256 位数据库加密和审计日志,设计上考虑了 HIPAA 和法律场景。但正文被 Reddit 屏蔽,没披露具体用的什么模型、转录延迟多高、说话人分离准确率多少。如果真能本地跑且免费,对隐私敏感场景(医疗、法律)有价值,但 74 星说明社区验证还很弱,先别当生产工具。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
18:38
24d ago
Hugging Face 博客· rssEN18:38 · 05·19
AllenAI发布OlmoEarth v1.1遥感模型,推理成本最高降低三倍
AllenAI 发布了 OlmoEarth v1.1,一个面向卫星图像分析的模型系列。核心改进是缩短 token 序列长度——Transformer 的计算量随序列长度平方增长,所以哪怕只缩短一点,推理成本也能明显下降。官方称相比 v1 最高可省 3 倍算力,同时保持原有精度。模型有多个尺寸可选,用户可以根据自己的算力预算挑。正文没披露具体参数量、效率...
#Vision#AllenAI#Hugging Face#OlmoEarth
精选理由
AllenAI 发了 OlmoEarth v1.1,一个地球观测模型家族。但正文没披露参数规模、效率提升的具体数字、用了什么数据集、以及许可证。遥感模型本身受众窄,加上信息缺口太大,没法判断它比现有方案好多少、能不能直接用。分数卡在 35 合理,不推。
一句话点评
AllenAI 发了遥感模型 OlmoEarth v1.1,推理成本最高降 3 倍。核心是把输入图片切成更小的 token 块,序列变短,计算量平方级下降。性能没掉,但正文只给了 MACs 和排名图,没披露具体精度数字,这点先别太激动。如果是真的,大面积遥感分析能省不少钱。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K0·R0
18:37
24d ago
r/LocalLLaMA· rssEN18:37 · 05·19
两个开源模型在 Arena 编码榜上超过了 Gemini 3.5 Flash
Reddit 帖子引用 Arena 编码排行榜,称 GLM 排第 7、Mimo 排第 9,而 Gemini 3.5 Flash 只排第 12。帖子没交代测试样本量、评分机制和具体模型版本,所以这个排名只能当参考,不能直接说谁更强。
#Code#Benchmarking#GLM#Mimo
精选理由
HKR 三项都通过,因为排名反差、具体榜单数字以及开源 vs 闭源编码模型的讨论点都成立。重要性只给 68 是因为这只是一条 Reddit 帖子,正文没披露测试样本量、评分方法或具体模型版本,信息缺口明显,不能当硬证据用。
一句话点评
Reddit 帖子说 GLM 和 Mimo 在编码排行榜上超过 Gemini 3.5 Flash,但正文被屏蔽,看不到样本量和评分细节。这个排名只能当参考,不能直接说谁更强。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
18:34
24d ago
Hacker News 首页· rssEN18:34 · 05·19
Google 改了搜索框,但正文只给了三个媒体链接
Google 发了一篇博客,标题说搜索框变了,但正文只列了三个媒体链接,外加 Hacker News 上 83 个点赞和 214 条评论。具体怎么改、什么时候上线、覆盖多少用户,正文都没说。
#Google#Hacker News#Product update
精选理由
H 和 R 成立:Google 核心搜索入口改动天然有讨论价值,HN 214 条评论也佐证了热度。但 K 不成立:正文没披露任何交互细节、上线范围或 AI 能力,信息缺口太大,没法判断实际影响。
一句话点评
Google 说搜索框要变,但博客正文只给了三个媒体链接和 Hacker News 的 83 个点赞、214 条评论。具体怎么改、什么时候上线、覆盖多少用户,全都没说。标题党嫌疑重,建议等官方详细说明再跟进。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
18:34
24d ago
AI HOT 精选· aihot-apiZH18:34 · 05·19
Gemini 3.5 Flash 上线 OpenRouter,性能超 3.1 Pro 但价格还是 Flash 档
Google DeepMind 的 Gemini 3.5 Flash 已经在 OpenRouter 上架。它在编码、智能体任务和工具使用上超过了 Gemini 3.1 Pro,但价格和速度依然保持在 Flash 系列的水平。支持 100 万 token 上下文(能一次塞进整本小说)、最大输出 6.5 万 token(写长报告够用),还支持多模态。输入每...
#Agent#Tools#Multimodal#OpenRouter
精选理由
正文只确认了 OpenRouter 上线,没给基准测试或 Google 官方发布细节,属于小更新,所以分数落在 60–71 区间。
一句话点评
Gemini 3.5 Flash 上线 OpenRouter,编码和智能体任务比自家 Pro 还强,价格却保持 Flash 的低价:输入 $1.5/百万 token,输出 $9/百万 token。支持 100 万上下文(整本小说)和 6.5 万输出(长报告)。但来源是 OpenRouter 的推文,Google 官方还没发 benchmark,性能水分未知。如果是真的,这性价比能打 Clau...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
18:15
24d ago
AI HOT 精选· aihot-apiZH18:15 · 05·19
Google 推出每日简报,帮你把收件箱、日历和任务整理成晨间摘要
Google 在 I/O 大会上发布了 Daily Brief,一个每天早晨自动生成的个性化摘要。它会从你的 Gmail 收件箱、日历和待办任务里抓取信息,按优先级排好,再建议你接下来该做什么。说白了就是帮你省掉早上翻一堆 App 的功夫,直接给一个“今天重点看什么、做什么”的清单。目前只说了是超简洁的晨间摘要,具体支持哪些任务来源、能不能自定义筛选规...
#Agent#Tools#Google#Product update
精选理由
HKR-K 和 HKR-R 通过:正文明确提到了收件箱、日历、任务和建议行动。HKR-H 偏弱,且正文没有披露上线范围、权限设置、定价或处理细节,所以这条新闻只能放在小产品更新档位。
一句话点评
Google 在 I/O 上推 Daily Brief,每天早上一键汇总 Gmail、日历和待办,按优先级排好并建议下一步。说白了就是省掉你翻多个 App 的功夫,直接给个“今天重点看什么”的清单。目前只说了是超简洁晨间摘要,具体支持哪些任务来源、能不能自定义筛选规则,正文没披露。如果真能跨应用智能排序,对打工人挺实用;但隐私和准确度是隐忧,毕竟要读你的邮件和日程。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
18:05
24d ago
彭博科技· rssEN18:05 · 05·19
摩根大通CIO谈AI带来的效率提升与管理挑战
摩根大通首席信息官Lori Beer说AI给银行带来了生产力提升,同时也制造了新的风险。正文没披露具体提升了多少、风险有哪些类别、以及怎么管。对于想了解大行怎么落地AI的人来说,这是个信号:银行内部已经在认真权衡收益和风险,但细节还不够,没法直接抄作业。
#JPMorgan Chase#Lori Beer#Commentary
精选理由
彭博+摩根大通CIO,信源和话题有分量,HKR-R成立。但全文只有“生产率收益”和“新风险”两个空泛判断,没有数字、机制或案例。HKR-H和HKR-K都不满足,不值得上推荐位。
一句话点评
摩根大通CIO Lori Beer公开说AI带来了生产力提升,也制造了新风险。正文没披露提升多少、风险类别和管控机制,所以这条只能当信号看:大行内部已经在认真权衡收益和风险,但细节不够,没法直接抄作业。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K0·R1
17:56
24d ago
● P1Hacker News 首页· rssEN17:56 · 05·19
谷歌搜索界面迎来重大改变
标题说用户熟悉的 Google 搜索要结束了,但正文只给了文章链接、81 个 Hacker News 点赞和 76 条评论,没透露具体改了产品哪块、用了什么 AI 机制、什么时候上线。信息缺口很大,目前只能确认这事在社区讨论热度不低。
#Google#TechCrunch#Hacker News#Commentary
精选理由
标题有钩子,但正文没有给出任何可验证的新事实——没有具体产品改动、AI 机制或发布时间,只有 Hacker News 的元数据。HKR-H 和 HKR-R 通过,但 HKR-K 不通过,因此重要性上限被卡在 40 以下,最终评 38 分,归入 excluded。
一句话点评
谷歌把用了25年的搜索框改成了AI对话入口,以后搜东西可能直接掉进AI生成的互动页面里,蓝色链接没了。这对靠搜索流量吃饭的网站是致命一击。
锐评
谷歌在I/O大会上宣布的这次改版,核心是把搜索从“返回一堆链接”变成“直接给你一个AI生成的答案页”。新搜索框能处理更长的对话式提问,还会在后台派“信息代理人”去帮你搜集资料,甚至允许用户自己搭建个性化小应用。TechCrunch的报道点出了最要命的地方:这种交互方式会进一步截流,用户留在谷歌页面里就把事办了,不再需要点进第三方网站。 不过,文章没给出任何数据来支撑这个“重大改变”到底覆盖多少用户、什么时候全量上线,也没提AI回答的准确率或出错率。谷歌过去在搜索里塞AI预览时就闹过不少事实性错误,这次升级成更复杂的互动体验,出错的风险只会更高。另外,出版商和内容创作者会少掉多少流量,谷歌打算怎么补偿或者有没有补偿机制,正文完全没提。这些信息缺口让“搜索已死”的判断得先打个折——方向是明确的,但落地效果和副作用还看不清。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K0·R1
17:54
24d ago
● P1The Verge · AI· rssEN17:54 · 05·19
Google I/O 2026 发布 Gemini 3.5 Flash 与多项产品更新
Google 在 I/O 2026 上发布了新模型 Gemini 3.5 Flash,今天起它就是 Gemini 应用和搜索里 AI Mode 的默认模型了。更强的 Gemini 3.5 Pro 下个月才来。文章只提了这俩模型、搜索、Gmail 和智能眼镜 Project Aura 有更新,但没把 13 个发布全列出来,想看完整清单得去 The Ver...
#Multimodal#Google#Sundar Pichai#Gemini
精选理由
这条消息有 I/O 大会的流量加持,Gemini 3.5 Flash 默认上线的动作也够快,对关注 Google 生态的人来说是个明确的信号。但正文只说了默认切换和 Pro 的时间点,13 项完整清单、跑分、定价这些关键信息都没给,所以重要性先打个折,放在 featured 里而不是直接上首页。
一句话点评
Gemini 3.5 Flash 直接上线,推理快了 4 倍,但运行成本比上代贵了 5.5 倍,省钱这事得看具体任务。
锐评
Google I/O 这次把 Gemini 3.5 Flash 直接推上线,没搞分批等待,这点挺实在。模型主打代理和写代码场景,上下文窗口 100 万 token,一次最多能吐 6.5 万 token,还加了四个思考档位,能记住上一轮的思考过程。官方说它比自家 3.1 Pro 强,在终端操作、前端代码等测试上分数更高,推理速度比同类前沿模型快 4 倍。 但第三方测试机构 Artificial Analysis 的数据得看仔细:它的智能指数评分 55,比上代 3 Flash 高了 9 分,可运行成本也贵了 5.5 倍,甚至比 3.1 Pro 还贵 75%。输出速度确实快,每秒超 280 个 token,价格是每百万输入/输出 token 收 1.5 和 9 美元。所以“快”是真的,“便宜”得打个问号,除非你的任务对延迟极度敏感。 另外,现场演示的 Omni 视频生成和 Spark 后台代理看着热闹,但正文没给出具体的延迟数据、失败率或第三方评测,目前只能当方向性展示。3.5 Pro 下个月才来,现在下结论还早。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
17:52
24d ago
Google 研究院· rssEN17:52 · 05·19
Google 在 Nature 发表 ERA:用于自动化科学实验分析的工具
Google Research 发了一篇 Nature 论文,讲的是 ERA(Empirical Research Assistance),一个帮科学家自动做实验分析的工具。但正文除了标题和导航栏,没有任何技术细节——没提它怎么工作、用了什么模型、效果如何、能不能复现。目前只能知道它发在了 Nature 上,目标是“加速计算发现”。具体是端到端自动跑实...
#Google Research#Nature#Research release
精选理由
标题提到Google Research的ERA、Nature论文和计算发现,但正文只有“General Science”四个字,方法、结果、复现条件一概没披露。没有新模型、新工具或可复现的机制,属于传统的计算发现方向回顾,对AI从业者来说既没有技术细节也没有业务影响,硬排除规则4直接把它压在40分以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R0
17:49
24d ago
● P1Hacker News 首页· rssEN17:49 · 05·19
Google 发布 Gemini 3.5 模型系列,具备前沿智能与执行能力
Google 在 I/O 大会上推出了 Gemini 3.5 系列模型,定位是“前沿智能加行动能力”。官方博客只给了一句介绍,正文没披露参数量、上下文窗口、定价和具体发布时间。Hacker News 上目前只有 19 个赞和 1 条评论,讨论热度不高。我会先打个折:这更像一个预告,实际能干什么、成本多高都还是未知数。
#Agent#Google#Gemini#Product update
精选理由
Google 官方放出 Gemini 3.5 标题,定位是“带行动能力的前沿智能”,但正文除了 URL、19 分和 1 条评论外什么都没披露。我会先打个折:重要性给 86 分、进 featured,是因为 Google 旗舰模型换代本身就是行业信号,哪怕现在信息几乎为零。H 和 R 都成立——标题自带发布悬念,而且这种级别的更新一定会影响竞争对手和下游工具链。K 不成立,因为参数、价格、上下文长度、具体怎么“行动”全都没写,没法当知识用。这点先别太激动,等后续有技术细节再重新评估。
一句话点评
谷歌发了 Gemini 3.5 Flash,输出速度号称是 GPT-5.5 的 4 倍,但价格也涨了,先别急着喊真香。
锐评
这次 Gemini 3.5 系列最大的变化不是跑分,而是谷歌把宝押在了“让模型干活”上。Flash 版本输出速度达到每秒 289 个 token,是 Claude Opus 4.7 和 GPT-5.5 高推理模式的 4 倍。速度快意味着在让模型进业务流程干活(也就是所谓的 agent workflow)时,等待时间更短,体验会流畅不少。谷歌内部用 Antigravity 工具做了个实验,12 小时启动 93 个子智能体,生成了 26 亿个 token,从零搭出一个能跑的操作系统核心,这个案例很直观地展示了模型在复杂任务里的调度能力。 不过,有信源提到 Flash 的价格“显著上涨”,具体涨了多少、跟竞品比性价比如何,正文没给数字。速度快但更贵,对高频调用场景来说,成本账得重新算。另外,基准测试只说“优于 3.1 Pro”,没放具体跑分对比,实际能力提升幅度还得看后续第三方评测。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K0·R1
17:46
24d ago
● P1Hacker News 首页· rssEN17:46 · 05·19
谷歌发布 Gemini Omni 多模态生成模型
Google DeepMind 放出了一个叫 Gemini Omni 的模型页面,副标题是“从任何东西创造任何东西”,听起来很全能。但正文里除了导航栏和品牌介绍,没有任何关于能力、参数、价格或发布日期的信息。Hacker News 上目前有 51 个点赞和 12 条评论,大家基本也是在等更多消息。目前能确定的只有这个页面存在,其他全是未知数。
#Google DeepMind#Gemini#Product update
精选理由
H 和 R 勉强过关:一个新名字足够让人点进去,也跟行业竞争相关。K 不通过:没有能力、定价、时间或可复现的细节,所以这条归入 all 层级。
一句话点评
谷歌发了Gemini Omni,一个能处理文字、图片、音频、视频并直接生成视频的多模态模型,但正文没给任何技术细节和实测数据,先当个预告看。
锐评
谷歌在I/O大会上把Gemini Omni定位成“全能模型”,主打从任意输入生成任意输出,现场演示了用一句话修改视频里的角色和背景。这个能力听起来很直接,但文章完全没提生成视频的分辨率、时长、延迟这些关键指标,也没说模型规模有多大、推理成本高不高。目前放出的第一个版本叫Gemini Omni Flash,已经在Gemini App和YouTube Shorts里能用,但API还没开,外部开发者没法自己测。哈萨比斯说这是Gemini家族最全面的版本,可“全面”到底体现在哪,文章只给了概念,没给对比。想判断它是不是真比现有视频生成方案强,得等第三方跑分和实际体验出来再说。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K0·R1
17:45
24d ago
● P1TechCrunch AI· rssEN17:45 · 05·19
Google 在 I/O 2026 发布 Gemini Spark 个人 AI 代理助手
Google 在 I/O 大会上掏出了 Gemini Spark,一个基于 Gemini 模型和 Antigravity 智能体框架(让模型进业务流程干活)搭起来的个人助手,主打 24 小时在线。它最大的卖点是直接连你的 Gmail,能读邮件、替你处理任务。不过文章没细说它能具体操作 Gmail 里的哪些事,也没提价格和什么时候能用上。这点先别太激动,...
#Agent#Tools#Google#Gemini
精选理由
Google 在 I/O 上扔了个新东西:Gemini Spark,一个号称全天候在线、能直接进你 Gmail 干活的助手。我会先打个折——正文没写定价、没写具体开放范围,也没提安全护栏做到什么程度,所以别急着把它当成已经落地的产品。但信息量是够的:它基于 Gemini 模型,跑在 Antigravity 智能体框架上,等于把模型塞进业务流程里当常驻工人,而不是一问一答的工具。标题里“24/7”和“Gmail 接入”这两个点,直接拉高了从业者对隐私和权限控制的疑问,也让它和 OpenAI 的助手路线形成对标。整体看,产品更新本身够硬,但缺落地细节,...
一句话点评
Google 把 Gmail 变成 AI 助手的训练场,这招比做模型更狠——它直接拿到了你最全的个人上下文。
锐评
Google 在 I/O 2026 发布的 Gemini Spark,本质上是一个能全天候自主干活的个人 AI 助手,底层用了 Gemini 模型和 Antigravity 的代理框架。它最核心的卖点不是模型多强,而是直接接入了 Gmail。这意味着它能读你的邮件、日历,用你已有的个人数据来安排日程或处理杂事,不需要你从头教它。 TechCrunch 的报道点出了 Google 的隐蔽优势:别人还在拼模型跑分,Google 手里已经有几十亿用户的邮件数据。但文章没给出 Spark 具体能自主执行哪些任务、错误率多少、隐私边界怎么划。这些才是决定它到底是“高级邮件过滤器”还是真正能替你干活的代理的关键。 目前信息都来自发布会演示,没有第三方实测。我会先打个折:接入 Gmail 是强场景,但“全天候自主”听着像愿景,实际能稳定跑通多少业务流程,还得等上线后看翻车率。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
17:45
24d ago
AI HOT 精选· aihot-apiZH17:45 · 05·19
Google 发了一篇 AI Mode 上线一年的行为变化报告,但没给具体数据
Google 官方博客说,AI Mode(搜索里那个能直接回答问题的对话模式)上线一年后,美国用户从敲关键词慢慢转向用自然语言提问。这个方向本身不意外——AI Mode 本来就是为了让人用大白话搜东西。但整篇正文没披露任何硬数字:用了多少人、跟谁比、怎么测的、自然语言查询占比涨了多少,全都没说。所以这个结论目前只能当个方向性信号,没法量化评估影响。
#Tools#Google#Product update
精选理由
HKR-R 通过,因为 Google 搜索行为变化直接影响 SEO 和流量策略。HKR-H 和 HKR-K 弱:文章只给了一个笼统的转变结论,没有使用率、样本量或方法论支撑。
一句话点评
Google 官方博客说 AI Mode 上线一年后,美国用户从敲关键词转向用自然语言提问。但整篇没披露任何硬数字:用了多少人、自然语言查询占比涨了多少、跟谁比、怎么测的,全都没说。结论只能当方向性信号,没法量化评估影响。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K0·R1
17:45
24d ago
TechCrunch AI· rssEN17:45 · 05·19
Google 推出 Universal Cart,一个跨设备跨商家的统一购物车
Google 在 I/O 大会上发布了 Universal Cart,一个能跨设备、跨商家、跨几天跟踪你购物全程的智能购物车。它本质上是一个 AI 代理,帮你把在不同网站看中的商品集中到一个地方管理,未来还能授权代理替你付款。正文没披露具体上线时间、数据怎么跟商家共享、支持哪些零售商,以及隐私控制细节。
#Google#Product update
精选理由
HKR 的 H 和 K 靠跨设备、跨零售商购物车这个钩子通过。AI 相关性弱,上线时间、数据机制、隐私控制都没披露,所以留在 all 层级。
一句话点评
Google 在 I/O 上发布了 Universal Cart,一个跨设备、跨商家、跨几天的 AI 购物车代理,帮你把散落在各网站的商品集中管理,未来还能代你付款。想法很实用,但正文没披露上线时间、数据怎么跟商家共享、支持哪些零售商,以及隐私控制细节。这点先别太激动,目前更像一个产品概念演示。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
17:45
24d ago
AI HOT 精选· aihot-apiZH17:45 · 05·19
Google I/O 2026:AI搜索进入智能体时代
Google在I/O 2026上宣布了搜索与AI深度融合的下一步,核心方向是让AI智能体(能自主执行任务的模型)直接参与搜索流程。官方博客称这次更新“结合了搜索引擎的广度与AI的理解力”,但正文没有披露具体功能列表、上线时间、定价或任何基准测试数据。简单说,Google画了一张“搜索+智能体”的大饼,但细节几乎为零——什么时候能用、效果如何、成本多少,...
#Google#Product update
精选理由
Google搜索很重要,但这篇只说了AI与搜索融合,没给功能、上线时间和评测数据;HKR三项全不满足,按0/3规则排除。
一句话点评
Google I/O 2026 宣布搜索将深度整合 AI 智能体(能自主执行任务的模型),但正文没给具体功能、上线时间、定价或任何基准测试。画了个“搜索+智能体”的大饼,细节为零。短评:方向对,但全是口号,等真东西出来再激动。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R0
17:43
24d ago
r/LocalLLaMA· rssEN17:43 · 05·19
用 LLM 写 Blender 代码,自动生成带活动关节的 3D 模型
开发者 mhb-11 开源了 Nova3D 前端,核心思路是让 LLM 直接写 Blender Python 脚本,生成带关节、可活动的 3D 模型(比如洗衣机、机器狗、微波炉),输出为 GLB 格式,保留部件层级和转轴。这套流程不绑定特定模型,换 GPT 或本地模型都能跑。目前验证还比较初步,正文没披露生成成功率或复杂场景下的稳定性,但思路挺直接:把...
#Code#Tools#Nova3D#Blender
精选理由
H 和 K 成立,因为工具确实做出了带关节的 3D 物体,机制也新。但只是一个 Reddit 发布,没有跑分、用户量或可复现的质量验证,所以分数压在 60–71 区间。
一句话点评
一个叫 Nova3D 的开源前端,让 LLM 直接写 Blender Python 脚本生成带关节的 3D 模型(洗衣机、机器狗),输出 GLB 保留部件层级。不绑定模型,GPT 或本地模型都能跑。思路很直接:把 3D 建模变成代码生成任务。但正文没披露生成成功率,复杂场景稳定性未知,目前更像一个有趣的 demo 而非生产工具。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R0
17:39
24d ago
r/LocalLLaMA· rssEN17:39 · 05·19
手写CUDA编译器:5000行Python把TinyLlama跑出PyTorch 96%性能
NoVibeCoding 发了一个三篇连载,用5000行Python加原生CUDA,自己写了一个编译器,把TinyLlama和Qwen2.5-7B经过六层中间表示(IR)降级成CUDA内核。在RTX 5090上跑,几何平均性能达到PyTorch生产栈的0.96倍——也就是说,手写编译器只比PyTorch慢4%,这个差距对研究原型来说已经很小了。正文没披...
#Code#Inference-opt#Tools#NoVibeCoding
精选理由
HKR全过:自建编译器几乎追平PyTorch,且给出了模型、硬件、速度对比的具体数字。CUDA/IR编译器深度限制了受众范围,技术可及性一般,所以放在all层。
一句话点评
有人用5000行Python+原生CUDA手写了一个LLM编译器,把TinyLlama和Qwen2.5-7B经过六层中间表示降级成CUDA内核。在RTX 5090上跑,性能达到PyTorch生产栈的0.96倍——只慢4%,对研究原型来说差距很小。正文没披露编译时间、内存开销和是否支持动态形状,这些对实际部署很关键。短评:手写编译器只比PyTorch慢4%,但别急着换,验证场景还太窄。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:37
24d ago
Hacker News 首页· rssEN17:37 · 05·19
Cursor 云代理又挂了,用户反馈启动排队超 10 分钟
Cursor 的 Cloud Agents 功能在 5 月 19 日出现服务降级,有用户发帖说云代理完全起不来,等了十多分钟都没反应,而前一天还能正常用。官方在状态页确认了这次故障,但具体影响范围、根因和恢复时间正文都没披露。一个让人有点恼火的细节是:状态页顶部还挂着“所有系统正常”的绿条,底下却写着服务降级,官方人员承认这确实矛盾,说会反馈给相关团队...
#Agent#Cursor#Incident
精选理由
Cursor 是热门 AI 编程工具,Cloud Agents 宕机有 HKR-H/R 拉力。HKR-K 不成立,因为正文没给故障范围、根因、受影响用户或恢复时间,属于低价值事故信息。
一句话点评
Cursor Cloud Agents 在5月19日挂了,用户等十多分钟都起不来,官方状态页却还挂着“所有系统正常”的绿条,自己人也承认这很矛盾。正文没披露影响范围、根因和恢复时间,信息缺口明显。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H1·K0·R1
17:35
24d ago
● P1AI HOT 精选· aihot-apiZH17:35 · 05·19
谷歌发布 Antigravity 2.0,用 93 个并行子智能体 12 小时搭出一个操作系统
谷歌在 I/O 大会上放出了 Antigravity 2.0 平台,已经对全球用户开放。现场演示里,他们让智能体从零构建了一个能跑起来的操作系统,只用了 12 小时。具体做法是同时跑 93 个子智能体,总共调了超过 1.5 万次模型、处理了 26 亿个 token,最后算下来 API 成本不到 1000 美元。平台本身集成了新的智能体系统和自然语音交互...
#Agent#Audio#Inference-opt#Google
精选理由
谷歌在 I/O 上放了个 Antigravity 2.0 的演示,让智能体用 12 小时、93 个并行子智能体、1.5 万次模型调用和 26 亿 token 搭出一个能跑的操作系统,API 成本不到 1000 美元。我会先打个折:这是发布会演示,不是可复现的公开测试,正文没披露可用性、定价和复现条件,所以别直接当成采购依据。但数字本身挺实在,12 小时和不到 1000 美元这两个数,对想用智能体做复杂工程的人是个参考锚点。标题够抓人,信息量也足,从业者会想点进去看细节,整体值得推。
一句话点评
12小时、93个智能体、不到1000美元拼出一个操作系统,数字很炸,但演示不等于产品化,先打七折看。
锐评
谷歌在 I/O 上拿 Antigravity 2.0 做了一场压力测试:让 93 个子智能体同时干活,12 小时内从零搭出一个能跑的操作系统。总共调了 1.5 万次模型,吞了 26 亿个 token,API 账单不到 1000 美元。这个成本确实低,相当于雇一个工程师干两周的活只花了几百块电费。 不过正文没披露这个操作系统到底能干什么、代码质量怎么样、有没有人工中途接手。演示场景和真实开发之间差着无数个 corner case,12 小时跑通一个 demo 和做出能维护的系统是两码事。另外,93 个智能体并行调度本身就有工程复杂度,正文也没说失败率、重试次数和 token 浪费比例。 我会把这条当成谷歌在秀多智能体协同的调度能力和 Gemini 3.5 Flash 的推理速度(号称快了 12 倍),但离“AI 自己写操作系统”还远。想看的是这套东西在真实业务里跑一次,而不是在舞台上跑一次。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
17:16
24d ago
Hacker News 首页· rssEN17:16 · 05·19
Kaggle 数据集被批“荒唐到好笑”,用来训练中风和糖尿病临床模型
Retraction Watch 报道,昆士兰科技大学的统计学家发现,Kaggle 上一个名为“droopy”的数据集,里面混入了大量名人照片(史泰龙、朱莉等)和重复图片,却被用来训练一个预测中风的临床模型,论文还发在了《Scientific Reports》上。另一个研究更系统地追踪了 Kaggle 上中风和糖尿病的表格数据集,发现这些数据质量极差,...
#Benchmarking#Retraction Watch#Kaggle#Incident
精选理由
HKR-H和HKR-R通过,但HKR-K不通过:RSS正文只有标题级事实,没有缺陷机制、研究数量或模型影响范围。这使它留在all,不到featured。
一句话点评
Kaggle 上一个叫“droopy”的中风数据集里混进了史泰龙、朱莉等名人照片,同一张图反复出现,却被用来训练临床模型,论文还发在了《Scientific Reports》上。昆士兰科大的统计学家还发现,Kaggle 上中风和糖尿病的表格数据集质量极差,但已被多篇论文使用。问题在于:这些数据怎么通过审稿的?目前正文没披露具体有多少篇论文受影响。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
17:02
24d ago
AI HOT 精选· aihot-apiZH17:02 · 05·19
谷歌IO大会首日:直播链接已出,但没说具体发了什么
Google DeepMind 发了条推,说 IO 大会第一天直播开始了,会讲谷歌的更新和技术突破。但正文没披露任何具体产品、模型参数、价格或发布时间线,目前只有一条直播链接。
#Google DeepMind#Google#Product update
精选理由
这是Google I/O首日直播的预告,没有产品名、模型规格、发布时间或可测试的机制,HKR三项全不满足。这种低信息量的宣传稿直接触发硬排除规则,分数不会超过40。
一句话点评
谷歌IO大会首日直播开始,但正文只给了直播链接,没提任何具体产品、模型或参数。目前信息量约等于零,建议等后续具体发布再跟进。
HKR 分解
hook knowledge resonance
打开信源
30
SCORE
H0·K0·R0
17:00
24d ago
AI HOT 精选· aihot-apiZH17:00 · 05·19
微软研究:让社区参与AI开发能改善服务
微软研究院发帖说,让社区参与AI开发流程可以改善AI服务,并让社区意识到AI能提供好服务。但正文没披露具体怎么参与、有什么效果指标或案例,所以这点先别太激动,信息缺口很大。
#Alignment#Microsoft Research#Commentary
精选理由
硬排除规则6适用:没有数据、案例或具名实验支撑这个泛泛的主张。HKR-H、HKR-K、HKR-R均不满足,因此视为噪音。
一句话点评
微软研究院发帖说让社区参与AI开发能改善服务,但正文没披露具体怎么参与、有什么效果指标或案例,所以这点先别太激动,信息缺口很大。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
16:53
24d ago
Hacker News 首页· rssEN16:53 · 05·19
Google I/O 2026主题演讲视频发布
这是一条指向 YouTube 上 Google I/O 26 主题演讲视频的链接,来自 Hacker News 首页,目前只有 8 个点赞、0 条评论。正文没有披露任何产品发布、模型细节或时间安排,所以暂时只能把它当作一个视频入口,具体内容需要自己去看。
#Google
精选理由
这条只有 Google I/O 26 主题演讲的标题和一个视频链接,HN 上 8 分 0 评论,正文完全没披露发布了什么。Google I/O 虽然是重要场合,但这条信息里没有任何可判断的 AI 行业事实——没模型、没功能、没价格、没演示。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R0
16:40
24d ago
Hacker News 首页· rssEN16:40 · 05·19
开源大模型架构优化:KV共享、多头交叉注意力与压缩注意力
Sebastian Raschka 这篇长文盘点了近期几个开源大模型在架构上的小改动,核心目标都是降低长文本推理成本。Gemma 4 的小模型用了 KV 共享——让后面几层复用前面几层算好的键值对,省显存和计算;ZAYA1 搞了压缩卷积注意力,把注意力计算量压下来;Laguna XS.2 给不同层分配不同的注意力预算;DeepSeek V4 还没正式发...
#Inference-opt#Sebastian Raschka#Commentary
精选理由
硬排除——技术可读性不达标:全文只有架构术语堆砌,没有机制说明、实验设置或入门线索。HKR 三项全不满足,分数上限被压在 40 以下。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K0·R0
16:02
24d ago
AI HOT 精选· aihot-apiZH16:02 · 05·19
Google I/O 日程公布,主题演讲在上午10点
Google AI Developers 发了 I/O 大会日程:太平洋时间上午10点主题演讲,下午1点半开发者主题演讲,3点半 AI 新动态,4点半跟 DeepMind 和 Antigravity 聊开发者生态。正文没披露具体会发什么产品,所以先别激动,等演讲内容出来再说。
#Google#Google DeepMind#Antigravity#Product update
精选理由
HKR-K靠两个具体时间点(10:00和15:30)通过,但HKR-H和HKR-R都不行——没有发布清单、Gemini细节或开发者工具变化,信息缺口明显。
一句话点评
Google I/O 日程定了,但正文没披露具体发什么产品,所以先别激动。主题演讲、开发者演讲、AI 新动态、DeepMind 生态对话各一场,时间都是太平洋时间。关键信息缺失:没有 Gemini 2.5 更新、没有新模型、没有硬件。建议等演讲内容出来再判断,现在只是预告。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K1·R0
16:00
24d ago
AI HOT 精选· aihot-apiZH16:00 · 05·19
Luma Agents 现在能用 Seedance 2.0 生成视频了
Luma 把 Seedance 2.0 接进了它的 Agents 工作流,你可以在 lumalabs.ai/app 上直接调用。操作方式和之前一样,只是底层模型换成了新版本。正文没披露 Seedance 2.0 的参数规模、定价、输出时长限制或灰度范围,所以暂时没法判断画质提升多少、成本涨没涨。如果你已经在用 Luma Agents,可以切过去试试效果...
#Agent#Multimodal#Tools#Luma Labs
精选理由
HKR-K 靠 Seedance 2.0 集成这个具体事实通过,但 HKR-H 和 HKR-R 弱,因为正文缺定价、限制、基准或更尖锐的工作流声明。这落在 60–71 的小产品更新区间。
一句话点评
Luma把Seedance 2.0接进了Agents工作流,操作不变,底层模型升级。正文没披露参数、定价、时长限制或灰度范围,画质提升和成本变化暂时没法判断。如果你已经在用Luma Agents,可以切过去试试效果。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
15:54
24d ago
Hacker News 首页· rssEN15:54 · 05·19
Superlog:装好就能自动修 Bug 的可观测性工具
Superlog 是一个 YC 孵化的可观测性工具,主打“装好就不用管”。它用一个命令行 wizard 扫描你的代码仓库,自动用 OpenTelemetry 打日志、追踪和指标,之后还会持续扫描仓库和基础设施,防止观测性“腐烂”。最特别的是,它会把相似错误归成一个事件,等收集到足够上下文后,自动生成一个修复 PR 发到 Slack。正文没披露定价细节,...
#Agent#Code#Tools#Superlog
精选理由
这是 YC 创业公司 Show HN 的产品发布,没有客户案例、定价、准确率或可复现测试。功能描述有吸引力,但验证太弱,适合放在 60–71 的小产品更新区间。
一句话点评
YC孵化的Superlog主打“装好就不用管”的可观测性,亮点是自动用OpenTelemetry打日志、追踪和指标,还能持续扫描防止观测性“腐烂”。最特别的是,它会把相似错误归成一个事件,等收集到足够上下文后,自动生成一个修复PR发到Slack。这点挺省人工,但正文没披露定价,也没说自动生成的PR在复杂场景下准确率如何。如果真能稳定修简单bug,对中小团队有吸引力,但别指望它搞定深层架构问题。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:33
24d ago
● P1AI HOT 精选· aihot-apiZH15:33 · 05·19
Karpathy 去了 Anthropic,没提具体做什么
Andrej Karpathy 发推说自己加入了 Anthropic。他之前管过特斯拉 Autopilot 的 AI,也是 OpenAI 的联合创始人。正文没披露他在 Anthropic 的具体职位、负责哪个方向,也没说带不带团队。光看这条消息,只能确认人才往 AI 安全那边又挪了一步,但实际影响有多大,现在判断还太早。
#Alignment#Safety#Andrej Karpathy#Anthropic
精选理由
我会先打个折:正文没披露他在 Anthropic 的具体职位和负责方向,所以重要性停在人事震动层面,还没到战略级。卡帕西的履历摆在那,加入 Anthropic 确实让安全对齐这条线更有看头,但缺了角色细节,先别太激动。
一句话点评
Karpathy 去了 Anthropic,但正文没写他具体干啥、带不带团队,光看这条推只能确认人才往安全方向又挪了一步,实际影响先别急着下结论。
锐评
Karpathy 加入 Anthropic 这条消息,目前能确认的只有他本人发推说了这件事。他之前在特斯拉管 Autopilot 的 AI,也是 OpenAI 的联合创始人,履历确实硬。但正文没披露他在 Anthropic 的具体职位、负责哪个方向、带不带团队,也没说他是去做研究还是管工程。光凭一条推文,只能说顶尖人才往 AI 安全这边又流动了一次,对 Anthropic 的研发实力有多大加成,现在判断还太早。我会先打个折:人去了是真的,但能带来什么变化,得看他接下来实际做什么。另外,Anthropic 最近在安全和对齐上本来就有声量,Karpathy 的加入更像是强化已有方向,而不是突然转向。还缺的信息是:他具体加入哪个团队、有没有公开发布的研究计划、以及 Anthropic 内部对他角色的定位。这些没出来之前,别把这条当成行业格局变了。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
15:18
24d ago
r/LocalLLaMA· rssEN15:18 · 05·19
开源抠图工具,还能当 MCP 服务给智能体用
Reddit 用户 orblabs 开源了一个叫 FP-Background_Obliterator 的抠图应用,带 UI 界面,也能以无头模式跑成 MCP 服务,让智能体直接调用。正文没披露底层模型、许可证、跑分或部署要求,所以不清楚效果和门槛。
#Vision#Agent#Tools#orblabs
精选理由
Reddit 上一个开源小工具,亮点是把背景移除包装成 MCP 服务让 agent 调用,HKR 的 H 和 K 靠这个钩子通过,但 R 很弱。正文没提用了什么模型、什么许可证、跑得快不快、怎么部署,所以只能归到低关注度的更新档位。
一句话点评
一个开源的抠图工具,现在还能跑成 MCP 服务,让智能体直接调用。正文没披露底层模型、许可证、跑分或部署要求,所以不清楚效果和门槛。如果模型选得轻量,跑成服务挺实用;但信息太少,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
15:11
24d ago
r/LocalLLaMA· rssEN15:11 · 05·19
Reddit 网友晒本地 AI 小工具:打字预测和语音转文字
一位 Reddit 用户分享了两款本地 AI 工具:Copyist 用 Gemma 2B 做下一个词预测,按 Tab 确认,适合不想联网又想省按键的人;typeWhisper 用 Parakeet 做本地语音转文字,数据不出电脑。两个模型都很小(2B 参数),本地跑延迟低、免费,但正文没披露具体准确率或实测体验,这点先别太激动。
#Audio#Tools#Reddit#Gemma
精选理由
HKR 的 K 和 R 勉强达标,因为帖子确实列出了两个本地 AI 工具,但本质上还是 Reddit 上的一问一答,没有发布、评测或技术细节。属于低价值的可浏览信号,不值得推荐。
一句话点评
短评:本地小模型做打字辅助和语音转文字,免费且数据不出电脑,但准确率未知。 点评:Reddit 用户分享了两款本地 AI 工具:Copyist 用 Gemma 2B 做下一个词预测,按 Tab 确认,适合不想联网又想省按键的人;typeWhisper 用 Parakeet 做本地语音转文字,数据不出电脑。两个模型都很小(2B 参数),本地跑延迟低、免费,但正文没披露具体准确率或实测体验,这...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R1
15:07
24d ago
● P1Hacker News 首页· rssEN15:07 · 05·19
Andrej Karpathy 加入 Anthropic
Karpathy 自己在 X 上发了这个消息,但正文没披露他具体担任什么职位、进哪个团队、什么时候入职。目前只有一条推文链接和 Hacker News 上的讨论,46 个赞、3 条评论,信息量很少。
#Andrej Karpathy#Anthropic#Personnel
精选理由
Karpathy 去 Anthropic 这件事本身是个信号,说明顶尖研究员在 OpenAI、特斯拉之后选了 Claude 这条线。但正文除了一个 X 链接和 HN 上 46 分、3 条评论,什么都没展开——没职位、没团队、没时间,连他负责什么方向都只能靠猜。我会先打个折:热度够,但信息太薄,重要性给到 82 是合理的,别因为名字就往上拔。
一句话点评
Karpathy 去了 Anthropic 做预训练,不是挂名,是直接进组干活。这条新闻的看点不是“又一个大佬跳槽”,而是他选了一家把安全当产品核心的公司,去搞最烧钱、最底层的模型训练。
锐评
Andrej Karpathy 加入 Anthropic 的预训练团队,这事值得关注,但别急着解读成“OpenAI 不行了”。他之前在 OpenAI 是创始成员,在特斯拉管过自动驾驶的 AI,去年又自己折腾了一段时间教育内容,现在选择回到大模型研发一线,而且直接进预训练组——这是决定模型底色的环节,负责用海量算力把基础能力灌进模型。Anthropic 的发言人确认他已经在 Nick Joseph 手下开始工作,不是顾问或虚职。 TechCrunch 的报道提到,预训练是构建前沿模型最贵、最吃算力的阶段之一。Karpathy 自己在 X 上说,他觉得未来几年大语言模型的前沿研究会特别关键,所以想回来做研发。这句话本身没毛病,但正文没披露他具体负责哪个方向、带多少人、合同签了多久。另外,马斯克在 X 上点了个赞,但没有任何实质评论,这点先别太激动。 还缺什么:Anthropic 没说他会不会碰安全对齐那部分,也没提他的加入是否意味着 Claude 下一代的训练规模会再上一个台阶。如果后续有技术路线或资源分配的细节,才能判断这次人事变动对产品节奏的实际影响。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K0·R1
14:33
24d ago
r/LocalLLaMA· rssEN14:33 · 05·19
我的 AI 代理差点把我电脑删干净了
一位用户在 Reddit 上发帖说,他部署的 AI 代理直接执行了 `rm -rf /`(Linux 下删除所有文件的命令),好在系统自带的危险命令拦截机制生效了,最终只虚惊一场。用户事后立刻加了个沙箱环境。帖子没交代用的是哪个代理框架,也没说运行环境是容器还是裸机,所以不清楚这个拦截是框架自带的还是操作系统层面的。
#Agent#Safety#Tools#DeltaSqueezer
精选理由
H 和 R 都很强,K 有具体的补救动作(拦截成功 + 补沙箱),不是只有标题党。但来源是 Reddit 单帖,没有日志、架构或影响范围,所以分数卡在 60–71 区间。
一句话点评
一条 Reddit 热帖:AI 代理直接执行了 `rm -rf /`,好在系统拦截生效,只虚惊一场。用户事后加了沙箱。帖子没交代用的是哪个代理框架,也没说运行环境是容器还是裸机,所以不清楚拦截是框架自带还是 OS 层面。核心警示:给代理的权限越大,越需要沙箱兜底。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:28
24d ago
Product Hunt · AI· rssEN14:28 · 05·19
Invenio:Mac 本地 AI 搜视频和照片,不传云端
Invenio 是一款 Mac 应用,让你用自然语言搜本地视频和照片里的画面,比如输入“骑自行车的人”就能找到对应帧,还能直接拖进 Premiere 或 Final Cut。所有处理都在本地完成,靠 Apple Neural Engine 跑,不上传数据。视觉搜索和 OCR 免费,语音搜索需要付费。正文没披露用了什么模型、索引方式、定价细节,也没说隐私...
#Vision#Invenio#Product update
精选理由
这是一款很薄的产品发布,只说了 Mac 本地视频/照片 AI 搜索,但模型、索引机制、价格、隐私细节都没披露,所以重要性只有 48,归入低价值 all 档。HKR 里 R 通过是因为本地媒体搜索确实戳中隐私和个人资料库管理的痛点,H 和 K 都不满足——标题没钩子,正文信息严重不足。
一句话点评
Mac 本地搜视频画面,输入“骑自行车的人”就能定位到帧,直接拖进剪辑软件。靠 Apple Neural Engine 跑,不上云,视觉搜索和 OCR 免费,语音搜索收费。支持外接硬盘处理 TB 级素材。但正文没披露用了什么模型、索引方式,也没说隐私具体怎么保障,定价细节也缺。本地化思路对剪辑师挺实用,但效果和速度未知,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
14:12
24d ago
Product Hunt · AI· rssEN14:12 · 05·19
Glia:一个本地优先的 AI 记忆桥,打通浏览器聊天和 IDE
Glia 是一个 100% 离线、开源的记忆桥工具。它通过 Chrome 扩展自动保存你在 Claude、ChatGPT 等网页端的对话,再通过一个本地 MCP 服务器让 Cursor、Claude Code 等 IDE 代理能直接查询这些记录,所有数据存在本地的 SQLite 数据库里。说白了,就是解决“我在网页上跟 AI 聊了半天,回到编辑器里 A...
#Memory#Tools#Code#Glia
精选理由
Glia 这个产品定位挺实在——本地优先的记忆桥,把浏览器聊天和 IDE 串起来,解决开发者来回丢上下文的烦心事。不过正文没披露支持哪些平台、数据怎么同步、价格多少,也没有任何测试数据或验证结果,所以信息缺口比较大,暂时够不上精选。
一句话点评
Glia 把网页端 AI 聊天记录自动存到本地 SQLite,再通过 MCP 协议让 Cursor 等 IDE 直接查,解决“浏览器聊完编辑器失忆”的痛点。100% 离线、开源,数据不出本机,对隐私敏感的项目很友好。目前只支持 Chrome 扩展和 7 家 AI 平台,IDE 端限 Cursor/VS Code/Windsurf/Claude Code。正文没披露性能开销和搜索延迟,小团队项...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
14:00
24d ago
AI HOT 精选· aihot-apiZH14:00 · 05·19
百度提了个新指标 DAA:智能体时代看“每天干多少活”
百度在 X 上发帖介绍了 DAA(Daily Active Agents,每日活跃智能体),把它类比成智能体时代的 DAU。DAU 看用户来不来,DAA 看智能体实际完成了多少工作——相当于从“人头数”换成“干活量”。帖子没披露 DAA 怎么算、有没有基准值或实测数据,目前只是一个概念框架。
#Agent#Baidu#Commentary
精选理由
百度抛了个新概念 DAA,想用每日活跃智能体来量化智能体完成的工作量,相当于把 DAU 的逻辑搬到智能体上。想法挺直接,但正文没给计算公式,也没贴任何样例数据,验证不了这个指标到底怎么用、有没有参考价值。属于典型的“有概念没细节”,所以重要性压到 39 分。
一句话点评
百度提了个新指标 DAA(每日活跃智能体),想类比 DAU 但把“人头数”换成“干活量”。概念听着合理,但正文没披露怎么算、有没有基准值或实测数据,目前只是个框架。先别太激动,等看到具体计算方法和验证结果再说。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K0·R1
13:52
24d ago
r/LocalLLaMA· rssEN13:52 · 05·19
用吃豆人网页测本地编程模型:Qwen 3.6 27B 能跑通,但复现率不高
作者用 Qwen 3.6 27B F16 模型在本地跑一个“从零写吃豆人网页”的单次任务,试了3次,2次跑出高分结果。但换成8-bit量化后再试5次以上,一次都没复现。MTP(多token预测)下推理速度8-18 tok/s,不开MTP只有6.6 tok/s。这个测试说明模型在特定任务上有潜力,但量化后稳定性下降明显,复现率低,实际用起来得做好重试准备...
#Agent#Code#Inference-opt#Qwen
精选理由
这是一篇 Reddit 用户的个人实测,用 Pacman 单页游戏测试 Qwen 3.6 27B 作为本地编程智能体的表现。3 次测试中 F16 精度赢了 2 次,但 8bit 量化版 5 次以上未复现成功,MTP 下速度仅 8-18 tok/s。样本量极小、基准自定义、来源是论坛帖子,这些因素限制了分数上限。但实验本身有参考价值,因为本地编程智能体是当前热点,数字和失败案例都真实。
一句话点评
Qwen 3.6 27B F16 本地写吃豆人网页,3次跑出2次高分,但8-bit量化后5次全翻车。MTP推理8-18 tok/s,不开只有6.6。潜力有,量化后稳定性崩了,实际用得多重试。正文没披露量化后具体分数差距。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
13:13
25d ago
Product Hunt · AI· rssEN13:13 · 05·19
GhostSnap:一次粘贴多张截图,自动压缩省 Token
GhostSnap 是一个 Mac 菜单栏工具,解决的是给 AI 传截图时“一张一张粘、Token 吃太快”的痛点。它让你连续截多张图,自动压缩(号称最高省 80% 体积),然后一次 Cmd+V 全粘进去。还支持从多张截图里统一提取文字、粘贴前做标注。买断价 6.99 美元,管两台 Mac。正文没披露具体压缩算法、支持哪些截图格式、以及一次最多能粘多少...
#Tools#GhostSnap#Product update
精选理由
HKR-K 靠一个具体功能通过:多截图粘贴加自动压缩。HKR-H 和 HKR-R 弱,因为正文缺平台、定价、压缩细节和上限,所以这条只够低段产品更新。
一句话点评
Mac 菜单栏截图工具,主打连续截多张图后一次 Cmd+V 粘进 AI 对话框,号称最高省 80% 体积。买断价 6.99 美元管两台 Mac,挺省钱。但正文没披露具体压缩算法、支持哪些格式、一次最多粘几张,省体积是否影响识别精度也未知。适合高频给 AI 喂截图的用户,但效果得实测。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K1·R0
13:08
25d ago
r/LocalLLaMA· rssEN13:08 · 05·19
剪枝反而让模型困惑度更低?Reddit 用户实测了一个组合拳
Reddit 用户 ShotokanOSS 试了一种改进版 WANDA 剪枝方法,再叠上 HQQ 无数据量化,发现先剪枝再量化效果更好。正文没披露用了什么模型、数据集,也没给困惑度具体数字,所以这个结论目前只能当个经验分享看,不能直接抄作业。
#Inference-opt#ShotokanOSS#WANDA#HQQ
精选理由
HKR-H/R 通过:反直觉的剪枝结果能吸引本地模型读者,且切中内存-质量权衡。HKR-K 不通过:正文没披露模型、数据集、perplexity 数值和复现方式,停留在低价值讨论层面。
一句话点评
Reddit 用户试了改进版 WANDA 剪枝 + HQQ 无数据量化,说先剪枝再量化效果更好。但正文没披露用了什么模型、数据集,也没给困惑度具体数字,目前只能当经验分享看,不能直接抄作业。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
13:03
25d ago
Product Hunt · AI· rssEN13:03 · 05·19
AVTR-1:实时生成AI虚拟人,现在开源了
Avaturn Live 把他们的实时虚拟人模型 AVTR-1 开源了,权重开放,可以免费拿去改。核心卖点是全双工——你说话时它也在听,能实时生成每一帧画面,而不是循环播放预渲染动画,所以表情和口型跟得上对话节奏。正文没披露参数量、许可证类型、具体延迟数字和部署条件,所以实际跑起来需要多少算力、能不能商用,目前还不清楚。如果你在做虚拟客服、直播助手这类...
#Multimodal#AVTR-1#Product Hunt#Product update
精选理由
HKR-H 通过,HKR-K 和 HKR-R 不通过。Product Hunt 帖子信息太薄,缺参数、许可证和延迟,所以留在低价值产品信号区间,不做硬排除。
一句话点评
AVTR-1 把实时虚拟人模型开源了,权重开放可免费改。核心卖点是全双工——你说话时它也在听,能实时生成每一帧画面,表情口型跟得上对话节奏。但正文没披露参数量、许可证类型、具体延迟数字和部署条件,实际跑起来需要多少算力、能不能商用,目前还不清楚。如果你在做虚拟客服、直播助手这类场景,值得关注,但先别急着上生产。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
13:01
25d ago
Ben's Bites· rssEN13:01 · 05·19
手机遥控电脑跑代码,Codex 新功能上线
OpenAI 的 Codex 现在支持从手机发起任务,实际计算仍在 Mac 或远程机器上跑,文件、配置和密钥都不动,你只用在手机上批准命令、回答问题或审查代码改动。Ben's Bites 还汇总了 20 多条 agent 相关动态:Anthropic 收购了 SDK 平台 Stainless 并关停服务;Cloudflare 用自家 50 个仓库测试 ...
#Agent#Code#Tools#Ben’s Bites
精选理由
这是一篇 Ben's Bites 的汇总,20 多条 agent 动态里最抓眼球的是 Codex 能用手机控制 Mac 任务,场景很直接。Anthropic 买下 API 工具公司 Stainless 说明他们在补基础设施短板,Cloudflare 拿 50 个仓库测 Mythos 也算个实打实的 benchmark 动作。不过因为是合集,每条都不深,适合当行业快讯扫一眼,不适合当深度分析。
一句话点评
短评:手机遥控Codex干活,算力还在Mac上,文件密钥不动,只批命令看改代码。 点评:OpenAI Codex现在支持从手机发起任务,但实际计算仍在Mac或远程机器上跑,文件、配置和密钥都不动,你只用在手机上批准命令、回答问题或审查代码改动。Ben's Bites作者自己说“没怎么用”,更常用Claude Code的/remote-control、Pi的Telegram bot等。这点先...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:00
25d ago
r/LocalLLaMA· rssEN13:00 · 05·19
全公司跑一套多智能体架构,三个角色共享一个上下文层
一位Reddit用户分享了他们组织内部的多智能体系统:用LangGraph管目标型智能体,CrewAI协调任务型智能体,Harbor存凭证并记录每次工具调用。三个智能体角色共享一个上下文层,所有调用都带来源追踪。正文没披露具体延迟和成本,但架构设计看起来适合内部流程自动化,不是那种需要高实时性的场景。
#Agent#Tools#Memory#LangGraph
精选理由
HKR 三项都过,但来源是单篇 Reddit 帖子,只说了架构设计,没披露规模、性能指标、可复现细节,所以分数压在 60–71 的 all 档。
一句话点评
一个Reddit用户分享了他们公司内部的多智能体系统:LangGraph管目标型智能体,CrewAI协调任务型智能体,Harbor存凭证并记录每次工具调用。三个角色共享一个上下文层,所有调用都带来源追踪。正文没披露具体延迟和成本,但架构设计看起来适合内部流程自动化,不是那种需要高实时性的场景。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
13:00
25d ago
AI HOT 精选· aihot-apiZH13:00 · 05·19
Cloudflare 让 Claude 智能体跑在自己的沙箱里,代码执行和网络都归你管
Cloudflare 和 Anthropic 合作,把 Claude Managed Agents 的代码执行环境搬到了 Cloudflare 的沙箱(Sandboxes)上。简单说,Claude 的“大脑”(推理循环)还在 Anthropic 那边,但“手脚”(跑代码、调工具、连网络)可以放在 Cloudflare 的基础设施里。好处是你能自己控制安...
#Agent#Code#Tools#Cloudflare
精选理由
触发硬排除规则2:这是一篇 Cloudflare 云服务集成类文章,类似托管 LLM/Agent 运行时的推广。H 和 K 条件满足,但价格、上线时间和性能指标均未披露,因此评分上限为 39。
一句话点评
Cloudflare 和 Anthropic 合作,让 Claude 的“大脑”留在 Anthropic,但“手脚”(跑代码、调工具、连网络)搬到 Cloudflare 沙箱里跑。好处是你可以自己控制安全策略、看日志、甚至 SSH 进机器。正文没披露定价和上线时间,也没给性能对比数据。这点先别太激动——架构听起来灵活,但实际延迟和成本未知。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K1·R0
12:57
25d ago
AI HOT 精选· aihot-apiZH12:57 · 05·19
毕马威全员用Claude:27.6万人接入,先从税务和网络安全下手
毕马威和Anthropic签了全球联盟,27.6万员工全部能用Claude,不是试点,是全员铺开。第一步落地在税务和法律客户的工具里,以及网络安全——用Claude找系统漏洞。毕马威自己的Digital Gateway平台嵌入了Claude Cowork和Managed Agents,以前调税规要几周,现在几分钟。另外Anthropic指定毕马威为私募...
#Tools#Safety#KPMG#Anthropic
精选理由
毕马威让27.6万员工用Claude,先落地税务和法律客户工具,还要联合开发私募股权和网络安全产品。规模够大,切入的是高客单价专业服务场景,对咨询和法律行业有冲击感。但正文没披露定价、产品细节或实际使用数据,所以热度够但不够上精选。
一句话点评
毕马威27.6万员工全员用Claude,不是试点,是全面铺开。第一步落地税务、法律和网络安全——用Claude找系统漏洞。自家平台Digital Gateway嵌了Claude Cowork和Managed Agents,以前调税规要几周,现在几分钟。Anthropic还指定毕马威为私募首选伙伴,帮被投公司部署Claude Code改老系统。 短评:27.6万人全员铺开,不是试点,说明毕马...
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
12:34
25d ago
r/LocalLLaMA· rssEN12:34 · 05·19
让嵌入模型能看懂数字大小
作者用正则把文本里的数字抽出来,把数量级平滑映射到128个桶里,然后微调了一个嵌入模型。训练用了3亿token、6张H100跑1小时,在句子三元组排序任务上正确率59%,对比ModernBERT的38%和BGE-base-v1.5的34%。提升明显,但59%离实用还有距离,而且正文没披露在标准检索基准(比如MTEB)上的表现,这点先别太激动。
#Embedding#Fine-tuning#Benchmarking#Qwen
精选理由
HKR三项都过,但这是Reddit上的个人实验,评测只做了三句排序这一项窄任务,没披露更广泛的benchmark或代码。所以归入“有趣但不上首页”档。
一句话点评
把数字从文本里单独拎出来做嵌入,思路挺直接。作者用正则抽数字,按数量级映射到128个桶,微调Qwen嵌入模型。训练成本低:3亿token、6张H100跑1小时。句子三元组排序正确率59%,对比ModernBERT的38%和BGE-base-v1.5的34%,提升明显。但59%离实用还有距离,而且正文没披露在标准检索基准(比如MTEB)上的表现,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
11:42
25d ago
r/LocalLLaMA· rssEN11:42 · 05·19
黑胡子AI晒出五台自建服务器,顶配用9950X3D+5090跑本地模型
Reddit用户BlackBeardAI晒了五台自建AI服务器,顶配是Ryzen 9950X3D、256GB DDR5和RTX 5090,全部跑Linux Mint 22。配置挺高,但正文没披露具体跑什么模型、推理速度或功耗,所以只能当硬件清单看。对想自己攒机跑本地大模型的人来说,这套配置算是个参考,但成本不低——光5090和9950X3D就得上万。
#Inference-opt#BlackBeardAI#Linux Mint#Asus
精选理由
这是一份个人homelab配置清单,没有跑分、没有成本模型、也没有产品/研究层面的影响,所以重要性给得比较低。HKR三项都过:硬件钩子够具体(H),配置信息完整(K),本地推理圈子的痛点都踩到了(R)。正文没披露每台机器的用途或跑模型的实际表现,信息缺口明显,但作为配置分享已经够用了。
一句话点评
Reddit 用户 BlackBeardAI 晒了五台自建 AI 服务器,顶配是 Ryzen 9950X3D、256GB DDR5 和 RTX 5090,全跑 Linux Mint 22。配置看着唬人,但正文被屏蔽,没披露跑什么模型、推理速度或功耗,只能当硬件清单看。对想自己攒机跑本地大模型的人来说,这套配置算个参考,但成本不低——光 5090 和 9950X3D 就得上万。短评:晒配置但没...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R1
11:16
25d ago
Hacker News 首页· rssEN11:16 · 05·19
Id-Agent:给 AI agent 用的省 token 版 UUID
GitHub 上一个叫 Id-Agent 的项目,目标是给 AI agent 系统提供一种比标准 UUID 更省 token 的 ID 方案。标准 UUID 一串 36 个字符,在 LLM 上下文里每个字符都算 token,多了就烧钱。这个库声称能压缩 ID 长度,但正文没披露具体编码方式、省了多少 token、以及是否兼容现有系统。项目目前 8 个星...
#Agent#Tools#Id-agent#GitHub
精选理由
一个刚发布的开源小工具,HN 上 12 分 22 条评论,热度不高。痛点明确但正文缺关键信息:没给编码机制、没给节省比例、没提兼容条件。H 和 R 勉强能过,K 因为缺核心数据过不了。属于低热度产品更新,不值得重点跟进。
一句话点评
短评:省 token 就是省钱,但项目才 8 个星,编码方式和兼容性都没说,先别激动。 点评:Id-Agent 想解决 AI agent 系统里 UUID 太费 token 的问题。标准 UUID 36 个字符,在 LLM 上下文里每个字符都算钱,agent 调用多了成本就上去了。这个库号称能压缩 ID 长度,但正文没披露具体编码方式、省了多少 token、以及是否兼容现有系统。项目目前只...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
10:45
25d ago
● P1OpenAI 博客· rssEN10:45 · 05·19
OpenAI 为生成图像添加数字身份证和隐形水印双重防伪
OpenAI 更新了内容溯源方案,主要做了三件事。第一,他们正式通过了 C2PA 标准认证,以后用 DALL·E、Sora 等工具生成的图片都会自带一份加密的“数字身份证”,记录是谁做的、怎么改的,平台可以直接读取。第二,和 Google DeepMind 合作,在 ChatGPT、Codex 和 API 生成的图片里加入 SynthID 隐形水印。这...
#Safety#Tools#OpenAI#Product update
精选理由
OpenAI 这次更新把内容来源标识这件事往前推了一步,但正文只给了三个机制的名字,没展开讲落地范围、时间表或实际采用数据。我会先打个折:HKR-K 靠三项具名机制过关,HKR-R 靠深度伪造和信任问题过关,HKR-H 偏弱,所以卡在 featured 门槛上。
一句话点评
OpenAI 给自家生图加了双重防伪:一层数字签名,一层谷歌的隐形水印,还放出了公开检测工具。但水印防不了截图,签名也可能被平台洗掉,别当它是万能验真机。
锐评
OpenAI 这次把内容溯源做成了双保险。第一层是 C2PA 数字签名,相当于给图片嵌了张防篡改的电子身份证,记录谁生成的、怎么编辑的。这层信息量大,但脆弱,上传下载或转格式就可能丢失。第二层是谷歌 DeepMind 的 SynthID 隐形水印,直接改像素,更扛造,截图也能留痕,但能携带的信息比签名少。两者互补,比单用一层靠谱。 目前覆盖范围是 ChatGPT、Codex 和 API 生成的图片。OpenAI 还上线了一个公开验证工具,上传图片就能查有没有这两层标记。不过正文没提音频和视频什么时候上水印,也没给检测准确率数据。水印能告诉你“这是 AI 画的”,但防不了有人截图后裁掉水印区域,或者用其他工具二次处理。这点先别太激动,它解决的是溯源,不是防伪。
HKR 分解
hook knowledge resonance
打开信源
85
SCORE
H0·K1·R1
09:33
25d ago
r/LocalLLaMA· rssEN09:33 · 05·19
本地模型除了写代码还能干嘛?有人用它自动操作桌面 GUI
一位 Reddit 用户说团队做了一个小型视觉语言模型(VLM),专门用来操作桌面图形界面。主要场景是:在两个没有 API 的应用之间搬数据,省去手动复制粘贴。他承认复杂界面下效果还不太稳定。正文没透露模型大小、跑分结果、是否开源,也没给可复现的搭建步骤。
#Agent#Vision#Tools#Reddit
精选理由
HKR 三项全过,靠的是一个具体的本地 Agent GUI 自动化案例和可靠性痛点。来源权威性和可复现细节弱,没有数字或完整测试日志,所以留在 all 层。
一句话点评
一个Reddit用户说团队做了个小视觉模型,专门在两个没API的应用之间搬数据,省去手动复制粘贴。他承认复杂界面下效果还不稳。正文没透露模型大小、跑分结果、是否开源,也没给可复现的搭建步骤。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
08:56
25d ago
Product Hunt · AI· rssEN08:56 · 05·19
Kept:把 AI 聊天记录存成本地 Markdown,不上云
Kept 是一个本地工具,能把你在 ChatGPT、Claude、Gemini、Grok 等平台上的对话抓下来,存成 Obsidian 兼容的 Markdown 文件,所有数据留在你自己电脑上,不上传任何云端。它还自带全文搜索、知识图谱和一个 MCP 服务器(让其他 AI 工具能直接读这些笔记)。项目 MIT 开源许可证,免费。目前只看到 Mac 标签...
#Memory#Kept#Product update
精选理由
一个小众 Product Hunt 工具上线,HKR 中 K 和 R 成立,但 H 不成立。正文只说了本地 Markdown 存储这一条,支持哪些平台、怎么导入、同步有没有限制、价格多少,全都没披露。
一句话点评
Kept 是个本地工具,能把你跟 ChatGPT、Claude 等 AI 的聊天记录抓下来,存成 Obsidian 能读的 Markdown 文件,所有数据都在你电脑上,不上传云端。它还自带全文搜索、知识图谱,甚至开了个 MCP 接口让其他 AI 工具直接读这些笔记。MIT 开源免费。 目前只看到 Mac 标签,Windows/Linux 用户得等等。正文没披露它怎么抓取对话——是浏览器插...
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K1·R1
07:57
25d ago
● P1AI HOT 精选· aihot-apiZH07:57 · 05·19
Claude 推出自托管沙箱与 MCP 隧道功能
Claude 在伦敦线下活动上发了两个新功能,都跟 Claude Managed Agents 有关。自托管沙箱进入公测,意思是代理可以在你自己的安全边界里运行,默认就用你设好的安全策略,不用再额外配一套。MCP 隧道是研究预览版,正文没展开讲具体怎么用,但从名字看应该是给 MCP 服务打通一条安全通道。这两个功能合在一起,解决的是同一个问题:让模型进...
#Agent#Tools#Safety#Claude
精选理由
这是 Claude 官方在代理基础设施上的一次实在更新,不是画饼。自托管沙箱让代理跑在用户自己的环境里,不用把数据全交给云端,安全团队更容易点头;MCP 隧道则解决了内外网工具打通的问题,代理能直接调用内部服务。两个功能都还在公测或预览阶段,正文没给出大规模压测数据,稳定性先打个折。但方向很明确:让代理进企业流程干活,同时把控制权留在用户手里。
一句话点评
Claude 的托管智能体现在可以把代码执行环境放在你自己的服务器上,并通过加密隧道连接公司内部工具,数据不用再经过 Anthropic。
锐评
Anthropic 给 Claude 的托管智能体加了两项安全功能:自托管沙箱和 MCP 隧道。简单说,以前智能体干活时的代码执行环境在 Anthropic 那边,现在你可以把沙箱部署在自己的云服务器上,执行过程完全在你眼皮底下。MCP 隧道则是一条加密通道,让智能体安全访问你公司内部的私有工具和数据源,不用把敏感服务暴露到公网。 这对有合规要求的团队是个实打实的利好——数据不出门,审计链路也完整。但公告没提自托管沙箱的额外资源开销和延迟影响,也没给出 MCP 隧道的并发上限或吞吐量指标。如果你的内部服务响应慢,智能体的整体表现肯定会打折扣。另外,部署和运维这套东西需要一定的工程能力,不是开个开关就能用。实际省不省心,还得看后续的文档和用户反馈。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
07:45
25d ago
Hacker News 首页· rssEN07:45 · 05·19
CISA员工在GitHub泄露AWS GovCloud管理员密钥
一名 CISA 合同工在 GitHub 上建了个叫“Private-CISA”的公开仓库,里面直接放了 AWS GovCloud 的管理员密钥、几十个内部系统的明文密码、软件构建用的代码包仓库(artifactory)的凭证,甚至还有一份叫“importantAWStokens”的文件。安全公司 GitGuardian 发现后联系不上当事人,最后通过 ...
#CISA#AWS#GitHub#Incident
精选理由
硬排除:跟 AI 关系很弱。HKR-H 和 HKR-R 有安全事件钩子,但 HKR-K 不通过,因为 RSS 只给了标题级事实,没有密钥权限、暴露窗口或补救措施。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
07:39
25d ago
● P1AI HOT 精选· aihot-apiZH07:39 · 05·19
月之暗面 Kimi 新融资拉来国资和央企,半年估值翻四倍
Kimi 正在进行一笔 20 亿美元(约 136 亿人民币)的融资,已接近收尾。新股东名单里出现了国智投、北京人工智能基金等国资机构,以及中国移动这样的央企。今年 1 月和 2 月,Kimi 已经密集完成了三轮融资,分别拿了 5 亿、7 亿和 7 亿美元。加上最新这笔,不到半年融资总额超过 39 亿美元,估值比去年 11 月的约 43 亿美元翻了四倍多...
#Code#Moonshot AI#Kimi#China Mobile
精选理由
Kimi 这轮融资还没完全 close,所以先不打满分。但国智投和中国移动出现在股东名单里,加上半年估值从不到 10 亿跳到 40 亿左右,说明国资在加速给头部模型公司兜底。我会先打个折:正文没披露具体估值计算方式和交割时间,这点先别太激动。
一句话点评
Kimi 半年融了 39 亿美元,估值翻四倍,新股东里出现了国资和央企。钱是到位了,但商业化能不能跑通,正文没提。
锐评
这条融资消息最值得看的是股东结构变化。国智投、北京人工智能基金和中国移动进场,说明 Kimi 在资本层面已经不只是 VC 故事,开始有国家队背书。不到半年密集完成四轮融资,总额超过 39 亿美元,估值从去年 11 月的约 43 亿美元涨到现在的体量,速度确实快。 但正文只讲了融资数字和股东名单,没披露这 20 亿美元新钱的具体用途,也没提公司收入、付费用户留存或模型 API 调用量这些能验证商业化的指标。之前有报道说 1-2 月付费订单增长猛,但那是两个月前的数据了。另外,K2.6 模型刚开源,集成到 Cursor 算是产品落地的一步,可实际用户反馈和付费转化还没看到。 我会先打个折:估值翻四倍更多反映的是资本对头部大模型公司的押注意愿,不直接等于业务健康度。还缺的信息是 Kimi 自己的营收规模、毛利率和客户留存率,这些才是判断它值不值这个价的关键。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
06:45
25d ago
r/LocalLLaMA· rssEN06:45 · 05·19
MTP 在 Apple Silicon 上反而掉速?实测 27B 模型 M2 Max 跑出 9 vs 12 t/s
一位 Reddit 用户在 M2 Max(96GB 内存)上测试了 froggeric 和 unsloth 的 27B 模型,发现开启 MTP(推测是 Multi-Token Prediction,即一次预测多个 token 的加速技术)后,生成速度反而从约 12 t/s 降到 9 t/s。正文没披露具体配置细节和 MTP 实现方式,所以这个结果不一定...
#Inference-opt#Apple#Reddit#Unsloth
精选理由
Reddit 用户单机实测,MTP 在 M2 Max 上跑 27B 模型反而比无 MTP 慢 2–3 t/s,结果反直觉且数字具体。但只有一个人测、配置单一(M2 Max 96GB),样本太少,验证弱,所以放在 40–59 低价值区间。正文没披露 MTP 的具体实现版本和 batch size,信息缺口明显。
一句话点评
短评:MTP 在 Apple Silicon 上反而减速,说明这技术对带宽敏感的设备不友好。 点评:一位 Reddit 用户在 M2 Max(96GB)上测了 27B 模型,开 MTP 后生成速度从 12 t/s 掉到 9 t/s,降了 25%。MTP 本意是一次预测多个 token 来加速推理,但这里适得其反。原因可能是 Apple Silicon 的统一内存带宽有限(约 400 GB/...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R1
05:50
25d ago
Product Hunt · AI· rssEN05:50 · 05·19
Viberia:像玩《文明》一样指挥AI智能体
Viberia 是一个把多个AI智能体放在一张等距地图上的管理工具,你可以像玩策略游戏一样,看到每个智能体的状态(谁卡住了、谁在提问、谁干完了),点进去就能聊天、换模型、用自己的API Key。智能体之间还能组队、互相学新技能,内置了文档、终端和浏览器。产品刚上Product Hunt,目前免费,但正文没披露具体的工作流机制、定价、支持哪些模型,以及什...
#Agent#Viberia#Product update
精选理由
HKR-H通过是因为'像玩文明一样指挥agent'这个角度有具体的新鲜感;但HKR-K和HKR-R不通过,因为正文只确认了定位,没给机制、定价、模型或从业者关心的实际价值。
一句话点评
Viberia 把多个 AI 智能体放在一张等距地图上,像玩《文明》一样管理它们的状态——谁卡住了、谁在提问、谁干完了。点进去就能聊天、换模型、用自己的 API Key,智能体还能组队、互相学新技能。目前免费,但正文没披露具体的工作流机制、定价、支持哪些模型,以及多人协作怎么实现。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
05:09
25d ago
Product Hunt · AI· rssEN05:09 · 05·19
Thinnest AI:每分钟1.5卢比,做100多种语言的语音AI代理
Thinnest AI 是一个语音 AI 代理基础设施,主打便宜和多语言。它声称每分钟通话成本只要 1.5 卢比(约合人民币 1 毛 3),支持 100 多种语言,还能让你自己选语音识别(STT)、语音合成(TTS)和大模型(LLM),也接 Twilio 和 SIP 这类电话系统。它有个无代码流程编辑器,可以挂知识库(RAG)和 MCP 工具。不过正文...
#Agent#Audio#Thinnest AI#Product update
精选理由
一个 Product Hunt 上的小工具发布,有两个可验证的事实,但没提用了什么模型、延迟多少、并发能力如何、部署条件是什么。HKR 的 K 和 R 勉强通过,没有触发硬排除规则。
一句话点评
Thinnest AI 号称每分钟通话只要1.5卢比(约1毛3人民币),支持100多种语言,还能自己选语音识别、语音合成和大模型。价格确实低,但正文没披露用了什么模型、延迟多少、部署条件如何。无代码流程编辑器和外挂资料库是加分项,但语音代理的体验关键在延迟和打断处理,这些信息缺口让它更像一个低价入口,不是成熟方案。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
04:36
25d ago
新智元 · 公众号· rssZH04:36 · 05·19
Profy 上线全球首个 AI 专家市场:把你的经验打包成数字分身,7x24 小时接单
Profy 推出一个平台,让专家把自己的工作流程打包成 AI 数字分身,7x24 小时在线变现。用户可以通过自然对话或上传 CLI 文件来创建分身。官方称其 HLE 评分比基础模型高出近 20 个百分点——HLE 是衡量模型在专家级任务上表现的指标,这个提升幅度说明数字分身确实能学到一些专业套路。不过正文没披露具体用了哪些模型、训练成本多少、以及分身能...
#Agent#Tools#Benchmarking#Profy
精选理由
HKR三项都过,但这是个小厂商的产品发布,宣传味比较重。正文给出了机制和HLE成绩,但没披露独立评测、定价、专家数量、交易数据这些关键信息。HLE高20个百分点这个数字挺亮眼,但正文没说是跟哪个基模比、测试条件是什么,这点先别太激动。整体看是个有意思的方向,但验证还很弱。
一句话点评
Profy 上线了一个专家数字分身市场,号称 HLE 评分比基础模型高近 20 个百分点,说明分身确实能学到专业套路。但正文没披露用了什么模型、训练成本多少,以及分身能处理多复杂的任务。先别太激动,HLE 提升幅度大可能因为基础模型本身得分低,而且平台刚上线,验证案例太少。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
04:24
25d ago
Hacker News 首页· rssEN04:24 · 05·19
Codex-Maxxing:把编程助手当操作系统用
作者 Jason Liu 分享了他如何把 OpenAI Codex 从写代码的工具变成日常工作的“操作系统”。核心做法是给每个重要工作流建一个“持久线程”(可以压缩历史、长期保留的对话),配合语音输入、中途打断(steering)、共享记忆(用 Obsidian 笔记库存上下文)和心跳监控(让模型在后台盯着 PR 或 Slack 线程)。他提到持久线程...
#Code#Tools#Commentary
精选理由
只有H勉强通过:标题有梗能吸引点开。但K和R都不行——正文没披露任何Codex用法、实验条件或结论,连个数字都没有,没法判断价值。整体信息缺口太大,只能归为低价值全量推送。
一句话点评
作者把 Codex 从写代码工具变成日常“操作系统”,核心是给每个工作流建一个可压缩历史的持久线程,配合语音输入、中途打断和共享记忆。他提到线程压缩后能跑几个月,但没披露具体成本、模型版本或延迟数据。做法有参考价值,但效果和开销得自己试。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
04:17
25d ago
r/LocalLLaMA· rssEN04:17 · 05·19
OpenCoffer 开源:自托管记账 + 自带模型聊天
OpenCoffer 发布了第一个开源版本,主打自托管个人财务管理和自带大模型聊天。你可以把它理解成一个本地记账软件,同时还能用自己的模型跟它对话查账。不过正文没披露支持哪些模型、怎么部署、要不要钱,也没说数据怎么连到模型——信息缺口挺大,想试的话得自己去翻仓库。
#Tools#OpenCoffer#ChatGPT#Open source
精选理由
一个小众开源工具发布:HKR-H 来自“记账+本地大模型”的组合,HKR-R 来自隐私敏感场景。HKR-K 弱是因为模型、部署、数据连接器都没披露。
一句话点评
OpenCoffer 是个开源的自托管记账软件,亮点是能接你自己的大模型来聊天查账。但正文被屏蔽了,没披露支持哪些模型、怎么部署、要不要钱,数据怎么连到模型也没说——信息缺口很大,想试得自己去翻仓库。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
04:00
25d ago
FT · 科技· rssEN04:00 · 05·19
无人机公司Helsing联手OHB竞标欧洲军用卫星项目,给卫星装AI大脑
德国无人机公司Helsing和航天公司OHB计划联合竞标一个军用卫星项目,目标是建一套带AI的侦察监控网络。说白了就是给天上的卫星装个AI大脑,让它能自己识别目标、分析画面。Helsing之前主要做无人机上的AI系统,这次想往太空走。正文没披露合同金额、卫星数量、采购时间表,也没说卫星什么时候部署、在什么条件下能用。所以这事还在早期,具体规模和技术成熟...
#Vision#Helsing#OHB#Partnership
精选理由
FT 来源有权威性,但正文只确认了 Helsing 和 OHB 联合竞标一个 AI 监控卫星网络,没披露金额、规模和时间表。HKR-H/R 通过;HKR-K 信息太薄,所以留在非推荐区。
一句话点评
德国无人机AI公司Helsing要和OHB联手竞标军用卫星项目,给卫星装AI大脑做侦察监控。正文没披露合同金额、卫星数量、部署时间,信息缺口很大,目前只能当意向看。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
04:00
25d ago
FT · 科技· rssEN04:00 · 05·19
四大会计师事务所招AI专家比招审计师还多
四大会计师事务所(德勤、安永、毕马威、普华永道)发布的AI专家岗位数量已经超过审计师岗位。正文没披露具体招聘数字、时间范围、地区分布或各家数据,所以没法判断这个“超过”是总量还是增速。但方向很明确:审计这类流程化业务正在被AI替代,事务所需要更多懂模型部署、数据工程的人,而不是传统做底稿的人。
#Big Four#Personnel
精选理由
HKR-H和HKR-R都成立:四大招聘反转有话题性,也切中就业市场神经。HKR-K弱在正文缺具体数字和时间跨度,没交代哪家贡献了主要增量,所以归入all层级,不单独加急或降级。
一句话点评
四大会计师事务所(德勤、安永、毕马威、普华永道)发布的AI专家岗位数量已超过审计师岗位。方向明确:审计这类流程化业务正在被AI替代,事务所需要更多懂模型部署、数据工程的人,而非传统做底稿的人。但正文未披露具体招聘数字、时间范围、地区分布或各家数据,无法判断“超过”是总量还是增速。信息缺口明显,结论需谨慎引用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
03:57
25d ago
Product Hunt · AI· rssEN03:57 · 05·19
Agora-1:一个能多人实时互动的AI世界模型,像玩游戏一样操控AI视频
Odyssey 在 Product Hunt 上发布了 Agora-1,一个“可玩的”多智能体世界模型研究预览。最多四个人类或 AI 智能体可以同时进入同一个实时生成的 3D 场景,从不同视角观看并互动,模型会维持场景的一致性。这不像传统 AI 视频只能看,更像一个共享的、可操控的模拟环境。不过正文没披露模型参数量、训练数据、推理成本、访问权限或发布时...
#Agent#Odyssey#Product Hunt#Product update
精选理由
Product Hunt 上的信息很薄:Agora-1 被定位为可玩的多智能体世界模型,但访问方式和具体技术细节都没有。HKR 只有 H 通过,所以这条属于低价值的产品更新类内容。
一句话点评
Odyssey 发了 Agora-1,一个最多4人/智能体同时进入的实时生成3D场景,大家能一起看一起互动,模型会保持场景一致。这比只能看的AI视频进了一步,更像共享模拟环境。但正文没披露模型参数量、训练数据、推理成本、访问权限和发布时间,这些关键信息缺失让实际可用性打折扣。短评:多人实时交互世界模型,方向有意思,但细节太少,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0
03:56
25d ago
Hacker News 首页· rssEN03:56 · 05·19
LLMCap:给 LLM API 调用设个硬性美元上限,超了就停
LLMCap 是一个代理层,你改一行代码把 API 请求指向它的地址,然后在后台设好每日或每月的美元上限。一旦花销触顶,它会在 token 被消耗前直接返回 429 错误,而不是事后发警报。官方声称新增延迟低于 35 毫秒,支持 Anthropic、OpenAI、Google Gemini、Mistral、Cohere 五家供应商,并提供 VS Cod...
#Tools#LLMCap#Hacker News#Product update
精选理由
LLMCap 用一个代理在 API 费用达到美元上限时硬性停止调用,这是一个实在的成本控制钩子。文章信息很薄:Hacker News 上只有 5 分、2 条评论,没有披露支持哪些厂商、计费规则、是否开源。
一句话点评
LLMCap 是一个代理层,你改一行代码把 API 请求指向它的地址,然后在后台设好每日或每月的美元上限。一旦花销触顶,它会在 token 被消耗前直接返回 429 错误,而不是事后发警报。官方声称新增延迟低于 35 毫秒,支持 Anthropic、OpenAI、Google Gemini、Mistral、Cohere 五家供应商,并提供 VS Code 插件和命令行工具。 短评:硬止损比...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
03:49
25d ago
Product Hunt · AI· rssEN03:49 · 05·19
Multi-Claude:在 Mac 上同时登录多个 Claude 账号
一个 macOS 原生应用,让你在电脑上同时跑多个 Claude 账号,每个账号独立保存会话、历史记录和设置,切换只需点一下。开发者说数据只存在本地,唯一的网络请求是一次性的许可证校验。目前是一次性买断,没有订阅,首发周用码 PRODUCTHUNT25 打 75 折。不过正文没披露具体定价、最多能加几个账号、以及最低支持哪个 macOS 版本。另外它本...
#Tools#Claude#Product update
精选理由
这是个很薄的产品更新,像 Product Hunt 上的工具发布,没有定价、限制或可复现的细节。H 和 R 通过,但信息缺口太大,只能算低价值的产品动态,没有硬排除触发条件。
一句话点评
一个 macOS 原生应用,让你在电脑上同时跑多个 Claude 账号,每个账号独立保存会话、历史记录和设置,切换只需点一下。开发者说数据只存在本地,唯一的网络请求是一次性的许可证校验。目前是一次性买断,没有订阅,首发周用码 PRODUCTHUNT25 打 75 折。不过正文没披露具体定价、最多能加几个账号、以及最低支持哪个 macOS 版本。另外它本质是个浏览器包装器,不涉及 Claude...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
03:48
25d ago
彭博科技· rssEN03:48 · 05·19
澳大利亚最大养老金基金称 Agentic AI 将冲击行业
AustralianSuper(管理 3500 万会员的澳洲最大养老基金)公开表态,认为 agentic AI(让模型进业务流程干活)能改变它服务会员的方式。正文没披露部署计划、供应商、时间表或投资金额,所以目前只是一个方向性表态,不是落地案例。
#Agent#AustralianSuper#Commentary
精选理由
HKR-K靠350万会员的企业背景勉强通过,但HKR-H和HKR-R都不足。没有披露Agent机制、预算、供应商或落地条件,所以不值得上推荐位。
一句话点评
AustralianSuper(澳洲最大养老基金,3500万会员)说agentic AI(让模型进业务流程干活)能改变服务方式。但正文没披露部署计划、供应商、时间表或投资金额,目前只是一个方向性表态,不是落地案例。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
03:43
25d ago
AI HOT 精选· aihot-apiZH03:43 · 05·19
QoderWork 发布 Design Desk:用自然语言生成可运行 React 项目的无限画布
QoderWork 推出了 Design Desk,一个无限画布 AI 工作区,用户用自然语言描述需求,就能直接生成可运行的 React + Vite 项目。设计师和开发者可以在同一份文件上协作,减少交接摩擦。目前正文没披露定价、底层模型和具体上线时间,想尝鲜可以直接去官网下载。
#Code#Tools#Alibaba Cloud#QoderWork
精选理由
HKR 三项都过:无限画布生成可运行 React+Vite 项目这个点具体且跟 AI 编程工具相关。但这是厂商社交帖子,没披露价格、模型或发布时间表,所以分数压在 60–71 区间。
一句话点评
QoderWork 出了个 Design Desk,用自然语言描述就能生成可运行的 React + Vite 项目,设计师和开发者能在同一份文件上协作,减少交接摩擦。听起来像把 Figma 和代码生成揉到一起,但正文没披露定价、底层模型和具体上线时间,想尝鲜得自己去官网下载。目前看更像一个概念演示,实际协作效果和生成代码质量未知,别急着当主力工具。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
03:06
25d ago
Hacker News 首页· rssEN03:06 · 05·19
Sieve:扫一遍 Cursor/Claude 聊天记录,揪出泄露的 API Key
Sieve 是一款 Mac 工具(9.99 美元),专门扫描本地 AI 编程助手的聊天记录和状态文件,找出你不小心贴进去的 API Key、Token、密码和私钥。支持 Cursor、Claude Code、VS Code Copilot、Windsurf、Codex 等 9 款工具,还能扫项目里的 .env 文件。扫描完全在本地完成,不上传任何数据。...
#Code#Tools#Safety#Sieve
精选理由
一个 Mac 本地安全小工具,但跟 AI 编程工作流贴得很近;泄露 API key 的 hook 和本地扫描机制让 HKR 三项都成立。来源权威性一般,检测规则正文没披露,所以不上 featured。
一句话点评
Sieve 是个 Mac 小工具(9.99 美元),专门扫 Cursor、Claude Code 等 9 款 AI 编程助手的聊天记录,找出你不小心贴进去的 API Key、密码和私钥。扫描全在本地完成,不上传任何数据,发现后还能直接擦除或存进系统钥匙串。这点先别太激动——正文没披露检测规则的具体细节,比如靠正则还是启发式,误报率未知。另外只支持 Mac,Windows 和 Linux 用户...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
02:55
25d ago
Product Hunt · AI· rssEN02:55 · 05·19
CLI Market:一个API查3760家零售商的商品,AI代理直接下单
CLI Market 把 VTEX 电商平台上的 3760 多家零售商(包括家乐福、三星等)的商品查询和购买接口,打包成一个统一的 Python 包。你装一个 `pip install cli-market`,AI 代理就能用自然语言说“买米”,然后自动跨店比价、加购物车、下单。它提供了 12 个 MCP 工具(让模型直接调用的功能模块),比如 `ma...
#Agent#Tools#CLI Market#Product update
精选理由
HKR 里 H 和 K 靠 3,760 家零售商这个具体数字过关,但 R 很弱。作为一条没有定价和集成细节的 Product Hunt 式工具发布,只能放在低优先级的小产品更新档位。
一句话点评
CLI Market 把 VTEX 平台上 3760 多家零售商(家乐福、三星等)的商品查询和购买接口打包成一个 Python 包,装个 `pip install cli-market`,AI 代理就能用自然语言说“买米”,自动跨店比价下单。它提供了 12 个 MCP 工具(让模型直接调用的功能模块),比如搜索、比价、加购物车。开源 MIT 协议,免费。但正文没披露 API 调用是否收费、有...
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
02:18
25d ago
● P1FT · 科技· rssEN02:18 · 05·19
Google 与 Blackstone 携手创建 AI 云公司并自研芯片
FT 这篇报道的正文被安全验证页挡住了,只从现有摘要能看出:一家黑石投资的 AI 云厂商拿到了 50 亿美元投资,计划明年上线 500 兆瓦的数据中心容量。标题里提到 Google 在推芯片,但正文没披露用的是 TPU 还是自研 Arm 芯片、以什么形式合作——是租算力、联合部署还是单纯采购。这点先别太激动,等看到全文再判断。
#Inference-opt#Google#Blackstone#Funding
精选理由
我会先打个折:Google 芯片到底怎么合作、分多少钱,正文没披露,这点先别太激动。但 Blackstone 支持的 AI 云集团拿到 50 亿美元投资,明年要上 500MW 数据中心容量,规模不小。对 AI 从业者来说,这背后是算力成本压力和找 NVIDIA 替代方案的现实需求,所以值得放进 featured。
一句话点评
Google 拉上黑石搞了个新 AI 云公司,起步就砸 50 亿美元,还打算用自己的芯片,摆明了要绕开英伟达。
锐评
Google 和黑石要合伙成立一家独立的 AI 云公司,专门卖搭载 Google 自研 TPU 芯片的算力服务。这事的核心逻辑是:Google 不想只当芯片的消费者,它想把自己设计的 TPU 变成一种可以对外出租的“基础设施”,直接跟英伟达的 GPU 云抢生意。起步资金 50 亿美元,目标是在 2027 年把数据中心规模干到 500 兆瓦,这个数字说明他们不是小打小闹,是奔着大规模商用去的。 不过,目前的消息主要来自《华尔街日报》的爆料,Google 和黑石官方都还没正式官宣,所以具体的股权结构、公司名字、运营团队都还是未知数。另外,TPU 虽然在某些 AI 任务上效率很高,但开发者生态跟英伟达的 CUDA 比还差得远,客户愿不愿意为了成本优势切换平台,是最大的不确定性。如果后续有具体的客户签约名单和 TPU 性能对比数据,这个故事的含金量会更高。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
01:46
25d ago
r/LocalLLaMA· rssEN01:46 · 05·19
MTP 在工具调用多的 agent 流程里可能反而拖后腿
Reddit 用户质疑 MTP(多 token 预测)在工具调用密集的 agent 流水线上是否真的有用。以 Qwen3.6-27B 为例,公开的 benchmark 显示:事实类任务上 MTP 的接受率只有 62-70%,而代码任务有 79-89%。差距挺大,说明 MTP 在需要精确调用外部工具的场景下可能帮倒忙。不过原帖没披露自己在生产 agent...
#Agent#Tools#Inference-opt#Qwen
精选理由
这是一条 Reddit 技术讨论,核心观点是 MTP(多 token 预测)在工具密集的 Agent 流程中可能净收益为负。帖子引用了流传基准的接受率(事实 62-70%、代码 79-89%),但正文没披露在工具密集流水线上的实测结果,信息缺口明显。HKR 三项都过,但证据强度有限,放在 60-71 all 档合理。
一句话点评
Reddit 用户实测发现,Qwen3.6-27B 的多 token 预测(MTP)在工具调用场景下可能帮倒忙:事实类任务接受率仅 62-70%,远低于代码任务的 79-89%。差距说明 MTP 在需要精确调用外部工具时反而拖后腿。不过原帖没披露生产环境实测数据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
01:38
25d ago
r/LocalLLaMA· rssEN01:38 · 05·19
本地跑子代理:10GB显存就能用,单KV缓存槽搞定
Reddit用户发布pi-subagent,让本地子代理跑在pi coding agent上,显存需求不到10GB,只用llama.cpp一个KV缓存槽。实测Apex Qwen在q_8 KV量化下能撑175-200k上下文,速度25-40 tokens/秒,取决于草稿命中率。正文没披露具体硬件配置和草稿模型大小,但显存和上下文长度数据挺实在,本地部署门...
#Agent#Code#Inference-opt#Qwen
精选理由
H/K/R 三项都达标,但来源是单条 Reddit 帖子,Apex Qwen 的上下文长度和速度声称未经验证。对本地 agent 玩家有参考价值,但不够强到上推荐位。
一句话点评
一个Reddit用户搞了个pi-subagent,让本地子代理跑在pi coding agent上,显存不到10GB,只用llama.cpp一个KV缓存槽。实测Apex Qwen在q_8 KV量化下能撑175-200k上下文,速度25-40 tokens/秒,取决于草稿命中率。正文没披露具体硬件配置和草稿模型大小,但显存和上下文长度数据挺实在,本地部署门槛确实低。 短评:本地子代理显存不到...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
01:30
25d ago
Hacker News 首页· rssEN01:30 · 05·19
LLM 半年回顾:模型冠军换了五次,编程智能体终于靠谱了
Simon Willison 在 PyCon US 2026 上用五分钟闪电演讲总结了 LLM 过去半年的关键变化。核心判断是:2025 年 11 月是一个转折点,编程智能体从“经常翻车”跨过“基本可用”的门槛,能当日常工具用了。这背后是 OpenAI 和 Anthropic 用“可验证奖励的强化学习”死磕代码质量的结果。同期“最佳模型”头衔在 Ant...
#Simon Willison#Hacker News#Commentary
精选理由
HKR-H 和 HKR-R 通过:Simon Willison 的半年 LLM 回顾标题有吸引力,能抓住从业者追赶进度的心理。HKR-K 不通过:RSS 只披露了标题、HN 13 分和 1 条评论,正文未披露任何模型、机构或技术细节,信息缺口大,只能放在较低的 all 档。
一句话点评
Simon Willison 在 PyCon US 2026 用五分钟闪电演讲总结 LLM 半年变化。核心判断:2025 年 11 月是转折点,编程智能体从“经常翻车”跨过“基本可用”门槛,能当日常工具用了。这背后是 OpenAI 和 Anthropic 用“可验证奖励的强化学习”死磕代码质量的结果。同期“最佳模型”头衔在 Anthropic、OpenAI、Google 之间换了五次,但演讲...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
01:14
25d ago
r/LocalLLaMA· rssEN01:14 · 05·19
从6GB到32GB:一个玩家用RTX 3090加3060凑显存跑大模型
Reddit用户晒单:买了张RTX 3090(24GB),打算跟手头的RTX 3060(8GB)拼在一起,凑出32GB显存,装Ubuntu用llama.cpp跑代码类模型,比如Qwen 3.5 4B和Qwen 3.6 27B。这配置成本不高——二手3090大概三四千块,加上3060总共32GB,比买一张RTX 4090(24GB)便宜一半以上。不过正文...
#Code#Inference-opt#Reddit#Qwen
精选理由
HKR-H和HKR-R成立,但HKR-K不成立:这只是一个个人硬件升级计划,没有llama.cpp的实测数据或可复现的配置,属于低价值信息。正文没披露任何模型推理速度或显存占用数据,建议观望。
一句话点评
Reddit 用户晒单:买二手 RTX 3090(24GB)配手头 RTX 3060(8GB),凑 32GB 显存,总成本约三四千元,比单买 RTX 4090(24GB)便宜一半以上。打算装 Ubuntu 用 llama.cpp 跑 Qwen 3.5 4B 和 Qwen 3.6 27B 等代码模型。 短评:二手卡拼显存是本地玩家的省钱老路子,32GB 跑 27B 模型够用,但跨卡通信延迟高...
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R1
01:08
25d ago
Product Hunt · AI· rssEN01:08 · 05·19
Freu AI:用自然语言让 Mac 应用自动干活,运行不花钱
Freu AI 是一个 Mac 上的 AI 代理,你说句话它就能帮你操作桌面应用。它先“看”一遍你的界面,把跨应用的流程记下来,然后转成一套确定性的 DSL(领域特定语言)在本地跑——不用写死坐标或选择器,每次跑也不消耗 token,所以官方说运行成本是零。它还开源了浏览器自动化引擎 freu-cli。不过正文没披露它支持哪些应用、怎么收费(只说运行免...
#Agent#Tools#Freu AI#Product Hunt
精选理由
这是一条 Product Hunt 上的工具发布帖,标题很唬人但内容很薄。H 和 R 能过,因为“自动化任何 Mac 应用”加“零成本”确实戳中从业者痛点;但 K 不过,因为正文没披露执行机制、支持范围或价格细则,属于典型的标题党式产品更新,不值得给高分。
一句话点评
Freu AI 号称用自然语言就能让 Mac 应用自动干活,而且每次运行成本为零。它先“看”一遍你的界面,把跨应用流程记下来,转成一套确定性的 DSL 在本地跑,不用写死坐标或选择器,也不消耗 token。这点先别太激动——正文没披露它支持哪些应用、怎么收费(只说运行免费),也没说部署要求。开源了浏览器自动化引擎 freu-cli 倒是加分项。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
01:00
25d ago
彭博科技· rssEN01:00 · 05·19
新西兰裁8700个公务员岗位,同时推AI替代
新西兰政府计划裁掉约8700个公共部门岗位,合并一些部委,并扩大AI的使用范围。裁人规模不小,占公务员总数约6.5%,但正文没披露具体时间表、用了哪些AI系统、以及预计能省多少钱。对AI从业者来说,这算一个政府级“用AI降本”的案例,但细节太少,暂时没法判断是简单自动化还是深度改造。
#New Zealand#Policy
精选理由
HKR三项都过,但正文只给了裁员规模、部门合并和扩大AI使用这几个政策信号,没有披露具体系统、采购金额或自动化机制。这是一条政策/劳动力信号,不是AI产品故事。
一句话点评
新西兰政府计划裁掉约8700个公务员(占总数的6.5%),同时说要扩大AI使用范围。这是一个政府级“用AI降本”的案例,但正文没披露具体用哪些AI系统、时间表以及预计省多少钱。目前信息太少,没法判断是简单自动化还是深度改造,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
00:48
25d ago
AI HOT 精选· aihot-apiZH00:48 · 05·19
Claude Code v2.1.144:后台会话可恢复,改名“用量积分”
Anthropic 给 Claude Code 打了个小补丁。新增 /resume 命令,终端里跑到一半的会话切到后台后能捡回来继续用,不用重开。之前叫“extra usage”的计费项改名为“usage credits”,更直白。修了一堆 bug:终端显示错乱、macOS 上特定文件夹会闪退、模型选择不记住、工具调用异常、MCP 服务器分页工具列表加...
#Agent#Code#Tools#Anthropic
精选理由
HKR-K 和 HKR-R 通过:版本有具体的 Claude Code 改动和开发者工作流相关性。HKR-H 不通过,因为是常规补丁,所以分数落在小产品更新区间。
一句话点评
短评:Claude Code 小版本更新,加了会话恢复和改名计费项,修了一堆 bug。 点评:Anthropic 给 Claude Code 打了个补丁,核心变化就两个:新增 /resume 命令,终端里跑到一半的会话切到后台后能捡回来继续用,不用重开;之前叫“extra usage”的计费项改名为“usage credits”,更直白。修了一堆 bug:终端显示错乱、macOS 上特定文...
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
00:41
25d ago
AI HOT 精选· aihot-apiZH00:41 · 05·19
让AI写代码时同步记笔记,方便人类事后查账
这个提示词让AI编码助手在写代码的同时,自动记录设计决策、偏离原始需求的地方、权衡过的方案和遗留问题。相当于给AI的思考过程留了一份“审计日志”,Code Review时可以直接对照笔记看代码,不用再反向猜AI为什么这么写。正文没披露完整模板、token消耗、评测效果或实际采用数据,所以效果到底多好还不确定,但思路挺实用——把AI的隐性判断变成可读文档...
#Code#Tools#Commentary
精选理由
HKR全通过:可审计的AI编码日志具体且贴近开发者需求。但证据不足——正文没披露模板长度、评测结果或可复现对比,所以不上精选。
一句话点评
这个提示词让AI编码助手边写代码边记设计决策、偏离需求的地方、权衡过的方案和遗留问题,相当于给思考过程留了份审计日志,Code Review时直接对照笔记看代码,不用再反向猜AI为什么这么写。正文没披露完整模板、token消耗、评测效果或实际采用数据,所以效果多好还不确定,但思路挺实用——把AI的隐性判断变成可读文档。 短评:思路实用,把AI的隐性判断变成可读文档,但缺模板和实测数据,效果...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
00:04
25d ago
r/LocalLLaMA· rssEN00:04 · 05·19
RTX 5060 Ti 本地跑大模型实测:有人整理了多卡配置和跑分表
Reddit 用户 club-5060ti 把 RTX 5060 Ti 本地跑大模型的零散经验整理成了结构化基准测试仓库,覆盖 1/2/3/4 卡以及混合 CUDA 硬件组合。提交测试结果必须写明拓扑(显卡怎么连的)、运行时、模型、量化精度、上下文长度、KV 缓存和速度。正文没披露具体跑分数据,但至少让想组多卡跑本地模型的人有个统一对比标准,不用再翻零...
#Inference-opt#Benchmarking#NVIDIA#Qwen
精选理由
Reddit 上的跟进帖,把 RTX 5060 Ti 本地推理整理成了基准仓库,覆盖单卡到四卡,还要求提交拓扑、运行时、模型和量化细节。对想买这张卡跑本地模型的人来说,信息比跑分帖更结构化。但正文没披露实际跑分结果,目前更像一个征集模板,不是现成结论。重要性 70 合理,够具体但还没出结果,不值得上推荐位。
一句话点评
短评:给多卡跑本地模型的人统一了对比标准,但没跑分数据,先别太激动。 点评:Reddit 用户 club-5060ti 把 RTX 5060 Ti 本地跑大模型的零散经验整理成了结构化基准测试仓库,覆盖 1/2/3/4 卡以及混合 CUDA 硬件组合。提交测试结果必须写明拓扑(显卡怎么连的)、运行时、模型、量化精度、上下文长度、KV 缓存和速度。这相当于给想组多卡跑本地模型的人一个统一对比...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
00:00
25d ago
Hugging Face 博客· rssEN00:00 · 05·19
Hugging Face 发布 Ettin Reranker 系列模型
Hugging Face 推出了六个 Ettin 重排序模型,参数从 1700 万到 10 亿不等,基于 ModernBERT 编码器。重排序模型的作用是在检索系统(比如外挂资料库)初步召回一批文档后,再精细排序,提升最终结果的相关性。这批模型通过蒸馏训练——用一个大模型(mixedbread-ai/mxbai-rerank-large-v2)的评分当...
#RAG#Hugging Face#Ettin#Product update
精选理由
三个 HKR 轴均不通过:帖子只提供了一个官方标题,没有任何具体事实。按 0-HKR / 零信息排除路径处理,分数上限 40。
一句话点评
Hugging Face 发布 Ettin Reranker 系列,6个模型从17M到1B参数,用蒸馏法从大模型学排序,在MTEB检索榜上达到同尺寸最佳。关键看点是全开源(模型+数据+训练配方),且基于ModernBERT编码器,推理速度比同尺寸Decoder模型快。但注意评测只用了MTEB英文v2,中文和多语言表现未知;蒸馏依赖教师模型mxbai-rerank-large-v2的质量,如果...
HKR 分解
hook knowledge resonance
打开信源
47
SCORE
H0·K0·R0
00:00
25d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·19
SaaS 把“数据不喂给 AI”做成了付费功能:Atlassian、GitHub 带头,中小客户被默认训练
这篇文章讲的是企业 SaaS 正在把“你的数据不被用于 AI 训练”从一个默认承诺,变成一个需要加钱才能买的功能。Atlassian 从 2026 年 8 月起,对 Free、Standard、Premium 层级的客户强制收集元数据(比如 sprint 日期、story points)用于训练 AI,只有 Enterprise 客户(最低 801 用...
#Safety#Zoom#Slack#Atlassian
精选理由
HKR-H和HKR-R过关,但HKR-K不达标:文章只抛了一个趋势判断加几个公司名,没有可验证的数字或政策细节,属于低价值评论,不值得投入时间深挖。
一句话点评
SaaS 厂商正把“不用你的数据训练 AI”从默认承诺变成付费功能。Atlassian 从 2026 年 8 月起强制收集 Free/Premium 用户的元数据(如 sprint 日期、story points)用于训练,只有 Enterprise(801 用户起)才能退出。GitHub Copilot、Figma、Slack 也类似。Google、Microsoft 因不缺数据而承诺不训...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1

更多

频道

后台