热点聚合 · 2026-05-13

▸ 39 signals · updated 3m ago

live · 612 today·policy v2

FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·

⤓ RSS live

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

125 212 320 419 541 631 749 827 923 1016 1136 1248 1339 1455 1535 1629 1721 1844 1973 2042 2143 2246 2311 2413 2520 2633 2738 2844 2931 3019 3113

2026年6月

一二三四五六日

138 250 349 443 539 616 713 838 99101112131415161718192021222324252627282930

2026-05-13 · 星期三2026年5月13日

22:25

26d ago

FEATUREDr/LocalLLaMA· rssEN22:25 · 05·13

双 RTX 3090 本地运行 Qwen 3.6 27B 的实测分享

Reddit 用户用双 RTX 3090 在 Ubuntu 上跑 Qwen 3.6 27B，48GB VRAM、262k 上下文、无 NVLink 下达到约 4000 pp/s 和 113 tk/s。

#Code#Tools#Inference-opt#Qwen

精选理由

HKR 三项都成立，且是带数字的第一人称本地推理实验；但来源是 Reddit 单帖，缺少可复现实验细节与横向评测，只压线进入 featured。

一句话点评

双 3090 跑 Qwen 3.6 27B 到 113 tk/s，这种 DIY 成绩会继续削弱“必须上云才玩得动”的恐惧营销。

锐评

双 RTX 3090 这条打脸的是推理门槛叙事，不是训练叙事。作者报了 48GB VRAM、262k context、无 NVLink、约 4000 pp/s 和 113 tk/s，跑的是 Qwen 3.6 27B；这些数如果可复现，27B 级本地 agent 已经够做长上下文代码审阅和离线工具链。我会先打折看，因为正文被 Reddit 403 挡住，只有摘要信息，量化方案、batch、KV cache、prompt 长度都没披露。可方向没变：3090 二手卡这种“上一代矿渣”还在吃掉中小模型推理需求，NVIDIA 新卡和云厂商卖的就不是能不能跑，而是并发、稳定性和运维省心。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

22:04

26d ago

FEATUREDThe Verge · AI· rssEN22:04 · 05·13

Microsoft Edge Copilot 更新可跨标签页提取信息

Microsoft Edge 将让 Copilot 读取所有打开标签页内容，用户可提问、比较商品或总结文章；正文披露可选择启用体验，但未披露上线时间。

#Agent#Tools#Microsoft#The Verge

精选理由

HKR 三项都过，但正文只给出跨标签读取、商品比较和总结文章，未披露上线时间或更深执行能力；按“中等产品更新”给 featured 下沿。

一句话点评

Edge 让 Copilot 读所有标签页，听着像浏览器 agent，实操更像把隐私弹窗和上下文窗口塞进同一个按钮。

锐评

Microsoft 这步先抢浏览器上下文，而不是先秀复杂 agent。Copilot 能读取所有打开标签页，做提问、商品比较、文章总结；用户可选择启用哪些体验，但上线时间、默认权限、企业策略边界都没披露。这个缺口不小，因为标签页是工作流里最脏也最值钱的上下文层。我更相信这是 Edge 对 Chrome 侧边栏和 Arc/Perplexity 类浏览器的防守。Copilot Mode 曾经能代订餐厅，现在被收进新体验，说明微软也在降调：先把跨标签检索做稳，再谈替你操作。隐私叙事会很吵，但成败看两个硬条件：是否默认关闭，以及能不能在 20 个标签里少胡编。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:45

26d ago

FEATUREDTechCrunch AI· rssEN21:45 · 05·13

Notion 将工作区变成 AI agent 中枢

Notion 发布新开发者平台，让团队在工作区内接入 AI agent、外部数据源和自定义代码；正文未披露价格、上线时间或支持的模型名单。

#Agent#Tools#Notion#Product update

精选理由

HKR 三项都命中，但正文缺价格、上线时间和模型名单，信息密度只能落在 72–77 的中量级产品更新；TechCrunch 来源支撑精选，不到同日必写。

一句话点评

Notion 把 agent 接进工作区，押的是“工作上下文归谁管”；但只有 RSS 摘要，pricing、模型、权限边界全没露。

锐评

Notion 这步像是在抢 agent 的落点，而不是炫模型能力。它的新开发者平台允许团队把 AI agent、外部数据源、自定义代码接进 workspace；这三个钩子都贴着企业内部上下文走，价值不在聊天框，在权限、文档、任务和数据库的连线。但信息现在太薄：价格、上线时间、支持模型、调用限制都没给。对比 Slack、Microsoft 365 Copilot、Atlassian Rovo，Notion 的优势是结构化知识库和轻数据库心智，短板是企业级治理和系统入口不够硬。要是权限继承、审计、第三方 agent 沙箱做不细，这东西很快会变成又一个插件市场。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:24

26d ago

● P1Hacker News 首页· rssEN21:24 · 05·13

美国医保推出为AI设计的新支付模型

标题称 Medicare 新支付模型面向 AI，RSS 正文仅给出 URL、3 点热度和 0 条评论，未披露模型机制、覆盖范围或上线时间。

#Medicare#TechCrunch#Hacker News#Policy

精选理由

触发 hard-exclusion-6：正文只有标题、URL、3 点热度和 0 评论，没有数据、案例或机制；虽有 HKR-H 的标题钩子，但信息不足以进入 all。

一句话点评

Medicare 给 AI agent 留了报销入口，这比又一个医院 copilots demo 狠；但现在只有 TechCrunch/HN 单链路，别急着按 TAM 重估。

锐评

TechCrunch 与 HN 同题跟进 Medicare ACCESS，口径完全一致；HN 更像放大器，不是独立核验。正文给出的硬钩子是：医保过去没有机制支付“访视间监测、电话随访、住房转介、取药提醒”的 AI agent，ACCESS 第一次补上这个支付槽。我觉得这条比多数医疗 AI 融资新闻硬，因为美国医疗软件的天花板常卡在 CPT code 和报销路径，不是模型能力。Abridge、Nabla 做文书还能蹭现有流程；照护协调 agent 要没人买单就只是试点。问题也很现实：正文没给费率、资格、风控责任，创业公司现在只能先画 workflow，不能直接画收入。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

20:41

26d ago

FEATUREDr/LocalLLaMA· rssEN20:41 · 05·13

老 GTX 1080 跑约 30B MoE 模型达到 24+ tok/s

用户 mdda 用 i7-6700、GTX 1080、32GB RAM 跑 Qwen 3.6 35B-A3B，128k 上下文约 24 tok/s。关键是 llama.cpp MoE 卸载与 TurboQuant/RotorQuant KV cache 量化。

#Inference-opt#Qwen#Gemma#llama.cpp

精选理由

单帖来源拉低权重，但旧 GTX 1080 + Qwen 3.6 35B-A3B + 128k + 24 tok/s 的组合有强点击点与可复现线索；命中 HKR-H/K/R，属于实践型 featured，而非模型/产品大发布。

一句话点评

GTX 1080 跑 30B MoE 到 24 tok/s，炫技之外的重点是 KV cache 量化正在把“本地长上下文”从显卡神话里拆出来。

锐评

这条最刺眼的不是“老显卡还能跑大模型”，而是 128k 上下文被压进 8GB VRAM 机器的路径已经很工程化。摘要给出 i7-6700、GTX 1080、32GB RAM、Qwen 3.6 35B-A3B、约 24 tok/s，机制是 llama.cpp MoE offloading 加 TurboQuant / RotorQuant KV cache 量化，PCIe 3.0 x16 打满，GPU 利用率只有 40–50%。我对 24 tok/s 这个数会打折看：Reddit 原文 403，没看到 prompt 长度、batch、量化档位和生成阶段曲线。但方向很清楚，MoE 稀疏激活加 KV 压缩，正在把本地推理瓶颈从“买更大显存”挪到“别让 PCIe 和 cache 爆炸”。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

20:22

26d ago

FEATUREDHacker News 首页· rssEN20:22 · 05·13

Meta不允许用户在Threads上屏蔽其AI账号

Meta 不允许用户在 Threads 屏蔽其 AI 账号；RSS 正文仅给出 HN 37 分、10 条评论，未披露账号机制或适用范围。

#Meta#Threads#Hacker News#Product update

精选理由

这是一个有讨论度的平台产品限制，HKR 三项都命中，但正文只给出标题事实与 HN 热度，未披露机制、范围或 Meta 解释，按小型产品/平台争议放在 60–71 档。

一句话点评

Meta AI 在 Threads 里不能被屏蔽，这不是小 UX bug，是平台把 AI 账号升格成系统组件，用户控制权直接让位。

锐评

2 家同时跟进，但 HN 只是转引 The Verge，事实链很短：Meta 不允许 Threads 用户屏蔽 Meta AI 账号，正文只披露用户可 tag 它提问。这个口径不像技术限制，更像产品决策。我不买“助手账号”这个包装。普通账号能被 block，Meta AI 不能，边界就变了：它不是内容发布者，而是平台默认入口。Meta 去年把 AI 塞进搜索框、Instagram、WhatsApp 后，Threads 这次更粗暴。对从业者来说，问题不是模型多强，而是分发位一旦被锁死，拒绝权也被产品经理收走。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

20:15

26d ago

FEATURED彭博科技· rssEN20:15 · 05·13

Cisco上调销售预期并宣布裁员聚焦人工智能

Cisco 盘后最高涨 19%，公司给出高于预期的销售预测，并计划裁减数千个岗位以聚焦 AI 市场。

#Cisco#Product update#Personnel

精选理由

Cisco 是 AI 基建相关大公司，19% 盘后涨幅和裁数千岗有话题性；但正文摘要未披露具体营收指引、AI业务规模或重组细节，只能按通用科技财报/裁员新闻给 60–71 档。

一句话点评

Cisco一边报创纪录季度收入一边裁5%押AI，这不是AI效率胜利，更像老牌网络厂商把成本故事包装成增长故事。

锐评

Cisco上调销售预期并裁员5%，TechCrunch写近4000人，Bloomberg强调股价和预测超预期，三家都把AI重组放进标题，口径高度一致，像围绕财报口径发散。我不太买“多花AI钱”这个包装。Cisco有创纪录季度收入，还同步砍5%岗位，说明AI在这里先是资本配置借口，不是产品牵引证据。正文没有披露AI订单、GPU网络收入、客户留存或毛利改善。和Arista靠AI集群网络需求讲增长不同，Cisco这条更像把存量组织腾挪讲成AI进攻。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

19:49

26d ago

FEATUREDTechCrunch AI· rssEN19:49 · 05·13

Musk 的 xAI 在密西西比数据中心运行近 50 台燃气轮机

Musk 的 xAI 在密西西比 Colossus 2 数据中心运行近 50 台燃气轮机，并因把“移动”燃气轮机当电厂使用遭起诉；正文未披露监管状态细节。

#xAI#Elon Musk#Incident#Policy

精选理由

HKR 三项都成立：标题有强冲突，事实给出近50台燃气轮机与诉讼，议题指向AI数据中心供电合规。它不是模型或产品发布，停在精选门槛段。

一句话点评

xAI 为 Colossus 2 跑近 50 台燃气轮机，这不是“算力焦虑”，是把数据中心供电外包给监管缝隙。

锐评

xAI 把 Colossus 2 的供电问题摊到地面上了：近 50 台燃气轮机，被起诉的点是把“移动”设备当电厂用。GPU 集群扩张现在卡的不是模型论文，而是电力接入、许可和地方承载力。正文只有 RSS 摘要，许可状态、排放规模、诉讼请求都没给，不能替任何一方判案。但这条很有代表性。过去一年 OpenAI、Anthropic、Meta 都在抢长期电力和数据中心合同，xAI 走得更硬也更粗暴：先把算力堆起来，再处理外部性。Colossus 2 若靠临时燃机撑规模，Musk 的速度叙事就要付出一笔环保和监管账。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

19:29

26d ago

FEATUREDAI HOT 精选· aihot-apiZH19:29 · 05·13

Claude 电脑与浏览器使用的最佳实践

Anthropic 发布 Claude 电脑与浏览器使用指南，Claude 4.6 API 截图上限为长边 1568 像素、115 万总像素，Opus 4.7 提升至 2576 像素、375 万总像素。

#Agent#Vision#Tools#Anthropic

精选理由

Anthropic 一手发布 Claude 电脑/浏览器使用指南，信息点是可执行的截图像素约束，不是单纯宣发；HKR 三项都过，但属于实操指南而非新模型或重大能力发布，落在 72–77 档。

一句话点评

Anthropic把截图上限从115万像素抬到375万像素，别小看这个参数，GUI agent卡住的经常不是推理，是看不清屏幕。

锐评

Claude 电脑使用指南里最硬的不是“最佳实践”，是 Opus 4.7 把截图预算抬到 2576 长边、375 万总像素。GUI agent 的失败链很朴素：按钮字太小、表格列看漏、弹窗状态误读，后面再强的规划都会跑偏。Claude 4.6 API 的 1568 长边、115 万像素，对复杂 SaaS 后台和多栏网页太紧。 Anthropic 这篇像工程手册，不像发布会。它承认浏览器使用需要靠截图规格、页面裁剪、动作粒度来喂模型。OpenAI 和 Google 都在讲 computer use，但谁先把视觉输入、工具调用、失败恢复写成可复现约束，谁更接近可上线的办公 agent。pricing 和延迟没给，这两个会决定开发者敢不敢默认开高分辨率。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:09

26d ago

FEATUREDMIT 科技评论· rssEN18:09 · 05·13

AI 聊天机器人正在泄露真人手机号

MIT Technology Review记录3起Gemini泄露手机号案例。DeleteMe称7个月内生成式AI隐私咨询增400%，其中55%提到ChatGPT。

#Safety#Alignment#MIT Technology Review#Google

精选理由

MIT Technology Review 给出具体案例与 DeleteMe 数据，HKR-H/K/R 都成立；影响面偏隐私安全与产品责任，不是模型或平台级更新，落在 featured 门槛上方。

一句话点评

别把这当 Gemini 小事故；手机号进回答链路后，模型厂的“删除请求”能力基本没产品化。

锐评

Gemini 把真实手机号塞进客服答案，暴露的不是幻觉，而是 PII 退场机制缺席。MITTR 只记录到 3 起案例，规模不大；但 DeleteMe 说 7 个月内生成式 AI 隐私咨询涨 400%，其中 55% 提到 ChatGPT、20% 提到 Gemini、15% 提到 Claude。这个分布更像使用量和可见度的影子，不是可靠事故率。我不太买“训练数据里有 PII”这个解释能收住问题。RAG、搜索增强、商家资料聚合都会把号码带进上下文，最后用户只看到一个权威口吻的答案。Google 搜索时代还有索引删除、robots、结果申诉；聊天答案一旦合成出来，普通人连该删哪一层都不知道。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:15

26d ago

● P1彭博科技· rssEN17:15 · 05·13

Microsoft 在 OpenAI 合作上累计投入超过 1000 亿美元

Microsoft 已在 OpenAI 合作上投入超过 1000 亿美元，正文未披露投入构成、时间表或双方协议条款。

#Microsoft#OpenAI#Partnership

精选理由

Bloomberg 给出超过1000亿美元这一新数字，直接牵动 Microsoft-OpenAI 绑定、算力资本开支与竞争格局；但正文未拆分投入构成、时间表和协议条款，K 够硬但细节不足，停在84。

一句话点评

两条都是 Bloomberg 标题链，正文被 403 挡住；“投超1000亿美元、目标回报920亿美元”更像微软把 OpenAI 账本摊给资本市场看。

锐评

两条覆盖都来自 Bloomberg，标题给出两个硬数：微软在 OpenAI 合作上花超 1000 亿美元，早期投资目标回报 920 亿美元；正文被 403 挡住，未披露口径和时间表。我看这不是普通“战略合作”新闻，而是微软 AI 资本开支叙事开始被利润表反咬。1000 亿美元级别投入，已经不是 Azure 优先供给那么简单；如果 920 亿回报目标来自内部测算，那市场该问的是收入确认、算力折旧、OpenAI 分成三张表怎么对齐。对比 2023 年那笔常被引用的 100 亿美元投资，这次数字膨胀到一个云厂商资产负债表问题。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:14

26d ago

● P1彭博科技· rssEN17:14 · 05·13

Anduril 融资50亿美元估值翻倍至610亿美元

Anduril 在 Thrive Capital 和 Andreessen Horowitz 领投的 50 亿美元融资中估值翻倍至 610 亿美元，CEO Brian Schimpf 称资金将投向制造产能、研发和基础设施。

#Robotics#Anduril#Thrive Capital#Andreessen Horowitz

精选理由

HKR 三项都成立：610 亿美元估值和 50 亿美元融资有强钩子，也给出资金用途；但这是防务机器人融资，不是基础模型发布，落在 78–84 档。

一句话点评

Anduril 5亿美元还没细节，610亿美元估值先砸出来；国防 AI 现在卖的不是模型能力，是五角大楼采购通道。

锐评

FT 和 Bloomberg 都打出 Anduril 估值翻倍至 610 亿美元，FT 标题还给出“over $60bn”；正文被付费墙挡住，融资金额、投资方、条款未披露。这种一致口径大概率来自同一轮融资沟通，而不是两家独立挖出细节。我对这条的判断很简单：Anduril 已经不按普通 AI startup 定价。610 亿美元接近上市前 SpaceX 式军工叙事，靠的是自主系统、传感器、Lattice 指挥软件和美国国防预算的绑定。和模型公司拼 SWE-bench 不同，Anduril 拼的是合同、交付资质和战场集成。AI 圈别只看“防务科技”四个字，钱在买进入国防采购体系的稀缺席位。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:10

26d ago

FEATUREDAI HOT 精选· aihot-apiZH17:10 · 05·13

Claude付费计划将提供月度编程使用额度

Claude付费计划自6月15日起可申领月度编程额度，覆盖Claude Agent SDK、claude -p、Claude Code GitHub Actions及第三方Agent SDK应用。

#Agent#Code#Tools#Claude

精选理由

这是 Claude 开发者生态的计费/额度更新，不是新模型或新能力；但日期、覆盖工具链和付费计划条件明确，且直接影响 Claude Code 用户的成本预期。

一句话点评

Anthropic把Claude付费订阅拆出编程额度，这是在给Claude Code降摩擦，也是在给重度开发者设一条更清楚的用量边界。

锐评

Anthropic这次动的是分发，不是模型能力：6月15日起，Claude付费计划可申领月度编程额度，覆盖Claude Agent SDK、claude -p、Claude Code GitHub Actions和第三方Agent SDK应用。这个包法很明确，Anthropic想把开发者从聊天框拉到终端、CI和agent应用里。金额、额度上限和是否结转都没披露，所以别急着把它读成降价。更像是把Claude Code从单点工具塞进订阅权益，逼OpenAI Codex、Cursor、GitHub Copilot在“订阅内可用量”上正面比账。开发者最后看的不是口号，是一次PR、一个CI job、一个agent loop到底烧掉多少额度。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:02

26d ago

FEATUREDAI HOT 精选· aihot-apiZH17:02 · 05·13

Runway Agent 发布

Runway 发布 Runway Agent，用户可用单次自然语言对话生成多场景视频；新免费计划提供 1500 积分制作首个视频。

#Agent#Multimodal#Tools#Runway

精选理由

Runway 是 AI 视频头部玩家，这次把“对话到多场景视频”包装成 Agent，并给出 1500 免费积分，具备产品更新的点击点和具体条件；正文信息仍偏公告体，未披露模型能力边界、价格与评测。

一句话点评

Runway Agent 把视频生成包装成对话式制片人，但硬指标只给了 1500 免费积分；没有质量、时长、价格，先别替它买“成片”叙事。

锐评

Runway Agent 最该被怀疑的词是“ready-to-publish”。正文给了单次对话、多镜头、旁白、对白、音乐、时间线编辑器和 1500 免费积分，但没给最长时长、分辨率、生成成本、失败重试规则，也没给品牌一致性的可测指标。 Runway 这次瞄准的不是电影作者，而是营销团队的低预算视频产能。这个方向对，社媒广告和产品短片容错高，Runway 比 OpenAI Sora 更早把编辑器、素材上传、商用工作流摆到台前。但“minutes”产出高分辨率多镜头视频，离可直接投放还差审美一致性、字幕/口型、版权音乐、品牌审查四道坎。Agent 名字很好卖，交付标准现在还藏在产品里。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:45

26d ago

● P1The Verge · AI· rssEN16:45 · 05·13

Meta AI推出端到端加密的隐私聊天模式Incognito Chat

Mark Zuckerberg 宣布 Meta AI Incognito Chat，称服务器不保存对话日志，并使用端到端加密；正文未披露上线范围、保留策略审计或密钥机制。

#Safety#Meta#Mark Zuckerberg#The Verge

精选理由

Meta 给 AI 聊天加 Incognito 模式，隐私反差带来 HKR-H，端到端加密和不留日志支撑 HKR-K，信任成本支撑 HKR-R。正文缺上线范围、保留审计和密钥机制，按中量级产品更新压在 featured 门槛。

一句话点评

3 家都在报 Incognito Chat，但正文只有标题；Meta 把“私密 AI”先塞进 WhatsApp，这比又发一个模型更像防监管动作。

锐评

3 家同时跟进 Incognito Chat，口径都围绕 WhatsApp、Meta AI、端到端加密，像是 Meta 主动放出的同一组产品信息。正文未披露上线地区、默认开关、模型日志保留期，也没有说明加密覆盖用户到模型，还是只覆盖聊天传输。我不太买“completely private”这个标题。AI 聊天和普通 WhatsApp 消息不一样，推理端要处理上下文、工具调用、风控记录；只说端到端加密，不说服务器侧可见性，隐私承诺就少了最关键一段。苹果 Private Cloud Compute 至少把审计和硬件边界讲清了，Meta 现在给的是一个好听入口。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:28

26d ago

FEATUREDAI HOT 精选· aihot-apiZH16:28 · 05·13

Anthropic推出面向小型企业的Claude服务包

Anthropic推出Claude for Small Business，内含连接器和15个自动化工作流，接入QuickBooks、PayPal、HubSpot等工具，用户在Claude Cowork中手动批准关键步骤。

#Agent#Tools#Anthropic#Claude

精选理由

Anthropic面向小企业推出Claude套包，披露15个工作流、主流业务连接器和人工审批机制；这是Claude实质产品更新，但正文未披露价格、覆盖地区与真实使用数据，落在中等偏高产品更新。

一句话点评

Anthropic把Claude塞进QuickBooks和PayPal，不是在卖聊天框，而是在抢小企业后台操作权；15个工作流够具体，pricing没给就先别信ROI。

锐评

Anthropic这步很务实：Claude for Small Business直接接QuickBooks、PayPal、HubSpot、Canva、Docusign、Google Workspace和Microsoft 365，先吃小企业最脏的后台活。15个agentic workflow覆盖 payroll、月结、催款、campaign、合同审核，且发送、付款、发布前要人工批准，这比“全自动员工”叙事靠谱得多。我看它更像把Claude Cowork变成SMB版Zapier加会计助理。强点是任务有账本和收款数据，弱点是文章没披露价格、权限模型、审计日志和失败赔付。QuickBooks里的错账不是写错邮件，Anthropic如果只讲省时，不讲责任边界，小企业老板会把风险留给自己。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:08

26d ago

FEATUREDr/LocalLLaMA· rssEN16:08 · 05·13

sensenova/SenseNova-U1-A3B-MoT · Hugging Face

SenseNova 在 Hugging Face 发布 SenseNova-U1-A3B-MoT，正文列出 A3B MoT、8B MoT 与 0.4B LoRA 权重链接，称其用 NEO-unify 架构统一多模态理解、推理与生成。

#Multimodal#Vision#Reasoning#SenseNova

精选理由

开源多模态模型发布，给出多档权重与 NEO-unify 机制，HKR 三项成立；但来源是 Reddit/Hugging Face 线索，正文未给评测分数、许可证与实测案例，压在 featured 低段。

一句话点评

只有摘要能看，SenseNova 把 A3B/8B MoT 和 0.4B LoRA 丢上 HF；我先不买“统一多模态”这句，先看权重和评测。

锐评

SenseNova 这条先按“开源分发试探”看，别急着按能力突破看。摘要给了三个硬钩子：SenseNova-U1-A3B-MoT、8B MoT、0.4B LoRA 权重链接；正文只抓到 Reddit 403，没披露 license、训练数据、上下文长度、推理成本和 benchmark。 “NEO-unify 统一理解、推理、生成”这类话在多模态模型里太便宜。Qwen-VL、InternVL、Llama 系列社区微调都把 HF 当默认战场，真正拉开差距的是可复现实测：OCR、图表、视频帧、工具调用、多轮视觉推理。SenseNova 如果只给权重链接，不给评测卡和商用条款，LocalLLaMA 会很快把它跑成一张 reality check。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:38

26d ago

FEATUREDAI HOT 精选· aihot-apiZH15:38 · 05·13

开源 psql_bm25s，让 PostgreSQL 多智能体检索提速 23 倍

团队开源 psql_bm25s 原生 PostgreSQL 访问方法，在标准基准中实现精确 BM25 检索，比 pg_search 快约 23 倍。

#Agent#RAG#PostgreSQL#psql_bm25s

精选理由

开源 PostgreSQL BM25 访问方法带有明确基准数字，适合 RAG/Agent 工程读者；但目前素材只来自单条发布信息，缺少第三方复测、规模条件与生产案例，落在 featured 低段。

一句话点评

23 倍这个数很刺眼，但我先看 benchmark 脚本；Postgres 里做精确 BM25，赢的是 RAG 工程师，不是多智能体叙事。

锐评

psql_bm25s 的好处很朴素：把精确 BM25 留在 PostgreSQL 访问方法里，少一层外部搜索栈。文中给了一个硬数，比 pg_search 快约 23 倍；但语料规模、索引构建时间、更新代价、并发条件都没给，这个 23 倍现在只能当性能线索，不能当迁移理由。我比较买账的是方向，不买“多智能体铺路”这句。生产 RAG 里，Postgres 已经常被拿来管权限、元数据和事务；检索再塞回同一系统，确实能省掉 Elasticsearch / OpenSearch 那类运维负担。可一旦数据更新频繁、租户隔离复杂，BM25 快不快只是第一关，崩不崩在 vacuum、锁和索引膨胀上。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:44

26d ago

FEATUREDHacker News 首页· rssEN13:44 · 05·13

Show HN：Rotunda，一个带模拟输入的 Agent 浏览器

Pierce 发布 Rotunda，这是基于 Firefox 150 的 Agent 浏览器，使用 RNN 模拟鼠标和键盘时序，并通过 CLI 或 Playwright API 接入 Claude、Codex 等工具。

#Agent#Tools#Rotunda#Firefox

精选理由

HKR 三项都成立：模拟鼠标键盘时序是清晰钩子，RNN 与 Playwright 接入给出可验证机制，也贴近 agent 浏览器自动化痛点。来源仍是 Show HN 单项目，缺少采用数据，压在 72–77 档。

一句话点评

Rotunda 的骚点不是“Agent 浏览器”，而是用一周个人键鼠轨迹去骗反自动化；这条线一旦跑通，合规和风控会先炸。

锐评

Rotunda 把浏览器 Agent 的问题搬到了反自动化边界上。它基于 Firefox 150，给 Claude、Codex 暴露 CLI 和 Playwright API，还用 RNN 模拟鼠标、键盘时序；训练数据只有作者自己一周的操作轨迹。这个设计很实用，也很危险：Playwright 这类自动化早被站点风控盯死，模拟人类输入等于直接碰 bot detection 的核心假设。我不太买“agent-first browser”这个包装。Browserbase、Steel、Anchor Browser 这批项目多在讲远程会话、状态管理、tool calling；Rotunda 更像本地反检测实验。正文没有披露成功绕过哪些站点、误封率、延迟开销。没有这些数，它先是一个红队工具胚子，不是生产级 agent runtime。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:00

26d ago

FEATURED彭博科技· rssEN13:00 · 05·13

Amazon 将 Alexa 集成至购物搜索栏

Amazon 将 Alexa 接入 Amazon.com 购物搜索栏；正文只有 RSS 摘要，未披露上线范围、排序机制、转化数据或时间表。

#Agent#Tools#Amazon#Alexa

精选理由

这是 Amazon 级别的常规产品入口更新，HKR-H 成立但正文信息很薄，缺少机制和数据，落在小产品更新的低段。

一句话点评

Amazon 把 Alexa 塞进购物搜索栏，但目前只有标题口径；我更像看到一次流量入口防守，不是 Alexa+ 终于翻身。

锐评

两家都把 Amazon、Alexa+、购物搜索栏放在标题里，口径高度一致；正文为空，价格、上线范围、可用日期、转化指标都没给。这个信号很直接：Amazon 先把生成式入口塞进最高频商业场景，而不是继续把 Alexa 当客厅语音助手讲。我不太买“AI 购物助手”这个包装。Amazon 的硬约束是搜索广告和推荐排序，Alexa+ 进搜索栏后，回答怎么插商品、怎么标 sponsored、怎么处理差评，会比模型能力更关键。对比 Perplexity 买东西和 Google AI Mode，Amazon 的优势不是对话，是它能直接改购买路径。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

12:29

26d ago

FEATUREDr/LocalLLaMA· rssEN12:29 · 05·13

AIDC-AI/Ovis2.6-80B-A3B 登上 Hugging Face

AIDC-AI 发布 Ovis2.6-80B-A3B，多模态 MoE 模型含 80B 总参数、约 3B 激活参数，支持 64K 上下文和 2880×2880 图像输入。

#Multimodal#Vision#Reasoning#AIDC-AI

精选理由

开源多模态 MoE 发布有清楚规格，HKR 三项都过；但正文只给参数、上下文与输入分辨率，未披露 benchmark、license 与实测结果，压在 featured 下沿。

一句话点评

Ovis2.6-80B-A3B 的骚点不是 80B，而是 3B 激活还敢塞 64K 和 2880 图；开源视觉模型在往“便宜能跑文档”卷。

锐评

Ovis2.6-80B-A3B 把多模态开源竞争拉回成本账：80B 总参数听着大，推理只激活约 3B，才是 LocalLLaMA 会买账的点。64K 上下文、2880×2880 图像输入、OCR/图表/长文档问答，目标很明确，就是把视觉模型塞进文档流，而不是陪聊天。我对“Think with Image”那套话有保留。裁剪、旋转、重看局部如果真在 CoT 内可调用，确实贴近 Gemini / Claude 做视觉工具化的路线；但正文没给 benchmark、延迟、显存占用，也没说 3B 激活在高分辨率下吞吐掉多少。这个模型先看部署账，不先看宣传词。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:00

26d ago

FEATUREDAI HOT 精选· aihot-apiZH12:00 · 05·13

为智能体配置开发环境

Cursor发布云端智能体开发环境工具，支持多仓库、Dockerfile配置、审计日志和环境级权限，缓存命中后构建速度提升70%。

#Agent#Code#Tools#Cursor

精选理由

Cursor 为云端代码智能体补齐开发环境层，正文有70%构建提速、Dockerfile、审计日志和权限边界等具体机制；这是中等偏上的产品更新，K/R成立但H较弱，落在featured门槛。

一句话点评

Cursor 把云端 agent 的战场挪到环境治理：多仓库、Dockerfile、审计日志，比再喊“会写代码”实在得多。

锐评

Cursor 这次补的是 agent 落地的脏活，不是模型能力。多仓库环境、Dockerfile 配置、build secrets、环境级网络和密钥控制，都是企业把云端 agent 放进真实工程流前必须过的门槛；缓存命中后构建速度提升 70%，至少说明他们在处理冷启动成本。我更信这类更新，而不是“agent 自动修 bug”的演示。Devin、Copilot Workspace、OpenAI Codex 类产品过去一年都卡在同一个地方：能改代码，不等于能拿到依赖、跑测试、碰内部服务。Cursor 的风险是它还没披露隔离模型、权限继承细节和失败回滚机制；没有这些，fleet of agents 听起来仍像把 CI 权限发给一群实习生。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

11:00

26d ago

● P1OpenAI 博客· rssEN11:00 · 05·13

OpenAI为Windows上的Codex构建安全有效沙箱

OpenAI 为 Windows 版 Codex 构建安全沙箱。RSS 摘要只披露受控文件访问和网络限制，未披露实现细节。

#Agent#Code#Safety#OpenAI

精选理由

OpenAI 官方披露 Codex Windows 沙箱，信息量集中在文件访问与网络限制两项安全边界；不是大版本发布，但对编码代理落地有直接影响，HKR 三项都成立。

一句话点评

OpenAI 给 Windows Codex 补沙箱，暴露的是 coding agent 落地的脏活：模型会写代码不够，OS 权限边界才决定能不能常开。

锐评

2 家跟进同一篇 OpenAI 工程文，口径高度一致；aihot 更像转述，信息链还是官方单源。OpenAI 说 Windows Codex 曾只有 2 个坏选项：几乎每条命令都批准，或开 Full Access；这解释了为什么 coding agent 在 Windows 上总有点半成品味。我比较买账这篇的工程判断。AppContainer、Windows Sandbox、MIC 都被逐个排除，原因不是模型能力，而是开发者工作流太脏：shell、Git、Python、包管理器、构建工具全要跑。和 macOS Seatbelt、Linux seccomp/bubblewrap 相比，Windows 这里确实少了一个好用的默认隔离层。Codex 要抢 IDE 常驻入口，先补这个坑。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

10:40

26d ago

FEATUREDAI HOT 精选· aihot-apiZH10:40 · 05·13

Miaoda 应用与企业版上线，自生成代码占比 90%

百度发布 Miaoda 应用和企业版，称 Miaoda 应用 90% 代码由自身生成，生成应用已服务超 1000 万用户，总价值达 50 亿元人民币。

#Code#Agent#Baidu#Miaoda

精选理由

百度产品更新有明确数字和自举叙事，适合 AI 应用生成与编程工具读者；但来源是公司 X 帖，50 亿元价值缺少第三方口径，压在 featured 低段。

一句话点评

百度说 Miaoda 自写 90% 代码，但 50 亿元“应用总价值”没口径；这更像低代码叙事抢位，不像已验证的开发者迁移。

锐评

百度把 Miaoda 包成“自举编程助手”，但最该打问号的是 50 亿元应用总价值这个口径。正文只给了三个数：Miaoda 应用 90% 代码由自身生成、生成应用服务超 1000 万用户、总价值 50 亿元；没有披露 MAU、付费率、留存、企业版价格，也没有说 90% 是按行数、提交数还是模块数算。我不怀疑代码助手能吞掉企业长尾应用，Cursor、GitHub Copilot 已经把 IDE 入口教育完了。问题是百度讲的是“生成应用价值”，不是开发者愿意付多少钱。没有计费和生产环境 SLA，这个数字更像内部估值表。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

10:06

26d ago

FEATURED量子位 · 公众号· rssZH10:06 · 05·13

字节提出生成精炼网络 GRN，探索视觉生成第三条路线

字节商业化技术团队提出 GRN 视觉生成架构，用 HBQ、全局精炼和复杂度采样处理量化损失、误差积累与固定步数问题，130M 模型将推理从 50 步降至平均 24 步，gFID 从 3.56 变为 3.79。

#Multimodal#Vision#Inference-opt#ByteDance

精选理由

HKR 三项都命中：字节提出 GRN，拿 130M 模型、平均 24 步和 gFID 3.79 给出可讨论证据。它是高质量研究发布，不是旗舰模型上线，停在 78–84 档。

一句话点评

GRN 最扎实的不是“第三路线”口号，而是 130M 模型把 50 步砍到平均 24 步，gFID 只从 3.56 退到 3.79。

锐评

字节 GRN 这篇别按“挑战扩散”读，按推理预算论文读更准。最硬的钩子是复杂度采样：130M 模型从固定 50 步降到 20-40 步，平均 24 步，gFID 只从 3.56 变成 3.79。这不是把画质打爆，而是把无差别迭代改成按熵分配计算。HBQ 的 0.56 rFID、GRN-G 2B 的 C2I FID 1.81 都好看，但文生视频 480p、2-10 秒还停在 2B 展示级别，离 Sora / Veo 那种产品化稳定性不是一档。商业化团队做这个更像在省推理成本，不是单纯发论文刷榜。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

10:06

26d ago

FEATURED量子位 · 公众号· rssZH10:06 · 05·13

8岁小学生 idea 变应用，秒哒 3.0 发布

百度在 2026 Create 大会发布秒哒 3.0，支持生成 iOS 和 Android 应用、安卓打包、在线热更新，并推出企业版三级权限与 SLA。

#Agent#Code#Tools#Baidu

精选理由

百度在 Create 大会发布秒哒 3.0，正文给出移动端生成、打包、热更新和企业权限/SLA 等具体功能；属于中等产品更新，HKR 三项都过，但不是模型发布或行业级能力跃迁。

一句话点评

秒哒3.0把“生成应用”讲到移动端和企业SLA，但这篇把8岁案例写太满；我更关心安卓包和热更新到底能扛多少真实发布。

锐评

百度这次想把秒哒3.0从玩具区拉进生产区，关键不在“8岁小学生”，而在安卓打包、在线热更新、三级权限、环境隔离和SLA这几项硬工程。AI coding产品过去常卡在demo之后：代码能出，发布、协作、回滚、权限没人管。秒哒把这些塞进同一产品，方向是对的。但这篇稿子的证据很软。9万老人平台、44万日访问、120万访问量都给了，没给留存、故障率、SLA等级、iOS上架路径、企业版价格。和Cursor、Claude Code相比，秒哒押的是低代码分发，不是程序员IDE。这个赛道成败看应用能不能长期跑，不看现场能不能复现一个“智会圈”。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

09:42

26d ago

FEATURED机器之心 · 公众号· rssZH09:42 · 05·13

林俊旸被曝创业：新 AI Lab 估值 20 亿美元

The Information 称林俊旸正为新 AI Lab 筹集数亿美元，融资后估值或达 20 亿美元，研究方向和最终估值未披露。

#Agent#Robotics#Multimodal#Lin Junyang

精选理由

HKR 三项都成立，但正文只有 The Information 爆料与融资估值数字，未披露研究方向、团队和产品计划；按 72–77 档给源可信度加权。

一句话点评

20 亿美元估值押的是林俊旸个人信用，不是新 Lab 的产品；方向、条款、首批成员都还太薄，别急着把它神化。

锐评

20 亿美元估值先把林俊旸推成中国版明星实验室样板，但这笔账目前主要靠履历撑着。正文只给了“数亿美元融资”、高榕和红杉接洽、数名字节腾讯及海外成员，研究方向和最终估值都没落定。Qwen 的开源分发确实是硬功劳，林俊旸 33 岁、阿里 P10、带过 Qwen 家族，这些标签足够让资本抢票。我对这条有点警惕。中国闭源模型公司的估值已被 DeepSeek 的低成本开源路线压过一轮，独立 Lab 如果没有算力条款、云入口或明确 agent/robotics 路线，20 亿美元更像人才溢价，不像业务定价。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:31

26d ago

● P1r/LocalLLaMA· rssEN08:31 · 05·13

万亿参数困境：MiMo-V2.5-Pro 开源，API 3.87 亿 tokens 花 70 美元

Xiaomi 开源 MiMo-V2.5-Pro，1.02T 参数、42B 激活、1M 上下文；作者用 API 跑 125 次 Claude Code 会话，3.87 亿 tokens 花费 70.12 美元，缓存命中率 96.3%。

#Agent#Code#Inference-opt#Xiaomi

精选理由

小米开源 1.02T MiMo-V2.5-Pro 属于国产旗舰模型发布；配套的 125 次 Claude Code 会话成本实验给了可讨论数字。来源是 Reddit 单帖，分数放在 85 档低位。

一句话点评

1.02T 开源模型的尴尬来了：能下不等于该自托管，70 美元跑 3.87 亿 tokens 才是这条的刀口。

锐评

MiMo-V2.5-Pro 把开源大模型的账算得很难看：1.02T 参数、42B 激活、1M 上下文很硬，但作者用 API 跑 125 次 Claude Code 会话，只花 70.12 美元处理 3.8738 亿 tokens，缓存命中率 96.3%。这不是模型权重能不能下载的问题，是本地推理很难打过托管缓存经济。MIT 许可给了企业改造空间，Xiaomi 也拿到开发者心智；可对多数团队，自托管 1T MoE 要吞显存、并发、路由、KV cache 和运维。除非你有合规隔离、稳定高吞吐、或要改权重，API 价格已经把“开源即省钱”这句打穿了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:26

26d ago

FEATUREDFT · 科技· rssEN08:26 · 05·13

SoftBank 因 OpenAI 持股收益 250 亿美元推动利润大增

SoftBank 第四季度录得 116 亿美元净利润，OpenAI 持股收益达 250 亿美元，正文未披露估值口径。

#SoftBank#OpenAI

精选理由

FT 来源强，HKR-H/K/R 都成立：250 亿美元未实现收益把 OpenAI 估值和 SoftBank 财报绑在一起，且给出 116 亿美元净利润。但这不是模型或产品更新，正文未披露估值口径，停在 featured 门槛附近。

一句话点评

SoftBank 用 OpenAI 账面收益撑出 116 亿美元季度利润，这不是经营胜利，是 AI 私募估值进损益表的高杠杆表演。

锐评

SoftBank 这季利润质量很薄，116 亿美元净利润靠 250 亿美元 OpenAI 持股收益抬起来。标题已给出核心数字，正文被 FT 订阅墙挡住，估值口径、持股比例、是否已实现收益都没披露。我对这类 AI 财报最警惕：它把未上市模型公司的再融资价格，直接折成上市投资人的利润故事。SoftBank 以前在 WeWork、Arm、Vision Fund 上都玩过账面波动，OpenAI 只是这轮更大的筹码。若没有现金退出或二级交易价格，这个 250 亿美元更像估值温度计，不像盈利能力。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

06:37

26d ago

● P1纽约时报中文网· rssZH06:37 · 05·13

中国曾寻求获取 Anthropic 最新技术但遭拒绝

中国智库代表上月在新加坡要求 Anthropic 向北京开放 Mythos，Anthropic 拒绝；该模型因擅长发现软件漏洞，仅向美国政府和40多家组织提供。

#Code#Safety#Tools#Anthropic

精选理由

NYT 给出 Anthropic 拒绝向北京开放 Mythos 的具体场景、用途和准入范围，HKR 三项都成立；这是安全模型进入地缘政治管制的硬新闻，够同日重点写。

一句话点评

Mythos 被当成网络武器管制了；Anthropic 拒绝北京访问请求，比任何安全白皮书都更诚实。

锐评

Mythos 已经进入准军控区，Anthropic 不是在卖一个代码模型，而是在划美国盟友圈。4 月发布后，它只给美国政府和 40 多家组织使用；中国智库上月在新加坡要北京访问权，被直接拒绝。这个数字很小，说明限制不是合规姿态，是分发设计。纽约时报引述美方估计，OpenAI ChatGPT 5.5 和 Anthropic Mythos 把中美模型差距从约 6 个月拉到 9 到 12 个月。我对这个差距口径有保留，政府口径常混进威慑叙事。但漏洞发现能力一旦接近可操作武器，开源追赶和 API 出口就是两套游戏。DeepSeek 适配华为芯片能补算力链，补不了 Mythos 这种受控访问网络。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

06:37

26d ago

FEATURED纽约时报中文网· rssZH06:37 · 05·13

黄仁勋“最后一刻”获邀随特朗普访华

特朗普周二上午致电邀请黄仁勋随团访华；白宫周一公布的16位CEO名单未包括他，英伟达仍在争取对华销售AI芯片许可。

#Inference-opt#Nvidia#Jensen Huang#Donald Trump

精选理由

NYT来源加上NVIDIA、特朗普访华与AI芯片许可三重交集，HKR三项都成立；但正文信息停在行程与许可争取，未披露政策松动或交易结果，落在精选门槛上方。

一句话点评

黄仁勋临时上“空军一号”，说明英伟达对华芯片许可已从商务部表格变成峰会筹码。

锐评

黄仁勋这次补票上机，不是礼宾失误修正，是英伟达把对华芯片许可压进了元首会晤议程。白宫周一16位CEO名单没有他，特朗普周二上午亲自致电，晚些时候让他在阿拉斯加登上“空军一号”，这个时间线太直白。英伟达争的不是一次出货，而是中国市场的合法留存。文中说特朗普去年夏天批准上一代英伟达芯片对华销售，还计划从销售中抽成，但中国政府尚未批准采购。两边都在把H20这类降规芯片当杠杆：华盛顿怕先进算力外流，北京怕被锁进美国可控供应链。黄仁勋坐上飞机，反而说明单靠合规版SKU已经谈不动了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

06:19

26d ago

● P1AI HOT 精选· aihot-apiZH06:19 · 05·13

SenseTime发布SenseNova-U1技术报告和开源模型

SenseTime 发布 SenseNova-U1 技术报告，披露六阶段训练、RL 后训练与蒸馏；开源版 SenseNova-U1-A3B-MoT 采用 MoE 架构，仅激活 30 亿参数。

#Multimodal#Vision#Fine-tuning#SenseTime

精选理由

HKR 三项都命中：A3B-MoT 的 30 亿激活参数和六阶段训练流程给出可讨论细节；但来源是厂商单帖，正文未披露基准成绩、许可证与复现实验，压在 featured 下沿。

一句话点评

只有标题：SenseTime 发了 SenseNova-U1 技术报告并开源权重，但参数、许可、评测全缺；我先把它看成国产多模态补位，不急着买账。

锐评

2 家来源口径一致：SenseTime 发布 SenseNova-U1 技术报告，并基于 MoE 架构开放模型权重；正文为空，参数规模、许可证、训练数据、benchmark 都没给。我对这条先打折。原生多模态加 MoE 是正确方向，但 2025 年后开源模型的门槛已经不是“放权重”，而是能不能在 MMMU、Video-MME、MathVista、OCRBench 这类测试里压住 Qwen2.5-VL、InternVL 和 DeepSeek 系列的工程惯性。SenseTime 这次标题把“构建全指南”摆在前面，像是在争开发者心智；没有可复现数字前，它还只是一次漂亮的入口声明。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:37

26d ago

FEATURED纽约时报中文网· rssZH05:37 · 05·13

中国寻求AI技术自主，削弱华盛顿制衡北京筹码

DeepSeek最新模型首次针对华为芯片优化推理，训练仍依赖英伟达芯片；华为称训练芯片今年推出，性能追平还需一年。

#Inference-opt#DeepSeek#Huawei#Nvidia

精选理由

NYT把DeepSeek-Huawei适配与训练芯片时间表连到美国制裁筹码，HKR全中；但正文不是新模型发布，也未给性能实测，压在78–84高位。

一句话点评

DeepSeek把新模型推理适配华为芯片，但训练仍靠英伟达；这不是国产替代胜利，是中国AI先把推理侧拆出美国控制。

锐评

DeepSeek这次最硬的是切走推理侧，而不是摆脱英伟达。文章给了两个钩子：新模型首次针对华为芯片优化推理；两位半导体人士说训练仍依赖英伟达。推理是日常成本和部署入口，训练才是前沿模型的算力闸门，所以北京拿到的是一段可运营的自主权，不是完整闭环。华为自己的说法也很克制：训练芯片今年推出，追平英伟达现有性能还要一年。H200获批后仍无对华收入，这让出口管制的谈判价值变得尴尬。美国卡住训练，中国先把模型、芯片、应用绑在推理栈里跑起来；这招不漂亮，但会把Nvidia在中国的默认位置一点点磨掉。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:06

27d ago

FEATURED新智元 · 公众号· rssZH04:06 · 05·13

清华系团队开源 MiniCPM-V 4.6，1.3B 模型支持单张 4090 全量微调

面壁智能、清华大学和 OpenBMB 开源 MiniCPM-V 4.6，1.3B 多模态模型支持单张 RTX 4090 全量微调，并提供 4 倍/16 倍视觉 token 压缩。

#Multimodal#Vision#Fine-tuning#ModelBest

精选理由

MiniCPM-V 4.6 是具备具体参数、硬件条件和压缩机制的开源多模态发布，HKR 三项都成立。它影响本地微调门槛，但不是头部厂商旗舰模型，落在 78–84 推荐档。

一句话点评

MiniCPM-V 4.6最硬的是一张4090全量微调；1.3B多模态若真能稳住4/16倍压缩，端侧VLM门槛会被它砍一截。

锐评

MiniCPM-V 4.6把端侧多模态的门槛打到了消费级显卡，这比“1.3B反超同级”更扎实。文章给了几个硬钩子：单张 RTX 4090 全量微调，4倍/16倍视觉 token 压缩，3136²大图首响延迟快 2.2 倍，AA 运行只耗 5.4M token，对比 Qwen3.5-0.8B 非推理版 101M。这里我买效率路线，但不全买宣传口径。视觉 token 早压缩确实是端侧VLM该卷的地方；可“全面碾压”“工业级武器”这种词太满，正文没给完整任务表、精度损失曲线和4090微调的 batch / 分辨率条件。对开发者来说，先跑文档OCR和高分辨率问答，别先信榜单海报。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:39

27d ago

FEATUREDAI HOT 精选· aihot-apiZH00:39 · 05·13

Google 发布首款 AI 优先笔记本 Googlebook，集成 Gemini

Google 推出 Googlebook，围绕 Gemini Intelligence 设计，包含 Magic Pointer、自然语言小组件生成和 Android 跨设备访问 3 项机制。

#Agent#Tools#Google#Gemini

精选理由

Google 硬件级 Gemini 集成有明确新品类和 3 个交互机制，HKR 全中；但正文未披露芯片、价格、上市时间与实际演示，压在 78–84 档。

一句话点评

Googlebook 把 Gemini 塞进光标和桌面组件，方向对；但没价格、芯片、离线能力，这更像系统入口宣示。

锐评

Googlebook 的赌注很清楚：AI 入口不放在聊天框，而放进光标、桌面组件和 Android 文件流。Magic Pointer、Create Your Widget、跨设备访问这 3 个机制，比再发一个 Gemini app 更贴近日常动作。用户不用先想 prompt，系统在选中文本、看文件、调手机应用时插手。我买这个方向，但不买“AI 优先笔记本”的完成度。正文没给价格、芯片、NPU、续航、离线 Gemini、企业管理策略。Windows Copilot+ PC 已经把本地算力叙事讲过一轮，Chromebook 过去输在高端生产力心智。Googlebook 若只靠 Gemini UI 层，最后会变成一台会弹建议的 Chromebook。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

27d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 05·13

Claude Code 新增 /goal 功能确保任务完成

Claude Code 推出 /goal 功能，让 Claude 持续工作直至任务完成；正文未披露触发机制、适用版本或失败条件。

#Agent#Code#Tools#Anthropic

精选理由

Anthropic/Claude Code 单功能更新，命中开发者长任务完成痛点；信息只到 /goal 名称和目标，缺少版本、机制、失败条件，所以停在 featured 下沿。

一句话点评

Claude Code 给 /goal 起了个好名字，但没有机制和失败边界，这更像把“继续做”包装成完成承诺。

锐评

Claude Code 的 /goal 现在卖的是耐心，不是可靠完成。标题给出“持续工作直至任务完成”，但正文只说“通过几种方式提供帮助”，没给触发机制、适用版本、价格、超时、回滚或失败条件。代码 agent 的难点从来不是多跑几轮，而是知道何时停、何时问人、何时承认做坏了。Cursor、Windsurf、Codex CLI 这类产品都绕不开同一件事：长链路任务会把误判成本放大。Anthropic 如果只给一个 /goal 命令，却不给可审计的 stop criteria，这个功能对 demo 很友好，对生产仓库仍然危险。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

27d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 05·13

AgentLens 揭示软件工程智能体评估中的“幸运通过”问题

研究分析2614条软件工程智能体轨迹，发现1815条可评估通过轨迹中10.7%为“幸运通过”，并开源AgentLens框架与AgentLens-Bench。

#Agent#Code#Benchmarking#AgentLens

精选理由

AgentLens把SWE智能体评测里的“幸运通过”量化为10.7%，有开源框架和基准，HKR三项都成立；但仍是单篇arXiv评测研究，未见跨源行业事件，落在78–84。

一句话点评

SWE-agent 榜单又被戳了一刀：1815 条通过轨迹里 10.7% 是撞线，不看过程的 pass rate 已经不够用了。

锐评

AgentLens 把 SWE-agent 评测里最脏的一块摊开了：通过测试不等于会修 bug，10.7% 的 passing 轨迹靠回归循环、盲重试、缺验证撞过去。它看了 2,614 条 OpenHands 轨迹，覆盖 8 个模型后端、60 个 SWE-bench Verified 任务，最后用 1,815 条可评估通过轨迹做过程评分。更扎心的是，按质量分重排后，有些模型名次能移动 5 位。SWE-bench Verified 过去一年被当成 coding agent 硬通货，但如果过程质量差这么多，厂商只晒 pass@1 就有点糊弄同行了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

27d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 05·13

检索廉价，代码为王：基于可执行程序的多跳推理 RAG

研究团队提出 PyRAG，把多跳 RAG 重构为 Python 程序合成与执行，并在 PopQA、HotpotQA 等 5 个问答基准上优于基线。

#RAG#Reasoning#Tools#PyRAG

精选理由

HKR 三项都过：标题有反差，正文给出 Python 程序合成与执行机制，以及 5 个问答基准优于基线。仍是 arXiv 研究稿，未披露幅度、代码可用性与生产验证，放在 78–84 的研究推荐档。

一句话点评

PyRAG 把多跳 RAG 拉回可执行轨迹，这比又发明一种 CoT 提示靠谱；但论文页没给具体分数，先别替它吹 SOTA。

锐评

PyRAG 的判断很对：多跳问答的问题不是检索不够多，而是中间状态没人管。它把推理写成 Python 程序，显式调用 retrieval 和 QA tools，再靠执行结果做 self-repair；这比让同一个模型写答案、再自我反省，工程上干净得多。证据也够具体：论文在 PopQA、HotpotQA、2WikiMultihopQA、MuSiQue、Bamboogle 这 5 个基准上测了 training-free 和 RL-trained 两种设置，还公开代码、数据和模型。但 arXiv 摘要页没披露提升幅度、基线配置、执行成本。RAG 论文最爱赢在 benchmark 表格，输在生产延迟和工具失败率；PyRAG 要证明的是代码轨迹能稳定省错，不是 Python 外壳更好看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

27d ago

FEATUREDOpenAI 博客· rssEN00:00 · 05·13

OpenAI回应TanStack npm供应链攻击

OpenAI 说明 TanStack“Mini Shai-Hulud”npm 供应链攻击应对，macOS 用户须在 2026 年 6 月 12 日前更新 OpenAI 应用。

#Safety#OpenAI#TanStack#Incident

精选理由

OpenAI 官方安全响应，给出 TanStack npm 供应链攻击和 macOS 端 2026-06-12 更新期限；影响规模与技术细节未披露，压在 featured 下沿。

一句话点评

OpenAI 把 TanStack npm 事故拉到客户端证书层处理，6 月 12 日 macOS 强制更新这个日期，比公关式“已修复”更刺眼。

锐评

OpenAI 这次给出的不是普通 npm 事故复盘，而是一次客户端信任链止血。TanStack“Mini Shai-Hulud”供应链攻击本来听起来像前端包污染，但 OpenAI 明说处理了系统防护和签名证书，还要求 macOS 用户在 2026 年 6 月 12 日前更新 OpenAI 应用。这个日期很关键：如果只是清理依赖，用户端不该承担硬截止。正文来自 RSS 片段，没披露受影响版本、证书轮换范围、攻击是否触达构建机。我的判断偏谨慎——这类事故的成本不在 npm 包本身，而在开发者机器、CI、签名资产之间那条灰色链路。xz 后门事件已经演过一次，包管理器只是入口。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

热点聚合 · 2026-05-13

更多

频道

后台