热点聚合 · 2026-05-31

▸ 13 signals · updated 3m ago

live · 612 today·policy v2

FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·

⤓ RSS live

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

125 212 320 419 541 631 749 827 923 1016 1136 1248 1339 1455 1535 1629 1721 1844 1973 2042 2143 2246 2311 2413 2520 2633 2738 2844 2931 3019 3113

2026年6月

一二三四五六日

138 250 349 443 539 616 713 838 99101112131415161718192021222324252627282930

2026-05-31 · 星期日2026年5月31日

20:35

8d ago

FEATUREDr/LocalLLaMA· rssEN20:35 · 05·31

NVIDIA Parakeet 语音转文本移植到 ggml：GGUF 量化、无 Python

mudler_it 将 NVIDIA Parakeet 语音转文本模型移植到 C++/ggml，f32/f16 路径与 NeMo 字节一致，GPU 最高约 5 倍加速。

#Audio#Inference-opt#Tools#NVIDIA

精选理由

这是 Reddit 上的开源移植，不是大厂模型发布；但有可验证性能数字和部署机制，且作者一手实验命中本地推理人群，刚过 featured 线。

一句话点评

Parakeet 进 ggml 的关键不是“又一个移植”，而是 STT 终于开始走 llama.cpp 那条本地化分发路。

锐评

Parakeet 进 ggml 会逼 STT 工具链降依赖，而不是只换一个后端。标题给出 f32/f16 与 NeMo 字节一致、GGUF 支持 f16 到 q4_k、GPU 最高约 5 倍加速；正文只返回 Reddit 403，benchmark 音频、显卡、批量大小都没披露。这个信息缺口很大，但方向很清楚：Whisper.cpp 证明过一次，ASR 模型一旦进 GGUF，就会被塞进桌面端、边缘盒子、离线客服和本地 agent。NVIDIA Parakeet 原本在 NeMo 生态里，Python/PyTorch 是部署门槛；ggml 版本把门槛拆到一个二进制文件。5 倍加速先别信满，字节一致性才是硬钩子。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:07

8d ago

FEATUREDAI HOT 精选· aihot-apiZH16:07 · 05·31

OpenAI正式进军机器人领域并启动招聘

OpenAI成立OpenAI Robotics团队，招聘全栈硬件、系统及ML工程师；Aditya Ramesh负责该项目，短期目标面向技术工人，正文未披露招聘规模。

#Robotics#OpenAI#Aditya Ramesh#Personnel

精选理由

OpenAI设立Robotics团队并公开招聘，具备OpenAI级别的方向信号，HKR三项都成立；但正文未披露产品形态、时间表和招聘规模，压在85以下。

一句话点评

OpenAI 机器人团队公开招聘，规模没披露；我看这不是发布产品，是把“世界模型”从 demo 拉到硬件债里还账。

锐评

OpenAI 现在碰机器人，野心大过证据。正文只给了 OpenAI Robotics、Aditya Ramesh、全栈硬件 / 系统 / ML 工程师三个钩子，招聘规模、硬件形态、时间表全空。短期目标还写成“支持技术工人构建未来基础设施”，这类表述离可交付产品很远。我更信这是世界模拟研究的落地方向，而不是 Figure AI 式人形机器人冲刺。Ramesh 从 DALL·E 到世界模拟，路径讲得通；但机器人最难的不是模型会不会想象场景，是数据采集、执行器、可靠性和售后。OpenAI 可以用模型压低控制栈门槛，却躲不开硬件迭代周期。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:53

8d ago

FEATUREDHacker News 首页· rssEN13:53 · 05·31

用200英镑二手数据中心GPU改装游戏PC

标题已给出作者以 £200 将数据中心 GPU 装入游戏 PC，正文未披露 GPU 型号、驱动配置、本地 LLM 性能或功耗数据。

#Inference-opt#Commentary

精选理由

HKR-H 和 HKR-R 成立，标题对本地 LLM 硬件党有吸引力；HKR-K 失手，正文缺型号、性能、功耗等可复现信息，只能放在低价值但可浏览区。

一句话点评

3 个社区源同时转这篇，信号不是“穷人 32GB 显存”，而是本地推理玩家已经愿意为 VRAM 改硬件了。

锐评

3 个源都围着同一篇博客转，角度高度一致：£200 的 Tesla V100 SXM2 加转接板，和 RTX 4080 凑出 32GB 显存。这个热度不是硬件捡漏小品，而是本地 LLM 的成本曲线露馅了。具体钩子很硬：V100 是 2017 年卡，16GB HBM2，900GB/s 带宽，作者用 llama.cpp 跑 27B 模型到 32 tokens/s。代价也很真实：SXM2 非 PCIe、82dB 风扇、PWM 飞线、双卡切层不等于单卡 32GB。NVIDIA 把消费卡显存卡得越紧，二手数据中心垃圾就越像民间推理栈。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

13:44

8d ago

FEATUREDr/LocalLLaMA· rssEN13:44 · 05·31

13 个 Gemma 4 E2B 去审查变体：44 GPU 小时基准对比

Abliterlitics 测试 13 个 Gemma 4 E2B 去审查变体，44 个 RTX 5090 GPU 小时显示 HarmBench ASR 从基座 32.2% 升至 82%–100%，coder3101 在 GSM8K 达 84.8%。

#Safety#Benchmarking#Reasoning#Google

精选理由

HKR 三项都命中，且是带数字的第一手社区实验；但对象是 Gemma 4 E2B 去审查变体，影响面窄于主流模型发布，放在 featured 门槛段。

一句话点评

只有摘要，Reddit 正文 403；但 Gemma 4 E2B 去审查后 HarmBench ASR 到 82%–100%，安全层看着很薄。

锐评

Gemma 4 E2B 的安全对齐在这组结果里像一层可剥涂层。Abliterlitics 用 44 个 RTX 5090 GPU 小时测 13 个去审查变体，HarmBench ASR 从基座 32.2% 拉到 82%–100%；这不是小幅漂移，是护栏被定向拆掉后的裸奔区间。更尴尬的是 coder3101 的 GSM8K 还从 83.5% 到 84.8%，至少摘要里没看到能力被明显牺牲。 Reddit 正文被 403，没法核验方法、prompt、样本量和是否用了同一评测脚本。我会先把它当红队信号，不当论文结论。但对开源小模型阵营够刺耳：如果 44 GPU 小时就能把拒答层打穿，Google 发 E2B 权重时写多少 safety card 都挡不住二次分发。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:12

8d ago

FEATUREDAI HOT 精选· aihot-apiZH12:12 · 05·31

苹果WWDC将推AI升级：Gemini蒸馏模型本地运行，外部依赖显著

苹果将在下月WWDC展示Siri和设备端AI升级，iPhone本地运行Gemini蒸馏小模型，复杂查询路由至Google Cloud并采用Nvidia机密计算。

#Agent#Inference-opt#Tools#Apple

精选理由

Apple、Google、Nvidia三方栈若在WWDC落地，会影响端侧AI与隐私叙事，HKR三项都命中。分数压在82，因为正文只有单条X信息，未披露模型规模、延迟、价格与正式合作条款。

一句话点评

苹果把“私有云AI”交给 Gemini、Google Cloud 和 Nvidia，WWDC 的问题不是 Siri 变聪明了多少，是苹果还剩多少自研栈。

锐评

苹果这次最尴尬的点，是把隐私叙事建在外部模型和外部云上。正文给的链路很具体：iPhone 本地跑 Gemini 蒸馏小模型，复杂查询进 Google Cloud，还要用 Nvidia 机密计算。2024 年苹果说 Private Cloud Compute 会跑在苹果芯片上，现在完整 Gemini 扛不住，方案部分转向谷歌云，名字还保留。我不太买“这只是合作补能力”的说法。OpenAI、Anthropic 都在把模型能力和推理栈绑得更紧，苹果却在 WWDC 前把模型、云、机密计算拆给三家。它当然有设备、系统和分发，但 Siri 延迟这么久后交出这套组合，像是在承认端侧优先路线被大模型体量打穿了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

09:47

8d ago

FEATUREDr/LocalLLaMA· rssEN09:47 · 05·31

PolyRange：面向 Web 目标的抗污染 offensive-AI benchmark

PolyRange v1.0 发布 84 个 WSTG 类，覆盖 12 个 OWASP 类别，采用每次部署由 LLM 新生成任务、两档防御和 agent 提交 flag 判定。

#Agent#Benchmarking#Safety#PolyRange

精选理由

HKR 三项都成立：PolyRange 把 Web 安全靶场做成动态生成任务的 agent benchmark，有 84 个 WSTG 类和两档防御；但来源单一且偏安全圈，压在 78。

一句话点评

只有摘要能看：PolyRange 用 84 类动态靶场反制 benchmark 污染，安全评测终于从选择题挪到可复现实战。

锐评

PolyRange 把 offensive-AI 评测拉回执行层，这比再刷一张静态 CTF 榜单靠谱。摘要给出 84 个 WSTG 类、12 个 OWASP 类别、每次部署由 LLM 新生成任务、两档防御、agent 提交 flag 判定；这些机制至少能压住训练集泄漏和题库背诵。我喜欢的是“fresh targets per deploy”这个设计，Anthropic / OpenAI 的安全报告常引用受控 cyber eval，但外部复现空间很小。PolyRange 跑 Fly.io 或 Docker 单命令，门槛低很多。问题也硬：正文被 Reddit 403 拦了，没看到题目生成模型、判分抗作弊、成本和失败样本。没有这些，84 类只是覆盖面，不等于有效难度。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:27

8d ago

FEATUREDr/LocalLLaMA· rssEN08:27 · 05·31

无需改代码，在官方 OpenAI Codex 桌面应用中使用任意模型和提供商

Reddit 用户 thibautrey 提出 3 步配置：改 Codex Desktop 的 config.toml、写入 API key、用 multicodex proxy alias 将 gpt-5.3-codex 映射到 MiniMax-Latest。正文披露本地 base_url 为 127.0.0.1:1455。

#Agent#Code#Tools#OpenAI

精选理由

这是可复现的开发者工作流技巧，不是官方发布；HKR-H 来自反锁定角度，HKR-K 有配置细节，HKR-R 命中成本与模型选择焦虑，落在教程型 featured 门槛。

一句话点评

Codex Desktop 被代理骗过模型名，这不是越狱炫技，是官方客户端把 provider 抽象层留给了社区。

锐评

Codex Desktop 这次暴露的是产品边界太薄：3 步改 config.toml、写 API key、把 gpt-5.3-codex alias 到 MiniMax-Latest，就能在官方壳里跑第三方模型。钩子很具体，本地 base_url 是 127.0.0.1:1455，代理还会把返回模型名伪装成 gpt-5.3-codex。我不把它看成稳定方案。正文实际只有 Reddit 摘要，目标页 403，没披露 Codex Desktop 版本、校验逻辑、工具调用兼容率。Cursor、Continue 早就把多 provider 做成正门；OpenAI 若不想让 Codex 变成漂亮前端，就得在认证、模型能力声明、tool schema 上收口。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:08

8d ago

FEATURED机器之心 · 公众号· rssZH05:08 · 05·31

一周 3.3k star，微软开源 SkillOpt 训练 Agent 技能文档

微软开源 SkillOpt，把 Agent 技能文档当作文本参数训练；论文称其在 52 个模型、基准、环境组合中达到最优或并列最优。

#Agent#Tools#Benchmarking#Microsoft

精选理由

微软开源SkillOpt属于高质量Agent研究与工具发布；HKR-H有3.3k star和“训练技能”钩子，HKR-K有文本参数机制与52组评测，HKR-R触达Agent工程化痛点，给82分进入featured。

一句话点评

微软 SkillOpt 把 skill 文档当外部权重训，52 组全赢；别急着喊自进化，关键是验证门控把 prompt 工程变成了可回归工程。

锐评

SkillOpt 最狠的点不是“像训神经网络”，是把 CLAUDE.md / Codex skill 这类玄学手艺塞进了验证闭环。它冻结模型权重，只改自然语言技能文档；7 个目标模型、6 个 benchmark、3 个执行环境共 52 组，论文称全部最优或并列最优。证据里最有用的是工程约束：默认 textual learning rate=4，每步最多 4 个 add/delete/replace；去掉后 SearchQA 从 87.1% 掉到 84.6%，LiveMath 从 61.3% 掉到 57.3%。我不太买“智能体一切都能自我学习”这种结尾，GEPA、TextGrad 早就在碰文本优化。SkillOpt 赢在 held-out gate 和 rejected-edit buffer，把失败编辑也纳入训练记忆。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:08

8d ago

FEATURED机器之心 · 公众号· rssZH05:08 · 05·31

Rubrics 综述：Agent 时代如何定义一个“好答案”？

中国人民大学高瓴人工智能学院发布 40 页 Rubrics 综述，将评价标准划分为定义、构造、训练、评测和开放挑战 5 类。

#Agent#Alignment#Benchmarking#Renmin University of China

精选理由

HKR 三项都命中，但素材是学术综述而非模型或产品发布；40页 Rubrics 框架对Agent评测有用，按“质量教程/综述”放在精选门槛。

一句话点评

Rubrics 这波热得合理，但别把评分表当护城河；Agent 训练里，谁能防 reward hacking，谁才有硬东西。

锐评

Rubrics 现在被重新抬上桌，是因为 Agent 任务把“标准答案”打碎了。人大高瓴这篇 40 页综述把定义、构造、训练、评测、开放挑战分成 5 类，钩子很清楚：LLM-as-a-Judge 解决谁来评，Rubrics 解决按什么评。我不太买“写清规则就能优化行为”的乐观叙事。Rubrics 一进 PPO、GRPO 这类 policy RL，就会变成可被策略模型钻的奖励接口；医疗安全这种维度还不能用普通加权分数处理，文中也提到 veto、saturation、在线演化。OpenAI、Anthropic 这两年都在往可解释 reward 和过程监督走，难点从来不是列 12 条标准，而是让标准在长程轨迹里不被模型学成格式套路。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:07

8d ago

FEATURED新智元 · 公众号· rssZH05:07 · 05·31

复旦系团队发布时空一体世界动作模型STI-WM

眸深智能发布 STI-WM 时空一体世界动作模型，称其支持 RGB、点云和本体输入、百秒级规划，并披露半年 5 轮融资、Pre-A 轮 3 亿元。

#Robotics#Multimodal#Agent#MouShen Intelligence

精选理由

HKR-H/K/R 都成立：STI-WM 把 RGB、点云、本体输入合到百秒级规划，还披露半年5轮融资、Pre-A 3亿元。信息偏公司发布口径，缺少公开评测和可复现入口，压在 featured 门槛段。

一句话点评

只有摘要，没有评测视频和失败率；STI-WM 把融资、世界模型、百秒规划绑在一起讲，机器人叙事味太重。

锐评

眸深智能这条最该打折的地方，是把“时空一体世界动作模型”和 Pre-A 轮 3 亿元放在同一张桌上卖。摘要给了 RGB、点云、本体输入和百秒级规划，但正文被微信验证挡住，没看到任务集、真实机器人成功率、推理延迟、闭环频率。机器人世界模型最怕演示好看、部署稀碎，Google RT-2、Figure、1X 都栽过泛化口径。半年 5 轮融资说明资本追得急，不说明 STI-WM 已经跨过可复现控制这道坎。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:00

8d ago

FEATURED量子位 · 公众号· rssZH05:00 · 05·31

复旦×通义提出 ToolCUA，让 Agent 学会在 GUI 与 Tool 间选路

复旦大学与通义实验室提出 ToolCUA-8B，在 OSWorld-MCP 上达 46.85% 准确率，使用 4k 工具与 180k 步合成轨迹训练。

#Agent#Tools#Fine-tuning#Fudan University

精选理由

Agent 工具选择训练范式有明确实验数字，复旦×通义与 Qwen 背书提高可信度，命中 HKR 三项；但目前只是单篇研究/开源线索，未到主流模型发布或产品级能力更新。

一句话点评

给 Agent 塞工具不难，难的是教它少犯贱：ToolCUA-8B 用 4k 工具轨迹把 8B 模型拉到 46.85%，这比“接上 MCP 就会变强”清醒多了。

锐评

ToolCUA 的狠点不是 46.85% accuracy，而是把“工具越多越强”这句行业口头禅拆穿了。正文给的反例很硬：Claude-4.5-Sonnet 接工具后，步骤从 23.3 降到 19.1，准确率却从 61.9% 掉到 48.4%；Qwen3VL-235B 也从 41.1% 掉到 38.1%。复旦和通义的解法像工程脏活，不像漂亮 demo：4k synthetic tools、180k interleaved steps、5k critical switching samples，再用只在成功轨迹上激活的 R_tool / R_length 修路径选择。我比较买账的是这个约束，奖励“该用才用”，不是刷 tool call 数。短板也明显：OSWorld-MCP 是 150+ tools 的受控环境，离企业里乱命名、权限残缺、返回脏数据的工具层还差一截。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:00

8d ago

FEATURED量子位 · 公众号· rssZH05:00 · 05·31

英伟达版“MacBook Pro”曝光：黄仁勋自研 CPU

NVIDIA、Microsoft 和 Arm 同日发布“PC 新纪元”暗示，正文称 N1X 笔记本或采用 20 核 ARM CPU、Blackwell GPU、6144 个 CUDA 单元和 128GB LPDDR5X 统一内存。

#Inference-opt#Agent#NVIDIA#Microsoft

精选理由

HKR 三项都命中，但正文信息仍是“暗示/或采用”的曝光口径，未确认发布时间、价格和量产计划；按中等偏强硬件传闻处理，卡在 featured 低段。

一句话点评

别把 N1X 当英伟达版 MacBook Pro；20 核 ARM、6144 CUDA、128GB 统一内存更像本地推理盒子披了笔记本壳。

锐评

N1X 最有杀伤力的不是 PC 形态，是英伟达把 CUDA 开发环境塞进 Windows on Arm 消费入口。传闻规格给到 20 核 ARM CPU、Blackwell GPU、6144 个 CUDA 单元、128GB LPDDR5X 统一内存，听着像移动版 DGX Spark；但正文也承认带宽约 273GB/s，x86 应用还要转译，游戏本叙事很虚。我不太买“AI 原生 PC=印刷机”这个类比。本地模型的瓶颈早就不是有没有一台机器，而是模型权重、工具链、散热、价格和开发者默认工作流。苹果 M 系列证明统一内存能养出本地 AI 体验，NVIDIA 的筹码是 CUDA，不是 PC 新纪元这句口号。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

01:30

9d ago

FEATUREDAI HOT 精选· aihot-apiZH01:30 · 05·31

6000 多公里全程零干预：特斯拉 FSD 完成横穿加拿大自动驾驶

特斯拉 FSD V14.3.3 完成温哥华到哈利法克斯 6051 公里零干预行程，历时 4 天 21 小时，全程无系统退出或人工修正。

#Agent#Robotics#Tesla#Product update

精选理由

HKR 三项都命中：特斯拉 FSD V14.3.3 的 6051 公里零干预行程有清晰数字和可讨论性。分数未进 85+，因为正文只给结果，缺少独立验证、路线细节与失败边界。

一句话点评

6051 公里零接管很硬，但别急着喊 L4；这是车主实测和官方点赞，不是监管口径下的安全案例。

锐评

特斯拉 FSD V14.3.3 跑完 6051 公里零接管，最刺眼的是它仍被官方定义为二级辅助驾驶。温哥华到哈利法克斯 4 天 21 小时，含施工、天气、高速并线、超充泊车，正文称零系统退出、零人工修正；这已经不是短视频式炫技。但样本也很窄：David Moss 团队单车路线，验证口径来自 X 公布和特斯拉 AI 主管祝贺，没有独立日志、原始视频覆盖率、ODD 边界。Waymo 的强项是限定城市和责任闭环，Tesla 把通用道路能力推到前台；监管会卡在后半句。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

热点聚合 · 2026-05-31

更多

频道

后台