热点聚合 · 2026-05-23

▸ 11 signals · updated 3m ago

live · 612 today·policy v2

FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·

⤓ RSS live

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

125 212 320 419 541 631 749 827 923 1016 1136 1248 1339 1455 1535 1629 1721 1844 1973 2042 2143 2246 2311 2413 2520 2633 2738 2844 2931 3019 3113

2026年6月

一二三四五六日

138 250 349 443 539 616 713 838 99101112131415161718192021222324252627282930

2026-05-23 · 星期六2026年5月23日

22:48

16d ago

FEATUREDr/LocalLLaMA· rssEN22:48 · 05·23

llama.cpp server 内置原生工具：exec_shell、edit_file 等

llama.cpp server 通过实验性 --tools 参数支持 8 类原生工具，文件操作相对启动目录执行，正文称尚无命令白名单或严格沙箱。

#Agent#Tools#Code#llama.cpp

精选理由

llama.cpp 属于本地 LLM 栈核心项目，内置 shell 与文件工具把 server 推向 Agent 运行时，且正文给出 8 类工具与无严格沙箱。来源是 Reddit、功能仍实验性，压在 featured 低段。

一句话点评

llama.cpp 把 8 个工具塞进 server，很方便，也很危险；没有白名单和沙箱的 exec_shell 不该默认接近生产目录。

锐评

llama.cpp 这次把本地 agent 门槛降得太快，安全边界没跟上。`--tools` 一口气给了 8 类能力：`read_file`、`grep_search`、`exec_shell_command`、`edit_file`、`apply_diff` 等，文件操作还按 server 启动目录相对执行。对 LocalLLaMA 用户，这确实少了一层 MCP 或 Python wrapper。可问题也在这里：一个 `.gguf` 加二进制就能读写文件、跑 shell，而正文明确说没有命令白名单，也没有严格沙箱。OpenAI Codex、Claude Code 这类工具至少把审批、目录权限、diff 展示做成显性流程；llama.cpp 现在像把 agent runtime 直接焊进推理服务。玩具项目爽，真实代码仓库里挺吓人。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:45

16d ago

FEATUREDAI HOT 精选· aihot-apiZH21:45 · 05·23

StepAudio 2.5 实时语音发布：副语言感知与人格化交互

StepFun 发布 StepAudio 2.5 Realtime，支持中英文实时语音、API 自定义人格、上万种原生人格选项和 5 个预设人格。

#Audio#Agent#Alignment#StepFun

精选理由

HKR 三项都命中，但信息来自官方 X 发布，正文未披露延迟、价格、评测与开放范围；按中等产品更新给到 featured 门槛。

一句话点评

StepFun 把实时语音押到“人格库”，但 1 万人格没有延迟、价格、打断数据支撑，听起来更像角色商品化。

锐评

StepAudio 2.5 Realtime 的卖点放在副语言感知和人格规模，这个方向对，但叙事有点飘。正文给了中英文、API 自定义人格、上万原生人格、5 个预设人格、RLHF 角色一致性；没给首包延迟、端到端延迟、打断成功率、并发价格，也没说“微表情”来自视频输入还是语音推断。语音模型这半年拼的不是会不会装人，而是打断、延迟、情绪跟随和长会话稳定性。OpenAI Realtime API 和 Gemini Live 已经把门槛抬到可用交互层。StepFun 如果只把人格数做成货架，开发者拿到的是素材库，不是可托管的语音 agent 底座。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:58

16d ago

FEATURED机器之心 · 公众号· rssZH13:58 · 05·23

22.9倍加速：FlashAR 用0.05%数据加速预训练自回归图像模型

浙江大学与阿德莱德大学提出 FlashAR，用 0.05% 原始训练数据把 Emu3.5-Image-34B 的 512×512 生成从 130.10 秒降到 5.68 秒，GenEval 总分从 80.48 降至 80.29。

#Inference-opt#Vision#Multimodal#Zhejiang University

精选理由

HKR 三项都成立：FlashAR 给出具体加速倍数、数据比例、耗时和 GenEval 变化，且面向自回归图像模型的推理瓶颈。非头部实验室发布，先放在80分精选，不上P1。

一句话点评

FlashAR最狠的不是22.9倍，而是把AR图像生成的1024步串行砍到63步，还只喂8万张图；扩散模型的护城河又少一块。

锐评

FlashAR打到的是AR图像模型最尴尬的部署点：质量够了，延迟烂到没法用。Emu3.5-Image-34B在512×512上从130.10秒降到5.68秒，GenEval只从80.48掉到80.29；关键机制是加垂直预测头，把32×32 token的解码从1024步压到H+W-1的63步。我对“几乎无损”先买一半。GenEval覆盖不了审美、文本细节和长提示一致性，8万张后训练数据也不等于广域稳。可BlockDiffusion同设置掉到73.83，FlashAR至少证明一件事：AR图像生成不必靠从头预训练才拿到并行性。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:58

16d ago

FEATURED机器之心 · 公众号· rssZH13:58 · 05·23

Bengio 新论文刷新递归推理上限，并行轨迹碾压串行推理

Yoshua Bengio 团队提出 GRAM，在 16 步递归加 20 条并行采样下，Sudoku-Extreme 准确率达 97.0%，超过 TRM 320 步串行递归的 90.5%。

#Reasoning#Inference-opt#Benchmarking#Yoshua Bengio

精选理由

Bengio团队论文有明确机制与数字，且“并行轨迹胜过长串行递归”对推理范式有讨论价值；但证据集中在Sudoku-Extreme，离通用模型产品更新还有距离，落在78–84档。

一句话点评

GRAM 最狠的点不是 97.0% 数独，而是把推理扩展从“多想几步”拆成“并行赌 20 条潜在轨迹”。

锐评

GRAM 给递归推理补上的不是随机噪声，而是可训练的搜索宽度。Sudoku-Extreme 上，16 步递归加 20 条并行采样到 97.0%，压过 TRM 320 步串行递归的 90.5%；这个差距直接打在 CoT 长 token 推理的延迟软肋上。我不急着把它外推到通用 agent。任务还是数独、N-Queens、Graph Coloring、ARC-AGI 这类强结构问题，选择机制还有多数投票和 LPRM 加持。可它把 LeCun 那套“潜在空间规划”从口号拉回可测实验：同样算预算，宽度搜索比一条链猛卷深度更像工程答案。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

11:40

16d ago

FEATUREDr/LocalLLaMA· rssEN11:40 · 05·23

Qwen3.6 27B在100k上下文窗口下的推理性能测试

Reddit 用户用 40GB VRAM 运行 Qwen3.6 27B，在 100k 上下文下生成 22-30 tok/s，提示处理 300-500 tok/s。

#Agent#Inference-opt#Multimodal#Qwen

精选理由

HKR 三项都命中，但来源是单条 Reddit 实测，影响面偏窄；有具体吞吐数字，适合进入 all，不到 featured 的源权威与行业影响门槛。

一句话点评

两个 LocalLLaMA 帖子只给标题和 403，100k 下 Qwen3.6 27B 的速度结论还站不住；先别拿截图数字当选型依据。

锐评

两个 LocalLLaMA 帖子同时讨论 Qwen3.6 27B 在 100k 上下文的速度与质量，但正文被 403 挡住，只有标题链路。这更像社区调参现场，不像可复现评测。我对这类长上下文速度贴一向很警惕：100k 条件下，prefill、KV cache、量化格式、batch size 任一项不同，tokens/s 都会飘。标题里一个问“怎么优化”，一个问“怎么解释结果”，说明连测试者也没把机制讲清。拿它和 vLLM 跑 Qwen2.5 32B、Llama 3.x 长上下文的正式 benchmark 比，证据密度差太远。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

11:00

16d ago

FEATUREDThe Verge · AI· rssEN11:00 · 05·23

Google 新款 anything-to-anything AI 模型上手体验

The Verge 试用 Google Gemini 新模型做玩偶 deepfake 视频，RSS 正文只披露 1 个毛绒鹿案例，未披露模型参数、价格或发布时间表。

#Multimodal#Vision#Google#Gemini

精选理由

Google/Gemini 多模态新能力有 The Verge 上手和 deepfake 钩子，HKR-H/R 成立；但正文事实稀薄，只给 1 个案例，缺价格、参数、开放时间，压在 featured 门槛。

一句话点评

只有 1 个毛绒鹿案例，没有价格、参数、上线时间；Google 这类 anything-to-anything 演示最该防的是把可玩性包装成产品可信度。

锐评

Google 这次最危险的不是 deepfake 效果好，而是门槛低到 The Verge 用 1 个毛绒鹿就能复现广告感。RSS 只给了 Buddy the deer 这个案例，模型参数、价格、发布时间、安全控制全没披露，所以别急着把它归进 Gemini 产品线胜利。我更警惕 Google 的叙事：anything-to-anything 听着像统一模型能力，落地时常变成一堆演示链路。Veo、Sora、Runway 都证明了视频生成的短板不在“能不能动”，而在一致性、可控性和滥用成本。这里正文只证明了一件事：普通人制作拟真小视频的摩擦又降了一档。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

08:00

16d ago

FEATUREDFT · 科技· rssEN08:00 · 05·23

SpaceX、OpenAI 和 Anthropic 计划IPO融资

标题已给出 SpaceX、OpenAI、Anthropic 3家公司 IPO 主题，正文为 FT 订阅页，未披露估值、时间表或募资规模。

#SpaceX#OpenAI#Anthropic#Funding

精选理由

FT 题材和对象足够强，HKR-H/R 成立；但可读正文只有订阅页，缺少估值、时间表和募资规模，只能按高关注度市场前瞻处理，未到 featured。

一句话点评

3 家把 SpaceX、OpenAI、Anthropic 放进同一个 IPO 框，AI 公司终于要拿公开市场审 GPU 烧钱率。

锐评

3 家同时跟进，FT 两篇都把焦点放在“巨型 IPO”与华尔街交易热，yage-share 用“三份招股书”框成三个赌注；口径高度一致，但正文被 FT 订阅墙截断，估值、时间表、融资规模没有展开。我看这不是普通上市窗口，而是 AI 私募估值向二级市场转嫁压力。OpenAI 和 Anthropic 的核心问题很具体：训练与推理成本持续吞现金，收入质量还要经受招股书审计。和 Databricks、Stripe 这种延迟上市不同，模型公司要解释的是 GPU 租约、云商依赖、毛利曲线。标题把 SpaceX 放一起，其实是在借 Musk 资产稀释 AI 现金流焦虑。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

03:47

17d ago

● P1量子位 · 公众号· rssZH03:47 · 05·23

DeepSeek V4 降价，宁德时代、京东、网易洽谈入场，梁文锋称目标是 AGI

DeepSeek-V4-Pro API 将于 6 月 1 日永久降价至促销价，输入缓存命中 0.025 元/百万 Token，彭博称其推进 700 亿元融资、投前估值 450 亿美元。

#Inference-opt#DeepSeek#CATL#Liang Wenfeng

精选理由

DeepSeek 属国内旗舰模型阵营，V4 API永久降价和彭博披露的700亿元融资/450亿美元估值都具备当天必写价值；HKR三项全中，且成本与资本两条线都会引发从业者讨论。

一句话点评

DeepSeek 把 V4-Pro 缓存价压到 0.025 元/百万 token，这不是让利秀，是用融资钱打 API 成本战。

锐评

DeepSeek 这轮最狠的动作不是喊 AGI，是把 V4-Pro 缓存命中价永久压到 0.025 元/百万 token。缓存未命中 3 元、输出 6 元，都是原价四分之一；同一时间又传 700 亿元融资、450 亿美元投前估值，这套账只能靠资本和自建基础设施接住。 CATL 参投的逻辑比京东、网易更直：DeepSeek 已在内蒙古自建数据中心，还经历过近 12 小时系统崩溃；CATL 刚用 9.42 亿美元拿下 VNET 38.1% 股权。梁文锋说不急着商业化，这话好听，但永久低价会逼同行跟价，最后比的不是模型发布会，是谁能把电、冷却、缓存命中率和融资成本摊得更薄。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

03:16

17d ago

FEATUREDr/LocalLLaMA· rssEN03:16 · 05·23

club-rdna16：16GB AMD/Radeon 本地 LLM 测试仓库

club-rdna16 公开 16GB Radeon 本地 LLM 测试仓库，RX 6900 XT 用 llama.cpp、ROCm/HIP 跑 Qwen3.6 35B-A3B，q8 KV 下 131k 上下文稳定。

#Inference-opt#Benchmarking#Qwen#AMD

精选理由

HKR 全中，但来源是 Reddit 单帖，正文信息只到测试条件，未披露速度、显存曲线与复现实验日志；按实用开源测试仓库给 featured 门槛分。

一句话点评

16GB Radeon 跑到 Qwen3.6 35B-A3B 131k 上下文，这比又一张 CUDA 跑分表更戳 AMD 本地推理的痛点。

锐评

club-rdna16 最有用的地方不是 35B 能跑，而是把 16GB Radeon 的长上下文失败条件写出来。RX 6900 XT 用 llama.cpp + ROCm/HIP 跑 Qwen3.6 35B-A3B，UD-IQ3_XXS 量化、q8 KV 下 131k 上下文稳定；MTP 到 100k 也能跑，但需要细调。这个颗粒度比榜单有效，因为本地推理死在 KV cache、prefill、驱动和电源 profile 上，不死在模型名上。AMD 的问题一直不是没有卡，是复现实验太碎。要是 RX 6800 XT、7800 XT、7900 GRE 能按同一模板补结果，这个 repo 会比很多 ROCm 官方样例更像工程入口。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:05

17d ago

FEATUREDAI HOT 精选· aihot-apiZH00:05 · 05·23

AI 替代入门级工作：科技行业受裁员冲击最重，74% CEO 冻结或缩减招聘

奥纬咨询研究称，科技行业受 AI 裁员冲击最重，74% CEO 已冻结或缩减招聘，计划削减初级岗位的企业比例从17%升至43%。

#Oliver Wyman#Commentary

精选理由

HKR 三项都命中：标题有强数字钩子，正文摘要给出 Oliver Wyman 调研比例，就业冲击对 AI 从业者有高共鸣；但它仍是二手行业报道，未披露样本量与方法，落在 featured 低段。

一句话点评

74% CEO 冻结或缩招，最刺眼的不是裁员，是公司在拆掉初级岗位这条训练管线。

锐评

CEO 们正在把 AI 当成组织瘦身借口，最危险的位置是初级岗位，不是总人数。奥纬咨询给的数很直：科技行业 74% CEO 冻结或缩减招聘，高于前一年的 67%；计划减少初级岗位的 CEO 从 17% 跳到 43%，只有 17% 说会增加初级岗位。说真的，这像把 junior engineer、analyst、support 这类训练场直接拔掉。问题在于 67% 的企业 AI 仍在规划或试点阶段。工具链还没进稳定生产，就先按成熟自动化的口径砍入口岗位，这个节奏很冒进。微软、谷歌这两年也在压 HC，但它们至少有 Copilot、Gemini 内部落地样本；普通公司照抄，只会三年后发现中层没人补。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

17d ago

FEATUREDComputing Life · Share · 鸭哥调研· rssZH00:00 · 05·23

AI 正在分裂成两个市场，你选哪一边

Token 价格每年下降 10 倍，但企业 AI 账单继续膨胀；正文称中国开源模型压低廉价端，企业锁定和 Agent 负载推高昂贵端，并形成 300 倍价差。

#Agent#Commentary

精选理由

HKR 三项都命中：标题有价格悖论，正文给出 10 倍年降和 300 倍价差，话题直指成本与锁定。但这是单篇观点文，不是模型发布或一手实验，停在 featured 低段。

一句话点评

300 倍价差这句很像 VC 图，但企业账单上涨不是价格问题，是 agent 把调用次数和审批链一起放大了。

锐评

300 倍价差这个判断有冲击力，但别把它听成模型市场自然分层。正文只给了每年 10 倍降价、企业账单继续涨、廉价端被中国开源压低、昂贵端被锁定和 Agent 负载推高；没有披露样本、价格口径、300 倍两端各是谁。我更买账的是“负载膨胀”这半句。一个 agent 任务不是一次聊天，常见会拆成规划、检索、工具调用、校验、重试，token 单价降 10 倍也挡不住调用链变长。DeepSeek、Qwen 这类开源模型确实把廉价推理压得很低，但企业高价端卖的往往是权限、审计、SLA、数据边界。拿 token price 解释账单上涨，太省事了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

热点聚合 · 2026-05-23

更多

频道

后台