热点聚合 · 2026-05-01

▸ 25 signals · updated 3m ago

live · 612 today·policy v2

FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·

⤓ RSS live

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

125 212 320 419 541 631 749 827 923 1016 1136 1248 1339 1455 1535 1629 1721 1844 1973 2042 2143 2246 2311 2413 2520 2633 2738 2844 2931 3019 3113

2026年6月

一二三四五六日

138 250 349 443 539 616 713 838 99101112131415161718192021222324252627282930

2026-05-01 · 星期五2026年5月1日

23:31

38d ago

FEATUREDr/LocalLLaMA· rssEN23:31 · 05·01

开发者用Qwen-3.6-27B在本地完整日常编程工作流测试

Reddit 用户 Demonicated 用 Qwen-3.6-27B-q8_k_xl、本地 VSCode 和 RTX 6000 Pro 跑了约 1 天日常开发。模型由 LM Studio 服务，和 Gemma 4 多量化版本对比后胜出；作者称生成略慢于托管模型，但全天未用 API token。真正值得盯的是工作流：先做 Plan 轮并明确细节，代码实现可用；正文未披露基准分数。

#Code#Tools#Agent#Qwen

精选理由

这是有条件的第一手本地编码实验，HKR 三项都中，但证据停在约 1 天体验；正文未披露基准分数、任务集或失败率，所以落在 60–71。

一句话点评

两个 Reddit 标题都在讲本地日常编码，但正文 403；先别把它当 Qwen 3.6 的胜利，只能当 RTX 6000 Pro 用户的体感样本。

锐评

2 条 Reddit 同源社区贴都押在 Qwen-3.6-27B 本地编程体验上，但正文只有 403，benchmark、任务类型、延迟、token/s 都没给出。我的判断很简单：这类帖子对从业者有用，但不能替代可复现实测。具体钩子是 Qwen-3.6-27B-q8_k_xl、VSCode、RTX 6000 Pro；这个组合更像“高端本地工作站能不能顶住日常 IDE 循环”，不是普通开发机结论。拿它去碰 Claude Sonnet 4.5 或 GPT-5 的云端编码体验，关键差异不在模型名，而在 repo 规模、工具调用、长上下文和修复闭环；标题没有这些，热度先打五折。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

23:06

38d ago

FEATUREDTechCrunch AI· rssEN23:06 · 05·01

Replit 的 Amjad Masad 谈 Cursor 交易、对抗 Apple 与不愿出售

Replit 收入从 2024 年 280 万美元增至十亿美元年化目标。正文只截到开头，披露了 Cursor 据称正与 SpaceX 谈 600 亿美元收购；未披露 Masad 对 Apple 争议或出售意向的完整说法。

#Code#Agent#Replit#Amjad Masad

精选理由

TechCrunch 访谈给出 Replit 收入目标与 Cursor 600 亿美元传闻，HKR-H/K/R 都成立。正文截取不完整，Apple 争议与拒售细节未展开，压在 72–77 档。

一句话点评

Replit 把收入叙事从 280 万美元拉到十亿美元年化目标，但正文没给留存和毛利；这更像 AI 编程估值军备赛的防守姿态。

锐评

Replit 这条最硬的不是 Masad 不想卖，而是它必须拿增长速度对冲 Cursor 的 600 亿美元传闻。摘要给了 2024 年收入 280 万美元和十亿美元年化目标，这个跨度足够夸张；正文截断，没给 ARR 口径、净留存、毛利、企业占比，也没给 Apple 争议和出售意向原话。AI 编程工具现在拼的不是 IDE 情怀，是谁能把模型成本、协作入口和企业采购打通。Cursor 若真被 SpaceX 按 600 亿美元谈，Replit 的独立叙事就不能只靠 founder conviction。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:00

38d ago

FEATURED彭博科技· rssEN17:00 · 05·01

核能 AI 初创公司 Fermi 承诺土地和电力，但未签下客户

Fermi 未签下任何客户，前 CEO 正争夺公司未来控制权。标题已给出核能数据中心愿景和 Texas panhandle 选址，正文未披露电力规模、土地面积或客户名单。

#Fermi#Incident#Personnel

精选理由

Bloomberg 报道给出 Fermi“核能+AI 数据中心”叙事的关键反证：没有签下客户，且前 CEO 争夺控制权。HKR 三项命中，但缺少电力规模、土地面积和客户名单，停在 featured 低段。

一句话点评

Fermi 一个客户都没签就内斗，AI 核电叙事的验尸报告先来了。

锐评

Fermi 最刺眼的不是换掉联合创始人，是核能数据中心故事连一个客户都没锁住。正文只给出 Texas Panhandle 选址和“未签客户”，电力规模、土地面积、PPA、客户名单都没披露；对一个卖算力供给确定性的公司，这些空白比 CEO 争夺更致命。 AI 数据中心确实在推核电叙事，Microsoft 绑过 Three Mile Island，Amazon、Google 也买过核能或 SMR 期权。但那类交易先有 hyperscaler 负荷，再谈电源。Fermi 现在反过来，先卖土地和愿景，再找负荷方。我看着像 2025 年那批“AI energy”融资故事的压力测试，第一刀砍在客户验证上。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:56

38d ago

FEATURED彭博科技· rssEN16:56 · 05·01

Meta 收购机器人公司 Assured Robot Intelligence 推进人形机器人技术

Meta Platforms 收购 Assured Robot Intelligence，用于推进人形机器人技术。该公司开发机器人 AI 模型；标题已给出收购事实，正文未披露价格、团队规模和产品时间表。

#Robotics#Meta Platforms#Assured Robot Intelligence#Partnership

精选理由

HKR-H 与 HKR-R 成立：Bloomberg 披露 Meta 收购 Assured Robot Intelligence 切入人形机器人，题材有竞争张力。HKR-K 偏弱，正文未给交易价格、团队规模或产品路线，压在精选门槛。

一句话点评

Meta 买下 Assured Robot Intelligence，但正文没给价格、人数和时间表；这更像扎克伯格先抢机器人模型人才。

锐评

Meta 收购 Assured Robot Intelligence，用于推进人形机器人项目。正文只有一句 RSS 摘要，没披露交易价格、团队规模、训练数据来源、硬件路线、产品时间表。信息密度很低，但方向不低：Meta 正在把机器人从研究兴趣，推进到可收购、可并表、可组织化投入的阶段。我对这条的第一反应，不是“Meta 要造人形机器人了”。这个说法太顺，也太像标题党。Meta 过去几年更擅长的不是把新硬件一次做成，而是用巨额算力和组织耐心，把一个方向熬到基础设施可复用。Reality Labs 已经烧了很多年，Quest、Ray-Ban Meta、Orion 原型眼镜都说明一件事：扎克伯格愿意在短期亏损里买长期入口。人形机器人如果成立，入口不再是脸上的屏幕，而是物理世界里的执行端。 Assured Robot Intelligence 的关键点在“机器人 AI 模型”，不是机器人整机。正文没说它有没有自研 humanoid hardware，也没说模型跑在仿真、机械臂、移动底盘，还是双足机器人上。这个缺口很要命。机器人公司差别巨大：做 perception-policy 模型是一回事，做 actuator、hand、locomotion 又是另一回事。Meta 买的是模型公司，说明它至少现在不急着证明自己会造关节、电机和整机供应链。它先补的是 embodied AI 的算法和数据能力。外部参照很清楚。Google DeepMind 有 RT-1、RT-2、RT-X 这条路线，把视觉语言模型迁移到机器人动作。Nvidia 在推 Isaac、GR00T 和 Jetson Thor，把仿真、基础模型和边缘算力绑在一起。Tesla Optimus 则拿真实工厂视频和自家执行器做闭环。Figure AI 之前靠 OpenAI 叙事拿到关注，后来 OpenAI 也公开重建 robotics 团队。Meta 如果继续只靠 FAIR 论文和开源模型，会在数据闭环上吃亏。收购一家机器人模型 startup，像是在补这块短板。但我不太买“收购一家小公司就能加速 humanoid”的叙事。机器人不是纯模型问题。语言模型的 scaling law 到机器人这里会被数据采集成本、仿真到现实差距、安全约束、硬件寿命一起卡住。一个 token 预测错了可以重试，一个机器人手臂撞坏夹具就是真实损失。正文未披露 Assured Robot Intelligence 的数据规模，也没披露它是否有真实机器人 fleet。没有这些信息，所谓“帮助 build humanoid technology”只能算组织信号，不能算技术信号。 Meta 的优势也很具体。它有 Llama 系列，有自研推理栈，有大规模视频和 3D 感知研究，有 Quest 带来的空间计算资产。Ray-Ban Meta 还给它积累了第一人称视频和可穿戴交互经验，虽然这些数据能否用于机器人训练，涉及隐私和授权，正文没有交代。它真正缺的是高质量 action data：机器人在真实环境里看见什么、怎么抓、怎么走、失败后怎么恢复。这类数据不是互联网爬虫能解决的。我会把这次收购放在“Meta 要补 embodied AI 组织能力”里看，而不是放在“Meta 明年卖 humanoid”里看。标题已给出收购事实，正文未披露价格和路线图，所以别急着把它和 Tesla Optimus 或 Figure 01 放在同一产品表里。更合理的判断是：Meta 正在为一个十年级别的硬件入口买期权。买贵了会像 Reality Labs 继续烧钱，买对了则会让 Llama 从聊天界面走向物理执行。现在证据只够到这里。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

16:42

38d ago

FEATUREDHacker News 首页· rssEN16:42 · 05·01

Spotify 推出验证徽章区分人类艺人与 AI 音乐

Spotify 为人类艺人添加“已验证”徽章，标题确认用途是区分 AI。正文只有 RSS 片段，未披露验证机制、覆盖范围、上线时间或审核条件。

#Audio#Spotify#Product update

精选理由

BBC 的平台标注更新，HKR-H/R 强，HKR-K 只有“Verified 徽章”这一层事实，缺少审核机制、覆盖范围和上线条件。按中等产品更新卡 featured 门槛，不上 P1。

一句话点评

Spotify 的人类徽章是防火墙，不是信任体系；它先把 AI 音乐留在门外，后面再卖一套“合规入口”。

锐评

2 家同时跟进 Spotify 验证徽章，标题口径一致，都把它写成人类艺人与 AI 音乐的区分工具；正文只给出 Verge 的细节，未披露验证机制、申诉流程或误标责任。我觉得 Spotify 这步很现实，也很滑。它没有解决 Suno、Udio 之后的核心问题：训练授权、仿声边界、收益分账。它只是在前台给用户一个“这是真人”的低成本信号。比较骚的是，Verge 明说 Spotify 仍给未来验证 AI act 留门。也就是说，徽章今天像保护人类艺人，明天也能变成 AI 音乐的上架许可。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

14:53

38d ago

FEATUREDr/LocalLLaMA· rssEN14:53 · 05·01

PFlash 在 RTX 3090 的 128K 预填充比 llama.cpp 快 10 倍

PFlash 在 RTX 3090 上让 Qwen3.6-27B Q4_K_M 的 128K TTFT 降至 24.8 秒，对比 llama.cpp 冷启动 248.4 秒。它用 Qwen3-0.6B drafter 做重要性打分，仅保留 5% span，C++/CUDA 推理环路无 Python、Triton、PyTorch。真正值得盯的是质量边界：正文只给 NIAH 单针 32K 至 128K 全通过，RULER 和多针结果未披露。

#Inference-opt#Tools#Code#Luce-Org

精选理由

HKR 三项都中，但来源是 Reddit 单帖，质量验证只到 NIAH 单针 32K–128K；RULER 与多针未披露。适合精选观察，不到高优先级发布。

一句话点评

PFlash 这数很香，但 5% span 保留像一把刀：128K TTFT 从 248.4s 砍到 24.8s，质量账还没摊开。

锐评

PFlash 把长上下文 prefill 做成了取舍题，不是白捡 10 倍速度。Qwen3.6-27B Q4_K_M 在 RTX 3090 上跑 128K，TTFT 从 llama.cpp 冷启动 248.4 秒降到 24.8 秒；机制是用 Qwen3-0.6B drafter 给 token/span 打重要性分，只保留 5% span，再走无 Python / Triton / PyTorch 的 C++/CUDA 环路。我买这个工程方向，但不买“长上下文能力不受影响”的默认假设。正文抓取只看到 403，摘要里也只给 NIAH 单针 32K 到 128K 全过；RULER、多针、跨段推理、代码库问答都没给。LocalLLaMA 圈子去年见过太多“needle 过了就宣称长上下文”的优化，生产价值要看被删掉的 95% 里有没有用户真正要的证据。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:19

38d ago

● P1FT · 科技· rssEN13:19 · 05·01

五角大楼与英伟达、微软、亚马逊签署军事AI合同

五角大楼签署军事 AI 合同，涉及 Nvidia、Microsoft、Amazon 3 家公司。RSS 摘要称，此前五角大楼曾与 Anthropic 因 Claude 使用发生冲突。正文未披露合同金额、部署范围和模型细节。

#Pentagon#Nvidia#Microsoft#Partnership

精选理由

FT 来源提高可信度，HKR 三项都命中，但正文只给出签约对象，缺少金额、部署范围、模型细节。按政策/合作新闻处理，停在 60–71 档，不进 featured。

一句话点评

五角大楼把AI合同给云和芯片厂，不是模型公司独赢；军用AI的门槛正从demo能力转向机密网交付权。

锐评

4 家同时跟进五角大楼AI合同，但角度分裂：Bloomberg强调微软、AWS让军方获得更多系统控制，FT和TechCrunch写英伟达、微软、AWS，Verge把OpenAI、Google也拉进来，并点出Anthropic缺席。这个分歧本身很关键，说明官方口径之外，各家在追供应链位置。正文只给Bloomberg标题和页面残片，合同金额、模型清单、部署级别未披露。我看这更像军用AI采购从“谁的模型强”转向“谁能进机密网络”。AWS、Azure、Nvidia在这局里比单一模型实验室更稳，因为军方要的是隔离环境、权限控制、审计和硬件供给。Anthropic缺席若属实，会刺破它“安全优先天然适合政府”的叙事。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:57

38d ago

FEATUREDr/LocalLLaMA· rssEN12:57 · 05·01

OpenAI Privacy Filter 与 GLiNER 的 600 个 PII 样本对比

Reddit 用户用 600 个 PII 样本对比 openai/privacy-filter 与 GLiNER large-v2.1。CPU 上前者 2.8 样本/秒，后者 1.1；英文边界匹配 macro F1 为 0.498 对 0.416。真正值得盯的是 tokenizer 偏移：严格匹配会把 openai/privacy-filter 压到 0.155。

#Safety#Benchmarking#Inference-opt#OpenAI

精选理由

Reddit 小样本实验不是行业级发布，但 HKR-H/K/R 都成立：600 个 PII 样本、速度与 F1 给出可讨论证据，tokenizer 偏移也有实操价值。来源权威性有限，停在 featured 低段。

一句话点评

600 条 PII 小测别吹成胜利，OpenAI privacy-filter 的 0.498 F1 已经一般，严格匹配掉到 0.155 更像工程坑。

锐评

OpenAI privacy-filter 赢了 GLiNER large-v2.1，但这个胜利很窄，甚至有点脆。标题摘要给了 600 个 PII 样本：CPU 2.8 样本/秒对 1.1，英文边界 macro F1 0.498 对 0.416；速度和宽松边界都占优。问题在 tokenizer 偏移。严格匹配把 openai/privacy-filter 压到 0.155，这不是排行榜小数点，是下游脱敏会不会切错姓名、邮箱、证件号的线。正文被 Reddit 403 挡住，没看到样本分布、PII 类型、语言比例和评测脚本。GLiNER 在通用 NER 上常被拿来当轻量基线；OpenAI 这个模型若主打隐私过滤，边界稳定性比 2.8 samples/s 更要命。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:34

38d ago

FEATUREDr/LocalLLaMA· rssEN12:34 · 05·01

MiMo-V2.5-Pro：实际最强开源权重模型？

Reddit 用户 cjami 测了 Xiaomi MiMo-V2.5-Pro，在 Blood on the Clocktower 自主对局基准中进入头部梯队。其好人阵营胜率 88%，坏人阵营 48%；每局平均 183,639 输出 token，成本 0.99 美元，工具调用错误率 0.4%。真正值得盯的是性价比：Kimi K2.6 每局 580,000 token、2.65 美元、10-15 小时。

#Agent#Reasoning#Tools#Xiaomi

精选理由

单个 Reddit 基准源权威有限，不能按模型发布处理；但它是具名实测，给出胜率、token、成本和工具错误率，HKR 三项都成立。放在 78–84 档，适合精选但不到 P1。

一句话点评

MiMo-V2.5-Pro 这条别急着封王：BOTC 单基准很窄，但 $0.99/局和 0.4% 工具错误率确实扎眼。

锐评

MiMo-V2.5-Pro 的看点不是“最佳开权重”，是小米把 agent 成本打到能反复跑实验的区间。cjami 给出的 BOTC 数据是好人 88%、坏人 48%，每局 183,639 输出 token、$0.99、工具调用错误率 0.4%。这个基准偏社交推理，不能直接外推到 SWE-bench 或企业工具流，但它压中了 agent 系统最烦的两件事：长局推理成本和工具稳定性。Kimi K2.6 每局 580,000 token、$2.65、10–15 小时，MiMo 这组数更像工程效率信号。Reddit 正文 403，复现实验细节没拿到，先别把榜单标题当结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:01

38d ago

FEATUREDr/LocalLLaMA· rssEN12:01 · 05·01

研究称大模型“负面体验”比例更高，小模型更“快乐”

Reddit 帖子称 AI Wellbeing Index 用 500 轮真实对话评估模型“负面状态”。Claude Haiku 4.5 为 5%，Gemini 3.1 Pro 为 55%；测试集含较多棘手负面对话，不代表真实均值。真正值得盯的是指标定义，而不是“AI 会痛苦”的标题。

#Benchmarking#Safety#Claude#Grok

精选理由

HKR 三项都命中：标题反直觉，正文有 500 轮对话与 5%/55% 数字，话题会引发 AI welfare 指标争议。来源是 Reddit 摘要，且样本偏负面对话不代表真实均值，压在 featured 门槛上方。

一句话点评

只有摘要，没有论文链接和量表题项；把 Gemini 3.1 Pro 的 55% 当“痛苦”读，是把拟人化标题误当测量。

锐评

这个 Reddit 说法最危险的地方，是把“负面状态”包装成“更痛苦”。摘要给了 500 轮真实对话、Claude Haiku 4.5 负面 5%、Gemini 3.1 Pro 负面 55%，还承认测试集偏向棘手负面对话。网页正文被 403 拦住，量表定义、标注规则、模型提示词、温度参数都没看到。我不买“模型越大越悲惨”这个标题。它更像是在测模型对负面语境的自我叙事倾向，类似 sycophancy / persona drift 的副产物。Anthropic 这两年一直把 Constitutional AI 和 refusal 风格调得更稳，Haiku 低分未必是“快乐”，也可能是更少进入内省戏。Gemini 3.1 Pro 的 55% 很刺眼，但没有题项和复现条件，只能先当红队指标，别当 AI 福利证据。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

11:18

38d ago

FEATUREDThe Verge · AI· rssEN11:18 · 05·01

Microsoft 希望律师信任 Word 中的新 Legal Agent

Microsoft 在 Word 中推出 Legal Agent，面向法律团队处理合同审阅等任务。它按法律实务工作流运行，可逐条对照 playbook 审查条款，并处理修订记录；正文未披露价格和上线范围。

#Agent#Tools#Microsoft#Sumit Chauhan

精选理由

Microsoft 把 Legal Agent 放进 Word，属于大厂办公 agent 的垂直场景更新；有明确审阅机制，但正文未披露价格、上线范围与真实客户数据，停在 featured 下沿。

一句话点评

Microsoft 把 Legal Agent 塞进 Word 很聪明：律师不缺聊天框，缺的是能啃修订记录和 playbook 的默认入口。

锐评

Microsoft 这步踩中了法律 AI 的分发命门：合同审阅不发生在独立 bot 里，发生在 Word 的修订记录、批注和 firm playbook 里。Legal Agent 明说能逐条对照 playbook 审条款，还能处理 tracked changes，这比“上传合同问模型”更接近律师真实工位。我对它的怀疑也很具体：正文没给价格和上线范围，也没给责任边界。Harvey、Spellbook 这类法律 AI 卖的是专业可信和流程封装，Microsoft 卖的是 Office 默认入口。入口很硬，但法律团队最后买不买账，要看它能不能留下可审计的红线、引用和修改理由。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

10:28

38d ago

● P1Hacker News 首页· rssEN10:28 · 05·01

OpenAI在批评Anthropic限制Mythos后也限制Cyber访问

TechCrunch标题称OpenAI在批评Anthropic限制Mythos后，也限制了Cyber访问。RSS正文仅含URL、HN 32分和12条评论，未披露限制范围、触发条件或时间线。

#Safety#OpenAI#Anthropic#TechCrunch

精选理由

HKR-H与HKR-R成立：OpenAI/Anthropic对照有冲突感，也关系模型访问权。HKR-K缺失，RSS正文未给限制机制或可核验细节，按普通行业报道落在60–71档。

一句话点评

OpenAI骂Anthropic限流Mythos，转头把GPT-5.5 Cyber也只给“关键防御者”；安全产品一到可攻击能力，开放叙事立刻缩水。

锐评

3 个来源都沿用 TechCrunch 标题链，HN 和 Reddit 只是放大讨论，信息源实际集中在 Altman 的 X 帖和 OpenAI 申请表。OpenAI 将 GPT-5.5 Cyber 先发给“critical cyber defenders”，还要求提交资质和用途；同一篇正文列出渗透测试、漏洞利用、恶意软件逆向，这些不是普通企业 Copilot 功能。我不买 Altman 前面骂 Anthropic“fear-based marketing”的姿态。Mythos 被限流时，OpenAI把对手讲成卖恐惧；轮到 Cyber，就用了几乎同一套门禁逻辑。安全圈早知道双用途工具不能全量开放，比较刺眼的是 OpenAI 先占道德高地，再按同样风险模型执行。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

09:10

38d ago

FEATUREDHacker News 首页· rssEN09:10 · 05·01

Intel auto-round 量化算法登上 HN 讨论

Intel 的 auto-round 项目登上 HN，标题称其面向 LLM 量化，页面显示 12 分、1 条评论。正文只有 GitHub 链接与 HN 元数据，未披露算法机制、支持模型、精度损失或推理收益。真正值得盯的是代码与基准是否可复现。

#Inference-opt#Intel#Open source

精选理由

HKR 三项都未命中：只有 Intel auto-round 的 GitHub/HN 元数据，未给算法机制、支持模型、精度损失或吞吐收益。按 0/3 HKR 排除，保留为低分噪声。

一句话点评

HN 和 LocalLLaMA 同时捧 Intel auto-round，信号很清楚：低比特推理又回到工程可用性，Intel 这次抢的是部署入口。

锐评

HN 和 LocalLLaMA 同时跟进 auto-round，但信息链都指向同一个 GitHub 仓库：1.1k stars、117 forks、92 issues、34 PRs，覆盖 CPU/XPU/CUDA、vLLM、SGLang、Transformers。我更愿意把它看成 Intel 在推理栈里补位，而不是一次算法炫技。AWQ、GPTQ 已经把低比特量化讲过一轮，今天开发者关心的是 4-bit 模型能不能少掉坑地进 vLLM。比较骚的是 Intel 把 XPU 和 CUDA 写在同一行，像是在承认训练卡输了，但部署层还要抢标准接口。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

09:00

38d ago

FEATUREDMIT 科技评论· rssEN09:00 · 05·01

Trump 大规模解职再挫美国科学体系

Trump 解职 National Science Board 全部 22 名成员，NSF 失去关键治理层。NSF 2024 年支出 93.9 亿美元，占联邦支出 0.1%；政府曾寻求削减 57% 预算，员工数已降 40%。真正值得盯的是 AI 与量子仍被列为 2027 年预算“前沿计划”。

#National Science Foundation#Donald Trump#Keivan Stassun#Policy

精选理由

HKR 三项都成立，但主线是美国科研治理，不是 AI 产品或模型发布；AI 与量子只作为 NSF 预算优先项出现。按政策类强相关新闻给 featured 下沿，低于同日必写的模型/能力更新。

一句话点评

Trump 一刀砍掉 NSB 22 人，这不是省钱，是把 NSF 的拨款闸门先拔掉监管人。AI 和量子被保留，只说明政治标签比科学治理更硬。

锐评

NSF 这刀砍的不是 93.9 亿美元预算，是美国基础研究的审批肌肉。National Science Board 22 名成员全被解职，NSF 自 2025 年 4 月起没有主任，员工数又降了 40%；这套组合拳会先伤到长周期、跨机构、没人能立刻讲 ROI 的项目。 AI 从业者别只看“AI、量子仍进 2027 前沿计划”这句。标签被保留，治理层被拆掉，钱就更容易流向短期政治可展示项目。DARPA 式任务制还能靠强项目经理撑住，NSF 靠同行评审和 board 授权维持广谱探索。把 board 清空后，前沿计划四个字更像白名单，不像科研战略。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

07:00

38d ago

● P1r/LocalLLaMA· rssEN07:00 · 05·01

用户完成16节点DGX Spark集群搭建及性能测试

Reddit 用户 Kurcide 完成 16 台 DGX Spark 集群，上线 fabric 后均达到线速。每台经单根 QSFP56 接入 FS N8510，双 rail 实测 100–111 Gbps，聚合约 200 Gbps。真正值得盯的是统一内存：8 节点已服务 434GB GLM-5.1-NVFP4，后续测试 DeepSeek 与 Kimi。

#Inference-opt#Kurcide#Nvidia#DeepSeek

精选理由

这是 Reddit 一手搭建记录，含 16 节点、双 rail 带宽与 434GB GLM-5.1-NVFP4 运行条件，HKR 三项都成立。影响面仍限于本地推理与硬件圈，按 72–77 档处理。

一句话点评

16 台 DGX Spark 这事只有 Reddit 标题，没有测试正文；但民间先把“桌面 AI 超算”买成集群，NVIDIA 的边缘叙事开始被用户反向验证。

锐评

2 条 Reddit 帖子同源跟进，标题给出 16 台 DGX Spark 集群和 build update，正文被 403 挡住，性能数字、网络拓扑、模型清单都没披露。这更像社区实测事件，不是厂商发布。我的判断很简单：DGX Spark 若只能靠单机噱头卖，会很快撞墙；16 节点玩法才会暴露它的真实边界。推理集群最怕的不是 FLOPS，而是互联、显存切分和调度开销。对比 Mac Studio 拼集群和 RTX 4090 本地推理，用户最后看的不是盒子多酷，而是 Llama/Qwen 跑多大、tokens/s 掉多少。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

06:20

38d ago

FEATUREDHacker News 首页· rssEN06:20 · 05·01

Apple 警告 Mac Studio 和 Mac mini 将短缺数月

Apple 称 Mac Studio 和 Mac mini 将短缺数月。正文仅有 RSS 片段，未披露短缺原因、受影响配置、地区或补货时间表。AI 从业者若依赖本地 Mac 推理或开发机采购，只能先按供应风险处理。

#Apple#Product update

精选理由

HKR-R 仅来自 Mac 开发机采购风险；HKR-H/K 都弱。正文没有 AI 模型、工具或部署信息，低 AI 相关性压到 40 以下。

一句话点评

Apple 连 Mac 供给都被本地 AI 需求打穿，挺讽刺：云厂商抢 GPU，开发者在抢一台能安静跑模型的桌面机。

锐评

2 家都抓住 Mac Studio、Mac mini 短缺数月，TechCrunch 强调 AI 需求超预期，HN 标题只保留供给告警，口径像来自同一场财报电话。Apple Q2 Mac 收入 84 亿美元，高于华尔街低 80 亿美元预期，年增 6%；总收入 1112 亿美元，年增 17%。我不太买“Apple 被 AI 需求惊到”这个包装。更准确的读法是，本地推理和开发工作站需求终于落到 Mac 销量里了，但 Apple 自己还在把 AI 产品叙事压在 iPhone 和服务上。Mac mini、Mac Studio 缺货数月，说明开发者买的是统一内存、能耗和桌面可用性，不是 Apple Intelligence 的口号。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

05:29

38d ago

● P1新智元 · 公众号· rssZH05:29 · 05·01

OpenAI 升级 Codex，可接管 Mac 执行跨应用任务

OpenAI 升级 Codex，支持 Slack、Google Workspace、Microsoft 365 等集成。Mike Russell 实测让 Codex 在 Mac 上完成音频修复、Photoshop 封面和 Firefly 视频生成，约 8 分钟达到 85—90 分效果。真正值得盯的是 OS 级电脑操控 agent，而不只是代码补全。

#Agent#Code#Tools#OpenAI

精选理由

HKR 三项都成立：OpenAI Codex 从代码工具扩到 Mac 级操作，并接入 Slack、Google Workspace、Microsoft 365。单篇来源限制了分数，但 8 分钟实测与 OS 级 agent 方向足够进 P1。

一句话点评

Codex 接管 Mac 的演示很抓人，但 8 分钟 85—90 分更像“可监督执行”，离无人值守生产还差错误恢复。

锐评

Codex 这次把战场从 IDE 推到桌面应用，OpenAI 在抢“电脑使用权”这层入口。摘要给的钩子很硬：Slack、Google Workspace、Microsoft 365 集成，加上 Mike Russell 让 Codex 操作 Audition、Photoshop、Firefly，约 8 分钟做到 85—90 分。问题也在这里：85—90 分是创作流程里最危险的区间，够像成品，仍要人类兜底。正文是微信验证页，没披露失败样本、回滚机制和权限边界。我更信它会先吃掉半结构化创意杂活，而不是“永别终端”。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:29

38d ago

FEATURED新智元 · 公众号· rssZH05:29 · 05·01

撕开 Claude Code 真相：好用的 98.4% 是工程，不是 AI

VILA-Lab 分析 Claude Code v2.1.88 的 51.2 万行源码，称 1.6% 属于 AI 决策逻辑。其余 98.4% 是权限网关、上下文管理、工具路由、错误恢复等确定性工程。真正值得盯的是 harness，而不是更长 prompt。

#Agent#Code#Tools#Anthropic

精选理由

Claude Code 拆解有强 HKR：标题反常识，正文摘要给出 51.2 万行与 1.6%/98.4% 量化拆分。它不是 Anthropic 官方发布，也未披露完整复现实验细节，停在 78–84 档。

一句话点评

只有标题和摘要，没源码方法细节；但 51.2 万行里 1.6% 是 AI 逻辑，这刀砍在 agent 产品的喉咙上。

锐评

Claude Code 被拆成 51.2 万行后，最刺眼的数字是 1.6%：AI 决策逻辑只占这一小块，其余落在权限网关、上下文管理、工具路由、错误恢复。正文被微信验证挡住，方法、文件归类标准、是否含依赖代码都没法核验，所以别把 98.4% 当精确审计结论。但方向我买账。过去一年 coding agent 的差距，越来越少来自“prompt 写得更玄”，越来越多来自能不能安全调用 shell、读写 repo、回滚失败、压缩上下文。OpenAI Codex、Cursor、Claude Code 都在拼这层工程壳。模型强只是入场券，能不能把错误关在沙盒里，才决定团队敢不敢把它接进真实仓库。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:29

38d ago

FEATURED新智元 · 公众号· rssZH05:29 · 05·01

开发者用10天婚假做出一句话生成 AI 世界的 WorldX

独立开发者用10天婚假完成 WorldX，输入一句话约5分钟生成地图、角色、动画和运行逻辑。系统用6步地图管线、每世界约3万至18万 token、Tick 循环、三层记忆和双维度情绪驱动 Agent。真正值得盯的是叠加标注加色差定位，把图像模型涂色转成确定性坐标计算。

#Agent#Multimodal#Memory#WorldX

精选理由

独立项目不够产业级，压在72–77档；但HKR三项都成立，且正文摘要给出可复现的管线、token规模和Agent记忆机制，适合精选。

一句话点评

WorldX 的亮点不是“一句话造世界”，而是把扩散图的涂色结果钉回坐标系；可惜正文被微信验证挡住，复现细节缺口很大。

锐评

WorldX 这类项目最容易被包装成生成式游戏demo，但这里有一处工程判断是对的：先让模型画，再用叠加标注和色差定位把结果拉回确定性坐标。摘要给出的条件很具体：10天开发、约5分钟生成、每世界3万至18万token、6步地图管线、Tick循环、三层记忆和双维度情绪。这个组合不像纯prompt秀，更像在给小镇模拟器补可运行结构。我对“活了过来”这个说法不太买账。正文被微信验证挡住，没看到开源地址、失败率、并发成本、角色长期一致性测试。Stanford Smallville 当年强在行为日志和社会关系闭环；WorldX 若只证明地图可定位，还没证明多Agent世界能长期稳定。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:01

38d ago

FEATURED机器之心 · 公众号· rssZH05:01 · 05·01

有人只用 API 猜出 GPT、Claude、Gemini 参数量？社区吵翻了

李博杰在 arXiv 发布 IKP 框架，用黑盒 API 估算 27 家厂商 188 个 LLM 参数量。数据集含 1400 个问题、7 个稀缺层级，并用 89 个已知参数开源模型拟合，R²=0.917。争议集中在合成数据、MoE 架构、90% 置信区间 0.3 至 3 倍。

#Benchmarking#Reasoning#Bojie Li#OpenAI

精选理由

HKR 三项都命中：黑盒 API 反推参数量有点击钩子，也给出可检验数据与误差边界。争议点清楚，但 0.3–3 倍置信区间偏宽，按 78–84 档给 featured，不到 P1。

一句话点评

只靠 API 猜 188 个模型参数量很刺激，但 0.3 到 3 倍置信区间太宽；这更像能力指纹学，不是拆黑盒验尸。

锐评

IKP 最有价值的不是“猜出 GPT/Claude/Gemini 参数量”，而是把厂商不披露的模型尺度变成可争论的统计对象。它用 1400 个问题、7 个稀缺层级、89 个已知开源模型拟合，R²=0.917 这个钩子够硬；但 90% 区间从 0.3 到 3 倍，落到单个闭源模型就很难当实锤。我更愿意把它看成能力指纹工具。MoE 会把“总参数”和“激活参数”搅在一起，合成数据也会放大训练集重叠风险。OpenAI、Anthropic、Google 不披露参数，本来就是商业叙事的一部分；IKP 打穿不了墙，但能让墙后面的影子有个粗轮廓。正文被微信验证挡住，细节只到摘要这一层。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:01

38d ago

FEATURED机器之心 · 公众号· rssZH05:01 · 05·01

强化学习的进化：从 PPO 到 MaxRL，LLM 推理训练算法演进

机器之心编译了 Alexander Weers 的长文，梳理 2024 至 2026 年 LLM 推理强化学习算法演进。文章覆盖 REINFORCE、PPO、GRPO、RLOO、Dr. GRPO、DAPO、CISPO、MaxRL、DPPO 与 ScaleRL，明确对比 critic 移除、裁剪、归一化和 pass@k 目标。真正值得盯的是训练机制差异，不是单个算法名。

#Reasoning#Fine-tuning#Alignment#Jiqizhixin

精选理由

这是高质量技术梳理，不是新模型或论文发布；HKR-H 来自 PPO→MaxRL 的演进线，HKR-K 有多种算法机制对比，HKR-R 命中推理训练路线选择。技术门槛较高，压在精选低段。

一句话点评

这篇只剩摘要可读，但算法名单很对：PPO 之后的主线不是换 acronym，而是去 critic、控裁剪、改 pass@k 目标。

锐评

这篇的价值在于把 RL 训练从“某个神奇算法”拉回工程选择，尤其是 PPO、GRPO、RLOO、DAPO、CISPO、MaxRL 放在同一张机制表里看。正文被微信验证挡住，我只能依赖摘要；但摘要点名 critic 移除、裁剪、归一化、pass@k 目标，这几个轴比算法名可靠。DeepSeek-R1 后，很多团队把 GRPO 当口号抄，问题是 reward variance、batch 采样、长度偏置都不会被名字自动解决。MaxRL 若主打 pass@k，评价口径就更接近推理产品，而不是单次答案漂亮。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:53

38d ago

FEATUREDLatent Space· rssEN04:53 · 05·01

[AINews] 万物皆 Agent：Codex 做知识工作，Claude 做创意工作

OpenAI 将 Codex 扩到非编码工作，正文称 CUA 快 42%。新版接入 Microsoft、Google、Salesforce，并覆盖文档、幻灯片、表格、研究和规划。真正值得盯的是 GUI agent 产品化，而非单次模型分数。

#Agent#Tools#Code#OpenAI

精选理由

OpenAI 把 Codex 推向非编码 GUI agent 场景，并给出 42% 速度数字和三家集成，HKR 三项都成立。未披露价格、开放范围和复现条件，压在 85 以下。

一句话点评

Codex 被推向 Office、Google、Salesforce 后，OpenAI 的赌注很直白：别等 OS 入口，先吃掉白领每天点击的 GUI。

锐评

Codex for Work 不是一次模型发布，是 OpenAI 把编码 agent 的执行习惯搬进知识工作流。正文给了三个硬钩子：CUA 快 42%，接入 Microsoft / Google / Salesforce，覆盖 Office 文件编辑、规划 UI、/goal 和 /chronicle。这里的关键不是“会写文档”，而是 agent 开始接管文件、浏览器、表格、幻灯片这些企业里最脏的状态机。我对 42% 这个数有保留，正文只链到 X，没有交代 benchmark 条件。更有意思的是动态 UI：OpenAI 明确不做 Claude Cowork 那种 toggle，而让 agent 自己路由界面。这个选择很激进，也很危险；一旦路由错，用户不是觉得模型笨，是觉得整个工作台不可信。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:16

39d ago

FEATURED量子位 · 公众号· rssZH04:16 · 05·01

他用 AI 办了个音乐节，主题：别读博

B站UP主“馄饨皮茄总”用 AI 生成 42 首“不读博音乐节”歌曲，播放量超 5000 万。单曲最多生成 100 多版，使用 Suno、MiniMax Music、HeartMuLa、ACE-Step 赛马后拼接。真正值得盯的是 AI 音乐工作流的人工筛选成本。

#Audio#Suno#MiniMax Music#HeartMuLa

精选理由

HKR 三项都成立：标题有反差，正文有42首与5000万播放等数字，流程暴露了AI音乐的人工筛选成本。它是强案例，不是模型或平台级发布，落在78–84档。

一句话点评

5000万播放不是 AI 音乐胜利，是人工赛马剪出来的胜利；单曲 100 多版，成本还卡在人耳。

锐评

这条最刺眼的不是“AI 办音乐节”，而是 42 首歌背后那套低自动化工作流。标题和摘要给了硬数：B站 UP 主“馄饨皮茄总”做了 42 首“不读博音乐节”歌曲，总播放超 5000 万；单曲最多生成 100 多版，还要在 Suno、MiniMax Music、HeartMuLa、ACE-Step 之间赛马后拼接。正文因微信验证不可读，没法核验制作时长和留存数据。我看着像短视频音乐生产的 A/B 工厂，不像端到端创作工具成熟。Suno 的强项是成曲速度，MiniMax Music、ACE-Step 这类中文/开源路线补的是可控性和本地语感。但如果爆款还要 100 次抽卡，模型省掉的是录音棚，不是制作人。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:16

39d ago

FEATURED量子位 · 公众号· rssZH04:16 · 05·01

北大开源统一世界模型框架：多类合成推理任务一套搞定

北京大学DCAI团队联合快手可灵等开源OpenWorldLib，覆盖视频生成、3D建模、VLA控制和多模态推理4类任务。框架以Pipeline调度Operator、Reasoning、Synthesis、Representation、Memory模块，支持forward与stream两种推理。真正值得盯的是统一接口能否降低跨任务复现实验成本。

#Multimodal#Reasoning#Memory#Peking University

精选理由

北大与快手可灵开源OpenWorldLib，属于有具体机制的研究框架发布；H/K/R都成立，但正文未披露基准结果、采用量或主流项目集成，停在78分。

一句话点评

只有标题和摘要，没代码细节、benchmark、license；OpenWorldLib像实验胶水，不像世界模型本体。

锐评

OpenWorldLib的价值先别往“统一世界模型”上贴，标题给的是框架，摘要给的是4类任务和5个模块。它把视频生成、3D建模、VLA控制、多模态推理塞进同一套Pipeline，用Operator、Reasoning、Synthesis、Representation、Memory调度，再支持forward和stream两种执行。这个设计像复现实验的脚手架，能省的是跨任务适配成本，不是直接提高模型能力。我对“大一统”叙事有点怀疑。正文被微信验证挡住，代码结构、依赖、benchmark、license都没披露。和去年一堆agent框架类似，统一接口很容易变成demo集合；只有当OpenWorldLib能稳定接入Kling类视频模型、VLA policy和3D生成后端，才算有工程含金量。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:15

39d ago

FEATUREDFT · 科技· rssEN00:15 · 05·01

Nvidia在华受阻，Huawei AI芯片销售激增

Huawei因Nvidia在华受阻获得中国科技公司大额AI处理器订单。正文只披露买方来自中国科技公司，未披露订单金额、芯片型号和交付时间。真正值得盯的是国产算力替代链条，而非单次销售标题。

#Inference-opt#Huawei#Nvidia#Product update

精选理由

FT 信源加持，事件指向中国 AI 算力替代链条，HKR-H 与 HKR-R 明确；但正文缺少订单金额、芯片型号和交付时间，HKR-K 不足，压在 78–84 档。

一句话点评

只有标题能确认华为 AI 芯片订单增加，金额、型号、交付全缺；别急着喊替代成功，先看客户是不是敢把训练主线迁过去。

锐评

华为这条别按销量喜报读，标题只确认 AI 芯片销售上升，正文被 FT paywall 截断，订单金额、Ascend 型号、交付时间都没披露。对从业者来说，买单和迁移主训练集群是两件事，尤其 Nvidia 在中国受限后，国产卡先吃到的是合规采购和推理补位。我更相信短期落点在推理和政企私有云，而不是 H100 / H20 级训练替换。Ascend 生态的问题一直不只在 FLOPS，还在算子、框架适配、故障恢复和多卡效率。标题给了需求侧压力，没给可复现的性能和交付证据，华为赢的是缺口，不等于已经赢了开发者时间。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

热点聚合 · 2026-05-01

更多

频道

后台