热点聚合 · 2026-05-02

▸ 12 signals · updated 3m ago

live · 612 today·policy v2

FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·FT · 科技OpenAI 提交上市申请，IPO 估值预计超 1 万亿美元98·AI HOT 精选OpenAI 提交 IPO 申请，继 Anthropic 之后98·AI HOT 精选OpenAI 秘密提交 IPO 申请，加入 AI 对手上市融资竞赛96·AI HOT 精选OpenAI 秘密提交 IPO 申请，奥特曼旗下 Tools for Humanity…96·THE VERGE · AIOpenAI 继 Anthropic 后提交 IPO 机密 S-1 文件96·HACKER NEWS 首页OpenAI 向 SEC 提交保密 S-1 草案96·OPENAI 博客OpenAI 向 SEC 秘密提交 S-1 草案96·AI HOT 精选OpenAI 向 SEC 机密提交 S-1 草案，上市时间未定96·彭博科技OpenAI 已秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 继 Anthropic 后秘密提交 IPO 申请95·TECHCRUNCH AIOpenAI 申请 IPO 之际，Sam Altman 的虹膜扫描公司据称裁员95·AI HOT 精选OpenAI 机密提交 IPO 文件，与 Anthropic 展开资本竞赛90·

⤓ RSS live

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

125 212 320 419 541 631 749 827 923 1016 1136 1248 1339 1455 1535 1629 1721 1844 1973 2042 2143 2246 2311 2413 2520 2633 2738 2844 2931 3019 3113

2026年6月

一二三四五六日

138 250 349 443 539 616 713 838 99101112131415161718192021222324252627282930

2026-05-02 · 星期六2026年5月2日

23:51

37d ago

FEATUREDr/LocalLLaMA· rssEN23:51 · 05·02

Qwen 3.6 35B模型在编码任务中优于27B版本

Reddit 用户称 Qwen3.6-35B 在编码和联网研究流水线中优于 27B。测试条件含 nvfp4 或 fp8 量化，设备为 Mac Studio M4 Max 128GB 和 M5 Max 48GB；正文未披露基准分数。

#Code#Agent#Inference-opt#Qwen

精选理由

单条 Reddit 体验贴有可复现硬件和量化条件，HKR 都有但证据弱；正文未披露基准分数或系统化对照，落在普通社区经验分享档。

一句话点评

只有 Reddit 标题链：Qwen 3.6 35B 被说编码强过 27B；没基准、没量化，先别把约 30B 档判死刑。

锐评

两个 LocalLLaMA 帖子都围绕 Qwen 3.6 27B 与 35B，标题一致偏向 35B；正文 403，未给 SWE-bench、HumanEval 或量化条件。这个信号更像社区体感投票，不是模型代际结论。 35B 在编码上压 27B并不稀奇，参数多 8B，推理预算也常被默认放宽。问题在于它是否在 4-bit、本地 24GB/48GB 显存、同一提示词下稳定赢。若没有这些条件，拿它说其他约 30B 模型过时，我不买；Qwen 系列强，但 LocalLLaMA 标题经常把一次跑分放大成生态判决。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

20:05

37d ago

FEATUREDr/LocalLLaMA· rssEN20:05 · 05·02

实现 TurboQuant 后，结果未完全复现论文

Reddit 用户复现 TurboQuant 时发现 PROD 版在 4-bit 下相关性约 95.8%，低于论文声称的 99% 以上。作者称该相关性仍让注意力质量明显下降，简单仿真 top-1 准确率约 67%。真正值得盯的是相关性不等于排序保持，KV cache 量化可能被注意力排序误差放大。

#Inference-opt#Benchmarking#TurboQuant#LocalLLaMA

精选理由

HKR 三项都命中，但来源是单篇 Reddit 复现实验，影响面低于正式研究发布；4-bit 相关性 95.8% 与 top-1 约 67% 给出实测信号，适合低位 featured。

一句话点评

TurboQuant 复现只拿到 4-bit 95.8% 相关性，99%+ 论文叙事被排序误差戳了一下。KV cache 量化别只看相关系数。

锐评

TurboQuant 这条最扎眼的不是 95.8% 和 99%+ 的差距，而是论文指标选错了战场。摘要称 Reddit 复现 PROD 版 4-bit 相关性约 95.8%，简单仿真 top-1 准确率约 67%；正文被 403 拦住，代码细节和样本设置没披露。对 KV cache 量化来说，注意力分数相关性高，不保证 top token 排序稳定。AWQ、GPTQ 这类权重量化还能靠离线校准兜底，KV cache 是逐步累积误差，排序一抖，解码路径就变了。论文如果只报相关系数，工程含金量要打折。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:11

37d ago

FEATUREDr/LocalLLaMA· rssEN18:11 · 05·02

作者用 C++17 从零实现 0.83M 参数 Transformer

Reddit 用户 Suspicious_Gap1121 发布 Quadtrix.cpp，用 C++17 从零实现 0.83M 参数 GPT 式模型。配置为 4 层、4 头、200 维，128 字符上下文；31.4M 字符语料上单 CPU 核训练 76.2 分钟，验证损失 1.6371 nats。真正值得盯的是手写反传：LayerNorm、attention、Q/K/V、dropout 和 AdamW 都不用 PyTorch、BLAS 或自动微分库。

#Code#Fine-tuning#Inference-opt#Suspicious_Gap1121

精选理由

这是小体量个人开源项目，不是模型或产品发布；但 HKR 三项都成立，且有可复现参数、训练条件和手写反传机制。按优质技术教程/实验给 featured 下沿。

一句话点评

0.83M 参数、单核 76 分钟训完，Quadtrix.cpp 的价值不是性能，是把 Transformer 训练栈从框架黑箱里硬拆出来。

锐评

Quadtrix.cpp 最有用的地方，是把小 Transformer 的训练链路压回可读代码，而不是再造一个可用模型。0.83M 参数、4 层 4 头、200 维、128 字符上下文，在 31.4M 字符上单 CPU 核训 76.2 分钟，val loss 到 1.6371 nats；这个规模离 TinyStories、nanoGPT 的实用边界都很远。但手写 LayerNorm、attention、Q/K/V、dropout、AdamW 反传，不靠 PyTorch、BLAS、autograd，这件事对教学和调试很硬。正文只有 Reddit 403，代码质量、数值稳定性、可复现脚本都没看到。别把它吹成轻量训练框架，它更像一把能拆开看的手术刀。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:44

37d ago

FEATUREDr/LocalLLaMA· rssEN15:44 · 05·02

Qwen 3.6 跑分领先，Gemma 4 在本地视觉实测中更稳

Reddit 用户用 vLLM FP8 本地对测 Qwen 3.6 与 Gemma 4，覆盖 27B/31B 视觉模型。Qwen 在疑难 GeoGuessr 会烧 8000+ token，Gemma 常用 1500 token；Gemma 更守 JSON 坐标格式，Qwen 视频需预处理到 2 FPS。真正值得盯的是默认视觉 token 预算：vLLM、Llama.cpp 可低到 280，调到 1120+ 后细节准确率上升。

#Vision#Multimodal#Benchmarking#Qwen

精选理由

HKR 三项都成立：标题有“跑分赢、现实输”的反差，正文给出 token、FPS、视觉预算等可复现配置。本地视觉模型横测很实用，但来源是单篇 Reddit 实测，压在 featured 门槛上方。

一句话点评

只有摘要、正文 403；但这条很像本地多模态的老问题：榜单赢家一进 vLLM/FP8，就被 token 预算和格式稳定性拽回地面。

锐评

Qwen 3.6 赢榜单，Gemma 4 赢本地运行，这个判断我买一半。摘要给的钩子很实：疑难 GeoGuessr 里 Qwen 烧到 8000+ token，Gemma 常在 1500 token；Gemma 更守 JSON 坐标格式，Qwen 视频还要预处理到 2 FPS。对做本地视觉 agent 的人，这些比单个 benchmark 分数更像成本曲线。但正文 403，原帖样本量、提示词、显存、图像分辨率都没给。最容易被误读的是“Gemma 4 wins reality”：如果 vLLM / Llama.cpp 默认只给 280 个视觉 token，调到 1120+ 后细节准确率上升，那赢的未必是模型，是运行配置更贴生产。Qwen 系列这两年一直吃 benchmark 红利，本地端一测延迟、token、格式，叙事就没那么顺了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:28

37d ago

FEATUREDHacker News 首页· rssEN15:28 · 05·02

LLM 在招聘筛选中持续偏好自己生成的简历

arXiv 论文用受控简历实验发现，LLM 在招聘筛选中偏好自己生成的简历。自偏好偏差在主流商业和开源模型中为 67% 至 82%，24 个职业模拟中，同模型求职者入围率高 23% 至 60%。真正值得盯的是模型自识别机制，简单干预可将偏差降低超过 50%。

#Safety#Alignment#Benchmarking#Jiannan Xu

精选理由

HKR 三项都成立：反常识招聘偏差有点击钩子，正文给出多组可检验数字，且关系到AI筛选系统的公平性。它是强研究议题，但不是模型发布或平台级产品更新，落在78–84推荐档。

一句话点评

招聘筛选里最脏的偏差，不是模型看不懂人，而是模型认出了自己的文风并给同类开绿灯。

锐评

这篇最刺的地方，是把“AI 写简历”从求职技巧打成了平台套利。论文在受控简历实验里给出 67% 至 82% 的自偏好偏差；24 个职业模拟中，同模型写简历的候选人入围率高 23% 至 60%。这不是传统人口属性公平问题，而是生成器和评估器共享风格指纹后的暗门。我对“简单干预降偏超过 50%”保留一点怀疑，正文摘要没交代具体干预细节和线上招聘系统复现条件。但方向很清楚：企业如果用 LLM 先筛简历，就等于给会猜评审模型的人发了一张隐藏加分卡。ATS 供应商再谈公平审计，不能只测性别、种族、年龄了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:44

37d ago

FEATUREDr/LocalLLaMA· rssEN13:44 · 05·02

Semvec：面向 LLM 的固定成本语义记忆，招募测试者

开发者发布 Semvec，用固定大小语义状态替代无限对话历史。其 48 轮基准称 token 减少约 76%，第 10 轮和第 10000 轮输入 footprint 相同。它支持 OpenAI 兼容 LLM、MCP、Claude Code、Cursor 与多 Agent 共享状态。

#Memory#Agent#Tools#Semvec

精选理由

HKR 三项都成立，但来源是 Reddit 自发项目，正文只给作者基准，缺少第三方复现与规模化使用证据。按独立工具发布处理，卡在 featured 下沿。

一句话点评

Semvec 的 76% token 降幅很诱人，但 Reddit 正文 403；固定语义状态听着像记忆层，先别把它当长期一致性的解药。

锐评

Semvec 最敢赌的是把对话历史压成固定大小语义状态，而不是继续堆 context window。摘要给了两个硬钩子：48 轮基准 token 少约 76%，第 10 轮和第 10000 轮输入 footprint 相同；但 Reddit 正文 403，benchmark 任务、模型、评分方式都没看到。我喜欢这个方向，尤其是接 MCP、Claude Code、Cursor、多 Agent 共享状态这一串，比普通向量库记忆更贴近开发工作流。问题也在这里：固定状态一定会丢信息，丢哪些、何时丢、能否回溯，才决定它是工程利器还是漂亮 demo。MemGPT、Zep、LangGraph memory 都撞过这堵墙。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:54

37d ago

FEATUREDHacker News 首页· rssEN08:54 · 05·02

Show HN：用客户端工具调用让 AI 填写 PDF 表单

SimplePDF 发布 Copilot 演示，用客户端工具调用填写 PDF 表单，SimplePDF 月活超过 20 万。PDF 不离开浏览器，解析、渲染、字段检测在本地运行；发送给 LLM 的是所需文本和用户消息。演示默认用 DeepSeek V4 Flash 代理，也支持 BYOK、云模型或 LM Studio 本地模型。

#Agent#Tools#SimplePDF#DeepSeek

精选理由

这是小而具体的 Show HN 产品演示，胜在机制清楚：PDF 留在浏览器，LLM 只拿必要文本。影响面不及头部模型发布，但对做 agent 工具调用和隐私型 SaaS 的读者有参考价值。

一句话点评

PDF 留在浏览器、只把文本发给模型，这比又一个“AI 填表”标题靠谱；企业 adoption 卡的就是数据边界。

锐评

SimplePDF 这条好在没把 PDF 全丢给模型，而是把解析、渲染、字段检测留在浏览器。正文只展示 W-9 demo 和“chat messages leave your device”提示，摘要给出 20 万月活、默认 DeepSeek V4 Flash 代理、支持 BYOK / LM Studio，本体其实是前端工具调用架构。我买这个方向，不买它的完成度叙事。PDF 表单是 agent 最适合落地的窄任务：字段有限、成功可验证、失败可人工改。Adobe Acrobat AI Assistant 做的是套件入口，SimplePDF 更像把隐私边界做成产品卖点。缺口也明显：正文未披露字段识别准确率、复杂表单覆盖率、DeepSeek 代理的日志策略。没有这些，20 万月活只能证明分发，不证明 copilot 留存。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:12

37d ago

FEATUREDr/LocalLLaMA· rssEN08:12 · 05·02

Qwen3.6-27B 在 RTX 3090 上实现原生 Windows 推理加速至 72 tok/s

Reddit 用户 One_Slip1455 发布 Qwen3.6-27B Windows 原生 vLLM 启动器，RTX 3090 短提示达 72 tok/s。长提示约 25k tokens 为 64.5 tok/s，127k ctx 单卡为 53.4 tok/s，2×3090 PP=2 可到 160k ctx。真正值得盯的是无 WSL、无 Docker、OpenAI 兼容端点和 INT4 量化路径。

#Inference-opt#Tools#Qwen#vLLM

精选理由

HKR 三项都命中：标题有 3090 原生 Windows 的反常识钩子，正文给出多组 tok/s 与 ctx 条件，且直击本地推理成本。来源是 Reddit 单帖，先压在 featured 下沿。

一句话点评

2 条 Reddit 标题都在报 Qwen3.6-27B 单卡高速推理，但正文 403；我先把它当工程信号，不当可验证基准。

锐评

2 条 LocalLLaMA 标题同时指向 Qwen3.6-27B 单卡推理提速，但可读正文只有 Reddit 403 拦截页。这个事件不能按正式发布写，也不能按论文结果写；它更像社区工程链路冒出来的早期信号。一个标题给出 RTX 3090、Windows 原生 vLLM、无 WSL、无 Docker、72 tok/s、便携 launcher 和 installer。另一个标题给出 RTX 5000 PRO 48GB、FP8、200k tokens BF16 KV cache、80 TPS。两条都来自同一社区源 reddit-localllama，覆盖数是 2，但不是 2 家独立媒体，所以不能把“多源”当交叉验证。两个标题的角度差得很明显。RTX 3090 那条讲的是部署摩擦：Windows 原生跑 vLLM，绕开 WSL 和 Docker，对本地玩家和 Windows 工作站用户很有吸引力。RTX 5000 PRO 48GB 那条讲的是长上下文和显存策略：27B FP8 加 200k BF16 KV cache，还能报 80 TPS。前者像“让更多人跑起来”，后者像“把长上下文塞进单卡”。它们合在一起说明社区关注点已经从“27B 能不能本地跑”转到“能不能在消费级或工作站级硬件上跑得顺”。这点我认可。但我对数字本身很谨慎。正文没有披露测试命令、batch size、prompt 长度、生成长度、量化格式细节、vLLM 版本、CUDA/driver 版本、是否启用 chunked prefill、是否测的是 decode-only、是否包含 prefill。72 tok/s 和 80 TPS 在本地推理语境里差异很大：单用户 decode 速度、批量吞吐、短输出平均值，都可以写成 tok/s。没有复现条件，这组数就是标题级 claim。尤其 200k BF16 KV cache 这个说法，关键在实际可用上下文、注意力实现、吞吐下降曲线和显存余量，标题没给。外部对比看，vLLM 对 Windows 原生支持一直不是主战场。过去本地部署常见路线是 Linux、WSL2、Docker、llama.cpp、Ollama、LM Studio、TensorRT-LLM 或各种社区打包。Windows 原生 vLLM 如果真的稳定，价值不在“又快了几 tok/s”，而在减少企业内网和个人工作站的部署阻力。很多公司桌面环境不给 Docker 权限，WSL 也被 IT 策略卡住；一个 portable launcher 加 installer，实际能扩大测试人群。这个工程价值比标题里的 72 tok/s 更扎实，前提是安装包可信、依赖可审计、版本可锁定。我更担心的是 LocalLLaMA 标题文化容易把“能跑截图”包装成“性能结论”。社区里经常出现同一模型、同一 GPU，换 prompt 长度和采样参数后速度差一截。RTX 3090 只有 24GB 显存，Qwen3.6-27B 如果以 FP8 或更低精度跑，权重、KV cache、workspace 都会挤得很紧。标题没有说上下文长度，72 tok/s 很大概率不是 200k 上下文条件下的速度。RTX 5000 PRO 48GB 那条给了 200k KV cache，但硬件和条件完全不同，不能拿来替 RTX 3090 背书。说真的，这类事件对 AI 从业者的价值不是转发速度榜，而是拿来更新本地推理栈判断：Qwen 系 20B-30B 档模型正在进入“单卡可用、长上下文可试、Windows 用户也能参与”的区间。它会挤压一部分小团队对闭源 API 的默认依赖，尤其是代码助手、日志分析、内网文档问答这类低并发场景。但在没有复现脚本前，我不会把 72 tok/s 写进采购建议，也不会把 80 TPS 当容量规划数字。我的处理方式很简单：收藏项目名，等 GitHub、安装包 hash、bench 命令和第三方复跑；没这些，就只算社区雷达上的热信号。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:10

37d ago

FEATURED彭博科技· rssEN08:10 · 05·02

中国法院裁定企业不能以 AI 为由裁员

中国法院裁定企业不能仅以 AI 替代为由裁员，标题披露 1 条规则。正文抓取内容主要是 Bloomberg 页面导航，未披露法院名称、案号、赔偿金额或适用条件。

#Bloomberg#Policy

精选理由

Bloomberg标题给出中国法院对AI替代裁员的边界，HKR-H/R强，HKR-K只有1条规则。正文抓取缺少法院、案号、赔偿金额和适用条件，压在精选门槛。

一句话点评

只有标题给出“不得仅因 AI 替代裁员”，没有案号和条件；公司想拿 AI 当裁员万能理由，这条先把口子堵住。

锐评

这条判决戳中了企业 AI 降本叙事里最偷懒的一环：把岗位消失包装成技术必然。标题只披露一条规则——企业不能仅以 AI 替代为由裁员，正文未披露法院名称、案号、赔偿金额和适用条件，所以别急着把它读成全国统一裁判尺度。对 AI 团队更现实的影响，是 HR 和法务会要求你证明“岗位变化”而不是喊“模型替代”。这跟欧盟 AI Act 的逻辑有点像：监管不拦技术部署，但会卡住高风险场景里的责任链。以后内部 Copilot ROI 报告若直接写“减少 30% 人力”，反而会变成劳动争议证据。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

06:35

37d ago

FEATUREDr/LocalLLaMA· rssEN06:35 · 05·02

暗钱活动付费给网红，将中国 AI 描述为威胁

Build American AI 资助一项影响者活动，条件是传播亲 AI 信息并煽动对中国的担忧。正文称该非营利组织关联一个 super PAC，资金来自 OpenAI 与 Andreessen Horowitz 高管；具体金额、名单和投放机制正文未披露。

#Build American AI#OpenAI#Andreessen Horowitz#Policy

精选理由

HKR 三项都命中：正文给出组织、资金来源和传播条件，金额、影响者名单与投放机制未披露。适合精选边缘位，不是模型发布级事件。

一句话点评

只有标题和摘要，Reddit 正文 403；把“中国威胁”塞进 influencer brief，这像 AI 政策游说开始学加密圈那套脏活。

锐评

Build American AI 这单最刺眼的不是亲 AI，而是把“中国威胁”做成投放口径。摘要给出的链条很具体：该非营利组织被指关联 super PAC，资金来自 OpenAI 与 Andreessen Horowitz 高管；但 Reddit 正文 403，金额、达人名单、投放机制都没给。我不把这当成已坐实的丑闻，证据还差关键三件套：合同、付款、话术包。可这个模式很熟：美国 AI 政策战已经从白皮书、听证会，滑到创作者分发。a16z 一直公开反监管，OpenAI 又要把“安全”和“美国领先”绑在一起讲；若这条后续补上付款证据，杀伤力会比普通 PAC 广告大得多。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:42

38d ago

FEATURED量子位 · 公众号· rssZH02:42 · 05·02

腾讯混元开源 440MB 离线翻译模型，称质量超过 Google 翻译

腾讯混元团队开源 Hy-MT1.5-1.8B-1.25bit，把 1.8B 翻译模型压缩至 440MB。模型支持 33 种语言、1056 个方向，Android Demo 可在骁龙 888、8GB 内存手机离线运行。真正值得盯的是 1.25-bit Sherry 量化：每 4 个参数中 3 个用 1-bit、1 个置零。

#Inference-opt#Tencent Hunyuan#QbitAI#Google

精选理由

腾讯混元开源端侧翻译模型，440MB、33 语种、1056 方向和 1.25-bit Sherry 量化给到可核查信息。HKR 三项都命中，但它是垂直翻译模型，不到基础模型级发布。

一句话点评

腾讯把 1.8B 翻译模型压到 440MB，手机离线跑；“超谷歌”先别信，1.25-bit 量化才是硬货。

锐评

腾讯这条最硬的是端侧预算被打穿，不是“翻译质量超谷歌”这句标题党。Hy-MT1.5-1.8B-1.25bit 把 1.8B 压到 440MB，Android Demo 标到骁龙 888、8GB 内存可离线跑；33 种语言、1056 个方向覆盖也够产品化。我更关心 Sherry 1.25-bit：每 4 个参数里 3 个用 1-bit、1 个置零，这比常规 INT4/INT8 端侧压缩狠得多。问题是正文抓取只剩验证码页，没看到 BLEU/COMET、延迟、功耗和谷歌对比集。没有这些，“超谷歌”只是公关句；440MB 离线可跑才是可复现的信号。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:42

38d ago

FEATURED量子位 · 公众号· rssZH02:42 · 05·02

苹果官方 App 误打包 Claude.md，被曝内部使用 Claude Code

Apple Support v5.13 在 5 月 1 日更新中误打包 Claude.md，24 小时内撤回。文件显示 Juno AI 与 Live Agents 通过 Protocol 层切换，client、agent、assistant 三类消息走同一流程。真正值得盯的是发布审查：正文未披露苹果如何让该文件进入生产包。

#Agent#Code#Tools#Apple

精选理由

HKR 三项都成立，但事件仍是一次 App 打包事故，不是模型或平台级发布。Apple 体量与 Claude.md 细节把它推到精选线，正文未披露文件进入生产包的审查链路。

一句话点评

Apple Support 把 Claude.md 塞进 v5.13 又 24 小时撤回，最丢人的不是用 Claude，而是苹果的发布闸门没挡住内部提示文件。

锐评

Apple 这次翻车暴露的是 AI 功能进生产链路太快，发布审查没跟上。标题和摘要给出两个硬点：Apple Support v5.13 在 5 月 1 日带出 Claude.md，24 小时内撤回；文件提到 Juno AI、Live Agents 通过 Protocol 层切换，client / agent / assistant 三类消息走同一流程。我不把它看成“苹果也在 Vibe Coding”的笑话。大公司用 Claude 写代码早就不稀奇，稀奇的是 Claude.md 这种开发上下文能进 App 包。OpenAI、Anthropic 客户端过去一年都在把 agent 流程产品化，苹果如果把客服 AI 和真人坐席接到同一协议层，方向很合理。问题是正文只有验证码页，未披露该文件如何通过打包、审计、上架检查。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

热点聚合 · 2026-05-02

更多

频道

后台