全部 · 2026-05-11

▸ 50 items · updated 3m ago

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 2573 26105 27120 28142 29116 3064 3162

2026年6月

一二三四五六日

1150 2157 3132 4117 5127 669 773 8141 9135 1084 1196 1288 1346 1434 1570 1682 1775 1886 1955 2027 2120 2274 2374 2468 2564 2640 2724 2837 2956 3083

2026年7月

一二三四五六日

156 271 347 421 527 664 758 865 975 1050 1134 1228 1345 1484 1582 1683 1745 1818 1938 2051 2170 2265 2340 24 25 26 27 28293031

2026-05-11 · 星期一2026年5月11日

23:33

77d ago

FEATUREDHacker News 首页· rssEN23:33 · 05·11

通用汽车裁减IT员工并转向招聘AI技能更强的人才

通用汽车刚裁了几百个IT岗位，打算招一批AI技能更强的人进来。TechCrunch报道了这事，但正文没披露具体裁了哪些岗位、招人时间表，也没说新招的人要做什么。Hacker News上目前有20个点赞和11条评论，讨论热度一般。

#GM#TechCrunch#Hacker News#Personnel

精选理由

精选 · 重要度 80 · 吸引力 + 共鸣

一句话点评

通用汽车裁掉600多名IT员工，不是收缩，是换血——腾出位置招会搞AI的人。

锐评

通用汽车这次裁掉IT部门超过10%的人，大约600个正式岗位，目的很直白：把传统IT技能的人请走，换成懂AI开发、数据工程、云架构和提示词工程的人。公司发言人确认了数字，也明说这是“技能置换”，不是单纯的降本。从招聘方向看，他们要的不只是会用现成AI工具的人，还包括能做AI原生开发、搭智能体（agent）和建模型的人。这说明通用汽车想把AI能力直接嵌入内部系统和业务流程，而不是外包给咨询公司或买几个SaaS账号就完事。不过文章没披露几个关键信息：新招的AI岗位薪资预算比被裁岗位高多少，也没说这批新人进来后具体要替代哪些旧系统或流程。另外，裁掉的600人里有多少是资深员工、有没有转岗培训的机会，正文也没提。如果只是换一批更贵的人进来，短期成本反而会涨，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

80

SCORE

H1·K0·R1

23:18

77d ago

AI HOT 精选· aihot-apiZH23:18 · 05·11

AWS 发了一篇长文，讲怎么搭大模型训练和推理的基础设施

AWS 在 Hugging Face 上发了一篇博客，把大模型从训练到推理需要的基础设施拆成三层：计算（H100、H200、Blackwell B200/B300 这些 GPU 实例）、网络（NVLink 和 EFA）、存储（分布式共享存储）。上层用 Slurm 或 Kubernetes 管资源，再往上跑 PyTorch、JAX 这些框架，监控用 Pr...

#Inference-opt#AWS#NVIDIA#Hugging Face

一句话点评

AWS 把大模型从训练到推理所需的基础设施拆成三层：计算（H100/H200/B200/B300 GPU）、网络（NVLink+EFA）、存储（分布式共享），上层用 Slurm 或 K8s 管资源，再跑 PyTorch/JAX。说白了就是一份 AWS 云上搭模型工厂的硬件选型清单，适合正在选云方案的人快速对齐。但全文基本是产品介绍，没给任何实测数据或成本对比，比如 H200 比 H100 快...

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

35

SCORE

H0·K1·R0

23:10

77d ago

AI HOT 精选· aihot-apiZH23:10 · 05·11

纳德拉出庭反击马斯克：你有我手机号，从没抱怨过微软与OpenAI的合作

微软CEO纳德拉在马斯克诉OpenAI案中作证，核心反驳两点：一是马斯克2016年曾发邮件感谢微软给OpenAI提供折扣算力，微软当时甚至亏了1500万美元（约1.02亿人民币）；二是马斯克有纳德拉手机号，但直到2024年起诉前，从未对双方合作表达过不满。纳德拉还评价2023年奥尔特曼被董事会短暂解雇是“业余之举”，称自己当时出面稳住局面是为了防止员工...

#Safety#Satya Nadella#Elon Musk#OpenAI

一句话点评

纳德拉出庭甩出2016年马斯克感谢邮件，证明他当年支持微软给OpenAI打折算力，微软甚至亏了1500万美元。关键点是马斯克有纳德拉手机号，但直到2024年起诉前从未抱怨过合作。纳德拉还吐槽2023年奥尔特曼被董事会短暂解雇是“业余之举”。这案子核心是马斯克想证明OpenAI背弃非营利承诺，但纳德拉的证词直接打脸他“早不反对、现在才告”。正文没披露陪审团倾向，但微软和OpenAI的防守逻辑很...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

71

SCORE

H1·K1·R1

23:05

77d ago

FEATUREDThe Verge · AI· rssEN23:05 · 05·11

OpenAI 发布 Daybreak，正面回应 Anthropic 的安全模型 Claude Mythos

OpenAI 推出 Daybreak 安全项目，把 3 月发布的 Codex Security AI 智能体用起来，先给组织代码建威胁模型、梳理可能的攻击路径，再自动验证和检测高风险漏洞。这距离 Anthropic 公布 Claude Mythos 安全模型仅一个多月——Anthropic 当时说这模型太危险不能公开，只放在自家 Project Gla...

#Agent#Code#Safety#OpenAI

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenAI 用三月发的 Codex 安全智能体做了个叫 Daybreak 的项目，直接对标 Claude Mythos，但 Mythos 因为太危险根本没公开。

锐评

OpenAI 把三月的 Codex Security 智能体包装成 Daybreak 项目推出来，核心是给企业代码建威胁模型、自动找高风险漏洞。这明显是在追 Anthropic 的 Claude Mythos，但 Mythos 因为“太危险”只放在自家 Project Glasswing 里内部用，正文没披露具体跑分对比，所以 Daybreak 到底强多少还不好说。我会先打个折：The Verge 的报道基于 RSS 片段，没看到实测数据、误报率或客户案例，只说了能“自动检测高风险漏洞”。这点先别太激动，安全工具最怕误报多，正文没提怎么控制。另外，Daybreak 依赖 Codex Security 智能体，但那个智能体本身的能力边界也没展开。还缺三样东西：一是和传统 SAST/DAST 工具的对比，二是实际部署的延迟和资源消耗，三是 Anthropic 那边 Mythos 到底藏了什么让 OpenAI 这么急着跟牌。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

22:19

77d ago

● P1The Verge · AI· rssEN22:19 · 05·11

Mira Murati 的 Thinking Machines 展示交互式 AI 模型实时处理音视频文字

Thinking Machines 周一公布了他们的方向——做“交互模型”。按他们的说法，这种模型能同时接收音频、视频和文字，实时理解、回应并行动，而不是像现在的模型那样等你打完字或说完话才开始反应。正文没披露模型规模、发布时间、定价和最终产品形态，所以这东西到底多能打、什么时候能用上，现在都还是未知数。

#Agent#Multimodal#Audio#Thinking Machines

精选理由

精选 · 重要度 87 · 吸引力 + 知识量 + 共鸣

一句话点评

Mira Murati 的新公司 Thinking Machines 亮出了第一个产品方向：一个能同时看、听、读文字的交互模型。但两家报道都没给具体数据和实测效果，先当概念展示看。

锐评

Mira Murati 离开 OpenAI 后创立的 Thinking Machines 终于有了动静。他们展示了一个能实时处理音频、视频和文字的多模态交互模型，目标是让 AI 在对话中真正“边听边想”，而不是等你说完再反应。这个方向本身不新，但由 Murati 带队，行业关注度自然高。目前的信息都来自 The Verge 和 TechCrunch 的简短报道，正文没有披露模型规模、训练数据、延迟指标或任何基准测试结果。TechCrunch 的标题强调“边说话边听”，但文章里也没给出具体的技术实现细节。两家媒体都只发了快讯，没有深度评测。我会先打个折：概念听起来实用，但没看到实测之前，没法判断这是真突破还是包装过的多模态流水线。还缺的东西很多——模型参数量、推理成本、是否开源、有没有第三方对比测试，这些才是决定它能不能落地的关键。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

87

SCORE

H1·K1·R1

22:13

77d ago

FEATUREDSinocism · 比尔·毕晓普· rssEN22:13 · 05·11

中国三部门联合发文，要给 AI 智能体立规矩

网信办、发改委和工信部在 5 月 8 号发了一份《智能体规范应用与创新发展实施意见》，专门盯上了那些权限高、能自己干活的 AI 智能体。文件主要担心三点：隐私泄露、智能体擅自行动，以及行为失控。官方在答记者问里说，现在手机助手、端侧管家这类智能体产品铺得很快，但高自主性也带来了新风险。文件把这项工作跟一个 2027 年的目标绑在了一起——到那时，新出的...

#Agent#Safety#Tools#Cyberspace Administration of China

精选理由

精选 · 重要度 78 · 吸引力 + 知识量 + 共鸣

一句话点评

三部委发文管AI智能体，担心隐私泄露和擅自行动。但正文没给出具体违规案例和处罚细则，先别太激动。

锐评

网信办、发改委和工信部5月8号发的这份文件，专门盯上了那些权限高、能自己干活的AI智能体。官方担心三点：隐私泄露、智能体擅自行动，以及行为失控。文件把这事跟一个2027年的目标绑在一起——到那时新出的智能终端和AI智能体普及率要超过70%。这个数字说明官方预期这类产品会铺得很快，所以急着先把规矩立起来。不过，文件目前还停留在“实施意见”层面。正文没披露具体的违规案例，也没说如果智能体捅了篓子，责任算在开发者、使用者还是平台头上。对从业者来说，最关键的合规红线、技术标准和处罚尺度都还没出来。我会先打个折，把它看成是监管风向的提前吹风，而不是马上要落地的硬约束。后续还得看有没有配套的强制性国标或部门规章跟上。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

78

SCORE

H1·K1·R1

21:31

77d ago

FEATURED彭博科技· rssEN21:31 · 05·11

GitLab 宣布裁员，省下的钱要投给 AI agent 业务

GitLab 说会裁掉一部分岗位，把省出来的人力和预算转到 AI agent 方向。具体裁多少人、砍哪些部门、省出多少钱、什么时候开始执行，正文都没披露——因为 Bloomberg 原文被付费墙挡了，只拿到 RSS 摘要。我会先打个折：这更像一个资源重分配的信号，不是财务危机驱动的裁员。

#Agent#Code#GitLab#Personnel

精选理由

精选 · 重要度 72 · 吸引力 + 共鸣

一句话点评

GitLab 要裁员省钱，把钱砸进 AI agent 方向。但具体裁多少、省多少、怎么花，正文全被付费墙挡了，先别太激动。

锐评

GitLab 宣布裁员，目的是把省下来的预算重新投到 AI agent 相关的增长机会上。这更像一次主动的资源腾挪，而不是公司财务出了大问题。但关键信息全是缺口：Bloomberg 原文被付费墙拦住了，我们只拿到 RSS 摘要，正文没披露具体裁员人数、涉及哪些部门、能释放出多少资金，以及什么时候开始执行。对于做开发者工具的公司来说，押注 agent 方向逻辑上说得通——让模型直接参与写代码、管流水线、做 code review，确实可能改变开发流程。但 GitLab 这次调整到底是大刀阔斧还是小范围试探，目前完全看不清。建议等官方后续的财报电话会或博客披露具体数字再下判断。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

72

SCORE

H1·K0·R1

21:17

77d ago

FEATUREDr/LocalLLaMA· rssEN21:17 · 05·11

Reddit 网友实测 288 次模型调用，把本地模型输出 JSON 时的各种翻车方式全整理了一遍，还写了个修复库

Reddit 用户 kexxty 用 OpenRouter 跑了 288 次结构化输出测试，覆盖 Llama 3、Mistral、Command R、DeepSeek、Qwen 等模型，发现本地模型和纯 API 模型在 JSON 上出的错其实差不多。他把这些失败归类后，写了一个叫 outputguard 的 Python 修复库，用 MIT 协议开源。...

#Code#Tools#Benchmarking#OpenRouter

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

本地模型和 API 模型在 JSON 输出上犯的错其实差不多，这个测试用 288 次调用把常见翻车类型整理出来了，还附带一个开源修复库。

锐评

Reddit 用户 kexxty 用 OpenRouter 跑了 288 次结构化输出测试，覆盖 Llama 3、Mistral、DeepSeek 等主流模型，结论是本地模型和纯 API 模型在 JSON 上出的错类型高度相似。他把失败案例归类后，写了一个叫 outputguard 的 Python 修复库，用 MIT 协议开源，不依赖任何特定模型供应商。库的逻辑是先拿 JSON Schema 校验，再按顺序上 15 种修复策略，总共包含 2001 个测试用例。这个工作的价值在于把“模型输出 JSON 老坏”这件事从吐槽变成了可复现的工程问题。15 种修复策略覆盖了哪些具体错误、修复成功率多少，正文没披露，这点先别太激动。另外测试只跑了 288 次调用，样本量偏小，不同模型之间的失败分布差异也没展开。如果作者能补上修复前后的通过率对比，以及哪些策略最管用，参考价值会大很多。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

21:04

77d ago

Hacker News 首页· rssEN21:04 · 05·11

我用AI搭了个工具，找出半夜吵醒我的元凶

作者住在嘈杂的城市，经常半夜被吵醒却不知道原因。他用一个周末（约8小时）让AI帮忙搭了一套工具：树莓派+两个USB麦克风，只在睡觉时录音，结合Garmin手表睡眠数据和Home Assistant传感器事件，生成一个像音乐编辑器的可视化界面。AI没用来识别声音（还是自己戴耳机听），但把搭建成本从“懒得搞”降到了“周末搞定”。结果发现吵醒他的主要是邻居关...

#Code#Tools#Commentary

一句话点评

作者用树莓派+两个USB麦克风，只在睡觉时录音，结合Garmin手表睡眠数据和Home Assistant传感器事件，生成一个像音乐编辑器的可视化界面。AI没用来识别声音（还是自己戴耳机听），但把搭建成本从“懒得搞”降到了“周末搞定”。结果发现吵醒他的主要是邻居关门和街上卡车。短评：AI没帮你听声音，但帮你省了8小时搭工具，值了。点评：核心价值不在AI识别能力，而在AI降低了个人工具...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

45

SCORE

H1·K0·R1

21:01

77d ago

FEATUREDr/LocalLLaMA· rssEN21:01 · 05·11

把 prompt 缓存用到强化学习训练里：长提示短回复场景下，Qwen3.5-4B 训练速度提升 7.5 倍

作者提出在强化学习训练时复用 prompt 缓存，专门针对那种提示很长、模型回复很短的任务。在 Qwen3.5-4B 上跑 16k token 提示、64 token 回复的例子，训练速度直接快了 7.5 倍。另一个 G=8 的例子更直观：1000 token 提示加 100 token 回复，原本要处理 8800 个 token，用这方法后实际只需处...

#Fine-tuning#Inference-opt#Qwen#girishkumama

精选理由

精选 · 重要度 78 · 吸引力 + 知识量 + 共鸣

一句话点评

在长提示、短回复的 RL 训练里复用 prompt 缓存，Qwen3.5-4B 上实测快了 7.5 倍，但正文被 Reddit 屏蔽，看不到具体实现和限制。

锐评

这条消息的核心卖点很直接：把推理时常用的 prompt 缓存思路搬到了强化学习训练里，专门吃那种提示巨长、模型只回几个字的场景。作者在 Qwen3.5-4B 上跑 16k token 提示配 64 token 回复，训练速度直接拉到 7.5 倍。另一个例子更直观，1000 token 提示加 100 token 回复，原本要处理 8800 个 token，用这方法后实际只处理 1800 个独立 token，省掉了大量重复计算。但这里有个硬伤：Reddit 原文被网络屏蔽，我们拿到的只有摘要，看不到具体怎么实现缓存、对训练收敛有没有影响、是不是只对特定 RL 算法有效。7.5 倍这个数字是在单一模型和单一任务上测的，换别的模型或回复长度变长后还能剩多少加速，正文没披露。另外，缓存本身会吃显存，显存换时间的账怎么算也没提。对做 RL 训练的人来说，这个方向值得跟，但先别急着改 pipeline。等原文解封或者作者放出代码和更完整的消融实验再说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

78

SCORE

H1·K1·R1

20:56

77d ago

FT · 科技· rssEN20:56 · 05·11

纳德拉：OpenAI 2023年罢免奥特曼那事，干得太业余了

微软CEO萨提亚·纳德拉在马斯克诉OpenAI案中作证，称OpenAI董事会2023年试图罢免山姆·奥特曼的操作是“业余水平”。他解释了当时为何力挺奥特曼，但正文未披露证词全文、具体法律主张或微软内部的决策过程。

#Satya Nadella#OpenAI#Elon Musk#Incident

一句话点评

纳德拉在马斯克诉OpenAI案中作证，称2023年OpenAI董事会试图罢免奥特曼的操作是“业余水平”。他解释了微软当时为何力挺奥特曼，但正文被FT付费墙挡住，看不到证词全文、具体法律主张或微软内部决策过程。短评：纳德拉公开吐槽OpenAI董事会“业余”，但关键细节都在付费墙后，目前只能看个标题。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

20:54

77d ago

AI HOT 精选· aihot-apiZH20:54 · 05·11

Luma Agents：扔几张参考图，自动生成一条完整广告

Luma Labs 发了个新工具 Luma Agents，说只要上传参考素材、定个创意方向，就能自动从情绪板变成一条完整广告。正文没披露生成耗时、模型细节、可控参数和定价，所以实际效果和成本都还不清楚。如果真能一步到位，对做素材的团队来说省不少事，但先别太激动，等实测。

#Agent#Multimodal#Tools#Luma Labs

一句话点评

Luma Labs 说新工具 Luma Agents 能拿参考素材和创意方向，自动从情绪板生成一条完整广告。正文没披露生成耗时、模型细节、可控参数和定价，所以实际效果和成本都不清楚。如果真能一步到位，对做素材的团队来说省不少事，但先别太激动，等实测。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

66

SCORE

H1·K0·R1

20:49

77d ago

r/LocalLLaMA· rssEN20:49 · 05·11

48GB显存跑50万token上下文，写代码每秒21个token

Reddit用户发帖称，用双TITAN RTX显卡（共48GB显存）跑Nemotron-3-Super-64B-A12B-Math-REAP-GGUF模型，实现了50万token的上下文窗口，写代码速度约21 token/秒。50万token大概能塞进三本《三体》的体量，21 tok/s在本地推理里算中等偏快。但帖子正文被屏蔽，没披露用了什么量化精度、...

#Code#Inference-opt#Reddit#Hugging Face

一句话点评

50万token上下文在48GB显存上跑出21 tok/s，这个数字挺亮眼——相当于三本《三体》塞进本地模型，写代码速度也够用。但帖子正文被屏蔽，没披露量化精度、具体prompt和可复现条件，所以这个成绩要打个问号。如果是真的，对长上下文本地部署是个好消息，但先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

20:45

77d ago

FEATUREDAI HOT 精选· aihot-apiZH20:45 · 05·11

OpenAI 发布 Daybreak，把自家模型和 Codex 打包成网络安全防御工具

OpenAI 宣布推出 Daybreak，一个面向安全团队的 AI 防御系统，整合了他们最强的模型、Codex 以及安全合作伙伴的能力，目标是加快漏洞发现和软件防护的速度。正文没披露具体定价、上线时间，也没给出任何防御效果的实测数据，所以实际能防住什么级别的攻击、误报率多少都还不清楚。

#Agent#Code#Tools#OpenAI

精选理由

精选 · 重要度 75 · 吸引力 + 共鸣

一句话点评

OpenAI 发了个网络安全 AI 系统 Daybreak，但正文没给任何防御效果数据，也没说定价和上线时间，先当个预告看。

锐评

OpenAI 宣布推出 Daybreak，说是把自家最强模型、Codex 和安全合作伙伴的能力打包，帮安全团队更快发现漏洞、加固软件。听起来像是让 AI 直接进安全运维流程干活，但正文只给了概念，没披露任何实测数据——能防住什么级别的攻击、误报率多少、响应延迟多高，全都不清楚。定价和上线时间也没提，所以现在只能算一张路线图，离实际能用还有距离。我会先打个折：方向对，但缺验证。如果后续能放出在真实攻防场景下的检出率和误报率，才值得认真评估。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

75

SCORE

H1·K0·R1

20:26

77d ago

Hacker News 首页· rssEN20:26 · 05·11

E2a：给AI智能体配一个开源邮箱网关

Mnexa-AI 开源了一个叫 E2a 的工具，作用是让 AI 智能体（比如自动客服、邮件助手）能收发邮件。它做了几件事：自动把同一话题的邮件归到一个线程里，发出的邮件可以让人先审核一遍，几分钟就能配好一个邮箱地址，还支持 WebSocket 或至少送达一次的 webhook 推送。不过项目刚起步，DMARC 防伪造、多区域部署、应用层加密、SOC 2...

#Agent#Tools#Mnexa-AI#E2a

一句话点评

Mnexa-AI 开源了 E2a，一个让 AI 智能体收发邮件的网关。它自动把同一话题的邮件归入一个线程，发出的邮件可以让人先审核，几分钟就能配好邮箱，还支持 WebSocket 或至少送达一次的 webhook 推送。不过项目刚起步，DMARC 防伪造、多区域部署、应用层加密、SOC 2 等安全认证都还没做。短评：给 AI 加个邮箱接口，开源、能审、能推，但安全合规还差得远。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

20:23

77d ago

Hacker News 首页· rssEN20:23 · 05·11

高中生开源了 Google Antigravity 的纯 JS 克隆版，零安装、自带终端和侧边栏 agent

一个高中生开发者用纯 HTML/CSS/JS 复刻了 Google Antigravity 的界面，项目叫 OpenGravity，目前是 alpha 阶段。亮点是零安装——靠 WebContainer API 和 xterm.js 在浏览器里跑了一个终端，能直接同步本地文件系统，侧边栏还有个 agent 可以执行命令和编辑文件。BYOK 模式意味着你...

#Agent#Code#Tools#OpenGravity

一句话点评

一个高中生用纯前端技术复刻了 Google Antigravity 的界面，亮点是零安装——靠 WebContainer API 在浏览器里跑终端，还能同步本地文件。BYOK 模式把 API key 存 localStorage，安全性自己掂量。目前才 13 个 HN 点赞，alpha 阶段，别当生产工具用。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

64

SCORE

H1·K1·R0

20:16

77d ago

Product Hunt · AI· rssEN20:16 · 05·11

Whisper Island：把语音转文字塞进 Mac 刘海

Coddo 新发了一个 Mac 小工具 Whisper Island，核心功能是语音转文字并直接粘贴到当前激活的 App（Slack、Notion、IDE 等）。界面藏在 MacBook 刘海或悬浮胶囊里，不占屏幕。用的是 OpenAI Whisper 模型，支持多语言。需要 Coddo 账号登录，和 Coddo 共享配额。免费，但正文没披露具体配额限...

#Audio#Coddo#Product Hunt#Product update

一句话点评

把语音转文字塞进MacBook刘海，不占屏幕，直接粘贴到当前App。免费但没披露配额限制，如果是重度用户可能很快用完。用OpenAI Whisper，延迟和离线支持都没提，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

45

SCORE

H1·K0·R0

19:54

77d ago

FEATUREDr/LocalLLaMA· rssEN19:54 · 05·11

Reddit 网友用英特尔傲腾持久内存攒了一台机器，本地跑 1 万亿参数模型，速度超过 4 token/秒

Reddit 用户 APFrisco 分享了一套硬件方案：用 768GB 英特尔傲腾持久内存（Optane PMem）当主存储，搭配 192GB DDR4 ECC 内存和一张 12GB 显存的 RTX 3060 显卡，通过 llama.cpp 的混合推理（CPU+GPU），在本地跑起了 Kimi K2.5 这个 1 万亿参数模型的 Q2_K_XL 量化...

#Inference-opt#APFrisco#Intel#Kimi K2.5

精选理由

精选 · 重要度 72 · 吸引力 + 知识量 + 共鸣

一句话点评

用傲腾内存跑1万亿参数模型，每秒4个token，这套方案把“本地跑超大模型”的成本打下来了，但正文没披露具体硬件总价和稳定性。

锐评

Reddit 用户 APFrisco 用 768GB 英特尔傲腾持久内存加 192GB DDR4 内存和一张 RTX 3060，在本地跑起了 Kimi K2.5 的 1 万亿参数量化版，速度约每秒 4 个 token。这个方案的核心是把傲腾当主存储，靠 llama.cpp 混合 CPU 和 GPU 推理，绕开了显存不够的硬伤。每秒 4 个 token 的速度不算快，大概相当于人眼扫读，但考虑到模型体量和硬件门槛，已经能让个人用户“跑得动”了。不过原文被 Reddit 屏蔽，我们看不到完整的配置细节、功耗数据或长时间运行的稳定性。傲腾持久内存虽然单 GB 成本比显存低很多，但二手市场价格波动大，实际攒机成本不好估算。另外，Q2_K_XL 这种极低量化对模型回答质量的影响有多大，正文也没提。这点先别太激动，等有实测对比再下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

72

SCORE

H1·K1·R1

19:51

77d ago

AI HOT 精选· aihot-apiZH19:51 · 05·11

OpenAI 给开发者加了 Codex 插件，写 AI 应用和智能体能快一点

OpenAI 在开发者工具里塞了个 Codex 插件，说能帮你更快地搭 AI 应用和智能体。但正文没披露具体快多少、有没有版本号、要不要额外付费——目前只能当个功能预告看，别急着升级。

#Agent#Code#Tools#OpenAI

一句话点评

OpenAI 给开发者工具加了个 Codex 插件，号称能加速搭 AI 应用和智能体。但正文没披露具体快多少、要不要额外付费、有没有版本号——目前只能当个功能预告看，别急着升级。短评：OpenAI 画了个 Codex 插件的饼，说能加速开发，但没给数据、价格和版本号，先观望。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

62

SCORE

H0·K1·R1

19:13

77d ago

彭博科技· rssEN19:13 · 05·11

Rezolve AI CEO 公开批评 Commerce.com 增长“丢人”，发起敌意收购

Rezolve AI 的 CEO Dan Wagner 在 Bloomberg 采访中直接开火，说 Commerce.com 的增长速度“令人尴尬”，并确认公司已发起敌意收购。正文没披露收购金额、股权结构、持股门槛和交易时间表，所以目前只能看个态度。Wagner 的潜台词是：你们自己做得太慢，不如我们来。对 AI 从业者来说，这更像一个商业资本动作，跟...

#Rezolve AI#Dan Wagner#Commerce.com#Funding

一句话点评

Rezolve AI CEO 公开批评 Commerce.com 增长“令人尴尬”，并确认已发起敌意收购。正文没披露收购金额、股权结构或时间表，目前只能看个态度。对 AI 从业者来说，这更像一个商业资本动作，跟技术关系不大。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

48

SCORE

H1·K0·R0

19:04

78d ago

FEATURED彭博科技· rssEN19:04 · 05·11

Ilya Sutskever 说他在 OpenAI 的股份值 70 亿美元

Ilya Sutskever 公开表示，他持有的 OpenAI 股份价值约 70 亿美元，这让他成为公司最大的个人股东之一。不过，正文因为 Bloomberg 的反爬机制没抓到，具体持股比例、估值怎么算的、有没有交易条款，这些关键信息目前都看不到。

#Ilya Sutskever#OpenAI#Funding#Personnel

精选理由

精选 · 重要度 75 · 吸引力 + 知识量 + 共鸣

一句话点评

Ilya Sutskever 自曝身家，说手里的 OpenAI 股份值 70 亿美元。但正文被 Bloomberg 反爬挡了，估值怎么算的、有没有限售条款，全看不到，这数先打个折。

锐评

Ilya Sutskever 公开说自己在 OpenAI 的股份价值约 70 亿美元，这让他成了公司最大的个人股东之一。但这条消息目前只有标题和摘要，Bloomberg 的正文因为反爬机制没抓到，具体持股比例、估值依据、有没有附带交易限制，这些关键信息全是空白。 70 亿这个数字本身挺唬人，但得看它是按哪一轮融资算的。OpenAI 最近估值在 3000 亿美元上下浮动，如果按这个基数倒推，Sutskever 的持股大概在 2% 出头。不过这只是粗略估算，实际可能因为优先股、期权行权价或者锁定期打折，真实可套现的价值未必有这么多。另外，Sutskever 离开 OpenAI 后自己开了 Safe Superintelligence Inc.，他手里这批股份有没有离职后的处置条款、能不能自由卖出，正文没披露，这些都会直接影响 70 亿的含金量。等他或 Bloomberg 放出完整信息再下结论不迟。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

75

SCORE

H1·K1·R1

18:57

78d ago

r/LocalLLaMA· rssEN18:57 · 05·11

Qwen-3.6-27B 在 Codex 里跑着跑着就停了？

有用户在 Reddit 反映，把 4-bit 量化后的 Qwen-3.6-27B 放进 Codex 测试框架并开启思考模式后，任务经常卡在“我要用这个工具”这类中间消息上，没法正常跑完。正文没披露日志、报错码或最小复现步骤，所以目前只能确认现象，没法判断是模型本身不稳定、量化精度损失还是 Codex 的兼容问题。如果你也在用这个组合，建议先关掉 thi...

#Agent#Code#Tools#Qwen

一句话点评

有用户反映4-bit量化的Qwen-3.6-27B在Codex测试框架里开思考模式会卡在中间消息上跑不完。正文没贴日志或报错码，所以目前只能确认现象，没法判断是模型不稳、量化精度损失还是Codex兼容问题。如果你也在用这个组合，建议先关掉thinking模式试试。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

48

SCORE

H0·K1·R1

18:54

78d ago

AI HOT 精选· aihot-apiZH18:54 · 05·11

Anthropic 估值五天涨了 2000 亿美元，年收入从 1 亿跳到 450 亿

Anthropic 的市场隐含估值五天从 1.2 万亿涨到 1.4 万亿美元，暴增 2000 亿。链上 Pre-IPO 数据显示，其年化收入从 2023 年的 1 亿美元飙到现在的 450 亿，一年翻了 14 倍。估值自 2025 年 10 月已涨 1067%，最近 24 天又涨 40%。这些数字来自 Jupiter 等链上平台交易的 Pre-IPO ...

#Anthropic#Jupiter#Funding

一句话点评

Anthropic五天估值涨2000亿美元，从1.2万亿跳到1.4万亿。链上Pre-IPO数据说年收入从2023年1亿飙到450亿，一年翻14倍。但这是链上交易工具反映的隐含估值，不是官方数字，流动性差、样本少，实际IPO定价可能打折。正文没披露450亿收入是确认收入还是合同额，也没说利润。如果是真的挺省钱，但这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

18:48

78d ago

FEATUREDAI HOT 精选· aihot-apiZH18:48 · 05·11

把大模型命令塞进脚本第一行：用 shebang 直接跑 LLM

Simon Willison 试了一种很野的玩法：把 LLM 命令行工具直接写在脚本的 shebang 行里，让一个纯文本文件变成可执行脚本。最简单的例子是 `#!/usr/bin/env -S llm -f` 下面直接跟一句“画个骑自行车的鹈鹕 SVG”，就能生成图片。复杂一点的可以用 `-T` 参数调用外部工具（比如报时），或者直接在 YAML 模...

#Tools#Code#Agent#Simon Willison

精选理由

精选 · 重要度 75 · 吸引力 + 知识量 + 共鸣

一句话点评

Simon Willison 把 LLM 命令行工具塞进了脚本第一行的 shebang 里，让一个纯文本文件直接变成可执行脚本。

锐评

这是个很“玩”的想法，但背后有实际用处：把自然语言指令直接当脚本跑。最简单的例子是 shebang 写 `#!/usr/bin/env -S llm -f`，下面跟一句“画个骑自行车的鹈鹕 SVG”，就能出图。复杂一点的可以用 `-T` 参数调用外部工具，比如报时；或者直接在 YAML 模板里用 Python 函数定义计算器，让模型自己调 multiply 和 add 算出 2344×5252+134=12,310,822。这本质是把 LLM 当成一个能理解模糊指令、还能调用工具的脚本解释器。好处是门槛极低，坏处也很明显：每次执行都要调模型，延迟和成本比传统脚本高几个数量级，而且输出不稳定，不适合任何需要确定性的场景。正文没提这种用法在生产环境的风险控制，也没给延迟或成本数据。如果是真的跑一次几毛钱、等两三秒，那对一次性小任务还行；但别指望它替代正经脚本。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

75

SCORE

H1·K1·R1

18:43

78d ago

AI HOT 精选· aihot-apiZH18:43 · 05·11

Claude Code 小版本更新，具体改了啥没写

Anthropic 在 GitHub 上发布了 Claude Code v2.1.139，仓库目前有 12.3 万星标和 2.02 万 fork，热度很高。但这次版本的发布说明正文是空的，没有披露任何改动内容、修复或新功能。如果你想知道具体更新了什么，得去翻 commit 记录或者等后续补充。

#Code#Anthropic#GitHub#Claude Code

一句话点评

Anthropic 发了 Claude Code v2.1.139，仓库 12.3 万星标热度很高，但发布说明正文是空的，没写任何改动。想确认修了什么 bug 或加了什么功能，得自己去翻 commit 记录。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

34

SCORE

H0·K0·R0

18:20

78d ago

彭博科技· rssEN18:20 · 05·11

Circle CEO：利率只是稳定币增长的一个因素

Circle CEO 说 AI agent 正在接近能实际做金融交易，同时公司一季度收入涨了 20%，但因为加密货币市场波动，净利润反而下降了。正文没披露具体净利润数字和 AI agent 交易落地的技术细节，这点先别太激动。

#Agent#Circle#Jeremy Allaire#Bloomberg

一句话点评

Circle CEO 说 AI agent 快能实际做金融交易了，但正文没披露任何技术细节或落地案例，这点先别太激动。公司一季度收入涨了20%，净利润反而下降，说明加密货币市场波动对稳定币发行商的影响不小。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

62

SCORE

H1·K1·R1

18:06

78d ago

AI HOT 精选· aihot-apiZH18:06 · 05·11

MiniMax 周三在旧金山办模型开发者活动，到场送 30 美元 API 额度

MiniMax 联合 Vercel、Anthropic 和 Moonshot 在旧金山办线下活动，时间是美国太平洋时间 5 月 13 日下午 5:30。每位参与者能拿到 30 美元 API 积分，还有额外抽奖池。活动本身是开发者交流性质，不是产品发布，正文没披露具体议程或嘉宾名单。

#Tools#MiniMax#Vercel#Anthropic

一句话点评

MiniMax 联合 Vercel、Anthropic 和 Moonshot 在旧金山办线下开发者活动，每人送 30 美元 API 积分，还有抽奖池。活动是交流性质，不是产品发布，正文没披露具体议程或嘉宾名单。短评：送 30 美元 API 积分算实在，但议程和嘉宾都没说，先别太激动。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

39

SCORE

H0·K0·R0

17:34

78d ago

FEATUREDAI HOT 精选· aihot-apiZH17:34 · 05·11

Replit 上线并行代理，一次能跑 10 个代理同时干活

Replit 新出的并行代理功能，允许最多 10 个代理同时跑。每个代理拿到的都是你应用的独立副本，在各自的机器上互不干扰，最后通过一个代理工作流把结果合并回来。正文没披露合并冲突怎么处理、任务怎么拆分，也没给出具体提速数据，这点先别太激动。

#Agent#Code#Tools#Replit

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

Replit 能同时跑 10 个代理干活了，但正文没交代任务怎么拆、冲突怎么解，也没给提速数据，先别太激动。

锐评

Replit 这次更新的核心是把并行代理做进了开发环境里：最多 10 个代理同时跑，每个拿一份独立的应用副本，在各自机器上互不干扰，最后通过一个代理工作流把结果合并回来。听起来像给开发者配了个小团队，但关键细节全没给。正文没披露任务是怎么拆分的——是用户手动分配还是系统自动切？合并冲突怎么处理，比如两个代理改了同一个文件怎么办？也没给出任何性能对比数据，比如 10 个代理比单代理快多少、资源开销涨了多少。这些信息缺口让实际效果很难判断。对 AI 从业者来说，这个方向有意思：把 agent 从单打独斗变成并行协作，确实可能缩短构建时间。但在看到冲突解决机制和实测数据之前，我会先打个折。如果只是简单把任务分出去再粗暴合并，实际体验可能还不如一个靠谱的单代理。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

17:30

78d ago

AI HOT 精选· aihot-apiZH17:30 · 05·11

PixVerse 用 GPT Image 2 生成了一组时尚大片，8 张图拼成杂志内页

有用户晒出一组 2×4 的时尚编辑图，每张都是男模穿街头潮牌、拿滑板或吉他，背景是纯色或渐变，打光柔和、皮肤逼真，没有文字和 logo。这组图是用 GPT Image 2 在 PixVerse 上生成的，走的是奢侈品广告风。正文没披露生成耗时和成本，但效果看起来已经接近商业摄影了。

#Vision#Multimodal#PixVerse#GPT Image 2

一句话点评

GPT Image 2 在 PixVerse 上生成的 2×4 时尚编辑图，8 张男模街拍，打光柔和、皮肤逼真，接近商业摄影。但正文没披露生成耗时和成本，也没说是否一次出图还是多次抽卡。效果看着不错，但离真正替代摄影棚还有距离——单张图可以，要保证 8 张风格、光影、肤色一致，目前看只是单图展示。如果是真的挺省钱，但得等实测。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

32

SCORE

H0·K0·R0

17:29

78d ago

r/LocalLLaMA· rssEN17:29 · 05·11

PowerColor 发了个 32GB 显存的 AI 显卡，单槽被动散热

PowerColor 推出了 Radeon AI PRO R9600D，配备 32GB GDDR6 显存，单槽被动散热设计，用 12V-2x6 供电接口。32GB 显存能跑不少本地大模型，但正文没披露功耗、价格和上市时间，也没跑分数据。被动散热意味着风扇都没有，适合塞进服务器机柜，但家用得自己保证风道。

#Inference-opt#PowerColor#Radeon#Product update

一句话点评

PowerColor 出了一张 32GB 显存的单槽被动散热显卡 R9600D，专为本地跑大模型设计。32GB 显存能塞下 70B 模型量化版，单槽被动散热意味着没风扇，适合塞机柜，家用得自己搞风道。但正文没披露功耗、价格和上市时间，也没跑分，实际推理速度未知。如果是真的，这卡比 RTX 4090 便宜不少，但被动散热和未知功耗让人犹豫。短评：32GB 显存挺香，但没功耗和价格，先别激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

17:27

78d ago

FEATUREDAI HOT 精选· aihot-apiZH17:27 · 05·11

Gemini 现在能翻你的 Gmail 和相册，自动拼出一个旅行计划

Gemini App 推出了“个人智能”功能，可以把你的 Gmail、Google Photos、搜索记录和 YouTube 观看历史串起来，直接生成一份定制旅行行程。它省去了你自己翻邮件找酒店、从相册回忆地点的步骤。你随时可以选哪些 App 给它读，也能关掉个性化设置。正文没披露它具体怎么处理隐私数据、会不会把邮件内容喂给模型训练，这点先别太激动。

#Agent#Tools#Memory#Gemini App

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

Gemini 能翻你的 Gmail、相册和搜索记录自动拼行程了，但正文没提这些数据会不会被拿去训练模型，这点先别太激动。

锐评

Gemini App 这次更新的核心是把你的个人数据——Gmail 里的酒店订单、Google Photos 的地点记录、搜索和 YouTube 历史——直接串起来生成旅行计划。省事是真的省事，不用自己翻邮件找预订号、从相册回忆上次去了哪。你可以手动选哪些 App 给它读，也能随时关掉个性化，控制权看起来在你手里。但正文完全没披露隐私处理细节：邮件内容会不会被用于模型训练？行程生成是在本地跑还是上传云端？这些关键信息缺失，让“个人智能”这个说法得打个折。如果是本地处理，隐私风险可控；如果上云，就得看 Google 的隔离策略。另外，目前只展示了旅行这一个场景，实际能覆盖多少日常任务还不清楚。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

17:22

78d ago

FEATUREDAI HOT 精选· aihot-apiZH17:22 · 05·11

Anthropic 把 Claude 平台搬上了 AWS，现在能用 AWS 账号直接买单了

Claude 平台在 AWS 上正式上线，AWS 客户可以直接用现有的 AWS 账号登录、走 AWS 的账单付款，还能用已承诺的消费额度来抵扣。这意味着你不用再单独搞一套 Anthropic 的账户和支付，采购流程会简单不少。功能上，这次把完整的 Claude API 套件都带过来了，包括能托管运行 AI 智能体（让模型按流程自动干活）、代码执行、文件...

#Agent#Code#Tools#Anthropic

精选理由

精选 · 重要度 74 · 知识量 + 共鸣

一句话点评

Claude 把完整 API 套件搬进 AWS 了，用现有 AWS 账号就能直接走账，省掉多签一份供应商合同的麻烦。

锐评

Anthropic 这次把 Claude 平台直接塞进了 AWS 控制台，对已经在 AWS 上跑业务的公司来说，采购和合规流程会简单很多——不用再单独开 Anthropic 账户，直接用 AWS 的账单付款，已经承诺的 AWS 消费额度也能拿来抵扣 Claude 的调用费用。功能上没打折扣，托管智能体（让模型按流程自动干活）、代码执行、文件处理这些 Claude API 的完整套件都带过来了。不过这篇公告没提价格有没有变化，也没说和 Amazon Bedrock 上已有的 Claude 服务是什么关系——是互补还是替代？另外，延迟、可用区覆盖范围这些实际部署的细节也都没给。如果你已经在用 Bedrock 调 Claude，这条消息先别急着激动，等看后续的定价和迁移指南再说。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H0·K1·R1

17:10

78d ago

r/LocalLLaMA· rssEN17:10 · 05·11

Gemma 4 在浏览器里完全离线跑，还能用 WebSerial 控制机器人

有人在 Reddit 上晒了段演示：用 Transformers.js 在 WebGPU 上完全离线运行 Gemma 4，并通过 WebSerial 控制 Reachy Mini 机器人。正文没披露模型大小、延迟、浏览器或硬件条件，所以实际跑起来有多流畅、占多少显存都不清楚。亮点是“完全离线+控制外设”这个组合，说明浏览器端推理已经能接真实硬件了，但性...

#Robotics#Tools#Inference-opt#Gemma

一句话点评

有人在浏览器里完全离线跑 Gemma 4，还通过 WebSerial 连上了 Reachy Mini 机器人。亮点是“浏览器推理+控制真实硬件”这个组合，说明前端推理已经能接外设了。但正文没披露模型大小、延迟、浏览器或硬件条件，所以实际跑起来有多流畅、占多少显存都不清楚。如果是小模型，那演示意义大于实用；如果是大模型，那 WebGPU 优化可能有点东西。短评：浏览器跑模型不新鲜，但能离线控制...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

17:02

78d ago

TechCrunch AI· rssEN17:02 · 05·11

Digg 又活过来了，这次改做 AI 新闻聚合器

Digg 在三月刚关停过一次，原因是没管住机器人刷帖，也没跟 Reddit 拉开差距。现在它给内测用户发邮件说，新版会用 AI 追踪某个领域里最有影响力的声音，把真正值得看的新闻挑出来。正文没披露用了什么模型、什么时候上线、怎么收费，所以这点先别太激动。

#Digg#Product update

一句话点评

短评：老牌聚合站 Digg 又活了，这次说用 AI 挑新闻。但模型、上线时间、收费全没提，先别激动。点评：Digg 三月刚关停，原因是机器人刷帖和跟 Reddit 没拉开差距。现在给内测用户发邮件说新版会用 AI 追踪某个领域里最有影响力的声音，把真正值得看的新闻挑出来。想法不新鲜，很多 AI 新闻产品都在做类似的事。关键信息缺口很大：用了什么模型、什么时候上线、怎么收费，正文都没披露。...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

16:44

78d ago

r/LocalLLaMA· rssEN16:44 · 05·11

Orc：把AI工作流写成可审计的声明式配置文件

Typhoonsg1 在做一个叫 ORC 的开源项目，核心是用 .orc 文件定义 LLM 工作流，把 agent、工具、数据 schema、执行步骤、验证规则和输出产物全写在一个配置文件里。好处是流程可审计、可复现，不像写代码调 chain 那样黑盒。目前项目还很早期，代码没公开，正文也没披露性能数据或跟 LangChain、Dify 的对比。

#Agent#Tools#Typhoonsg1#Ollama

一句话点评

Typhoonsg1 在 Reddit 上预告了一个叫 ORC 的开源项目，核心是用 .orc 配置文件把 agent、工具、数据 schema、执行步骤、验证规则和输出产物全写在一起，让 LLM 工作流可审计、可复现，不像调 LangChain 那样黑盒。目前项目还很早期，代码没公开，正文也没披露性能数据或跟 Dify 的对比。想法不错，但缺实测，先别太激动。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

64

SCORE

H1·K1·R0

16:44

78d ago

Product Hunt · AI· rssEN16:44 · 05·11

Crade AI：一个能看见你屏幕的 ChatGPT

Crade AI 是一款桌面 AI 助手，支持 Mac 和 Windows，核心卖点是它能直接“看见”你的屏幕，不用截图、复制粘贴或上传文件。你遇到 bug、Excel 公式、看不懂的德文发票或报错信息，直接问就行，答案会浮窗显示在当前窗口上方。免费版每天 200 次额度，Pro 版每月 7.99 美元（约 57 元人民币）给 1000 次额度，复杂任...

#Vision#Crade AI#ChatGPT#Product update

一句话点评

Crade AI 是个桌面助手，能直接“看”你屏幕，不用截图或复制粘贴，问 bug、Excel 公式、德文发票直接浮窗回答。免费版每天 200 次，Pro 每月 7.99 美元（约 57 元）给 1000 次。听起来方便，但正文没披露它怎么获取屏幕内容——是录屏、截图还是 API 权限？隐私和安全性存疑。另外“复杂任务用更聪明 AI”没说具体模型，免费额度够轻量用，重度用户成本不高。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

42

SCORE

H1·K0·R0

16:20

78d ago

FEATUREDAI HOT 精选· aihot-apiZH16:20 · 05·11

Karpathy 聊人机交互下一步：别只让模型吐 Markdown，试试让它直接写 HTML

Karpathy 觉得现在大模型默认输出 Markdown 太简陋了，他建议直接让模型生成带排版、图形和交互的 HTML，界面会好用很多。更远的想法是“交互式神经视频”——用扩散模型实时生成能操作的画面，但他也承认这玩意儿怎么跟精确的传统软件配合还是个没解的问题。输入这边，光靠语音、文字或视频不够，得加上手势指点这类更自然的交互。在脑机接口到来之前，输...

#Multimodal#Tools#Andrej Karpathy#Commentary

精选理由

精选 · 重要度 72 · 吸引力 + 知识量 + 共鸣

一句话点评

Karpathy 说现在大模型输出太像草稿纸，直接生成带排版和按钮的 HTML 会好用很多。但“交互式神经视频”那部分还缺具体方案，先当方向看。

锐评

Karpathy 这条推文的核心判断很直接：大模型默认吐 Markdown 是偷懒，让模型直接生成 HTML 页面，能立刻把排版、图表和可点击的交互都带上，用户体验会跳一大截。他给了一个马上能试的建议——让模型用 HTML 结构化回复，这比等下一代界面务实。更远的那层“交互式神经视频”，是用扩散模型实时生成可操作的画面，听起来像把电影变成软件。但他自己点出了关键缺口：这种神经生成的画面怎么跟需要精确数值的传统软件（比如 Excel、CAD）配合，现在完全没解。正文没给出任何技术路线或实验数据，所以这部分只能当长期猜想，别急着当真。输入侧他提到手势指点这类更自然的交互，但同样没展开具体实现。整体看，这条推文的价值在于把“输出格式”这个被忽视的环节拎出来，HTML 这个建议成本低、可验证；视频生成那层还缺约束条件和精度验证，离落地很远。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

72

SCORE

H1·K1·R1

16:04

78d ago

r/LocalLLaMA· rssEN16:04 · 05·11

4张RTX 5060 Ti组本地推理，能打过两张RTX 3090吗？

Reddit用户ziphnor想组一套4张RTX 5060 Ti的本地推理机，跑Qwen 3.6 27B的int8/fp8模型，问跟双RTX 3090比怎么样。每张5060 Ti有16GB显存，4张一共64GB，比双3090的48GB多。价格方面，两张打折的5060 Ti大概960欧元，比双3090便宜。但问题是PCIe通道分配：一张走x8，另外三张只...

#Inference-opt#NVIDIA#Qwen#ziphnor

一句话点评

Reddit 用户 ziphnor 想用 4 张 RTX 5060 Ti（每张 16GB，共 64GB）跑 Qwen 3.6 27B 的 int8/fp8 模型，比双 RTX 3090（48GB）显存多 16GB，价格也更低（两张打折约 960 欧元）。但 PCIe 通道分配是硬伤：一张走 x8，另外三张只能走 x4，多卡通信带宽严重受限，大模型推理延迟可能比双 3090 还高。正文没披露具...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

48

SCORE

H1·K0·R1

16:03

78d ago

AI HOT 精选· aihot-apiZH16:03 · 05·11

谷歌DeepMind和Coursera合开Gemini开发者课，教你把模型接进业务流程

这门课分三块：一是让模型能推理并执行复杂任务（不只是聊天），二是通过函数调用把Gemini连上真实工具（比如数据库、API），三是教你怎么部署和测试可扩展的AI系统。课程已开放注册，但正文没披露价格和时长。适合想用Gemini做生产级应用的开发者，不是入门科普。

#Agent#Tools#Google DeepMind#Coursera

一句话点评

谷歌DeepMind和Coursera出了门Gemini开发课，分三块：让模型能推理干活、用函数调用连数据库和API、以及部署可扩展系统。适合想拿Gemini做生产级应用的开发者，不是入门科普。但正文没披露价格和时长，注册前得自己掂量。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

52

SCORE

H0·K1·R0

16:03

78d ago

AI HOT 精选· aihot-apiZH16:03 · 05·11

Claude 在 AWS 上全线开放，用 AWS 账号就能调 API

Claude 现在 AWS 上全面可用，AWS 客户可以直接用 AWS 的身份验证、计费和承诺金抵扣来调用全套 Claude API。正文没披露定价、上线区域和具体时间表。

#Tools#Claude#AWS#Product update

一句话点评

Claude 在 AWS 上全面可用，AWS 客户可直接用自家身份验证、计费和承诺金抵扣来调用全套 API。这对已有 AWS 合同的企业很友好，省去单独签约和付费的麻烦。但正文没披露定价、上线区域和具体时间表，实际可用性要打问号。如果是真的，能降低企业接入门槛，但别急着冲。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

38

SCORE

H0·K1·R1

15:54

78d ago

FEATUREDAI HOT 精选· aihot-apiZH15:54 · 05·11

菲尔兹奖得主实测 ChatGPT 5.5 Pro：17 分钟独立解决数学难题，成果够写博士论文

剑桥数学家、菲尔兹奖得主 Timothy Gowers 用 ChatGPT 5.5 Pro 做了个实验，只给简单提示，没做任何数学指导。AI 在 17 分钟内独立解决了一个加法数论公开问题，给出的构造在理论上是最优的。Gowers 判断这个成果完全够格写进博士论文。随后 AI 又在一个更难的 k 重求和集问题上，把已知上界从指数级改进到亚指数级，审阅者...

#Reasoning#Timothy Gowers#OpenAI#Terence Tao

精选理由

精选 · 重要度 84 · 吸引力 + 知识量 + 共鸣

一句话点评

菲尔兹奖得主实测：ChatGPT 5.5 Pro 用 17 分钟独立解决了一个加法数论公开问题，成果够写进博士论文。但正文没披露模型是否针对数学做过专项训练，这点先别太激动。

锐评

Gowers 的实验结果确实吓人：只给简单提示，没做任何数学指导，模型在 17 分钟内独立解决了一个加法数论公开问题，给出的构造在理论上是最优的。随后它又把一个更难问题的已知上界从指数级改进到亚指数级。Gowers 判断这完全够格写进博士论文，并警告如果 AI 数学水平继续按这个速度发展，博士生培养会面临危机。不过这篇报道有几个关键信息缺口。第一，正文没说明 ChatGPT 5.5 Pro 是否针对数学推理做过专项训练或调用了外部工具，这直接影响我们判断它是“自己想出来的”还是“查出来的”。第二，Gowers 本人是顶尖数学家，他选的题目虽然公开，但难度和方向可能恰好落在模型擅长的问题类型上，换一个领域是否还能复现，正文没提。第三，陶哲轩在同期发声，强调人类数学家的核心价值在于“消化”和深度理解证明，而不是产出证明本身——这个视角在报道里被一笔带过，但其实是理解这件事的关键补充。对从业者来说，这条新闻的价值不在于“AI 又赢了”，而在于它把一个问题推到台前：当模型能独立产出博士级成果时，科研训练体系该怎么重新设计。正文没给出答案，Gowers 自己也说还在找。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

84

SCORE

H1·K1·R1

15:53

78d ago

Hacker News 首页· rssEN15:53 · 05·11

UCF 人文学院毕业生对毕业演讲嘉宾喝倒彩，只因她说 AI 是“下一次工业革命”

中佛罗里达大学人文与传播学院的毕业典礼上，演讲嘉宾 Gloria Caulfield 刚说出“AI 是下一次工业革命”，台下数千名毕业生就发出嘘声，还有人喊“AI 烂透了”。演讲者本人似乎没预料到这个反应，转身摊手问“怎么了”。正文没有披露 Caulfield 的具体职务背景，也没说她之后怎么圆场的。这件事本身不是技术新闻，但能看出 AI 在普通文科生...

#404 Media#UCF#Hacker News#Commentary

一句话点评

中佛罗里达大学人文学院毕业典礼上，演讲嘉宾刚说“AI是下一次工业革命”，台下数千毕业生就嘘声一片，还有人喊“AI烂透了”。演讲者转身摊手问“怎么了”。正文没披露她之后怎么圆场，也没说她的具体背景。这事不是技术新闻，但能看出AI在普通文科生中的口碑——至少在这个场合，情绪是抵触的。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

58

SCORE

H1·K0·R1

15:51

78d ago

r/LocalLLaMA· rssEN15:51 · 05·11

用户对比Strix Halo与DGX Spark家庭本地大模型服务器方案

一个 Reddit 用户在纠结：花 3388 美元买 AMD Strix Halo 的 Framework 台式机，还是花 3500 美元买 Nvidia DGX Spark（华硕版），用来在家跑大模型。目标是在 Ubuntu 上搭 Open WebUI，跑 Qwen 3.6 35B A3B 和 GPT OSS 120B 这类模型，量化到 Q4_K_M...

#Inference-opt#Tools#Vision#AMD

一句话点评

用户拿AMD Strix Halo和NVIDIA DGX Spark比谁更适合在家跑大模型。Strix Halo是APU，显存共享系统内存，成本低但带宽受限；DGX Spark是NVIDIA的桌面AI盒子，有专用显存和CUDA生态，但贵。正文被Reddit屏蔽，没看到具体配置和跑分。关键缺口：没披露模型规模、推理速度、功耗和价格。如果只是跑7B以下模型，Strix Halo性价比可能更高；要...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

15:39

78d ago

彭博科技· rssEN15:39 · 05·11

贝莱德CIO：AI不是泡沫，但短期通胀和地缘风险会先来

贝莱德全球固定收益CIO Mike Pyle在彭博访谈中表示，AI不是泡沫，短期会推高通胀（因为企业大量投资硬件和基建），长期才会带来生产率提升。他还说传统的60/40股债组合已经失效，投资者需要重新配置。另外提到伊朗、石油供应和霍尔木兹海峡的地缘风险是当前最大的经济不确定性。访谈是视频形式，正文没有给出具体数据或模型细节。

#BlackRock#Mike Pyle#Bloomberg#Commentary

一句话点评

贝莱德CIO说AI不是泡沫，短期推高通胀，长期才提生产率。传统60/40股债组合已失效，需重新配置。地缘风险（伊朗、霍尔木兹海峡）是最大不确定性。视频访谈，无具体数据或模型细节，观点仅供参考。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

52

SCORE

H0·K0·R1

15:37

78d ago

FEATUREDAI HOT 精选· aihot-apiZH15:37 · 05·11

Anthropic 在 GitHub 开源了一套金融 AI 模板，直接给投研、投行、风控配好了 10 个智能体和 11 家数据商的连接器

这套模板把金融行业里常见的 AI 用法打包成了开箱即用的工作流，覆盖投研、投行、风控等核心环节。里面塞了 10 个端到端智能体、7 个垂直插件，还接好了 11 家主流金融数据商的 MCP 连接器，等于把模型跟 Bloomberg 这类数据源的通路提前打通了。部署方式从个人插件到企业 API 都支持，也能塞进 Microsoft 365 和私有云。正文没...

#Agent#Tools#Anthropic#GitHub

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 把金融 AI 的常用套路打包开源了，10 个智能体加 11 家数据商连接器，等于帮你把 Bloomberg 的管子提前接好。但正文没提效果验证和合规怎么过，这点先别太激动。

锐评

Anthropic 在 GitHub 扔了一套金融 AI 模板，不是论文也不是白皮书，是直接能跑的代码。里面塞了 10 个端到端智能体，覆盖投研、投行、风控这些金融圈高频场景，还配了 7 个行业插件和 11 家主流金融数据商的 MCP 连接器——你可以理解成模型跟 Bloomberg、Refinitiv 这类数据源的接口已经焊好了，不用自己从头写管道。部署方式从个人插件到企业 API 都支持，也能塞进 Microsoft 365 和私有云，说明他们想同时吃个人开发者和机构客户两条线。这件事的看点不在技术有多新，而在 Anthropic 选了一条跟 OpenAI 完全不同的路：OpenAI 在铺消费级应用，Anthropic 直接往垂直行业里扎，用开源模板拉生态。金融是监管最严、对准确性要求最高的行业之一，敢在这里开源模板，姿态上是在说“我的模型能进生产环境”。但正文没披露几个关键信息：这 10 个智能体在真实业务场景里的准确率是多少？有没有经过合规审查？MCP 连接器是官方合作还是社区贡献？这些直接决定这套模板是 demo 级还是生产级。另外也没提延迟和成本，金融场景对实时性要求高，如果跑一个风控判断要十几秒，那就只能当参考工具用。建议先拿自己的数据跑一遍，别直接往交易链路里接。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

15:30

78d ago

AI HOT 精选· aihot-apiZH15:30 · 05·11

MiniMax组了个“10x团队”，请行业专家来教模型干活

MiniMax 宣布成立“10x团队”，邀请各领域专家直接参与模型研发——不是当顾问，而是亲自定义问题、搭评估、设计工作流，成果会开源。团队目标是把大模型从“能演示”推到“真能用”。提供上海、北京、香港、旧金山、伦敦五个办公地，薪酬含股权。但正文没披露团队规模、招聘人数和薪资范围，实际落地节奏还不清楚。

#Benchmarking#Tools#MiniMax#Personnel

一句话点评

MiniMax 搞了个“10x团队”，直接拉行业专家进研发一线，不是挂名顾问，而是亲自定问题、搭评估、设计工作流，成果还开源。目标是把模型从“能演示”推到“真能用”，听着挺实在。但正文没披露团队规模、招聘人数和薪资范围，实际落地节奏还不清楚。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

45

SCORE

H0·K1·R0

15:16

78d ago

FEATUREDAI HOT 精选· aihot-apiZH15:16 · 05·11

Cognition AI 总部首次曝光：Scott Wu 和他 18 个月做到 4.45 亿美元年化收入的 Devin

推文放出了 Cognition AI 总部“Cog House”的内部画面。创始人 Scott Wu 是顶尖竞技程序员，拿过三次国际信息学奥赛金牌。他在 2023 年 11 月母亲去世、Sam Altman 被 OpenAI 解雇的同一天创立了公司，赌的是 AI 会变成能全天干活的智能体。他们做的 AI 软件工程师 Devin 刚上线时表现一般，但 1...

#Agent#Code#Cognition AI#Scott Wu

精选理由

精选 · 重要度 84 · 吸引力 + 知识量 + 共鸣

一句话点评

Devin 18 个月做到年化 4.45 亿美元营收，但初期表现一般，这个转折值得点进去看。

锐评

这条推文放出了 Cognition AI 总部内部画面，但真正值得关注的是 Devin 的商业成绩：上线 18 个月年化营收 4.45 亿美元，客户包括高盛、美国陆军和奔驰，公司估值约 250 亿美元。创始人 Scott Wu 本人是三次信息学奥赛金牌得主，2023 年 11 月母亲去世当天创立公司，赌的是 AI 能变成全天干活的智能体。不过正文没披露这 4.45 亿是合同额还是实际回款，也没说客户续费率。Devin 刚上线时表现一般，现在到底解决了哪些场景、哪些还是 demo，从这条推文里看不出来。估值 250 亿这个数字我会先打个折，毕竟没看到独立验证。还缺的信息：Devin 在客户实际生产环境里的通过率、平均修复时间、跟人类工程师的对比数据。光有营收和估值，只能说明卖得动，不能说明好用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

84

SCORE

H1·K1·R1

15:09

78d ago

Hacker News 首页· rssEN15:09 · 05·11

BotCost.dev：免费工具算算 AI 爬虫吃了你多少带宽费

一个免费工具，上传 Nginx、Cloudflare 等日志，就能算出 GPTBot、ClaudeBot 等 18 种 AI 爬虫占了多少带宽、折合多少钱。页面宣称典型月访客 5 万的站点，AI 爬虫每月能吃掉 180 美元带宽费；验证延迟不到 10 毫秒，跑在 Cloudflare 边缘节点上，不影响真实用户。工具在浏览器本地处理日志，不上传。最后还...

#Botcost.dev#Hacker News#Product update

一句话点评

一个免费工具，上传 Nginx 或 Cloudflare 日志，就能算出 GPTBot 等 18 种 AI 爬虫吃了多少带宽、折合多少钱。典型月访客 5 万的站点，AI 爬虫每月能吃掉 180 美元带宽费；验证延迟不到 10 毫秒，跑在 Cloudflare 边缘节点上，不影响真实用户。工具在浏览器本地处理日志，不上传。最后还生成一行 WAF 规则帮你屏蔽。短评：算账工具，不是防御工具。...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

15:00

78d ago

OpenAI 博客· rssEN15:00 · 05·11

OpenAI 发 2026 年 Q1 数据：ChatGPT 用户画像变宽，35 岁以上和女性用户增长最快

OpenAI 发布 2026 年 Q1 消费版 ChatGPT 使用数据，核心结论是用户结构在变宽。女性用户（按名字推断）占比已过半，且增速继续领先；35 岁以上用户的消息量占比在提升，虽然 35 岁以下仍是主力。地域上，拉美、亚太、非洲一些国家的人均消息量排名上升最快，比如多米尼加、海地、日本、墨西哥、坦桑尼亚。工作场景里，写文档和做图仍是主流，但增...

#OpenAI#ChatGPT#Commentary

一句话点评

ChatGPT 用户结构在变宽：女性用户（按名字推断）已过半，35 岁以上用户消息占比上升，拉美、非洲一些国家人均消息量排名涨得最快。工作场景里写文档做图仍是主流，但增速放缓，更专业的任务（如医疗文档、信息检索）在变多。不过正文没披露具体用户数、增长率、地域渗透率，也没说怎么定义“采用率”。结论方向对，但缺硬数字支撑，先别当拐点论。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

67

SCORE

H0·K1·R1

15:00

78d ago

AI HOT 精选· aihot-apiZH15:00 · 05·11

ChatGPT 2026 年第一季度用户画像：35 岁以上和女性用户增长最快

OpenAI 发布 2026 年 Q1 数据，称 ChatGPT 用户结构正在变宽：35 岁以上用户的消息占比在上升，女性用户（按名字推断）已超过可推断性别用户的一半。地域上，拉美、亚太和非洲一些国家的人均消息量排名上升最快，比如多米尼加和日本都跳了 8-9 位。工作场景里，写文档、做图这类通用任务占比在下降，医疗文档、信息检索等更垂直的用途在变多。不...

#OpenAI#ChatGPT#Product update

一句话点评

OpenAI 发了一组 Q1 数据，说 ChatGPT 用户结构在变宽：35 岁以上用户的消息占比在涨，女性用户（按名字推断）已过半。地域上，拉美、亚太和非洲一些国家的人均消息量排名上升最快，比如多米尼加和日本都跳了 8-9 位。工作场景里，写文档、做图这类通用任务占比在下降，医疗文档、信息检索等更垂直的用途在变多。不过正文没披露具体增长率、样本量、地域覆盖范围，也没说怎么推断性别和年龄。这...

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

64

SCORE

H0·K1·R1

更多

✕

频道

热点聚合每日 AI 日报全部播客·视频 AX 严选 X 监控收藏信源邮件订阅 Agent 接入

后台

用量系统订阅管理精选策略策略迭代用户