全部 · 2026-05-09

▸ 50 items · updated 3m ago

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 2573 26105 27120 28142 29116 3064 3162

2026年6月

一二三四五六日

1150 2157 3132 4117 5127 669 773 8141 9135 1084 1196 1288 1346 1434 1570 1682 1775 1886 1955 2027 2120 2274 2374 2468 2564 2640 2724 2837 2956 3083

2026年7月

一二三四五六日

156 271 347 421 527 664 758 865 975 1050 1134 1228 1345 1484 1582 1683 1745 1818 1938 2051 2170 2265 2340 24 25 26 27 28293031

2026-05-09 · 星期六2026年5月9日

23:47

79d ago

FEATUREDAI HOT 精选· aihot-apiZH23:47 · 05·09

SpaceXAI 商标已提交申请，xAI 并入 SpaceX 后品牌统一的第一步

一份商标申请文件显示，“SpaceXAI”在 2026 年 5 月 6 日提交，目前状态是待审查。这个时间点正好是马斯克宣布把 xAI 并入 SpaceX 的时候，等于把 AI 能力和航天业务挂到同一个品牌下面，想把“上火星”和“搞超级智能”两件事放在一个实体里做。正文没披露商标覆盖的具体产品范围、审批进度和实际落地时间，所以现在只能看到品牌整合的意图...

#SpaceX#xAI#Elon Musk#Product update

精选理由

精选 · 重要度 78 · 吸引力 + 知识量 + 共鸣

一句话点评

马斯克把 xAI 和 SpaceX 绑到一个商标下，但正文只说了申请提交，没披露审批进度和具体产品，先当品牌占位看。

锐评

这条消息的核心是商标动作，不是产品发布。SpaceXAI 在 2026 年 5 月 6 日提交了商标申请，目前状态是待审查，时间正好卡在马斯克宣布把 xAI 并入 SpaceX 的节点上。意图很直白：把造火箭和搞超级智能两件事塞进一个品牌筐里，对外讲一个“上火星也要带 AI”的故事。但正文没给出任何实质信息。商标覆盖哪些具体产品或服务、审查走到哪一步、有没有实际业务落地时间表，全都没提。所以现在只能看到品牌整合的姿势，看不到技术路线或商业路径。商标申请本身门槛不高，离真正把 AI 能力装进航天系统还差着工程验证、安全审批和实际部署好几道坎。我会先打个折：这更像一次法律和品牌层面的对齐，不是技术融合的里程碑。后续得看他们会不会公布具体应用场景，比如星舰的自主控制系统、星链的智能调度，或者地面任务的 AI 辅助决策。没这些细节之前，别急着把它当成航天 AI 的转折点。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

78

SCORE

H1·K1·R1

23:31

79d ago

AI HOT 精选· aihot-apiZH23:31 · 05·09

Google 开放 Fitbit Air 健康 API，开发者可拿 31 种真实数据做个人健康自动化

Google 随新款 Fitbit Air 发布了 Health API，开放了运动、睡眠、心率、血氧等 31 种健康数据点。支持 Webhooks 实时推送、细粒度读写权限、按时间范围查询和汇总。开发者可以用这些真实个人数据搭 AI Agent、MCP Server、CLI 或实时监控系统，实现健康自动化工作流。官方已给出首次调用教程。注意：API ...

#Agent#Tools#Google#Fitbit

一句话点评

Google 开放了 Fitbit Air 的 Health API，提供 31 种健康数据点（运动、睡眠、心率、血氧），支持 Webhooks 实时推送和细粒度权限控制。开发者可以用真实个人数据搭 AI Agent 或自动化工作流，官方已给出首次调用教程。注意：API 目前仅限 Fitbit Air 用户，且正文没披露调用配额和定价，如果是免费或低成本，对健康类 Agent 开发者是个实用入口。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

36

SCORE

H0·K0·R0

23:00

79d ago

Hacker News 首页· rssEN23:00 · 05·09

用户用摩斯密码骗过 Grok，让 Bankrbot 转出 20 万美元代币

有人在 X 上发了一条摩斯密码消息，绕过了 Grok 的安全检查，诱导它命令 Bankrbot 从链上转出 30 亿枚 DRB 代币，价值约 20 万美元。攻击利用了 AI 代理的自主权限——Bankrbot 被授权执行链上转账，Grok 又没识别出摩斯密码里的恶意指令。正文没披露这笔交易的具体哈希值、攻击者身份或 Bankrbot 的权限设置细节，所...

#Agent#Safety#Tools#Grok

一句话点评

有人用摩斯密码骗过 Grok，让它命令 Bankrbot 转出 30 亿枚 DRB（约 20 万美元）。攻击利用了 AI 代理的自主权限——Bankrbot 被授权执行链上转账，Grok 没识别出摩斯密码里的恶意指令。正文没披露这笔交易的具体哈希值、攻击者身份或 Bankrbot 的权限设置细节，所以无法验证攻击是否真实发生、代币是否真的被转走。如果是真的，这暴露了两个问题：一是 AI 代理...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

22:27

79d ago

Product Hunt · AI· rssEN22:27 · 05·09

AgentPeek：把 Claude Code 和 Codex 塞进 Mac 刘海

一个 Mac 菜单栏小工具，让你在屏幕顶部的刘海区域直接监控 Claude Code 和 Codex 的运行状态——能看到会话、权限、token 用量和本地开发服务器。数据全留在本地，不上传。正文没披露具体怎么实现、卖多少钱、什么时候正式上线，但如果你同时跑多个 AI 编程助手，这个“瞄一眼”的体验应该挺实用。

#Agent#Code#Tools#AgentPeek

一句话点评

短评：在Mac刘海屏上瞄一眼Claude Code和Codex的状态，数据本地保存，适合多Agent并行的开发者。但正文没披露实现方式、价格和上线时间，先别太激动。点评：AgentPeek是一个Mac菜单栏工具，把Claude Code和Codex的运行状态直接显示在屏幕顶部的刘海区域——你能看到会话、权限、token用量和本地开发服务器。数据全留在本地，不上传，隐私方面比较放心。对于同...

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

45

SCORE

H1·K0·R0

21:52

79d ago

Product Hunt · AI· rssEN21:52 · 05·09

Contextberg：让 AI 代理记住你干过什么，不用每次从头教

Contextberg 是一个跑在本地的记忆工具，通过 MCP 协议给 AI 代理喂上下文。它会在后台默默录屏、记浏览器历史、存你和代理的对话记录，然后自动生成短期和长期记忆。下次 Claude Code 或 Cursor 再问你“从哪开始”，它已经知道。目前只支持 Windows，免费，从微软商店装就行。正文没披露具体支持哪些数据源、部署选项和安全控...

#Agent#Memory#Tools#Contextberg

一句话点评

Contextberg 是一个跑在本地的记忆工具，通过 MCP 协议给 AI 代理喂上下文。它会在后台默默录屏、记浏览器历史、存你和代理的对话记录，然后自动生成短期和长期记忆。下次 Claude Code 或 Cursor 再问你“从哪开始”，它已经知道。目前只支持 Windows，免费，从微软商店装就行。正文没披露具体支持哪些数据源、部署选项和安全控制，隐私风险需要自己掂量。短评：本地...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

55

SCORE

H1·K0·R1

20:54

79d ago

Product Hunt · AI· rssEN20:54 · 05·09

Web Speed：号称让 AI 代理的 Token 开销打一折

Web Speed 是一个给网页代理用的“逻辑层”，核心是把网页转成机器能高效读的“地图”，而不是让 AI 一行行啃 HTML。官方说这样能省 70% 到 90% 的 Token 费用，跑得更快更稳。但正文没披露具体怎么实现的、定价多少、有没有公开的跑分测试。如果真能省这么多，对做浏览器自动化或信息抽取的团队来说挺省钱，但这点先别太激动——等看到可复现...

#Agent#Inference-opt#Web Speed#Product update

一句话点评

Web Speed 号称能把网页转成机器地图，省 70%-90% Token 费。对做浏览器自动化的团队挺省钱，但正文没披露具体实现、定价和可复现的跑分，先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

48

SCORE

H1·K0·R1

20:21

79d ago

r/LocalLLaMA· rssEN20:21 · 05·09

Strix Halo 跑 MiniMax 2.7，100K 上下文还能双开会话

Reddit 用户 Zc5Gwu 在 AMD Strix Halo 上跑 MiniMax 2.7，用 llama-server 配了 10 万 token 上下文，同时开两个会话，共享 KV 缓存，没有上下文偏移，不用 mmap，缓存全放显存不换到内存。正文没披露具体推理速度或显存占用，但能双开 100K 上下文说明显存够大、缓存管理做得比较干净。

#Code#Inference-opt#MiniMax#Qwen

一句话点评

Reddit 用户 Zc5Gwu 在 AMD Strix Halo 上跑 MiniMax 2.7，双开 10 万 token 上下文会话，共享 KV 缓存且全放显存，不换到内存。能这么玩说明显存够大、缓存管理干净。但正文没披露具体推理速度或显存占用，这点先别太激动。如果真能流畅双开长上下文，对本地部署长文档分析挺实用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

19:48

79d ago

r/LocalLLaMA· rssEN19:48 · 05·09

有人给 DeepSeek 的 ds4.c 写了个极简 Web 界面

开发者 cocktail_peanut 开源了一个叫 ds4.pinokio 的仓库，给 ds4.c 服务器套了个最小化的 WebUI。要求不低：Apple Silicon Mac 上至少 128GB 内存。正文没披露具体支持哪些模型或推理速度，但 128GB 的门槛说明这玩意是为超大模型本地跑准备的，普通用户暂时别想。

#Tools#cocktail_peanut#Apple#antirez

一句话点评

开发者给 ds4.c 服务器套了个最小化 WebUI，但门槛极高：Apple Silicon Mac 必须 128GB 内存起步。这基本排除了普通用户，只适合想本地跑超大模型的人。正文没披露支持哪些模型或推理速度，实用性存疑。如果是真的，跑大模型不用再死磕命令行，但 128GB 的门槛让多数人只能看看。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

61

SCORE

H0·K1·R1

19:15

79d ago

r/LocalLLaMA· rssEN19:15 · 05·09

苹果下架 256GB 版 M3 Ultra Mac Studio，本地跑大模型的高配选择又少一个

苹果官网悄悄拿掉了 256GB 内存的 M3 Ultra Mac Studio 机型，目前只剩 512GB、96GB 等选项。正文没解释原因，但本地跑大模型的人都知道，256GB 刚好能塞下 70B 参数模型的全精度推理，少 1GB 都跑不动。现在只剩更贵的 512GB 或更小的 96GB，要么多花钱要么降模型规模。

#Apple#Product update

一句话点评

苹果悄悄下架了 256GB 内存的 M3 Ultra Mac Studio，只剩 512GB 和 96GB 可选。256GB 刚好能塞下 70B 模型的全精度推理，少 1GB 都跑不动。现在要么多花一倍钱上 512GB，要么降级到 96GB 跑小模型。苹果没解释原因，可能是为了推高利润机型，也可能是供应链调整。对本地跑大模型的人来说，这等于砍掉了性价比最高的选项。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

60

SCORE

H1·K1·R1

18:46

80d ago

r/LocalLLaMA· rssEN18:46 · 05·09

llama.cpp 合并了一个新 MoE 架构：Sarvam，30B 模型实际只激活 2.4B 参数

llama.cpp 的 PR #20275 加入了 Sarvam MoE 架构支持。Sarvam 有两个版本：30B 模型非嵌入层活跃参数仅 2.4B，105B 模型活跃参数 10.3B。这意味着推理时计算量远小于同尺寸稠密模型，适合本地部署。不过正文没披露训练数据、评测结果或开源协议，实际效果和可用性还不清楚。

#Reasoning#Code#Agent#ggml-org

一句话点评

llama.cpp 刚合入 Sarvam MoE 架构支持。Sarvam-30B 非嵌入层活跃参数仅 2.4B，105B 版活跃参数 10.3B，推理计算量远小于同尺寸稠密模型，本地部署很划算。但正文没披露训练数据、评测结果和开源协议，实际效果和可用性还不清楚。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

18:33

80d ago

Hacker News 首页· rssEN18:33 · 05·09

Meta 强推 AI，员工被监控鼠标键盘，内部炸了

Meta 要求美国员工接受电脑操作全量追踪——记录打字、鼠标移动、点击和屏幕内容，目的是拿员工数据训练 AI 模型，学习“人怎么用电脑完成日常工作”。CTO 明确回复“公司电脑没有退出选项”，员工在内部帖下刷了 100 多个愤怒和震惊表情。Meta 有 7.8 万员工，受影响人数至少数万。公司正在从互联网公司转型为 AI 组织，但内部手段粗暴，员工士气...

#Meta#Hacker News#The New York Times#Commentary

一句话点评

Meta 强制追踪美国员工电脑操作（打字、鼠标、屏幕内容），用来训练 AI 学“人怎么用电脑干活”。CTO 明确回复“公司电脑没有退出选项”，内部帖下刷了 100 多个愤怒表情。7.8 万员工中至少数万人受影响。公司转型 AI 但手段粗暴，员工士气崩了。正文没披露追踪数据具体怎么用、是否匿名、有没有外部审计。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

18:10

80d ago

r/LocalLLaMA· rssEN18:10 · 05·09

SillyTavern 被名字耽误了？一个角色扮演前端能当通用界面用

Reddit 用户 Spiderboyz1 聊 SillyTavern 的角色架构：三个角色可以共享同一个群聊，但各自用不同的系统提示词。正文没披露性能数据、插件列表或可复现的搭建步骤，所以这点先别太激动——架构灵活不等于跑得稳。

#Agent#Tools#SillyTavern#LocalLLaMA

一句话点评

SillyTavern 支持三个角色共享群聊但各自用不同系统提示词，架构灵活。但正文没披露性能数据、插件列表或搭建步骤，这点先别太激动——灵活不等于跑得稳。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

62

SCORE

H1·K1·R0

17:49

80d ago

AI HOT 精选· aihot-apiZH17:49 · 05·09

OpenRouter 上线免费编码路由工具：按分数自动选最便宜的模型

OpenRouter 推出了一款实验性工具 Pareto Code，免费使用。你可以在请求里加一个 min_coding_score 参数，工具会根据 Artificial Analysis 的排名，自动把编码任务路由到满足分数要求且成本最低的模型上。说白了就是帮你省钱的——不用手动比价，系统替你挑最便宜的。不过正文没披露这个 min_coding_s...

#Code#Tools#Inference-opt#OpenRouter

一句话点评

OpenRouter 出了个免费工具 Pareto Code，加个参数就能自动把编程任务路由到最便宜的模型，省得自己比价。数据源是 Artificial Analysis 的排名，但正文没披露 min_coding_score 具体怎么算、覆盖哪些模型，实际效果得自己试。免费是亮点，但实验性意味着不稳定，别当主力用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

17:46

80d ago

AI HOT 精选· aihot-apiZH17:46 · 05·09

AI 让强者更强、弱者更弱：能动性差距正在拉大

François Chollet 指出，AI 正在放大用户之间的能动性差异：低能动性用户会进一步丧失主动权，高能动性用户则能借助 AI 获得更多控制力。正文没有披露具体数据、实验条件或效应量，所以这点先别太激动——但逻辑本身值得留意：AI 不是均匀地赋能所有人，而是像放大器一样，把原有的差距越拉越大。

#fchollet#Commentary

一句话点评

短评：Chollet 提了个直觉上成立的观点：AI 像放大器，拉大用户间的能动性差距。但没给数据，先当假说看。点评：François Chollet 这条推文的核心判断是：AI 不是均匀地赋能所有人，而是像放大器一样，把用户原有的能动性差距越拉越大。低能动性用户（习惯被动接收信息、不主动提问或验证）会进一步丧失主动权，而高能动性用户（会拆解任务、迭代 prompt、交叉验证）则能借助 A...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

35

SCORE

H1·K0·R1

17:13

80d ago

AI HOT 精选· aihot-apiZH17:13 · 05·09

OpenAI 演示 GPT-Realtime-2 语音控制 CRM，但没提延迟和价格

OpenAI Devs 发了个演示，把 GPT-Realtime-2 接进 CRM 工作流，让用户用语音操作客户管理系统。正文只说了集成思路，没披露 API 参数、延迟、定价和上线条件。如果延迟高或成本贵，实际落地会打折扣，这点先别太激动。

#Audio#Tools#OpenAI#Product update

一句话点评

OpenAI Devs 演示了用 GPT-Realtime-2 语音控制 CRM，思路是把语音指令转成 API 调用。正文只说了集成思路，没披露 API 参数、延迟、定价和上线条件。如果延迟高或成本贵，实际落地会打折扣，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

60

SCORE

H1·K0·R1

16:56

80d ago

r/LocalLLaMA· rssEN16:56 · 05·09

9070 XT 跑 Qwen 27B Q3 量化，12 tok/s

Reddit 用户用 AMD 9070 XT 在 llama.cpp 上跑 Qwen 27B Q3 量化模型，速度 12 tok/s。这个速度对 27B 模型来说算中等偏慢，大概每秒能吐出 12 个 token，相当于每 5 秒生成一句话。用户开了 65536 的超长上下文（不能缩），用了 q4_0 的 KV 缓存、batch 512、ubatch 1...

#Inference-opt#Qwen#llama.cpp#Reddit

一句话点评

AMD 9070 XT 跑 Qwen 27B Q3 量化，12 tok/s，相当于每秒吐 12 个 token，每 5 秒生成一句话。速度中等偏慢，但开了 65536 的超长上下文（不能缩），这个长度下能跑起来已经不错。正文没披露功耗、显存占用和对比数据，没法判断是不是最优调参。如果上下文能缩到 32K，速度应该能翻倍。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

64

SCORE

H0·K1·R1

16:40

80d ago

AI HOT 精选· aihot-apiZH16:40 · 05·09

HappyHorse 视频生成上线阿里云，号称速度第一

HappyHorse 在阿里云 Model Studio 上线，主打视频生成速度快、自带音画同步。官方自称基准测试排名第一，但没说是哪个榜单、什么测试条件。正文也没提定价和可用区域，想用的话得自己去点链接看。速度是卖点，但具体多快、排队情况如何，目前只有宣传语。

#Multimodal#Audio#Vision#HappyHorse

一句话点评

HappyHorse在阿里云上线，主打视频生成快和音画同步，自称基准测试第一但没提是哪个榜。速度是卖点，但正文没披露具体多快、排队情况、定价和可用区域，想用得自己去试。短评：速度卖点，但榜单和定价都没说，先打个折。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

32

SCORE

H0·K0·R0

16:05

80d ago

FEATUREDr/LocalLLaMA· rssEN16:05 · 05·09

BeeLlama.cpp：用 DFlash 和 TurboQuant 让 Qwen 3.6 27B 在单张 3090 上跑 20 万上下文，速度翻倍

Anbeeld 发了一个 llama.cpp 的分支 BeeLlama.cpp，主要加了 DFlash（一种省显存的注意力机制）和 TurboQuant（更快的量化方案），还支持推理和视觉任务。标题里说在单张 RTX 3090 或 4090 上跑 Qwen 3.6 27B 的 Q5 量化版，能塞进 20 万 token 的上下文，速度比原版快 2 到 ...

#Inference-opt#Vision#Reasoning#Anbeeld

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

单卡3090跑27B模型塞进20万token上下文，速度翻倍到135 tps，但这是个人分支，正文被Reddit屏蔽了，具体测试条件和稳定性都看不到。

锐评

Anbeeld 给 llama.cpp 做了个分支，加了 DFlash 和 TurboQuant 两个优化。DFlash 是一种省显存的注意力机制，TurboQuant 是更快的量化方案。标题说在单张 RTX 3090 上跑 Qwen 3.6 27B 的 Q5 量化版，能塞进 20 万 token 的上下文，速度比原版快 2 到 3 倍，峰值到了 135 tps。这个数字如果属实，意味着消费级显卡跑大模型的门槛又降了一截，长上下文推理不再必须上多卡或云服务。但这条消息的正文被 Reddit 屏蔽了，返回 403，我们看不到任何实现细节、测试脚本或对比基准。135 tps 是在什么 prompt 长度、什么 batch size 下测的，TurboQuant 对模型精度损失有多大，DFlash 在长序列下是否稳定，这些全都没披露。发布者是个人开发者，分支的维护和后续兼容性也要打个问号。我会先打个折看待这些性能数字，等有可复现的测试或代码仓库能正常访问了再判断。如果你手头有 3090 想试试，建议先在小规模任务上验证，别直接上生产。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

15:55

80d ago

r/LocalLLaMA· rssEN15:55 · 05·09

Mimo v2.5 Pro 做网页：3D 地球花了10分钟效果还差，改个星星就死循环

Reddit 用户实测 Mimo v2.5 Pro 生成三个网站。其中一个 3D 地球任务耗时 10 分钟，结果很烂；用户让它把星星调亮一点，模型就开始反复调用工具，鼠标控制也坏了。正文没披露模型版本、参数规模或具体报错，但能看出复杂交互场景下工具调用容易卡死，延迟高（10 分钟），且缺乏有效的终止机制。

#Code#Tools#Agent#Mimo

一句话点评

Reddit 用户实测 Mimo v2.5 Pro 生成三个网站，3D 地球任务耗时 10 分钟，结果很烂；让星星亮一点，模型就开始反复调用工具，鼠标控制也坏了。复杂交互场景下工具调用容易卡死，延迟高（10 分钟），且缺乏有效的终止机制。正文没披露模型版本、参数规模或具体报错，但能看出这类 agent 在真实任务中稳定性堪忧。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

15:53

80d ago

FEATUREDAI HOT 精选· aihot-apiZH15:53 · 05·09

特斯拉用视觉AI提前“看”到碰撞，让气囊和安全带更早启动

特斯拉把车上摄像头看到的画面和碰撞传感器结合起来，让安全系统能提前判断要撞车了，不等传感器确认就先把安全带收紧、气囊准备好。团队用真实事故数据和仿真回放，拿人体模型测受力，发现早一点启动保护能明显降低预估伤害。这次改进通过OTA推给车主，但正文没披露具体支持哪些车型，也没给出伤害风险降低了多少的量化数字。

#Vision#Robotics#Tesla#Elon Musk

精选理由

精选 · 重要度 75 · 吸引力 + 知识量 + 共鸣

一句话点评

特斯拉用摄像头提前“看”到碰撞，不等撞实就先拉安全带、备气囊。但正文没给车型和具体降伤数字，这点先别太激动。

锐评

这条消息的核心是特斯拉把纯视觉判断塞进了被动安全链路里。传统做法是等碰撞传感器确认撞击了再动作，但传感器有确认延迟，调太灵敏又怕误爆。特斯拉的方案是用摄像头画面提前预判“这下车躲不掉了”，在撞上之前就把安全带预紧、气囊进入待命状态，等于把保护动作的起跑线往前挪了一小截。团队用真实事故数据和仿真回放，拿人体模型测了受力，结论是早一点启动确实能让伤害预估往下走。但这条推文本质上是产品更新预告，不是技术论文。它没给出任何量化数字——伤害风险到底降了多少百分比、在什么碰撞形态下有效、有没有误触发率的对比，全都没提。支持的车型也只说“通过OTA推送”，没列清单。所以现在能确认的是方向对、逻辑通，但实际效果多大、覆盖多广，还得等后续数据或者第三方拆解。如果这是你考虑购车或安全对比的依据，建议先打七折看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

75

SCORE

H1·K1·R1

15:46

80d ago

AI HOT 精选· aihot-apiZH15:46 · 05·09

手机扫一扫，房子变3D模型；AI Agent在算命比赛里赢了人类专家

一项叫“3D高斯泼溅”的技术，用手机扫一遍房子就能生成浏览器里能看的3D模型，文件小、成本低，房产中介可能先受益。另一边，AI在垂直领域靠Agent范式突破：Tianfu Agent在专业命理大赛里接近人类顶尖水平，做法是给模型配一套专用工具（比如查规则、算参数），而不是让它硬背所有知识。这套思路对法律、中医这类规则密集的行业有参考价值。不过正文没披露...

#Agent#Vision#Tools#Tianfu Agent

一句话点评

手机扫一圈房子就能生成浏览器可看的3D模型，文件小成本低，房产中介确实能用。但正文没披露扫描精度、建模耗时和手机型号限制，实际落地效果要打折。Tianfu Agent在命理大赛接近人类顶尖水平，做法是给模型配专用工具（查规则、算参数），而不是硬背知识。这套思路对法律、中医等规则密集行业有参考价值，但命理本身争议大，且比赛规模、对手水平未公开，验证强度有限。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

15:36

80d ago

FEATUREDAI HOT 精选· aihot-apiZH15:36 · 05·09

YC 老板 Garry Tan 开源了自己的 AI 系统 GBrain，五个月读了 20 多本书，管着 10 万页知识

Garry Tan 把 GBrain 放上了 GitHub，这是他给自己搭的一套个人 AI 操作系统，想做成能持续增值的“第二大脑”。系统按任务拆成几个模块：Book Mirror 负责深度处理书籍，Meeting Prep 自动做会前预习，五个月啃完 20 多本书，结构化知识库超过 10 万页，还在涨。架构上分三层——轻量路由层决定用哪个模型、可组合...

#Agent#Tools#Memory#Y Combinator

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

YC CEO 把自己用的个人 AI 系统开源了，五个月啃完 20 多本书、管着 10 万页知识库，但正文没给实际效果验证，先当个高级玩具看。

锐评

Garry Tan 把 GBrain 放上 GitHub，这事本身比代码更有信号：一个顶级投资人愿意把自己日常用的 AI 系统公开，说明个人知识管理这块确实缺好工具。系统拆成三层——路由层决定用哪个模型、技能层跑具体任务、数据层存结构化知识，思路不新但落地得挺实在。五个月处理 20 多本书、管理超 10 万页知识库，数字看着漂亮，但正文没披露这些书到底读出了什么、会议预习有没有真省时间。我会先打个折：这是一个人给自己定制的系统，换个人用能不能跑通、维护成本多高，全都没说。开源不等于可复用，别看到 YC 就激动。还缺两样东西：一是实际使用前后的效率对比，二是其他人部署后的反馈。如果只是 Tan 自己用着爽，那更像个人作品展，离产品还远。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

15:15

80d ago

Hacker News 首页· rssEN15:15 · 05·09

Subquadratic 发布 1200 万 token 上下文窗口

一家叫 Subquadratic 的公司号称把上下文窗口做到了 1200 万 token，标题说“窗口被打破了”。但正文除了标题和 Hacker News 的 8 个点赞、0 条评论之外，没有任何技术细节——没提用了什么模型架构、延迟多少、价格多少、能不能复现。1200 万 token 确实很大（相当于几十本《三体》），但没披露具体怎么实现的，这点先别...

#Memory#Inference-opt#Subquadratic#Hacker News

一句话点评

标题说上下文窗口被打破了，Subquadratic 号称做到 1200 万 token（相当于几十本《三体》）。但正文除了标题和 Hacker News 上 8 个点赞、0 条评论外，没有任何技术细节——没提用了什么模型架构、延迟多少、价格多少、能不能复现。信息缺口太大，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

14:43

80d ago

FEATUREDTechCrunch AI· rssEN14:43 · 05·09

英伟达今年已承诺 400 亿美元做 AI 股权投资

英伟达继续在 AI 圈大笔撒钱。根据 CNBC 和 FactSet 的数据，2026 年才过了几个月，它已经承诺了超过 400 亿美元的股权投资。最大一笔是给 OpenAI 的 300 亿，剩下的分布在七笔对上市公司的数十亿美元级投资，以及大约二十多轮对未上市初创公司的参投里。最近的两笔包括给玻璃制造商康宁最多 32 亿、给数据中心运营商 IREN 最...

#Nvidia#OpenAI#Corning#Funding

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

英伟达今年光股权投资就承诺了400亿刀，其中300亿给了OpenAI。这已经不是卖铲子，是直接买矿了。

锐评

英伟达今年在AI领域的股权投资承诺已经超过400亿美元，最大头是给OpenAI的300亿。剩下的钱撒向了七家上市公司的数十亿级交易和大约二十多家未上市初创公司，最近还投了玻璃制造商康宁和数据中心运营商IREN。这个数字说明英伟达正在用卖GPU赚来的巨额现金流，系统性地绑定下游客户和上游供应商。但文章没披露这些投资的条款细节——是纯现金换股，还是包含了以货抵款、代金券式的采购承诺。如果是后者，实际现金支出会打折扣。另外，正文也没提这些投资在英伟达整体现金储备里占多大比例，以及监管机构对一家芯片商同时成为最大客户股东这件事的态度。这点先别太激动，等看到具体交割文件和反垄断风声再说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

14:38

80d ago

Hacker News 首页· rssEN14:38 · 05·09

Space CLI：在终端里让 AI 帮你做闪卡

Space 这个做了七年的闪卡应用，刚发布了一个命令行工具。装上后，你可以在终端里直接创建、搜索、导出卡片组，然后 pipe 给 Claude、ChatGPT 或本地模型（比如 Ollama），让 AI 帮你分析易混淆词、解释难卡、或者生成新的复习题。CLI 读写的是本地数据库，不需要登录或 API key，离线也能用。卡片在 CLI 里改了，手机和平...

#Agent#Code#Tools#Claude

一句话点评

Space 做了七年的闪卡应用，刚推出 CLI 工具，让你在终端里直接创建、搜索、导出卡片组，然后 pipe 给 Claude、ChatGPT 或本地模型（如 Ollama），让 AI 分析易混淆词、解释难卡或生成新复习题。CLI 读写本地数据库，无需登录或 API key，离线也能用。亮点是打通了 AI 工作流：批量导出 JSON 喂给模型，再拿回分析结果或新卡片，比手动逐张处理高效得多。...

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

61

SCORE

H1·K1·R0

14:36

80d ago

FEATUREDAI HOT 精选· aihot-apiZH14:36 · 05·09

Redis 作者用几千行 C 代码把 DeepSeek V4 Flash 塞进 MacBook，跑出 27 tok/s

Antirez 开源了一个叫 ds4 的推理引擎，专门给 DeepSeek V4 Flash 用。代码只有几千行 C，能在 128GB 内存的 MacBook Pro 上跑 100 万 token 上下文的模型。他用了三招：对 MoE 专家做不对称 2-bit 量化来压缩模型体积；把 KV Cache 搬到高速 SSD 上，绕开内存不够的问题；再给苹果...

#Inference-opt#Antirez#Redis#DeepSeek

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

Redis 作者用几千行 C 代码把 DeepSeek V4 Flash 塞进 MacBook，27 token/秒，但量化压缩和 SSD 换内存的代价正文没提。

锐评

Antirez 开源的这个 ds4 推理引擎，核心是把大模型跑在个人电脑上这件事做成了。他用三招：对 MoE 专家做不对称 2-bit 量化，把模型体积压下来；KV Cache 不放在内存，而是搬到高速 SSD 上，绕开 128GB 内存不够用的问题；再针对苹果芯片做纯 Metal 优化。结果是在 MacBook Pro 上跑 100 万 token 上下文的 DeepSeek V4 Flash，实测每秒 27 个 token。这个速度能读，但离实时对话还有距离。正文没披露量化后模型效果掉了多少，也没说 SSD 读写延迟对长上下文推理的稳定性影响。27 tok/s 是在什么负载下测的、有没有批处理，这些关键信息都缺。我会先打个折：工程上很漂亮，但别急着把它当生产环境方案。还缺一个对比：同样硬件跑其他量化方案是什么速度？如果只是针对 DeepSeek V4 Flash 特化，通用性就有限。另外，几千行 C 代码维护成本不低，后续模型更新能不能跟上也是问题。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

14:32

80d ago

Product Hunt · AI· rssEN14:32 · 05·09

Vexilo：给 Claude Code 用的“操作手册”，内置 31 个智能体、92 条命令和 121 项技能

Vexilo 是一个 Claude Code 的规划工具，相当于一本现成的操作手册。它打包了 31 个专用智能体（比如代码审查、TDD 引导、项目规划）、92 条按场景分类的命令，以及 121 项按领域（前端、后端、AI、运维）划分的技能。还集成了一个 GitHub 上 16 万星的工作流。主要解决一个痛点：大部分 Claude Code 用户只用到 ...

#Agent#Code#Tools#Vexilo

一句话点评

Vexilo 打包了 31 个智能体、92 条命令和 121 项技能，相当于给 Claude Code 用户一本现成的操作手册，解决“只用到 10% 功能”的痛点。亮点是集成了 GitHub 上 16 万星的工作流，且宣称一次付费无订阅。但正文没披露价格、具体集成方式和实际效果验证，买之前最好先确认这些智能体是否真能提升你的开发效率。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

62

SCORE

H0·K1·R0

14:29

80d ago

r/LocalLLaMA· rssEN14:29 · 05·09

Qwen3.6-27B 多 token 预测在双 MI50 上跑出 60 tok/s，速度翻倍

Reddit 用户用两块 AMD MI50（ROCm 7.2 + llama.cpp 改版）跑 Qwen3.6-27B 的多 token 预测（MTP，即一次预测多个后续 token 来加速推理）。短 prompt 从约 26 tok/s 涨到 56–60 tok/s，一个 1.8 万 token 的编码任务从 390.9 秒降到 205.5 秒，接近...

#Inference-opt#Benchmarking#Code#Qwen

一句话点评

两块AMD MI50（16GB×2）跑Qwen3.6-27B的MTP（多token预测，一次猜多个后续词来加速），短prompt从26 tok/s翻倍到56-60 tok/s，1.8万token编码任务从390秒降到205秒，接近翻倍。但注意：这是改版llama.cpp+ROCm 7.2，非官方支持；MTP加速依赖任务类型，短文本收益大，长文本可能边际递减。正文没披露显存占用和功耗，双卡部署...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

14:10

80d ago

r/LocalLLaMA· rssEN14:10 · 05·09

用 NVMe 当显存不够时的交换分区，能跑大模型吗？

Reddit 用户问：只有 20G 内存和 4G 显存，能不能靠 150G NVMe 交换分区跑 100B+ 参数模型。正文没披露模型名称、量化精度、实际吞吐或延迟，所以这点先别太激动。NVMe 交换比传统硬盘快很多，但跟显存带宽比还是差几个数量级，推理速度会非常慢，可能每秒只能生成几个 token。如果真能跑，成本确实低——不用买新硬件，但体验大概率...

#Inference-opt#Reddit#LocalLLaMA#Commentary

一句话点评

短评：NVMe 交换跑大模型？能跑，但慢到怀疑人生。 Reddit 用户想用 20GB 内存 + 4GB 显存 + 150GB NVMe 交换分区跑 100B+ 参数模型。NVMe 顺序读写约 7GB/s，但显存带宽（如 RTX 4090 约 1TB/s）差两个数量级，推理时每层参数都要从硬盘搬进显存，每秒可能只出几个 token，基本不可用。正文没披露模型名、量化精度和实测延迟，所以别太...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

41

SCORE

H1·K0·R1

14:08

80d ago

FEATUREDAI HOT 精选· aihot-apiZH14:08 · 05·09

Peekaboo 3.0 发布，主打“先动手”的 Mac 操作和界面识别

Peekaboo 3.0 上线了，作者说这是 2.0 以来最大的一次更新。核心变化是把“操作”放在第一位，不再是先看再点，而是直接让模型去执行 Mac 上的任务。它把截图和界面检测统一成一个功能，CLI 和 MCP 之间的 JSON 交互也整理得更干净，快照功能有改进。作者提到去年就想做，但当时模型能力不够，现在时机到了。正文没披露定价、用了哪个模型，...

#Agent#Vision#Tools#Peekaboo

精选理由

精选 · 重要度 72 · 吸引力 + 知识量 + 共鸣

一句话点评

Peekaboo 3.0 把操作放第一位，让模型直接动手干活而不是先看再点，但正文没披露用了哪个模型、定价多少。

锐评

Peekaboo 3.0 这次改版思路挺直接：以前是截图给模型看，模型告诉你点哪里，你再点；现在是模型直接上手操作 Mac，截图和界面检测合并成一个功能，省了一步。作者说去年就想做，但当时模型能力跟不上，现在才敢推。这个判断我信一半——模型确实强了，但让模型直接操作桌面环境，稳定性、误操作风险、权限控制都是坑，正文完全没提这些。 CLI 和 MCP 之间的 JSON 交互整理得更干净，快照功能也有改进，说明作者在工程上花了功夫。但关键信息全缺：没写定价，没写接的是哪个模型，也没写延迟和成功率。如果用的是云端大模型，延迟和隐私就是硬伤；如果是本地模型，那能力边界在哪也得说清楚。这些不补上，3.0 更像一次架构重构，离真正能放心交给它干活还有距离。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

72

SCORE

H1·K1·R1

14:01

80d ago

Hacker News 首页· rssEN14:01 · 05·09

Mochi.js：一个用 Bun 写的浏览器自动化框架，号称指纹检测全过

Mochi.js 是一个基于 Bun 和原生 Chrome DevTools Protocol 的浏览器自动化库，MIT 协议开源。它的核心卖点是“不留痕迹”——通过一套 48 条规则的 DAG（有向无环图）来生成指纹，保证 Canvas、WebGL、字体、音频等所有指纹表面都来自同一个（profile, seed）对，不会出现 Mac 的 UA 配上...

#Agent#Tools#Mochi.js#Bun

一句话点评

Mochi.js 是一个基于 Bun 的浏览器自动化库，主打“不留痕迹”——用 48 条规则的有向无环图统一生成 Canvas、WebGL、字体等所有指纹，避免出现 Mac 的 UA 配上 Linux WebGL 这种矛盾组合。作者称在 FingerprintJS Pro v4 上跑 Linux 数据中心 IP，嫌疑分 8 但没被标为机器人。核心思路是把 Patchright + 指纹注入 ...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

13:22

80d ago

彭博科技· rssEN13:22 · 05·09

欧洲央行官员：AI 风险倒逼金融基础设施审查

欧洲央行管委 Escrivá 说，AI 带来的风险（比如模型出错、被攻击）可能冲击金融系统的底层设施，央行得重新检查这些设施扛不扛得住。他还提到要守住央行作为最后担保人的角色，别让稳定币把这事搅乱了。正文没披露审查范围、时间表，也没说具体哪些 AI 场景最危险，所以这点先别太激动，目前只是一个方向性表态。

#Safety#European Central Bank#José Luis Escrivá#Policy

一句话点评

欧洲央行管委Escrivá表态要重审金融基础设施扛不扛得住AI风险（模型出错、被攻击），还要守住央行最后担保人角色，别让稳定币搅局。正文没披露审查范围、时间表，也没说哪些AI场景最危险，目前只是一个方向性表态，先别太激动。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

58

SCORE

H0·K0·R1

11:57

80d ago

FEATUREDr/LocalLLaMA· rssEN11:57 · 05·09

用 12GB 显存跑 Qwen3.6 35B A3B，llama.cpp MTP 实测跑到 80 tok/s、128K 上下文

Reddit 用户 janvitos 在 RTX 4070 Super（12GB 显存）上跑 Qwen3.6-35B-A3B-MTP-GGUF，搭配 llama.cpp 的一个 MTP 拉取请求。他贴出的实测数据是每秒 69.2 到 81.9 个 token，草稿接受率在 0.694 到 0.947 之间，上下文长度拉到 131072。关键设置是 -f...

#Inference-opt#Code#Tools#Qwen

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

12GB 显存跑 35B 模型，128K 上下文还能飙到 80 token/秒，但这是个人单卡测试，别急着当通用结论。

锐评

这条帖子最抓眼球的是数字：一块 RTX 4070 Super（12GB 显存）上，Qwen3.6-35B-A3B 这个 MoE 模型跑出了每秒 69 到 82 个 token 的速度，上下文拉到 131072，草稿接受率最高 0.947。怎么做到的？核心是 llama.cpp 的一个 MTP（多 token 预测）拉取请求，配合 -fitt 1536 参数，从显存里专门划了 1.5GB 给草稿模型和 KV 缓存用。先打个折：这是单个用户 janvitos 贴出的实测，不是官方基准，也没说测试用的 prompt 是什么、输出长度多少、温度设的多少。草稿接受率 0.694 到 0.947 这个范围本身就说明波动不小，低的时候相当于每三个草稿 token 就有一个被扔掉，实际加速效果会打折扣。另外，正文被 Reddit 的网络安全拦截了，我们看不到完整的设置细节和讨论，只能根据摘要判断。对想在家用消费级显卡跑大模型的人来说，这个方向值得关注——MoE 架构本身激活参数少，MTP 又让模型一次猜好几个 token，确实可能把门槛压到 12GB 这个量级。但还缺几样东西：不同任务下的稳定性数据、长上下文时注意力机制会不会崩、以及这个 MTP PR 什么时候能合进 llama.cpp 主线。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

11:25

80d ago

AI HOT 精选· aihot-apiZH11:25 · 05·09

腾讯混元 Hy3 预览版免费期结束，OpenRouter 上三项指标排第一

腾讯混元说 Hy3 预览版在 OpenRouter 上两周免费期内，总 token 用量、代码生成和工具调用三项指标都排第一，市场份额冲到 15.4%。现在免费期结束，但还能以有竞争力的价格继续用。正文没披露具体价格和性能对比，想省钱的话可以自己去 OpenRouter 看看报价。

#Code#Tools#Tencent Hunyuan#OpenRouter

一句话点评

短评：OpenRouter两周免费期数据，Hy3预览版在token用量、代码和工具调用三项排第一，份额冲到15.4%。免费结束但价格未披露，别急着冲。点评：腾讯混元说Hy3预览版在OpenRouter上两周免费期内，总token用量、代码生成和工具调用三项指标都排第一，市场份额冲到15.4%。这个排名来自OpenRouter的公开数据，可信度还行，但注意这是免费期数据——用户冲着免费来，...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

11:15

80d ago

FEATUREDFT · 科技· rssEN11:15 · 05·09

德国无人机初创公司 Helsing 估值冲到 180 亿美元，投资人正往军工赛道砸钱

Helsing 计划在新一轮融资里融 12 亿美元，估值达到 180 亿美元。这家德国公司背后有 Spotify 创始人 Daniel Ek 站台。正文被付费墙挡住了，没披露更多技术细节或财务数据，所以这个估值到底靠什么撑起来，目前还看不清。

#Robotics#Helsing#Daniel Ek#Spotify

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

FT 正文被付费墙挡了，180 亿估值靠什么撑起来完全看不清，这条先打个折看。

锐评

Helsing 要融 12 亿美元，估值冲到 180 亿，Spotify 创始人 Daniel Ek 在背后站台。但 FT 这篇报道正文被付费墙完全挡住，除了融资规模和估值数字，没有任何技术细节、收入数据或客户名单。国防 AI 赛道现在热钱多，但 180 亿这个数放在欧洲军工创业公司里算顶格了，到底是因为有实打实的订单和部署案例，还是纯靠地缘政治情绪推高，正文没披露。想知道这钱花得值不值，至少得看到它在什么平台上跑、卖给谁、年收入多少，这些目前全是空白。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

10:59

80d ago

FEATUREDr/LocalLLaMA· rssEN10:59 · 05·09

DeepSeek 拒绝了阿里的投资，选择保持公司独立

Reddit 上一条帖子说，DeepSeek 和阿里的融资谈判谈崩了，双方没能在条款上达成一致。帖子提到 DeepSeek 当时的估值是 3000 亿人民币，想融 500 亿。不过原文链接点进去显示 403 错误，正文内容被屏蔽了，所以具体的谈判细节和拒绝原因都没法核实。

#DeepSeek#Alibaba#Tencent#Funding

精选理由

精选 · 重要度 84 · 吸引力 + 知识量 + 共鸣

一句话点评

DeepSeek 和阿里的融资谈判黄了，估值 3000 亿想融 500 亿，但帖子原文被 Reddit 屏蔽，具体条款和拒绝原因都没法核实。

锐评

这条消息目前只能当传闻看。Reddit 帖子说 DeepSeek 拒绝了阿里，估值开到 3000 亿人民币，想拿 500 亿融资，但双方没谈拢。问题是原链接直接 403，正文内容被屏蔽了，我们看不到任何谈判细节——是阿里要的股权太多，还是 DeepSeek 不想被绑进阿里云生态，这些关键信息全是空白。如果数字属实，3000 亿估值在国产大模型里算头部梯队，但 500 亿的融资规模也很大，说明 DeepSeek 对现金流的胃口不小。拒绝阿里可能意味着它更想保持独立，不走“站队云厂商”的老路，也可能只是价格没谈到位。现在缺的是官方回应或可靠信源。光靠一条被屏蔽的 Reddit 帖子，我会先打个折，别急着下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

84

SCORE

H1·K1·R1

10:58

80d ago

Product Hunt · AI· rssEN10:58 · 05·09

Connector.wtf：把广告账户接进AI聊天，免费

Connector.wtf 是一个免费的 MCP 服务器（一种让 AI 工具直接读外部数据的标准接口），能把 Google Ads、Meta Ads 和 LinkedIn Ads 的广告账户直接连到 ChatGPT 或 Claude 上。目前只支持读数据（read-only），不能写或改广告。作者说托管成本几乎为零，所以干脆免费，省得大家一辈子跟 CS...

#Tools#Connector.wtf#Google#Meta

一句话点评

Connector.wtf 免费把 Google Ads、Meta Ads 和 LinkedIn Ads 接进 ChatGPT 或 Claude，只读不写。作者说托管成本几乎为零所以免费，省得大家一辈子导 CSV。目前只支持三个平台，权限和数据范围正文没披露，小团队作品，别当企业级方案。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

48

SCORE

H0·K1·R0

10:34

80d ago

r/LocalLLaMA· rssEN10:34 · 05·09

用本地 Qwen 3.6 27B 当助手，有人成功装好了 Arch Linux

一位 Reddit 用户把 Pi 编程代理连到本地跑的 Qwen 3.6 27B 模型上，让它帮忙配置 Arch Linux。模型能处理蓝牙音箱连接和 HDPI 缩放这类实际任务，但用户没给模型直接 sudo 权限——相当于让模型提建议、自己动手执行。正文没披露具体用了多少样本或微调细节，但能跑通本地模型做系统配置，说明 27B 规模在 agent 场...

#Agent#Code#Tools#Qwen

一句话点评

短评：本地模型当系统管理员，27B 够用但别给 sudo。点评：Reddit 用户把 Pi 编程代理接上本地 Qwen 3.6 27B，让它帮忙配 Arch Linux——连蓝牙音箱、调 HDPI 缩放都搞定了。关键限制：用户没给模型 sudo 权限，相当于模型只出建议、人动手执行，安全但效率打折。27B 规模能跑通 agent 任务，说明本地模型在系统配置场景已经够用，成本比调 API...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

09:58

80d ago

● P1AI HOT 精选· aihot-apiZH09:58 · 05·09

百度发了 ERNIE 5.1，参数量砍到原来的三分之一，训练费压到同规模模型的 6%

ERNIE 5.1 把总参数量压到原规模的大约三分之一，激活参数压到大约一半，预训练成本只花到同规模模型的 6% 左右。百度说性能没崩，Agent 能力超过 DeepSeek-V4-Pro，世界知识和创意写作接近头部闭源模型和 Gemini 3.1 Pro，推理仅次于 Gemini 3.1 Pro，深度搜索排全球第四。技术手段提了两个：弹性预训练用来提...

#Agent#Reasoning#Inference-opt#Baidu

精选理由

精选 · 重要度 86 · 吸引力 + 知识量 + 共鸣

一句话点评

百度把模型参数砍到三分之一，训练费压到同规模6%，Agent跑分超DeepSeek-V4-Pro。但没给具体基准和实测条件，先打七折看。

锐评

ERNIE 5.1 的核心卖点是省钱：总参数压到原来的三分之一，激活参数压到一半，预训练成本只花了同规模模型的 6% 左右。百度说性能没崩，Agent 能力超过 DeepSeek-V4-Pro，推理仅次于 Gemini 3.1 Pro，深度搜索排全球第四。技术手段提了弹性预训练和异步强化学习，但正文没展开具体怎么做的，也没给完整的 benchmark 对比表。我会先打个折。成本压缩到这个程度确实吸引人，但“性能没崩”需要更多第三方验证。Agent 能力跑分超了谁、在什么任务上超的、差距多大，这些都没披露。深度搜索排第四，前三是谁、评分标准是什么，同样没说。还缺几样东西：推理延迟和吞吐量的实测数据、开源计划或 API 定价、以及非百度系评测的复现结果。如果这些数字能兑现，对做 Agent 部署的团队是个好消息，但现在只能当厂商自述来看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

86

SCORE

H1·K1·R1

09:27

80d ago

r/LocalLLaMA· rssEN09:27 · 05·09

Reddit 用户实测：Qwen 写代码强，但写 App Store 文案和对话不如 Sonnet 4.6

一位 Reddit 用户对比了 Qwen 和 Sonnet 4.6 在创意写作与对话直觉上的表现，结论是 Qwen 在编程任务上很强，但在写 App Store 文案和简洁对话上不如 Sonnet 4.6。帖子没有披露测试次数、具体提示词、模型版本或评估标准，所以这个结论只能当个人感受看，不能当严谨评测。

#Code#Fine-tuning#Qwen#Anthropic

一句话点评

一位 Reddit 用户说 Qwen 写 App Store 文案和简洁对话不如 Sonnet 4.6，但没披露测试次数、提示词和模型版本，结论只能当个人感受。短评：个人体感，缺评测细节。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

52

SCORE

H0·K0·R1

09:25

80d ago

Ben's Bites· rssEN09:25 · 05·09

Ben 用 AI 搭了个 Gmail 客户端，自己用，还给 agent 留了后门

Ben 用 Codex 和 Factory 给自己写了一个本地 Gmail 客户端，Gmail 还是数据主库。功能包括分栏收件箱、快捷键、命令面板、回复/写邮件、20 秒撤回、一键退订、搜索、规则同步、缓存刷新，以及给 agent 用的隐藏选择器和调试接口。一开始很卡，原因是频繁请求 Gmail API，后来加了本地缓存和后台预取才变快。规则部分踩了坑...

#Agent#Code#Tools#Ben's Bites

一句话点评

Ben 用 Codex 和 Factory 给自己写了个本地 Gmail 客户端，核心思路是 Gmail 做数据主库，前端自己控。一开始卡是因为频繁调 Gmail API，加了本地缓存和后台预取才解决。规则同步也踩了坑，agent 默认写本地规则文件，没跟 Gmail 同步。亮点是给 agent 留了隐藏接口，但正文没披露具体怎么用。整体是个 AI 辅助写个人工具的实战记录，不是产品发布，别...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

69

SCORE

H1·K1·R1

09:10

80d ago

Product Hunt · AI· rssEN09:10 · 05·09

Yeta AI：给 YouTube 视频实时配音，贴链接选语言就行

Yeta AI 是一个浏览器工具，你贴一个 YouTube 链接、选目标语言，它就能实时把视频里的语音换成另一种语言的 AI 配音，不用上传也不用等。支持 10 种以上语言，免费起步，不用绑信用卡。正文没披露具体延迟多高、用了什么模型、音色质量如何，也没说支持哪些语言。如果延迟能控制在几秒内、音色自然，那对看外语视频的用户挺实用，但这点先别太激动，得等实测。

#Audio#Yeta AI#YouTube#Product update

一句话点评

Yeta AI 是一个浏览器工具，贴 YouTube 链接就能实时把语音换成 AI 配音，不用上传。支持 10 种以上语言，免费起步，不绑信用卡。正文没披露具体延迟、用了什么模型、音色质量，也没说支持哪些语言。如果延迟能控制在几秒内、音色自然，对看外语视频的用户挺实用，但这点先别太激动，得等实测。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

48

SCORE

H1·K0·R0

09:10

80d ago

r/LocalLLaMA· rssEN09:10 · 05·09

有人用两张专业卡跑 MiMo-V2.5 量化版，测了 104 万 token 上下文

LegacyRemaster 在本地用 llama-server 跑了 MiMo-V2.5 的 IQ3_S 量化版，上下文拉到 1,048,576 token。机器是双卡：RTX 6000（96GB 显存）加 W7800（48GB 显存），49 层全卸到 GPU，开了 FlashAttention，16 线程。他的体感是，超过 5 万 token 后，...

#Inference-opt#Code#MiMo#MiniMax

一句话点评

有人在双卡（RTX 6000 96GB + W7800 48GB）上把 MiMo-V2.5 的量化版跑到了 100 万 token 上下文，5 万 token 后速度比 MiniMax 稳。但温度低于 0.2、重复惩罚 1.1 时会循环，说明长文生成质量还有坑。正文被 Reddit 屏蔽了，没披露具体速度和显存占用，如果是真的，这个硬件门槛对本地部署不算友好。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

09:07

80d ago

r/LocalLLaMA· rssEN09:07 · 05·09

现在这显卡价格，到底谁在买啊？

Reddit 用户吐槽当前 GPU 和 DDR5 定价离谱：8GB 显存卡卖到以前 16GB 卡的价格，RTX 4090 比刚发布的 RTX 5090 还贵 1000 美元。帖子没披露实际销量或渠道库存数据，所以这到底是厂商硬扛价还是真有人接盘，正文没说。

#Inference-opt#Reddit#Nvidia#AMD

一句话点评

Reddit 用户吐槽显卡定价离谱：8GB 显存卡卖到以前16GB卡的价格，RTX 4090比刚发布的RTX 5090还贵1000美元。帖子没披露实际销量或渠道库存数据，所以这到底是厂商硬扛价还是真有人接盘，正文没说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

58

SCORE

H1·K1·R1

08:56

80d ago

FEATUREDAI HOT 精选· aihot-apiZH08:56 · 05·09

工信部启动 AI 伦理审查先导计划，先在几个先导区省份跑通流程

工信部发了个通知，要在国家人工智能产业创新应用先导区所在的省份，先试着把 AI 伦理审查这件事落地跑起来。计划里安排了四件事：一是让各省把审查制度细则定清楚，把城市层面的协同治理机制建起来；二是让企业、研究机构这些创新主体自己建 AI 伦理委员会，有条件的还可以搞审查与服务中心；三是动真格做审查，高风险 AI 活动要组织专家复核，同时推动风险评估、委员...

#Safety#Alignment#MIIT#Policy

精选理由

精选 · 重要度 75 · 知识量 + 共鸣

一句话点评

工信部要在AI先导区省份先跑通伦理审查，把制度、委员会、高风险复核和风险监测网搭起来。正文没提具体时间表和违规怎么罚，落地力度还得看后续细则。

锐评

这条通知的核心是把AI伦理审查从纸面推到实操。工信部选了四个方向：省级定细则、企业建伦理委员会、高风险活动要专家复核、再搭一个部省市三级联动的风险监测网络。听起来框架很全，但正文没披露几个关键信息——比如“高风险”怎么界定，审查不通过会有什么后果，以及企业自建委员会会不会变成自己审自己。对从业者来说，信号很明确：以后做AI产品，特别是涉及高风险场景的，伦理审查会像安全评估一样成为硬门槛。通知里提到要搞标准研制和验证，说明现在连审查标准本身都还在摸索阶段。这点先别太激动，等具体标准和案例出来，才能判断是动真格还是走流程。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

75

SCORE

H0·K1·R1

08:52

80d ago

AI HOT 精选· aihot-apiZH08:52 · 05·09

Qwen 3.5 和 3.6 全系列模型上线 SiliconFlow，从 9B 到 397B 都有

SiliconFlow 平台一口气上了阿里 Qwen 3.5 和 3.6 两个系列共 7 个模型，覆盖 9B 到 397B 参数，既有稠密（Dense）也有混合专家（MoE）架构，还带原生多模态能力。具体型号包括 Qwen3.6-35B-A3B（35B 总参数，每次推理只激活 3B，省显存）、Qwen3.6-27B、Qwen3.5-397B-A17B（...

#Multimodal#Inference-opt#SiliconFlow#Qwen

一句话点评

SiliconFlow 一口气上了阿里 Qwen 3.5 和 3.6 共 7 个模型，从 9B 到 397B 都有，MoE 和稠密架构全包。最亮眼的是 Qwen3.6-35B-A3B，总参数 35B 但每次只激活 3B，显存省得离谱，推理成本能压到很低。Qwen3.5-397B-A17B 则是超大杯 MoE，适合不差钱的场景。原生多模态是加分项，但正文没披露具体跑分或延迟数据，实际效果得自己...

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

36

SCORE

H0·K1·R0

08:44

80d ago

Hacker News 首页· rssEN08:44 · 05·09

把文档交给大模型改，改完反而坏了

这篇论文说，让大模型帮你改文档，改着改着内容就坏了。作者搞了一套叫 DELEGATE-52 的测试，覆盖编程、晶体学、乐谱等 52 个专业领域，模拟长流程的文档编辑任务。测了 19 个模型，结果 Gemini 3.1 Pro、Claude 4.6 Opus、GPT 5.4 这些顶级模型，在长流程结束时平均搞坏了 25% 的内容，其他模型更惨。论文还发现...

#Agent#Research release

一句话点评

这篇论文给所有让AI帮忙改文档的人泼了盆冷水。作者搞了套DELEGATE-52测试，覆盖编程、乐谱等52个专业领域，模拟长流程编辑。测了19个模型，结果Gemini 3.1 Pro、Claude 4.6 Opus、GPT 5.4这些顶级模型，在长流程结束时平均搞坏了25%的内容，其他模型更惨。而且用工具（agentic tool use）也没用，文档越长、交互越多、干扰文件越多，错误越严重。...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

68

SCORE

H1·K0·R1

08:40

80d ago

FEATUREDAI HOT 精选· aihot-apiZH08:40 · 05·09

用 Codex 并行调试验证修复

作者查 bug 时会让 Codex 在临时沙盒里重建出问题现场，先确认 bug 能复现，再修，修完再验证一遍。本地环境不会被搞乱，因为所有操作都在隔离的临时环境里跑；速度也不掉，因为他同时开 10 个会话并行处理。正文没披露具体修复成功率或单次耗时。

#Agent#Code#Tools#Codex

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

用临时沙盒并行跑10个Codex会话查bug，修完还能自动验证，本地环境不脏。但正文没给成功率和耗时，效果先打七折。

锐评

这条分享了一个挺实用的调试思路：让 Codex 在隔离的临时沙盒里复现 bug、修、再验证，同时开 10 个会话并行跑，既不怕搞乱本地环境，速度也不掉。这相当于把“复现-修复-回归”这个最吃耐心的环节外包给模型，而且用并行换时间，思路直接。但正文只给了操作流程，没披露关键数据。修复成功率多少？单次任务平均耗时多久？10 个并行是稳定跑还是偶尔崩？这些都没说。另外，crabbox 这个沙盒工具本身的开销、能跑的语言和依赖限制也没提，实际能不能照搬要看自己的技术栈。还缺一个对比：跟直接在本机开多进程或者用 CI 跑测试修 bug 比，这套流程到底省了多少时间、少踩了多少坑。没有这些，就只能当个灵感参考，不能直接当方案用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

07:43

80d ago

FEATUREDAI HOT 精选· aihot-apiZH07:43 · 05·09

re_gent：给 AI 编程助手配了个 Git，能管代码、提示词和模型权重

re_gent 开源了一个类似 Git 的版本控制工具，专门给 AI 编程助手用。它不光能像 Git 一样对代码做分支、合并和回滚，还能管提示词和模型权重。目前在 GitHub 上拿到了 201 个星标，有 11 个复刻。正文没披露具体的性能开销和兼容哪些模型，这点先别太激动。

#Agent#Tools#re_gent#GitHub

精选理由

精选 · 重要度 73 · 吸引力 + 知识量 + 共鸣

一句话点评

给 AI 编程助手用的 Git，能管代码、提示词和模型权重。目前只有 201 个星标，正文没披露性能开销和兼容哪些模型，先观望。

锐评

re_gent 想解决一个实际问题：AI 编程助手改代码时，不光代码在变，提示词和模型权重也在变，传统 Git 管不了后两者。它把这三样东西统一用分支、合并、回滚来管，思路直接。项目在 GitHub 上拿了 201 个星标、11 个复刻，Hacker News 讨论热度有 100 分，说明开发者圈子里有人觉得这个方向对。但正文完全没提性能开销——每次提交要存模型权重的话，仓库体积和操作延迟会多大？也没说兼容哪些模型和编程助手，是只支持自家生态还是能接 Copilot、Cline 这些主流工具。这两个信息缺口让实用性打了不少折扣。如果后续能补上兼容列表和基准测试，才值得认真试试。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

73

SCORE

H1·K1·R1

07:23

80d ago

彭博科技· rssEN07:23 · 05·09

字节跳动今年AI基建预算上调25%，达到2000亿元

字节跳动把今年AI基础设施的投入计划提高了25%，总金额来到2000亿人民币（约294亿美元）。这个数字挺吓人的，但文章说主要是因为内存芯片涨价了，加上TikTok母公司自己在AI上铺得更开。不过正文没披露这2000亿具体花在哪——是买GPU、建数据中心还是租算力，也没说这笔钱比去年实际花了多少。所以这个涨幅有多大、是不是真超预期，还得看后续细节。

#ByteDance#South China Morning Post#TikTok#Funding

一句话点评

字节跳动今年AI基础设施预算上调25%至2000亿人民币，约294亿美元。涨幅看着大，但文章提到主因是内存芯片涨价，并非纯业务扩张。正文没披露这2000亿具体花在哪——买GPU、建数据中心还是租算力，也没说去年实际花了多少。所以这个涨幅有多大、是不是真超预期，还得看后续细节。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

71

SCORE

H1·K1·R1

更多

✕

频道

热点聚合每日 AI 日报全部播客·视频 AX 严选 X 监控收藏信源邮件订阅 Agent 接入

后台

用量系统订阅管理精选策略策略迭代用户