全部 · 2026-05-27

▸ 50 items · updated 3m ago

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 2573 26105 27120 28142 29116 3064 3162

2026年6月

一二三四五六日

1150 2157 3132 4117 5127 669 773 8141 9135 1084 1196 1288 1346 1434 1570 1682 1775 1886 1955 2027 2120 2274 2374 2468 2564 2640 2724 2837 2956 3083

2026年7月

一二三四五六日

156 271 347 421 527 664 758 865 975 1050 1134 1228 1345 1484 1582 1683 1745 1818 1938 2051 2170 2265 2340 24 25 26 27 28293031

2026-05-27 · 星期三2026年5月27日

23:40

61d ago

● P1AI HOT 精选· aihot-apiZH23:40 · 05·27

Cognition AI 拿了超 10 亿美元，投前估值 260 亿，想把软件工程师效率提 10 倍

Cognition AI 新融了超过 10 亿美元，投前估值 260 亿美元。它的年化收入一年里从 3700 万美元涨到约 4.92 亿美元，涨了十几倍。核心产品 Devin 被定位成能自主干活的初级工程师，不是只补代码，而是能自己规划、测试、部署，走完多步骤流程。公司不绑死一家模型，既用自己的模型，也接 OpenAI 和 Anthropic 的大模型...

#Agent#Code#Tools#Cognition AI

精选理由

精选 · 重要度 88 · 吸引力 + 知识量 + 共鸣

一句话点评

Devin 年化收入一年涨十几倍到近 5 亿美元，但 10 倍效率目标目前只是 CEO 一句话，没看到独立验证。

锐评

Cognition AI 这轮融了超 10 亿美元，投前估值 260 亿，数字很大，但更值得看的是收入增速：年化收入从 3700 万跳到约 4.92 亿，一年翻了十几倍，说明 Devin 确实有人在买单。Devin 的定位不是补全代码的插件，而是能自己规划、测试、部署的初级工程师，走完多步骤流程，这点比传统代码助手更进一步。公司不绑死一家模型，既用自己的也接 OpenAI 和 Anthropic 的，策略上灵活，但实际效果取决于调度能力，正文没披露不同模型在不同任务上的分配逻辑和失败率。CEO 说目标是让全球约 3000 到 3500 万软件工程师效率提升 10 倍，这个数字目前只是愿景，没有给出测量基准或外部验证，先别太激动。还缺的信息：Devin 在真实团队里的留存率、接手老代码库的表现、以及客户续费数据，这些才能判断它是不是真在干活而不是在 demo。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

88

SCORE

H1·K1·R1

23:09

61d ago

AI HOT 精选· aihot-apiZH23:09 · 05·27

用 Coding Agent 的关键：开头规划比什么都重要

作者建议先用 GPT-5.5 或 Claude Opus 4.7 这类最强模型，在 Codex、Claude Code、Cursor 的 Plan 模式下分别生成设计方案，挑最好的再借鉴其他版本。复杂计划拆成多个 Phase，每个写清楚要求和验证标准，存成 Markdown 文档。执行时按 Phase 走，人工随时纠偏。最后用 GPT-5.5 做一次代...

#Agent#Code#Tools#OpenAI

一句话点评

短评：规划先行，选最优方案再执行，避免多Agent交叉Review导致代码膨胀。点评：作者分享了一个实用的Coding Agent工作流：先用GPT-5.5或Claude Opus 4.7在Codex、Claude Code、Cursor的Plan模式下分别生成设计方案，挑最好的再借鉴其他版本。复杂计划拆成多个Phase，每个写清楚要求和验证标准，存成Markdown文档。执行时按Pha...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

22:21

61d ago

r/LocalLLaMA· rssEN22:21 · 05·27

Gemma4 31B 本地跑出来质量很差，Google API 却正常

Thagor 用两张 NVLink 连起来的 A100 跑 Gemma4 31B，vLLM 0.21.0、BF16、tensor parallel size 2、最大长度设到 65536。本地输出的结构化 JSON 格式不对，但同一个模型走 Google API 就正常，LiteLLM 路由和请求参数完全一样。正文没披露具体报错或日志，所以问题出在 v...

#Inference-opt#Tools#Code#Google

一句话点评

两张A100跑Gemma4 31B本地输出JSON格式乱掉，走Google API却正常。问题大概率出在vLLM 0.21.0的推理配置或bug上，不是模型本身不行。正文没披露具体报错日志，所以没法判断是tensor parallel、BF16精度还是max length设太长导致的。如果本地部署想省API费，这点先别太激动，得等vLLM修或换版本试。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

64

SCORE

H0·K1·R1

22:07

61d ago

FEATUREDAI HOT 精选· aihot-apiZH22:07 · 05·27

Anthropic 公开了用 Claude Opus 扫代码漏洞的六步流程，扫开源项目找到 1596 个漏洞，修了 97 个

Anthropic 在这篇博客里讲了他们怎么用自家最强的 Claude Opus 模型去扫代码安全漏洞。整个流程分六步：先做威胁建模（搞清楚代码可能被怎么攻击），再把代码放进沙盒隔离运行，接着让模型找漏洞，找到后人工验证是不是误报，然后排优先级，最后出修复方案。他们拿这套流程去扫开源项目，截至 2026 年 5 月 22 日共报出 1596 个漏洞，其...

#Code#Agent#Safety#Anthropic

精选理由

精选 · 重要度 83 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 公开了用自家最强模型扫开源代码漏洞的流水线，已报 1596 个漏洞、修了 97 个，但没给误报率和每条漏洞的验证成本。

锐评

Anthropic 这篇博客讲的是他们怎么把 Claude Opus 变成一个自动化代码安全审计员。流程不复杂：先分析代码可能被攻击的路径，再把代码扔进隔离环境让模型去找漏洞，找到后人工确认是不是误报，最后排优先级、出修复方案。到 5 月 22 日，这套流程在开源项目里扫出了 1596 个漏洞，其中 97 个已经修了。数字看着挺多，但关键信息缺了不少。第一，没提误报率——模型报 100 个漏洞里到底有几个是真的，这个直接决定人工复核要花多少时间。第二，没讲每条漏洞的验证成本，如果每个都得资深安全工程师花半小时确认，那省下的只是扫描时间，不是总成本。第三，97 个修复听起来不多，是漏洞太难修还是项目维护者不买账，正文没解释。这套流程的价值在于把安全审计从“人盯着代码一行行看”变成了“模型先筛一遍，人只做确认”，思路是对的。但别急着把它当成熟方案，它更像 Anthropic 在展示自家模型能干活，离“开箱即用的安全扫描工具”还差误报率、成本数据和第三方复现这三样东西。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

83

SCORE

H1·K1·R1

21:25

61d ago

彭博科技· rssEN21:25 · 05·27

分析师：Salesforce 转向 AI 比预期慢

D.A. Davidson 分析师 Gil Luria 在 Bloomberg 节目上说，Salesforce 的 AI 转型进度比预期要慢。他是在点评 Salesforce 和 Snowflake 最新财报时说的，但正文没披露具体收入数字、客户迁移进度或时间表，所以这个判断目前只是一个分析师的观点，没有硬数据支撑。

#Salesforce#Gil Luria#Snowflake#Commentary

一句话点评

分析师说Salesforce AI转型比预期慢，但正文没给任何收入或客户迁移数据，目前只是一个观点，没有硬证据。短评：分析师说Salesforce AI转型慢，但没给数据，先当观点看。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

61

SCORE

H1·K0·R1

20:53

61d ago

Hacker News 首页· rssEN20:53 · 05·27

iOS 26 检测到裸体画面会直接冻结 FaceTime 通话

PCMag 报道，iOS 26 在 FaceTime 通话中检测到裸露画面时会直接冻结画面。正文没披露检测机制是端侧模型还是云端判断，也没说误报率。这条新闻在 Hacker News 上拿了 36 分、19 条评论，说明开发者圈子里有人在意隐私和误拦截的平衡。如果检测是纯端侧跑，延迟和功耗会是关键；如果是云端过一道，那隐私风险就大了。目前信息不够判断实...

#Vision#Safety#Apple#PCMag

一句话点评

iOS 26 在 FaceTime 检测到裸露画面时会直接冻结通话，而不是模糊或警告。PCMag 报道，但没说明检测是在手机本地跑还是上传云端，也没给误报率。Hacker News 上 36 分、19 条评论，开发者圈子里有人在意隐私和误拦截的平衡。如果是纯端侧跑，延迟和功耗是问题；如果过云端，隐私风险就大了。目前信息不够判断实际体验，先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

20:45

61d ago

彭博科技· rssEN20:45 · 05·27

Marvell 上调全年业绩预期：AI 数据中心芯片需求撑起增长

Marvell Technology 上调了全年业绩指引，季度营收预期也高于分析师平均预测，理由是 AI 数据中心对芯片的需求强劲。正文没披露具体上调幅度、营收数字和哪些芯片品类在拉动，所以暂时没法判断增长有多猛。

#Inference-opt#Marvell Technology#Product update

一句话点评

Marvell 上调全年指引，理由是 AI 数据中心芯片需求强。但正文被 paywall 挡住，没披露上调幅度、具体营收数字和哪些芯片在拉动，所以暂时没法判断增长有多猛。如果是真的，定制 AI 芯片（ASIC）这块可能比通用 GPU 更稳，但缺细节只能先打个折。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

55

SCORE

H0·K0·R1

20:37

61d ago

Hacker News 首页· rssEN20:37 · 05·27

开源无人机竞速模拟器，让你提前练手AI Grand Prix

Elodin 开源了一个 AI Grand Prix 的练习模拟器，参赛者现在就能写自动驾驶代码，不用等官方模拟器。这套工具把 Elodin 的物理引擎（6自由度刚体、电机动力学、GPU渲染的FPV摄像头）和真实的 Betaflight 飞控（SITL模式，PID循环锁定在1kHz）通过UDP串起来，参赛者只需要写一个 autopilot 函数，输入传...

#Robotics#Elodin#Betaflight#Open source

一句话点评

Elodin 开源了一个 AI 无人机竞速赛的练习模拟器，参赛者现在就能写自动驾驶代码，不用等官方模拟器。这套工具把 Elodin 的物理引擎（6自由度刚体、电机动力学、GPU渲染的FPV摄像头）和真实的 Betaflight 飞控（SITL模式，PID循环锁定在1kHz）通过UDP串起来，参赛者只需要写一个 autopilot 函数，输入传感器数据（IMU、姿态、气压计、磁力计、可选摄像头...

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

66

SCORE

H1·K1·R0

20:23

61d ago

FEATUREDr/LocalLLaMA· rssEN20:23 · 05·27

有人整理了一份1030亿token的Usenet语料，覆盖1980到2013年，全是真人发言、没有AI污染

一个叫OwnerByDane的用户放出了一套从Usenet新闻组扒下来的语料，总规模1031亿token，包含4.08亿条帖子，横跨18347个新闻组，时间从1980年一直拉到2013年。这套数据最大的卖点是“前互联网时代、纯人类产出、零AI生成内容”，对想避开模型训练数据被AI输出污染的开发者来说，算是个稀缺资源。目前可以免费下载每个新闻组层级500...

#Fine-tuning#OwnerByDane#Gemma#Hugging Face

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

一套1031亿token的纯人类语料，1980-2013年Usenet帖子，零AI污染，对想避开合成数据陷阱的团队是稀缺货。但正文没披露去重和过滤细节，这点先别太激动。

锐评

OwnerByDane放出的这套Usenet语料，核心卖点就一个：干净。1031亿token、4.08亿条帖子，时间跨度从1980年到2013年，正好卡在互联网大规模普及和AI生成内容泛滥之前。对现在被合成数据污染搞怕了的模型训练者来说，这种“纯人类产出”的文本确实有吸引力，尤其适合做基座模型的预训练或者风格微调。目前每个新闻组层级可以免费下载500条帖子的样本，完整语料需要单独谈授权。但发布帖里没讲清楚几个关键点：去重做到什么程度、有没有过滤掉垃圾广告和重复灌水帖、不同新闻组之间的质量差异有多大。Usenet本身鱼龙混杂，有些组讨论质量很高，有些就是纯吵架，不处理干净直接喂给模型，效果会打折扣。另外1031亿token放在今天不算特别大，大概相当于几套高质量书籍语料的量级，能起多大作用还得看具体怎么用。如果后续能补上数据处理流程的说明，这套语料的价值会更明确。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

20:10

61d ago

FEATURED彭博科技· rssEN20:10 · 05·27

Snowflake 与 AWS 签署六十亿美元多年合作协议

Snowflake 盘后股价飙升近 30%，原因是公司上调了全年销售预期，并宣布与亚马逊云服务（AWS）签署了一份价值 60 亿美元、为期多年的合作协议。这笔交易不仅包括使用 AWS 的云基础设施，还会用上亚马逊自研的 AI 芯片。正文被 Bloomberg 的付费墙挡住了，没披露具体是哪些芯片、以及这笔大单对 Snowflake 毛利率的影响。

#Inference-opt#Snowflake#Amazon#Partnership

精选理由

精选 · 重要度 83 · 吸引力 + 知识量 + 共鸣

一句话点评

Snowflake 跟 AWS 签了五年 60 亿美元的芯片大单，主要为了用亚马逊自家的 AI 训练芯片，摆明了想减少对英伟达的依赖。

锐评

这笔 60 亿美元、为期五年的合同，核心是 Snowflake 要大规模采购 AWS 的 Trainium 芯片来跑 AI 任务。对 Snowflake 来说，这是在算力成本上的一次豪赌——用亚马逊自研芯片替代昂贵的英伟达 GPU，如果能跑通，长期能省下不少钱。对 AWS 而言，这是其自研 AI 芯片拿下的最大客户背书，直接向市场证明 Trainium 不只是内部用的玩具。不过，文章没披露这 60 亿是纯增量投入，还是把原本就要花在 AWS 上的云服务费重新打包算进去了。也没提 Trainium 在实际大规模训练任务中的性能对比数据。如果只是把现有预算换了个名头，那对双方的实际利好就要打个折扣。另外，Snowflake 的客户最终会不会因为底层芯片切换而感受到推理速度或精度的变化，正文也没给出任何测试结果。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

83

SCORE

H1·K1·R1

20:06

61d ago

FEATURED彭博科技· rssEN20:06 · 05·27

Salesforce下季度营收指引低于预期，市场担忧AI冲击软件需求

Salesforce 发布了当前季度的营收指引，低于分析师预期。正文没披露具体数字和差距有多大，但市场反应是股价承压，核心担忧是 AI 正在替代传统 CRM 软件的功能——客户可能不再需要买那么多席位，而是让 AI 代理直接干活。这对所有靠坐席收费的 SaaS 公司都是一个信号：AI 不是增值功能，而是业务模式的潜在颠覆者。

#Salesforce#Commentary

精选理由

精选 · 重要度 72 · 吸引力 + 共鸣

一句话点评

Salesforce 新季度营收指引低于预期，股价承压。核心担忧不是增速放缓，而是 AI 代理可能替代传统 CRM 席位——客户不再需要买那么多账号，让 AI 直接干活。这对所有按坐席收费的 SaaS 公司都是信号：AI 不是增值功能，而是业务模式的潜在颠覆者。正文没披露具体营收数字和差距，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

72

SCORE

H1·K0·R1

20:00

61d ago

Hacker News 首页· rssEN20:00 · 05·27

YouTube 将自动给 AI 生成的视频打标签

YouTube 宣布要自动识别并标记 AI 生成的视频，但正文没披露检测机制和上线时间。目前这条消息在 Hacker News 上只有 11 分和 2 条评论，热度不高，说明社区可能还在观望。自动打标签是好事，但检测准不准、会不会误伤普通剪辑视频，这些关键信息都还没出来，先别太激动。

#Multimodal#Vision#Safety#YouTube

一句话点评

YouTube 要自动给 AI 生成的视频打标签，但检测机制和上线时间都没说。目前 HN 上只有 11 分、2 条评论，社区还在观望。自动标注是好事，但准不准、会不会误伤普通剪辑，这些关键信息都缺，先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

68

SCORE

H1·K0·R1

19:39

61d ago

TechCrunch AI· rssEN19:39 · 05·27

薪酬公司 Remote 靠 AI 把人效提了 50%，没加一个人

Remote 是一家做全球薪酬和合规的初创公司，总部在阿姆斯特丹。他们最近宣布年经常性收入（ARR）突破 3 亿美元，并且现金流转正，关键原因是人均营收涨了 50%，但没招新人。CEO 把这归功于 AI 工具——比如用 AI 自动处理合同、税务表单这些重复劳动，让现有员工干更多活。3 亿美元 ARR 说明产品已经跑通，人效提升 50% 是个挺实在的数字...

#Remote#Product update

一句话点评

Remote 靠 AI 把人均营收拉高 50%，ARR 破 3 亿美元且现金流转正，数字挺实在。但正文没披露具体用了哪些 AI 工具、部署成本多高，也没说员工数到底多少，人效提升的基数不清楚。这点先别太激动——SaaS 公司人效提升有天花板，而且 Remote 做的是薪酬合规这类流程标准化高的业务，AI 替换重复劳动相对容易，换到复杂场景不一定能复制。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

19:26

61d ago

FEATUREDr/LocalLLaMA· rssEN19:26 · 05·27

一台 300 美元笔记本跑 Qwen 3.5 35B 模型，推理速度跑到每秒 10.33 个 token

一位 Reddit 用户在一台 300 美元买的联想 Ideapad Slim 3i 上，用纯 CPU 跑 Qwen 3.5 35B 模型（Q4_K_S 量化版），推理速度达到了每秒 10.33 个 token。这台机器是 i3-1215U 处理器，板载 8GB 内存加一条 32GB DDR4 扩展内存。能跑出这个速度，主要靠几个操作：用 ik_lla...

#Inference-opt#Qwen#Lenovo#Claude

精选理由

精选 · 重要度 73 · 吸引力 + 知识量 + 共鸣

一句话点评

300美元笔记本跑35B模型到10.33 t/s，靠的是MoE架构只激活3B参数，不是真跑35B。

锐评

这条帖子的亮点是成本控制：一台300美元的联想笔记本，纯CPU推理，把Qwen 3.5 35B模型跑到了每秒10.33个token。但先别激动，这个35B是MoE（混合专家）架构，实际干活时只激活大约3B参数，所以本质上是在跑一个小得多的模型，速度自然快。作者自己也说了，换成Gemma 4 26B（激活参数多25%），速度就掉到3 t/s左右。优化手段挺实在：用ik_llama.cpp这个推理引擎，把任务钉在两个性能核上，开了MTP投机解码（一次猜多个token），KV缓存也做了Q8_0量化。温度飙到90度但没降频，作者猜测ik_llama的CPU效率比原版llama.cpp好，不过没做严格对照，这点存疑。正文没披露输出质量有没有因为投机解码或量化打折，也没测长上下文下的速度衰减。另外，内存是8GB板载加32GB扩展的非对称双通道，对带宽的影响也没量化。如果未来真能通过刷BIOS调内存时序和换DDR5再提20%速度，那这台机器的性价比确实能打，但目前还缺可复现的验证。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

73

SCORE

H1·K1·R1

19:23

61d ago

● P1AI HOT 精选· aihot-apiZH19:23 · 05·27

Cognition 拿了 10 亿美元融资，估值冲到 260 亿，自称全球最大独立智能体实验室

Cognition 宣布完成超 10 亿美元融资，估值 260 亿美元，领投方包括 Lux Capital 和 General Catalyst。公司说今年企业用量涨了 10 倍以上，年化收入做到 4.92 亿美元。他们两年前推出的 Devin 定位是第一个 AI 软件工程师，这次还强调自己在编码智能体和代码审查上领先，Peter Thiel 也投了重...

#Agent#Code#Cognition#Lux Capital

精选理由

精选 · 重要度 88 · 吸引力 + 知识量 + 共鸣

一句话点评

Devin 的公司拿了 10 亿美元，估值 260 亿，年收入近 5 亿。数字很大，但正文没披露利润和续费率，这点先别太激动。

锐评

Cognition 这轮融资把估值推到了 260 亿美元，年化收入做到 4.92 亿美元，企业用量今年涨了 10 倍以上。单看这几个数字，增长确实猛。但正文只给了收入，没提成本结构和客户留存率——做编码智能体的公司，推理成本通常不低，如果续费率跟不上，高收入也可能对应高亏损。他们强调自己是“首个 AI 软件工程师”和“顶级代码审查”，但没给出具体的基准测试结果或客户实际使用数据。Devin 推出两年了，市场上同类产品已经不少，领先优势到底有多大，光靠融资额和收入增速还看不出来。Peter Thiel 重仓参与是个信号，但投资逻辑不等于产品逻辑。还缺的信息：付费客户数、平均合同金额、Devin 在真实项目里的任务完成率。这些才是判断 260 亿估值是否合理的关键。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

88

SCORE

H1·K1·R1

18:44

62d ago

AI HOT 精选· aihot-apiZH18:44 · 05·27

Midjourney 网页版更新：语音对话能记住你的图片提示和风格参考了

Midjourney 网页版改进了对话模式，现在支持文字和语音输入。开启语音会话后，模型能直接访问你之前设置的图片提示、风格参考、侧边栏设置和最近生成的任务——不用退出语音再手动调参数。图片提示现在可以从工具栏和侧边栏直接添加，而且提交语音时图片会保留在工具栏里，直到你手动移除。新增了一个“Rerun as HD”按钮，可以把之前用标准清晰度生成的 V...

#Multimodal#Audio#Vision#Midjourney

一句话点评

Midjourney 网页版语音模式现在能记住你之前设的图片提示、风格参考和侧边栏设置，不用退出语音再调参数了。新增的“Rerun as HD”按钮可以把之前标准清晰度的 V8.1 图一键转高清。小改进不少，比如搜索对无订阅用户开放、上传限制明确到 20MB。整体是体验优化，没有新模型或能力突破。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

64

SCORE

H1·K1·R0

18:39

62d ago

TechCrunch AI· rssEN18:39 · 05·27

你的 SEO 策略是为一个已经不存在的搜索引擎优化的

Google I/O 确认 AI 生成的答案现在是搜索的核心，但大多数品牌几乎看不到 AI 如何向客户描述自己。对于花了多年时间围绕 10 个蓝色链接（传统搜索结果列表）建立策略的人来说，规则已经大变。播客嘉宾提到，AI 引荐的转化率比传统自然搜索高 400%，但正文没披露具体监测品牌在 AI 中形象的方法、流量影响数字，或团队如何调整策略。ChatG...

#TechCrunch#Google#Commentary#Product update

一句话点评

Google I/O 确认 AI 回答已取代传统蓝色链接成为搜索核心，但品牌几乎看不到 AI 如何描述自己。播客嘉宾称 AI 引荐转化率比传统搜索高 400%，但正文没披露监测方法、流量影响数字或具体调整策略。标题很抓人，但信息缺口大，更像一个话题引子而非实操指南。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

18:32

62d ago

r/LocalLLaMA· rssEN18:32 · 05·27

Qwen3.6 从 Q4 到 Q6，本地写代码的体验从“凑合用”变成“接近付费 API”

Reddit 用户实测，Qwen3.6 从 Q4 量化升到 Q6 后，本地 coding agent 的生成质量明显提升，体感上已经接近付费 API。硬件是双 RTX 3090，温度压在 65°C 以下，用 MTP 推理能达到每秒 20–50 token。不过帖子没披露具体 benchmark 或任务集，这个“接近付费 API”的判断更多是主观感受，不...

#Agent#Code#Inference-opt#Qwen

一句话点评

Qwen3.6 从 Q4 升到 Q6 量化，本地 coding agent 质量体感接近付费 API。双 RTX 3090 跑 MTP 推理 20–50 token/s，温度 65°C 以下。但这是 Reddit 用户主观感受，没披露 benchmark 或任务集，可信度打折。量化提升确实存在，但“接近付费 API”缺验证。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

18:29

62d ago

FEATUREDAI HOT 精选· aihot-apiZH18:29 · 05·27

OpenAI 产品现在能直连你内网的 MCP 服务器了

OpenAI 给 ChatGPT、Codex 和 Responses API 加了个能力：可以走纯出站 HTTPS 去调你团队放在内网的 MCP 服务器。服务器不用暴露到公网，模型这边只往外发请求，不接收入站连接。正文没提延迟和鉴权细节，实际部署前最好先测一下链路稳定性。

#Tools#Agent#OpenAI#Product update

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenAI 让模型能直连你内网的 MCP 服务器了，不用把服务暴露到公网。但正文没提延迟和鉴权，实际用之前最好先测一下。

锐评

OpenAI 给 ChatGPT、Codex 和 Responses API 加了一个实用能力：模型可以主动往外发 HTTPS 请求，去调你部署在私有网络里的 MCP 服务器。MCP 服务器全程不用暴露到公网，模型这边只做纯出站连接，不接收入站流量，网络层面确实更安全。这个设计解决了一个很实际的痛点——以前想让模型调用内部工具或数据，要么把服务开到公网，要么搭复杂的代理，现在直接走出站隧道就行。但公告里没写清楚几个关键点：出站连接建立后的延迟表现怎么样、鉴权机制是走 token 还是证书、断连重试策略是什么。这些在生产环境里比“能不能连”更重要。另外，只支持纯出站 HTTPS 意味着服务器端不能主动推消息给模型，双向实时交互的场景暂时覆盖不到。如果你的 MCP 服务器本身依赖长连接或需要服务端推送，这个方案就不太适用。建议先在非关键链路跑几天，看看稳定性和超时表现再往正式流程里放。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

18:14

62d ago

r/LocalLLaMA· rssEN18:14 · 05·27

Reddit 老哥用墙插风扇和旋钮，拼了一台多 Tesla 本地 AI 服务器

Reddit 用户 MackThax 晒了一台多 Tesla 显卡的本地 AI 服务器，折腾了几个月终于跑起来了。散热方案很硬核：风扇直接插墙插，靠一个旋钮手动调转速。正文没披露具体用了多少张 Tesla、什么型号、跑什么模型、推理速度多少，所以性能没法判断。但至少证明了一件事：只要肯动手，Tesla 卡也能凑合着用，成本可能比买正经服务器低不少。

#Inference-opt#MackThax#Reddit#Tesla

一句话点评

Reddit 用户 MackThax 晒了一台用多张 Tesla 显卡拼起来的本地 AI 服务器，散热方案很硬核：风扇直接插墙插，靠旋钮手动调转速。折腾了几个月终于跑起来了，但正文没披露具体用了多少张 Tesla、什么型号、跑什么模型、推理速度多少，所以性能没法判断。至少证明了一件事：只要肯动手，Tesla 卡也能凑合着用，成本可能比买正经服务器低不少。短评：硬核省钱方案，但性能未知，别...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

45

SCORE

H1·K0·R1

18:06

62d ago

FEATUREDAI HOT 精选· aihot-apiZH18:06 · 05·27

Anthropic 发布 AI 智能体零信任安全框架

Anthropic 发了篇博客，讲企业里用自主 AI 智能体（能自己调用工具、读写记忆的模型）该怎么搞安全。核心判断是：前沿模型把漏洞利用的时间从几个月压到了几小时，老一套安全流程跟不上。文章给了一套三层零信任架构，把智能体拆成身份层、工具层和记忆层分别做权限最小化，还列了八个阶段的落地步骤。威胁模型里重点提了提示注入、工具投毒和记忆投毒这三种攻击方式...

#Agent#Tools#Memory#Anthropic

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

Anthropic 自己下场写安全框架了。核心就一句话：前沿模型把漏洞利用时间从几个月压到几小时，老一套安全流程跟不上。框架本身是三层零信任架构，把智能体拆成身份、工具、记忆分别做权限最小化，思路不新但落地步骤写得细。不过这是厂商博客，不是第三方审计报告，实际效果还得看企业自己踩坑。

锐评

这篇博客最值得看的是威胁模型里的时间压缩判断：以前攻击者从发现漏洞到利用可能要几个月，现在前沿模型几小时就能搞定。这个数字说明，如果你让一个能自己调用工具、读写记忆的模型进业务流程干活，传统的定期审计和事后补丁基本等于裸奔。 Anthropic 给的方案是把智能体拆成三层——身份层管谁能用、工具层管能碰什么系统、记忆层管能记住什么——每层都做权限最小化。这跟传统零信任的思路一致，但落地到 AI 智能体上多了几个坑：提示注入（有人往输入里塞恶意指令）、工具投毒（篡改模型调用的 API 返回结果）、记忆投毒（污染模型的长期记忆让它以后做错事）。博客列了八个阶段的落地步骤，从盘点资产到持续监控都有，算是给安全团队一个现成的 checklist。不过得打个折。这是 Anthropic 的官方博客，不是独立安全评估，没有第三方验证，也没有披露这套框架在他们自己产品里的实际部署效果和事故数据。另外，正文没提这套架构的性能开销——每层都做鉴权和隔离，延迟会增加多少、成本会涨多少，这些关键数字都缺。企业真要落地，得自己先在小范围跑一遍看看账划不划算。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

17:59

62d ago

AI HOT 精选· aihot-apiZH17:59 · 05·27

OpenCode 和 MiMo V2.5 限时免费，1M 上下文窗口

OpenCode 和 MiMo V2.5 现在限时免费开放，支持 1M 上下文窗口（一次能塞进整本小说或超长代码库），还带推理、文本和图像能力。不过正文没披露免费截止日期和使用限制，想薅羊毛得抓紧确认。

#Reasoning#Multimodal#OpenCode#MiMo

一句话点评

OpenCode 和 MiMo V2.5 限时免费，1M 上下文窗口能塞整本小说或超长代码库，还带推理、文本和图像能力。但正文没披露免费截止日期和使用限制，想薅羊毛得抓紧确认。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

69

SCORE

H1·K1·R1

17:58

62d ago

FEATUREDAI HOT 精选· aihot-apiZH17:58 · 05·27

Hao AI Lab 开源 FastVideo Dreamverse，一张 B200 显卡 7 秒跑出 30 秒 1080p 视频

这个工具用一张 NVIDIA B200 GPU 搭配 LTX-2 模型，把生成 30 秒 1080p 视频的时间压到了 7 秒，做到了实时出片。代码和博客都公开了，但正文没披露画面质量、一致性和复杂场景下的表现，实际效果得自己跑一遍才知道。

#Multimodal#Vision#Inference-opt#Hao AI Lab

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

7秒出30秒1080p视频，单卡B200跑LTX-2。速度很猛，但正文没给画质和一致性数据，先当技术演示看。

锐评

这个工具把视频生成拉到了实时级别，一张B200显卡跑LTX-2模型，30秒1080p视频只要7秒，比播放速度还快。对做实时互动、直播特效的人来说，这个延迟数字很有吸引力。代码和博客都公开了，可以直接复现。但兴奋之前得打几个折。正文完全没提画面质量、帧间一致性、复杂场景下的表现，也没给任何量化指标或对比基准。速度快不等于能用，如果画面抖、物体变形、细节糊，那7秒出片的意义就大打折扣。另外只测了B200这一种卡，其他硬件上的表现未知，部署成本对个人开发者不太友好。还缺的东西：不同分辨率下的延迟曲线、用户主观评分、与现有方案的画质对比。建议自己跑一遍看看实际效果，别光看7秒就下单买卡。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

17:42

62d ago

r/LocalLLaMA· rssEN17:42 · 05·27

260K参数的小模型跑在90年代CPU模拟器上，每秒吐2-4个字

开发者 MironV 把 Karpathy 的 stories260K 模型塞进了一个2008年的RTOS（实时操作系统）里，底层跑在 JavaScript 模拟的 Freescale ColdFire MCF5307 CPU 上——这芯片是90年代的东西。为了在这么老的硬件上推理，他用了 INT8 逐行量化、查表法算 RoPE（旋转位置编码）和快速反...

#Inference-opt#Code#MironV#Claude

一句话点评

有人把Karpathy的260K参数小模型塞进了一个模拟的90年代CPU里，跑在2008年的RTOS上，每秒只能生成2到4个token。这基本是行为艺术，证明模型可以小到在古董硬件上蠕动，但离实用差得远。正文没披露具体推理精度损失，也没说跑完整句子的耗时。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

69

SCORE

H1·K1·R1

17:39

62d ago

FEATUREDAI HOT 精选· aihot-apiZH17:39 · 05·27

Google Pay 更新：让 AI 代理替你跑支付流程，安卓端也能一键结账了

Google Pay 这次更新主要干了两件事：一是把支付系统开放给 AI 代理，二是把安卓和桌面端的结账体验做得更顺滑。先说 AI 这块，他们搞了个通用商业协议（UCP），你现有的商户号和支付后台不用动，就能让 AI 代理直接调用支付能力去完成交易。还发了个 MCP 服务器（公开预览版），相当于给开发用的 AI 助手配了个支付插件，能帮你查集成问题、分...

#Agent#Tools#Google Pay#Google

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

Google Pay 把支付后台开放给 AI 代理了，商户不用重做系统就能让 AI 直接调支付。但 MCP 服务器还在公开预览，别急着上生产。

锐评

这次更新核心是把支付能力拆成 AI 可调用的模块。通用商业协议（UCP）让商户现有的支付后台和商户号不用动，AI 代理就能直接发起交易，省掉重建支付逻辑的成本。同时发了个 MCP 服务器（公开预览版），相当于给开发用的 AI 助手配了个支付插件，能查集成问题、分析趋势、生成代码，目标是缩短从接入到第一笔交易的时间。安卓端补上了动态回调，支付按钮可以放到商品详情页或购物车页，用户填地址时实时算运费和总价，不用关掉支付弹窗就能完成授权和重试，理论上能提高转化率和授权成功率。WebView 支付也扩展到了社交应用，一次集成覆盖原生 App、移动网页、桌面端和社交平台。另外新增了卡片资金来源信号，返回信用卡、借记卡还是预付卡，商户可以据此在确认页加折扣或附加费。正文没给出任何性能数据或转化率提升的具体数字，也没说明 UCP 的安全模型和权限边界。MCP 服务器还在预览阶段，正式版要等今年晚些时候，稳定性未知。这些功能听起来省事，但实际落地效果还得看商户接入后的数据。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

17:33

62d ago

FEATUREDAI HOT 精选· aihot-apiZH17:33 · 05·27

黄仁勋带人看了英伟达在台湾的新园区，年投资额报 1500 亿美元

黄仁勋公开了英伟达在台湾的新园区。公司计划每年在台湾砸约 1500 亿美元，这个数字比一周前 AMD 宣布的 100 亿美元 AI 投资高了不止一个量级。正文没披露园区具体做什么、投资怎么分配，也没提产能或人员规模，所以这 1500 亿到底对应多少实际落地项目，我会先打个折看。

#Jensen Huang#Nvidia#AMD#Funding

精选理由

精选 · 重要度 73 · 吸引力 + 知识量 + 共鸣

一句话点评

1500亿这个数比AMD一周前说的100亿高了15倍，但正文没讲钱花在哪、怎么花，先别太激动。

锐评

黄仁勋公开了英伟达在台湾的新园区，同时抛出一个数字：计划每年在台湾投资约1500亿美元。这个体量确实惊人，一周前AMD刚宣布要在台湾AI领域投超过100亿美元，英伟达直接把这个数乘了15倍。但正文只给了总额，没披露园区具体做什么、投资怎么分配、对应多少产能或人员规模。1500亿是包含基建、设备、研发还是供应链补贴，完全不清楚。如果是真的，这个级别的年投入会重塑台湾在AI硬件产业链的位置；但信息缺口太大，目前只能当个意向数字看。后续需要关注实际落地的项目清单和资金到位节奏，才能判断这1500亿有多少是实打实的。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

73

SCORE

H1·K1·R1

17:32

62d ago

FT · 科技· rssEN17:32 · 05·27

白宫要求测试前沿AI模型，避免“切尔诺贝利时刻”

FT报道，白宫下令对前沿AI模型进行测试，作为防止AI出现“切尔诺贝利时刻”的第一步。但正文没披露测试范围、执行机制、覆盖哪些模型、时间表，以及该命令是否对私营实验室有约束力（除了联邦采购条件）。

#Safety#Benchmarking#White House#Financial Times

一句话点评

白宫要求对前沿AI模型做安全测试，说是防“切尔诺贝利时刻”。但FT这篇正文被墙了，关键信息全缺：测什么、怎么测、谁测、什么时候测、私营公司是否必须执行。目前只知道有这个命令，执行力和范围都是问号。短评：方向对，但没细节等于没约束力。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

66

SCORE

H1·K0·R1

17:30

62d ago

AI HOT 精选· aihot-apiZH17:30 · 05·27

Replit 入选 Redpoint 2026 InfraRed 100 榜单

Replit 被风投 Redpoint 列入 2026 年 InfraRed 100 榜单，该榜单专门收录做 AI 运行基础设施的公司。往届入选者包括 Stripe、Snowflake 和 HashiCorp，说明这个名单偏重底层平台型公司。正文没披露具体评选标准，所以这份荣誉更多是品牌背书，不是技术能力排名。

#Code#Tools#Replit#Redpoint

一句话点评

Replit 入选 Redpoint 的 InfraRed 100 榜单，往届有 Stripe、Snowflake，说明这是份偏底层平台的风投背书，不是技术排名。正文没披露评选标准，所以这份荣誉更多是品牌认可，别太当技术实力认证。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

28

SCORE

H0·K0·R0

17:20

62d ago

FEATUREDHugging Face 博客· rssEN17:20 · 05·27

ITBench-AA 发布：最前沿的模型在企业 IT 运维任务上得分不到 50%

Artificial Analysis 和 IBM 搞了个新基准 ITBench-AA，专门考模型能不能像真人一样处理企业 IT 的活，第一波先考站点可靠性工程（SRE）任务。结果最厉害的 Claude Opus 4.7 也只拿了 47%，GPT-5.5 是 46%，所有顶尖模型都没过半。这个测试让模型在真实的 Kubernetes 环境里查日志、追依...

#Agent#Benchmarking#Artificial Analysis#IBM

精选理由

精选 · 重要度 74 · 吸引力 + 共鸣

一句话点评

顶尖模型在真实K8s排障任务里集体不及格，最高才47%。这个分低得真实，但正文没披露测试了多少任务、怎么打分，先别急着引用。

锐评

Artificial Analysis 和 IBM 搞了个新基准 ITBench-AA，让模型在真实的 Kubernetes 环境里当 SRE（站点可靠性工程师），查日志、追依赖、定位故障。结果挺惨：Claude Opus 4.7 只拿了 47%，GPT-5.5 是 46%，所有顶尖模型都没过半。这说明现在的模型离“能进企业 IT 流程干活”还有明显差距，不是接个 API 就能上岗。不过这篇博客缺了几个关键信息：没写总共测了多少个任务、样本量多大，也没说评分是纯自动检查还是有人工复核。如果任务量很小，或者评分标准很主观，那 47% 这个数字就得打折。另外，测试用的是哪个版本的 Kubernetes、故障场景有多复杂，正文也没交代。这些缺口让结果只能当个趋势参考，不能直接拿来比模型好坏。还缺一个对比：人类 SRE 工程师在同样任务上能拿多少分？没有这个基线，光说模型不及格，我们不知道这个及格线到底有多难。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

74

SCORE

H1·K0·R1

17:08

62d ago

r/LocalLLaMA· rssEN17:08 · 05·27

Qwen3.6 35B-A3B 跑通了 FoodTruck Bench，但分数和测试条件都没说

Reddit 上有人发帖说 Qwen3.6 35B-A3B 完成了 FoodTruck Bench 测试。但正文只给了一个链接，点进去还被 Reddit 屏蔽了，看不到具体分数、测试条件或复现方法。所以目前只能确认模型跑通了这项测试，但跑得怎么样、用了什么设置、是不是有水分，一概不知。

#Benchmarking#Qwen#Reddit#Benchmark

一句话点评

Qwen3.6 35B-A3B 跑通了 FoodTruck Bench，但正文只给了一个被屏蔽的链接，分数、测试条件、复现方法全没披露。目前只能确认模型能跑，但跑得好不好、有没有水分，一概不知。短评：跑通不等于跑好，缺分数和设置，先别激动。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

42

SCORE

H1·K0·R0

16:42

62d ago

FT · 科技· rssEN16:42 · 05·27

欧盟推“技术主权”战略，想减少对美国依赖

欧盟正在起草一份“技术主权”战略，核心是从过去盯着监管大科技公司，转向主动扶持欧洲本土服务，减少对美国技术的依赖。正文没有披露具体落地时间表、预算金额或采购目标，所以目前更像一个政策方向，不是可执行的计划。对AI从业者来说，如果欧洲真的推自己的云、模型或数据基础设施，未来在合规、部署和采购上可能会有新的选择或壁垒，但这点先别太激动，等预算和细则出来再说。

#EU#Big Tech#Policy

一句话点评

欧盟从“管大公司”转向“扶欧洲自己人”，起草了一份技术主权战略。正文没披露预算、时间表或采购目标，目前只是个方向。对AI从业者来说，如果真推欧洲云和模型，未来合规和部署会有新变量，但这点先别太激动，等钱和细则出来再说。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H0·K1·R1

16:38

62d ago

FEATUREDAI HOT 精选· aihot-apiZH16:38 · 05·27

Anthropic 和 OpenAI 把编程助手从包月套餐改成按量收费，我觉得他们终于找到赚钱的感觉了

Simon Willison 发现，从 2026 年 4 月起，Anthropic 和 OpenAI 悄悄把企业版编程助手（Claude Code/Cowork 和 Codex）的收费方式从固定座位费改成了按 API 调用量计费，跟直接买 token 一个价。他自己一个月用这些工具烧掉的 token 折合 2180 美元，但个人套餐只要 200 美元，...

#Agent#Code#Anthropic#OpenAI

精选理由

精选 · 重要度 80 · 吸引力 + 知识量 + 共鸣

一句话点评

两家公司悄悄把企业编程助手的收费从固定座位费改成了按 API 调用量计费，个人套餐 200 美元能烧掉 2180 美元的 token，但企业客户现在要按原价买单了。

锐评

Simon Willison 用自己的账单算了一笔账：他一个月用 Claude Code 和 Codex 烧掉的 token 折合 2180 美元，但个人套餐只花了 200 美元。他原本以为企业客户也能拿到类似的折扣，结果发现完全不是这么回事。Anthropic 的企业版从去年 11 月起就改成了每人每月 20 美元座位费加 API 用量计费，OpenAI 也在今年 4 月跟进了，Codex 的收费直接和 API token 价格对齐。这个时间点很巧：4 月两家都发了新模型，API 价格还涨了——GPT-5.5 比前代贵一倍，Opus 4.7 贵了约 40%。企业客户签的通常是年单，等于被锁在了涨价后的价格上。Willison 的判断是，这不是单纯的涨价，而是产品找到了市场契合点。编程助手这类产品，用户真的愿意为效果付费，公司也就敢按用量收钱了。不过文章没披露企业客户的实际留存率和续约情况，也没说有多少客户在收到新账单后选择砍用量或换方案。光靠个人用户的账单推算企业接受度，说服力还差一点。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

80

SCORE

H1·K1·R1

16:35

62d ago

r/LocalLLaMA· rssEN16:35 · 05·27

SWE-rebench 排行榜更新：GPT-5.5、Opus 4.7、Cursor、Kimi K2.6 等模型最新成绩

SWE-rebench 更新了排行榜，新增了 110 个来自 2026 年 3 月、4 月和 5 月 GitHub PR 的 Python 任务。测试方式跟 SWE-bench 一样：模型先读 issue，然后改代码、跑测试，必须全部通过才算过关。这次榜单覆盖了 GPT-5.5、Opus 4.7、Cursor（Composer 2.5）和 Kimi K...

#Code#Benchmarking#SWE-rebench#GPT-5.5

一句话点评

SWE-rebench 更新了 110 个 2026 年 3-5 月的 GitHub PR 任务，测试模型读 issue、改代码、跑测试的能力。GPT-5.5、Opus 4.7、Cursor Composer 2.5 和 Kimi K2.6 都上榜了。但正文被 Reddit 屏蔽，具体得分和排名没披露。短评：新任务覆盖最近三个月，比老版更贴近实际开发，但没数据只能看个热闹。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

71

SCORE

H1·K1·R1

16:28

62d ago

FEATUREDHacker News 首页· rssEN16:28 · 05·27

谷歌推AI搜索后DuckDuckGo流量增长超25%

谷歌大力推广AI模式后，主打无AI的搜索引擎DuckDuckGo一周内访问量涨了28%。这个数字来自PC Gamer报道，但原文没交代流量统计口径、具体时间窗口和数据来源，所以先打个折看。不过趋势很直白：用户嘴上说喜欢AI，身体却在逃离AI搜索。

#DuckDuckGo#Google#Commentary

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

谷歌强推AI搜索后，DuckDuckGo安装量涨了30%，访问量涨了28%，用户用脚投票。

锐评

DuckDuckGo 的安装量涨了 30%，访问量涨了 28%，这两个数字直接对应谷歌在搜索结果里强推 AI 概览的时间点。TechCrunch 的标题用了“force-fed”这个词，说明部分用户对 AI 搜索的呈现方式有抵触，不是不要 AI，是不要被硬塞。DuckDuckGo 本身没做 AI 概览，它的增长更像是对谷歌产品决策的一次市场反馈。不过要打折看：正文是空的，我们只拿到了标题和增长百分比，不知道统计口径是周环比还是年同比，也不清楚用户留存和实际使用频次。增长 30% 听起来猛，但如果基数小，绝对值可能有限。另外，用户逃离谷歌后是不是真的满意 DuckDuckGo 的搜索结果，这里也没数据。还缺两块信息：一是谷歌 AI 搜索的用户满意度数据，二是 DuckDuckGo 这边的新增用户画像和后续行为。光看安装量，只能说明有人不爽，不能说明替代品就赢了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

82

SCORE

H1·K1·R1

16:12

62d ago

FEATUREDAI HOT 精选· aihot-apiZH16:12 · 05·27

Google 搜索产品 VP 聊 AI 原生搜索：新模式怎么跑、成本多高、出版商怎么办

Robby Stein 在 Google I/O 上谈了搜索正在从列链接转向直接给答案的 AI 原生模式。AI Mode 会把复杂问题拆成多轮搜索去查，背后跑在 Google 自己的 TPU 上，推理成本不低，但正文没给具体数字。搜索量没降反升，这点他提了但没展开数据。关于答案里引用哪些信息源和链接，有一套选择逻辑，但没细说权重。出版商最关心的流量问题...

#Agent#Reasoning#Tools#Google

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

Google 搜索要直接给答案了，但没公布推理一次要花多少钱，也没说出版商流量到底会掉多少。

锐评

这篇访谈确认了 Google 搜索正在从列链接转向 AI 直接生成答案，AI Mode 会把复杂问题拆成多轮搜索去查，背后跑在自家 TPU 上。Robby Stein 说搜索量没降反升，但正文没给具体数据，这点先别太激动——没数字就没法判断是整体蛋糕变大了，还是只是 Google 自己的统计口径变了。关于出版商最关心的流量问题，访谈只提到存在张力，但没披露任何流量影响评估或补偿机制。信息源和链接的选择逻辑也只说有套规则，权重怎么算、会不会偏向自家生态，正文都没展开。推理成本不低这个判断他提了，但没给单次查询的成本区间，也没说规模化后能压到多少。还缺几个关键信息：AI 回答的准确率有没有内部基准、什么类型的查询会触发 AI Mode、以及这套系统在非英语市场的表现。这些不补上，很难判断这是搜索体验升级还是流量分配格局的重写。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

16:08

62d ago

Hacker News 首页· rssEN16:08 · 05·27

PostHog 默认用你的数据训练 AI 模型

PostHog 宣布将用用户数据训练自研 AI 模型，默认开启（美国云实例），欧盟云实例默认关闭。目标是让会话回放分析更便宜、做合成用户测试、预测用户行为。数据会匿名化，不卖给第三方，训练由 PostHog 自己做。6 月 29 日才开始训练，用户可以在组织设置里随时关闭。CEO 说选默认开启是因为数据不够就训不出有用的模型。正文没披露数据保留时长、具...

#Fine-tuning#PostHog#Policy

一句话点评

PostHog 默认用你的数据训模型（美国云实例），欧盟默认关。目标是让会话回放分析更便宜、做合成用户测试、预测行为。数据匿名化，不卖第三方，6月29日才开训，可随时关。CEO 说默认开启是因为数据不够训不出有用模型。正文没披露数据保留时长、具体脱敏方法、模型架构和训练细节，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

16:02

62d ago

Product Hunt · AI· rssEN16:02 · 05·27

Quartz：一款完全在 Mac 本地跑 AI 的邮件客户端，主打专注

Quartz 今天在 Product Hunt 上线，是一个 Mac 邮件客户端，核心卖点是所有 AI 处理都在本地完成，邮件不会发给第三方 AI 服务。它能按重要性排序邮件，并随着使用学习你的偏好；回邮件时，它会模仿你的语气写草稿。底层用了 Google Gemma 4 和 Tauri 框架，免费。目前只确认支持 Gmail，其他邮箱服务没说。全本地...

#Quartz#Product Hunt#Google Gemma 4

一句话点评

Quartz 是一个 Mac 邮件客户端，所有 AI 处理都在本地完成，邮件不会发给第三方。它用 Google Gemma 4 跑在本地，能按重要性排序邮件、模仿你的语气写回信草稿，免费。关键信息：全本地处理，隐私有保障；底层是 Gemma 4，模型能力够用但不算顶级；目前只确认支持 Gmail，其他邮箱没说。短评：本地 AI 邮件客户端，隐私友好，但只支持 Gmail，生态窄。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

62

SCORE

H1·K1·R0

16:01

62d ago

AI HOT 精选· aihot-apiZH16:01 · 05·27

Grok编程智能体上线Kilo IDE，需付费订阅才能用

xAI把Grok编程智能体（grok-build-0.1）放到了Kilo IDE的扩展和命令行工具里，订阅SuperGrok或X Premium+就能用。说白了就是让Grok帮你写代码、改代码，直接在开发环境里干活。不过门槛不低——两个订阅都是付费档，免费用户暂时没戏。正文没披露具体支持哪些编程语言或任务类型，也没说效果多好，这点先别太激动。

#Agent#Code#Tools#xAI

一句话点评

xAI 把 Grok 编程智能体（grok-build-0.1）塞进了 Kilo IDE 的扩展和命令行，订阅 SuperGrok 或 X Premium+ 就能用。说白了就是让 Grok 帮你写代码、改代码，直接在开发环境里干活。不过门槛不低——两个订阅都是付费档，免费用户暂时没戏。正文没披露具体支持哪些编程语言或任务类型，也没说效果多好，这点先别太激动。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H0·K1·R1

16:00

62d ago

● P1TechCrunch AI· rssEN16:00 · 05·27

AI编程公司Cognition融资10亿美元估值达250亿

Cognition 就是那个做了 AI 程序员 Devin 的公司，这次拿了超过 10 亿美元，投前估值 250 亿美元，投后 260 亿。八个月前它刚以 102 亿估值融了 4 亿，估值翻了一倍多。领投方是 Lux Capital、General Catalyst 和 8VC，Founders Fund 等老股东也跟了。公司说现在年化收入跑到 4.9...

#Code#Cognition#Funding

精选理由

精选 · 重要度 100 · 吸引力 + 知识量 + 共鸣

一句话点评

Cognition 八个月估值翻倍到 250 亿美元，年化收入冲到 4.92 亿，但正文没披露利润和客户留存，这个估值先打个折看。

锐评

Cognition 又拿钱了，10 亿美元，投前估值 250 亿，投后 260 亿。八个月前它刚以 102 亿估值融了 4 亿，这轮直接翻了一倍多。领投方是 Lux Capital、General Catalyst 和 8VC，老股东 Founders Fund 等也跟了。公司说年化收入跑到了 4.92 亿美元，企业客户对 Devin 的使用量连续六个月环比涨 50%。客户名单里有奔驰、NASA、高盛这类大企业，说明产品确实在正经公司里用起来了，不只是开发者玩具。去年大家还担心模型厂（Anthropic 的 Claude Code、OpenAI 的 Codex）会吃掉独立 AI 编程工具的市场，但这轮融资至少说明顶级 VC 押注独立玩家还有空间。不过正文没提几个关键数字：毛利率、净留存率、客户平均合同额。4.92 亿是年化收入，不是实际到账，而且没披露烧钱速度。250 亿估值对应年化收入大概 50 倍，这个倍数在 SaaS 里算很高，得看它能不能持续保持 50% 的月环比增长。另外，它去年收了 Windsurf 的剩余部分，整合效果怎么样也没说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

15:55

62d ago

FEATUREDAI HOT 精选· aihot-apiZH15:55 · 05·27

Perplexity 开源 Unigram 分词器，CPU 占用降了五六倍

Perplexity 把自家重写的 Unigram 分词器开源了，放在 pplx-garden 仓库里。这个分词器主要解决一个实际问题：现在小型的重排序模型和嵌入模型在 GPU 上跑一次只要几毫秒，但 CPU 分词那一步反而成了拖后腿的环节。他们这次重构后，CPU 占用直接降了 5 到 6 倍，等于把分词这步的延迟砍掉一大截，让整体响应更快。正文没提具...

#Embedding#Inference-opt#Perplexity#Open source

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

Perplexity 开源了一个重写的分词器，把 CPU 占用砍了 5-6 倍，专门解决小模型在 GPU 上跑得快、但分词拖后腿的问题。

锐评

这条开源消息的实用价值很直接。现在很多重排序和嵌入模型在 GPU 上推理只要几毫秒，但文本进模型前得先在 CPU 上做分词，这一步反而成了延迟大头。Perplexity 重写了 Unigram 分词器，把 CPU 占用降了 5 到 6 倍，等于把管道里最慢的那段修了。代码放在 pplx-garden 仓库，可以直接拿去用。不过正文没披露具体是怎么改的，也没给基准测试的硬件环境和延迟数字。5-6 倍是 CPU 占用下降，不是端到端延迟下降，实际能省多少时间还得看你的模型和部署方式。另外只提了小型重排序和嵌入模型，对大模型的分词有没有同样效果，没说。我会先打个折：如果你们管线里分词确实是瓶颈，这个值得试；如果不是，就别指望它能救整体延迟。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

15:48

62d ago

AI HOT 精选· aihot-apiZH15:48 · 05·27

Claude Marketplace 新增五家合作伙伴，可用已有消费额度购买

Claude Marketplace 新上了五家第三方工具：augmentcode、boltdotnew、coderabbitai、Hebbia 和 Legora。它们的产品都基于 Claude 模型，而且你之前跟 Anthropic 签的消费承诺（比如预付费或最低消费）可以直接用来买这些服务，不用额外掏钱。正文没披露具体价格或额度折算方式，但对企业客...

#Code#Tools#Anthropic#augmentcode

一句话点评

Claude Marketplace 新增五家第三方工具，包括代码生成、前端搭建、代码审查等方向。最大卖点：企业之前跟 Anthropic 签的消费承诺（预付费或最低消费）可以直接用来买这些服务，不用额外掏钱。正文没披露具体价格或额度折算方式，但对企业客户来说，这相当于把已锁定的预算盘活了。短评：Anthropic 在学应用商店抽成模式，但对企业客户更友好——承诺的预算能买第三方工具，不用再...

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H0·K1·R1

15:47

62d ago

r/LocalLLaMA· rssEN15:47 · 05·27

ReAligned-Qwen3.5 发布：用奖励模型给 Qwen 去审查，六个尺寸从 0.8B 到 35B

Lazarus AI 和 Eric Hartford 放出了 ReAligned-Qwen3.5 系列，基于 Qwen3.5 做了 SFT+GRPO 微调，核心是用一个叫 ReAligned 的分类器做奖励信号，目标是减少模型拒绝回答、回避敏感话题和输出官方叙事框架的问题。一共六个尺寸，从 0.8B 到 35B-A3B，覆盖小到大的部署场景。正文没披露...

#Fine-tuning#Alignment#Lazarus AI#Eric Hartford

一句话点评

Lazarus AI 和 Eric Hartford 放出了 ReAligned-Qwen3.5 系列，基于 Qwen3.5 做了 SFT+GRPO 微调，核心是用一个叫 ReAligned 的分类器做奖励信号，目标是减少模型拒绝回答、回避敏感话题和输出官方叙事框架的问题。一共六个尺寸，从 0.8B 到 35B-A3B，覆盖小到大的部署场景。正文没披露训练数据量、评测基准和具体效果对比，所以...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

15:42

62d ago

FEATUREDr/LocalLLaMA· rssEN15:42 · 05·27

KV缓存量化对比测试：q5和q6性能被低估，q8/q4组合实际效果不佳

作者用BeeLlama.cpp在Qwen 3.6 27B上测了38种KV缓存量化组合，覆盖64k和128k上下文。核心发现：q5_0和q5_1作为KV缓存的中档选择被严重低估，精度和速度都平衡得不错；而社区里流行的q8_0配q4_*组合其实表现不佳——K缓存精度高但V缓存太差，整体不如对称的q6/q5方案。作者还建议，如果模型权重已经压到Q4/IQ4级...

#Inference-opt#Benchmarking#Qwen#BeeLlama.cpp

精选理由

精选 · 重要度 81 · 吸引力 + 知识量 + 共鸣

一句话点评

KV缓存别死磕q8了，q5和q6性价比高得多；q8配q4这种头重脚轻的组合实测效果很差，显存紧张时优先保均衡。

锐评

这篇来自Reddit的测试用Qwen 3.6 27B模型跑了38种KV缓存量化组合，结论很直接：q5和q6被严重低估了。数据上看，q5_0的KV缓存只用了34.4%的显存，但精度能达到bf16的99.72%，速度也没怎么掉。反观社区里流行的q8_0配q4_0组合，虽然K缓存精度高，但V缓存太弱，整体表现还不如均衡的q6_0配q5_0。测试还发现，给低比特模型（比如Q4）配满血bf16缓存是笔亏本买卖，两者抢同一块显存，不如把缓存也压一压，省出空间拉长上下文。作者给出了一个实用阶梯：显存富裕用q8_0/q6_0，想多挤点空间上q6_0/q5_0，显存紧张就q5_0/q5_0，q4_0/q4_0是实在没辙的选择。TurboQuant系列里只有turbo3_tcq在极限压缩时有点用，turbo4又慢又差。不过要注意，这只是一张3090上跑一个模型的结论，换其他模型架构或任务场景是否成立，正文没给交叉验证。另外KLD指标能反映分布差异，但和下游任务的实际表现有多大关联，这点也没展开说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

81

SCORE

H1·K1·R1

15:40

62d ago

FEATUREDThe Verge · AI· rssEN15:40 · 05·27

AI 公司砸钱想埋掉这个政客，结果反而让他出了名

OpenAI 和 Anthropic 这两家死对头，正通过各自的超级政治行动委员会（Super PAC）在纽约第 12 选区民主党初选中烧钱打仗。被集火的对象是候选人 Alex Bores，他因为提出过一份对 AI 公司不太友好的监管法案，从 2025 年底开始就遭到由 OpenAI、Palantir 和 a16z 高管资助的团体“引领未来”砸下数百万...

#Safety#OpenAI#Anthropic#Alex Bores

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenAI 和 Anthropic 这对死对头，在纽约一个选区初选里砸钱互殴，反而把被他们攻击的候选人 Alex Bores 炒出了名。

锐评

这件事最讽刺的地方在于：OpenAI 和 Anthropic 都想用钱影响谁来监管自己，结果钱花得越多，被他们集火的那个候选人知名度越高。被攻击的 Alex Bores 之前提过一份对 AI 公司不太友好的监管法案，从 2025 年底开始，由 OpenAI、Palantir 和 a16z 高管资助的超级政治行动委员会“引领未来”就砸了数百万美元反对他。现在 Anthropic 也加入战局，要在 6 月初选前再烧数百万。正文没披露双方具体花了多少钱、广告内容是什么，也没说 Bores 的民调到底涨了多少。这点先别太激动——知名度不等于选票，而且两家公司表面在互打，实际都在用超级 PAC 绕开直接捐款上限，本质上是在同一个选区里各扶一个代理人。还缺的关键信息是：Bores 那份法案到底写了什么让两家都紧张，以及选民是否真的因为 AI 公司的干预而改变投票倾向。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

74

SCORE

H1·K1·R1

15:38

62d ago

FT · 科技· rssEN15:38 · 05·27

数据中心房东 DigitalBridge 花 10 亿美元买下一家能源私募

DigitalBridge 以 10 亿美元收购了能源私募 ArcLight。这笔交易背后是华尔街公司正在组队找新电源——AI 数据中心太耗电了，得提前锁电。不过正文被付费墙挡住了，没披露交易结构、融资方式，也没说 ArcLight 手里具体有哪些电厂或管线资产。10 亿在基础设施并购里不算大数，但信号明确：数据中心运营商开始直接下场买能源团队，而不是...

#DigitalBridge#ArcLight#Funding#Partnership

一句话点评

数据中心运营商 DigitalBridge 花 10 亿美元买下能源私募 ArcLight，等于直接买了个电力团队来锁电。AI 太耗电，华尔街公司都在组队找电源，这笔收购信号很明确。但正文被付费墙挡住，没披露 ArcLight 手里具体有哪些电厂或管线资产，10 亿在基础设施并购里不算大数，具体能锁多少电、多快落地，还得看后续披露。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

15:00

62d ago

FT · 科技· rssEN15:00 · 05·27

OpenAI 基金会计划花 2.5 亿美元研究 AI 对经济的影响

OpenAI 的基金会宣布要拿出 2.5 亿美元，专门研究 AI 对经济的影响。这笔钱是它今年 3 月承诺的 12 个月内发放 10 亿美元的一部分。2.5 亿不是小数目，但正文没披露具体研究课题、哪些机构能拿钱、评审标准是什么，也没说钱什么时候到位。所以目前只能知道 OpenAI 在往这个方向砸钱，但具体怎么花、花在谁身上，信息还不够。

#OpenAI#Funding#Policy

一句话点评

OpenAI 基金会要砸 2.5 亿美元研究 AI 对经济的影响，钱不少，但具体研究什么、谁拿钱、怎么评、什么时候到账，正文全没提。目前只能当个方向信号看，别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

69

SCORE

H1·K1·R1

14:59

62d ago

AI HOT 精选· aihot-apiZH14:59 · 05·27

Krea 2 开放 API，能在 ComfyUI 和 Claude 里直接调用了

Krea 2 的 API 今天上线，支持在 fal 和 ComfyUI 上跑，也能通过 NousResearch 的 Hermes 智能体调用，还兼容 Claude、Codex 和 OpenClaw。正文没披露定价、调用配额和模型参数，所以实际成本和多平台稳定性还不清楚。如果你已经在用这些平台或智能体，可以省去自己搭管道的功夫。

#Agent#Tools#Krea#NousResearch

一句话点评

Krea 2 API 上线了，能在 fal 和 ComfyUI 上跑，也能通过 NousResearch 的 Hermes 智能体调用，还兼容 Claude、Codex 和 OpenClaw。正文没披露定价、调用配额和模型参数，所以实际成本和多平台稳定性还不清楚。如果你已经在用这些平台或智能体，可以省去自己搭管道的功夫。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H0·K1·R1

14:57

62d ago

r/LocalLLaMA· rssEN14:57 · 05·27

Hugging Face 员工用 Claude Code 扒出数据集族谱：Alpaca 类衍生了几百个版本

一位 Hugging Face 员工用 Claude Code 做了个数据集族谱浏览器，发现 Alpaca 风格的数据集衍生出了几百个变种。正文没披露一共分析了多少个数据集，所以这个“几百个”是绝对数还是比例还不清楚。工具本身是开源的，可以自己跑一遍看看你的数据集被谁改过。

#Tools#Code#Hugging Face#Claude Code

一句话点评

一个 Hugging Face 员工用 Claude Code 扒了数据集族谱，发现 Alpaca 风格的数据集衍生出几百个变种。工具开源，可以自己查你的数据集被谁改过。但正文没披露一共分析了多少数据集，所以“几百个”是绝对数还是比例不清楚。这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

69

SCORE

H1·K1·R1

14:54

62d ago

r/LocalLLaMA· rssEN14:54 · 05·27

H100 跑 30 人推理，选 llama.cpp 还是 vLLM？

一位用户打算用单张 H100（94GB 显存）搭推理服务，目标支持 30 个用户、实际并发 10–15，上下文窗口开到 131k–262k。正文没披露最终选了哪个框架，也没给 benchmark 数据，所以没法直接判断谁更快。不过这个场景的关键瓶颈是显存：超长上下文会吃掉大量显存，94GB 在 262k 窗口下可能只够塞一个模型加少量 batch，并发...

#Inference-opt#Code#Agent#Nvidia

一句话点评

单卡H100（94GB）撑30用户、262k上下文，显存是硬瓶颈。262k窗口下94GB可能只够塞一个模型加小batch，并发10-15都悬。正文没给benchmark，选llama.cpp还是vLLM只能猜：前者显存省但吞吐低，后者吞吐高但吃显存。建议先压测显存占用，别直接上生产。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

45

SCORE

H1·K0·R1

14:18

62d ago

Hacker News 首页· rssEN14:18 · 05·27

我做了一个紧急求助页，家人出事时能自动发短信和定位

一个开发者因为记不住紧急号码，又担心手机被抢（巴西常见）、没电或摔坏，做了个简单的网页：点击后自动用 LLM 把求助内容总结成短信，连同 GPS 定位、IP 地址和完整消息一起发给预设的联系人（可以多个）。代码已开源。目前只有 8 个点赞和 11 条评论，验证还比较弱，但思路很实用——相当于一个“一键 SOS + 位置共享”的轻量版。正文没披露 LLM...

#Tools#Hacker News#GitHub#Open source

一句话点评

一个巴西开发者因为记不住紧急号码、怕手机被抢或没电，做了个一键 SOS 网页：点击后 LLM 把求助内容总结成短信，连同 GPS 和 IP 发给预设联系人。代码已开源。目前只有 8 个点赞和 11 条评论，验证很弱，但思路实用——相当于轻量版“一键求救+位置共享”。正文没披露 LLM 用的什么模型、短信走哪家 API、是否支持离线，这些是落地关键。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

48

SCORE

H1·K1·R0

更多

✕

频道

热点聚合每日 AI 日报全部播客·视频 AX 严选 X 监控收藏信源邮件订阅 Agent 接入

后台

用量系统订阅管理精选策略策略迭代用户