全部 · 2026-06-07

▸ 50 items · updated 3m ago

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 2573 26105 27120 28142 29116 3064 3162

2026年6月

一二三四五六日

1150 2157 3132 4117 5127 669 773 8141 9135 1084 1196 1288 1346 1434 1570 1682 1775 1886 1955 2027 2120 2274 2374 2468 2564 2640 2724 2837 2956 3083

2026年7月

一二三四五六日

156 271 347 421 527 664 758 865 975 1050 1134 1228 1345 1484 1582 1683 1745 1818 1938 2051 2170 2265 2340 24 25 26 27 28293031

2026-06-07 · 星期日2026年6月7日

23:26

50d ago

FEATUREDAI HOT 精选· aihot-apiZH23:26 · 06·07

英伟达和 SK 海力士签了多年协议，要一起设计下一代 AI 内存芯片

两家公司签了一份多年合作协议，打算从设计阶段就联手搞下一代 AI 用的内存芯片。目前公开的信息里没提具体产品规格、什么时候量产，也没说涉及多少资金。

#Inference-opt#Nvidia#SK Hynix#Partnership

精选理由

精选 · 重要度 73 · 吸引力 + 共鸣

一句话点评

Nvidia 和 SK Hynix 要从设计阶段就绑在一起搞下一代 AI 内存，但正文没披露具体产品、量产时间和金额，先当个意向书看。

锐评

这条消息的核心是两家公司把合作往前挪了一步：以前是 SK Hynix 照着 Nvidia 的需求做内存，现在变成从芯片设计阶段就一起搞。对 AI 从业者来说，这主要影响的是未来 GPU 的显存带宽和能效——内存墙一直是推理和训练的大瓶颈。但 Bloomberg 这篇报道的信息量很薄。正文没写具体在开发什么规格的产品，是 HBM4 还是更下一代，也没提什么时候能量产、双方各自投入多少资源。唯一能确定的是这是一份“多年协议”，说明不是一次性的项目合作。如果是真的，这种深度绑定对 Nvidia 意味着能更早锁定先进内存供应，对 SK Hynix 则是绑定了最大的买家。但反过来看，这种排他性也可能让其他 GPU 厂商和云厂商更难拿到同等水平的内存。现在还缺产品路线图、技术指标和财务条款，等有更多细节再判断实际影响不迟。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

73

SCORE

H1·K0·R1

23:26

50d ago

彭博科技· rssEN23:26 · 06·07

英伟达与SK海力士签多年协议，联合开发下一代AI内存芯片

英伟达和SK海力士签了一份多年合作协议，要一起设计未来几代的AI内存芯片。正文没披露具体芯片规格、量产时间或财务条款，所以暂时不知道是HBM4还是更下一代，也不清楚双方投了多少钱。对AI从业者来说，这条消息的信号是：英伟达在提前锁定高端内存产能，SK海力士则拿到了一个长期需求保障。但具体能带来多少性能提升或成本下降，还得等更多细节。

#Inference-opt#Nvidia#SK Hynix#Samsung Electronics

一句话点评

英伟达和SK海力士签了多年协议，联合设计下一代AI内存芯片。信号很明确：英伟达在提前锁高端HBM产能，SK海力士拿到长期订单保障。但正文没披露具体是HBM4还是更下一代，也没说量产时间和投了多少钱。对从业者来说，这条消息的战略方向比技术细节重要——先知道两家绑定了，但性能提升和成本下降幅度都未知。三星那边压力会更大。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

23:09

50d ago

彭博科技· rssEN23:09 · 06·07

Naver 要用英伟达的模型建数据中心，巩固韩国 AI 市场地位

Naver 跟英伟达达成合作，计划基于英伟达的模型建数据中心，目的是在韩国 AI 市场稳住领先位置。正文没披露具体投多少钱、用哪款模型、什么时候落地，所以规模和时间线都不清楚。对 Naver 来说，这步棋是押注英伟达的生态，但代价和排他性风险也没提。

#Inference-opt#Naver#Nvidia#Partnership

一句话点评

Naver 要用英伟达的模型建数据中心，想在韩国 AI 市场稳住领先。正文没披露投多少钱、用哪款模型、何时落地，规模和时间线都不清楚。对 Naver 来说，这是押注英伟达生态，但代价和排他性风险也没提。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

66

SCORE

H1·K1·R0

23:00

50d ago

NVIDIA 博客· rssEN23:00 · 06·07

英伟达与韩国斗山集团合作，把AI塞进机器人和工厂基建

英伟达和韩国斗山集团（Doosan）扩大了合作，涉及四家子公司：斗山机器人、斗山山猫（工程机械）、斗山能源（发电设备）和斗山电子材料（PCB基板）。合作方向是“物理AI”——也就是让AI直接控制机器人、工厂设备，而不是只跑在云端。斗山机器人会用英伟达的仿真平台训练机器人，斗山能源则帮英伟达建AI工厂的电力基础设施。正文没披露具体金额或落地时间表，所以目...

#Robotics#Agent#Inference-opt#NVIDIA

一句话点评

英伟达和韩国斗山集团签了个大合作，涉及四家子公司：机器人、工程机械、发电设备、PCB基板。核心是“物理AI”——让AI直接控制机器人和工厂设备，不只在云端跑。斗山机器人会用英伟达的仿真平台训练机器人，斗山能源帮建AI工厂的电力设施。但正文没披露具体金额或落地时间表，所以先别太激动。这更像一个生态占位：英伟达在拉拢传统工业巨头进自己的仿真和算力体系。对从业者来说，信号是“物理AI”的落地路径开...

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

58

SCORE

H0·K1·R0

23:00

50d ago

AI HOT 精选· aihot-apiZH23:00 · 06·07

英伟达与斗山集团合作，把物理AI塞进工厂机器人

英伟达和韩国斗山集团签了个大单，覆盖四个业务板块。斗山机器人会集成英伟达的Isaac Sim（机器人模拟器）、Cosmos（物理世界理解模型）、Jetson Thor（边缘计算硬件）等组件，用来做一套叫Agentic Robot OS的系统，让机器人自己干活，比如拆垛和抛光。说白了就是让机器人能看懂物理世界、自己规划动作，不用人一步步教。合作还涉及AI...

#Robotics#Agent#Multimodal#NVIDIA

一句话点评

英伟达和韩国斗山集团签了笔大单，把Isaac Sim（机器人模拟器）、Cosmos（物理世界理解模型）、Jetson Thor（边缘计算硬件）打包进斗山机器人的Agentic Robot OS，让机器人自己干拆垛、抛光这类活。说白了就是给机器人装了个能看懂物理世界、自己规划动作的脑子，不用人一步步教。合作还涉及AI工厂基础设施，但正文没披露具体金额和落地时间表。这点先别太激动，英伟达这类框架...

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

39

SCORE

H0·K1·R0

22:07

50d ago

r/LocalLLaMA· rssEN22:07 · 06·07

双3090跑Qwen3.6-27B，FP8版来了，官方说效果跟BF16差不多

club-3090项目给Qwen3.6-27B加上了实验性的FP8支持，两张RTX 3090就能跑。官方声称FP8版和BF16版表现几乎一样，但没贴具体跑分，这点先别太激动。FP8的好处是省显存、省带宽，双3090用户终于能塞下这个27B模型了，但实际推理速度和质量还得自己试。

#Inference-opt#club-3090#Qwen#NVIDIA

一句话点评

双3090终于能跑Qwen3.6-27B了，FP8省显存省带宽，官方说和BF16表现几乎一样但没贴跑分，这点先别太激动。实际推理速度和质量得自己试，正文也没披露具体延迟或精度对比。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

21:30

50d ago

彭博科技· rssEN21:30 · 06·07

英国首相要在就业中心推AI工具，帮人找工作

英国首相斯塔默宣布将在就业中心部署AI工具，帮求职者找工作，应对AI对岗位的冲击。正文没披露具体用什么模型、怎么用、什么时候上线、覆盖多少就业中心。目前只知道是政府层面的AI落地尝试，但细节太少，没法判断效果。

#Tools#Keir Starmer#UK Government#Policy

一句话点评

英国首相斯塔默要在就业中心部署AI工具帮人找工作，应对AI抢饭碗。但正文没披露用什么模型、怎么用、什么时候上线、覆盖多少就业中心。目前只是政府层面的AI落地尝试，细节太少，没法判断效果。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

21:09

50d ago

r/LocalLLaMA· rssEN21:09 · 06·07

llama-server 路由：把模型绑到一张卡上，它还是会在每张卡上占显存

一位用户在 2×3090、2×4060 Ti 和 1×5060 Ti 的机器上跑 llama-server 路由，发现即使把 Gemma 4B 模型固定到一张 GPU，它仍然会在每张卡上分配 CUDA 上下文，每张卡吃掉 120–256 MiB。结果前面跑了一个 262K 上下文的编码模型后，3090 只剩约 200 MiB 空闲，再加载这个 4B 模...

#Inference-opt#Tools#llama-server#Gemma

一句话点评

llama-server 路由模式下，即使把模型固定到一张 GPU，它仍会在每张卡上占 120–256 MiB 的 CUDA 上下文。用户 2×3090 跑完 262K 上下文编码模型后只剩 200 MiB，再加载 4B 模型直接 OOM。这不是 bug，是 llama-server 当前的设计——路由需要每张卡都预留上下文。正文没提是否有 flag 能关掉这个行为，实测可以试试 --no-...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

64

SCORE

H1·K1·R1

20:24

50d ago

Hacker News 首页· rssEN20:24 · 06·07

Nightwatch：开源只读AI运维，本地猫头鹰连中心大脑，离线聚类告警风暴

Nightwatch 是一个开源、只读的 AI SRE（站点可靠性工程师）工具。每个本地节点（叫“猫头鹰”）只向外连中心大脑，告警风暴在离线端聚类，调用远程大模型前会自动脱敏真实密钥、IP、主机名和路径。它能在你的生产系统上做根因分析，然后给出需要人工确认的修复建议。核心思路是“只读”+“本地优先”，降低安全风险。不过正文没披露具体支持哪些大模型后端、...

#Agent#Tools#Safety#Nightwatch

一句话点评

Nightwatch 是个开源 AI 运维工具，核心思路是“只读”+“本地优先”：每个节点（猫头鹰）只向外连中心大脑，告警风暴在本地聚类，调远程大模型前自动脱敏密钥、IP、路径。这能降低安全风险，适合不敢把生产数据直接丢给 API 的团队。但正文没披露支持哪些大模型后端、脱敏后根因分析准确率如何，也没说“只读”模式下能覆盖多少故障场景。如果只是聚类+脱敏+调 LLM 给建议，那门槛不高，关键...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

20:13

50d ago

r/LocalLLaMA· rssEN20:13 · 06·07

Qwen 3.6 27B 在 DeepSWE 上只跑了 1.79%，排名倒数第三

Qwen 3.6 27B 在 DeepSWE 评测上得了 1.79%，18 个模型里排第 18，只比 Haiku 4.5 和 Minimax M2.7 高。这次只跑了一次（one rollout），总共花了 70 小时，平均每个任务 32 分钟、输出 4.4 万 token。分数低可能跟只跑一次有关，多跑几次取平均通常会涨分，但正文没披露是否做了多次实验。

#Code#Reasoning#Benchmarking#Qwen

一句话点评

Qwen 3.6 27B 在 DeepSWE 上只得了 1.79%，20 个模型里排第 18，仅高于 Haiku 4.5 和 Minimax M2.7。这次只跑了一次（one rollout），花了 70 小时，平均每个任务 32 分钟、输出 4.4 万 token。分数低可能跟单次运行有关，多跑几次取平均通常会涨分，但正文没披露是否做了多次实验。短评：单次跑分垫底，多跑几次可能涨，但成本不低。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

19:24

50d ago

Product Hunt · AI· rssEN19:24 · 06·07

Conan：给 Claude Code 套上一个 Mac 原生实时仪表盘

Conan 是一个 macOS 原生应用，把 Claude Code 包进一个实时 HUD 里——每次提示、工具调用、技能和 token 消耗都实时显示。免费，今天在 Product Hunt 上线，目前 115 票排第 7。正文没提比直接在终端跑 Claude Code 快多少，也没说是否支持其他模型。

#Conan#Claude Code#Product Hunt

一句话点评

Conan 把 Claude Code 包进一个 macOS 原生 HUD 界面，每次提示、工具调用、token 消耗都实时显示，免费。目前 Product Hunt 115 票排第 7。正文没披露比终端跑快多少，也不支持其他模型。短评：给 Claude Code 加了个可视化仪表盘，免费但性能提升和模型兼容性都没说，先别太激动。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

62

SCORE

H1·K0·R0

18:54

51d ago

Hacker News 首页· rssEN18:54 · 06·07

如果大模型有人类特质，那《帝国时代2》也有

这篇论文用一个简单实验来戳破一个流行说法：很多人说大模型涌现了人类特质（比如道德感、理解语言），作者不直接反驳，而是训练了一个简单的神经网络去玩《帝国时代2》，然后指出——如果大模型那种表现算“人类特质”，那《帝国时代2》里的任何实体（比如一个农民）也能算。核心论点是：这些所谓的人类属性在经验上不唯一，换一个载体（乐高、波士顿地图）也可能出现类似行为。...

#Age of Empires II#Research release#Commentary

一句话点评

这篇论文用一个简单实验戳破“大模型有人类特质”的说法：训练一个神经网络玩《帝国时代2》，然后指出——如果LLM那种表现算“人类特质”，那游戏里的农民也能算。核心论点是这些属性在经验上不唯一，换一个载体（乐高、波士顿地图）也可能出现类似行为。作者没做新实验，只是逻辑推演，但论证挺有力。短评：用游戏农民类比LLM“人性”，逻辑有趣但没新实验。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

52

SCORE

H1·K0·R1

18:14

51d ago

FEATUREDAI HOT 精选· aihot-apiZH18:14 · 06·07

ChatGPT 要变成 AgentGPT 了

OpenAI 准备给 ChatGPT 做上线以来最大的一次改版，从聊天机器人转成一个能直接干活的 Agent 平台。它会整合自家的编程工具 Codex、图像生成，还会接入 Canva、Booking 这类第三方应用。高管放话说“聊天已死”，目标是做成跨平台的个人 AI 助手，以后甚至不用你手动输入提示词。改版预计几周内在网页和手机端上线。商业压力不小：...

#Agent#Code#Tools#OpenAI

精选理由

精选 · 重要度 84 · 吸引力 + 知识量 + 共鸣

一句话点评

ChatGPT 要从聊天框变成能直接帮你订酒店、写代码、做图的 Agent 平台了，但正文没提它怎么解决 Agent 执行任务时容易出错和卡住的老问题。

锐评

OpenAI 这次改版方向很明确：把 ChatGPT 从对话工具推成能调用外部应用干活的 Agent 平台。整合 Codex、Canva、Booking 这些，意味着它想直接嵌入用户的工作流和消费场景，不再只是问答。高管喊“聊天已死”，潜台词是交互方式要从人主动提问，转向模型预判需求、主动执行。几个数字值得留意：9 亿周活、5000 万付费用户、月收入 20 亿美元，盘子不小但还没盈利。企业客户贡献约四成收入，说明 to B 是当前现金牛，年底目标拉到五成，压力不小。Codex 桌面版周活超 500 万，证明编程场景是高频入口。不过，这条消息来自社交媒体爆料，不是官方公告，具体产品形态和上线时间都可能变。最关键的信息缺口是：Agent 执行链路的可靠性、权限边界和错误处理机制，正文一个字没提。Anthropic 估值冲到 9650 亿，OpenAI 刚融完 1220 亿，IPO 目标估值可能超万亿——在这种资本预期下，产品动作激进很正常，但 Agent 落地从来不是改个界面就能解决的。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

84

SCORE

H1·K1·R1

17:56

51d ago

TechCrunch AI· rssEN17:56 · 06·07

Notion 恢复了对 Anthropic 的访问

Notion 产品负责人说被转发量“惊到了”，但正文没披露中断持续了多久、影响了多少用户、以及怎么恢复的。

#Notion#Anthropic#Incident#Product update

一句话点评

Notion 恢复了 Anthropic 的访问，但正文只提了产品负责人被转发量“惊到”，没披露中断时长、影响用户数、恢复方式。信息缺口太大，没法判断严重性。短评：转发量高≠事故严重，缺关键数据。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

62

SCORE

H0·K0·R1

17:30

51d ago

彭博科技· rssEN17:30 · 06·07

Kevin O'Leary要在加拿大建最大数据中心，但当地人不买账

Kevin O'Leary支持的一家公司提议在阿尔伯塔省西北部建加拿大最大的数据中心，但正文没披露投资额、算力规模、时间表或具体的审批条件。目前只知道项目面临公众质疑，具体质疑点（电力、水、噪音还是地价）也没展开。信息缺口很大，暂时只能判断：项目还在早期舆论阶段，离落地还远。

#Kevin O’Leary#Policy

一句话点评

Kevin O'Leary（《创智赢家》明星）要在加拿大阿尔伯塔省建该国最大数据中心，但正文被墙，只拿到标题和摘要。目前信息缺口极大：投资额、算力规模、时间表、审批条件全没披露。公众质疑具体是电力、水、噪音还是地价也不清楚。项目还在早期舆论阶段，离落地还远。短评：明星背书+大项目画饼，但缺关键细节，先别当真。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

61

SCORE

H1·K0·R1

17:29

51d ago

r/LocalLLaMA· rssEN17:29 · 06·07

Gemma4 的 QAT 量化版翻车了：画棋盘 SVG 棋子乱飘，不如老版 Q4 稳

Reddit 用户实测了 Gemma4 26B A4B 的两个 QAT GGUF 版本（用 llama.cpp b9549），跑一个画棋盘 SVG 的 prompt。结果 QAT 版输出的棋子位置不稳定、乱飘，而老版 Q4_K_XL 在相同参数下多次运行都更可靠。QAT 本意是用量化感知训练减少精度损失，但这次实测效果反而更差。正文没披露具体量化参数和...

#Inference-opt#Vision#Benchmarking#Google

一句话点评

Reddit 用户实测 Gemma4 26B A4B 的 QAT 版（量化感知训练版），跑画棋盘 SVG 任务，结果棋子位置乱飘，不如老版 Q4_K_XL 稳定。QAT 本意是减少量化精度损失，但这次翻车了。正文没披露具体量化参数和测试次数，样本量小，结论先打个折。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

55

SCORE

H1·K1·R1

16:41

51d ago

AI HOT 精选· aihot-apiZH16:41 · 06·07

特朗普政府想搞个公共财富基金，让美国公民通过AI公司股权分红

据FT报道，特朗普政府正与OpenAI讨论一个公共财富基金方案：AI公司捐出少量股权，基金把收益通过账户或分红发给美国公民，而不是政府直接运营公司。这和特朗普去年对Intel的90亿美元直接持股不同。OpenAI之前提过类似概念，目的是让公民分享AI增长红利。政治背景是选民担心失业、数据中心成本和企业控制，而AI公司需要华盛顿在基建、采购和监管上帮忙。...

#OpenAI#Trump administration#Intel#Policy

一句话点评

特朗普政府想搞个公共财富基金，让AI公司捐点股权，收益分给美国公民，而不是政府直接管公司。这和去年直接投Intel 90亿美元不一样。OpenAI之前提过类似想法，目的是让普通人分享AI红利，背后是选民怕失业、怕数据中心成本高、怕企业控制一切。但正文没披露股权比例、分配机制、立法路径这些关键细节，离落地还远。短评：想法挺新，但细节全无，先别激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

69

SCORE

H1·K1·R1

16:25

51d ago

r/LocalLLaMA· rssEN16:25 · 06·07

用一句话控制3D虚拟人做动作，不用按钮

yuntiandeng 发了一个演示：输入一句话，模型就把这句话编译成一段浏览器里能跑的本地动作程序，支持循环、保持和并行轨道。相当于用自然语言代替了手动拖拽动画时间轴。正文没披露用了什么模型、延迟多高、能不能跑在消费级显卡上，所以实用性要打个问号。但思路挺直接——把语言指令拆成可执行的原子动作，而不是让模型直接生成骨骼动画，这样控制更精确、可调试。

#Agent#Code#Tools#yuntiandeng

一句话点评

一句话让3D角色动起来，不用拖时间轴。yuntiandeng的演示把自然语言编译成浏览器可执行的原子动作序列，支持循环、保持和并行。思路聪明：拆成可调试的指令块，比直接生成骨骼动画更可控。但正文没披露用了什么模型、延迟多高、能否跑在消费级显卡上，实用性要打个问号。短评：思路直接，但缺关键参数，先别太激动。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

68

SCORE

H1·K1·R0

16:23

51d ago

AI HOT 精选· aihot-apiZH16:23 · 06·07

OpenAI 还在搞那个“超级应用”，想把 ChatGPT 变成啥都能干的入口

OpenAI 计划在未来几周内推出改版 ChatGPT，目标是做成一个“超级应用”，里面塞进编程工具和 AI 智能体（让模型帮你干活）。一位 OpenAI 高管甚至说“聊天已死”，意思是纯对话模式不够用了，得靠 Codex 这类付费产品把免费用户转化成收入。公司想靠这个跟 Anthropic 抢企业客户，也为 IPO 前冲盈利。不过正文没披露具体功能范...

#Agent#Tools#OpenAI#Product update

一句话点评

OpenAI 高管说“聊天已死”，计划几周内把 ChatGPT 改造成超级应用，塞进编程工具 Codex 和 AI 智能体（让模型帮你干活）。目标很明确：靠付费产品把免费用户变现，跟 Anthropic 抢企业客户，为 IPO 冲盈利。但正文没披露具体功能范围、定价或上线时间，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

70

SCORE

H1·K0·R1

16:23

51d ago

TechCrunch AI· rssEN16:23 · 06·07

OpenAI 还在憋那个“超级应用”

一位 OpenAI 高管放话说“聊天已死”，暗示他们正在做的超级应用不会只是一个聊天框。但正文没披露产品形态、发布时间或具体功能，所以这点先别太激动——目前只知道他们还在做，但不知道做成什么样。

#Agent#Tools#OpenAI#Product update

一句话点评

OpenAI 高管放话“聊天已死”，暗示超级应用不只是聊天框。但正文没披露产品形态、发布时间或具体功能，这点先别太激动——目前只知道他们还在做，但不知道做成什么样。短评：标题唬人，正文没料，等产品出来再说。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

66

SCORE

H1·K0·R1

16:12

51d ago

r/LocalLLaMA· rssEN16:12 · 06·07

GMKtec EVO-X3 迷你主机：塞进 OCuLink、Wi-Fi 7 和双 PCIe 4.0，后续还有 192GB 内存的 Ryzen AI MAX...

GMKtec 的 EVO-X3 迷你主机在标题里列了一堆接口：OCuLink（外接显卡用）、Wi-Fi 7 和双 PCIe 4.0 插槽。硬件用的是 Ryzen AI MAX+ 495，但正文没披露价格和具体上市时间。后续会出一个 192GB 内存的版本，这个容量对本地跑大模型挺友好，但得等。

#Inference-opt#GMKtec#AMD#Reddit

一句话点评

GMKtec EVO-X3 迷你主机主打接口堆料：OCuLink（外接显卡）、Wi-Fi 7、双 PCIe 4.0 插槽，硬件用 Ryzen AI MAX+ 495。后续还有 192GB 内存版，本地跑大模型挺香，但价格和上市时间都没说。短评：接口全但价格未知，192GB 版值得等。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

15:31

51d ago

AI HOT 精选· aihot-apiZH15:31 · 06·07

AI 产出暴涨，但 GDP 没动：Gary Marcus 用一张图说清“产出繁荣，回报惨淡”

Gary Marcus 引用 FT 和华盛顿邮报的数据图指出：AI 确实让应用、书籍、音乐、论文的数量暴增，但销量、GDP、科学质量都没跟着涨。他管这叫“slop”（垃圾内容泛滥）。正文没披露具体图表数据、生产力指标或实测的 AI 影响，但核心判断很清楚——产出多不等于价值高，尤其 agentic coding 烧钱最狠，OpenAI 和 Anthro...

#Gary Marcus#John Burn-Murdoch#Financial Times#Commentary

一句话点评

Gary Marcus 引用 FT 和华盛顿邮报的数据图指出：AI 让应用、书籍、论文数量暴增，但销量、GDP、科学质量都没跟着涨。他管这叫“垃圾内容泛滥”。正文没披露具体图表数字或生产力指标，但核心判断很清楚——产出多不等于价值高。短评：数量暴涨不等于价值提升，Marcus 用数据图打脸“AI 生产力神话”，但缺具体数字支撑。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

15:13

51d ago

● P1r/LocalLLaMA· rssEN15:13 · 06·07

在消费级笔记本上成功运行Qwen3.6 35B-A3B大语言模型

一位 Reddit 用户分享了自己在笔记本上跑通 Qwen3.6 35B-A3B 的体验。他的机器是华硕 Zenbook Pro 14，配了 RTX 4060 8GB 显存和 64GB 内存。用 llama.cpp 加载 unsloth 的 IQ3_XXS 量化版模型，在 3.2 万 token 上下文时生成速度约 27 token/秒，拉到 25.6...

#Inference-opt#Code#Tools#Qwen

精选理由

精选 · 重要度 88 · 吸引力 + 知识量 + 共鸣

一句话点评

消费级笔记本跑通35B模型，8GB显存+32GB内存就能玩，但速度别抱太高期待。

锐评

这条消息的核心是：有人用一台普通游戏本（RTX 4060 8GB显存、32GB内存）成功跑起了Qwen3.6 35B-A3B模型。这个模型本身是35B参数的大模型，但用了MoE（混合专家）架构，实际激活的参数量只有3B左右，所以对硬件的要求比看上去低很多。发帖人提到一个有意思的点：开了推测解码（speculative decoding）之后，生成速度有明显提升。推测解码相当于让一个小模型先猜答案，大模型再批改，能省不少时间。不过正文被Reddit屏蔽了，具体每秒能生成多少个token、延迟多少、有没有量化、用了什么推理框架，这些关键细节都没披露。如果你手头正好有类似配置的笔记本，想本地跑一个能力还不错的模型，这个组合值得试试。但别指望它能像ChatGPT那样秒回，也别拿它当生产环境用——消费级硬件的散热和稳定性都是硬伤。另外，35B参数里只有3B在干活，意味着知识密度可能不如同级别的稠密模型，这点在复杂任务上要打个问号。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

88

SCORE

H1·K1·R1

15:03

51d ago

r/LocalLLaMA· rssEN15:03 · 06·07

MCP 服务器一多，启动时怎么管？

Reddit 用户 vazma 发现，在 openCode 里加载多个 MCP 服务器时，还没输入任何提示词，就已经消耗了大量 token 并污染了上下文窗口。他问社区有没有好办法，提到了三种思路：用代理统一管理、用中心枢纽调度、或者只在会话层按需懒加载。但正文没披露他自己具体用了哪种方案，也没给出实测数据。

#Agent#Tools#Reddit#openCode

一句话点评

MCP 服务器一启动就全加载，还没打字 token 先烧了一截，上下文也被污染。社区在聊三种解法：代理统一管、中心枢纽调度、会话层按需懒加载。但原帖没说自己用了哪套，也没给实测数据——这点先别太激动。懒加载最省 token，但延迟会高，正文没披露具体开销。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

14:16

51d ago

r/LocalLLaMA· rssEN14:16 · 06·07

start-llama：一个帮你管理 llama-server 配置的命令行小工具

Look_0ver_There 发了个叫 start-llama 的命令行工具，能让你更方便地启动 llama-server，支持多版本二进制文件、按模型单独配参数，还能在命令行里临时覆盖设置。正文没披露安装方式、许可证和具体支持哪些平台，想用的话得自己去 GitHub 仓库翻。

#Tools#Look_0ver_There#llama-server#start-llama

一句话点评

一个叫 start-llama 的命令行工具，帮你省去每次手动敲参数启动 llama-server 的麻烦。支持多版本二进制、按模型单独存配置，还能在命令行临时覆盖设置。对本地跑模型的人来说挺实用，但正文没披露安装方式、许可证和具体支持哪些平台，想用还得自己去 GitHub 翻。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

61

SCORE

H0·K1·R1

14:04

51d ago

彭博科技· rssEN14:04 · 06·07

AI 搜索正在把互联网吸进“死亡螺旋”

彭博这条视频讲了一个正在发生的恶性循环：AI 搜索直接给答案，用户不再点进原始网站，导致网站流量下降。流量少了，网站要么关站要么把内容藏起来，AI 模型就缺新鲜数据训练，回答质量跟着变差。SparkToro 的 Rand Fishkin 管这叫“零点击搜索”——用户留在平台内，外部网站拿不到流量。People Inc. CEO Neil Vogel 说...

#RAG#Bloomberg#Rand Fishkin#People Inc.

一句话点评

彭博这条视频讲了一个正在发生的恶性循环：AI搜索直接给答案，用户不再点进原始网站，导致网站流量下降。流量少了，网站要么关站要么把内容藏起来，AI模型就缺新鲜数据训练，回答质量跟着变差。SparkToro的Rand Fishkin管这叫“零点击搜索”——用户留在平台内，外部网站拿不到流量。People Inc. CEO Neil Vogel说他们靠授权、社交分发和付费AI合作来对冲搜索流量下滑...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

14:00

51d ago

AI HOT 精选· aihot-apiZH14:00 · 06·07

苹果内部秘密会议后终于把AI当核心战略，WWDC 2026见分晓

彭博爆料，苹果在一次内部秘密会议后正式把AI列为核心战略，相关更新预计在WWDC 2026上公布。正文没披露会议时间、参会人、涉及哪些产品线，也没给技术细节。目前只能知道苹果态度变了，但具体做了什么、做到哪一步，信息缺口很大，这点先别太激动。

#Apple#Product update#Commentary

一句话点评

彭博爆料苹果在一次内部秘密会议后正式把AI列为核心战略，预计WWDC 2026公布。但正文没披露会议时间、参会人、涉及哪些产品线，也没给技术细节。目前只能知道苹果态度变了，但具体做了什么、做到哪一步，信息缺口很大，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

68

SCORE

H1·K0·R1

14:00

51d ago

彭博科技· rssEN14:00 · 06·07

苹果一次秘密会议后终于认真对待AI了

彭博标题说苹果在一次秘密会议后终于认真对待AI了，但正文只提了WWDC 2026的预期，没披露会议时间、参会人、具体决策或内部机制。信息缺口很大，这点先别太激动。

#Bloomberg#Apple#Commentary

一句话点评

标题说苹果一次秘密会议后终于认真搞AI了，但正文只提了WWDC 2026预期，没披露会议时间、参会人、具体决策。信息缺口很大，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

62

SCORE

H1·K0·R1

13:56

51d ago

r/LocalLLaMA· rssEN13:56 · 06·07

求推荐比 OmniCoder v2 9B 更小的工具调用模型

一位 Reddit 用户在 LocalLLaMA 版发帖，想找一个比 OmniCoder v2 9B 更小的模型，要求能准确调用工具，并且能在 12GB RTX 3060 上更快热加载。帖子正文被 Reddit 屏蔽，没有透露候选模型或跑分结果。

#Agent#Tools#Code#OmniCoder

一句话点评

有人在Reddit上问有没有比OmniCoder v2 9B更小的模型能准确调用工具，还要能在12GB RTX 3060上更快热加载。帖子正文被屏蔽，没透露候选模型或跑分。9B在12GB卡上跑推理还行，但热加载速度主要看模型大小和框架优化，小模型确实有优势。目前Qwen2.5-7B-Instruct和Gemma 3-4B都支持工具调用，但具体准确率对比缺数据。如果追求更小，可以试试Qwen2...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

45

SCORE

H1·K0·R1

13:15

51d ago

彭博科技· rssEN13:15 · 06·07

黄仁勋确认英伟达新 Vera 芯片将用 SK 海力士内存

黄仁勋在公开场合说，英伟达下一代 Vera CPU 会搭载 SK 海力士的内存颗粒。两家公司还计划明年扩大合作规模。正文没披露 Vera 的具体架构、制程或量产时间，也没说用的是 HBM 还是其他类型的内存，所以这条消息目前更像一个供应商锁定信号，而不是产品发布预告。

#Inference-opt#Nvidia#Jensen Huang#SK Hynix

一句话点评

黄仁勋说英伟达下一代 Vera CPU 会用 SK 海力士的内存，但正文没提具体是 HBM 还是其他类型，也没说架构、制程和量产时间。目前更像一个供应商锁定信号，不是产品发布预告。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H0·K1·R1

13:00

51d ago

彭博科技· rssEN13:00 · 06·07

AI 公司大额增发可能让市场接不住

彭博报道，多家 AI 公司准备通过增发股票来筹集资金，这可能导致市场上股票供给突然增加。正文没披露具体是哪些公司、增发规模多大、时间表如何，所以风险到底有多大还不好说。但信号很清楚：AI 烧钱太快，公司开始靠卖股票续命，而买家可能不够多。

#Bloomberg#Wall Street#Funding#Commentary

一句话点评

彭博说AI公司要扎堆增发股票筹钱，但没点名、没规模、没时间表。信号本身值得看：AI烧钱太快，公司开始靠卖股票续命。但风险多大完全取决于具体数字，正文没披露，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

58

SCORE

H1·K0·R1

12:59

51d ago

AI HOT 精选· aihot-apiZH12:59 · 06·07

Symbolica 2.0 发布：可编程符号系统，支持 Python 和 Rust

Symbolica 2.0 是一个高性能符号计算框架，主要面向 Python 和 Rust 用户。这次更新的核心是“可编程符号”——用户可以自定义数学对象的行为，比如让它们像内置函数一样自动化简、求导、展开、打印和求值。新版本还改进了 Rust API，减少了导入和类型路径，支持更流畅的 builder 模式；输出方面增加了自动换行、彩色括号、HTML...

#Code#Tools#Symbolica#Hacker News

一句话点评

Symbolica 2.0 是一个符号计算框架，让 Python 和 Rust 用户能自定义数学对象的行为（比如自动求导、化简）。上了 Hacker News 首页（100 分），但正文没披露性能基准、许可证变更或迁移细节。亮点是 JIT 编译和双精度浮点支持，对需要快速数值核的物理/工程场景有用。不过社区验证还弱，先别当 Mathematica 平替。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

32

SCORE

H0·K0·R0

12:00

51d ago

The Verge · AI· rssEN12:00 · 06·07

AI“网红”越来越难分辨了

The Verge 报道，AI 生成的虚拟网红（比如 Aitana Lopez 和 Lil Miquela）已经逼真到让社交平台都犯难。文章标题说“越来越难分辨”，但正文没披露任何检测方法、平台数据或具体判断标准——所以这点先别太激动，信息缺口很明显：到底难在哪、多难、谁在负责识别，全没讲。

#Multimodal#Vision#The Verge#Aitana Lopez

一句话点评

The Verge 说 AI 虚拟网红（Aitana Lopez、Lil Miquela）已经逼真到平台都难分辨，但正文没给任何检测方法、平台数据或判断标准。标题说“越来越难分辨”，信息缺口很明显：到底难在哪、多难、谁在负责识别，全没讲。当个现象观察看可以，别当技术报告信。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

63

SCORE

H1·K0·R1

11:54

51d ago

r/LocalLLaMA· rssEN11:54 · 06·07

Qwen 3.6 27B 的 KV 缓存量化测试：75 组对比，覆盖 q8/q6/q5/q4

Anbeeld 放出了 Qwen 3.6 27B 的 KV 缓存量化基准测试，一共 75 组对比，涵盖 q8/q6/q5/q4 四种精度。测试用的是 BeeLlama.cpp，因为它支持 KVarN、q6_0、TurboQuant 和 TCQ 这些量化方法。正文没披露具体跑分和延迟数据，所以暂时没法判断哪种量化方案性价比最高。

#Inference-opt#Benchmarking#Qwen#BeeLlama.cpp

一句话点评

Anbeeld 测了 Qwen 3.6 27B 的 KV 缓存量化，75 组对比覆盖 q8 到 q4，用了 BeeLlama.cpp 支持 KVarN、TurboQuant 等方法。但正文没披露跑分和延迟，暂时没法判断哪种方案最划算。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

62

SCORE

H0·K1·R1

11:16

51d ago

Hacker News 首页· rssEN11:16 · 06·07

Lathe：用 LLM 生成技术教程，逼你亲手做一遍，而不是跳过学习

Lathe 是一个 Go 写的命令行工具加本地网页界面，核心思路是让 LLM 根据你指定的领域生成带练习、旁注和目录的多章节技术教程，然后你必须自己动手完成。作者只在 macOS 上测过 Claude Code，Hacker News 上目前 37 票、2 条评论，热度不高。亮点是它刻意不让你“跳过”学习过程——LLM 只负责出题和搭框架，动手的还是你...

#Agent#Code#Tools#Lathe

一句话点评

Lathe 是个 Go 写的命令行工具，让 LLM 帮你生成带练习和旁注的技术教程，但你必须自己动手做，不能跳过学习。作者只在 macOS 上测过 Claude Code，HN 上 37 票、2 条评论，热度很低。亮点是思路对——LLM 只出题搭框架，不替你写答案。但正文没披露生成一篇教程要多少 token、多快，也没说支持哪些模型。如果成本可控，对想系统学新领域的人挺实用，但这点先别太激动...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

66

SCORE

H1·K1·R1

11:02

51d ago

r/LocalLLaMA· rssEN11:02 · 06·07

把 Nemotron 3.5 ASR 塞进 Docker，CPU 跑语音识别比实时快 4.5 倍

有人把语音识别管线从 Parakeet 换成了 Nemotron 3.5 ASR，打包成 Docker 镜像。一个模型支持 40 多种语言，原生支持流式识别（不用等整段音频传完再出字），还附了流式和文件上传的客户端示例。CPU 上用 onnxruntime-genai 跑，速度是实时的 4.5 倍——也就是处理 1 秒音频只要 0.22 秒，延迟很低。...

#Audio#Tools#Inference-opt#Docker

一句话点评

有人把语音识别管线从 Parakeet 换成了 Nemotron 3.5 ASR，打包成 Docker 镜像。一个模型支持 40 多种语言，原生支持流式识别（不用等整段音频传完再出字），还附了流式和文件上传的客户端示例。CPU 上用 onnxruntime-genai 跑，速度是实时的 4.5 倍——也就是处理 1 秒音频只要 0.22 秒，延迟很低。短评：一个模型覆盖 40+ 语言，C...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

10:53

51d ago

Product Hunt · AI· rssEN10:53 · 06·07

AgentCAD：让代码型AI自己画3D零件图的开源工具

AgentCAD 是一个免费开源工具，专门给 Claude Code、Codex 这类编程智能体用的。你给它一段文字描述、一张草图或一张图片，它就能写出 build123d 或 CadQuery 脚本，然后自动检查代码有没有错、几何体是否封闭（水密）、尺寸对不对，最后从各个角度渲染出来。智能体在你看之前就把错误修好了。输出是交互式 3D 查看器，外加 ...

#Code#AgentCAD#Claude Code#Codex

一句话点评

AgentCAD 让 Claude Code 这类编程智能体直接写 3D 零件脚本，还能自动检查代码和几何体是否封闭（水密），修完错才给你看。免费开源，输出 STEP/STL/GLB 文件，可直接打印或编辑。但正文没披露支持哪些智能体框架，也没说复杂装配体表现如何，这点先别太激动。如果是真的，能省掉人工反复调脚本的功夫。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

62

SCORE

H1·K1·R0

10:48

51d ago

FEATUREDAI HOT 精选· aihot-apiZH10:48 · 06·07

北海道农民雇了个叫 Codex 的工程师，用 AI 干了 8 件农活

北海道农民富安弘毅把 ChatGPT 和 Codex 当工程师用，做了 8 件事：拍照识别西兰花病害、用卫星 NDVI 数据看作物长势、拿 ESP32 加 LINE 机器人远程开关温室卷帘、给农场群聊写了个管温度和排期的机器人、从聊天记录里自动统计播种数量、研究 RTK-GPS 自动转向原理并算了自建要花多少钱、用 Airtable 搭了农场管理数据库...

#Agent#Vision#Code#Hiroki Tomiyasu

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

北海道农民把 ChatGPT 和 Codex 当工程师用，做了病害识别、温室遥控等 8 个工具，但正文没披露准确率、误判率和实际省了多少人工。

锐评

这条最值得看的是落地感——不是概念验证，是一个农民真的把 AI 塞进了日常农活里。富安弘毅用 ChatGPT 拍照识别西兰花病害，用 Codex 写 ESP32 代码远程开关温室卷帘，还给农场 LINE 群聊做了管温度和排期的机器人。他连 RTK-GPS 自动转向都自己研究了一遍，算出如果自建要花多少钱。这些用法把“让模型进业务流程干活”这件事拉到了最接地气的场景：田里、大棚里、聊天群里。但正文没给任何性能数字。病害识别到底准不准？误判一次可能就是一茬菜的损失。温室卷帘的远程控制有没有延迟或掉线记录？群聊机器人管排期，是真正减少了人工协调，还是只是把混乱从口头搬到了聊天框里？这些信息缺口让“如同身边有一位超级工程师”这句话先打个折——工程师干活是要验收的，正文没披露验收结果。另外，全文来自一条推文，没有第三方验证，也没有说明这些工具是稳定运行还是 demo 阶段。如果后续能看到产量对比或工时统计，这条的价值会扎实很多。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

76

SCORE

H1·K1·R1

10:13

51d ago

AI HOT 精选· aihot-apiZH10:13 · 06·07

Her · हेर：Claude Code 会话分析工具

Her 是一个开源的 Claude Code 会话分析工具，你只需上传 .jsonl 会话文件，它就能自动还原出整个操作过程，并用大白话告诉你：哪些轮次执行了高风险操作（比如部署、改配置、碰密钥），以及上下文预算到底花在了哪里。分析引擎是纯规则判断，不依赖任何第三方 AI API；只有生成英文报告和建议时才调用本地的 Nemotron-Mini-4B-...

#Agent#Tools#Safety#Claude Code

一句话点评

开源工具，上传 Claude Code 的 .jsonl 日志就能自动还原操作过程，标出高风险动作（部署、改配置、碰密钥）和上下文预算花在哪。分析引擎纯规则判断，不调第三方 API；只有生成英文报告时才用本地的 Nemotron-Mini-4B 模型。数据只留在当前 Space 的私有空间，用完自动删。目前只支持 Claude Code 的日志格式，其他 agent 用不了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

10:00

51d ago

FT · 科技· rssEN10:00 · 06·07

沃尔玛对员工说：AI 是来帮你干活，不是来抢饭碗的

沃尔玛向员工喊话，说引入 AI 是为了改善工作，不是取代人。正文没披露具体用了什么工具、影响了多少岗位、以及部署时间表，所以这更像一个安抚姿态，不是落地计划。目前信息缺口很大，没法判断实际影响。

#Walmart#Commentary

一句话点评

沃尔玛给员工发定心丸：AI 是来帮忙的，不是来抢饭碗的。但正文没披露具体用了什么工具、影响了多少岗位、以及部署时间表，所以这更像一个安抚姿态，不是落地计划。目前信息缺口很大，没法判断实际影响。短评：安抚员工的话术，缺细节，先别当真。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

09:50

51d ago

r/LocalLLaMA· rssEN09:50 · 06·07

怎么提高大模型的提示处理速度？

一位用户在24GB显存的7900XTX显卡上跑Qwen模型，上下文拉到230k时，prefill速度从850 t/s掉到350 t/s（160k上下文时）。他提到用HIP（AMD的GPU加速库）能让提示处理快10%，但生成token更慢、显存占用更高。正文没披露具体优化方法，只说了现象和硬件限制。

#Inference-opt#Agent#Qwen#Reddit

一句话点评

7900XTX 跑 Qwen，上下文从 160k 拉到 230k，prefill 速度从 850 t/s 掉到 350 t/s，降了快 60%。用户说用 HIP 能让提示处理快 10%，但生成更慢、显存更高——这优化有点拆东墙补西墙。正文没披露具体怎么调的，只说现象和硬件限制。对本地跑长上下文的用户是个参考：显存 24GB 是瓶颈，长文预填充掉速明显，HIP 的收益有限且副作用大。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

56

SCORE

H0·K1·R1

09:45

51d ago

r/LocalLLaMA· rssEN09:45 · 06·07

三块 Jetson Orin Nano Super 组集群跑大模型

Reddit 用户 East-Muffin-6472 发帖分享如何把三块 Jetson Orin Nano Super 拼成一个集群，每块有 1024 个 CUDA 核心、8GB 统一内存和 6 个 Cortex-A78 CPU 核心。帖子只讲了搭建步骤，说后续会做分布式推理和训练演示，但没给任何跑分或延迟数据。三块加起来也就 24GB 显存，跑 7B...

#Inference-opt#NVIDIA#Reddit#East-Muffin-6472

一句话点评

三块 Jetson Orin Nano Super 拼集群，总显存才 24GB，跑 7B 模型都勉强。帖子只讲了怎么接线装驱动，没给任何跑分或延迟数据，分布式推理到底快不快完全未知。动手党可以看看，但别指望性能翻倍。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

62

SCORE

H1·K1·R1

09:43

51d ago

Hacker News 首页· rssEN09:43 · 06·07

不用训练的单图扩散模型，一张图就能生成百万像素新图

这篇 CVPR 2026 论文提出了一种不需要训练的单图扩散模型。传统方法要拿一张图反复训练几小时，它直接拿这张图在不同尺度上切出的小块（patch）当数据集，因为小块维度低、数量有限，可以用一个数学闭式解（最优去噪器）来算得分函数，完全跳过神经网络训练。效果上，它声称生成质量和多样性都超过了需要训练的单图扩散模型，还能做文字风格迁移、图像对称化、重定...

#Vision#Inference-opt#Research release

一句话点评

CVPR 2026 这篇提出不用训练的单图扩散模型：把原图切成不同尺度的小块当数据集，因为小块维度低、数量有限，直接用数学闭式解算去噪器，跳过神经网络训练。声称生成质量和多样性超过需要训练的方法，还能做文字风格迁移、图像对称化。亮点是快——宣称百万像素图一秒生成，十亿像素几分钟。但正文没披露与训练方法的具体对比基准、运行时间实测数据，也没说代码是否开源。这点先别太激动，等看到消融实验和复现结...

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

52

SCORE

H1·K0·R0

09:09

51d ago

FT · 科技· rssEN09:09 · 06·07

英国对Palantir的依赖值得警惕

FT这篇标题直接点出英国政府过度依赖Palantir的风险。正文没披露合同金额、系统范围、时间表或替代方案，信息缺口明显。核心警告是：政府应该选最好的技术，而不是被一家供应商锁死。对AI从业者来说，这提醒了政企合作中vendor lock-in的现实问题——即使技术再强，单一依赖也会让议价权和灵活性打折。

#Palantir#UK Government#Financial Times#Policy

一句话点评

FT这篇评论警告英国政府过度依赖Palantir，核心风险是vendor lock-in——一家供应商锁死，议价权和灵活性都会打折。正文没披露合同金额、系统范围或替代方案，信息缺口明显。对AI从业者来说，这是政企合作的现实提醒：技术再强，单一依赖也会让政府失去选择权。短评：单一供应商依赖风险，FT点出但缺细节。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

64

SCORE

H1·K0·R1

09:00

51d ago

最佳拍档· atomZH09:00 · 06·07

李飞飞团队发布GPIC图像数据集：1亿张图，想做下一代ImageNet

斯坦福李飞飞团队放出GPIC数据集，号称1亿张图片，目标是接替ImageNet成为新一代图像基准。但正文没披露数据来源、版权处理方式、具体评测结果以及开放下载条件。1亿张图规模确实大，但没说明有多少是私有数据、多少来自公开爬取，版权风险未知。也没给FID等指标对比现有数据集，所以暂时没法判断它比ImageNet或DINOv2好多少。如果后续开源且版权干...

#Vision#Benchmarking#Fei-Fei Li#Stanford

一句话点评

李飞飞团队放出GPIC数据集，号称1亿张图，目标是接替ImageNet。规模确实大，但正文没披露数据来源、版权处理方式和评测指标，也没说开放下载条件。暂时没法判断它比ImageNet或DINOv2好多少，版权风险未知。如果后续开源且版权干净，会是视觉基准的重要补充，但这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

69

SCORE

H1·K1·R1

08:58

51d ago

彭博科技· rssEN08:58 · 06·07

英国政府要直接买本土AI芯片，留住自家公司别跑

据《每日电讯报》报道，英国政府打算直接向本土科技公司采购AI芯片，用订单把企业留在英国。正文没披露采购金额、具体公司名单和时间表。这招相当于政府当大客户，给本土芯片公司一个稳定收入，降低它们搬去美国或亚洲的动力。如果真落地，对英国AI硬件创业公司是个直接利好，但规模多大、能不能执行到位，目前信息不够判断。

#Inference-opt#The Telegraph#Policy

一句话点评

英国政府打算直接掏钱买本土AI芯片，用订单把公司留在英国。这招比补贴更直接——政府当大客户，给创业公司一个稳定收入。但正文没披露采购金额、具体公司名单和时间表，规模多大、能不能执行到位，目前信息不够判断。如果真落地，对英国AI硬件创业公司是个直接利好，但先别太激动，等细节出来再说。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

64

SCORE

H0·K1·R1

07:24

51d ago

r/LocalLLaMA· rssEN07:24 · 06·07

没显卡也能跑 Gemma 4，一台旧电脑就够了

Reddit 用户用一台 i5-8500、32GB 内存、无独显的旧 Linux 台式机，跑起了 Gemma 4 的 26B-A4B 模型，速度约 7 tokens/s。这台机器二手价才 150 美元，说明大模型推理的门槛比想象中低。不过这个速度只适合跑跑小任务或测试，离实时对话还差得远。正文没披露具体量化精度和上下文长度，这点先别太激动。

#Inference-opt#Gemma#Koboldcpp#Reddit

一句话点评

一台150美元的旧台式机（i5-8500，32GB内存，无独显）就能跑Gemma 4的26B-A4B模型，速度约7 tokens/s。这个速度做实时对话太慢，但跑跑小任务或测试完全够用，说明大模型推理门槛比想象中低。不过正文没披露量化精度和上下文长度，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

70

SCORE

H1·K1·R1

07:09

51d ago

AI 群聊日报· atomZH07:09 · 06·07

群聊日报：AI 提效不等于搞钱，Vite 1.3 亿周下载却难变现

今天群里最热的讨论是“AI 提效到底能不能搞到钱”。结论很清醒：提效是手段，但跟搞钱没有必然联系——效率高了，钱可能被老板拿走，或者大家都在提效，你也没多赚。真正能打通通道的是自己创业，用 AI 降低生产成本。Vite 周下载 1.3 亿次，但全部价值在本地完成，没有计费点，最终被 Cloudflare 收购。AI agent 在系统提示词里硬编码“P...

#Agent#Code#VoidZero#Vite

一句话点评

群聊日报的核心讨论：AI提效不等于搞钱。Vite周下载1.3亿次但变现难，因为价值全在本地完成，最终被Cloudflare收购。AI agent在系统提示词里硬编码“Prefer Vite”，间接控制了生态。另一个看点：Opus 4.7/4.8继续偷懒说日语，GPT 5.5在长任务中稳定上位。短评：提效是手段，搞钱得自己创业，用AI降成本。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

68

SCORE

H1·K1·R1

07:00

51d ago

AI HOT 精选· aihot-apiZH07:00 · 06·07

NVIDIA 在韩国网吧办派对，推 RTX Spark 芯片：Windows 笔记本续航一整天，1440p 游戏超 100 帧

NVIDIA 在韩国网吧（PC Bang）和《绝地求生》开发商 KRAFTON、《剑灵》开发商 NC、以及《英雄联盟》冠军战队 T1 一起庆祝新芯片 RTX Spark 发布。官方称这颗超级芯片能让 Windows 笔记本续航一整天，跑 1440p 分辨率的大型游戏帧率超过 100fps。不过正文没披露具体功耗、价格和上市时间，所以这个“全天续航”是跑...

#Inference-opt#Agent#NVIDIA#KRAFTON

一句话点评

NVIDIA 在韩国网吧搞了个 RTX Spark 发布派对，拉上《绝地求生》开发商和《英雄联盟》冠军战队站台。官方说这颗超级芯片能让 Windows 笔记本续航一整天，1440p 跑 3A 大作超 100fps。但正文没披露功耗、价格和上市时间，所以“全天续航”是跑游戏还是待机、多少瓦时电池都没说。先别太激动，等实测和定价出来再判断值不值。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

34

SCORE

H0·K1·R0

06:25

51d ago

FEATUREDAI HOT 精选· aihot-apiZH06:25 · 06·07

Harness-1：一个用强化学习练出来的200亿参数检索子智能体，能记住搜索状态

UIUC 和 Chroma 发布了一个叫 Harness-1 的检索子智能体，参数量 200 亿，基于 gpt-oss-20b 训练。它被放在一个“有状态搜索框架”里用强化学习训练，简单说就是模型在搜索时能记住上一步干了什么，再决定下一步怎么查，而不是每次都从头瞎找。在 8 个基准测试上，它的平均整理召回率是 0.730，比目前最好的开源子智能体高出 ...

#Agent#RAG#Reasoning#UIUC

精选理由

精选 · 重要度 80 · 吸引力 + 知识量 + 共鸣

一句话点评

UIUC和Chroma训了个200亿参数的检索子模型，能记住上一步搜索结果再决定下一步怎么查，8个基准平均召回率0.730，比开源第二名高出11.4个百分点。

锐评

这条新闻值得点开看，因为它解决了一个很实际的痛点：让模型在多次搜索时别像金鱼一样忘事。Harness-1 的做法是把检索过程本身当成一个“有状态”的任务来训练，模型能根据前一步拿到了什么，调整下一步的查询词和检索策略，而不是每次都从零开始瞎碰。数字上，它在 8 个基准上的平均整理召回率是 0.730，比目前最好的开源子智能体高出 11.4 个百分点，只输给 Opus-4.6。这个提升幅度不小，说明“记住上一步”确实管用。但要注意，文章没披露训练用了多少算力、推理延迟是多少，也没说这个 200 亿参数的模型在实际业务里跑起来成本高不高。还缺一个关键信息：它是在 gpt-oss-20b 上训的，但没交代基座模型本身的能力边界。如果基座推理就弱，那检索策略再聪明也白搭。另外，所有测试都在基准上，真实场景里资料库乱七八糟的时候表现如何，正文没提。这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

80

SCORE

H1·K1·R1

更多

✕

频道

热点聚合每日 AI 日报全部播客·视频 AX 严选 X 监控收藏信源邮件订阅 Agent 接入

后台

用量系统订阅管理精选策略策略迭代用户