AX 严选 · 2026-06-06

▸ 11 条 · updated 3m ago

2026年6月

一二三四五六日

163 251 335 431 539 611 716 846 959 1039 1138 1225 1320 149 1521 1635 1728 1834 1919 202 213 2218 2319 2420 2522 2612 278 286 2917 3023

2026年7月

一二三四五六日

110 218 310 42 55 617 717 817 916 1010 116 128 137 1420 1515 1622 1711 181 198 2012 2118 2211 2310 24 25 26 27 28293031

2026-06-06 · 星期六2026年6月6日

23:08

51d ago

AI HOT 精选· aihot-apiZH23:08 · 06·06

MiniMax M3 代码审计：花 7 分钱抓到 13 个 bug，效果和 1.3 美元的 Claude Opus 一样

MiniMax 拿自己的 M3 模型和 Claude Opus 4.8 做了一次代码审计对比：同一份代码里预先埋了 17 个 bug，用同样的提示词去抓。结果 M3 花了 7 美分找到 13 个，最便宜的 Claude 运行也找到 13 个，但花了 1.3 美元，成本差了将近 19 倍。这个对比挺直观的——如果代码审计这类任务对模型能力要求没那么极致，...

#Code#Benchmarking#MiniMax#Claude

一句话点评

MiniMax 拿自家 M3 和 Claude Opus 4.8 比代码审计：同一份代码埋了 17 个 bug，同样提示词。M3 花 7 美分找到 13 个，最便宜的 Claude 也找到 13 个，但花了 1.3 美元，成本差 19 倍。关键数字：17 个 bug 只抓到 13 个，说明两者能力上限差不多，都没全对。成本差距主要来自模型定价，M3 走性价比路线。缺什么：没披露 bu...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:47

51d ago

FEATUREDAI HOT 精选· aihot-apiZH21:47 · 06·06

美国众议院推草案：想一刀切掉各州自定 AI 法规的权力，全收归联邦

路透社消息，美国众议院议员放出一份 AI 法案草案，核心就一条：禁止各州自己搞 AI 监管，把立法权全部集中到联邦手里。目前正文没披露提案人是谁、走哪个委员会、什么时候投票，也没说联邦层面打算用什么机制来替代各州的规则。如果通过，意味着加州、纽约这些地方不能再单独出更严的 AI 法规，企业只需要面对一套联邦标准。但草案刚出，离落地还远，先别太激动。

#U.S. House#Policy

精选理由

精选 · 重要度 76 · 吸引力 + 知识量 + 共鸣

一句话点评

草案核心是让各州别管AI了，全听联邦的。但联邦自己怎么管，正文一个字没提。

锐评

这份草案最狠的地方不是统一标准，而是先让各州闭嘴，联邦自己却还没拿出替代方案。路透社的报道只说了众议院有人放出草案，禁止各州单独立法，但提案人、走哪个委员会、什么时候投票全没披露。对企业来说，不用再应付加州、纽约、科罗拉多各自不同的要求，确实省事。但问题在于，联邦层面连审计、事故报告、隐私保护、自动化决策这些基本机制都没亮出来，就先砍掉地方监管，这更像是给平台松绑，而不是正经搞治理。欧盟AI法案好歹列了风险等级和具体义务清单，不管你觉得好不好用，至少有个框架。这份草案从现有信息看，只展示了让所有人停手的那部分。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

19:02

52d ago

FEATUREDAI HOT 精选· aihot-apiZH19:02 · 06·06

五个实验室，五个心智：用小模型搭了个会内幕交易的金融宫斗剧

这个项目用四家不同实验室的小模型（OpenAI 的 gpt-oss-20b、OpenBMB 的 MiniCPM3-4B、NVIDIA 的 Nemotron-Mini-4B 和一个自己微调的 0.5B Qwen）分别扮演市场里的不同角色，玩家则充当幕后金主，可以放贷、散布真假内幕消息、做空和贿赂。模型之间的差异本身就是卖点，让市场博弈更像真的吵架而不是念...

#Agent#Fine-tuning#Memory#Hugging Face

精选理由

精选 · 重要度 74 · 吸引力 + 知识量 + 共鸣

一句话点评

用四家不同实验室的小模型来扮演市场角色，让博弈更像真吵架而不是念剧本，这个思路比单纯换提示词聪明。但正文没披露游戏实际运行时的延迟和成本，这点先别太激动。

锐评

这个项目把多模型异构做成了游戏卖点，而不是技术妥协。它用 OpenAI 的 gpt-oss-20b、OpenBMB 的 MiniCPM3-4B、NVIDIA 的 Nemotron-Mini-4B 和一个自己微调的 0.5B Qwen 分别驱动市场里的不同角色，玩家则充当幕后金主，可以放贷、散布真假消息、做空和贿赂。模型之间的天然差异让市场博弈产生了真实的策略分化，比如猫头鹰囤货的方式和狐狸投机的方式就是不一样，这比用同一个模型换提示词要生动得多。技术上的主要坑在模型部署层，不在模型本身。他们用的 vLLM 0.22.1 在启动时需要即时编译，依赖 CUDA 工具包，而精简的容器镜像默认不带，导致四个模型一开始全部报错。作者自己微调的 0.5B 小模型表现不错，自我交易率降到了 0%，有效报价率达到 100%，说明小模型在特定角色扮演任务上完全够用。不过文章没提几个关键信息：四个模型同时跑起来的显存占用和推理延迟是多少，玩家操作后市场反应要等多久，以及这种多模型架构的长期稳定性如何。这些数据对想复现的人来说比模型差异本身更重要。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:24

52d ago

AI HOT 精选· aihot-apiZH16:24 · 06·06

AI 的黑色星期五：一夜蒸发 5000 亿美元，OpenAI 可能要被政府接管

Gary Marcus 把 6 月 5 日称为 AI 行业的黑色星期五——当天美股 AI 相关公司市值合计蒸发约 5000 亿美元。芯片股（英伟达、博通、美光）、GPU 租赁商（CoreWeave、Nebius）以及微软、Meta 等巨头跌幅都超过大盘（道指仅跌 1.35%）。韩国半导体板块也遭重挫，KOSPI 跌 5.5%，三星电子跌 6.4%，SK...

#Gary Marcus#Commentary

一句话点评

Gary Marcus 把 6 月 5 日称为 AI 黑色星期五，美股 AI 相关公司市值蒸发约 5000 亿美元。英伟达、博通、美光等芯片股，CoreWeave 等 GPU 租赁商，以及微软、Meta 跌幅均超大盘（道指仅跌 1.35%）。韩国半导体板块也遭重挫，KOSPI 跌 5.5%，三星电子跌 6.4%，SK 海力士跌 9.9%。更关键的是，CNBC 报道特朗普政府正与 OpenAI...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

15:36

52d ago

AI HOT 精选· aihot-apiZH15:36 · 06·06

Hugging Face 开源了一个用 AI 帮你筛工作的工具

Hugging Face 发布了一个开源 AI 求职工具 Job Searcher。你上传简历、填好偏好，它先用 DeepSeek V4 Pro 生成 LinkedIn 搜索词，搜到职位后，再用一个微调过的 Qwen3-8B 小模型从技能匹配、经验相关度、学历证书、行业契合度、职级对齐五个维度打分，并给出每项的理由。整个流程跑下来，你拿到的不是几十个职...

#Agent#Fine-tuning#Tools#Hugging Face

一句话点评

Hugging Face 做了一个开源求职工具：上传简历，它先用 DeepSeek V4 Pro 生成 LinkedIn 搜索词，再用微调过的 Qwen3-8B 小模型从技能、经验、学历、行业、职级五个维度打分，最后只给你一个短名单和每项理由。关键是用 LoRA 微调 8B 模型替代大模型做重复评分，成本低、速度快。但正文没披露微调用了多少样本、评分准确率有没有验证，也没说 LinkedIn...

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

13:07

52d ago

FEATUREDAI HOT 精选· aihot-apiZH13:07 · 06·06

GitHub 开源 Spec Kit：先写产品规范再让 AI 写代码，把 vibe coding 的流程反过来

GitHub 把 Spec Kit 开源了，专门解决 AI 编程里一个常见毛病：需求还没说清楚，模型就开始写代码，结果边界漏了、反复返工。这个工具包把流程倒过来——先写产品功能规范，再让 AI 根据规范去澄清差距、做技术计划、拆任务，最后交给 agent 执行。规范本身成了可执行的开发合约，不是一份看完就扔的文档。目前支持 Copilot、Claude...

#Agent#Code#Tools#GitHub

精选理由

精选 · 重要度 82 · 吸引力 + 知识量 + 共鸣

一句话点评

GitHub 把 Spec Kit 开源了，核心思路是让 AI 先对齐产品规范再写代码，而不是上来就敲。109K 星标说明需求不小，但正文没披露实际落地效果和返工率变化。

锐评

这个工具包解决了一个真实痛点：AI 编程现在最大的坑不是代码写不好，而是需求没对齐就开始写，最后边界漏了、逻辑打架，返工成本比手写还高。Spec Kit 把流程倒过来——先写产品功能规范，再让 AI 去澄清规范里没说清的地方、做技术计划、拆任务，最后才交给 agent 执行。规范本身变成了一份可执行的开发合约，不是看完就扔的文档。 109K 星标说明开发者对这个思路买账，但要注意几点：第一，正文没给出任何对比数据，比如用了 Spec Kit 之后返工率降了多少、开发周期缩短了多少，这些才是判断它值不值得切过去的关键。第二，支持 30 多个 agent 集成听起来覆盖面广，但不同 agent 对规范的理解和执行质量肯定有差异，正文没提哪个组合效果最好。第三，写一份能当合约用的产品规范本身就有门槛，如果规范写不好，后面的澄清和拆任务环节可能反而放大偏差。我会先打个折：方向对，但缺实测数据。如果团队已经有比较成熟的产品需求文档习惯，这个工具包可能省不少事；如果平时连 PRD 都写不清楚，光靠 Spec Kit 救不了流程。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:48

52d ago

FEATUREDAI HOT 精选· aihot-apiZH12:48 · 06·06

OpenCV 5 发布，换了一套能跑大模型的神经网络引擎

OpenCV 5 最大的变化是换了一套全新的 DNN 引擎，从原来的逐层执行改成基于计算图的架构，能做算子融合，跑 Transformer、视觉语言模型和大语言模型都成了原生能力。ONNX 算子的覆盖率从 4.x 时期不到 23% 一下子拉到 80% 以上，以前很多导不进来的模型现在能直接用了。另外硬件加速层也重新整理了，厂商可以直接插优化后的计算内核...

#Vision#Inference-opt#Multimodal#OpenCV

精选理由

精选 · 重要度 80 · 吸引力 + 知识量 + 共鸣

一句话点评

OpenCV 5 把 DNN 引擎重写成计算图架构，ONNX 算子覆盖率从不到 23% 拉到 80% 以上，跑 Transformer 和大模型成了原生能力。

锐评

OpenCV 5 这次更新挺实在，核心是把用了多年的 DNN 推理引擎从逐层执行换成了基于计算图的架构。这带来的直接好处是能做算子融合，跑 Transformer、视觉语言模型甚至大语言模型都成了原生支持，不用再绕弯子。最直观的数字是 ONNX 算子覆盖率从 4.x 时期不到 23% 一下子提到了 80% 以上，以前很多导不进来的模型现在能直接用了，对做模型部署的人来说省了不少事。硬件加速层也重新整理了，厂商可以直接插优化后的计算内核，不用在杂乱的 #ifdef 里改代码。另外 Python 绑定更现代了，支持命名参数，不用再猜参数顺序。不过正文没给出新版引擎在具体模型上的推理延迟或吞吐量对比，也没提这 80% 的覆盖率具体覆盖了哪些算子、缺的那 20% 是不是高频使用的。这点先别太激动，实际落地效果还得看社区后续的跑分和踩坑反馈。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:00

52d ago

AI HOT 精选· aihot-apiZH12:00 · 06·06

苹果又发新版 Siri，但只说了句“重新介绍”

苹果在 WWDC 上再次推出新版 Siri，官方口径是“重新介绍”。但 The Verge 的报道只引用了这一句话，正文没披露任何功能、版本号、价格或上线时间。目前能确认的只有苹果想重做 Siri 这个意图，具体改了啥、什么时候能用，一概不知。

#Apple#The Verge#Siri#Product update

一句话点评

苹果在 WWDC 上又发了一遍 Siri，但只说了句“重新介绍”，功能、版本、上线时间全没提。目前能确认的只有苹果想重做 Siri 这个意图，具体改了啥一概不知。短评：苹果又画了一次 Siri 的饼，但这次连馅儿都没露。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

11:42

52d ago

AI HOT 精选· aihot-apiZH11:42 · 06·06

Persona Atlas：把名人思维画成可比较的坐标点

Hugging Face 上一个开源工具，输入人名，一个小模型代理会去网上搜资料，生成一份带来源的人物档案，然后用这个人的口吻回答10个开放式问题（比如自由意志、机器意识）。每个回答转成向量，这样一个人物就变成了空间里的一个点，可以跟其他人比距离。还画了一张特质热力图，显示谁更幽默、谁更抽象、谁更怀疑——但注意，热力值是相对排名，不是绝对分数。整个流程...

#Agent#Embedding#Tools#Hugging Face

一句话点评

短评：把名人变成可量化的思维坐标，创意不错，但验证很弱。点评：Hugging Face 上一个开源工具，输入人名，小模型代理会去网上搜资料，生成带来源的人物档案，然后用这个人的口吻回答10个开放式问题（比如自由意志、机器意识）。每个回答转成向量，这样一个人物就变成了空间里的一个点，可以跟其他人比距离。还画了一张特质热力图，显示谁更幽默、谁更抽象、谁更怀疑——但注意，热力值是相对排名，不是...

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

09:52

52d ago

AI HOT 精选· aihot-apiZH09:52 · 06·06

海螺AI×上影节：6月14-15日开放日，有展位和行业沙龙

MiniMax的海螺AI要在上海电影节期间办开放日，时间是6月14-15日，内容包括专属展位、多模态行业聚会和主题圆桌。正文没披露具体时间和地点，只说在图片里。如果你对AI+影视感兴趣，这两天可以去逛逛，但建议先找官方确认详细安排。

#Multimodal#MiniMax#Hailuo AI#Shanghai International Film Festival

一句话点评

海螺AI借上影节办开放日，6月14-15日，有展位、多模态聚会和圆桌。正文没披露具体时间和地点，只说在图片里。如果你对AI+影视感兴趣，这两天可以去逛逛，但建议先找官方确认详细安排。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

06:46

52d ago

AI HOT 精选· aihot-apiZH06:46 · 06·06

阶跃首席科学家张祥雨合著的 ResNet 论文获 CVPR 2026 时间检验奖

标题说 ResNet 获奖，但正文是空的，没交代是哪一篇 ResNet 版本、获奖理由、完整作者名单或 CVPR 委员会细节。

#Vision#StepFun#Zhang Xiangyu#CVPR

一句话点评

阶跃首席科学家张祥雨合著的 ResNet 拿了 CVPR 2026 时间检验奖，但正文是空的，没说是哪一篇 ResNet、获奖理由和完整作者名单。ResNet 是 2015 年的经典残差网络，拿奖不意外，但信息缺口太大，没法判断是原始论文还是后续变体。短评：经典拿奖，但正文空，缺版本和理由。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

AX 严选 · 2026-06-06

更多

频道

后台