AX 严选 · 2026-05-10

▸ 10 条 · updated 3m ago

2026年5月

一二三四五六日

1 2 3 4 5 6 736 819 921 1010 1132 1228 1335 1438 1528 1617 179 1824 1947 2026 2132 2236 237 246 257 2625 2729 2834 2936 308 316

2026年6月

一二三四五六日

138 235 332 422 532 610 78 829 944 1029 1129 1215 1371415161718192021222324252627282930

2026-05-10 · 星期日2026年5月10日

20:01

33d ago

FEATUREDAI HOT 精选· aihot-apiZH20:01 · 05·10

Codex 自己找了个安全审计的活，花了 22 小时赚到 16.88 美元

有人让 Codex 去赚 5 美元，它自己找到开源项目的安全审计赏金，提交了能用的代码修复，跟维护者来回沟通，还搞定了 GitHub 的验证流程，最后代码被合并，拿到了 16.88 美元。整个过程大约 22 小时，如果每天重复，一个月能赚 506.40 美元。金额不大，但这是 AI 第一次自己跑通“接活—干活—收钱”的闭环。正文没披露 Codex 具体...

#Agent#Code#Tools#Codex

精选理由

HKR 三项都站得住：一个 Codex agent 在 22 小时内走完了从接任务到收钱的闭环，有具体金额和流程细节。不过目前只有一条社交帖子作为证据，没有可复现的日志，所以先不打最高级。

一句话点评

Codex自己跑通了“接活—干活—收钱”的闭环，22小时赚了16.88美元。金额小，但这是AI第一次没靠人插手就完成有偿工作，这点值得关注。

锐评

这条消息最值得看的是闭环：用户只给了一个模糊目标“去赚5美元”，Codex自己找项目、读需求、写代码、跟维护者沟通、过验证流程，最后代码被合并，拿到16.88美元。22小时赚这个数，时薪不到1美元，效率还很低，但意义不在金额——这是AI首次在没有人类逐步指挥的情况下，完成从接单到收钱的全流程。要打折的地方不少。正文没披露Codex具体做了什么级别的安全审计，也没说修复的漏洞有多严重。开源项目的安全审计赏金门槛参差不齐，有些只是修个文档链接也算。另外，GitHub验证流程怎么过的、维护者是否知道对面是AI，这些都没提。如果维护者不知情，这个闭环的“自主”就要打折扣。还缺关键信息：Codex有没有犯错或提交无效PR？22小时里有多少是在等待响应？如果换成更复杂的项目，这套流程还能不能跑通？这些没答案之前，先别急着说AI能养家了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:54

33d ago

FEATUREDAI HOT 精选· aihot-apiZH18:54 · 05·10

《科学》研究：OpenAI 一年前的 o1 模型急诊诊断正确率 67%，超过医生的 50-55%

我会先打个折：这项研究用的是 OpenAI 一年前发布的 o1 模型，按现在标准已经算旧版了。测试数据来自真实急诊室，信息混乱、不完整，模型给出的正确或接近正确的诊断率达到 67%，而参与对比的医生是 50-55%。差距在早期分诊阶段最明显，那时能拿到的信息最少。研究还提到 o1 在处理结构化病例时临床推理几乎不出错。不过正文没披露样本量有多大、医生是...

#Reasoning#Benchmarking#OpenAI#Science

精选理由

我会先打个折：这只是一项诊断研究，没覆盖住院数据和影像诊断，别急着说 AI 能独立看急诊。但《科学》背书加上 o1 在真实急诊病例上比医生高出十几个百分点，确实值得从业者看一眼。它说明在特定文本诊断任务上，旧模型已经能摸到甚至超过人类平均水平，后续怎么落地、怎么担责才是真难题。

一句话点评

67% vs 医生50-55%，但用的是旧版o1，且正文没披露样本量和医生资历，先别太激动。

锐评

这项研究拿一年前的o1模型在真实急诊数据上跑，诊断正确或接近正确的比例达到67%，比参与对比的医生高出12-17个百分点。差距在早期分诊阶段最明显——那时候能拿到的信息最少，模型反而更稳。研究还提到o1在处理结构化病例时临床推理几乎不出错，这点挺有意思，说明模型在信息规整后表现更可靠。但正文没披露样本量有多大、参与医生是什么年资、来自哪家医院。急诊室环境千差万别，如果对比的医生样本偏弱，67%这个数字就要打折。另外研究只测了急诊初诊环节，没碰长期住院数据和影像诊断，这两块恰恰是临床最吃经验的地方。还缺一个关键验证：诊断对了不代表病人预后变好。下一步得看AI系统真的嵌入急诊流程后，能不能缩短分诊时间、减少误诊导致的延误，而不是只在论文里赢过人类。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:53

33d ago

AI HOT 精选· aihot-apiZH18:53 · 05·10

Anthropic 没靠补贴拿下令牌份额第一

OpenRouter 发帖说 Anthropic 在没有补贴的情况下，令牌份额排到了第一。帖子没披露排名方法、具体份额比例和统计周期，所以这个“第一”的含金量还不好判断。

#Anthropic#OpenRouter#Benchmark

精选理由

OpenRouter 令牌份额是开发者真实调用量的一个代理指标，所以 HKR-H/R 通过。HKR-K 不通过，因为缺份额数字、统计周期和榜单口径，信息不足以支撑更高推荐层级。

一句话点评

OpenRouter 说 Anthropic 没补贴也拿下了令牌份额第一，但没给排名方法、具体比例和统计周期，这个“第一”的含金量要打个问号。如果数据真实，说明开发者自掏腰包也愿意用 Claude，对定价和口碑是强信号。缺的是第三方验证和细分场景（比如长上下文 vs 简单问答）的份额分布。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

18:36

33d ago

AI HOT 精选· aihot-apiZH18:36 · 05·10

NousResearch 发了 Hermes 配置 Pareto Code 的文档

文档教你怎么在 Hermes 里设置 Pareto Code，但只给了 OpenRouter 路由配置链接，没提具体参数、版本或跑分。想抄作业的话，信息还不够。

#Agent#Tools#Code#NousResearch

精选理由

HKR 三项全无：内容只是 Hermes/Pareto Code 的配置链接，没有可衡量的结果、机制或落地范围，因此 HKR 0/3，tier 设为 excluded。

一句话点评

NousResearch 发了份文档教你怎么在 Hermes 里配 Pareto Code，但正文只甩了个 OpenRouter 路由配置链接，具体参数、版本、跑分一个字没提。想抄作业的话，信息缺口太大，得自己试。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

15:01

33d ago

AI HOT 精选· aihot-apiZH15:01 · 05·10

Claude 被当成人来养，中期会有啥后果？

这篇帖子认为 Claude 的人格化定位（比如它是唯一有真人名字的 AI、训练方式刻意拟人、Anthropic 内部有“Claude 宪法”约束行为、还有粉丝画卡通形象）从中期看影响深远，好坏难说。但正文没披露任何数据、案例或实测效果，所以这点先别太激动——更像一个观察角度，不是结论。

#Alignment#Safety#Claude#Anthropic

精选理由

H和R通过，但K缺新数据、案例或可验证机制。Claude人格化评论符合受众兴趣，但证据太单薄，分数压在60–71区间。

一句话点评

Claude是唯一有真人名字的AI，训练方式刻意拟人，还有内部“宪法”约束行为，粉丝甚至画卡通形象。这种人格化定位中期影响深远，好坏难说。但正文没披露任何数据、案例或实测效果，所以这点先别太激动——更像一个观察角度，不是结论。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

13:51

34d ago

AI HOT 精选· aihot-apiZH13:51 · 05·10

单人48小时、不到10美元，AI把3D教学应用开发门槛打到了零

GPT Images 2和Gemini 3.1 Pro让一个懂生物学的普通人，不用写代码、不用懂3D建模，花两天时间和不到10美元就能做出一个3D教学应用。过去这得一个团队干几个月、烧不少钱。理论上，教师、家长也能自己造虚拟实验室这类互动工具，教育资源不再只属于精英机构。但正文没披露可复现的工作流、代码或产品链接，这点先别太激动。

#Multimodal#Code#Tools#GPT Images 2

精选理由

H和R两条通过：单人低成本做3D教学应用有话题性。K不通过：没有流程、成品链接或可验证的工具链细节，所以分数落在60-71区间。

一句话点评

一个懂生物的人用 GPT Images 2 和 Gemini 3.1 Pro，两天、不到 10 美元就做出了 3D 教学应用，过去这得团队干几个月。门槛确实降了，但正文没给可复现的工作流、代码或产品链接，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

11:01

34d ago

AI HOT 精选· aihot-apiZH11:01 · 05·10

BlackBar：一个给菜单栏加黑条的小工具

开发者 openclaw 为 @useblacksmith 做了个叫 BlackBar 的菜单栏工具，刚发了 v0.1.0 版，GitHub 上有 release 链接。正文没提这工具具体能干嘛、支持什么系统、用什么许可证，目前就是个空壳发布。

#Tools#openclaw#Blacksmith#BlackBar

精选理由

标题只说 BlackBar 菜单栏工具发布了，没有任何功能细节，也看不出和 AI 的明确关联。信息量太低，所以排除。

一句话点评

短评：一个菜单栏工具刚发了个v0.1.0，连功能介绍都没有，先别激动。点评：开发者openclaw为Blacksmith做了个叫BlackBar的菜单栏工具，刚发了v0.1.0版，GitHub上有release链接。但正文没披露这工具具体能干嘛、支持什么系统、用什么许可证，目前就是个空壳发布。对于AI从业者来说，这类工具通常用于快速调用模型或管理API密钥，但信息缺口太大，无法判断是否值...

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

08:36

34d ago

AI HOT 精选· aihot-apiZH08:36 · 05·10

OpenCode 把 Ring 2.6 1T 模型限时免费开放了

OpenCode 临时开放了 Ring 2.6 1T 模型的免费访问，支持 256K 上下文窗口、推理能力，且是纯文本模型。但正文没披露免费截止日期，想用的话得抓紧，别指望长期白嫖。

#Reasoning#OpenCode#AntLingAGI#novita_labs

精选理由

这是一条小产品开放消息：H来自1T免费试用这个钩子，K来自256K上下文等细节。免费期限、定价和评测都没提，所以分数卡在60-71之间。

一句话点评

OpenCode 临时把 Ring 2.6 1T 模型免费开放了，支持 256K 上下文和推理，纯文本模型。但正文没披露免费截止日期，想用的话得抓紧，别指望长期白嫖。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

03:32

34d ago

AI HOT 精选· aihot-apiZH03:32 · 05·10

七个月用AI搭一个一人公司，月入7万

Anthropic联合创始人说首个十亿美元一人公司快出现了，但普通人更实际的目标是月入7万。路线分七步：选一个具体、能重复做的付费任务；把系统提示词写成详细的岗位描述；用MCP工具链把AI连进实际工作流，实现自动化；反复调提示词；最后系统自己跑，创始人每周只花少量时间处理异常。关键不是技术多完美，而是找到别人愿意付钱的痛点，快速给个能用的方案。正文没披...

#Agent#Tools#Anthropic#Commentary

精选理由

HKR三项都过，但这是一条X上的路线图帖子，不是产品发布或命名实验。正文没有给出公司案例、收入证明或可复现的结果，所以放在较低的“all”档。

一句话点评

短评：月入7万路线图，核心是找付费痛点+自动化，但正文没披露具体案例和收入验证。点评：Anthropic联合创始人说首个十亿美元一人公司快出现了，但普通人更实际的目标是月入7万。路线分七步：选一个具体、能重复做的付费任务；把系统提示词写成详细的岗位描述；用MCP工具链把AI连进实际工作流，实现自动化；反复调提示词；最后系统自己跑，创始人每周只花少量时间处理异常。关键不是技术多完美，而是找...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:25

34d ago

AI HOT 精选· aihot-apiZH02:25 · 05·10

Lee Robinson 的 11 条求职建议：简历一页、GitHub 秀代码、别用 AI 写求职信

Lee Robinson 从大量审阅简历的经验出发，给工程师 11 条求职建议。核心是简历要简洁专业：限制一页、别放照片、GitHub 展示代码而非装饰。个人网站和 LinkedIn 要用心维护，X 内容得清理。申请时针对不同公司调整重点，务必提 AI 技能（顺应趋势），项目重质不重量。别用 AI 生成求职信和简历，保持真实。展示个人爱好能帮建立人际连...

#Code#Lee Robinson#GitHub#LinkedIn

精选理由

这是通用的工程师求职建议，不是AI行业新闻。HKR-R靠就业焦虑勉强通过，但HKR-H和HKR-K都不达标，低相关性让它不值得收录。

一句话点评

Lee Robinson 给工程师的 11 条求职建议，核心是简历一页、不放照片、GitHub 展示代码而非装饰。个人网站和 LinkedIn 要用心，X 内容得清理。申请时针对不同公司调整重点，务必提 AI 技能（顺应趋势），项目重质不重量。别用 AI 生成求职信和简历，保持真实。展示个人爱好能帮建立人际连接。短评：建议偏常识，但“别用 AI 写求职信”这点值得留意——HR 可能已经看腻了。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

AX 严选 · 2026-05-10

更多

频道

后台