ax@ax-radar:~/curated $ grep -l 'curated=true' sources/
41 srcsignal 72%cycle 04:32

AX 严选 · 2026-05-12

28 · updated 3m ago
按日期浏览清除筛选
2026年6月
138235332422532610788299441029112912151371415161718192021222324252627282930
2026-05-12 · 星期二2026年5月12日
17:54
31d ago
● P1AI HOT 精选· aihot-apiZH17:54 · 05·12
Anthropic 为法律行业发布 Claude 插件和 MCP 连接器
Anthropic 发布了 20 多个 MCP 连接器和 12 个法律专用插件,让 Claude 能直接操作合同管理系统、研究平台、文档管理和电子取证软件。具体来说,它可以在 Word 里起草和修改合同,在 Outlook 里处理日常法律流程,还能做条款对比。正文没披露这些工具的实际准确率、客户测试数据或定价,所以效果和成本现在还没法判断。
#Agent#Tools#Anthropic#Claude
精选理由
Anthropic 这次不是发模型,而是给 Claude 配了一套法律行业的“工具包”:20 多个 MCP 连接器加 12 个插件,直接嵌进 Word 和 Outlook 里干活,合同起草、修订、条款比对都能做。我会先打个折——正文没披露这些连接器具体覆盖哪些系统、插件是自己做的还是第三方接的,也没给实际客户案例或效率数据,所以“省了多少时间”现在说不清。但方向很明确:让模型进业务流程干活,而且选了一个对准确率要求极高、人工成本也高的行业。如果是真的跑通了,律所和法务团队的重复劳动会被吃掉一大块。这点先别太激动,等看有没有律所站出来说实测结果。
一句话点评
Anthropic 给法律行业打包了 20 多个外接软件连接器和 12 个专用插件,但没公布实际律所测试数据和出错率。
锐评
Anthropic 这次不是发新模型,而是给 Claude 配了一套法律行业的“外挂工具包”:20 多个 MCP 连接器用来打通合同管理、电子取证、文档系统这些律所日常软件,12 个插件针对具体法律业务场景做定制。说白了就是让 Claude 能直接读你系统里的案卷、合同,而不是靠人复制粘贴。 文章提到法律从业者是 Claude Cowork 功能里最活跃的知识工作者群体,这个数据挺有意思,说明律师们确实在用。但整篇博文没给出任何一家律所的实际部署案例,也没提幻觉率、引用准确率这些法律场景最要命的指标。法律文书错一个条款引用就是大麻烦,光说“连接上了”不够。 还缺的东西很明确:第三方律所的测试反馈、具体任务上的准确率对比、以及这套工具包到底怎么收费。没有这些,这更像一份产品路线图而不是交付证明。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
17:34
31d ago
● P1AI HOT 精选· aihot-apiZH17:34 · 05·12
谷歌在 Android Show 2026 上发了新助理 Android Intelligence,能跨 App 自动干活
谷歌这次推的 Android Intelligence 是一个系统级智能助理,主打跨安卓应用的多步骤自动化任务,比如你让它订咖啡、回消息、填表,它可以自己切 App 完成。Chrome 里的 Gemini 也加了浏览器操作能力,能直接帮你操作网页。另外还有语音笔记转文字功能叫 Rambler,以及可以自定义的生成式 UI 小组件。整场发布没提具体推送时...
#Agent#Tools#Audio#Google
精选理由
这条消息抓人是因为安卓系统级的智能助理,能跨 App 自动操作,不是某个 App 的小修小补。具体放出的功能点挺实在:Chrome 里让 Gemini 直接帮你用浏览器、自动填表、语音转文字,还有可定制的小组件,都是开发者能马上摸到的界面。正文没给技术细节和实际延迟数据,所以效果先打个折。但这件事本身是移动 AI 代理的卡位战,对做工具和分发的团队来说,风向意义大于单点功能。
一句话点评
谷歌把 Gemini 塞进安卓系统层,能跨 App 自动干活了,但正文没提推送时间、支持机型和收费方式,先别急着换手机。
锐评
这次 Android Intelligence 的核心是把助手从“回答问题”变成“动手操作”:它能自己切 App 帮你订咖啡、回消息、填表,Chrome 里的 Gemini 也能直接操控网页。这比之前单 App 内的 AI 功能进了一步,相当于让模型进入业务流程干活。但整场发布没披露具体推送时间、哪些设备能用、是否收费,这些信息缺口让实际落地效果要打个折。另外,Rambler 语音笔记转文字和自定义生成式 UI 小组件听起来实用,但没给准确率、延迟或隐私处理细节。对开发者来说,系统级权限和跨 App 调用的稳定性会是关键,目前还看不到技术白皮书或 API 文档。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
17:27
31d ago
AI HOT 精选· aihot-apiZH17:27 · 05·12
Symphony给每个任务单独开一个Codex智能体
Symphony的做法是:每个未完成的任务都配一个常驻的Codex智能体,相当于给每个活儿派一个专属AI助手一直盯着。正文没披露什么条件下会触发、最多能同时跑多少个任务、以及怎么收费,所以实际能用多顺、成本多高还不清楚。
#Agent#Code#Symphony#OpenAI
精选理由
HKR全过,因为工作流挂钩具体,但正文只给了“每任务一个智能体”这个点,触发条件、并发限制和定价全没披露,属于60–71分的小产品更新区间。
一句话点评
Symphony 给每个未完成任务配一个常驻 Codex 智能体,相当于每个活儿都有专属 AI 助手盯着。好处是任务不用排队等调度,但正文没披露触发条件、并发上限和收费方式,实际顺不顺、贵不贵还不清楚。短评:常驻 Agent 听着省心,但并发和成本没交代,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:59
31d ago
AI HOT 精选· aihot-apiZH16:59 · 05·12
AI 取代人类?先看看谁在靠这个说法赚钱
吴恩达说“AI 导致大规模失业”是夸大其词,证据是软件工程师招聘依然强劲、美国失业率也低。他点破背后动机:AI 公司拿员工薪资对标来抬价,企业借 AI 解释裁员,教育机构靠制造焦虑卖课,媒体追流量。实际净增岗位远超替代,AI 改变的是工作性质而非摧毁就业。正文没披露具体净增数据来源,这点先别太激动。
#Andrew Ng#Commentary
精选理由
HKR-H和HKR-R通过:角度有争议性,且紧扣从业者的岗位焦虑。HKR-K不通过:正文没有给出任何可验证的招聘率、失业率数字或机制,停留在观点评论层面,因此归入常规评论区间。
一句话点评
吴恩达给AI失业论泼冷水,核心论据是软件工程师招聘依然强劲、美国失业率低。他点破背后利益链:AI公司拿员工薪资对标抬价,企业借AI解释裁员,教育机构卖焦虑课,媒体追流量。实际净增岗位远超替代,AI改变的是工作性质而非摧毁就业。正文没披露净增数据来源,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
16:08
31d ago
AI HOT 精选· aihot-apiZH16:08 · 05·12
Perceptron Mk1 视觉语言模型上线 OpenRouter,能看视频还能输出空间结构
Perceptron Mk1 是一个能分析视频的视觉语言模型,刚上线 OpenRouter。它最高每秒看 2 帧画面,有 32k 的多模态上下文窗口,可以同时处理文字和图像。亮点是它把点、框、多边形这些空间结构作为主要输出,而不是只给一段文字描述,适合做具身推理或视频理解。不过正文没披露具体价格和延迟,实际跑起来成本高不高、快不快还不清楚。
#Multimodal#Vision#Reasoning#Perceptron Inc.
精选理由
一条小模型上架 OpenRouter 的常规更新,亮点是 2 FPS 视频分析和 32k 多模态上下文,但公司本身没号召力,也没披露成本或应用场景,所以落在 60–71 这个区间。
一句话点评
Perceptron Mk1 是个能看视频的视觉语言模型,刚上 OpenRouter。它每秒最多看 2 帧,有 32k 上下文窗口,输出不是文字而是点、框、多边形这些空间结构,适合做具身推理或视频理解。但正文没披露价格和延迟,实际跑起来快不快、贵不贵还不清楚。 短评:输出空间结构而非文字,适合具身推理;但没价格和延迟,先别激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
15:43
31d ago
AI HOT 精选· aihot-apiZH15:43 · 05·12
Grok 接上 Gmail,用大白话翻邮件
Grok 现在能连你的 Gmail,用自然语言搜邮件、找附件(比如机票、发票)、按发件人或时间段汇总内容,还能提取会议和截止日期,生成摘要。说白了就是把收件箱变成能对话的资料库,不用再手动翻。但正文没披露什么时候开放、要不要额外付费、以及哪些账号能用,这点先别太激动。
#Agent#Tools#Grok#Gmail
精选理由
这是 xAI 一个中等偏小的产品更新,来源只有 X 上一条消息。上线范围、权限模型和收费方式都没披露,所以放在 all 而不是 featured。
一句话点评
Grok 现在能直接连 Gmail,用自然语言搜邮件、找附件、按人按时间汇总,还能提取会议和截止日期。说白了就是把收件箱变成能对话的资料库,不用再手动翻。但正文没披露什么时候开放、要不要额外付费、以及哪些账号能用,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
14:46
31d ago
AI HOT 精选· aihot-apiZH14:46 · 05·12
Runway 办了个“还没拍出来的节目”提案赛,二十强出炉
Runway 搞了个叫“尚未存在的节目”的提案比赛,刚公布了二十位获奖者,前五名的提案展示已经可以看。正文没披露评委是谁、奖金多少、评选标准是什么,所以目前只能当个创意征集活动来看,离实际落地还有距离。
#Commentary
精选理由
HKR里H勉强过关,因为比赛概念有点新鲜感;但K和R都不行——这读起来像Runway社区的一个比赛通知,没有评审细节、奖金条款、制作计划或产品机制,对AI从业者来说信息量不足。
一句话点评
Runway 搞了个“尚未存在的节目”提案比赛,刚公布二十强,前五名展示已可看。目前信息有限,评委、奖金、评选标准都没披露,只能当创意征集看,离落地还远。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K0·R0
13:24
32d ago
AI HOT 精选· aihot-apiZH13:24 · 05·12
微软发布材料科学多任务模型MatterSim-MT,可同时模拟多种物性
微软研究院的MatterSim团队推出了MatterSim-MT,一个能同时模拟多种材料物性(不止是势能面)的多任务模型。正文没披露模型参数量、训练数据规模、具体评测基准以及是否开源,所以目前没法判断它比单任务模型强多少、成本高不高。如果真能一个模型搞定多个物性模拟,对材料筛选这类场景会省不少事,但具体效果还得等更多细节。
#Reasoning#Microsoft Research#MatterSim#Research release
精选理由
触发硬排除规则4:材料科学AI交叉,没有agent或产品落地含义。HKR-K 有模型名和能力描述,但参数、数据集和评测结果均未披露,信息缺口明显。
一句话点评
微软研究院的MatterSim-MT号称能同时模拟多种材料物性,不止是势能面。但正文没披露模型参数量、训练数据规模、具体评测基准以及是否开源,所以目前没法判断它比单任务模型强多少、成本高不高。如果真能一个模型干多个活,对材料筛选这类场景会省不少事,但具体效果还得等更多细节。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H0·K1·R0
10:04
32d ago
AI HOT 精选· aihot-apiZH10:04 · 05·12
GPT-4o + Kling AI 联手生成超写实 F1 直播截图,连压缩伪影都复刻了
有人用 GPT image 2(GPT-4o 的图片生成功能)和 Kling AI,按详细提示词合成了一张 F1 电视转播视角的截图。画面里一位年轻女性戴着赛车耳机、神情紧张,身份特征从参考图里保住了;背景加了“FINAL LAP”横幅、计时塔和直播标识。最狠的是连压缩伪影、肤质和 8K 画质都模拟了,看起来就像真从电视上截的。不过正文没披露用了多少样...
#Multimodal#Vision#Kling AI#GPT
精选理由
HKR 的 H 和 R 都达标,但正文就是一个生成演示,没给完整提示词、设置或可复现的测试。没有产品发布或新能力展示,所以兴趣度偏低。
一句话点评
有人用 GPT image 2 + Kling AI 按提示词合成了一张 F1 电视转播截图,连压缩伪影和 8K 画质都模拟了,看起来像真从电视上截的。身份特征从参考图保住了,背景加了“FINAL LAP”横幅和直播标识。但正文没披露用了多少样本、跑了多少轮,也没说参考图分辨率多高、有没有人工精修。如果真能一张图搞定广播级细节,那做广告素材或影视预可视化能省不少钱。不过目前只是单张 demo...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
03:08
32d ago
AI HOT 精选· aihot-apiZH03:08 · 05·12
答案之外:信息呈现方式正成为AI智能层的一部分
SiliconFlowAI 认为,让大模型输出 HTML 比默认的 Markdown 能做出更丰富的排版和交互,是个值得试的技巧。长远看,人类喜欢用语音输入,但视觉(图像、动画、视频)才是更好的输出形式——因为大脑约三分之一的皮层专门处理视觉。AI 输出会沿着“原始文本→Markdown→HTML→交互式神经视频/模拟”这条路演进,最终可能由扩散模型直...
#Multimodal#Vision#Tools#SiliconFlowAI
精选理由
H和R靠输出格式这个角度勉强过关,但K完全不过:没有数据、实验、来源或具体案例支撑,按硬排除规则6,分数压在40以下。
一句话点评
短评:输出格式从 Markdown 换 HTML 就能提升交互,这招成本低、见效快,值得一试。但别急着吹“视觉革命”,正文没披露具体效果和用户反馈。 SiliconFlowAI 提了个实用技巧:让大模型输出 HTML 而非默认 Markdown,能直接做出更丰富的排版和交互,比如按钮、图表。这招几乎零成本,适合快速提升产品体验。长远看,他们画了条路线:原始文本→Markdown→HTML→...
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H1·K0·R1
02:19
32d ago
● P1AI HOT 精选· aihot-apiZH02:19 · 05·12
Mira 的新公司 Thinking Machines 发了个原生多模态交互模型,前台 200 毫秒一响应,后台跑长线推理
这个模型把音频、视频、文字直接吃进去,不用再靠 agent 把一堆独立模型串起来。前台交互模型每 200 毫秒处理一次输入,保持对话的实时感,用户可以随时打断;后台推理模型负责长程规划和调工具。正文没披露具体参数量、训练数据和成本,也没给评测对比,所以实际效果和泛化能力还得看后续公开信息。
#Multimodal#Audio#Tools#Thinking Machines
精选理由
我会先打个折:正文没披露定价、开放范围和具体 benchmark,所以只能按现有信息给到 87。亮点在于 Thinking Machines 没有只发模型权重,而是给了一套前台 200 毫秒交互节点加后台推理的分层设计,原生多模态输入不是后期缝合的。这对正在折腾实时多模态 agent 的团队来说,至少提供了一个可参考的架构思路,但没看到代码或论文之前,不宜再往上拉。
一句话点评
Thinking Machines 发了个原生多模态交互模型,前台 200 毫秒一刷保持实时感,后台另跑推理做重活。正文没给参数量、训练数据和评测,效果先打七折。
锐评
Mira Murati 离开 OpenAI 后搞的 Thinking Machines 终于亮出了第一个产品。这个模型最大的卖点是原生多模态,音频、视频、文字一口吃进去,不用像现在很多方案那样靠 agent 把语音识别、视觉、语言模型串成流水线。架构上分了两层:前台交互模型每 200 毫秒处理一次输入,保证对话不卡顿,用户可以随时插话打断;后台推理模型负责长程规划和调工具。这种设计思路挺务实,把实时交互和重度推理拆开,各干各的。 但正文没披露任何硬指标。参数量多大、训练数据从哪来、推理成本多少、跟 GPT-4o 或 Gemini 的对比评测,一概没有。200 毫秒的响应间隔听起来不错,可如果后台推理要等好几秒,前台再快也只是在拖时间。另外,原生多模态听着高级,实际能不能稳定处理嘈杂环境下的语音、模糊视频画面,还得看后续公开的测试结果。 现在还缺的是第三方实测和开放试用。光靠一篇公告没法判断这个模型到底比现有方案强在哪,建议等有公开 benchmark 或 demo 再下结论。
HKR 分解
hook knowledge resonance
打开信源
87
SCORE
H1·K1·R1
00:39
32d ago
AI HOT 精选· aihot-apiZH00:39 · 05·12
Cursor 现在能装进 Microsoft Teams 了
Cursor 官方宣布支持 Microsoft Teams 集成,加上已有的 Slack 和 Linear,凑齐了三种办公协作工具。如果你公司用微软全家桶,Teams 是绕不开的入口,这个集成能省掉来回切换的麻烦。不过正文没披露具体能做什么(比如能不能在 Teams 里直接调 Cursor 写代码)、权限怎么管、什么时候上线、要不要额外付费——目前只给...
#Tools#Cursor#Microsoft Teams#Slack
精选理由
HKR-K 和 HKR-R 基于 Cursor 一个小的工作流更新通过,但 HKR-H 偏弱。正文只确认了 3 种集成;权限、具体操作和价格均未披露,所以留在 all 层级。
一句话点评
Cursor 集成了 Teams,加上已有的 Slack 和 Linear,凑齐三大办公协作入口。对微软全家桶用户来说,省掉来回切换的麻烦。但正文没披露具体能做什么(比如能不能在 Teams 里直接调 Cursor 写代码)、权限怎么管、什么时候上线、要不要额外付费——目前只给了安装链接。 短评:集成入口是好事,但功能细节全缺,先别激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1

更多

频道

后台