ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
44 srcsignal 72%cycle 04:32

全部 · 2026-03-12

6 items · updated 3m ago
RSS live
2026-03-12 · 星期四2026年3月12日
22:23
45d ago
● P1MIT 科技评论· rssEN22:23 · 03·12
一名国防官员披露 AI 聊天机器人如何用于目标排序决策
一名美国国防官员称,五角大楼可把目标清单输入生成式 AI,由模型按飞机位置等因素排序,并给出先打击建议,再由人工复核。正文举例称,这类系统可叠加在 Maven 之上以加快检索和分析;提速幅度正文未披露,官员也未确认这已在实战中使用。真正值得盯的是,聊天式输出更易调用,但比 Maven 的地图界面更难核验。
#Agent#Vision#Safety#Pentagon
精选理由
这条拿满 HKR:标题把聊天式 AI 接进目标排序,冲击感够强;正文也给出可讨论的机制,含人工复核和叠加 Maven 的路径。我给 80 分,不再上调,因为官员描述的是“可如何使用”,提速数据和实战部署都未确认。
编辑点评
五角大楼把生成式 AI 接到目标排序链路里,这不是“多一层助手”,而是在把核验负担转嫁给最后那个点确认的人。
深度解读
五角大楼这次透露的关键信号很直接:生成式 AI 可以接收目标清单,并按飞机位置等条件给出先打击建议。我的判断是,这一步比很多“AI 参与军事决策”的表述更靠近武力使用本身。官员一直强调有人复核,但这套说法我不太买账。正文没有披露提速幅度、误报率、复核时长,也没说明模型输出会不会附带证据链。没有这些,所谓 human review 很容易沦为 legal air cover,不是实质制衡。 问题不在于模型会不会“直接开火”。问题在于目标排序本身就是决策。你把 20 个候选目标排成 1 到 20,前 3 个先打,后果已经被重写了。军事系统里最危险的自动化,常常不是最终按钮,而是把人的注意力、时间预算、怀疑阈值都压到一个更窄的窗口里。文章自己其实已经点到这层:Maven 的地图界面逼着人看地理关系和友军位置,聊天式输出读起来更快,核验却更难。这个变化很像把“看传感器”改成“看摘要”。在高压场景里,摘要通常赢。 这里有个现成参照。2024 年多家媒体报道过以色列在加沙使用 Lavender、Gospel 一类系统做目标筛选和优先级分发,争议点从来不是有没有人在回路里,而是人均审查时间被压到几秒到十几秒。具体数字各家报道口径不一,我不想硬引。但那个教训很清楚:一旦系统先给出名单和排序,人类复核常常是在追认,不是在独立判断。美国军方现在给出的叙事,和当时那套“机器提议、人来批准”非常接近。差别只在界面从 dashboard 变成 chatbot,审计难度反而更高。 再往前看,Maven 2017 年启动时用的是更传统的计算机视觉路线。那类系统至少还能把框、轨迹、热区直接叠在图像或地图上。生成式 AI 接上去以后,用户得到的是语言结论。语言结论的麻烦在于,它天然会压平不确定性。模型即便内部只是基于不完整数据做模式匹配,输出也会长得像“有依据的参谋意见”。这和 GPT、Claude、Grok 在企业知识库场景里的幻觉问题是同一类机制,只是企业里错的是报表,战场上错的是人命。 我对文中另一条线也有疑虑:OpenAI、xAI、Anthropic 在涉密环境里可用,不等于它们适合承担 targeting workflow。模型能进密网,只说明部署和合规过了一关,不说明评估过关。正文没披露任何红队结果,也没说是否做过对抗样本测试,比如坐标扰动、时间戳过期、友军标记缺失、传感器冲突这几类常见脏输入。军用场景里,最不该接受的说法就是“先上,再靠人兜底”。如果没有针对排序错误的专门评估,聊天机器人只是在把 Maven 的脆弱点换一种形式放大。 还有个政治层面的变化不能忽略。文章把近期伊朗学校袭击、过时目标数据、AI 使用争议放在同一篇里,这不是陪衬。它说明军方正试图在舆论高压下,提前为“AI 参与但非 AI 决定”这套责任结构定口径。说真的,这种口径我见得太多了。系统负责缩短链路,人类负责承担后果,供应商负责强调有使用限制,最后没有任何一方完整拥有因果链。 所以这条新闻的重点,不是 Pentagon 是否已经让 ChatGPT 或 Grok 决定打谁。正文明确没确认。重点是 targeting 这条链路里,排序、摘要、建议这三个环节已经被默认为可以语言模型化。门一旦开了,后面争的就不是“能不能用”,而是“证据展示要到什么粒度、人工复核要花几分钟、谁来留审计日志”。这些要是还没有硬规则,那“人在回路里”只剩一句公关话。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
13:02
46d ago
MIT 科技评论· rssEN13:02 · 03·12
《Download》:中国 OpenClaw 热催生安装生意,美国电池业转冷
MIT Technology Review 报道,中国工程师 Feng Qingyang 1月接触 OpenClaw 后,数周内把安装副业做成超100人团队,累计完成7000单。另一条主线是美国电池业转冷,估值曾超10亿美元的 24M Technologies 据报正关闭;这不是单一公司失手,而是需求、融资和新化学路线一起降温。
#Agent#Tools#Feng Qingyang#24M Technologies
精选理由
HKR-H 与 HKR-R 成立:百人团队和 7000 单让中国 AI 安装潮有了可讨论的样本。HKR-K 偏弱,正文没交代 OpenClaw 的机制、价格和复现条件,且电池副线分散主题,信息密度只够 all。
编辑点评
OpenClaw 在中国几周催生 7000 单安装生意,先跑出来的不是模型壁垒,是灰产化服务链。
深度解读
OpenClaw 先催生了 7000 单安装服务,这条新闻里最硬的信号不是工具多强,而是中国消费侧对“可代操作 AI”几乎零等待。一个北京工程师 1 月上手,几周内拉起 100 多人团队,这说明门槛根本不在模型推理,而在部署、调参、代装、售后这些脏活累活。每次 agent 工具冒头,最先赚到钱的常常不是底模公司,而是把不稳定系统包成可交付服务的人。去年 Manus、Computer Use、Rabbit 式演示火的时候,圈内就已经反复出现同一幕:demo 很顺,真实设备环境一落地,全是权限、浏览器、验证码、远控和失败重试的问题。OpenClaw 这波看着也是这个结构。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
10:42
46d ago
Google 研究院· rssEN10:42 · 03·12
Google Research 推出 Groundsource:用 Gemini 把新闻报道转成数据
Google Research 介绍 Groundsource,条件只有标题:它用 Gemini 把新闻报道转成数据。RSS 片段正文为空,发布时间、输入形式、抽取字段、评测数字都未披露。真正该盯的是可复现细节;现在能确认的只有产品名、Gemini 参与,以及面向新闻数据化这个方向。
#Tools#Google Research#Gemini#Groundsource
精选理由
现在能确认的只有 Google Research 发布 Groundsource,并用 Gemini 处理新闻数据化。HKR 只命中 H;K 缺少机制、字段和评测,R 也没落到采编或数据业务影响,所以放在低分 all,不进 featured。
编辑点评
Google Research 只放出一个标题。没有字段、评测、输入样例的“新闻转数据”,我先不买账。
深度解读
Google Research 这次只公布了 Groundsource 这个名字,并说它用 Gemini 把新闻报道转成数据;发布时间有 1 个时间戳,正文对输入格式、抽取字段、评测数字都未披露。我的判断很直接:这条现在还不够构成能力声明,它更像方向预告,不像可验证发布。 我对“把新闻变成数据”这句口号一直比较警觉。新闻抽取不是新问题,GDELT、Diffbot、Event Registry 这类系统很多年前就在做,区别从来不在“能不能抽”,而在 3 个硬指标:schema 是否稳定、跨来源冲突怎么解、时间更新后的回填怎么做。标题只给了 Gemini 参与,这离可用还差很远。要是没有明确 schema,模型今天抽 company、tomorrow 抽 organization,数据仓库直接烂掉。要是没有 source attribution 和 confidence,后续分析根本没法审计。 Google 自己其实最该知道这件事有多难。Gemini 近一年的长上下文和工具调用能力确实适合做信息抽取,我记得 Google 在多文档理解、长文处理上一直把这当卖点,但那是模型能力,不等于数据产品成立。数据产品要看 precision、recall、去重率、延迟、人工复核成本。正文一个数都没给,我还没法判断它是 research demo,还是能进生产。 我还有个疑虑:如果 Groundsource 主要依赖通用模型做后处理,成本会很难看。新闻流是高频输入,按篇抽取再做实体对齐,token 成本和人工质检会一起涨。OpenAI、Anthropic、Google 过去一年都在推结构化输出和 function calling,原因很现实:大家都发现“抽成 JSON”比“写得像懂了”难得多。Groundsource 要证明自己,至少得拿出一组可复现样例:给 100 篇新闻、定义 20 个字段、报 F1 或人工一致性,再说多语种和时效。现在只有标题,我只能把它看成 Google 在给 Gemini 找一个很顺的展示场景,不把它当成熟系统。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H1·K0·R0
08:01
46d ago
阮一峰的网络日志· rssZH08:01 · 03·12
零安装“云养虾”:ArkClaw 使用指南
字节把 ArkClaw 作为 Coding Plan 绑定服务推出,Pro 首月49.9元可长期使用,Lite 首月9.9元仅免费体验7天。文中确认 ArkClaw 在火山方舟云主机预装 OpenClaw,支持飞书、钉钉、企业微信消息绑定,网页终端显示底层为 Ubuntu;正文未披露长期续费价格与主机规格。真正值得盯的是,它把云端代理、模型配额和消息推送绑成一套,省掉本地安装,但能力边界仍取决于 OpenClaw 与所加载 Skill。
#Agent#Tools#Memory#ByteDance
精选理由
H、K 有信息量:标题有反差,正文也给出49.9/9.9元、7天体验和预装 OpenClaw。分数仍压到 excluded,因为题材是火山方舟托管服务的使用指南,命中云厂商促销;长期续费、主机规格和独立效果验证都未披露。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H1·K1·R0

更多

频道

后台