全部 · 2026-02-19

▸ 5 items · updated 3m ago

2026年2月

一二三四五六日

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 262 2722 285

2026年3月

一二三四五六日

13 22 35 44 519 616 71 81 97 109 117 126 137 14 15 167 1711 1844 1984 2069 2132 2241 2375 2477 2579 2670 2756 2824 2932 3058 3185

2026年4月

一二三四五六日

198 2101 379 432 535 691 7126 8129 9112 1087 1142 1271 13159 14140 15122 16246 1781 1853 1960 20347 21687 22363 23348 24256 259 26 273282930

2026-02-19 · 星期四2026年2月19日

16:00

67d ago

MIT 科技评论· rssEN16:00 · 02·19

Microsoft 提出在线识别AI篡改内容的技术方案

Microsoft 评估了 60 种内容溯源、数字水印和指纹组合，并向 MIT Technology Review 提出一套在线标注 AI 篡改内容的技术蓝图。文章称该方案只判断内容来源与是否被操纵，不判断真伪；现有平台审计里仅 30% 测试帖被正确标注，真正值得盯的是标准落地和平台是否愿意执行。

#Safety#Tools#Microsoft#MIT Technology Review

精选理由

这篇稿子在 HKR 三项都成立：标题抓人，正文有 60 组方案和 30% 正确标注率两个硬信息，议题也直指平台信任基础设施。分数停在 featured，不再上提，因为它讲的是技术蓝图与标准落地难题，不是已经大规模部署的产品更新。

编辑点评

微软只拿出一张“真实性蓝图”，没给标准名、时间表、参与方；这更像先抢规则话语权，不是马上能落地的解法。

深度解读

微软提交了一套在线真实性证明蓝图，但正文没给标准名、落地时间、合作平台。我的判断很直接：这不是“识别 AI 内容”的技术突破，而是微软在抢下一轮内容认证规则的位置。我一直觉得，内容真实性这件事最难的环节从来不是研究团队写出规范，而是平台、模型厂商、创作者工具、终端系统愿不愿意一起埋点。文章只说微软 AI 安全团队评估了数字篡改记录方法，面向互动式深度伪造和高拟真模型提出技术标准；问题是，没有标准名，你就没法判断它到底是在讲 C2PA 这一类 provenance 方案，还是在讲水印、签名、硬件级采集链路，或者几种东西的混合。标题已经给出“prove what’s real online”，正文没披露验证对象、失败率、威胁模型，这个口径其实很容易被高估。回到上下文看，这条并不新。Adobe、Microsoft、BBC、Nikon 那批公司过去几年一直在推 C2PA，OpenAI 去年也谈过图像来源标记，Google 在 SynthID 上押过水印路线。行业已经反复证明一件事：单点技术都不够。水印会被裁剪、重编码、截图链路打掉；元数据会在平台转码和搬运中丢失；即便签名保住了，用户也未必会点开看。Meta、X、TikTok 这种分发平台如果不把“认证状态”做进排序、标注、下架策略，真实性证明就只是文件里多一层说明书。说真的，我对很多公司把 provenance 讲成“解决深伪”的口气一直不太买账，它更像法证和责任归属工具，不是内容鉴伪银弹。微软现在发这条，我看更像是提前占位。原因也不复杂：互动式深度伪造已经从静态图片走向实时音视频，风险从“假图传播”变成“实时冒名、实时诈骗、实时操纵”。这类场景里，事后取证价值还在，但用户决策窗口只剩几秒。你给一段视频补完整来源链，不等于你能阻止一次 Zoom 诈骗、一次直播带节奏、一次伪造客服通话。文章没写实时验证延迟、客户端展示方式、跨平台传递机制，这些才决定它能不能进产品。还有一个我比较在意的点：如果微软推的是标准，它自己的激励并不完全中立。它同时有模型、云、企业软件、操作系统、搜索分发触点。标准一旦被大平台采纳，谁最容易把签名、密钥管理、身份绑定、企业合规打包卖出去？大概率还是微软、Adobe、Google 这种 already-in-the-stack 的厂商。规则当然需要有人推，但“为了安全”与“为了把基础设施入口握在手里”经常是同一件事。这个说法我没有正文证据，只能说按过去一年各家对水印和 provenance 的推进路径看，这个动机非常现实。我还有个疑虑。文章把“证明什么是真的”说得很大，听起来像要给互联网加一层真伪底座。可现实是，未来几年更常见的状态不是“真假分明”，而是“有来源声明的内容”和“没有来源声明的内容”并存。没有声明，不等于一定是假；有声明，也不等于上下文没被误导性剪辑。平台如果把未签名内容一律降权，会伤到大量普通用户和独立创作者；如果不降权，标准又没有约束力。这就是 adoption 的死结。所以我对这条的结论是：方向没错，叙事偏大，关键变量全在微软之外。要判断它是不是一条硬新闻，至少还得补四个信息：标准名称、有哪些模型公司签、哪些社交平台接、用户界面怎么显示。缺一项，它都更像政策倡议，不像产品事实。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

13:10

67d ago

MIT 科技评论· rssEN13:10 · 02·19

The Download：自主贩毒潜艇，与“道德作秀”聊天机器人

MIT Technology Review 2月19日一期《The Download》汇总两条主线：无人贩毒潜艇正因 Starlink、即插即用船舶自动驾驶和高清摄像头进入新阶段。另一条是 Google DeepMind 要求像测代码和数学能力那样审查 LLM 的道德行为；正文只给出方向，未披露评测框架、数据集或时间表。

#Alignment#Safety#Benchmarking#Google DeepMind

精选理由

这是一篇混合话题的 newsletter roundup，标题有点击力，但 AI 部分只抛出 DeepMind 想评测 LLM 道德行为这个方向。正文未给出评测机制、数据集或落地时间，另一半又偏离 AI 产品与代理主线，所以分数落在低位 all。

编辑点评

DeepMind 把道德评测抬到代码同级，这步方向没错；只要没任务定义和标注规则，它很快就会滑成价值观公关。

深度解读

DeepMind 先把道德评测提到代码同级，问题才算说对了一半。正文只给出方向，没给框架、数据集、时间表，也没说“道德行为”落在哪些可测任务上。信息缺口很大，所以我对“virtue signaling”这个标题有点保留；标题在挑衅，材料还没到能下重结论的程度。我一直觉得，这类事最难的不是让模型说出一套漂亮原则，而是把原则压成可复现的判分标准。代码有 HumanEval、SWE-bench、AIME 这类相对清楚的目标。道德行为没有这种天然标尺。你让模型做陪伴、治疗、医疗建议、代理执行，至少要拆成 3 类：一是识别风险，二是拒答或升级人工，三是在允许范围内给出稳健建议。每一类都要有失败定义。比如自伤诱导、妄想迎合、越权医疗建议，这些可以标红线；“是否显得温暖”“是否体现美德”这种就很容易被标成审美题。文章外的上下文其实很多。Anthropic 早年就拿 HHH 讲 helpful、harmless、honest，OpenAI 这两年也一直用 Model Spec 约束高风险场景回复。问题是，这些工作大多擅长写原则和案例，不擅长给出像 SWE-bench 那样能反复跑、跨模型比较、还能防刷分的硬基准。我印象里，过去一年公开讨论最多的是 sycophancy、reward hacking、persona drift：模型会迎合用户，会学会“看起来负责”，不等于真可靠。要是 DeepMind 这次只测“模型会不会说正确的话”，那就是把表演能力当成品行。我对这条还有个更实际的 pushback。现在最危险的场景，已经不是单轮聊天，而是 agent 能调用工具、改日程、发消息、下单、搜索病症。道德评测如果不把工具使用算进去，就会失焦。一个模型口头上会提醒风险，行动上却照样执行高风险步骤，这种失配在 agent 系统里很常见。正文没披露是否覆盖 action-taking，也没说评测是在纯文本、沙盒工具，还是带真人反馈环境里跑。另一条被放在同一期里的无人毒贩潜艇，其实也提醒了同一个现实：便宜、即插即用、可远程控制的组件，会把风险扩散得比治理快。LLM 也是这样。先被大规模部署到情感陪伴、医疗分诊、教育辅导，再补做道德基准，顺序上已经偏晚。说真的，我支持 DeepMind 把这件事拉进正式评测体系，但我不买“只要开始测就算解决了一大步”这个说法。没有任务边界，没有标注治理，没有跨文化分层报告，道德评测最后多半只会产出一张很好看的雷达图。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

11:00

67d ago

MIT 科技评论· rssEN11:00 · 02·19

无人贩毒半潜艇如何改变哥伦比亚毒品贸易

哥伦比亚军方2025年4月在Tayrona国家公园外拦截一艘40英尺无人贩毒半潜艇，并确认其配有自动驾驶、监控摄像头和两块Starlink天线。正文称该艇是首艘确认的哥伦比亚无人贩毒半潜艇，疑似Clan del Golfo原型；常规半潜艇造价100万至200万美元，可运3吨可卡因，在欧洲批发价超1.6亿美元。真正值得盯的是现成自动驾驶和卫星联网已把“去船员化”变成可复用路径，跨洋走私的风险—成本比在变。

#Agent#Robotics#Tools#Clan del Golfo

精选理由

这篇稿子有 HKR-H 和 HKR-K：无人半潜艇进入毒品运输，且正文给出自动驾驶、摄像头、两块 Starlink、3 吨运力和 100万至200万美元造价。分数压在 60 段，因为它更像双用途自主系统的安全报道，不是 AI 行业本身的产品、模型或研究更新。

编辑点评

哥伦比亚军方截获1艘配Starlink的无人半潜艇，这不是走私奇闻，是现成自动驾驶开始外溢到灰黑产业。

深度解读

哥伦比亚军方在2025年4月截获1艘40英尺无人半潜艇，并确认艇上有自动驾驶、摄像头和2块Starlink天线。我的判断很直接：这条的冲击不在贩毒，而在技术扩散门槛已经低到犯罪组织也能把“无人航运”拼出来。以前半潜艇的壁垒是船体隐身、航程和船员承受力；现在船员这一环开始被拿掉，风险函数就变了。文章给了几个够硬的数。常规半潜艇造价100万到200万美元，可运3吨可卡因，欧洲批发价超过1.6亿美元。按这个账，哪怕原型艇连续损失几艘，经济上也能成立。更关键的是，自动驾驶、卫星联网、远程视频监控都不是军用品。Starlink 终端、船用 autopilot、现成摄像头，本来就活在渔船、游艇和低成本无人系统供应链里。你把这些模块装进一条40英尺玻璃钢壳体里，工程难度不低，但已经不是“国家级能力”。这点我觉得比“首艘无人贩毒潜艇”这个标题更扎实。这事跟 AI/机器人圈的关联，也不是“犯罪用了 AI”这么浅。它更像过去一年大家反复看到的那条线：通用自主能力先在便宜硬件上落地，再迅速流向监管最薄的边缘场景。2024年以后，乌克兰战场上的海上无人艇、廉价 FPV、商用卫星链路，已经把这个剧本演过一遍。民用导航、视觉回传、链路冗余、简单任务规划，一旦足够便宜，扩散速度通常快过法规。这里未必需要大模型，也未必需要很强的自主决策；只要能做航线保持、避开基础风险、掉线后继续跑预设任务，收益就够高。我对文中的一个叙事有点保留：它把“无人化”讲得像远洋走私马上要规模化升级。现有信息还不够。正文是 RSS 片段，没披露控制链路结构、续航、抗干扰能力、海况适应、失联后的 fail-safe，也没说这艘艇有没有真实完成过长距离测试。装了 Starlink 不等于稳定可控，海面遮挡、天线暴露、供电、盐雾、电子战环境都会吃掉可靠性。自动驾驶也分等级，能沿预设航线跑，和能在复杂海况里长期自主避碰，是两回事。标题给出了方向，正文没给出验证强度，我不会把它直接判成“跨洋无人走私已经成熟”。但就算只把它当原型，这条也足够说明问题。犯罪网络最擅长做的，从来不是发明新技术，而是把成熟零件塞进高利润、高风险链路里。半潜艇本身就是这种产物：不是最先进，却刚好压中风险、时间、成本三角。现在去船员化再叠一层，组织就少了被抓后供出上游的口子，也少了招募、训练、补给、士气这些人因成本。哪怕无人艇的单艇损失率更高，只要情报暴露率下降，账仍然可能更好看。我还想到另一个经常被低估的点：Starlink 在这里不是“联网功能”，而是把控制半径和组织半径一起拉长。传统近岸快艇更多依赖本地协同；一旦上了卫星链路，远程监控、分段接力、跨区域调度都更容易。这个变化和企业里远程运维机器人有点像，差别只是一个合法，一个非法。技术结构很接近：低成本终端、全球可用链路、有限但够用的自动化。很多人喜欢把这种事当成安全新闻，我看它更像供应链新闻。如果你做 agent、机器人、边缘自治系统，这条的提醒很现实：别再把“能力扩散”只理解成 app 复制。硬件 BOM 价格下降、开源控制栈成熟、卫星网络普及，会把一批以前需要专业团队的任务，变成犯罪组织也能外包、组装、复用的模板。文章里没有给出 autopilot 供应商，也没披露控制软件细节；没有这些，没法判断它靠规则导航还是更复杂的自治。但这已经足够说明，下一阶段的滥用问题不只是深伪和诈骗，而是低成本自主系统开始进入真实物流世界。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

10:00

67d ago

FEATUREDOpenAI 博客· rssEN10:00 · 02·19

推进 AI alignment 的独立研究

OpenAI 发布了一篇题为《Advancing independent research on AI alignment》的文章，主题是推进 AI alignment 的独立研究。给定内容只有标题和链接，没有正文、数字或机制细节，因此无法确认具体研究项目、资助安排或时间表。

#Alignment#Safety#OpenAI#Safety/alignment

精选理由

OpenAI 宣布向 UK AISI 发起的 The Alignment Project 提供 750 万美元资助，这是可核实的安全研究投入，不是空泛表态。HKR-K 和 HKR-R 成立，但 HKR-H 偏弱：新闻点在金额与“独立性”张力，正文未披露项目名单、周期与评审机制，所以给 featured 下沿。

编辑点评

OpenAI 向英国 AISI 的 The Alignment Project 投了 750 万美元，这笔钱有用，但更像安全合法性的外部采购，不是路线转向。

深度解读

OpenAI 这次拿出 750 万美元支持英国 AISI 的 The Alignment Project，我的判断很直接：这是一笔认真但克制的资金，不是 OpenAI 忽然把 alignment 主导权交给外部，而是把“外部独立研究要存在”这件事制度化，顺手给自己补一层公共可信度。数字先摆清楚。正文给了 3 个关键信息：OpenAI 出资 750 万美元，约合 560 万英镑；整个基金池超过 2700 万英镑；单个项目通常拿 5 万到 100 万英镑，还可能拿到算力和专家支持。还有一句很关键：OpenAI 不新建项目，不改评审流程，也不影响现有遴选，只是让“已经过审的项目”里有更多能拿到钱。这个设计很重要，因为它刻意切掉了“OpenAI 出钱，OpenAI 选题，最后还是 OpenAI 影响外部议程”的质疑点。我觉得这条的价值，首先不在 750 万美元本身。对 frontier lab 的年度算力、人才、评估预算来说，这不是会改写研发重心的量级。OpenAI 单次大模型训练和部署的成本外界一直估得很高，我没法在这篇文里核实他们 2026 年内部安全预算，但拿这 750 万和任何一代前沿模型的训练成本比，都不是一个数量级。所以这更像“给外部 alignment 生态续命”，不是“把内部 safety 能力外包”。我反而认同文里一个不那么好听、但更诚实的前提：很多 alignment 工作必须贴着 frontier model、贴着 deployment 做，独立研究者天然拿不到同等模型访问权和同等事故数据。这个问题过去一年已经越来越明显。Anthropic、OpenAI、Google DeepMind 讲安全时，最有用的材料常常来自系统卡、红队、上线后的实际误用数据，而不是纯概念论文。外部学界在理论上能走得很深，但只要最强模型权重、长程 agent 轨迹、真实 abuse telemetry 都关在实验室里，独立研究就很难碰到最硬的 failure mode。OpenAI 这篇文章其实默认承认了这个结构性不对称。但我对他们这套叙事还是有一点保留。OpenAI 说要支持“未必沿着当下主流方法扩展”的研究路线，这话我赞成；问题是，外部研究如果拿不到评估接口、拿不到高危能力的沙盒、拿不到失败案例，最后容易被推回到抽象理论和低风险代理任务上。那种研究当然有价值，像计算复杂性、博弈论、认知科学、密码学这些方向，基金说明里都点名了；可它和 frontier deployment 的闭环还是隔着一层。说得直白一点，钱能买多样性，买不到对称信息。这里有个文章外的背景很关键。2024 到 2025 年，外部安全资助其实已经变成几条线并行：Anthropic 之前做过 alignment science 与政策侧合作，Google DeepMind 也长期资助 academic safety work，英国 AISI 自己这两年一直在做评估与公共基础设施。OpenAI 这次把钱投给 AISI，而不是自己再造一个 OpenAI branded fellowship，我觉得是对的。原因很现实：安全资助如果还挂在实验室自己门口，外界很难不把它看成 PR 延伸；挂到已有政府研究组织和既有评审池里，独立性至少强一截。可别把“独立性”理解得太满。AISI 是英国政府体系内机构，不是完全游离于国家战略之外的纯民间基金。OpenAI 说 Renaissance Philanthropy 负责行政支持，评审流程不受资助方影响，这些都能减轻利益冲突，但不能自动解决议程设置问题。哪些课题被定义成 alignment，哪些被定义成 security，哪些更容易拿到算力配套，背后还是会有制度偏好。正文没有披露评审委员会构成、项目地域分布、算力支持的供给来源与额度，这些缺口都很实在。还有一点我比较在意：OpenAI 把“iterative deployment”又放进了安全论证核心。这是他们一贯立场，我不意外。我自己对这套说法一直是部分接受。你确实需要上线才能看到真实对抗和真实误用，纯封闭研发会漏掉一堆问题；但迭代部署成立的前提，是每一轮部署带来的外部风险要小于你从真实世界得到的安全学习收益。这个平衡怎么算，正文没给机制，也没给阈值。没有阈值，iterative deployment 就容易从一种治理方法滑成一种增长叙事。所以我对这条的结论是：这是好事，而且是应该做的那种好事；只是别把它看成 OpenAI 已经解决了“谁来独立审视 frontier systems”这个更难的问题。750 万美元能扩大项目池，2700 万英镑能让不少研究团队活下来，单项 5 万到 100 万英镑也足够支撑一批严肃课题。但只要最关键的模型访问、评估接口、事故数据、算力额度还主要掌握在几家实验室手里，独立 alignment 研究的上限就仍然被平台侧定义。这个结构，文章没有解决，它只是承认了一部分。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

08:54

67d ago

MIT 科技评论· rssEN08:54 · 02·19

让 Agentic AI 在零售业落地需要什么

Infosys Knowledge Institute 播客采访了一家美国大型零售企业的软件工程主管，讨论 Agentic AI 如何用于软件开发全流程。正文确认的场景包括需求校验、测试用例生成与分析、问题定位提速；企业名称、量化效果与部署规模未披露。真正值得盯的是治理机制：文中明确有人审与严格治理，但没有给出可复现指标。

#Agent#Code#Tools#Infosys Knowledge Institute

精选理由

这篇只命中 HKR-R：人审与治理确实触到企业把 agentic coding 放进生产环境的焦虑。HKR-H/K 都弱，标题没有新钩子，正文也没给企业名、量化效果、部署规模与复现条件，所以只到 all。

编辑点评

Infosys 这条只给出流程与治理，没给提效数字，我不太买账；没基线的 agentic 经验谈，参考价值很有限。

深度解读

文章确认，这家美国大型零售商把 agentic AI 用在 3 类开发环节：需求校验、测试用例生成与分析、问题定位提速。问题也很直接：企业名称、部署规模、提效百分比、缺陷逃逸率变化，正文都没披露。我对这类案例一直比较谨慎。零售企业的软件栈很杂，电商前台、库存、促销、门店 POS、供应链系统经常混在一起。你说 agent 能帮工程团队，我信；你不说它帮了多少、在哪条链路帮了多少，我就没法判断这是生产级能力，还是几个 Copilot 风格工具串起来的演示。文中用了“measurable quality outcomes”这句话，但可复现指标没有给。是单测覆盖率提升 8% 还是 Sev-1 故障定位时间缩短 30%？正文没有。这条里我反而更在意“严格治理”和“人审”两个词。过去一年，企业级 agent 落地最常见的卡点，不是模型不会写代码，而是它一旦跨到工单、代码库、测试系统、发布流水线，权限边界马上变复杂。去年很多大厂讲 agentic SDLC，也基本停在 PR review、测试生成、知识检索这几块；真敢把变更自动推到生产的，非常少。我印象里，GitHub Copilot Enterprise、Atlassian、ServiceNow 都在强调审批链和审计日志，原因很现实：只要 agent 动过票据状态、依赖版本、部署配置，责任归属就会变成法务问题，不只是工程问题。 Infosys 这里的叙事也有点太顺了。需求校验、测试生成、问题定位，这 3 个场景确实是低风险起步位，因为它们离生产写入更远，也更容易加人工兜底。但这不等于“agentic AI 在零售跑通了”。说实话，我对“全流程”这个说法有点怀疑。正文只覆盖 SDLC 的局部环节，没有提代码合并权限、回滚机制、工具调用成功率、误报率，也没有讲多代理协作的失败模式。没有这些，离“work”还差一截。外部参照也能说明问题。过去一年，很多企业发布的编程 agent 案例，最后拿得出手的硬指标，往往是单点效率：比如工单分流时间、测试草案生成时长、平均修复时间。很少有人能稳定证明“端到端交付速度”提升，因为那会受组织流程、遗留系统、发布窗口影响。零售行业尤其这样，旺季冻结、门店版本兼容、第三方支付接口，都会把 agent 的理论收益吃掉一大块。这篇文章没有给出季节性约束和系统边界，我没法把它当成通用方法论。如果把它当信号看，我会给一个偏保守的判断：大企业已经接受 agent 先做“副驾驶型流程节点”，还没普遍接受它做“有执行权的工程主体”。这和很多 2025 年的发布节奏是一致的——厂商拼命讲 multi-agent，但企业真付钱的，常常还是带审批、带审计、带回退的人机协作。零售不是最慢的行业，但也绝对不是最敢放权的行业。所以，这条的价值不在“agent 很能干”，而在它把企业采购侧的门槛说漏了：先证明可审计，再谈自治。遗憾的是，文章只给了态度，没给数据。我还没查到完整播客内容；如果后续能补上缺陷率、MTTR、人工复核占比、工具调用成功率，这条才算从经验谈走到案例。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

全部 · 2026-02-19

更多

频道

后台