全部 · 2026-02-13

▸ 7 items · updated 3m ago

2026年2月

一二三四五六日

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 262 2722 285

2026年3月

一二三四五六日

13 22 35 44 519 616 71 81 97 109 117 126 137 14 15 167 1711 1844 1984 2069 2132 2241 2375 2477 2579 2670 2756 2824 2932 3058 3185

2026年4月

一二三四五六日

198 2101 379 432 535 691 7126 8129 9112 1087 1142 1271 13159 14140 15122 16246 1781 1853 1960 20347 21687 22363 23348 24256 259 26 273282930

2026-02-13 · 星期五2026年2月13日

17:23

72d ago

FEATUREDDwarkesh Patel 访谈· atomEN17:23 · 02·13

AI 最大的问题不是你以为的那件事——Dario Amodei

Dario Amodei 说，AI 可能把经济年增速推到 10% 到 20%，但不会到 300%。他更担心地域分化：硅谷及其社交连接区域的增速可能到 50%，其他地区接近当前水平。真正值得盯的是扩散不均，不是总量增长本身。

#Dario Amodei#Silicon Valley#Commentary

精选理由

这是知名从业者的短评，不是政策或产品新闻，但给出 10%–20% 总增速与硅谷 50% 增速的明确判断，HKR-H/K/R 都成立。短板是正文只有观点，没有数据来源、扩散机制或政策方案，所以分数放在 featured 下沿。

编辑点评

Dario Amodei 把风险落在 50% 对常速的地域裂口上，这个判断比“AI 拉高 GDP”靠谱，但他把问题讲得还是太像信息扩散，不够像资本与算力分配。

深度解读

Dario Amodei 给出了 10%到20% 的年增长判断，又给出了硅谷 50% 增长、其他地区接近常速的分化场景。我的判断很直接：这段话最准确的地方，不是宏观增速区间，而是他承认 AI 红利先按地理和关系网结算。短视频里把原因说成“接近 AI、听说过 AI、跟硅谷社交连接”，我不太买账只到这一步。信息扩散从来不是主约束，钱、算力、客户入口、合规能力才是。<br><br>过去一年这条线已经很清楚。最能吃到生成式 AI 收入的，不是“理解 AI 的地区”，而是先拿到 GPU 配额、云预算和企业分发渠道的公司。OpenAI、Anthropic、微软、谷歌、Nvidia 的集聚效应，本来就把美国少数城市推到了前面；湾区再叠加人才流动和二级市场融资，领先会自我强化。Dario 这里讲“socially connected to Silicon Valley”，其实已经在暗示网络效应，但他没把更硬的那层讲穿：模型能力可以 API 化，资本开支和数据中心建设不会自动扩散。<br><br>我还有个疑虑。10%到20% 的经济年增速是非常激进的说法，正文没给时间跨度、基线口径、是美国还是全球，也没给生产率传导机制。这个数字我不会直接收。历史上通用技术落地，经常先在少数行业和少数地区抬高利润，不会同步抬高全社会产出。要是 Anthropic 真把“地域不均”当核心风险，光讲原则不够，至少要看到更具体的分发动作，比如教育、政务、医疗这些低 GPU 预算场景怎么拿到便宜且稳定的模型能力。标题给了判断，执行路径正文没披露。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:17

72d ago

FEATUREDMIT 科技评论· rssEN17:17 · 02·13

ALS夺走这位音乐人的嗓音，AI让他重新唱歌

32岁的 Patrick Darling 在失去歌唱能力两年后，用基于旧录音训练的 AI 声音克隆重建嗓音，并在 2 月 11 日伦敦活动上重返舞台。正文给出两项关键条件：说话声克隆通常需约 10 分钟清晰音频；他的歌声只能用手机在嘈杂酒吧拍下的片段与厨房录音合成，团队再用 Eleven Music 花约 6 周微调歌曲。真正值得盯的是可用性而不是煽情叙事：这套流程已被 ElevenLabs 作为 ALS 等失声人群免费项目提供，但正文未披露底层模型细节。

#Audio#Multimodal#Tools#Patrick Darling

精选理由

这篇稿子不靠煽情撑分，正文给出两项少见的可复现条件：说话声约需10分钟清晰音频，歌声可用酒吧手机片段在6周内微调完成。H/K/R 都命中，但它是高质量应用案例，不是行业级产品或研究发布，所以放在 featured 低段。

编辑点评

ElevenLabs 用约 10 分钟语音样本和 6 周微调，让 Patrick Darling 在失声 2 年后重新开口；我买账这件事的公益价值，但不买账“技术已经成熟”这层暗示。

深度解读

ElevenLabs 把一个 32 岁 ALS 音乐人的旧录音做成可用歌声，并让他在失声 2 年后重返舞台；这条最硬的信号不是煽情，而是消费级语音克隆第一次碰到了“身份连续性”这个刚需场景。很多语音公司过去两年都在讲自然度、延迟、情感控制，讲得像是在卷 demo。这里不一样。对 ALS 用户来说，声音不是 UI，声音就是本人。文章给出的条件也很具体：说话声大约要 10 分钟清晰音频；歌声样本很差，只能靠手机在嘈杂酒吧拍下的片段和厨房录音，再花约 6 周微调。这说明门槛已经低到“没做过声纹备份的人，也还有补救机会”，但还没低到随手可用。我一直觉得，这类项目比明星配音、AI 翻唱更能检验一家音频公司的底子。原因很简单：娱乐场景允许“像”，辅助沟通场景要求“是”。文章里说，合成后的歌声保留了他原本略沙哑、音准有点飘的特点，听上去不完美，但像人。这一点我反而信。近一年主流 TTS 都在避开瑕疵，声音越做越圆，最后常常圆得没人味。病后重建声音的目标不是播音腔，而是可辨认的个人痕迹。这个取向，比 benchmark 上再加几点 MOS 更有技术含金量。外部参照也很清楚。苹果在 2023 年就推过 Personal Voice，官方口径是用户读 150 句，约 15 分钟，主要面向 iPhone 端的个人语音合成。它的优点是本地化和系统整合，缺点是情感和可控性一般，至少我之前听到的样本还比较“规整”。ElevenLabs 这条路更激进：用更脏的数据，追更像本人的结果，还把场景从说话推到唱歌。唱歌比说话难很多，因为音高、时值、连音、气息都要保住人味。文章没披露底层模型、训练目标、是否分离说话与歌声声纹，这些恰好决定它到底是产品故事，还是可复制流程。我对这条报道有个保留。现在看到的是一次成功个案，不是稳定服务指标。10 分钟清晰语音是经验门槛，不等于每个 ALS 用户都能拿到同样结果。歌声部分更依赖人工介入。6 周微调已经说明，这不是上传文件、点一下按钮、第二天交付。谁来做清洗、切片、对齐、纠错、版权确认，文章都没说。免费项目当然是好事，但它能覆盖多少病例、多少语言、多少口音，正文没有数字。没有这些数字，就还不能把它讲成“失声者普遍可得”的方案。还有一层 pushback 不能省。语音克隆公司现在最爱讲安全，最怕讲授权边界。这个案例授权关系很清楚，因为就是本人重建本人声音。可一旦产品把“几秒到几分钟旧录音即可恢复身份感”这件事做顺，滥用面也会同步变宽。过去一年从选举诈骗电话到假 CEO 语音转账，音频伪造已经不算小众风险。文章没谈 ElevenLabs 的防滥用机制，我也没查到这次项目用了哪些限制，比如 watermark、声纹验证、人工审核、家属授权流程。医疗与辅助沟通场景当然该支持，但“公益入口”不能替代“安全设计”。所以我对这条的判断是：它证明了语音 AI 最先落地的高价值区，不在内容工业，而在失能补偿。它也顺手暴露了另一个现实：这套能力离标准化医疗工具还差一截，离大规模安全开放也差一截。现在能确认的是，旧录音哪怕很差，仍有机会救回一部分人的声音身份；还不能确认的是，这件事能不能稳定、低成本、跨语言地复制到更多患者身上。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:11

72d ago

● P1Dwarkesh Patel 访谈· atomEN17:11 · 02·13

Anthropic CEO称AI模型指数增长即将在一到两年内结束

Anthropic CEO Dario Amodei 在一场长访谈中称，模型能力的指数级提升仍在延续，但已接近终点，时间尺度只差“1到2年”。他把进展归因于算力、数据、训练时长与可扩展目标函数，并称 RL 在数学、编程等任务上也呈对数线性收益；访谈未披露具体实验曲线、模型版本或复现参数。真正值得盯的是他的判断：预训练与 RL 不是两套故事，而是一套持续扩展的训练经济学。

#Reasoning#Code#Alignment#Dario Amodei

精选理由

这是头部实验室 CEO 对扩展曲线、RL 收益和时间线的直接判断，HKR 三轴都成立。分数压在 85，因为正文未披露实验曲线、模型版本或复现条件，新增信号主要是观点密度，不是产品或论文发布。

编辑点评

Amodei 把时间线压到“几年”，我买紧迫感，但不买他把公共怀疑写成迟钝。RL 时代缺公开 scaling law，正是怀疑该存在的地方。

深度解读

Dario Amodei 在 Dwarkesh 访谈里把 AGI 叙事推到“几年内接近天才国家级算力体”。这次覆盖只有 2 个来源，且都是 Dwarkesh 的文字版和 YouTube 版，不能当作独立媒体交叉验证。两边标题完全一致，说明事件的信号不是“多家媒体确认”，而是 Anthropic CEO 选择在一个长访谈里释放高强度时间线判断。这里最重的不是那句“near the end of the exponential”。重的是 Amodei 把三件事绑在一起讲：模型能力按预期指数推进；代码能力已经越过一般博士或专业水平；公众仍在用常规政治议题处理一个短时间窗里的能力跃迁。这个组合很 Anthropic：一边强调安全和治理紧迫性，一边不断提醒市场，自己坐在前沿能力曲线的最内侧。 Dwarkesh 的文字稿角度更偏“思想路线图”。它把问题拆成 RL scaling、经济扩散、算力投入、实验室利润、监管、美国和中国竞争。YouTube 标题没有新增事实，主要放大那句可传播的警报。两源一致不是独立判断收敛，而是同一访谈资产的双渠道分发。这个要分清，否则很容易把“播客爆款标题”误读成行业共识。我对 Amodei 的核心判断一半认同，一半保留。认同的部分是：过去一年多，前沿模型在代码、长任务、工具调用、agentic workflow 上的斜率确实比聊天体验更陡。Claude Sonnet 4.5 这类模型如果放在软件工程上下文里看，已经不是“会写函数”的级别，而是在很多 repo 级任务里开始触碰初级工程师的工作边界。OpenAI、Anthropic、Google、xAI 都把模型发布讲成推理、代码、工具使用、长上下文和多步任务，说明前沿实验室内部也不再只盯 next-token loss 的展示指标。保留的部分在 RL。Dwarkesh 问得很准：三年前大家还能讨论预训练 scaling law，至少有公开曲线和跨数量级 compute 的故事。现在 RL regime 里，外部看不到同等级别的公开规律。我们不知道 Anthropic 看到的是 reward model、verifier、合成任务环境，还是代码和数学 benchmark 上的局部幂律。正文只披露了访谈问题和 Amodei 的高层说法，未披露可复现实验、训练 compute、数据配方、RL 预算占比、能力曲线斜率。拿“指数快结束了”当结论可以，拿它当证据不行。说真的，我也不太买“公众没有认出我们有多接近终点”这个责备口吻。公众看不到 Anthropic 内部 eval，看不到失败样本，看不到训练后能力的分布尾部，也看不到模型在真实企业流程里的可靠性曲线。外部只能看到发布会、基准榜、产品 demo、价格表和宕机记录。要求外部像实验室 CEO 一样相信时间线，本身就不合理。前沿实验室过去反复用安全理由要求政策信任，又用商业理由保留关键证据，这里面有张力。更微妙的是算力和利润问题。访谈时间戳里有“如果 AGI 临近，为什么不买更多算力”和“AI labs 如何盈利”。这两个问题把 Amodei 叙事里最硬的矛盾摆出来了：如果只差几年，理性策略应该极端扩张 compute；如果实验室还要讲利润模型，那就说明资本、供电、芯片、产品化、监管都在约束这条指数曲线。所谓“end of the exponential”并不只受算法控制，它还受数据中心交付周期、GPU/ASIC 供应、推理毛利、客户愿付价格约束。正文未给 Amodei 对这些矛盾的完整回答，所以不能替他补。外部参照也让这句话更复杂。2025 到 2026 的主线不是单纯模型变聪明，而是推理成本下降、代码 agent 上线、企业集成变慢、监管和版权诉讼继续拖住部署。很多 AI 从业者已经在生产环境里看到两条曲线分叉：benchmark 能力升得快，可靠落地升得慢。Amodei 说“diffusion cope”这个章节标题很挑衅，但现实是扩散确实有摩擦。ERP、医疗、金融、政府采购不会因为模型能解 PhD 题就自动改流程。我的判断是：这次访谈是一个强烈的“内部时间线外泄式发言”，不是一篇能验证时间线的技术披露。它的价值在于告诉我们 Anthropic CEO 仍然把能力曲线看得非常短，并且认为社会反应严重滞后。它的弱点也清楚：没有公开 RL scaling law，没有给出 eval 方法，没有解释从代码超强到经济重构之间的可靠性鸿沟。AI 从业者该认真听这个警报，但别把 CEO 的紧迫感误当成物理定律。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

11:00

73d ago

OpenAI 博客· rssEN11:00 · 02·13

GPT-5.2 推导出一项理论物理新结果

OpenAI 在标题中称，GPT-5.2 推导出一项理论物理新结果；当前只有标题这 1 条信息。RSS 摘要为空，正文未披露具体结果、推导方法、验证方式与参与研究者。真正值得盯的是可复现性；没有公式、实验或同行评审，这还不是可核验结论。

#Reasoning#OpenAI#Research release#Commentary

精选理由

标题有点击力，但信息量接近零：正文未给出公式、验证方式、参与研究者或同行评审。该题材属于“传统科学+AI 交叉且无产品/agent 含义”硬排除，所以判为 excluded，分数压在 39 以下。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

10:00

73d ago

OpenAI 博客· rssEN10:00 · 02·13

OpenAI 在 ChatGPT 中推出 Lockdown Mode 和 Elevated Risk 标签

OpenAI 宣布在 ChatGPT 中加入 Lockdown Mode 和 Elevated Risk 标签，已确认是两项新安全功能。正文为空，除产品名与功能名外，触发条件、覆盖用户范围、上线时间、默认设置均未披露。别被标题骗了，当前能确认的是方向是安全分级，不是完整机制。

#Safety#OpenAI#ChatGPT#Product update

精选理由

OpenAI 官方只确认 ChatGPT 将加入 Lockdown Mode 和 Elevated Risk labels。正文未披露触发条件、覆盖人群、默认状态与上线节奏，HKR 只有标题钩子，没有足够机制信息，所以进 all，不进 featured。

编辑点评

OpenAI 给 ChatGPT 加了 2 个安全入口，但正文为空；我先不买账，没触发条件的“安全模式”更像叙事占位。

深度解读

OpenAI 宣布 ChatGPT 新增 2 项安全功能，但正文未披露触发条件、默认开关、覆盖人群和上线节奏。我的第一反应不是“更安全了”，而是 OpenAI 在把 ChatGPT 的风控界面做成分级系统，先把产品语义占住，再补执行细节。Lockdown Mode 这个名字很重，听起来接近高风险账户保护、会话限制，或者更强的外部访问隔离；Elevated Risk labels 则像内容、账号、会话、工具调用中的风险标记层。问题在于，标题只给了名字，没给机制，这两者落差很大。我一直觉得，消费级 AI 产品走到 2026 年，安全能力的竞争点早就不是“有没有拒答”，而是谁先把风险状态显式暴露给用户和管理员。去年到今年，Anthropic、Google、Microsoft 都在往这条路走：不是单点拦截，而是给模型输出、账号状态、企业策略挂标签。我没查到这篇正文，因为它就是空的；但按行业节奏看，OpenAI 现在补这层并不意外，反而算偏晚。ChatGPT 先前更像统一交互面板，很多安全决策藏在系统侧，用户只看到结果，看不到判定级别。我对这条的保留意见很明确：如果 Elevated Risk 只是前台标签，没有配套的动作矩阵，比如限速、禁用工具、加强审计、管理员告警，那它就是 UI，不是控制面。Lockdown Mode 也一样。默认关闭的话，实际采用率通常不会高；默认开启的话，误伤率、申诉流程、企业兼容性就会立刻变成问题。标题已给出方向，正文未披露代价。这个信息缺口很关键，因为安全功能最容易被公司写成“能力上线”，最难讲清的是谁来承担 friction。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

09:00

73d ago

FEATUREDOpenAI 博客· rssEN09:00 · 02·13

超越速率限制：扩大 Codex 和 Sora 的访问

OpenAI 在标题中称将扩大 Codex 和 Sora 的访问，方向是超越现有 rate limits。正文为空，未披露配额上调幅度、适用用户、价格变化或上线时间。真正该盯的是访问机制怎么改；标题只有方向，没有参数。

#Code#Multimodal#OpenAI#Product update

精选理由

这是 OpenAI 官方产品更新，HKR-H 和 HKR-R 成立：标题抓住限流痛点，也会牵动订阅与工作流讨论。HKR-K 不成立，因为正文没有配额上调幅度、适用层级、价格变化和上线时间，所以只给到 featured 门槛分。

编辑点评

OpenAI 只在标题里承诺扩大 Codex 和 Sora 访问，正文 0 个参数都没给；这更像配额策略预告，不是能力跃迁。

深度解读

OpenAI 这次只给了一个方向：要把 Codex 和 Sora 的访问规模做大，而且是“超越现有 rate limits”。标题给出 2 个产品名，正文却没披露配额上调幅度、适用层级、是否改价、何时上线，连最关键的访问机制也没有。我的判断很直接：这条先别当模型进展看，当作商业化闸门在重画。我一直觉得，OpenAI 的很多产品更新，先卡住用户体验的不是模型本身，而是配额、队列和成本曲线。Codex 牵着推理成本和长任务稳定性，Sora 牵着视频生成的算力占用和等待时间，这两类产品都比聊天接口更容易被 rate limit 定义产品形态。标题里专门写“beyond rate limits”，我看着像在试探从硬限流转向别的分配方式，比如更高并发池、积分制、优先级队列，或者按任务类型分桶。具体是哪一种，正文没说，现阶段不能替它脑补。这里有个行业背景，文章里没有。2024 到 2025 这波生成式产品，大家都在把“能力发布”和“访问发布”拆开做。Anthropic、Google、OpenAI 都干过类似操作：模型先上线，再按套餐、地区、组织级别慢慢放量。原因很现实，推理成本没降到足够低之前，rate limit 本身就是定价器。尤其 Sora 这种视频产品，我还没看到哪家能把高质量文生视频做成完全敞开的自助服务。Runway、Pika 之前也都靠积分、时长、分辨率和队列来控量，不是因为不会做产品，而是 GPU 小时太贵。我对这条叙事有个保留。OpenAI 如果只是把“每分钟几次调用”改成“每月多少积分”或者“高峰排队更短”，标题会显得比实际动作大。Codex 这边也一样，开发者要的不是一句“更容易访问”，而是很具体的条件：仓库上下文上限是多少，后台任务最长跑多久，并发 agent 能开几个，失败重试怎么算费。这些变量不披露，用户根本没法判断它是从 demo 走向生产，还是只是在减少抱怨。还有一点我不太买账：把 Codex 和 Sora 放在同一标题里，传播上很省事，产品上却未必是一回事。一个是代码代理，一个是视频生成，成本结构、延迟容忍度、成功标准都不同。它们被同框，更像 OpenAI 在传递“我们开始认真处理高成本产品的可用性”这个信号，而不是两条产品线同步成熟。现在只有标题信息，我还不能下更重的结论；但要是后面没有明确的新配额表、套餐差异或 API 条款更新，这条新闻的含金量就会很有限。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

00:30

73d ago

少数派 · 直链· rssZH00:30 · 02·13

派早报：智谱上线并开源 GLM-5 模型，网信办开展春节清朗行动

标题给出 2 条事实：智谱上线并开源 GLM-5 模型，网信办开展春节清朗行动。RSS 摘要还提到字节跳动发布视频创作模型 Seedance 2.0、小米 Tag 追踪器已在欧洲上市；参数、许可证、时间表与行动范围，正文未披露。别被单一标题骗了，这更像多条新闻汇总，不是一篇只讲 GLM-5 的独立稿件。

#Multimodal#Zhipu#ByteDance#Xiaomi

精选理由

“智谱上线并开源 GLM-5”是有效信号，但这篇是早报汇总，不是围绕该发布的独立稿。正文未给出参数、许可证、评测或上线条件，HKR 主要命中 R，重要性落在低价值新闻带，给 all。

编辑点评

少数派这条把 4 件事塞进 1 个标题。对 GLM-5 下判断还太早，正文连参数和许可证都没给。

深度解读

标题同时挂出 GLM-5、清朗行动、Seedance 2.0、Xiaomi Tag 四件事。这个信息密度不等于信息含量，因为正文只剩一段 RSS 摘要，连 GLM-5 的参数、上下文长度、许可证、基准、发布日期都没披露。我先把态度摆明：这条现在没法当作“GLM-5 发布”来读，更像中文科技媒体常见的晨报拼盘。你如果真在做模型选型，眼下拿不到任何可执行信息。开源这两个字当然抓眼球，但开源差别很大。权重开放、代码开放、商用许可、蒸馏限制、地域限制，落地结果完全不是一回事。正文没给，任何“智谱开始正面冲击开源头部”的结论都站不住。回到 GLM 这条，我一直觉得国内模型厂商现在最需要交代的，不是又迭代到第几代，而是三组硬指标：一，许可证到底宽不宽；二，推理成本压到什么水平；三，代码、工具调用、长上下文这几个高频场景有没有实测。去年到今年，开源圈已经被 Qwen、DeepSeek、Llama 这几家把标准抬得很高。Qwen 系列通常会把尺寸、评测、部署方式讲得比较全；DeepSeek 真正打到开发者心智，靠的也不是“我们又发新模型”，而是价格和可复现 benchmark 一起出来。我没看到 GLM-5 的任何对应数据，所以现在讨论实力排位，基本都在空转。清朗行动那半句也一样。网信办开展行动是事实，行动范围、平台类型、处罚口径、是否点到 AI 生成内容，正文都没写。这个缺口不能轻轻带过。过去一年，国内平台最敏感的不是“有没有治理”，而是治理是否开始更细地落到 AIGC 分发、推荐、账号矩阵、训练数据来源这些接口层。我还没查到这次春节行动的正式通报，所以不想硬猜。但如果连行动边界都没有，只把“清朗”三个字塞进标题，对从业者帮助很有限。 Seedance 2.0 反而让我多看一眼，因为字节最近在视频生成上动作不小。问题还是同一个：没有分辨率、时长、可控性、生成速度、是否对外开放 API，这条消息就只能停留在“字节也在继续推视频模型”。拿过去一年的行业节奏看，视频模型竞争早就不是 demo 竞赛了。Runway、Pika、Kling、即梦这一圈打到后面，比的是稳定性、编辑链路和成本，不是单次样片够不够惊艳。标题没给这些，判断不了。 Xiaomi Tag 在欧洲上市这句更像消费电子动态，和前面三条放在一起，只会稀释焦点。说真的，我不太买账这种标题写法。它会制造一种“今天信息很多”的感觉，但对 AI 从业者最需要的那部分细节，几乎没有增加。所以这条最稳的读法只有一个：把它当线索，不当结论。GLM-5 是否值得认真看，至少要等智谱公开模型卡、许可证、参数规模、评测口径，最好再加一组第三方部署反馈。没有这些，标题里的“上线并开源”只是一句起点，不是能力证明。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

全部 · 2026-02-13

更多

频道

后台