播客·视频

▸ 3 episodes · updated 3m ago

6 个频道在监控

全部 Dwarkesh Patel 访谈46 硅谷101 播客34 Latent Space30 Dwarkesh Patel 播客21 Lex Fridman 播客15 最佳拍档15

筛选精选全部仅精选

▸ Lex Fridman 播客3 集

2026-03-23 · 星期一2026年3月23日

16:24

35d ago

● P1Lex Fridman 播客· atomEN16:24 · 03·23

Jensen Huang：NVIDIA、4 万亿美元公司与 AI 革命｜Lex Fridman Podcast #494

Jensen Huang 在 Lex Fridman 播客中称，NVIDIA 为 AI 集群做“极限协同设计”，目标是在 1 万台计算机上取得远超线性扩展的加速。访谈给出的具体约束是 Amdahl 定律、模型与数据分片、网络交换、供电和散热；他还说自己有 60 多名直接下属。真正值得盯的是，NVIDIA 把竞争面从单卡推到了整机柜和数据中心。

#Inference-opt#Tools#NVIDIA#Jensen Huang

精选理由

这是一手高权威访谈，不是新品发布，但信息密度够高。HKR 三轴都过：标题有强钩子，正文给出“1 万台计算机”“Amdahl 定律”“模型/数据/流水线切分”等机制，且直指 NVIDIA 的系统级护城河；分数不到 85，因为缺少可落地的新产品或新数据披露。

编辑点评

黄仁勋把 NVIDIA 的战场抬到 1 万台计算机级别，这话我买一半；系统协同是真护城河，"远超线性扩展"先别跟着鼓掌。

深度解读

黄仁勋把目标定义成“1 万台计算机拿到远超线性扩展”，这句比公司估值更有信息量，但我对这句宣传口径是有保留的。Amdahl 定律、模型切分、网络交换、供电、散热，这些约束他说得都对；问题在于，只要跨到 1 万节点，任何“超线性”都高度依赖负载形态、并行策略、通信掩蔽和基线选取。正文给了问题框架，没给 benchmark、没给 workload、没给测量口径，所以这句现在更像工程目标，不是可复现结论。我倒是认同他另一层意思：NVIDIA 现在卖的早就不是单颗 GPU。访谈里他把 GPU、CPU、HBM、交换、NIC、机柜、电力、液冷、系统软件放进同一套设计约束里，这个叙事不是包装。过去一年这条线已经很清楚了：从 HGX 到 DGX，再到 NVL72 这类整柜系统，采购决策在很多云厂和大模型公司那里已经从“买多少卡”变成“拿什么拓扑、多少功率密度、什么冷却方案、多久能上线”。我一直觉得很多人低估了这里的门槛，不是芯片参数，而是把供电、网络、软件栈和部署窗口同时卡住的交付能力。你单看 FLOPS，AMD 和定制 ASIC 都能追；你把交付周期和集群利用率算进去，差距就没那么容易抹平。但我也不太买“只有 NVIDIA 能做系统级协同”这套隐含结论。过去一年 AMD MI300 系列已经在几家头部云和模型公司拿到真实部署，Google TPU 也从来不是单芯片竞争，而是从 pod 级别打包交付。AWS Trainium 走的也是同一路数：芯片不一定压过 NVIDIA，体系内网络、软件、租赁模式能先拿下一部分负载。也就是说，机柜级、数据中心级竞争不是 NVIDIA 一家发明的，只是它把这一套商业化和产品化推进得最快。黄仁勋这次把“极限协同设计”讲得很顺，我能理解，因为这正好把 CUDA 护城河扩成了“CUDA + NVLink + Spectrum/InfiniBand + 供电散热方案 + 交付组织”。这个组合比单卡护城河厚得多。他说自己有 60 多名直接下属，这个细节我反而觉得很关键。多数 CEO 会把跨学科协调层层下放，他没有。他在讲的不是个人管理神话，而是一种公司结构：让光互连、内存、交换芯片、GPU、系统软件这些负责人尽量短路径地在一个决策面上碰撞。这和传统半导体公司按 BU 切开的做法不一样。这个组织形式跟 NVIDIA 现在的产品形态是匹配的，因为瓶颈已经不在某一颗芯片，而在接口处。谁把接口收紧，谁就更容易把性能、良率、功耗、可维护性一起拉上去。我对这段访谈最大的疑虑，还是它把“工程上追求超线性”说得像“商业上稳定可交付”。这两件事不是一回事。训练集群里，特定并行策略配合更高效的网络拓扑，确实会让新增节点带来的收益好于朴素预期；但一到真实生产，故障率、尾延迟、运维复杂度、作业编排都会吃掉纸面增益。NVIDIA 过去几代系统强，不只是因为峰值性能高，也是因为它让客户少踩坑。可这部分在访谈里几乎没展开，正文也没给案例。我还想补一个文章外的背景。去年到今年，行业里一个很实在的变化是 token 成本下降速度，已经越来越受系统设计影响，不再只是模型蒸馏或芯片代际升级。推理端尤其明显：同样模型，批处理、KV cache、互连拓扑、内存带宽和编排软件，最后都会反映到每百万 token 的成本上。黄仁勋现在反复把叙事从“更强 GPU”拉到“更完整数据中心”，就是因为单芯片时代那套比较表快不够用了。所以我对这条的判断是：方向没问题，口径有点冲。NVIDIA 的优势确实越来越像系统公司，不再只是芯片公司；但“远超线性扩展”这种话，没 workload、没基线、没复现条件，我不会替他转述成事实。给从业者的启发也不是“大家都去做大机柜”，而是接口正在吃掉器件。谁能把训练和推理里的网络、内存、软件调度、供电散热一起算，谁才配谈下一轮护城河。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

2026-02-12 · 星期四2026年2月12日

03:07

74d ago

● P1Lex Fridman 播客· atomEN03:07 · 02·12

OpenClaw：爆红 AI Agent 背后的 Peter Steinberger｜Lex Fridman Podcast #491

Lex Fridman 第491期播客采访 Peter Steinberger，讨论开源 AI agent OpenClaw；正文称其 GitHub 星标已超17.5万到18万。正文确认它可接入 Telegram、WhatsApp、Signal、iMessage，并允许用户选择 Claude Opus 4.6、GPT 5.3 Codex 等模型；具体架构、评测与安全边界未完整披露。真正值得盯的是系统级权限与自修改能力带来的安全面，这不是“会聊天”，而是可执行真实操作的 agent。

#Agent#Tools#Safety#Peter Steinberger

精选理由

这不是普通播客串谈。OpenClaw 作为高关注开源 agent，正文给出 17.5万到18万 GitHub 星标、Telegram/WhatsApp/Signal/iMessage 接入和自修改能力，HKR 三项都成立。分数停在 featured，不到 p1，因为架构、评测与安全边界都没讲透。

编辑点评

OpenClaw 把 18 万星换成了系统权限，这条我不敢按“产品出圈”看，它先是一次大规模安全实验。

深度解读

OpenClaw 这波爆红，我的判断很直接：它火，不是因为 agent 终于“可用”了，而是它把很多团队一直回避的权限问题，公开塞进了一个人人能 fork 的开源壳里。GitHub 星标到 17.5 万到 18 万，传播速度已经说明一件事：开发者现在要的不是更会聊的模型，要的是能碰 Telegram、WhatsApp、Signal、iMessage，能改自己代码，能直接替人执行动作的系统。问题也出在这里。能力边界一旦从 token 输出，换成系统调用、消息收发、文件读写，风险面就不是聊天机器人那一套了。正文给出的关键信息其实很少。已披露的是 OpenClaw 可接入多类消息端，可选 Claude Opus 4.6、GPT 5.3 Codex 这类模型；Peter 还明确说过，agent 知道自己的源码，知道自己运行的 harness，还会按提示修改自己的软件。没披露的是更要命的部分：权限模型怎么切，默认能拿到哪些系统能力，是否做了工具级 allowlist，是否有跨应用确认，是否跑过越权、提示注入、数据外传这类安全评测，失败率是多少，回滚机制是什么。标题给了“viral agent”，正文没给这些，我不会替它补。我对这条叙事有个明显 pushback：很多人把它讲成“从语言到行动的分水岭”，这个说法我不太买账。能操作电脑、能调工具、能看消息，这些部件 2024 年就齐了。OpenAI 去年那套 Computer Use，Anthropic 也做过类似方向，开源侧像 Open Interpreter、AutoGen、browser-use、还有一批 desktop agent 项目，思路都不新。OpenClaw 赢在组装方式和分发方式，不在底层科学突破。它把“个人电脑上的全权限 agent”做成了一个可复制、可围观、可二创的公共事件，所以才形成了这次情绪外溢。说白一点，技术积木早就在那，OpenClaw 把引信点着了。我一直觉得，开源 agent 的门槛不在 planner，也不在 prompt，而在权限工程。消息应用接入是最敏感的一层。因为这里面混着身份验证、联系人关系、历史语境、外链点击、附件下载、支付和验证码。播客里甚至提到它会点“我不是机器人”按钮，这一下我有点愣住了。不是因为它多聪明，而是因为很多网站和风控系统默认把这一步当成人机边界。今天它点的是按钮，明天它读的是短信验证码，再往后就是帮你确认银行转账。只要同一执行链条里没有硬隔离，所谓个人助理和高权限木马，差的就只是一条 system prompt。文章外的上下文也很关键。过去一年，几家大厂都在往 agent 推，但落地形态明显更保守：要么放在企业 SaaS 里，权限由工作流和 RBAC 卡死；要么放在浏览器沙箱里，动作范围受限；要么把高风险操作拆成必须人工确认的 checkpoint。原因很现实，不是他们不会做“全自动”，而是做了也不敢直接放给大众机器。OpenClaw 反过来走，把本地权限、私有数据、自由模型选择放在一起，这种产品决策很像早期 jailbreak 社区的速度感：先把边界撞出来，再看哪里会出血。开发者会爱这种自由，安全团队看到的会是另一张图。还有一点别被播客气氛带走。Lex 把它讲成“ChatGPT 之后又一个历史节点”，这个包装很顺耳，但证据还不够。18 万星说明它抓住了开发者注意力，不说明它能长期稳定运行，更不说明普通用户会把自己的消息、文件、联系人、系统控制权长期交给它。agent 产品过去一年最常见的死法，不是 demo 做不出来，而是连续运行 3 天以后开始漂移：权限累积、上下文污染、工具调用串错、重试风暴、日志泄密。OpenClaw 如果真要从病毒式项目变成耐用系统，迟早得交出几样硬东西：任务成功率、长程运行稳定性、权限审计、失败回放、默认拒绝策略。正文一个都没给。 Peter 说 agent 知道自己的源码，还能改自己的软件，这个点很抓眼球。我承认，这对独立开发者有极强吸引力，因为它把“写程序”和“维护程序”合成了一条闭环。可我对自修改默认开启这件事保留很大怀疑。自修改最怕的不是一次改坏，而是你不知道哪一次改动让系统失去可解释性。代码 diff 能看，行为漂移更难看。要是再叠加多模型切换，比如 Claude Opus 4.6 和 GPT 5.3 Codex 在工具使用偏好、函数调用稳定性、拒答边界上都不同，复现实验会变得很难。你今天测通的路径，明天换个模型版本就未必还成立。所以我看 OpenClaw，不会先问“它是不是 agent 元年代表作”，我会先问三个工程问题：默认权限是不是最小化，敏感动作是不是强确认，自修改是不是可回滚。三条里少一条，它都更像一场面向开发者社区的大型试玩。这个试玩当然有价值，甚至可能逼着整条赛道更快面对权限设计。但如果有人把它讲成“个人 AI 助手的终局形态”，我不会跟。现在已知的是它拿到了注意力和想象力，未知的是它能不能穿过安全、稳定性和责任归属这三关。后面这三关，才决定它是 Linux 式基础设施，还是又一个一周爆红的 agent 标本。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

2026-01-31 · 星期六2026年1月31日

22:33

85d ago

FEATUREDLex Fridman 播客· atomEN22:33 · 01·31

2026 年 AI 现状：LLM、编程、缩放定律、中国、Agent、GPU、AGI｜Lex Fridman 播客 #490

Lex Fridman 在第490期播客中与 Sebastian Raschka、Nathan Lambert 讨论 2026 年 AI 竞争，并把 2025 年 1 月 DeepSeek R1 发布视为关键转折。正文点名 Anthropic Claude Opus 4.5、Google Gemini 3、Z.ai GLM、Minimax、Kimi Moonshot，但未给出统一基准、成本表或复现实验。真正值得盯的是判断框架：技术扩散更快，差距更像算力、预算与组织文化，不只是模型点榜。

#Agent#Code#Benchmarking#Lex Fridman

精选理由

这是一条高质量观点型内容，不是新闻。HKR-H 与 HKR-R 成立：Lex Fridman、Sebastian Raschka、Nathan Lambert 把 China、Agents、GPUs、AGI 放进同一判断框架，讨论对象就是从业者。HKR-K 不足：正文未给统一基准、成本表或复现实验，所以只到 featured 下沿。

编辑点评

Lex 第490期把 DeepSeek R1 定成 2025 年拐点，这个框架我认；我不买“谁技术独占谁赢”的老叙事，2026 更像组织力和算力兑现赛。

深度解读

Lex 第490期把 DeepSeek R1 放到 2025 年 1 月拐点位置，这个判断基本成立。问题不在“谁先想到新点子”，而在谁能把点子变成稳定产品，吃下算力、数据、分发和团队执行的摩擦成本。播客里 Sebastian Raschka 直接说了，2026 很难再有哪家公司独占某种别人完全拿不到的技术；Nathan Lambert 补的一刀也很关键，Anthropic 眼下的优势更像组织文化押注 code，而不是拿着别人不知道的炼丹秘方。这个判断我认，而且比一堆榜单截图更接近现实。我对这期最认同的地方，是它把“技术扩散速度”摆到台面上。过去一年这个趋势已经非常明显。DeepSeek R1 在 2025 年 1 月把“高性能推理模型不必只属于封闭美国实验室”这件事公开化了。后面开源权重、蒸馏路线、推理时扩展、合成数据、后训练 recipe，扩散速度都快得离谱。很多实验室今天发的东西，几周内就会被复现、改写、移植。说真的，2023 年那种“靠神秘感压制市场”的窗口，到了 2026 已经窄很多了。现在还能拉开差距的，更多是两类东西：一类是钱，另一类是人怎么协作。这也是我觉得节目里点到但没展开透的地方。标题里塞了 LLM、coding、agents、GPUs、中国、AGI，一口气很大；正文给出的硬数据却很少。没有统一 benchmark，没有成本表，没有上下文长度，也没有可复现实验条件。所以你没法严肃地下结论说 Claude Opus 4.5 一定压过 Gemini 3，或 Z.ai GLM、Minimax、Kimi Moonshot 已经整体追平美国头部。播客提供的是观察框架，不是证据链。做从业者的人，得把这两件事分开。拿 Anthropic 和 Google 这段来说，Nathan 说 Claude Opus 4.5 的热度已经接近 meme，我觉得这话挺准。过去一年 Anthropic 最会做的一件事，不只是把模型做强，而是把“代码工作流”变成可感知产品优势。Claude Code 这条线，把模型能力、IDE 入口、开发者口碑绑在一起了。Google Gemini 3 的问题，不一定是能力差，播客里也承认它“fantastic”；问题是 Google 经常把一次强发布做成一次短促的舆论峰值，后续心智占领不稳定。我自己一直觉得，Google 在模型层不缺硬货，缺的是持续把能力翻译成单一清晰产品叙事。这个毛病从 Bard 到 Gemini 时代都没完全治好。中国部分我反而觉得这期讲得更接近 2026 的实情。DeepSeek 还是标志性公司，但它未必继续是唯一旗手。Nathan 点名 Z.ai 的 GLM、Minimax、Kimi Moonshot，这个方向没问题：DeepSeek 打开的不是一家公司的胜利，而是一组中国实验室的许可。这里最容易被外部观察者看漏的一点，是中国模型竞争越来越像“高频发布 + 快速跟进 + 强产品化落地”的组合，不再只是单次论文或单个榜单冲刺。我还没看到这期里给出这些模型在编码、agent 成功率、长上下文可靠性上的并列数字，所以谁领先不能硬排。但“多点开花”已经是事实，不是叙事包装。我也想泼一点冷水。Sebastian 说没有公司能长期独占技术访问权，这个方向对；如果把它理解成“技术差距因此不重要”，那就过了。OpenAI、Anthropic、Google DeepMind 这几家头部实验室依旧握着几个很现实的优势：更大的训练预算、更稳定的高端 GPU 配额、更完整的后训练与安全评测链路、更多真实付费流量回流。点子会扩散，基础设施不会以同样速度扩散。去年很多人把“开源追得快”直接翻译成“闭源护城河没了”，后来在大规模部署、企业采购、稳定性要求上都撞了墙。播客里其实也承认了，预算和硬件约束会成为差异项；我会把这句看得比“idea space is fluid”更重。还有一个细节我比较在意：Nathan 把 Anthropic 描述成“least chaotic”。这话听着像文化评价，实际很像经营指标。模型公司一旦进入 agent 和 coding 主战场，发布节奏、工具接口、回归测试、价格策略、上下文稳定性，全都变成组织纪律问题。去年大家已经见过，单次 benchmark 领先不等于开发者持续迁移；把 API、IDE、文档、速率限制、故障恢复一起做好，才会形成留存。节目没有展开这些运维层数字，我有点遗憾，因为这部分往往比“谁更聪明”更决定商业结果。所以我对这期的结论很直接：它最有价值的不是预测谁赢，而是纠正观察方法。2026 年别再把 AI 竞赛看成几家实验室闭门比智商。更像 F1 车队：空气动力学会被抄，领先圈速最后落在预算、供应链、维修站配合和车手失误率。标题已经给出大框架，正文没给出足够定量材料；这不妨碍那个核心判断成立——技术神秘感在下降，执行密度在升高。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

播客·视频

更多

频道

后台