ax@ax-radar:~/podcasts/latent-space $ ls -t podcasts/
44 srcsignal 72%cycle 04:32

播客·视频

9 episodes · updated 3m ago
6 个频道在监控
筛选精选全部含低分剧集
Latent Space9
2026-04-18 · 星期六2026年4月18日
2026-04-16 · 星期四2026年4月16日
2026-04-15 · 星期三2026年4月15日
00:31
12d ago
Latent Space· rssEN00:31 · 04·15
Notion 的 Token Town:5 次重建、100+ 工具、MCP vs CLI 与软件工厂未来——Notion 的 Simon Last 和 Sarah Sachs
标题给出 Notion 讨论 Token Town、5 次重建与 100+ 工具,并把 MCP 与 CLI 放在同一比较框架里。RSS 片段正文为空,未披露这些重建对应的时间、架构、指标与结论。真正值得盯的是 Notion 是否给出可复现的工具编排机制;目前只有标题信息。
#Tools#Notion#Simon Last#Sarah Sachs
精选理由
标题有点击点,也碰到工程团队关心的工具链话题,但正文为空,只有访谈主题,没有数据、机制或案例支撑。按 hard-exclusion-6 处理:零来源评论内容,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R1
2026-04-08 · 星期三2026年4月8日
00:26
19d ago
Latent Space· rssEN00:26 · 04·08
[AINews] Anthropic 达到 300 亿美元 ARR,Project GlassWing 与 Claude Mythos 预览——自 GPT-2 以来首个因过于危险而未发布的模型
标题称 Anthropic 年化经常性收入达到 300 亿美元,并预览 Project GlassWing 与 Claude Mythos。正文为空,ARR 口径、两项目细节、以及“自 GPT-2 以来首个因过于危险而未发布的模型”的判定依据均未披露。别被标题带跑,真正该盯的是未披露的证据链。
#Anthropic#Claude#GPT-2#Commentary
精选理由
标题有话题性,也碰到 Anthropic 增长与模型安全两根行业神经。问题是正文为空,ARR 口径、Project GlassWing 与 Claude Mythos 细节、以及“自 GPT-2 以来首个”判定依据都没给,触发 hard-exclusion 的零来源内容,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H1·K0·R1
2026-04-07 · 星期二2026年4月7日
17:14
20d ago
● P1Latent Space· rssEN17:14 · 04·07
面向“Token Billionaires”的极限 Harness Engineering:100万行代码、日耗10亿 token、0 人类写码、0 人类审查
OpenAI Frontier 团队称其用 5 个月构建内部测试产品,代码库超 100 万行、每天消耗超 10 亿 token,且合并前 0 人类写码、0 人类审查。正文给出的具体机制是把失败归因到缺失的能力、上下文或结构,并用 Symphony 多代理编排、规格文档、测试、可观测性和 1 分钟内构建循环来约束 Codex。真正值得盯的是流程重心已从“人审代码”转到“人设计 harness”;价格估算约 2000 到 3000 美元/天,但该数值来自文中转述。
#Agent#Code#Tools#OpenAI
精选理由
HKR 三轴都成立:标题有强钩子,正文也给了流程机制与量级数字。分数压在 featured 而非 p1,因为它是访谈转述,不是官方产品发布,1B token/天与成本等关键说法缺少独立佐证。
编辑点评
OpenAI Frontier 把代码评审前移成测试与编排设计,这条路我买账;“0% 人审”更像流程胜利,不是模型已会自己负责。
深度解读
OpenAI Frontier 用 5 个月跑出 100 万行代码和 10 亿 token/天,这件事先说明一个事实:代码代理的瓶颈,已经从“会不会写”转到“你能不能把失败关进笼子里”。我对这条基本买账。因为文中最扎实的部分,不是 0% 人类写码,也不是 0% 合并前人审,而是他们把失败拆成能力、上下文、结构三类,再用规格、测试、可观测性和 1 分钟内构建循环去压缩误差面。这个思路比“再 prompt 一下”硬得多。 我一直觉得,很多团队把 coding agent 用废了,不是模型差,是工程环节还停在副驾驶时代。Cursor、Devin、Copilot 这一轮产品,2025 年就已经把“自动改一串文件、自动提 PR、自动跑部分测试”做出来了,但默认前提还是人来兜底。OpenAI 这次公开讲的东西,是把兜底位置改了:不是最后的人审,而是前面的 harness。这个变化很大。因为它默认接受一个现实:在 100 万行仓库里,人类 review 本来就经常只看局部语义,抓不住系统性回归;测试覆盖、观测指标、回滚路径,反而更接近真实控制面。 但我对“0% human review”这个口号有点警觉。文章给了 repo 规模、token 用量、开发周期,也给了方法论;正文没披露缺陷率、回滚率、线上事故数、测试逃逸比例,也没给出和人工团队的交付速度对照。没有这些数,这句口号更像管理学信号,不是可靠性结论。工程团队当然可以在 merge 前不看代码,可前提是测试集、验收条件、沙箱隔离、发布闸门都足够硬。要是 harness 本身有盲区,模型只会更快把错误做大。 价格叙事我也不完全买。文中 2000 到 3000 美元/天是转述,不是官方账单。按 10 亿 token/天算,这个成本对 OpenAI 内部团队几乎不构成约束,对多数创业公司也未必离谱;贵的是把整套 harness 养起来的人力和组织纪律。你需要 PRD 写得像可执行合同,需要一分钟级构建,需要每次失败都归档到能力、上下文、结构,而不是甩锅给“模型今天抽风”。这比买 token 难多了。很多公司看到这里,会误判成“多烧 token 就行”;我看正好相反,没测试工厂,token 烧得越多,噪声越多。 还有一个上下文,文章没展开,但很关键。OpenAI 现在自己就是 Codex 的最高强度用户,这跟过去模型公司把内部 dogfooding 当展示橱窗不一样。这里暴露的是产品路线:代码代理不再只是 IDE 插件,而是在往“受约束的软件工厂”走。Symphony 这种多代理编排,如果真能稳定复现,影响的不只是写码效率,还会改掉团队分工——资深工程师写的将更少是业务逻辑,更多是规范、测试、评估器、发布策略。我觉得这才是这篇里最有信息量的地方。 说真的,我还是保留一层怀疑:这套方法目前成立,多半依赖 OpenAI 内部几个奢侈条件——自家模型优先适配、自家工具深度联动、足够高的 token 配额、对失败样本的持续回灌。外部团队能不能照搬,正文没证明。去年很多 autonomous coding demo 都死在同一个地方:demo 里的 repo 干净、边界清楚、依赖可控;一到遗留系统、脏数据、跨团队接口,代理就开始失速。OpenAI 这次至少给出了一条靠谱方向,但它证明的是“极强 harness 可以托住极强 agent”,还没证明“普通团队靠现成工具就能复制 dark factory”。这两件事差得很远。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
2026-04-03 · 星期五2026年4月3日
2026-03-31 · 星期二2026年3月31日
01:04
27d ago
Latent Space· rssEN01:04 · 03·31
[AINews] 科技行业最后的 4 类工作
标题称科技行业只剩“最后 4 类工作”,但正文为空,具体是哪些岗位、按什么标准划分,均未披露。当前只能确认这是一篇 AINews 评论性条目,核心信息只有“4 类工作”这个数字;别被标题带跑,实质细节还没有。
#Commentary
精选理由
H 和 R 都有:标题抓人,也打到从业者的岗位焦虑。问题是 K 近乎为零,正文没有岗位名单、标准、样本或数据,触发 hard-exclusion-6(零来源评论),只能排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H1·K0·R1
2026-03-30 · 星期一2026年3月30日
19:25
28d ago
Latent Space· rssEN19:25 · 03·30
Mistral:Voxtral TTS、Forge、Leanstral,以及 Mistral 4 的下一步——对谈 Pavan Kumar Reddy 与 Guillaume Lample
Latent Space 在标题中点名 Mistral 4 的 3 个相关话题:Voxtral TTS、Forge、Leanstral,并预告“下一步”讨论。正文为空,发布日期、产品形态、参数、价格、发布时间均未披露。真正能确认的只有这是一次与 Pavan Kumar Reddy 和 Guillaume Lample 的对谈。
#Audio#Mistral#Pavan Kumar Reddy#Guillaume Lample
精选理由
标题有点击钩子,HKR-H 成立;正文为空,只有对谈对象姓名,没有参数、价格、发布时间或实测,HKR-K 与 HKR-R 都不成立。触发“零来源内容”硬排除,重要性封顶 39,列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H1·K0·R0

更多

频道

后台