16:29
45d ago
Ben's Bites· rssEN16:29 · 03·13
我这周在构建什么,以及怎么构建
Ben Tossell 披露他上周工作坊吸引 1.3k 人报名,并发布一个给 Codex 或 Claude Code 使用的交互式 cookbook alpha0.1。正文列出其当前栈:GPT 5.4 XHigh 负责“proper code”,Opus 4.6 负责规划与设计;他还称自己做的 visualise skill 在 GitHub 已超过 200 stars。别被标题骗了,这不是产品发布,核心是个人 agent 开发流程与工具偏好复盘。
#Agent#Code#Tools#Ben Tossell
精选理由
这篇文章更像个人 builder log,不是正式产品发布。HKR 里只有 K 成立:它披露了模型分工、1.3k workshop 报名和 GitHub 200+ stars;但没有系统对比、可复现流程和更广的行业影响,所以放在 all。
编辑点评
Ben Tossell 用 1.3k 报名和 200 GitHub stars 证明了一件事:个人 agent 工作流内容已经能自带分发,但这离产品还很远。
深度解读
Ben Tossell 把 1.3k 人带进工作坊,又把一份 alpha0.1 cookbook 丢给 Codex 和 Claude Code,这条我看成“个人工作流商品化”的样板,不看成产品发布。重点不在那个教程链接,也不在 200 stars;重点在他把“我怎么和 agent 配合”直接包装成可复制体验,而且已经有人愿意先报名再试。
我一直觉得,2026 年很多 AI builder 的默认栈已经收敛到双模型分工:一个模型负责长代码生成,一个模型负责规划、拆解、设计。Ben 这里点名 GPT 5.4 XHigh 写“proper code”,Opus 4.6 做 planning 和 design,这个组合很像不少独立开发者这几个月公开说过的做法。原因不神秘:代码正确率、补全速度、上下文稳定性,往往不是同一模型同时最强。Anthropic 这半年在写作、结构化规划、前端品味上口碑更稳;OpenAI 系模型在代码执行链路和工具调用上更常被拿来干重活。我自己没系统跑过他这套 cookbook,但这个分工逻辑我买账。
我不太买账的是另一层叙事:把这些信号直接读成“新产品验证通过”。1.3k 报名是很好的内容分发数据,不是留存数据,不是付费数据,也不是完成率数据。正文没披露 workshop 转化率、cookbook 跑通率、部署成功率,也没披露 Codex 和 Claude Code 各自的失败率。Ben 还直接写了 Codex 在 workshop 里掉链子,这反而比漂亮截图更有信息量——今天所谓 agent 教学,最脆弱的一环还是现场稳定性,不是 prompt 设计。
另一个有意思的点,是他把“interactive cookbook”放在“step-by-step tutorial”对立面。这个判断我基本同意。过去一年,大量 AI 教学内容都卡在一个老问题:用户要在教程、IDE、终端、浏览器之间来回切,认知上下文一直断。把教程直接喂给 agent,让 agent 边做边教,确实更接近学徒制,而不是看文档做填空。去年到今年,OpenAI Codex、Claude Code、Cursor 的很多高留存用法,本质都在往这个方向靠:不是给你一个答案,而是给你一段可执行过程。
但这里也有个明显风险。把教程嵌进 agent,不等于教学质量自动上升。模型会补全,也会乱讲;会生成页面,也会把错误模式包装得很像最佳实践。Ben 推荐用户去读 agent 中间的 thinking/output,这个建议是对的,可惜大部分初学者并不会真的审。于是“交互式 cookbook”很容易滑成另一种外包:用户得到一个能跑的站点,却没建立排错能力。标题里那种“become a builder”式热情,我理解;真落到能力迁移,正文还没给出证据。
visualise skill 这段也挺说明问题。Claude 前一天刚上交互式图表和图解 beta,他第二天就 reverse-engineer 成一个可装到 agent 里的 skill,还拿到 200+ stars。这个速度说明两件事。第一,模型厂商刚放出一个可见能力,外围开发者马上会做二次封装,延展到别的平台。第二,所谓护城河经常不是“能力是否存在”,而是谁先把它变成默认工作流。200 stars 当然不算大项目,离插件级爆发还早;但对一个个人实验仓库,它足够说明需求真实存在。
我对“code is basically free nowadays”这句有点保留。token 单价这两年确实压下来了,Claude Code、Codex 这类工具也把生成门槛拉低了,但真不免费的部分从来不是首版代码,而是反复返工、审阅、设计取舍、上线后的维护。Ben 自己也承认 cookbook 站点还要再做 design pass,contrast 都不对。这个细节很诚实,也刚好说明现实:代码更便宜了,审美和判断反而更贵。
所以这条的价值,在于它把 agent 时代一个越来越清晰的分层摆到台面上:底层模型能力在趋同,上层差异开始落到工作流编排、教学体验、默认技能包、还有个人品牌带来的分发。Ben 这次拿到的不是产品胜利,更像先手卡位。要不要把它当成 business,我还没看到足够证据;要不要把它当成信号,我觉得得认真看。
HKR 分解
hook —knowledge ✓resonance —
64
SCORE
H0·K1·R0