新FEATUREDHacker News 首页· rssEN05:44 · 06·13
用 Anthropic 最危险的模型,一次生成一个完整游戏
作者拿 Claude Fable 试了一个他想了多年的游戏点子。模型先推理了 45 分钟,烧掉超过 20 欧元的 token,最后吐出一个 2,319 行、零依赖的 index.html,游戏直接能跑。他说这是第一次有 AI 一次性做成这件事,之前所有模型都失败了。不过正文没披露具体模型版本,也没解释 Anthropic 安全评估里说的“危险”到底指什么。
#Code#Anthropic#Claude Fable#Koen van Gilst
精选理由
作者拿 Claude Fable 试了一个他想了多年的游戏点子。模型先推理了 45 分钟,烧掉超过 20 欧元的 token,最后吐出一个 2,319 行、零依赖的 index.html,游戏直接能跑。他说这是第一次有 AI 一次性做成这件事,之前所有模型都失败了。不过正文没披露具体模型版本,也没解释 Anthropic 安全评估里说的“危险”到底指什么,所以“最危险”这个标签先别太当真,但单次生成完整可玩游戏这个结果本身挺扎实。
一句话点评
作者用Claude Fable一次性生成了一款他想了多年的牧羊犬游戏,45分钟烧掉20多欧元token,出来一个2319行零依赖的HTML文件直接能玩。这是他第一次见AI做成这事,但正文没提具体模型版本,也没说“危险”到底指什么。
锐评
这条分享的价值在于一个真实的个人基准测试:作者拿一个他反复尝试多年的游戏点子,让Claude Fable一次性写出来。之前所有模型都失败了,这次成了,说明模型在长链条代码生成和零依赖交付上确实有进步。2319行HTML,没有外部库,直接能跑,这个结果本身挺直观。
但信息缺口也很明显。作者没写用的是Claude Fable的哪个版本,也没解释Anthropic安全评估里说的“危险”具体指什么能力或风险。标题里的“最危险AI”更像一个引子,正文没展开。另外,20多欧元token成本对个人实验来说不低,45分钟推理时间也偏长,这些数字说明当前这种一次性生成方案还不太适合频繁迭代或预算有限的场景。
如果作者能补上模型版本、安全评估的具体指向,以及这个游戏逻辑的复杂度说明,参考价值会更高。现在更像一个“它做到了”的兴奋记录,而不是可复现的评测。
HKR 分解
hook ✓knowledge ✓resonance ✓