FEATUREDAI HOT 精选· aihot-apiZH19:22 · 05·07
冻结 LLM 隐藏状态仍存可读行为信号,Cygnus 提升准确率
Proprioceptive AI 称 Cygnus 在冻结 LLM 上加入适配器,把 Qwen-32B 的 ARC-Challenge 准确率从 82.2% 提至 94.97%。机制是把隐藏状态投影到 gl(4,R) 李代数空间,分离含精度信号的暗模式。真正值得盯的是复现实验;正文未披露完整评测集与对照设置。
#Inference-opt#Interpretability#Benchmarking#Proprioceptive AI
精选理由
HKR 三项都命中:数字和机制足够新,角度也反常识。分数压在 featured 低位,因为来源是 X 帖,正文未披露完整评测集、训练细节与对照设置。
一句话点评
Qwen-32B 的 ARC-Challenge 从 82.2% 跳到 94.97%,这数太漂亮;我先把 Cygnus 放进复现等候室。
锐评
Cygnus 这个结果先别急着转成能力叙事,12.77 个点的 ARC-Challenge 提升放在冻结 Qwen-32B 上太扎眼。它只加适配器,把隐藏状态投到 gl(4,R) 李代数空间,再抽“暗模式”;如果成立,这比普通 LoRA 更像测试时读状态校正。
问题是评测边界没给够。正文只说一张 RTX 3090、82.2% 到 94.97%、覆盖 3B 到 405B、5 万并发,没交代 ARC-Challenge 的 split、prompt、seed、是否调过验证集。ARC 这类基准早被各种推理包装刷到变形;没有第三方复跑,这更像一个很会包装的 interpretability-to-performance demo。
HKR 分解
hook ✓knowledge ✓resonance ✓