FEATUREDr/LocalLLaMA· rssEN17:33 · 05·14
MOOSE-Star(ICML 2026):用于科学假设发现的 7B 模型与 108K 论文数据集
MiroMind 研究者发布 MOOSE-Star 集合,含 3 个 7B 模型与 108,717 篇 NCBI 论文数据集。MS-IR-7B 在灵感检索准确率达 54.37%,fp16 约 14GB。
#RAG#Reasoning#Fine-tuning#MiroMind
精选理由
ICML 研究发布有可验证数字,且 7B/fp16 约 14GB 对本地从业者有现实吸引力;但来源单一、机构影响力有限,仍停在 featured 门槛段。
一句话点评
MOOSE-Star 像是把“科学发现 agent”从口号拉回可复现基线:7B、14GB fp16、108K 论文,比巨模 demo 更诚实。
锐评
MOOSE-Star 的价值不在“自动科学发现”,而在给这个方向放了一个小模型硬基线。摘要给出的钩子很具体:3 个 7B 模型,TOMATO-Star 含 108,717 篇 NCBI 论文,MS-IR-7B 用 DeepSeek-R1-Distill-Qwen-7B 做底座,灵感检索准确率 54.37%,fp16 约 14GB,还能跑 llama.cpp、vLLM、SGLang。
我喜欢这个尺寸选择。科学假设发现最怕被 GPT-5 级别闭源能力糊成 demo,最后没人知道是检索、推理还是语料泄漏在起作用。这里把任务压到 7B,本地可跑,才方便做消融和复现。正文被 Reddit 403 拦住,训练细节和评测构造没展开;54.37% 这个数先别神化,关键是负例怎么采、论文时间切分怎么做。
HKR 分解
hook ✓knowledge ✓resonance ✓