ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
44 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-04-21 · 星期二2026年4月21日
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于神经网络的扩散模型分数估计:优化与泛化
论文为扩散模型中的分数估计建立了 GD 训练神经网络的理论框架,并给出首个极小极大最优泛化界。方法把去噪分数匹配化为带噪标签回归,再用局部核回归近似训练动态,并推导适用于无界输入域的早停规则。真正值得盯的是,它把“理论假设精确求解 ERM”和“实际用 GD 训非凸网络”之间的缺口补上了一段。
#Research release
精选理由
论文补了扩散模型分数估计的理论缺口,HKR 只命中 K。主题偏优化理论,进入门槛高,正文未给出面向通用从业者的实验场景或产品含义,触发“技术可达性不足”,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过自监督双通道交叉注意力分析双腕 IMU 信号检测帕金森病
论文提出自监督交叉注意力编码器,用双腕佩戴 IMU 信号在 PADS 数据集上检测帕金森病,覆盖 469 名受试者。模型在 HC vs. PD 上平均准确率 93.12%,在 PD vs. DD 上 87.04%;只用 20% 标注数据时,自监督表征把两项准确率做到 93.56% 和 92.50%。真正值得盯的是部署条件:优化模型在 Raspberry Pi CPU 上单窗口平均推理 48.32 毫秒,正文未披露窗口长度等实时细节。
#Multimodal#Benchmarking#Inference-opt#arXiv
精选理由
HKR 只命中 K:有数据、有部署延迟,但核心仍是医学筛查研究。触发硬排除“传统科学/医疗 + AI 交叉且无产品或 agent 指向”,按政策降为 excluded,分数封顶 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
迈向高效影响函数:把 Dropout 当作压缩工具
该论文提出用 Dropout 压缩梯度,以更高效地计算影响函数,目标是降低大模型上的计算与内存开销。摘要称该方法同时减少影响函数计算和梯度压缩过程的开销,并保留关键数据影响成分;具体降幅、实验数据集和模型规模,正文摘要未披露。真正该盯的是机制是否稳:这不是换近似器,而是把 Dropout 直接放进影响函数所需梯度压缩链路。
#Interpretability#Inference-opt#Tools#Research release
精选理由
论文有一个可检验的方法点,所以 HKR-K 成立;但标题和摘要都停留在影响函数与梯度压缩细节,未给出降幅、数据集、模型规模或落地场景。它触发“技术可达性不足”硬排除,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
神经网络用梯度下降进行持续学习的理论
论文为单隐层二次神经网络给出持续学习遗忘的闭式保证,设定是梯度下降顺序训练带高斯噪声的 XOR-cluster 任务。作者把训练期遗忘率显式写成迭代次数、样本量、任务数和隐藏层宽度的函数,并用算法稳定性界定测试期遗忘;真正值得盯的是,这类结果直接把忘记问题参数化了。
#Fine-tuning#Research release
精选理由
这篇论文有明确新知:把持续学习遗忘写成与迭代次数、样本量、任务数、隐藏层宽度相关的闭式界。问题是设定过于理论化,单隐层二次网络加 XOR-cluster 任务缺少工程落点,触发技术可达性不足,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
非单调损失下的保形风险控制:理论与有限样本保证
论文证明:当校准样本量 n 相对网格大小 m 足够大时,非单调损失下的保形风险控制仍能把超出目标风险 α 的误差压到约 √(log(m)/n)。作者还给出匹配下界,说明这个速率是 minimax 最优;并在 Lipschitz、单调性及重要性加权分布偏移条件下推导更细保证。真正值得盯的是,CRC 失效不只看“非单调”本身,还看 n 与 m 的比例。
#Research release
精选理由
这篇论文的新增信息明确:CRC 在非单调损失下仍有约 √(log(m)/n) 误差界,还有匹配下界与分布偏移条件,所以 HKR-K 命中。问题是内容明显偏统计学习理论,现有信息也没给通用从业者的应用入口,H 与 R 都弱,触发 technical-accessibility fail,重要性封顶 39。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
SigGate-GT:用 Sigmoid 门控注意力缓解图 Transformer 过平滑
SigGate-GT 在 5 个标准基准上提升 GraphGPS,ogbg-molhiv 达到 82.47% ROC-AUC,ZINC 达到 0.059 MAE。方法是在 GraphGPS 内给每个注意力头加入 learned sigmoid gate,可把无信息连接压到 0;消融称 4-16 层平均将过平滑降 30%,且在 10× 学习率范围内更稳。真正值得盯的是,它把图模型过平滑与 LLM attention sink 归到同一机制:softmax 的 sum-to-one 约束。
#Reasoning#Benchmarking#Research release#Benchmark
精选理由
HKR 只有 K 成立:论文给出具体机制和基准数字,但题材停留在图学习子领域。它触发技术可达性不足的硬排除,普通 AI 从业者缺少进入点,重要性封顶 39。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
迈向三维气动预测的基础模型范式
TUM 团队提出 AeroTransformer,用近 30000 个 SuperWing 样本预训练,再用 450 个任务样本微调三维机翼气动预测。模型在跨声速机翼表面流场预测上达到 0.36% 误差,较从零训练降 84.2%。真正值得盯的是数据复用机制:论文已开源数据集、预训练模型和在线设计工具。
#Fine-tuning#Benchmarking#Tools#TUM
精选理由
这篇稿子有具体数字,HKR-K 成立;但主题是三维机翼空气动力学预测,主要属于传统科学与工程设计场景,不直接关联模型产品、agent 或行业竞争。按“传统科学 + AI 交叉”硬排除处理,重要性封顶 39,这里给 36 分。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
从用户识别到活动计数:一种与身份无关的多用户 WiFi 感知方法
论文把多用户 WiFi 感知改写为活动计数任务,在 WiMANS 上把每类活动人数回归到 0-5 计数,平均绝对误差为 0.1081。未见用户评测里,身份相关模型的 macro-F1 从 80.38 降到 32.61;身份无关模型的计数误差基本稳定。真正值得盯的是闭集设定失效后,按人分配动作这一路径明显更脆弱。
#Research release
精选理由
论文给出两个可检验结果:未见用户下身份相关模型 macro-F1 从 80.38 降到 32.61,身份无关计数 MAE 为 0.1081,HKR-K 成立。主题仍是 WiFi 感知学术研究,和 agent、模型产品、产业动态距离远,触发“跨学科但无产品含义”排除,分数压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过模型级专家混合做领域专用目标检测
论文在 BDD100K 上评估模型级 MoE 目标检测,并报告其表现持续超过标准集成。方法把基于 YOLO 的检测器按语义互斥子集分别训练,再用门控网络动态分配专家权重,并加入损失平衡抑制专家塌缩。真正该盯的是检测结果融合与门控训练细节;摘要未披露绝对精度提升、专家数量与推理开销。
#Vision#Interpretability#Benchmarking#KASTEL-MobilityLab
精选理由
HKR-K 过线:它报告语义互斥子集专家、门控分配和负载平衡损失,并称在 BDD100K 持续优于标准集成。HKR-H/R 偏弱,正文又未披露绝对提升、专家数量和推理开销;题材也偏 CV 细分研究,触发 technical-accessibility fail,故 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
在临床时间序列中捕捉事件的时序注意力
论文提出 LITT,用虚拟“相对时间线”对齐临床序列事件,并在 3,276 名乳腺癌患者 EHR 上预测心脏毒性致心脏病的发病时间。方法把时间当作可计算维度,为候选事件分配相对时间戳,再做面向事件时序的注意力。摘要称其优于基线和现有生存分析方法,但正文片段未披露具体数据集名称与提升幅度。
#Interpretability#Benchmarking#Research release#Benchmark
精选理由
方法层面有新信息:用虚拟相对时间线对齐 EHR 事件,再做 timing-attention,并在 3,276 名乳腺癌患者上预测心脏毒性发病时间。问题是它落在“传统科学/医疗 + AI 交叉、缺少 agent 或产品含义”的硬排除,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用基础模型在 SAR 图像中做零样本舰船实例分割的提示方法
论文用 SAR 数据训练的 YOLOv11 检测器给 SAM2 提供框提示,在不使用任何像素级掩码标注的条件下完成舰船零样本实例分割,并在 SSDD 上做到 0.637 mIoU 与 89.2% 检出率。作者称该结果相当于全监督基线的 89%,机制是用检测框的空间约束压住光学到 SAR 的域偏移;真正值得盯的是,它没做微调或适配器。
#Vision#Multimodal#Benchmarking#Research release
精选理由
论文有具体指标和可复现机制,HKR-K 成立。问题是它属于高度垂直的 SAR 遥感分割研究,缺少产品、Agent 或行业外溢,触发 technical-accessibility fail,importance capped below 40,故 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于 LLM 遗忘数据帕累托改进的随机对跖搜索
论文提出 RASLIK 检索算法,用于在触发式 LLM 遗忘中同时改善遗忘与保留的权衡,并宣称在多模型、多数据集、多种遗忘算法上优于确定性基线和 oracle sampling。其机制是把 permutation-projection hashing 与 randomized antipodal search 结合到线性化影响核上,目标是降低样本选择方差并实现次线性复杂度。真正值得盯的是数据检索前置:正文给了方法与结论,具体增益数字和实验规模在摘要未披露。
#Alignment#Inference-opt#Tools#Research release
精选理由
触发硬排除:技术可达性不足。标题和摘要集中在线性化影响核、hashing 与搜索算法,正文摘要也未披露增益数字、实验规模和复现门槛;HKR 只有 K 命中,对通用 AI 从业者不够友好,所以 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
POLAR:用于边缘 LLM 服务中 LoRA 适配器缓存与路由的在线学习
论文提出 POLAR,把边缘 LLM 的 LoRA 适配器缓存与请求路由建模为双时间尺度上下文 bandit,并给出两种在线算法。POLAR+ 在满足随机正则性与可缓存条件时取得 Õ(d√NT+√KT) 次线性遗憾;实验用 Qwen2.5-7B 的 15 个真实 LoRA 适配器和实测 GPU 分页延迟。真正值得盯的是,作者声称内存层级不会从根本上拖慢路由学习速率。
#Inference-opt#Fine-tuning#Benchmarking#Qwen
精选理由
这篇论文有料:它把 LoRA 缓存与路由建模为双时间尺度 contextual bandit,并给出遗憾界和 Qwen2.5-7B 上 15 个真实适配器实验。门槛也很高,正文信息集中在在线学习理论与边缘推理优化,缺少对通用读者的收益翻译,触发 technical-accessibility fail,故排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通用的基于扩散的概率降尺度
该论文提出单一条件扩散模型,把约25公里分辨率天气预报降尺度为约5公里概率预测,并对异构上游天气模型做零样本适配。评测覆盖近地面变量和最长90小时预报,用独立站点观测检验;结果称集合均值稳定优于各模型原始确定性预报,CRPS收益更大。真正值得盯的是,它不做模型专属微调;正文未披露具体增益数值。
#arXiv#Research release#Benchmark
精选理由
单一条件扩散模型做25公里到5公里天气降尺度,零样本适配异构上游模型,HKR-K成立。它仍是气象科学与AI交叉,和代理、产品、模型竞争关系远,按 hard-exclusion-传统科学交叉排除,分数封顶39。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
迈向基于 E-value 的 Bayesian Deep Ensembles 停止规则
该论文提出一种基于 E-value 的停止规则,在多种实验设定下为 Bayesian Deep Ensembles 的顺序采样决定何时提前停止。方法把集成构建表述为 anytime-valid 序贯假设检验,用来检验“加入 MCMC 相对已优化 Deep Ensembles 没有增益”的原假设。摘要称常只需完整链预算的一小部分,具体比例、数据集与绝对收益正文片段未披露。
#Inference-opt#Research release
精选理由
命中 hard-exclusion-技术可达性不足:核心内容依赖 Bayesian deep ensembles、E-value 与序贯检验,泛 AI 从业者缺少进入点。HKR 仅 K 成立,正文也未给出节省比例、数据集与绝对收益,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
R3D2:用扩散模型为自动驾驶仿真真实插入 3D 资产
R3D2 提出一个轻量级单步扩散模型,在实时条件下把完整 3D 资产插入自动驾驶数字孪生场景,并生成阴影与一致光照。其训练数据来自野外 AD 数据:先用图像条件 3D 生成模型做 3DGS 物体,再合成放入神经渲染环境。真正值得盯的是跨场景迁移与 text-to-3D 插入,但摘要未披露具体基准分数。
#Vision#Multimodal#Zenseact#Research release
精选理由
只命中 HKR-K:摘要给出单步扩散、实时 3D 插入、阴影光照一致三项机制。题材深陷自动驾驶仿真与神经渲染,普通 AI 从业者缺少进入点,且摘要未披露基准分数,按技术可达性不足排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于行为克隆组合泛化的自预测表征
论文提出 BYOL-γ 表征目标,用于目标条件行为克隆在新状态-目标组合上的零样本泛化。摘要称该方法用自预测表征近似有限 MDP 中的后继表征,并通过长程时间一致性缩小分布外差距。真正该盯的是机制:正文片段只给出理论近似与“具竞争力”结果,任务数量、基线名称和具体指标未披露。
#Agent#Benchmarking#Research release#Benchmark
精选理由
这篇论文有机制新意,但对通用 AI 从业者的进入门槛过高:核心是 goal-conditioned behavioral cloning、后继表征和有限 MDP 近似,正文摘要也没给任务数、基线名和指标。HKR 只命中 K,按 hard-exclusion 的 technical-accessibility fail 处理,分数压到 40 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
医疗数据中的联邦规则集成方法
论文提出联邦 RuleFit 框架,用差分隐私直方图、共享切分点和 Federated Dual Averaging,在多机构医疗数据上训练可解释全局模型。摘要称其在模拟中达到接近集中式 RuleFit 的表现,并优于现有联邦方法;真实数据分析也给出有竞争力的精度。真正值得盯的是可解释性来自规则和稀疏系数,正文摘要未披露数据规模与具体指标。
#Interpretability#Benchmarking#Research release
精选理由
摘要给出差分隐私直方图、共享切分点和 Federated Dual Averaging,HKR-K 成立。它仍是面向医疗多机构数据的联邦学习方法论文,缺少 agent 或产品外溢,且摘要未披露数据规模与核心指标;按 hard-exclusion-传统科学/行业交叉排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
RA-RRG:用关键词提取做多模态检索增强的放射学报告生成
RA-RRG 提出检索增强放射学报告生成框架,在 MIMIC-CXR 和 IU X-ray 上取得 CheXbert 最优结果,并给出有竞争力的 RadGraph F1。方法先用 LLM 从报告提取临床关键词,再按输入胸片检索相关短语并条件化生成;摘要未披露具体分数。真正值得盯的是,它把抑制幻觉和降低多模态大模型算力开销放进同一条链路,代码已开源。
#RAG#Multimodal#Benchmarking#Deepnoid AI
精选理由
这篇论文有具体方法链路和开源代码,HKR-K 成立。问题是题材属于医疗影像+AI 交叉研究,缺少 agent、产品或行业竞争外溢,触发 hard-exclusion 的传统 science+AI crossover 规则,分数封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过 metacircuit 实现的全模拟谐振循环神经网络
研究团队提出一种通过 metacircuit 实现的全模拟谐振循环神经网络 R²NN,可直接处理原始模拟时序输入并绕过模数转换。其机制是把训练后的 R²NN 参数直接映射到耦合电谐振器,结合可联合训练的全局电阻耦合与局部谐振,形成按频率选择通路的阻抗分布。论文在触觉感知、语音识别和状态监测上做了硬件演示,但正文未披露精度、功耗、延迟或芯片规模。
#Reasoning#Audio#Inference-opt#arXiv
精选理由
论文有一个可复述的机制,所以 HKR-K 成立。问题是正文未披露精度、功耗、延迟、芯片规模,理解门槛落在模拟电路细节,触发 technical-accessibility fail;重要性被压到 39 以下,只能 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Shifting the Gradient:理解防御性训练如何保护语言模型完整性
Satchel Grant等在arXiv发表论文,对比2种防御训练方法PPS与IP,结论是二者都能抵御“evilness”特征注入,但机制不同。论文称PPS会把激活梯度推向PPS向量轴的衰减方向,已被该特征微调的模型里IP无效。真正值得盯的是,IP的梯度更分散,正文未披露统一机理。
#Alignment#Safety#Interpretability#Satchel Grant
精选理由
这篇论文有 HKR-K:摘要至少给出 PPS 与 IP 的差异机制,信息量够具体。门槛也很高,正文摘录没交代实验设置、模型规模和部署含义,触发技术可达性硬排除,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Reward Score Matching:统一流模型与扩散模型的基于奖励微调
这篇 arXiv 论文提出 Reward Score Matching,把流模型与扩散模型的奖励微调统一成一个框架。摘要称,多种方法的差异可归结为价值引导估计器构造,以及各时间步的有效优化强度;实验涉及可微奖励和黑盒奖励。真正值得盯的是,它把偏差、方差、算力权衡放到同一视角下,但摘要未披露具体基准、提升幅度与训练成本数字。
#Fine-tuning#Alignment#Research release
精选理由
这篇论文有一点 K:它把 flow model 与 diffusion model 的奖励微调放进同一分析框架。门槛仍然偏高,摘要未披露基准、提升幅度与训练成本数字,通用读者缺少进入点,触发技术可达性排除,因此给 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
时间序列基础模型嵌入空间中的非平稳性
这篇 arXiv 论文在受控条件下测试多种 TSFM,考察均值漂移、方差变化、线性趋势与持久性在嵌入空间中的线性可检测性。作者按扰动强度做 sweep,发现可检测性会平滑下降,不同模型还会出现各自的失效模式。真正该盯的是区分分布漂移与弱平稳性破坏;正文未披露具体模型名、数据集和指标数值。
#Embedding#Benchmarking#Research release#Benchmark
精选理由
这篇论文有一条可检验结论:TSFM 嵌入对均值漂移、方差变化、线性趋势与持久性的可检测性会随扰动强度下降。题目和摘要都偏时间序列统计专门领域,正文未披露模型名、数据集与指标,触发 technical-accessibility fail,按排除处理。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
评估用于 DDoS 流量的时序与结构异常检测范式
该论文在2个统计特性不同的数据集上评估3类无监督检测器,比较 DDoS 流量的时序特征与结构特征,结果显示结构特征持续持平或优于时序特征。作者提出训练前决策框架,依据聚合流信号的 lag-1 自相关与 PCA 累积解释方差选特征;两项探针若无结论,只保留混合方案为后备,正文未给出其已验证结果。
#Benchmarking#Research release#Benchmark
精选理由
论文有可检验结论,HKR-K成立:结构特征在两个数据集上持平或优于时序特征,还给出训练前探针框架。问题是它触发 hard-exclusion-technical-accessibility:DDoS 异常检测过于垂直,正文依赖安全与统计背景,对 AI RADAR 的通用从业者不友好,所以排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
揭开在线对齐方法“反常高效”的原因
论文称,在线 RLHF 与在线 DPO 在温度为 0 的决策型遗憾下可达 O(1) 累积遗憾,不是既有理论里的 O(log T)。摘要给出的机制是:KL 正则遗憾把学习统计成本与软策略探索随机性混在一起;新准则只评估推理时的最高分回复。真正值得盯的是评价口径变了,RSS 摘要未披露实验设置、定理条件与适用边界。
#Alignment#Reasoning#arXiv#Research release
精选理由
摘要提出一个新理论口径:在线 RLHF 与 online DPO 在温度 0 的决策遗憾下可达 O(1) 累积遗憾。信息停留在 regret 定义与上界,实验设置、定理条件和适用边界未披露;对泛 AI 从业者门槛过高,触发 technical-accessibility fail。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于生成式 PDE 基础模型的 Flow Marching
论文提出 Flow Marching,并在约250万条轨迹、12类 PDE 上训练生成式 PDE 基础模型。方法联合采样噪声强度与物理时间步,配合 P2VAE 和 FMT;正文称其计算效率最高比全长视频扩散高15倍,并在未见过的 Kolmogorov 湍流上做少样本适配与长期滚动评测。真正值得盯的是,它把不确定性生成和长期稳定性放进同一训练目标,不再只做确定性外推。
#Inference-opt#Benchmarking#Research release#Benchmark
精选理由
论文有具体机制与数字,HKR-K 成立;但主题落在 PDE 与科学计算交叉,读者很难直接映射到代理、产品或部署。按 hard-exclusion-4 处理,技术门槛也偏高,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
LLM 作为工具而非代理:用于神经架构搜索的代码挖掘树变换
论文提出 LLMasTool,把神经架构搜索改成代码挖掘的树变换,并在 CIFAR-10、CIFAR-100、ImageNet16-120 上分别提升 0.69、1.83、2.68 分。方法先从任意源码抽取可复用模块,再把完整架构表示成层次树;搜索由多样性引导算法和贝叶斯建模负责,LLM 只补全剩余自由度,不直接生成整段代码。
#Code#Tools#Benchmarking#Research release
精选理由
标题有反直觉点,正文也给了三组基准增益,HKR 命中 H 和 K。问题在于它是高度专业的 NAS 研究,源码挖掘、树变换和贝叶斯搜索都缺少通用读者上手点,触发 hard-exclusion-technical-accessibility fail,按规则排除并封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
批量自适应因果标注
该论文提出批量自适应采样方法,在平均处理效应估计中用90个优化标注样本,达到361个随机样本的置信区间,标注预算节省75%。方法通过最小化缺失结果场景下双重稳健估计器的渐近方差,给出最优批量采样概率闭式解;实验覆盖模拟数据和无家可归者服务外展干预等真实数据。真正值得盯的是,它把主动选样直接绑到 AIPW 因果估计效率,而不是单纯做通用主动学习。
#Benchmarking#Tools#Research release
精选理由
K 有实质信息:90 个优化标注达到 361 个随机标注的区间效果,机制也写到 AIPW 渐近方差最小化。问题是技术门槛高,正文没有 agent、产品或通用工作流落地,触发“technical-accessibility fail”,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于语义的分布式学习:学习多样且可判别的表征
论文提出一个语义驱动的分布式学习框架,在 i.i.d. 与 non-i.i.d. 两种数据条件下学习兼具多样性和判别性的表征。方法在 i.i.d. 场景里对全局目标加入表征方差约束,并用原始-对偶法推导更新;在 non-i.i.d. 场景里用节点聚类、虚拟复制和块坐标下降训练。实验覆盖 MNIST、CIFAR-10 和 CIFAR-100;具体指标提升幅度正文未披露,真正值得盯的是它试图用语义共享降低对统一网络架构的依赖。
#Embedding#Benchmarking#Research release
精选理由
这篇 arXiv 论文更像分布式学习子领域的技术增量,HKR 三项都弱。它还触发 technical-accessibility fail:原始-对偶、虚拟复制、块坐标下降这些机制对泛 AI 读者门槛高,且正文未给出关键提升数字,因此按硬排除处理。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
AutoOR:用可扩展后训练让 LLM 自动形式化运筹优化问题
AutoOR 用合成数据生成与强化学习后训练 8B 模型,把自然语言运筹问题转成求解器可执行形式。论文称它在 6 个既有 OR 基准上达到 SOTA 或竞争性结果,并可覆盖线性、混合整数、非线性三类问题。关键机制是从标准优化形式生成可验证数据,再用求解器执行反馈做 RL 奖励;各基准分数正文摘要未披露。
#Reasoning#Fine-tuning#Benchmarking#arXiv
精选理由
论文有可验证训练思路,HKR-K 成立,但核心场景是运筹自动建模,技术门槛和受众都偏窄。正文摘录未给出各基准分数与复现细节,触发 hard-exclusion-technical-accessibility fail,重要性封顶 39。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
EEG 基础模型的测试时适应:真实分布偏移下的系统研究
论文提出 NeuroAdapt-Bench,系统评测 EEG 基础模型在真实分布偏移下的测试时适应。基准覆盖多个预训练模型、下游任务与异构数据集,包含同分布、分布外和 Ear-EEG 等极端模态偏移。结果显示标准 TTA 增益不稳定,梯度法常明显降级;真正值得盯的是免优化方法更稳。
#Benchmarking#Fine-tuning#Research release#Benchmark
精选理由
有料点在系统基准和结论:梯度式 TTA 不稳,免优化法更稳,所以 HKR-K 命中。分层仍给 excluded,因为它落在传统科学/医疗交叉且无 agent 或产品外溢,受众适配弱;题材也偏专业,接近 technical-accessibility fail。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
CCAR:把内在鲁棒性视为一种涌现的几何属性
论文提出 CCAR,用类条件激活正则化把特征空间压成块对角结构,并将各类别能量限制在正交子空间。摘要称该约束可提升 Fisher 判别比,并在标签噪声、输入损坏与对抗扰动上优于基线;基线名称、数据集与提升幅度正文未披露。
#Benchmarking#Interpretability#Research release
精选理由
摘要只给出 CCAR 的几何约束思路,没给数据集、基线名称和提升幅度。主题偏 ML 理论,普通 AI 从业者缺少进入点,触发技术可达性不足这条硬排除,分数按规则压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
遗传编程符号回归的泛化界
该论文为遗传编程符号回归推导了泛化界,条件是表达式树的大小、深度和可学习常数受约束。界被拆成结构选择项与常数拟合项两部分,对应树结构组合复杂度和固定结构内常数优化复杂度。真正值得盯的是,它把 parsimony pressure、深度限制、数值稳定算子和区间算术连到显式复杂度项上。
#Research release
精选理由
论文有明确理论增量,但主题是符号回归与遗传编程的泛化界,读者门槛偏高。HKR 只命中 K,且没有产品、基准或应用层后果,触发 technical-accessibility fail,按规则排除并压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
S-GRPO:大型视觉语言模型的统一后训练方法
论文提出 S-GRPO,把大型视觉语言模型后训练中的 SFT 与 RL 合并为一套框架,目标是缓解单独使用两者时的遗忘与冷启动问题。其核心机制 CGI 会在二值验证器判定一组轨迹全部探索失败时,注入已验证真值轨迹,并赋予确定性最高奖励。真正值得盯的是,这篇摘要只声称收敛更快、适应更强,正文片段未披露基座模型、数据集和具体指标。
#Multimodal#Fine-tuning#Research release
精选理由
触发技术可达性排除:这是一篇面向视觉语言模型后训练研究者的方法论文,行业读者进入门槛偏高。HKR 只命中 K:摘要给出 CGI 机制,但正文信息未披露基座模型、数据集和指标,“更快收敛、更强适应”暂时无法校验。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于 Meta-optics 的神经伴随方法:用 Fourier Neural Operators 加速体积逆向设计
论文提出 Neural Adjoint Method,用 Fourier Neural Operator 从体素化介电常数体直接预测 3D 伴随梯度场,把每轮伴随求解替换为快速预测,并称设计时间可从数小时降到数秒。摘要给出两个硬信息:宽带设计常要数千次 Maxwell 求解,评测覆盖 spectral sorting、achromatic focusing、waveguide mode conversion 三项任务;数据集来自成对的 forward/adjoint FDTD 仿真。真正值得盯的是它学的是逐体素敏感度场,不是只做终态回归。
#Research release
精选理由
有具体技术点,HKR 里 K 成立:方法不是终态回归,而是直接预测逐体素 3D 伴随梯度场。问题在于它属于 Maxwell/FDTD 驱动的 meta-optics 逆设计,技术门槛高,也没有 agent 或产品含义,触发“技术可达性失败”和“传统科学+AI 交叉”排除规则。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于不确定性感知多模态学习的跨模态贝叶斯低秩适配
论文提出 CALIBER,用跨模态贝叶斯低秩适配处理音频-文本学习,并把随机性限制在秩 r 适配器空间的低维潜变量内。其机制是按层、按 token 用文本-音频交叉注意力调制均值和方差;摘要称在多种文本与音频骨干上持续匹配或超过文本贝叶斯 PEFT 与多模态迁移基线,但正文未披露具体数据。真正值得盯的是,它把音频当作可靠性信号,而不只是额外特征。
#Multimodal#Audio#Fine-tuning#Research release
精选理由
HKR-K 命中:摘要至少给出一条可复述的机制线索。HKR-H、R 都弱,且触发 hard-exclusion-technical-accessibility:贝叶斯 PEFT 与不确定性建模门槛高,正文这里也未披露具体指标,普通 AI 从业者难判断实际价值。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
CAPO:顺序协作团队中的反事实信用分配
论文提出 CAPO,用于固定顺序协作团队的信用分配,并在单次初始批数据上优化各代理策略。方法从 SeqAU 推出无 critic 的策略梯度,只需当前策略的少量前向计算,不增加环境调用。作者还给出偏差与方差界;在受控顺序 bandit 中,团队越大,CAPO 相对基线优势越明显。
#Agent#Reasoning#Benchmarking#Wolpert
精选理由
这是一篇有料但很窄的多智能体强化学习论文:无 critic、单次初始批数据、无额外环境调用,这些点都具体。问题是可读门槛高,正文也只给出受控顺序 bandit 结果,缺少产品化或通用 agent 落地场景;按 hard-exclusion 的 technical-accessibility fail 处理,分数封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Persistence-Augmented Neural Networks
论文提出 Persistence-Augmented Neural Networks,用 Morse-Smale complex 做持久性数据增强,保留局部拓扑与层级演化,预处理复杂度为 O(n log n)。方法可接入卷积网络和图神经网络,并在病理图像分类、3D 多孔材料回归中优于基线及 persistence images、landscapes。真正该盯的是它保留局部结构,不再只做全局 TDA 汇总。
#Interpretability#Benchmarking#Tools#Research release
精选理由
论文有可检验的新点:用 Morse-Smale complex 做持久性增强,预处理复杂度写到 O(n log n),并报告在病理图像分类与 3D 多孔材料回归优于若干 TDA 基线。问题是门槛过高,整篇面向 TDA/几何学习读者,触发“技术可达性不足”,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于大规模数据集蒸馏的软标签剪枝与量化
论文提出 LPQLD,用软标签剪枝与量化改进大规模数据集蒸馏,在 ImageNet-1K 将标签存储压到原来的 1/78,在 ImageNet-21K 压到 1/500。方法用 class-wise batching 和 batch-normalization supervision 提高图像多样性,再用动态知识复用与校准的师生对齐提升监督多样性。真正值得盯的是,它不只省存储,还把准确率最多拉高 7.2% 和 2.8%,代码已开源。
#Fine-tuning#ImageNet#Research release#Open source
精选理由
这篇论文有具体数字,HKR-K 成立;但主题是大规模数据集蒸馏,阅读门槛高,主要面向训练研究者。按 hard-exclusion-technical-accessibility fail 处理,重要性封顶在 39 以下,归为 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于心脏时间序列的基础模型:基于掩码潜在注意力
论文提出 LAMAE,用掩码自编码预训练 ECG 基础模型,并用潜在注意力学习导联间连接机制。正文确认其在 MIMIC-IV-ECG 上预测 ICD-10 代码时优于独立导联掩码建模和对齐式基线,但摘要未披露具体分数、样本量与参数规模。真正值得盯的是它把导联冗余当作结构监督,而不是继续把 12 导联当独立通道。
#Multimodal#Benchmarking#Interpretability#MIMIC-IV-ECG
精选理由
HKR 只有 K 命中:论文提出把导联冗余当作结构监督,并称在 MIMIC-IV-ECG 上优于两类基线。按硬排除规则 4,这属于传统科学/医疗与 AI 交叉,缺少 agent 或产品含义;摘要也未披露具体分数、样本量与参数规模,所以降为 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用化学信息学预测阿尔茨海默病天然药物化合物
该研究用随机森林筛查超7000个天然化合物,识别出73个潜在抗阿尔茨海默病候选物。数据来自ChEBI、SynSysNet和INDOFINE,经Open Babel预处理并用Dragon描述符建模,精确率0.5970、召回率0.6590。真正值得盯的是描述符信号:原子极化率、键重数和非氢键计数排在前列。
#Benchmarking#ChEBI#Open Babel#Dragon
精选理由
有料,但触发硬排除 4:这是传统药物发现里的 AI 筛查,缺少 agent、产品或产业链影响。HKR 只有 K 命中;对 AI 从业者的讨论价值主要停留在方法细节,所以分数压在 40 以下并排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基础模型时代分子性质预测深度学习的系统综述与基准
这篇 arXiv 综述梳理了分子性质预测的4类范式,并汇总量子、理化、生理和生物物理任务的基准证据。摘要点名数据清洗、划分策略和评测协议的问题,包含立体化学不一致、实验来源异质、随机或定义不清划分下的复现性不足;正文未披露覆盖数据集数量。真正值得盯的是基准方法论,不是“基础模型”标签:作者主张改用时间感知和 scaffold 感知划分,并提出3个方向。
#Benchmarking#Multimodal#arXiv#GitHub
精选理由
文章有一条 HKR-K:它抓住了分子基准里的数据清洗与划分偏差,给出可检验的方法论批评。问题在题材,分子性质预测属于传统科学+AI 交叉,缺少 agent 或产品落点,触发硬排除规则。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
半监督表格分类中:协同协进化与单体进化搜索对比
论文在 25 个 OpenML 数据集上比较 CC-SSL 与 EA-SSL,用 1%、5%、10% 标注率评估半监督表格分类;两者的测试 MacroF1 中位数都高于 3 个轻量 SSL 基线,且 1% 标注时差距最大。正文给出机制:CC-SSL 联合进化两组特征子视图与伪标签策略;EA-SSL 作为参数匹配的单体进化基线。真正值得盯的是,CC-SSL 对 EA-SSL 的最终测试表现多数只是统计平局,而 EA-SSL 在 best-so-far fitness、搜索多样性和部分多分类场景的达标代数上更强。
#Benchmarking#OpenML#Research release#Benchmark
精选理由
摘要有具体评测设定,HKR-K成立:25个OpenML数据集、1/5/10%标注率、MacroF1与搜索多样性都有新信息。它仍是表格半监督与进化搜索的细分方法比较,缺少通用AI读者的进入点,触发“技术可达性不足”,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过查询学习所有利益相关方都可接受的抽签方案
论文研究有限选项上的抽签可行性:算法只靠二元接受/拒绝反馈,寻找让全部利益相关方都接受的抽签方案,或证明不存在。作者给出确定性、随机化和 learning-augmented 算法,并证明最坏情况下查询复杂度对利益相关方人数呈线性、对精度呈对数依赖。真正值得盯的是,适应式查询可少问一部分人的约束;预测准时还能继续降成本,同时保留最坏情况保证。
#Alignment#arXiv#Research release
精选理由
这篇是定理驱动的偏好学习论文,正文信息集中在查询复杂度:对参与者人数线性、对精度取对数。HKR 只中 K;标题缺少钩子,也没有 agent、产品或部署入口,按 technical-accessibility fail 归入 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
批归一化线性模型中延迟损失尖峰的机制研究
论文在批归一化线性模型里证明:归一化会逐步抬高有效学习率,并在白化平方损失回归中触发延迟损失尖峰。摘要给出无上升沿条件、延迟起始条件、方向性起始等待时间上界,还称上升沿会在有限步内自稳定。对 logistic regression,结果只在高度受限的 active-margin 与 knife-edge 条件下成立;别把它当成神经网络损失尖峰的一般解释。
#Research release
精选理由
HKR 只有 K 命中:摘要披露了延迟损失尖峰的机制与边界条件。硬排除命中 technical-accessibility fail,这类优化理论论文门槛高,且作者已说明对神经网络损失尖峰不构成一般解释,所以 importance capped below 40。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Belief Arbitration 中作为后果敏感压缩的支持充分性
论文提出一种循环仲裁架构,用后果几何、仲裁记忆和资源约束压缩证据支持结构;自适应支持分辨率控制器在重复交互仿真中累计效用超过全部固定分辨率控制器。摘要还称,固定高分辨率控制拿到最高承诺准确率,但被资源成本与学习碎片化拖累;仿真规模、任务设定与具体数值正文未披露。真正值得盯的是,作者把“保留多少证据”改写成动态控制问题,不是静态置信度阈值。
#Reasoning#Memory#Research release
精选理由
HKR-K 只落在机制层:论文把证据保留写成自适应支持分辨率控制,并声称重复交互仿真里累计效用高于固定控制器。正文未披露规模、数值和复现条件,概念负载高,离 agent 与产品实践远,触发 technical-accessibility fail,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
如何为学习算法做 sketch
论文提出一种数据删除方案,可在深度学习中以误差趋近 0 的 ε 和失败率 δ,快速预测删去训练子集后的模型输出。其预计算与预测开销仅比常规训练和推理慢 O(log(1/δ)/ε²) 因子,存储需 O(log(1/δ)/ε²) 个模型;证明依赖“stability”假设,并在 microgpt 的最小实验中验证。真正值得盯的是,它把数据影响追踪从重训问题改成可预计算的近似查询。
#Interpretability#microgpt#arXiv#Research release
精选理由
有一条清楚的新技术主张,HKR-K 成立:可预计算近似回答“删去子集后模型会怎样”。但它主要是理论学习算法,依赖 stability 假设,实验也只到 microgpt,触发 technical-accessibility fail,按规则排除并将分数压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Lizard:面向大型语言模型的高效线性化框架
Lizard 将预训练 Transformer 大语言模型改造成次二次架构,并在 5-shot MMLU 上比既有线性化方法高 9.4 到 24.5 分。论文称其用近似 softmax 的次二次注意力,加上可学习的紧凑模块做自适应记忆控制,并提出面向硬件的算法处理 gated attention 数值不稳定。真正值得盯的是,它瞄准的不只是训练算力,还包括长上下文推理时随长度增长的 KV cache 内存瓶颈。
#Inference-opt#Reasoning#Benchmarking#arXiv
精选理由
按现有正文只能确认这是 arXiv v4 论文,题目指向 LLM 线性化。方法、指标与复现条件都没给出,内容又偏推理优化研究且缺少入口,触发技术可达性排除,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
CAARL:用于可解释协同演化时间序列预测的上下文学习
论文提出 CAARL,用 LLM 预测协同演化时间序列,并把序列拆成自回归片段、构建时序依赖图、再序列化成叙事文本。摘要称其在真实数据上验证了有效性,能给出类似 chain-of-thought 的中间推理轨迹;具体数据集、指标、提升幅度正文片段未披露。
#Reasoning#Interpretability#Benchmarking#Research release
精选理由
论文有具体方法,但题材偏窄,摘要也未披露数据集、指标和提升幅度。对通用 AI 从业者门槛偏高,触发 hard-exclusion-technical-accessibility,因此降到 39 以下并排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
R&F-Inventory:用于触达频次广告单调库存估计的大规模数据集
论文发布了 R&F-Inventory 数据集,用于触达频次广告的库存估计,并定义了 2 个标准任务。数据以“定向-排期-频控”为上下文,在同一上下文下提供多个预算点的 UV、PV 观测,形成完整预算-效果曲线,还显式包含“5 天不超过 3 次”这类时间窗频控。真正值得盯的是它把单调性、边际递减和理论曝光上限写进数据与校验流程;数据规模正文未披露,实验代码已在 GitHub 提供。
#Benchmarking#arXiv#GitHub#Research release
精选理由
论文有可复现资产:R&F-Inventory 数据集、2 个标准任务、GitHub 代码,HKR-K 成立。问题在于主题高度偏广告投放建模,读者需要先懂定向、排期、频控语境,HKR-H 与 R 都弱,触发 technical-accessibility fail,分数封顶 39。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
实时 LTL 进度跟踪:迈向基于任务的探索
论文提出 Live LTL Progress Tracking,用有限线性时序逻辑在轨迹每个时间步更新一个 tracking vector,给任务规格标注 true、false 或 open 三种状态。该方法把向量应用到 LTL 公式树,编码多阶段任务在整条轨迹中的执行进度,可用于性能度量、探索多样性和奖励塑形。真正值得盯的是它瞄准非马尔可夫 RL 目标,但摘要只给出算法框架与简单示例,未披露实验规模、基线结果和具体 RL 集成收益。
#Reasoning#Research release
精选理由
这是一篇偏 RL+LTL 的方法论文,HKR 只命中 K:摘要说明了逐时间步的三态 tracking vector 与公式树更新。它触发 technical-accessibility fail,且正文未披露实验规模、基线结果和 RL 集成收益,普通 AI 从业者难判断实际价值,所以 importance 压到 39 以下并排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
优化自然物理的数学
论文提出一个优化理论框架,把最优控制的终端横截条件与广义 KKT 条件对应起来,用于从约束优化问题导出算法。摘要称该框架会生成贯穿隐藏空间的自然向量场,并通过 Pontryagin 型最小值原理、Hamilton-Jacobi 不等式与控制跳跃构造逆最优算法;可生成多少算法、覆盖哪些基准,正文未披露。真正值得盯的是,它想把算法设计改写成统一动力学问题,而不是再给单个优化器补经验解释。
#Research release#Commentary
精选理由
触发硬排除:技术可达性失败。信息停在 Pontryagin / Hamilton-Jacobi / KKT 的理论映射,正文未给出算法数量、基准或性能数字;对通用 AI 从业者过深,也没有产品或 agent 落点,所以分数封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于摊销变分推断的实例自适应参数化
这篇 arXiv 论文提出 IA-VAE,用超网络按输入生成编码器调制,在单次前向条件下缓解 VAE 的摊销间隙。作者称该变分族包含标准摊销推断,所以最优 ELBO 不会更差;正文未披露具体参数规模与提升幅度,只说在合成数据和标准图像基准上,held-out ELBO 提升且多次运行达统计显著。真正值得盯的是,它把“更强后验近似”做成了输入相关参数化,不是单纯堆大编码器。
#Benchmarking#Research release#Benchmark
精选理由
论文提出按输入生成编码器调制的 IA-VAE,并称在合成数据和图像基准上 held-out ELBO 提升,K 轴成立。可它是高门槛的变分推断方法论文,正文未披露参数规模与提升幅度,也没有 agent 或产品落点,触发 technical-accessibility fail,分数封顶 39。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于机器人探索算法中动态图稀疏化的学习方法
论文提出一个基于 transformer、用 PPO 训练的动态图剪枝框架,在 RRT 前沿探索仿真中将图规模最多压缩 96%。摘要称该方法在稀疏且延迟奖励下学到剪枝决策,但探索速率低于基线,标准差最低。真正该盯的是权衡:图更小且更稳定,正文未披露环境数量、算力开销与真实机器人结果。
#Robotics#Research release
精选理由
这篇论文有一个可验证结果,HKR-K成立:transformer+PPO 在 RRT 前沿探索里把图规模最多压缩96%。问题是题材过专,正文未披露环境数量、算力开销与真实机器人结果,通用 AI 从业者缺少入口,触发 technical-accessibility fail,importance capped below 40。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
吸引、排斥与摩擦:引入带摩擦的漂移模型 DMF
DMF 在 FFHQ 成人到儿童域翻译中,以 16 倍更低训练算力达到或超过 Optimal Flow Matching。论文给出两项理论结果:推导两粒子替代系统的收缩阈值,并证明线性调度摩擦系数可给出有限时域误差界。真正值得盯的是,高斯核下若漂移场在任意开放集上为 0,则可推出 q=p,补上原始 Drifting Models 可识别性的反向结论。
#Inference-opt#Benchmarking#FFHQ#Research release
精选理由
摘要给出16倍更低训练算力、收缩阈值和有限时域误差界,HKR-K成立。问题是信息几乎全在生成建模理论层,缺少产品、agent或工程落点,触发hard-exclusion:technical-accessibility fail,importance封顶39。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
ProtoCLIP:用于稳健零样本胸部X光分类的原型对齐潜变量细化
ProtoCLIP 在未见数据集 VinDr-CXR 上把零样本胸片分类 AUC 提高 2 到 10 个百分点,气胸任务达到 0.94。方法包含两步:构造病灶聚焦训练子集并加入精筛负样本,压低标签共现偏差;再用保持表征结构的蒸馏目标稳定迁移。真正值得盯的是,它瞄准域偏移、长尾分布和共现病灶误判,且不需大规模重训。
#Vision#Multimodal#Benchmarking#VinDr-CXR
精选理由
有具体结果,HKR-K 成立:VinDr-CXR 上 AUC 提升 2–10 点,气胸任务到 0.94,还写了病灶聚焦子集与蒸馏机制。但它是医学影像分类论文,不碰 agent、产品更新或部署链路,按 hard-exclusion-4 处理,importance 封顶 39。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
D-QRELO:用量化与残差低秩近似做大语言模型免训练、免数据 Delta 压缩
D-QRELO 用 1 比特粗粒度量化加残差低秩近似压缩 LLM 微调 delta 权重,且不需要额外训练或数据。摘要称,大规模 SFT 数据会放大 delta 参数幅度、奇异值与熵,拉高压缩误差;该方法先抓主结构,再用较小残差做细节恢复。真正值得盯的是,它同时覆盖 dense 与 MoE 架构,但摘要未披露压缩率、具体基线名和各任务数字。
#Fine-tuning#Research release
精选理由
论文给出免训练、免数据的 delta 压缩思路,但正文只有摘要级信息,压缩率、基线和任务结果都未披露。题材偏量化与低秩近似,触发 hard-exclusion-technical-accessibility fail,通用 AI 读者缺少进入点。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
MST 和 AIM 中差分隐私的紧审计
论文提出基于 Gaussian Differential Privacy 的审计框架,在 MST 和 AIM 的最坏情形下做紧隐私审计。摘要给出 (ε,δ)=(1,10^-2) 时,经验 μ≈0.43,对应理论 μ=0.45,理论与实践差距很小。真正值得盯的是,它用完整的假阳性/假阴性权衡评估 DP 保证;正文仅披露摘要,实验设置细节未展开。
#Safety#Benchmarking#MST#AIM
精选理由
摘要有一个可检验新点:GDP 审计在 MST 和 AIM 上给出 μ≈0.43 对比理论 μ=0.45。问题也很明确:主题过深、只披露摘要、实验设置与实际落地场景未展开,触发 technical-accessibility hard exclusion,重要性压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
深度 ReLU 网络的鞍点到鞍点动力学:首次逃离鞍点中的低秩偏置
论文研究小权重初始化下,深度 ReLU 网络的梯度下降如何从参数原点鞍点逃离,并给出首个逃离方向的结构定理。结果称第 ℓ 层权重矩阵的第一奇异值,至少比其余奇异值大 ℓ^{1/4},显示更深层存在低秩偏置。作者还提出鞍点到鞍点动力学:GD 会经过一串瓶颈秩递增的鞍点;正文未披露实验规模或数值验证细节。
#arXiv#Jacot#Research release
精选理由
论文给出ℓ^{1/4}奇异值间隔与“鞍点到鞍点”机制,HKR-K命中。问题是它属于深度优化理论,正文未给一般从业者可复现的实验入口,也不直接连到产品、成本或安全,触发“技术可达性不足”排除,故列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
引入 O-Value:混淆矩阵分类指标的通用标准化
论文提出 OPS 函数,把任意基于混淆矩阵的分类指标映射到 [0,1]。O-Value 被定义为观测性能在参考分布中的百分位排名,用来跨不同类不平衡测试集比较结果。摘要称已在多类真实数据集实验验证稳健性,具体数据集、基线和提升幅度正文片段未披露。
#Benchmarking#Research release#Benchmark
精选理由
HKR-K 命中,因为摘要给了两个具体机制:OPS 把混淆矩阵指标映射到 [0,1],O-Value 用参考分布百分位做比较。HKR-H 与 R 都弱,且正文未披露数据集、基线和提升幅度;题目偏数值评测方法,触发 technical-accessibility fail,按规则列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
局部不一致消解:概率模型中注意力与控制的相互作用
论文提出 Local Inconsistency Resolution(LIR)算法,用迭代聚焦子模型并调整可控参数来做学习与近似推断。该框架建立在 Probabilistic Dependency Graphs(PDGs)上,声称可统一 EM、belief propagation、adversarial training、GANs 和 GFlowNets;正文摘要只披露其已在离散 PDGs 与合成数据上实验。真正值得盯的是,它给 GFlowNets 提出了一种更自然的损失,并报告收敛更好,但摘要未披露具体指标与幅度。
#Reasoning#Benchmarking#arXiv#GFlowNets
精选理由
论文的可取点是给出 LIR 机制,并把 EM、belief propagation、GANs、GFlowNets 放进同一叙述里。问题也很直接:摘要只确认离散 PDGs 与合成数据实验,没给指标、幅度和复现条件,题材又偏理论化,触发 technical-accessibility fail,分数封顶并排除。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
从答案到论证:用 Toulmin 引导的课程式目标条件学习提升临床诊断推理可信度
该论文提出 CGCL,用 3 阶段课程训练 LLM 生成符合 Toulmin 结构的临床诊断论证。三阶段覆盖事实抽取与鉴别诊断、核心假设论证与反驳、最终带限定条件的结论综合。实验称其诊断准确率与推理质量可比高成本 RL,T-Eval用于量化推理完整性,但正文未披露模型名、数据集规模与具体分数。
#Reasoning#Alignment#Benchmarking#Research release
精选理由
HKR 只有 K 过线:3 阶段 Toulmin 课程与 T-Eval 提供了机制线索。硬排除落在临床场景跨界、缺少产品或 agent 外溢;正文也未披露模型名、数据规模与具体分数,重要性封顶 39。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Multi-Beholder:用多实例学习和单类分类预测低级别胶质瘤生物标志物
论文提出 Multi-Beholder,用 H&E 全切片图像预测低级别胶质瘤 5 个生物标志物,在 TCGA-LGG 内部验证集 AUROC 最高达 0.973。方法把单类分类并入多实例学习,做实例级伪标签补全切片级标签;在 Xiangya 外部队列 AUROC 最高为 0.820,代码已开源。
#Vision#Interpretability#Benchmarking#TCGA-LGG
精选理由
这篇论文有具体机制、内外部验证和开源代码,HKR-K 成立。它属于传统医学研究与 AI 的交叉场景,和 agent、产品更新、平台竞争都无直接关联,触发硬排除规则 4,分数压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Reciprocal Co-Training(RCT):用强化学习耦合梯度模型与不可微模型
这篇论文提出 RCT,用强化学习把 LLM 与 Random Forest 双向耦合,并在 3 个医疗数据集上让两类模型都获得提升。机制是把表格数据转成标准化文本供 LLM 编码,再用 LLM embedding 扩充 RF 特征,同时把校准后的 RF 概率作为 LLM 的强化学习反馈。真正值得盯的是双向训练闭环;具体增幅、模型规模与训练成本,摘要未披露。
#Fine-tuning#Benchmarking#Research release#Benchmark
精选理由
HKR-K 成立:摘要给出 LLM 与 Random Forest 的双向训练闭环。tier 设为 excluded,因为方法偏学术、上手门槛高,验证只在 3 个医疗数据集;增幅、模型规模和训练成本未披露,触发 hard-exclusion-technical-accessibility。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于肽-蛋白相互作用预测与靶标条件肽生成的一体化深度学习框架:ConGA-PepPI 与 TC-PepGen
论文提出一体化框架,结合 ConGA-PepPI 与 TC-PepGen 做肽-蛋白相互作用预测和靶标条件肽生成;5 折交叉验证中,ConGA-PepPI 准确率 0.839、AUROC 0.921。该模型用非对称编码、双向交叉注意力和从成对预测到结合位点定位的渐进迁移;结合位点 AUPR 在蛋白侧为 0.601、肽侧为 0.950。真正该盯的是闭环筛选设计:TC-PepGen 在长度受控基准下有 40.39% 生成肽的 AlphaFold 3 ipTM 超过天然模板。
#Reasoning#Benchmarking#AlphaFold 3#Research release
精选理由
论文给出 5 折指标、结合位点 AUPR 和 AlphaFold 3 验证闭环,HKR-K 成立。题材属于肽药/蛋白设计研究,缺少面向通用 AI 从业者的产品、Agent 或产业外溢,触发“传统科学+AI 交叉”排除,分数封顶 39。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
盲逆问题学习的样本复杂度
该论文为盲逆问题中的 LMMSE 学习推导了闭式最优估计器,并给出有限样本误差界,误差随噪声水平、问题条件数与样本数量变化。论文还把该问题与定制的 Tikhonov 正则化建立等价关系,正则结构显式依赖信号、噪声和随机前向算子的分布。真正值得盯的是,它把算子随机性如何拖慢收敛率写成了理论项;正文摘要未披露实验规模。
#Research release
精选理由
论文有理论增量:闭式 LMMSE、误差界和 Tikhonov 等价都算新信息。问题是它属于盲逆问题与样本复杂度的专门数学,摘要未给实验规模、代码或 agent/产品后果,触发 technical-accessibility fail,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
一种基于 Nyström 近似、可扩展且支持置换的核双样本检验
论文提出一种基于 Nyström 近似的 MMD 双样本检验,并用置换检验保持统计有效性,目标是把大规模场景的计算成本降下来。摘要给出的核心结果是有限样本检验功效界,且在分布按 MMD 充分分离时,分离率达到该设定下已知的 minimax 最优速率;数值实验已做,但正文未披露具体数据集规模与运行开销。真正值得盯的是,它不只做近似加速,还给出功效保证。
#Research release
精选理由
K 轴成立:摘要给出 Nyström 近似、置换检验和 minimax 速率。H、R 都弱,内容偏统计理论,缺少 AI 产品或 agent 场景入口,触发技术可达性排除,importance 封顶 39。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
扩散模型中分数平滑的插值效应
论文提出:当训练数据均匀落在一维子空间时,分数函数的平滑会驱动扩散模型沿该子空间生成训练样本之间的插值点。作者给出解析解与数值实验,并称神经网络学习到的分数函数即使无显式正则,也会在简单非线性流形上出现类似效应。真正值得盯的是,摘要只确认机制与设定,正文未披露具体基线、指标和实验规模。
#Research release
精选理由
这篇论文有一个可检验的机制解释,HKR 只命中 K。标题和摘要都偏理论,正文未披露基线、指标和实验规模,也没给出产品或工程外溢,触发 hard-exclusion 的 technical-accessibility fail,所以排除并压到 39 分以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Mamba 的双线性输入调制:用 Koopman 双线性形式增强记忆保持与乘法计算
论文提出 Coupled-BIM 与 Coupled-GM 两种 Mamba 变体,并在输入延迟摆与 NARMA-10 两个任务上比较记忆保持和双线性计算。结果显示,Coupled-GM 只明显改善记忆保持;Coupled-BIM 同时提升两项能力,且只有它会随 SSM 状态维度增大继续受益。真正值得盯的是并行扫描兼容门控并不等于双线性计算,正文未披露具体分数与参数规模。
#Memory#Benchmarking#Research release#Benchmark
精选理由
稿件有 HKR-K:它区分了 Coupled-BIM 与 Coupled-GM 的能力差异,还给出“随 SSM 状态维度增大继续受益”的结论。问题是主题高度依赖 Mamba、Koopman 与 SSM 背景,触发 technical-accessibility fail;正文也未披露具体分数与参数规模,所以排除。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Torch Geometric Pool:用于图神经网络池化的 PyTorch 库
Torch Geometric Pool 发布了一个基于 PyTorch Geometric 的图池化库,提供 20 种分层池化器,并用 SRCL 分解统一接口。正文说明它标准化了池化输出对象,支持 dense pooler 的批处理与非批处理模式,也提供缓存和预粗化流程。真正值得盯的是复用性:同一套模型代码可跨多种 pooling 方法比较,库已在 GitHub 和 PyPI 以 MIT 许可发布。
#Tools#PyTorch Geometric#Torch Geometric Pool#GitHub
精选理由
K 有料,正文给出 20 种 pooler、SRCL 分解、标准化输出和缓存机制。H 与 R 都弱,且触发 hard-exclusion-technical-accessibility:GNN pooling 过于专门,普通 AI 从业者缺少进入点,importance capped below 40。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于自闭症谱系与典型发育人群的光适应 ERG 与振荡电位(LEOPs)数据集
LEOPs 数据集发布了 5309 条单闪 ERG、4434 条 OPs 波形,覆盖典型发育、ASD 与 ASD+ADHD 儿童青少年。数据来自澳大利亚和英国两地,用手持 RETeval 在左右眼采集,含 9 步随机闪光、2 步高强度闪光和 85 Td·s 标准刺激。仓库还提供个体级 JSON、刺激代码、电极位置图像与部分诊断分数;真正值得盯的是它把时序生理信号和采集元数据一起放出。
#Tools#ISCEV#RETeval#Research release
精选理由
命中硬排除:传统科学与 AI 交叉但没有 agent、模型能力或产品落地线索。正文提供 5309 条 ERG、4434 条 OPs 和采集协议,HKR 只有 K 成立;对 AI RADAR 受众相关性弱,所以排除。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
异步平均 Q-learning 的中心极限定理
论文为异步更新下的 Polyak-Ruppert 平均 Q-learning 建立了两类中心极限定理。摘要明确给出非渐近 CLT,其 Wasserstein 距离收敛率依赖迭代次数、状态动作空间大小、折扣因子和探索质量;还证明部分和过程弱收敛到布朗运动。真正值得盯的是,它把异步 Q-learning 的统计波动写成可分析对象,但 RSS 摘要未披露具体界、实验设置或定理常数。
#Research release
精选理由
这篇稿子有理论增量,但面向异步平均 Q-learning 的 CLT 推导,通用 AI 从业者缺少进入点。HKR-K 仅在抽象层面成立;正文未披露定理常数、实验设置或代理/产品含义,触发 technical-accessibility fail,按规则排除并压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于生物学 2D+t 反应扩散系统的物理信息神经网络
该论文把 BINN 从 1D+t 扩展到 2D+t 反应扩散系统,并用时间序列显微数据学习肺癌细胞群体动力学方程。方法链包含数据预处理、BINN 方程学习、符号回归后处理;标题与摘要给出闭式方程发现,正文片段未披露数据规模、误差指标与训练成本。真正值得盯的是,它把 PDE 从正则项改成显式识别目标,面向可解释方程恢复,不只是前向预测。
#Interpretability#Tools#Research release
精选理由
论文有方法信息:BINN 从 1D+t 扩到 2D+t,并接符号回归做闭式方程恢复,所以 HKR-K 通过。问题在于它属于生物反应扩散 PDE 发现,缺少 agent、产品或通用开发工作流含义,触发“传统科学+AI 交叉”排除。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用奇异学习理论推导 Gibbs 后验的 PAC-Bayes 界
arXiv:2604.17219 为 Gibbs 后验推导了显式、非渐近的 PAC-Bayes 泛化界。方法把经验风险指数倾斜先验得到后验,并分析参数空间中的边际型积分;正文给出低秩矩阵补全与 ReLU 网络回归、分类例子。真正值得盯的是,它瞄准过参数化与奇异模型,且声称界比经典基于度量熵的复杂度界更紧。
#Benchmarking#Research release
精选理由
这篇论文有明确的新理论主张,HKR-K 成立;但内容落在统计学习理论深水区,正文也没有给通用 AI 从业者的上手入口。它缺少产品、工作流或行业竞争含义,触发 technical-accessibility fail,分数按规则压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
RefineStat:面向概率程序合成的高效探索
RefineStat 提出一套面向概率程序合成的框架,用语义约束和诊断式重采样提升小语言模型生成质量。摘要称,它会强制分布合法、参数成形,并在可靠性检查失败时重采样先验或似然项。真正该盯的是,作者说小模型结果常能追平或超过 OpenAI o3,但正文未披露具体任务、分数和模型规模。
#Code#Reasoning#Benchmarking#OpenAI
精选理由
这篇稿子触发 hard-exclusion-technical-accessibility fail:概率程序合成属于窄领域研究,普通 AI 从业者缺少进入点。摘要给了语义约束和诊断式重采样两点机制,任务设置、对比成绩、模型规模都没披露,所以重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
非凸最小化中无界方差下的下界与近端锚定 SGD
论文证明:在 BG-0 方差条件下,求非凸平滑函数的 ε-驻点至少需 Ω(ε^-6) 次随机查询;均方平滑情形至少需 Ω(ε^-4) 次。摘要还给出 PASTA,把 Halpern anchoring 与 Tikhonov regularization 结合,用来压住随距离二次增长的方差项,并称其在多类非凸设定达到 minimax 最优。真正值得盯的是,这把无界方差的复杂度劣化定成了下界,不再只是分析松。
#Reasoning#Research release
精选理由
这篇论文有明确新结论,HKR-K 成立:无界方差下的非凸优化复杂度下界与 PASTA 机制都很具体。问题是它触发 hard-exclusion-technical-accessibility fail,正文面向随机优化理论读者,缺少对一般 AI 从业者的可进入点,因此排除并将分数压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
G-PARC:面向非结构网格时空动力学的图物理感知循环卷积网络
论文提出 G-PARC,用移动最小二乘核在非结构图上近似空间导数,并把 PDE 导数直接嵌入网络计算图。摘要称,它在河流水文学、平面激波、弹塑性动力学基准上,参数量比 MeshGraphNet、MeshGraphKAN、GraphSAGE 少 2-3 倍且精度更高。真正值得盯的是,它用解析微分算子替代 encoder-processor-decoder;摘要未披露具体数据集规模与误差数值。
#Reasoning#Benchmarking#Research release#Benchmark
精选理由
论文有机制新意,也给出“少 2-3 倍参数且更准”的比较口径,所以 HKR-K 成立。问题在于它同时触发 hard-exclusion:技术门槛高,且属于传统科学数值模拟与 AI 交叉,正文未给数据集规模与误差数值,对本受众偏离主线。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
SAND:用于神经退行性疾病评估的语音分析挑战赛
SAND 挑战赛发布一个带临床标注的语音验证数据集,用于开发和评测 ALS 早筛与进展预测模型。摘要点名对象是 ALS 相关构音障碍语音,机制是由临床医生与机器学习团队联合标注;数据规模、任务划分和评测指标正文未披露。真正值得盯的是参考数据集是否可复现,因为当前瓶颈被直接指向“缺少标注数据”。
#Audio#Benchmarking#SAND#Amyotrophic Lateral Sclerosis
精选理由
HKR 只有 K 成立:摘要确认 ALS 构音障碍语音的临床标注数据集,但规模、任务划分和评测指标都未披露。题材属于医学评估与 AI 的交叉,缺少 agent 或产品外溢,触发传统科学 crossover 硬排除,分数封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
大型语言模型在分子生成中有多强的创造性?
该论文系统评测 LLM 在分子生成中的创造行为,并将其拆成 2 个维度:收敛创造力与发散创造力。评测覆盖理化性质、ADMET 和生物活性任务;摘要称增加约束后,模型的约束满足率会上升,但未披露具体模型名、数据规模与分数。真正值得盯的是,它把分子生成从“对错题”改写成“受约束搜索”问题。
#Benchmarking#Research release#Benchmark
精选理由
文章触发“传统科学与 AI 交叉、缺少 agent / product 含义”的硬排除:分子生成更接近计算化学评测,不是这组读者每天追的 AI 主线。摘要还缺模型名、数据规模和结果分数,HKR 三轴都弱,重要性压到 35。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Back to Repair:用于时间序列异常检测的极简去噪网络
论文提出 JuRe,用单个 hidden dimension 128 的深度可分离卷积残差块做时间序列异常检测,在 TSB-AD 多变量基准拿到 AUC-PR 0.404,覆盖 17 个数据集、180 条序列。它在 UCR 单变量档案的 AUC-PR 为 0.198,覆盖 250 条序列;消融显示去掉训练期 corruption 会让 TSB-AD 的 AUC-PR 下降 0.047。真正值得盯的是训练目标,不是堆注意力或潜变量;论文还称其在 TSB-AD 上对 25 个基线中的 21 个有 Wilcoxon 显著性优势。
#Benchmarking#arXiv#JuRe#UCR
精选理由
K 轴成立:摘要给了基准、AUC-PR 和消融降幅,信息密度不低。题材仍偏时间序列异常检测专门赛道,读者需要较强背景才能判断价值,与通用模型产品和代理工作流连接弱,触发 technical-accessibility fail,故排除并封顶 39。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
一种结合模糊逻辑的不确定性感知损失函数:用于 MRI 脑图像分割
该论文提出一种结合模糊逻辑的不确定性感知损失函数,并在 2 个公开数据集 IBSR、OASIS 上用于 MRI 脑组织分割。方法把 categorical cross-entropy 与 fuzzy entropy 组合,并在 U-Net、U-Net++ 上对比 CCE。真正值得盯的是,它瞄准像素分类不确定性;摘要称多项指标优于 CCE,但未披露具体分数。
#Vision#Alignment#Benchmarking#Research release
精选理由
论文有可识别的新机制,但它属于医学影像分割,缺少 agent、模型产品或通用工作流外溢,触发“传统科学 + AI 交叉”硬排除。摘要只说在 IBSR、OASIS 上优于 CCE,未披露具体分数,HKR 只有 K 勉强成立。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
热力学液态流形网络:面向离网自主微电网太阳能预测的物理约束深度学习
论文提出 Thermodynamic Liquid Manifold Network,用 22 个气象与几何变量预测离网光伏发电,在 1826 天测试中把夜间误差压到 0。模型含 Spectral Calibration 和 Thermodynamic Alpha-Gate,共 63,458 个参数;5 年测试 RMSE 为 18.31 Wh/m²,Pearson 相关系数 0.988。真正值得盯的是,它把天体几何约束直接写进结构,目标不是刷分,而是消除夜间虚假发电和云瞬变相位滞后。
#Benchmarking#Research release
精选理由
论文有具体机制和指标,HKR-K 成立:22 个输入、63,458 参数、1826 天测试、夜间误差为 0。问题是它属于传统科学+AI 交叉,主题是光伏预测,不指向模型、Agent 或产品落地,触发硬排除;标题也偏学术,HKR-H 与 HKR-R 都弱。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于贝叶斯攻击图与过程挖掘的动态风险评估
论文提出把 Bayesian Attack Graphs 与过程挖掘结合,用在线系统行为证据动态更新漏洞被利用与关键节点失陷的概率。方法先用过程挖掘刻画恶意网络流量,再把利用证据写入条件概率表;实验基于含多台机器、多个子网和多个 CVE 漏洞的网络靶场。真正值得盯的是它做的是运行中概率更新,不是静态攻击面枚举;正文未披露具体样本规模与量化指标。
#Safety#Tools#Research release
精选理由
HKR-K 成立:论文把过程挖掘证据接进 Bayesian Attack Graph,做运行中的风险概率更新。问题是内容强依赖攻防建模语境,正文也未给出样本规模与量化指标,对通用 AI 读者缺少入口,触发 technical-accessibility fail,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
超越特征融合:用于多模态不确定性估计的上下文贝叶斯 PEFT
论文提出 CoCo-LoRA,用于带音频上下文的文本预测,在低资源条件下做多模态、不确定性感知的参数高效微调。方法把音频嵌入一次投影到共享上下文空间,再经各层轻量头调制低秩空间中的变分后验;随机性只放在紧凑秩空间潜变量。作者称其在多任务、多骨干评测中持续持平或优于文本 PEFT 与特征融合迁移基线,但摘要未披露具体数据。
#Multimodal#Audio#Fine-tuning#Research release
精选理由
摘要提供了 CoCo-LoRA 的结构,但没给出具体指标、提升幅度或复现实验条件。主题集中在 Bayesian PEFT 与不确定性估计,门槛偏高,缺少产品或 agent 指向,触发 hard-exclusion-technical-accessibility-fail,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Positive-Only Drifting Policy Optimization
论文提出 PODPO,用仅正优势样本更新在线强化学习策略,并去掉似然建模与梯度裁剪。机制是 advantage-weighted local contrastive drifting;摘要称它利用生成模型的局部平滑性,把动作推向高回报区域。真正值得盯的是它不再事后惩罚负样本,但正文未披露实验结果、基线和具体增益。
#Reasoning#Research release
精选理由
HKR-K 命中,因为摘要至少给出“正优势样本更新 + local contrastive drifting”这套具体机制。问题是正文未披露实验结果、基线和增益,而且主题高度偏在线 RL 优化细节,触发 technical-accessibility fail,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
FRIGID:在训练与推理阶段扩展基于扩散的质谱分子生成
FRIGID 提出扩散语言模型,用数亿无标签分子结构训练,并按质谱、指纹表示与已确定化学式生成分子结构。论文称其用前向碎裂模型做推理时扩展,通过定向重遮盖与去噪修正不一致片段,在 MassSpecGym 的 Top-1 超过 18%,在 NPLIB1 将现有方法 Top-1 提高到 3 倍;代码已开源。
#Multimodal#Benchmarking#Tools#Research release
精选理由
HKR 只命中 K:论文给出数亿级训练规模、前向碎裂推理和基准增幅。硬排除命中“传统科学+AI 交叉”,也有技术门槛偏高的问题;主题落在计算化学与质谱解析,不是本栏读者最关心的模型产品或开发者工作流。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用参数化高斯消息传递求解线性模型中的 L1 正则化路径
论文提出 2 种算法,用参数化高斯消息传递计算线性模型的 L1 正则化路径,覆盖 L1 正则化 Kalman smoothing、linear SVM 与 LASSO。两种算法互为对偶,分别处理独立变量与因变量的 L1 正则化;核心机制是因子图上的 Kalman 型前向-后向递推,正文未披露基准数字。真正该盯的是适用边界与复杂度条件:作者只称在部分情形下可与既有方法竞争,未给出统一优势。
#Inference-opt#Tools#arXiv#Research release
精选理由
论文有明确方法增量:两种对偶算法用参数化高斯消息传递求线性模型的 L1 正则化路径。读者进入门槛高,正文也没给统一基准或胜出条件,触发 hard-exclusion-technical-accessibility fail,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于图、单纯形与胞腔学习的收缩与沙漏持久性
论文提出 Hourglass Persistence,用交替的包含与收缩序列描述图拓扑,并称其在标准真实图数据集上持续优于多种 PH 方法。正文给出机制:前向持久同调与收缩同调在表达力上不同,算法可插入端到端可微 GNN 流水线;具体提升幅度与数据集数量在摘要未披露。真正值得盯的是收缩操作被正式纳入拓扑描述子,这不只是换特征,而是在改 GNN 里拓扑信息的生成过程。
#Reasoning#Tools#Benchmarking#Aalto-QuML
精选理由
这篇论文在图学习拓扑描述子上有新机制,HKR-K 成立;正文摘要也确认它把收缩操作纳入持久性表示,并接入可微 GNN。问题是进入门槛太高,核心价值依赖持久同调、单纯复形、胞腔复形语境,普通 AI 从业者缺少入口,触发 technical-accessibility fail,按规则排除并压到 39 分以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
GRAIL:用于神经符号强化学习的自主概念落地
GRAIL 提出用 LLM 弱监督加环境交互,自动学习神经符号强化学习中的关系概念落地,覆盖 Kangaroo、Seaquest、Skiing 3 个 Atari 任务。摘要称它在简化设定下追平或超过手工概念智能体,并在完整环境中暴露奖励最大化与高层目标完成的权衡;具体分数、样本效率和模型规模,正文未披露。
#Reasoning#Agent#Benchmarking#Research release
精选理由
K 命中在于机制具体:LLM 弱监督接环境交互,还点名 3 个 Atari 任务。H、R 都弱,正文未披露分数、样本效率、模型规模;题材又偏神经符号 RL 专门领域,按 technical-accessibility fail 处理,列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
FedLLM:用于可解释交通流预测的隐私保护联邦大语言模型
论文提出 FedLLM,用联邦学习做 15-60 分钟多步交通流预测,并通过只交换轻量 LoRA 适配器参数保护各客户端数据。方法包含 CSS 高速路段选择、面向交通结构化提示的领域微调,以及支持非 IID 分布的跨区域协同训练;摘要称其优于中心化基线,但未披露数据集规模、具体指标和提升幅度。真正值得盯的是参数交换与可解释输出这套组合,不是“LLM 做交通预测”这个标题。
#Fine-tuning#Reasoning#Research release
精选理由
HKR-K 成立:摘要给出 LoRA 适配器交换、15–60 分钟多步预测、非 IID 联邦训练三条具体机制。题材仍是交通流预测,缺少 agent、模型发布或产品外溢,触发“传统行业+AI、无产品含义”排除,分数封顶 39。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过解耦证据学习实现可信抑郁评估
论文提出 EviDep,用 Normal-Inverse-Gamma 分布同时估计抑郁严重度、偶然不确定性和认知不确定性,并用解耦融合抑制多模态证据重复计数。方法包含基于小波 Mixture-of-Experts 的频率感知特征提取,以及共享共识与模态特有信息的显式分离;作者称其在 AVEC 2013/2014、DAIC-WOZ、E-DAIC 上取得更高精度和更好校准,但正文未披露具体分数。
#Multimodal#Safety#Benchmarking#Research release
精选理由
有 K:摘要披露了 NIG 不确定性建模和解耦多模态融合两处机制。问题在于它属于心理健康评估研究,缺少 agent 或产品落地场景,且正文未披露具体 benchmark 分数,按 hard-exclusion 4 处理,分数压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
迈向完全无参数随机优化:基于自界分析的网格搜索
论文提出 Grasp 网格搜索框架,在非凸与凸两类随机优化中追求“完全无参数”算法。核心机制是自界分析自动确定参数搜索范围,不再要求输入满足真实问题参数的上下界条件。摘要称非凸情形达到接近最优收敛率且仅差对数因子,凸情形兼顾加速与普适性;正文未披露实验设置、基线和具体常数。
#Research release
精选理由
HKR 只中 K:摘要给出“无参数”随机优化的新机制,用自界分析自动定搜索范围。它触发 technical-accessibility fail,这类数值优化理论对通用 AI 读者缺少入口,按规则列为 excluded,分数压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
(稀疏)关注细节:在机器学习天气预报模型中保留频谱保真度
论文提出概率天气预报模型 Mosaic,在 1.5° 分辨率、2.14 亿参数下,匹配或超过用 6 倍更细数据训练的模型。它用 learned functional perturbations 生成集合成员,并在原生分辨率网格上采用 block-sparse attention,以共享相邻查询的 key/value 实现线性成本长程依赖。24 成员、10 天预报在单张 H100 上耗时低于 12 秒;真正值得盯的是,单个集合成员在全部已解析频率上接近完美频谱对齐。
#Inference-opt#Benchmarking#Research release#Benchmark
精选理由
HKR 只命中 K:摘要给出 2.14 亿参数、block-sparse attention 和单张 H100 跑 24 成员 10 天预报低于 12 秒等硬信息。硬排除命中“传统科学+AI 交叉且无 agent/产品含义”,天气预报场景离本站主线较远,技术门槛也偏高,因此列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用稀疏含噪数据学习哈密顿动力系统
论文提出 ASRNNs,用仅含两个不规则时间点的训练轨迹学习非线性哈密顿系统,并在相关噪声下保持长期预测精度。方法把哈密顿学习与辛递归积分结合,绕开时间导数估计;再把 ASRNNs 作为数据生成器,配合 SINDy 和 PySR 恢复多项式系统的精确符号方程。真正值得盯的是结构约束:这不是多堆数据,而是靠物理结构扛住极端稀疏采样。
#Interpretability#arXiv#SINDy#PySR
精选理由
论文有具体方法点,HKR-K 成立:只用两个不规则时间点训练,并用辛递归积分避开导数估计。它落在 hard-exclusion-4 的“传统科学 + AI 交叉”范围,缺少 agent 或产品指向,读者门槛也偏高,所以排除并压到 39 分以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
RosettaSearch:用于蛋白质序列设计的多目标推理时搜索
RosettaSearch 用 LLM 在推理时搜索蛋白质序列,并在 400 条 LigandMPNN 生成的次优序列上把设计成功率提高 2.5 倍。论文称其结构保真度指标提升 18% 到 68%,奖励由 RosettaFold3 计算,且用独立预测器 Chai-1 复核后结果仍成立。真正值得盯的是它把搜索轨迹变成训练数据;代码和数据集将在论文发表时释放。
#Inference-opt#Multimodal#Reasoning#Research release
精选理由
HKR-K 命中:摘要给出 2.5 倍成功率、18%-68% 结构指标提升,还写明 RosettaFold3 奖励与 Chai-1 复核。题材是蛋白质设计研究,缺少 agent、模型产品或行业落地含义,触发“传统科学 + AI 交叉”硬排除;专业门槛也偏高,所以压到 35。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过物理引导神经网络在太阳辐照预测中超过自注意力机制
该论文在苏丹的 NASA POWER 数据上,用物理引导的 CNN-BiLSTM 预测全球水平辐照度,RMSE 做到 19.53 W/m²,优于注意力基线的 30.64 W/m²。模型把 CNN 的空间提取、BiLSTM 的时序建模,与 15 个人工特征结合,特征含 clear-sky 指数和太阳天顶角,并用贝叶斯优化调参。真正该盯的是机制:正文给出了误差和特征数,但未披露样本规模、预测跨度与具体 Transformer 基线细节。
#Benchmarking#NASA POWER#Research release#Benchmark
精选理由
HKR-K 靠具体 RMSE 和特征细节成立。按 hard-exclusion-4 排除:这是传统科学+AI 的太阳辐照预测论文,没有代理、产品或工作流外溢价值,样本规模、预测跨度和 Transformer 基线细节也未披露。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
二值神经网络推理的 Sugeno 积分视角
论文把二值神经网络推理写成 Sugeno 积分,并在隐藏层神经元的二值输入条件下,把激活阈值测试改写为该积分。正文给出每个神经元决策的显式集合函数表示和 if-then 规则表示,还给出最后一层分数的 Sugeno 表达式。真正值得盯的是,这让 BNN 决策可直接映射成规则系统;摘要未披露实验规模与精度结果。
#Interpretability#Inference-opt#Research release
精选理由
这篇论文有可验证的新主张,HKR-K 成立:它把 BNN 神经元决策改写成 Sugeno 积分与 if-then 规则。门槛偏高,摘要也未披露实验规模、精度或推理收益,触发 technical-accessibility fail;按规则 importance capped <40,tier=excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
UniMamba:融合状态空间与注意力的统一时空建模框架
Xingsheng Chen等9位作者在arXiv发布UniMamba,用于多变量时间序列预测,并在8个公开基准数据集上报告精度与计算效率同时优于现有方法。模型由Mamba变量通道编码层、时空注意力层和前馈时间动力学层组成,正文只给出FFT-Laplace Transform、TCN与状态空间和注意力融合机制,未披露具体提升幅度。真正值得盯的是它把Mamba长序列效率和显式时序依赖学习放进同一框架,这更像时序架构整合,不是单点技巧。
#Xingsheng Chen#Pietro Lio#arXiv#Research release
精选理由
这篇稿子聚焦多变量时间序列预测,受众很窄。正文只确认 UniMamba 融合 Mamba、时空注意力和前馈时间动力学,并提到 8 个公开基准,具体提升幅度未披露;HKR 只有 K 勉强成立,且触发“技术可达性不足”硬排除,重要性封顶。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
结合特征选择与机器学习,利用田间高光谱成像评估葡萄藤叶片氮含量
这篇 arXiv 论文用 400–1000 nm 田间高光谱图像和集成特征选择,评估 4 个葡萄品种叶片与冠层氮含量;叶片层面 Chardonnay 的最佳结果为 R²=0.82、RMSE=0.19 %DW。数据覆盖 2022 与 2023 生长季、bloom 和 veraison 两个阶段,包含 Chardonnay、Pinot Noir、Concord、Syrah。真正值得盯的是,叶片层挑出的氮敏感波段可迁移到冠层层面,且在部分品种上保持或提升预测精度。
#Vision#Benchmarking#Research release
精选理由
论文有具体数据,HKR-K 成立:400–1000 nm 田间高光谱、四个品种、最佳 R²=0.82。它属于农业科学与 AI 的垂直交叉,正文也没有代理、模型机制或产品落地含义,触发“传统科学 + AI 交叉”硬排除,分数压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用 protein words 预测蛋白质-小分子互补配对规则的可解释框架
PWRules 用结合亲和力数据提取 protein words 与小分子片段的互补配对规则,并用 PWScore 对活性化合物排序。摘要称它在基准数据集上达到与 Glide、PSICHIC 可比的表现,还能泛化到训练集外靶点,如 SARS-CoV-2 主蛋白酶;基准规模、训练数据量和具体指标正文未披露。真正值得盯的是,它未用显式结构监督,却学到在配体结合口袋附近富集的规则,还能与现有方法联用提升富集效果。
#Interpretability#Benchmarking#Research release#Benchmark
精选理由
触发 hard-exclusion-传统科学与 AI 交叉:这是蛋白-小分子配对研究,和 agent、模型产品、开发者工作流关联弱,所以排除。HKR 只有 K 勉强成立,正文也未披露基准规模、训练数据量与具体指标,信息密度不够支撑更高分。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Faster by Design:用经专家验证的 CFD 训练神经替代模型,实现交互式空气动力学
论文提出 GIST 神经替代模型,并发布基于 LMP2 级 CAD 的高保真 RANS 数据集,覆盖 6 个工况,目标是替代单次需数万 core-hours 的高保真 CFD 评估。摘要称该模型具备离散化不变性,复杂度随网格规模线性增长,并在公开基准和赛车数据上达到 SOTA;正文未披露具体误差、网格规模和推理时延。真正值得盯的是,作者把“交互式设计探索”首次放进工业赛车流程验证。
#Tools#Benchmarking#Dallara#Research release
精选理由
HKR-K 命中:摘要确认 GIST 神经替代模型、LMP2 级 CAD 的 RANS 数据集和 6 个工况,信息量不低。问题是这类赛车/航空 CFD 研究离 AI 产品与 agent 工作流太远,正文也未披露误差、网格规模和推理时延;按 hard-exclusion「传统科学+AI 交叉」处理。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用微调 LLM 做反事实建模,用于健康干预设计与传感器数据增强
论文用微调 LLM 生成健康场景反事实,在 AI-READI 数据集上把可行性做到 99%、有效性做到 0.99。作者比较 GPT-4、BioMistral-7B、LLaMA-3.1-8B 与 DiCE、CFNOW、NICE;在 3 种标签稀缺设置下,反事实数据增强平均恢复 20% F1。真正该盯的是,LLaMA-3.1-8B 微调后既能做可执行干预,也能补少数类样本。
#Fine-tuning#Interpretability#Benchmarking#Research release
精选理由
HKR 只有 K 成立:摘要给出 99% 可行性、0.99 有效性和平均恢复 20% F1。文章落在健康传感场景的学术反事实建模,缺少通用产品、agent 或模型竞争含义,触发“传统科学+AI 交叉且无产品影响”硬排除,所以 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于 ICU 脑膜炎早期检测的集成深度学习模型:多中心研究
一项多中心研究称,结合 RF、LightGBM 和 DNN 的 stacking 集成模型在内部测试集上表现较好,在类别极不平衡条件下 NPV 仍高于 99.9%。外部 eICU 队列表现低于内部测试集,但敏感性仍保持稳健;真正该盯的是,正文只给出摘要片段,未披露样本量、AUC、特异性和前瞻性验证设计。
#Benchmarking#eICU#Research release#Benchmark
精选理由
摘要至少给出一个可检验点:RF、LightGBM 与 DNN 的 stacking,以及内部集 NPV>99.9%、外部 eICU 表现回落。问题是它属于医疗场景的 AI 应用,缺少 agent、产品或通用方法外溢,触发“传统科学/医疗+AI 跨界”硬排除;正文也未披露样本量、AUC 和前瞻性验证。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
FlowRefiner:基于流匹配的 3D 湍流模拟迭代精修
论文提出 FlowRefiner,用流匹配迭代精修 3D 湍流自回归预测,并在大规模多尺度湍流实验中报告了最优精度。方法把随机去噪改成确定性 ODE 校正,所有阶段共用速度场回归目标,还用解耦 sigma 调度固定噪声范围。真正值得盯的是小噪声区间稳定性;具体基准名、误差数字和算力成本,正文摘要未披露。
#Research release#Benchmark
精选理由
有料点在方法:FlowRefiner 把随机去噪改成确定性 ODE 校正,并用解耦 sigma 调度做 3D 湍流精修。它命中“传统科学+AI 交叉”硬规则,技术门槛也偏高;正文未披露误差数字和算力成本,所以归为 excluded,分数压到 35。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
FireScope:用思维链预言机预测野火风险
FireScope 提出 FireScope-Bench 与 VLM 框架,在美国训练、欧洲测试的野火风险栅格预测上取得提升,但摘要未披露具体分数。数据集结合 Sentinel-2 影像、气候数据、美国专家风险栅格与欧洲真实火情;模型同时用强化学习和视觉监督生成风险图与推理轨迹。真正值得盯的是跨洲泛化与可解释性被放到同一基准里,但公开数据和代码目前只写“将发布”。
#Reasoning#Multimodal#Benchmarking#Research release
精选理由
这篇论文有 HKR-H 和 HKR-K:跨洲泛化设定与推理轨迹监督都有新意。问题在于它属于灾害科学与 AI 交叉,缺少 agent、产品或部署含义,触发硬排除 4,重要性封顶到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H1·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
高维广义线性模型中的公平性约束
该论文提出一套训练框架,在高维广义线性模型中先用辅助特征推断敏感属性,再加入公平性约束以降低偏差。摘要称该方法在隐私或法律限制下仍可训练,并尽量保留预测准确率;数据集、约束形式、评测指标与提升幅度正文未披露。真正该盯的是可复现细节:若没有敏感属性推断误差和公平—精度权衡曲线,效果很难判断。
#Alignment#Benchmarking#Research release
精选理由
这篇触发 technical-accessibility fail:核心是高维 GLM 与公平约束优化,进入门槛高,通用 AI 读者缺少上手点。摘要只披露方法框架,未披露数据集、指标、敏感属性推断误差和公平—精度权衡曲线,信息量不足,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
自适应领域模型:贝叶斯演化、热轮换与面向几何和神经形态 AI 的规范训练
论文提出 Adaptive Domain Models 训练架构,把训练内存压到约为推理占用的 2 倍,且与网络深度无关。摘要称其结合类型系统、Program Hypergraph 与 b-posit 2026,可做精确梯度累加、保持几何 grade,并覆盖损失优化与 STDP 模型。真正值得盯的是部署机制 warm rotation;正文未披露实验、硬件与基准结果。
#Inference-opt#Fine-tuning#Benchmarking#Research release
精选理由
摘要给出“训练内存约为推理 2 倍、且与网络深度无关”这个可检验主张,但正文未披露实验、硬件与基准。题目和机制都偏几何与神经形态专门语境,触发技术可达性排除,故定为 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
SparrowSNN:面向高能效 ECG 分类的软硬件协同设计
SparrowSNN 提出一套面向边缘 ECG 分类的软硬件协同设计,在 MIT-BIH ECG 和 DEAP EEG 上把能耗降到现有超低功耗方案的 1/20 到 1/100。正文给出 3 个部件:SSF 激活函数、可定制的微瓦级量化混合 ANN-SNN 模型、可重构低功耗 ASIC。真正值得盯的是它把 SNN 的时序读权重开销当成系统问题一起改,不只是在模型侧省电。
#Inference-opt#Benchmarking#Research release#Benchmark
精选理由
HKR-K 成立,文章给了明确能耗降幅和系统设计部件。题材是 ECG/EEG 专用边缘芯片与 SNN 协同,偏生物信号应用,也有明显技术门槛,触发 hard-exclusion-4 与 hard-exclusion-1,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
在有效市场假说下预测体育结果:仅赔率方法与广义线性模型的理论和实验分析
论文在 90014 场足球比赛、5 家博彩公司数据上,提出 OO-EPC 与 FL-GLM 两种赔率转概率方法,并报告它们优于现有仅赔率法和广义线性模型。OO-EPC 不用历史数据拟合,按各结果“等盈利置信度”定价;FL-GLM 只拟合 1 个参数,专门校正 favourite-longshot bias。真正值得盯的是约束设计:这不是再堆特征,而是把有效市场假说压进模型结构。
#Benchmarking#arXiv#Research release#Benchmark
精选理由
摘要给了90014场比赛、5家博彩公司和两种具体校准法,HKR-K成立。选题仍偏离 AI RADAR 主航道:这是体育博彩预测研究,不连接模型能力、产品、Agent 或团队工作流,按“无 agent/product implication 的跨域研究”排除,分数封顶39。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
脉冲形状判别算法:综述与基准测试
该论文综述并基准测试近 60 种辐射探测脉冲形状判别算法,并在 2 个标准化数据集上统一评估。评测使用 FOM、F1-score、ROC-AUC 与方法间相关性;数据来自 241Am-9Be 未标注集和 238Pu-9Be 飞行时间标注集。结果指向深度学习,尤其 MLP 与统计特征结合神经回归的混合方法,常优于传统算法;作者还公开了 Python、MATLAB 工具箱和数据集。
#Benchmarking#Tools#Research release#Open source
精选理由
有统一基准和开源资产,HKR-K 成立;但主题是辐射探测脉冲判别,离模型、代理和产品链条太远,还要求核探测背景。命中 hard-exclusion-传统科学+AI 交叉,重要性封顶 39,归入 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
从多模态电子病历中学习治疗策略的标注辅助方法
论文提出 AACE,用专家标注训练多模态 EHR 治疗策略模型,并在推理时只依赖表格数据与临床文本表示来预测治疗获益。摘要称该方法在合成、半合成和真实 EHR 数据上优于基于风险和表征的因果基线,但未披露具体数据集规模、指标数值与标注成本。真正值得盯的是,它直接针对“表征丢失混杂信息会导致偏差”这个临床因果学习痛点。
#Multimodal#Research release
精选理由
HKR-K 成立:论文给出一个具体机制,用专家标注缓解多模态 EHR 表征丢失混杂信息。它仍属于医疗因果学习交叉研究,缺少 agent 或产品落地,摘要也未披露数据规模、指标数值与标注成本;按 hard-exclusion-4 处理,分数封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
一种用于两阶段自适应鲁棒优化的机器学习方法
论文提出机器学习方法,求解含二元 here-and-now 变量、且不确定集为多面体的两阶段线性自适应鲁棒优化问题。方法把最优 here-and-now 决策、对应最坏情景、最优 wait-and-see 决策编码成三类 strategy,并先用列约束生成算法解相似实例来构造训练集。作者在 facility location、multi-item inventory control、unit commitment 上测试;摘要称速度大幅快于现有算法且精度高,但未披露提速倍数与误差。
#Tools#Benchmarking#Research release#Benchmark
精选理由
摘要给出三类 strategy 编码和用列约束生成构造训练集,HKR-K成立。但这是一篇深度运筹优化论文,正文未披露提速倍数与误差,和 Agent、模型产品、行业竞争都没有直接连接;触发 technical-accessibility fail,importance capped at 35,tier=excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
PrivaDE:面向区块链数据市场的隐私保护数据评估
PrivaDE 提出一套隐私协议,让模型方与数据方在不暴露模型参数、原始特征和标签的条件下,共同计算候选数据集效用分数。论文称该协议可抵抗恶意行为,并接入区块链市场,由智能合约执行公平结算;实验结果给出在线运行时间控制在 15 分钟内,模型规模可达数百万参数。真正值得盯的是它把“买前验数”做成可执行流程,但正文未披露更细的基线、成本拆分和链上开销。
#Tools#Inference-opt#Research release
精选理由
论文有一条清晰新信息,所以 HKR-K 成立:在不暴露模型参数、原始特征和标签的条件下评估数据效用,实验写到 15 分钟内、数百万参数。问题是核心价值依赖安全协议与链上结算细节,落入 hard-exclusion 的 technical-accessibility fail;HKR-R 也弱,所以 tier = excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
SHRUG-FM:面向地球观测的可靠性感知基础模型
SHRUG-FM 用三类信号融合,让地球观测基础模型在高风险样本上选择弃答,并在 3 个快速制图任务中降低保留样本的预测风险。三类信号包括输入空间地球物理 OOD、嵌入空间 OOD 和任务不确定性;对比基线点名 predictive entropy,但摘要未披露具体降幅。真正值得盯的是它用浅层决策树做信号融合,直接给出可解释的弃答阈值。
#Safety#Interpretability#Benchmarking#Research release
精选理由
HKR 里只有 K 明显成立:摘要给出输入空间 OOD、嵌入空间 OOD 和任务不确定性三类信号,并用浅层决策树做弃答阈值。题材属于传统科学与 AI 交叉,服务遥感快速制图,缺少代理或通用产品外溢,按 hard-exclusion-4 归 excluded,分数封顶 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Neural Operator:只靠数据就能建模世界吗?数据驱动科学机器学习范式解读
该 arXiv 论文把 Neural Operator 定位为 PDE 近似的更快替代方案,并强调其具备离散化不变性与分辨率不变性。摘要点名对比 FEM 与 FDM 的高耗时、高计算成本;正文未披露实验数字、具体模型族或基准结果。真正该看的不是“只靠数据”这句标题,而是它把数据驱动科学 ML 放在传统数值方法的补充位。
#Research release#Commentary
精选理由
文章有概念钩子,但核心是 Neural Operator 面向 PDE 的科学 ML 讨论,摘要未给实验数字、模型族或基准。它属于传统科学与 AI 交叉,缺少 agent 或产品落点,且技术门槛高,按硬排除处理。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于高速流建模的自适应时间步两阶段深度学习框架
论文提出两阶段框架 ShockCast,用自适应时间步建模高速流,场景覆盖接近或超过声速的流动。第一阶段预测 timestep size,第二阶段把该时间步与当前流场一起用于状态推进;作者生成了 3 个超声速流数据集,并公开到 Hugging Face 与 AIRS 代码库。真正值得盯的是,它把时间步预测单列成一阶段,试图同时处理激波分辨率与计算成本。
#arXiv#Hugging Face#DIVE Lab#Research release
精选理由
论文有明确新机制与开源数据,HKR 只有 K 成立。它属于传统科学计算与 AI 交叉,正文没有 agent、模型产品或产业影响线索,触发硬排除规则 4,所以 importance 压到 39 以下并列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
MASPO:统一梯度利用、概率质量与信号可靠性的稳健高采样效率 LLM 推理方法
MASPO提出统一RLVR框架,按三类失配机制优化LLM推理训练。方法包含软高斯门控、质量自适应限制器和非对称风险控制,分别处理梯度截断、概率约束均一化与正负样本信用分配偏差。摘要称其显著超过基线,代码已开源;正文未披露具体模型、基准分数和提升幅度。
#Reasoning#Fine-tuning#Benchmarking#FlyTune
精选理由
命中硬排除“技术可达性不足”:标题和摘要都停留在RLVR内部机制,缺少面向通用AI从业者的入口。正文只确认方法名与三个组件,未披露模型、基准分数和提升幅度,HKR三轴都偏弱,重要性压到35。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于可聚类性的多视图聚类潜在噪声视图评估
论文提出 Multi-View Clusterability Score,用3个组件在聚类前评估多视图数据中的潜在噪声视图。3个组件分别是单视图结构可聚类性、联合空间可聚类性、跨视图邻域一致性;标题与摘要称这是首个面向多视图数据的可聚类性分数。真正值得盯的是预聚类筛查这一步,摘要称真实数据实验有效,但正文未披露数据集数量与具体提升幅度。
#Benchmarking#Research release
精选理由
论文给出预聚类噪声视图评分,机制有3个组件,信息点成立;但这是窄题多视图聚类方法,正文也没披露数据集数量与提升幅度。它命中技术可达性不足的硬排除,离产品、Agent 和模型竞争都远,故列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
NCO4CVRP:面向容量约束车辆路径问题的神经组合优化
论文在 CVRP 基准上改造 LEHD 与 POMO 推理流程,并报告 Beam Search 与基于模拟退火的 RRC 持续缩小最优性差距。具体做法是给 RRC 加入概率接受机制以跳出局部最优,并给 POMO 接入 Beam Search;正文未披露具体降幅、数据集规模与计算开销。真正该盯的是推理期搜索设计,而不是再堆新网络结构。
#Reasoning#Inference-opt#Benchmarking#Research release
精选理由
HKR-K 只因机制层面有新信息:POMO 接入 Beam Search,RRC 加入概率接受。HKR-H 与 HKR-R 都弱;内容高度依赖 CVRP 与搜索背景,且未披露降幅、数据集规模与算力,触发 hard-exclusion-technical-accessibility-fail,按排除处理。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于机器学习预测金属有机框架中的质子电导率
该论文构建质子导电 MOF 数据库,并用描述符模型与 transformer 迁移学习模型预测质子电导率,最佳 Freeze 模型的 MAE 为 0.91。作者还用特征重要性与主成分分析检查影响因素;真正值得盯的是,正文给出的是“可估到一个数量级内”,数据库规模与样本分布未披露。
#Research release
精选理由
论文有具体方法和误差值,HKR 只命中 K。它触发“传统科学 + AI 交叉且无 agent / 产品含义”硬排除:主题是 MOF 质子导电预测,数据库规模与样本分布正文未披露,所以归入 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Fisher Decorator:用局部传输映射改进流策略
论文提出 Fisher Decorator,用局部传输映射细化离线强化学习中的流策略,并把 KL 约束目标近似为由 Fisher 信息矩阵控制的各向异性二次优化。摘要称该方法利用流速度中的 score function 构造二次约束,且在最优解邻域内给出可控近似误差;基准名称、具体分数和提升幅度正文未披露。真正值得盯的是,它把旧方法的误差归因于各向同性近似,而不是单纯模型表达力不足。
#Research release#Benchmark
精选理由
K 轴命中在于它给出一个具体机制:用局部传输映射和 Fisher 信息矩阵近似 KL 约束。硬排除命中“技术可达性失败”:正文只有离线 RL 数学设定,基准、增幅和 agent 场景都未披露,普通从业者难转成可用信息。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
DGSSM:用于多模态显著目标检测的扩散引导状态空间模型
DGSSM 将多模态显著目标检测表述为渐进去噪过程,并在 13 个公开基准上报告优于现有方法。方法把扩散结构先验、多尺度 Mamba 编码、自适应显著性提示和迭代式 Mamba 扩散细化结合起来,还加入边界感知细化头与自蒸馏。真正值得盯的是边界恢复这块;摘要称模型尺寸紧凑,但正文未披露参数量与推理成本。
#Vision#Multimodal#Benchmarking#Research release
精选理由
HKR 只有 K 命中:有机制名词和 13 个基准,但缺少面向从业者的产品、成本或部署信息。题材属于细分显著目标检测,technical-accessibility fail 明显;正文也未披露参数量与推理成本,所以按硬排除降为 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
训练-推理输入对齐比框架选择更影响纵向视网膜图像预测
论文比较 5 种纵向视网膜预测配置后发现,训练与推理输入分布对齐可把 delta-SSIM 提高 0.082、SSIM 提高 0.086,且两项均 p<0.001。作者据此提出确定性回归模型 TRU,在 3 个平台、28,902 只眼的数据上,对 3 个基线在各 FAF 队列的 delta-SSIM、SSIM 和 PSNR 持平或更优;真正值得盯的是,对齐后框架差异不再显著。
#Vision#Benchmarking#Optos#Heidelberg Spectralis
精选理由
论文有明确新信息:训练—推理输入分布对齐比框架选择更重要,还报告 28,902 只眼和 SSIM 增益。问题在受众匹配,它是医学影像预测研究,缺少 agent、模型产品或产业外溢,触发“传统科学+AI 交叉”排除,分数封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于多智能体选项发现的智能体间相对表征
该论文提出一种多智能体选项发现方法,用联合状态抽象压缩随智能体数量指数增长的状态空间。方法先近似团队“Fermat”对齐状态,再定义逐维 spreadness,并用神经图拉普拉斯估计器提取同步化选项。实验覆盖两个模拟多智能体领域的多个场景,正文未披露具体任务数;真正值得盯的是,它把“协调”直接写进表征,而不是事后拼接独立策略。
#Agent#Reasoning#Benchmarking#Research release
精选理由
论文有明确方法新意,但主题是多智能体强化学习里的 option discovery,阅读门槛高,正文也只给出两个模拟领域,缺少面向通用 agent 工作流的落地条件。HKR 仅 K 命中,触发 technical-accessibility fail,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过跨被试 soft-ROI 融合实现统一多模态脑解码
论文提出 BrainROI,并在 NSD 数据集的跨被试脑描述任务上取得领先结果。方法用 multi-atlas soft-ROI 共享空间、Voxel-gate 体素级融合和全局标签对齐;BLEU-4、CIDEr 均优于近期方法,但正文未披露具体增幅。作者还用本地部署的 Qwen 做小样本闭环提示优化,并在推理时加入参数化解码约束,真正值得盯的是跨被试泛化与可审计性。
#Multimodal#Interpretability#Benchmarking#Qwen
精选理由
标题有新鲜感,方法也给了具体机制,所以 HKR-H 和 HKR-K 成立。问题在于它属于传统科学+AI 交叉,正文没有代理、产品或产业链含义;再加上 NSD、ROI、体素融合门槛偏高,触发 hard-exclusion,重要性封顶 39。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H1·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
EGMOF:用混合 Diffusion-Transformer 架构高效生成金属有机框架
EGMOF 用两阶段混合架构生成 MOF,在储氢数据集上做到 94% 以上有效率和 91% 命中率。方法先用 1D diffusion 模型 Prop2Desc 把目标性质映射为描述符,再由 transformer 模型 Desc2MOF 生成结构;仅 1000 个样本仍有效。真正值得盯的是,它声称可在 29 个性质数据集上做条件生成,旧方法做不到。
#Research release#Benchmark
精选理由
HKR 只命中 K:有具体数字和方法机制。硬排除规则 4 直接生效——这是传统科学与 AI 交叉研究,正文未显示 agent、产品或行业落地含义;importance 需压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
IDOBE:传染病暴发预测基准生态
IDOBE 发布了一个传染病暴发预测基准,汇集跨百年监测数据,并切分出超 10,000 个暴发序列,覆盖 13 种疾病。论文用 11 个基线模型做 1 到 4 周预测,指标含 NMSE、MAPE 和 NWIS;结果显示 MLP 方法整体最稳,峰前阶段统计方法略占优。
#Benchmarking#NSSAC#Research release#Open source
精选理由
论文有明确数据与基线,HKR-K 命中;但题材是传染病暴发预测,缺少 agent、模型产品或产业落地指向,触发“传统科学 + AI 交叉且无产品含义”硬排除。信息增量主要服务公共卫生 ML,不在本栏重点。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
ARCS:用拓扑感知图注意力与规格条件做自回归电路合成
ARCS 在 32 种电路拓扑上生成可 SPICE 仿真的完整模拟电路,仿真有效率达 99.9%,只需 8 次 SPICE 评估。其方案把图 VAE、flow-matching 模型与基于 SPICE 的排序串成混合流水线;单模型推理用拓扑感知 Graph Transformer,加 Best-of-3 后在 97ms 达到 85% 有效率。真正值得盯的是 RL 细节:作者把 GRPO 改到多拓扑训练里,用按拓扑归一化 advantage,把有效率较 REINFORCE 提高 9.6 个百分点,且只用 500 步。
#Reasoning#Tools#Benchmarking#arXiv
精选理由
摘要有具体数据和机制,HKR-K成立。问题是内容几乎完全站在模拟电路与SPICE语境里,触发技术可达性硬排除;它也没有清晰的代理、产品或行业竞争外溢影响,对通用 AI 读者过窄。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
SegWithU:将不确定性建模为扰动能量的单次前向风险感知医学图像分割
SegWithU 在 ACDC、BraTS2024、LiTS 上以单次前向实现风险感知医学分割,AUROC/AURC 分别达 0.9838/2.4885、0.9946/0.2660、0.9925/0.8193。它在冻结预训练分割骨干上加轻量不确定性头,读取中间特征,用紧凑探针空间中的 rank-1 后验探针建模扰动能量,并输出校准图与排序图。真正值得盯的是,它保留分割质量且只需一次推理,代码已开源。
#Vision#Benchmarking#Tools#ProjectNeura
精选理由
论文有可验证的新机制和指标,HKR-K 成立:冻结分割骨干后加轻量不确定性头,并在 ACDC、BraTS2024、LiTS 报告 AUROC/AURC。题材属于医学影像分割研究,缺少 agent、模型发布或产品链路,触发“传统科学+AI 交叉”排除规则,且技术门槛偏高,因此 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
MerLin:面向光子与混合量子机器学习的发现引擎
MerLin 发布开源框架,把线性光路强模拟接入 PyTorch 与 scikit-learn,并支持量子层端到端可微训练。作者称其已复现 18 篇光子与混合 QML 工作,覆盖核方法、储备池、卷积、循环与生成模型。真正值得盯的是可复现实验基线与硬件感知测试,不只是一套单点算法实现。
#Benchmarking#Tools#Fine-tuning#MerLin
精选理由
摘要给出“接入 PyTorch/scikit-learn、复现 18 篇工作”这类可检验信息,HKR-K 成立。主题是光子与混合量子 ML 框架,面向高度专门研究场景,触发 technical-accessibility fail 与传统科学+AI crossover,故列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于 CMS 触发系统横向动量估计的物理先验图神经网络
该论文在 CMS Trigger Dataset 上用物理先验 GNN 估计粒子横向动量,station-informed EdgeConv 把 MAE 做到 0.8525,参数量比深度学习基线至少少 55%。方法给出 4 种图构造:station-as-node、feature-as-node、bending angle-centric、η-centric,并加入带注意力与门控更新的 Message Passing Layer。真正值得盯的是精度-效率共设计,而非单纯换个 GNN 结构。
#Inference-opt#Benchmarking#CMS#arXiv
精选理由
论文给出 MAE 0.8525、参数量至少少 55%,HKR-K 成立。题材是 CMS 触发系统里的高能物理论文,缺少 agent、模型产品或行业外溢,触发 hard-exclusion-4;术语门槛也高,按 excluded 处理。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
机器学习驱动的 Android 恶意软件检测关键问题拆解
该论文统一整理 Android 恶意软件检测研究,并重现 12 个代表性方法做三维评测。评测覆盖检测效果、真实世界鲁棒性与效率;结果显示现有方法仍易受恶意软件演化和对抗攻击影响。真正值得盯的是语义建模短板:论文将问题归因于检测器难以从 APK 特征稳定捕获恶意行为语义。
#Benchmarking#Safety#Android#arXiv
精选理由
HKR 只中 K:论文补了 12 个 Android 恶意软件检测方法的统一复现与三维评测。题材落在安全细分研究,触发 technical-accessibility fail 硬排除,且没有 agent、模型产品或行业竞争外溢,分数封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
生物医学数据发现性的 Zeta 定律:多少数据才够?
该 arXiv 论文提出生物医学跨模态发现性缩放框架,并称在温和假设下,性能累计信噪能量遵循类 zeta 定律。机制落在协方差谱衰减、任务对齐信号投影和已学习表征;AUC 等指标可写成可识别谱模态上的累计能量。真正该盯的是交叉区间:小样本时简单模型更强,样本增大后高容量或多模态编码器反超。
#Multimodal#Benchmarking#Research release
精选理由
有题眼,也有具体机制,但这是生物医学数据发现性的理论论文,正文未给出 agent、产品或通用开发流程外溢。触发“传统科学 + AI crossover 无 agent/product implication”硬排除;技术门槛也偏高,importance 封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H1·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过 Landing 在非凸等式与不等式约束下高效训练扩散模型
论文提出统一约束扩散框架,在非凸可行集内同时处理等式与不等式约束。方法用 landing 机制替代投影,避免迭代 Newton 求解与投影失效,并覆盖过阻尼和欠阻尼正反向采样。摘要称训练与推理的函数评估和显存占用下降,样本质量接近现有最优;正文未披露具体降幅。
#Inference-opt#Benchmarking#Research release#Benchmark
精选理由
有一个明确方法点:用 landing 替代投影和 Newton,同时覆盖非凸等式与不等式约束,所以 HKR-K 成立。主题过深,正文也没给出可迁移到产品、Agent 或业务指标的条件,触发 technical-accessibility fail,按规则排除并封顶 39。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于图 Transformer 的癌症预后通路嵌入
论文提出 PATH,用共享基因底座嵌入叠加患者条件调制,做癌症转移预测,F1 达到 0.8766。该方法把 CNV 和突变信号注入基因表示,再用图 Transformer 建模通路间注意力;摘要称较多组学 SOTA 提升 8.8%。真正值得盯的是,模型不只报分数,还声称能揭示疾病状态相关的通路重连。
#Benchmarking#Interpretability#Research release#Benchmark
精选理由
论文有具体指标与机制,HKR-K 成立;但它是癌症预后场景的多组学方法论文,不在模型、产品或 agent 主线。多组学与通路建模门槛高,且属于传统科学 + AI 交叉,触发硬排除 4 与 1,所以列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
面向自动驾驶汽车系统的 RISC-V 功能安全:ML 辅助认证的分析框架与研究路线图
该 arXiv 论文提出一个面向自动驾驶的 RISC-V 功能安全分析框架,并把优化目标指向 ASIL-D 级可认证平台,而非更快内核。摘要点名成本主要落在诊断覆盖分析、工具链资格认定、故障注入、安全案例生成,以及 ISO 26262、ISO 21448、ISO/SAE 21434 合规。真正值得盯的是认证流程自动化:文中列出 LLM 辅助 FMEDA、知识图谱安全案例、RL 故障注入、GNN 诊断覆盖,但正文未披露实验结果。
#Safety#Tools#RISC-V#Research release
精选理由
摘要列出 ASIL-D、FMEDA、RL 故障注入等机制,信息量存在。命中“技术可达性”硬排除:主题卡在 ISO 26262 / RISC-V 车规认证,门槛高,且正文未披露实验结果或产品落地。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Thermal-GEMs:面向建筑热动力学的通用模型
论文评测多源迁移学习与时间序列基础模型,发现前者在真实建筑数据上可将预测误差较单源迁移学习最多降低63%。文中比较4种多源架构,并给出阈值:需有16到32栋源建筑、各覆盖1年数据,多源模型才会按MAE稳定超过TSFM。真正值得盯的是选型条件,不是“通用模型”这个标题。
#Benchmarking#Research release#Benchmark
精选理由
HKR-K 命中,因文中有具体误差降幅和多源数据阈值。题材属于传统工程/科学与 AI 交叉,缺少 agent、产品或行业影响,触发硬排除“传统科学 + AI crossover without agent/product implications”,分数封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
面向高维稀疏泊松数据的邻域嵌入
论文提出 p-SNE,用于把高维稀疏泊松计数数据嵌入低维空间。方法用泊松分布之间的 KL 散度度量样本差异,再用 Hellinger 距离优化嵌入;正文未披露定量指标和基线胜负。作者在合成数据、邮件通信、OpenReview 论文和神经 spike 记录上做实验,真正值得盯的是它把离散计数几何直接写进了降维目标。
#Embedding#Benchmarking#OpenReview#arXiv
精选理由
HKR 只有 K 命中:论文给出把泊松计数几何写进降维目标的具体机制,但正文未披露量化提升和基线胜负。内容偏数值方法,对通用 AI 从业者上手门槛高,且没有 agent 或产品含义,触发 hard-exclusion:technical-accessibility fail。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
ConforNets:在 OpenFold3 中用潜变量控制蛋白构象
ConforNets 通过改写 OpenFold3 的 pre-Pairformer 成对潜变量,在多态蛋白基准上提升了交替构象生成成功率。方法核心是对通道做仿射变换,并以全局方式调制 AF3 表征,可跨蛋白复用。真正值得盯的是监督式“构象迁移”:模型可从源蛋白学到变化,并在同一家族中诱导保守构象切换。
#Benchmarking#Tools#Research release#Benchmark
精选理由
文章有明确技术新意,摘要也给出可核对的机制:改写 OpenFold3 的 pre-Pairformer 成对潜变量,并声称可跨蛋白迁移构象控制。它仍属于蛋白科学 + AI 交叉,阅读依赖结构生物学背景,触发 hard-exclusion-4,且有技术门槛,因此 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
MoGERNN:面向未观测位置的归纳式交通预测器
MoGERNN 提出一种归纳式时空图模型,用部分传感器观测预测未观测路段交通状态,并在 2 个真实数据集上持续优于基线。方法含稀疏门控的 Mixture of Graph Experts 与图编码器-解码器,正文未披露具体提升幅度;代码已公开在 GitHub。真正值得盯的是它声称传感器配置变化后仍保有竞争力,这不是补点插值,而是面向传感网络变动的泛化。
#Reasoning#Benchmarking#Tools#arXiv
精选理由
HKR-K 成立:它给出“部分传感器观测预测未观测路段”的可检验主张,并公开代码。硬排除命中“传统科学/工程 + AI 交叉且无 agent 或产品含义”;这更像交通工程论文,正文也没给出具体提升幅度,重要性封顶 39。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Itô 型过程生成时间序列预测中的信息统计特征提取
论文提出从满足未知漂移与扩散系数的 Itô 随机微分方程时间序列中提取两类统计特征,并用简单自回归算法验证其能提升预测。特征来自混合模型参数的统计重建,分为与当前状态无关的均匀重建和考虑状态依赖的非均匀重建;正文未披露数据集规模、误差降幅与具体算法复杂度。真正值得盯的是,它刻意避开神经网络架构干扰,只检验特征本身是否带来增益。
#Research release
精选理由
K 有一点:论文把特征工程从模型容量里拆开,比较均匀与状态相关重建对自回归预测的影响。分数压到 34,因为主题落在 Itô 过程统计方法,正文又未披露误差降幅与复杂度,触发技术可达性硬排除,也没有产品或 agent 相关性。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
医学图像分析中的分布偏移应对:一篇综述
这篇综述系统梳理了医学图像分析应对分布偏移的4类方法:联合训练、联邦学习、微调和领域泛化。论文按医疗场景中的数据可得性、隐私约束和协作协议来组织方法,并给出经验分析:可访问的域信息越少,性能提升越受限。真正值得盯的是,研究重心正从显式分布对齐转向不确定性感知建模。
#Fine-tuning#Benchmarking#Research release#Commentary
精选理由
有料点在于它把分布偏移方法分成4类,并给出“域信息越少,增益越小”的经验判断。分层仍给 excluded:这是医学影像综述,缺少 agent、产品和产业影响,命中“传统科学+AI 交叉但无产品含义”硬排除,分数封顶 39。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
连续时间离散空间耦合隐马尔可夫模型的高效推断
论文提出 Latent Interacting Particle Systems,用于在连续时间、离散状态的耦合隐马尔可夫模型中做近似后验推断。方法把未来观测编码为 look-ahead functions(twist potentials),再接入 twisted Sequential Monte Carlo;实验覆盖图上的潜在 SIRS 推断和基于真实数据训练的野火传播神经模型。真正值得盯的是,它瞄准的是 Doob's h-transform 后验难采样这个老问题;正文未披露量化结果。
#Inference-opt#Research release
精选理由
HKR-K 过线,因为摘要给了可识别的方法增量:look-ahead functions 与 twisted SMC 结合。问题在于题材是连续时间耦合 HMM 的专门数值推断,正文未披露量化结果,也没有 agent 或产品落点,触发 hard-exclusion:technical-accessibility fail。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于物理信息图神经网络的可扩展量子误差缓解
论文提出 GEM,用图神经网络做量子误差缓解,并在 10 比特与 16 比特超导量子处理器随机电路上验证。方法把量子电路编码为属性图,将 T1、T2、读出误差写入节点特征,把双比特门误差写入边特征,再用双分支仿射校正约束物理一致性。真正值得盯的是可扩展性:摘要称 GEM 在小规模精度可比 CDR,零样本迁移到更大系统时 MAE 更低且更稳定,但具体误差数值正文片段未披露。
#Benchmarking#Tools#arXiv#Research release
精选理由
摘要有具体机制与10/16比特实验,HKR-K成立。但这是量子计算+AI交叉研究,离模型、agent、产品现场远,还需要量子误差缓解背景,触发传统科学 crossover 与 technical-accessibility fail 两条硬排除,所以列为 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于机电系统建模与辨识的耗散潜变量残差物理信息神经网络
论文提出 DiLaR-PINN,用于机电系统建模与辨识,并以偏斜—耗散参数化保证系统能量不增加。该残差网络只作用于不可测潜状态,还配合循环 rollout 与课程式序列扩展训练。作者在真实直升机系统上对比 4 个基线,称其对耗散效应拟合更准,长时域外推更强。
#Robotics#Research release
精选理由
HKR-K 命中:论文有具体机制和真实系统对比。问题在于它主要是机电系统建模论文,理解门槛高,也没有 agent、模型发布或产品落地,触发 hard-exclusion-technical-accessibility 与 hard-exclusion-science-crossover,所以排除并把分数压到 34。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用并行持久化 MCMC 玻尔兹曼机学习,从蛋白质多序列比对估计进化场与耦合
该论文用并行、持久化 MCMC 配合玻尔兹曼机学习,从蛋白质多序列比对中估计单点场和两两耦合,并在 8 个蛋白家族上验证。方法还引入随机梯度下降降算力成本,并按满足特定蛋白构象条件来调正则化参数;标题已给出逆 Potts 问题,正文未披露速度提升幅度和定量精度。
#Research release
精选理由
HKR 只有 K 成立:方法与验证条件具体。题材落在蛋白序列统计建模,缺少 agent 或产品含义,且需要玻尔兹曼机与逆 Potts 背景,触发 hard-exclusion-4,并接近 hard-exclusion-1,所以 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于 ML 型 SOP 监测跨系统泛化的变分自编码器域适配
论文提出基于 VAE 的域适配框架,把 21 公里 O-band 暗光纤与 63.4 公里 C-band 城域环的共享事件特征压到同一表示,再冻结编码器训练单系统分类器。系统 1 迁移到系统 2 的准确率达 95.3%,反向为 73.5%;相对单系统监督 DNN 基线分别提升 83.4% 和 51%,且文中称系统内性能未受损。
#Research release
精选理由
有具体实验数字,HKR-K 成立;但主题是光通信 SOP 监测的跨系统迁移,技术门槛高,也不指向模型、代理或产品实践。触发 hard-exclusion-technical-accessibility 与传统科学/工程+AI crossover,按规则降为 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
一种用于估计市场效率的“逆向”实验框架
论文提出一种“逆向”实验框架,仅用双向拍卖订单簿数据预测配置效率,并在最早几笔出价和要价阶段就得到可用结果。方法结合分位数归一化、线性回归和梯度提升树,输入含 bids、asks 与成交价,不含保留价;摘要未披露具体误差、样本规模和市场类型分布。真正值得盯的是,它想把实验市场中的效率标签反推到真实市场监测,但离可用于治理还差公开评测细节。
#Benchmarking#Tools#Research release
精选理由
HKR-K 只拿到一层:摘要说明用早期 bids/asks、成交价配合回归和 GBT 估计配置效率。硬排除规则 4 生效:这是实验经济学 + ML 论文,不指向模型、agent 或产品;正文也未披露误差、样本量和市场分布,读者难判断含金量。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过混沌提升分类准确率
论文提出一种分类方法:先把输入向量升维,再把它作为混沌动力系统的初始条件演化一段时间,最后交给可训练的 softmax 分类器输出类别概率。作者用维度 2 到 20 的随机扰动正交向量做概念验证,类别数与向量维度相同;摘要称它比原始向量 softmax 和仅升维 softmax 训练更快、准确率更高,但具体增幅正文片段未披露。真正值得盯的是机制:作者还声称给出了性能提升解释,以及最优混沌演化时长的选择流程。
#Benchmarking#Research release
精选理由
标题钩子强,机制也新:先升维,再把向量送入混沌动力系统演化,最后接 softmax;摘要给了 2–20 维概念验证。问题是精度增幅与复现实验细节未披露,主题偏数值方法,普通 AI 从业者缺少落地入口,触发 technical-accessibility fail。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H1·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
通过稀疏叶指示核重新审视森林邻近度
论文提出 SWLC 核,把决策森林邻近度统一为共享稀疏叶指示结构的一类核,并称在标准森林设定下精确计算可达时间与内存近线性扩展。它给出邻近矩阵的有限样本精确稀疏分解,用叶碰撞上的稀疏线性代数替代全样本两两比较。作者还实现了内存高效 Python 库,基准覆盖多数据集、邻近度定义和森林配置,正文未披露具体速度倍数。
#Embedding#Benchmarking#Tools#Research release
精选理由
HKR 只中过 K:方法上有新机制,但标题和摘要都偏传统树模型核方法。它触发 technical-accessibility fail,且正文未披露具体加速倍数与现代 AI 产品关联,对通用 AI 从业者的讨论价值有限,所以排除并压到 40 以下。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
E2E-WAVE:用于水下视频组播的端到端学习式波形生成
E2E-WAVE 在 2.3 kbps 水声信道上实现 128×128、16 FPS 视频组播,并在 NOF1 信道把 PSNR 提高 5 dB(19.26%)、SSIM 提高 0.10(14.28%)。论文称水下声学信道误码率达 20%–46%,超过阈值时 LDPC 会增错;该方法把语义相似性嵌入物理层波形,结合 VideoGPT 1024×压缩、可训练波形库和可微 OFDM。真正值得盯的是,它只用单一信道训练就泛化到未见环境;标题已给出“首个”表述,正文未披露独立复现或实海试规模。
#Multimodal#Audio#Benchmarking#arXiv
精选理由
论文有具体指标,但不在本栏主航道。正文给了 2.3 kbps、128×128@16 FPS、PSNR/SSIM 提升和单信道训练泛化;它仍是水声通信物理层论文,阅读门槛高,也没有 agent、产品或模型竞争含义,所以触发硬排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
TGLF-WINN:面向聚变湍流输运建模的数据高效深度学习替代模型
论文提出 TGLF-WINN,用更少数据近似 tokamak 湍流输运;在全量数据上,它比 TGLF-NN 将相对 RMSLE 再降 12.5%。在约为全量 1/9 的稀疏训练下,退化幅度比 TGLF-NN 小一个数量级;加入贝叶斯主动学习后,仅用 25% 训练数据就接近 TGLF-NN 全量精度,并在下游通量匹配中实现 45 倍加速。
#Inference-opt#Tools#arXiv#Research release
精选理由
有具体结果,但命中硬排除 4:这是聚变物理里的 AI 替代建模,不是模型、产品或代理生态新闻。摘要披露12.5% RMSLE降幅、25%数据接近TGLF-NN全量精度、下游45倍加速,K成立;H和R对通用AI从业者都偏弱,所以排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
考虑中轴的有符号距离函数学习
该论文提出一种变分方法,从无定向点云学习全局高精度 SDF,并把 SDF 梯度跳跃集显式建模为表面中轴。方法把 eikonal 方程和零水平集设为约束,采用 Ambrosio-Tortorelli 型相场近似,使相场函数隐式描述中轴。真正值得盯的是,它同时用神经网络逼近 SDF 与相场;摘要称近场与全局都更准,但正文未披露具体基准数字。
#Vision#Research release
精选理由
有料点在方法设计,但触发 hard-exclusion-technical-accessibility fail:这是面向几何学习与数值方法读者的窄众论文,普通 AI 从业者缺少进入点。摘要也未给出具体基准数字,HKR 仅 K 命中,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用引导粒子扩散采样建模气相反应动力学
论文把物理引导的扩散采样用于 ARD 方程的气相反应动力学,并在稀疏观测条件下重建完整时空轨迹。摘要称方法可外推到未见参数区间;别被“实验级应用”标题带偏,正文片段未披露数据集规模、误差指标和对比基线。
#Research release
精选理由
触发硬排除:传统科学与 AI 交叉,且没有 agent 或产品落点。正文信息也只到方法名与外推 claim,缺少误差、基线和数据规模,HKR 三轴都弱,重要性封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用 CWT 增强振动感知并用 YOLO 做空间故障定位
论文提出一套轴承故障监测框架,把振动信号转成 CWT 时频谱,再用 YOLOv9、YOLOv10、YOLOv11定位并识别故障能量区域,在 CWRU、PU、IMS 三个数据集上 mAP 最高达 99.4%、97.8%、99.5%。对比对象包括传统时序模型、视觉骨干网络和基于 STFT 的表示,摘要称该方法在弱故障与非平稳信号上检测性和鲁棒性更强。真正值得盯的是区域级定位把时频能量分布和故障特征连了起来,但正文片段未披露训练配置与推理开销。
#Vision#Interpretability#Benchmarking#Research release
精选理由
HKR-K 命中:摘要给了方法链路和三组指标。文章仍属工业故障诊断场景,缺少 agent、模型、产品或生态层面的外溢,触发“传统科学/工程 + AI 无产品含义”与技术可达性排除,importance capped below 40。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于故障强度诊断的深层分层知识损失
论文提出 DHK 框架,用两种树结构损失改进故障强度诊断,并在 4 个真实数据集上超过近期 SOTA 方法。机制包括分层树损失、焦点分层树损失、基于树高的自适应加权,以及带分层动态间隔的 group tree triplet loss。真正该盯的是类间层级先验;具体指标、误差降幅和数据规模,摘要未披露。
#SAMSON AG#Research release#Benchmark
精选理由
摘要给出分层树损失、动态间隔和 4 个真实数据集,HKR-K 成立。问题是主题落在工业故障强度诊断,和 agent、模型发布、产品更新都不相连,触发“传统科学/工程 + AI crossover”硬排除,分数封顶 39。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
XRePIT:在 OpenFOAM 中实现的深度学习-计算流体力学混合框架,用于快速稳健且可扩展的非定常模拟
论文提出 XRePIT,在 OpenFOAM 中用残差阈值自动切换神经代理与数值求解器,在 3D 浮力驱动流测试里实现最高 2.91 倍加速。结果称其长时模拟可越过独立代理的稳定边界,且相对 L2 误差保持在 O(1E-03)。真正值得盯的是自动化耦合机制,不再局限于低维手工实现;正文未披露训练数据规模与硬件配置。
#Inference-opt#Tools#Research release#Open source
精选理由
命中硬排除:传统科学与 AI 交叉,且技术门槛高。这是面向 CFD 数值模拟的研究,不是模型、产品或 agent 工作流新闻;HKR 只过 K,因摘要给出切换机制、2.91 倍加速和 O(1E-03) 误差。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于草图正则化的科学模拟隐式神经压缩器原位训练
论文提出一种原位训练协议,用有限内存缓冲保存完整样本与草图样本,并用草图正则抑制灾难性遗忘。方法以 Johnson-Lindenstrauss 结果作理论动机,在二维、三维、长时程、非结构网格与非笛卡尔几何上测试;摘要称其在高压缩率下重建强,且原位效果接近离线法,但正文未披露具体压缩率与误差数值。
#Memory#Fine-tuning#Research release
精选理由
触发硬排除两条:一是传统科学与 AI 交叉,二是技术可达性差。摘要虽给出 sketch-based regularization 与有限内存缓冲机制,但正文未披露压缩率、误差等关键数字,也没有 agent 或产品落点,所以仅保留低分 K,tier=excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
扩散模型在非线性时空系统识别中的目标参数化
论文比较3类扩散目标参数化,称 clean-state 预测在湍流仿真里的长期 rollout 更稳定、误差更低。方法采用直接处理物理场的 patch-based transformer;正文未披露误差降幅等具体数值。真正该盯的是目标定义本身,不是继续沿用图像生成里的 noise 或 velocity 目标。
#Benchmarking#Research release
精选理由
这篇论文有一个可测试结论:把扩散目标从 noise 或 velocity 改成 clean-state,长期 rollout 更稳。场景落在湍流等物理系统识别,摘要也未披露误差降幅、算力开销和复现条件;触发“传统科学+AI 交叉”与“技术可达性不足”,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
NPCNet:用导航器驱动伪文本做早期脓毒症表型深度聚类
NPCNet把 EHR 时序数据离散成伪文本,并在领域约束下做早期脓毒症表型深度聚类。模型含文本嵌入生成器、聚类算子和目标导航器 3 个组件;导航器用辅助任务注入临床知识,聚类算子迭代联合优化质心与患者表示。标题和摘要已给出方法与任务,正文未披露具体数据集、基线名称和提升幅度。
#Embedding#Benchmarking#Research release#Benchmark
精选理由
这篇稿件触发 hard-exclusion-4:医疗研究与 AI 交叉,但没有 agent、产品或产业落地线索。摘要给了“伪文本+导航器”的方法名,正文未披露数据集、基线和提升幅度,HKR 三轴都不成立,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
图模型中基于条件独立发现的不同冗余概念
该论文指出,图模型发现中未被使用的冗余条件独立检验,能检测且有时纠正已学习图中的错误。摘要给出的机制是:并非所有冗余检验都含额外信息;对任意概率分布都成立的条件独立或不独立陈述,通常难以纠错,只有依赖图结构假设推出的陈述更有用。真正值得盯的是“冗余”的来源,而不是检验数量;正文未披露实验规模与具体算法。
#Research release
精选理由
HKR-K 成立:摘要明确区分两类“冗余”条件独立检验,并给出哪一类能纠错的机制。门槛仍然过高,正文未披露实验规模与算法细节,且缺少产品或代理落点,触发 technical-accessibility fail,重要性封顶并排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用机器学习自动分类火星等离子体区域
论文提出一个基于 MAVEN SWIA 离子全向能谱的分类器,自动识别火星周围 3 类等离子体区域:太阳风、磁鞘和感生磁层。作者比较了 MLP 与引入短时序的 CNN,结果称 CNN 能稳定区分 3 类区域,MLP 难以分开太阳风与磁鞘。真正值得盯的是输入只用单一仪器能谱,正文摘要未披露具体准确率、样本规模与部署条件。
#Tools#MAVEN#Research release
精选理由
HKR 只有 K 勉强成立:摘要至少给出单仪器输入与 CNN 对比 MLP 的具体机制。按硬排除规则,这属于传统科学 + AI 工具应用,和 agent、模型、产品更新都无直接关联;摘要也未披露准确率、样本规模与部署条件,所以设为 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于离网系统可靠太阳辐照预测的物理约束状态空间模型
论文提出 PISSM,用少于4万个参数预测离网光伏系统的太阳辐照,并在 Omdurman, Sudan 多年数据上宣称精度更高。模型用动态 Hankel 矩阵抑制传感器噪声,以线性状态空间替代注意力机制,再用 Solar Zenith Angle 与 Clearness Index 做门控,硬性约束昼夜周期并避免夜间误报。真正值得盯的是,这套设计把物理约束直接写进结构,不靠事后修正。
#Inference-opt#arXiv#Research release
精选理由
论文有具体机制与参数量,HKR-K 命中。主题仍是能源预测,缺少 agent、产品或模型竞争外溢,触发“传统科学 + AI 跨界且无产品含义”硬排除;技术门槛也偏高,importance capped below 40。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于 Hadamard 网络偏置校正与残差网络的混合多维 MRI 前列腺癌检测
论文提出两阶段 HBR-Net-18,用六张 HM-MRI 参数图上的 Hadamard U-Net 偏置场校正,接 ResNet-18 做前列腺癌检测。分类阶段使用重叠 11×11 图像块,并结合 2D 同层与 3D 邻层信息;摘要称其敏感性与特异性更均衡,但正文未披露具体样本量、指标数值和基线差距。真正该盯的是偏置校正先行这一步,它把 MRI 强度不均当成显式问题处理,而不是直接把脏输入丢给分类器。
#Vision#Research release
精选理由
命中硬排除:传统科学/医疗影像与 AI 交叉,和代理、模型产品、开发工作流距离较远,tier 只能给 excluded。HKR 里只有 K 勉强成立,因为摘要至少披露了偏置校正先行与 2D/3D 图像块融合机制;样本量、指标和基线差距正文未披露。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
基于物理约束图注意力网络的复杂合金多标签相图预测
论文提出用于 Ag-Bi-Cu-Sn 合金相图预测的物理约束 GAT,在约 2.5 万个 pycalphad 平衡态上预测 9 种相,macro-F1 达 0.951,精确相集匹配率为 93.98%。加入热力学约束后,稠密域内网格精确率升至约 96%,未见三元截面达 99.32%,700°C 四元截面达 91.78%。真正值得盯的是,它把约束同时放进训练惩罚和推理投影,不只追分数。
#Reasoning#Benchmarking#arXiv#pycalphad
精选理由
有料点明确:文章给出2.5万个 pycalphad 平衡态、9类相标签,以及约束同时进入训练惩罚和推理投影的做法。分数压到34,因为它触发“传统科学+AI交叉、无 agent/产品含义”的硬排除,受众相关性弱,tier 只能是 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于最优传输的 Sobolev 梯度上升:重心优化与收敛分析
论文提出一种无约束的 Wasserstein barycenter 对偶形式,并给出 Sobolev gradient ascent,在输入分布离散到规则网格时计算重心。作者称该方法省去代价高的 c-concavity 投影,且全局收敛率与欧氏空间非光滑凸优化的经典次梯度法一致。真正该盯的是简化是否保持精确解;摘要称数值实验优于现有求解器,但正文未披露具体基准规模。
#Research release#Benchmark
精选理由
摘要给出无约束 Wasserstein barycenter 对偶形式、Sobolev gradient ascent 和收敛率表述,所以 HKR-K 成立。问题是主题过于偏最优化数值方法,正文未披露基准规模,也没有 agent、模型或产品落点,触发 technical-accessibility fail,按规则排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
非凸情形下一阶自适应方法的统一收敛理论,涵盖 AdaNorm、全量与对角 AdaGrad、Shampoo 和 Muon
论文提出一个统一框架,覆盖非凸无约束优化中的自适应预条件一阶方法,包含 AdaNorm、全量与对角 AdaGrad、Shampoo 及 Muon 的自适应变体。作者给出完全随机情形的全局收敛速率分析,并同时覆盖无动量和两类动量设定;分析只要求梯度 oracle 方差满足合理假设,不要求随机梯度有界,也不要求步长足够小。真正值得盯的是,它允许不同变量组混合异构几何,还保留统一证明。
#Research release
精选理由
命中 hard-exclusion-technical-accessibility fail:这是典型的优化理论 / 数值方法论文,读者需要较强预备知识才能判断价值。HKR 里只有 K 勉强成立,但缺少面向通用 AI 从业者的可操作结论、产品含义或行业话题性,所以 importance capped at 39 并排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
PyEPO:基于 PyTorch 的端到端 predict-then-optimize 线性与整数规划库
论文发布了 PyEPO,并称其是在预测目标系数条件下,首个面向线性与整数规划的通用端到端 predict-then-optimize 工具库。摘要列出 surrogate decision loss、black-box solver、perturbed methods 三类方法,并在 Shortest Path、Multiple Knapsack、TSP 上做了对比实验。真正值得盯的是工程接口与算法打包;摘要未披露具体基准数值。
#Tools#Benchmarking#Research release#Open source
精选理由
arXiv 编号 2206.14234 对应 2022 论文,2026 这条没有新版本、新实验或采用数据,触发 stale rerun。摘要只说明三类方法与三个任务,未给结果数值,题材又偏线性/整数规划工具链,圈层太窄。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于自主太空探索的自适应量化行星陨石坑检测系统
论文提出 AQ-PCDSys 理论架构,用 INT8 量化神经网络检测行星陨石坑,面向功耗、散热、内存受限的航天载荷。正文给出 QAT、光学图像与 DEM 的自适应多传感器融合、局部 FP16 坐标转换等机制;但未披露实测精度、延迟、功耗或飞行硬件遥测。真正值得盯的是,它现在是数学蓝图,不是经过实机验证的部署结果。
#Vision#Multimodal#Inference-opt#Research release
精选理由
标题有新鲜感,但正文停在理论架构:INT8 量化、多传感器融合、局部 FP16 坐标转换都有,精度、延迟、功耗、飞行硬件遥测都未披露。它也落在航天遥感 + AI 交叉,和通用 AI 产品与从业者议题距离较远,触发传统科学 crossover 硬排除,故 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H1·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
利用 DINOv2 与注意力 LSTM 预测 IVF 囊胚形成的时序胚胎图像方法
这篇 arXiv 论文用 DINOv2 结合带多头注意力的 LSTM 预测 IVF 胚胎是否形成囊胚,在 704 段胚胎时序视频上报告 96.4% 准确率。方法先从少量日采图像提取视觉特征,再建模发育时间序列;正文只给出“超过现有方法”,未披露对比基线名称与缺帧实验细节。真正值得盯的是,它把“无完整视频、只有零散日图”设成可用条件,这更贴近很多 IVF 实验室的采集现实。
#Vision#Benchmarking#Research release#Benchmark
精选理由
论文有具体方法与数字,HKR 只过 K;但它属于“传统科学/医疗 + AI”交叉,正文也没给出 agent、产品或行业落地含义,触发硬排除规则 4。按规则 importance 需压到 40 以下,tier 设为 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于结构健康监测的混合频谱-时序融合框架
该论文提出 Spectro-Temporal Alignment 与 Hybrid Spectro-Temporal Fusion 两个框架,用到达时间间隔描述符结合频谱特征做结构健康监测,并在 LDS V406 振动台数据上优于传统输入方案。摘要给出两档时间分辨率:Δτ=0.02更利于传统机器学习,Δτ=0.008更利于深度学习。真正值得盯的是,作者还用均值、标准差、变异系数和平衡分数评估稳定性;正文未披露具体模型配置与绝对指标。
#arXiv#LDS#Research release
精选理由
论文有具体机制与 Δτ 条件,HKR 只命中 K。它属于传统工程场景把 AI 当工具的研究,且结构健康监测门槛高、没有代理或产品外溢,按硬排除规则列为 excluded,分数封顶 39。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
ENTIRE:基于学习的体渲染时间预测
ENTIRE 用深度学习预测体渲染时间,并在 CPU、GPU 与是否启用单次散射等条件下评估。方法先提取体数据结构特征,再结合分辨率、相机配置和传输函数做预测;摘要称推理很快、精度较高,但正文未披露误差数值。真正值得盯的是它可用少量样本微调到新场景,还展示了稳帧率调参与负载均衡两个案例。
#Fine-tuning#Tools#Research release
精选理由
文章有一层 HKR-K:方法路径具体,可验证,还提到少样本微调、稳帧率调参与负载均衡两个用例。硬排除规则 technical-accessibility fail 生效:体渲染性能预测门槛高,摘录未披露误差数值,对通用 AI 从业者的产品和模型判断帮助有限。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
SPaRSe-TIME:用显著性投影与低秩时序建模做高效可解释预测
SPaRSe-TIME 提出把时间序列预测拆成显著性、记忆、趋势 3 个分量,并用信息子空间投影替代对全部时间步的均匀处理。摘要称该方法在多种真实数据集上取得有竞争力的精度并显著降低计算复杂度,但正文片段未披露具体数据集名称、误差指标或降本幅度。真正值得盯的是它把可解释性直接绑定到分量贡献;别被标题骗了,随机性强的复杂多变量场景仍是短板。
#Interpretability#Inference-opt#Research release
精选理由
命中硬排除 technical-accessibility fail。题目和摘要都偏时间序列方法论文,门槛高,缺少给通用 AI 从业者的进入点。正文也没给出数据集、误差指标和算力节省,HKR 三轴都没立住。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
STCast:用于全球与区域天气预报的自适应边界对齐
STCast 提出自适应边界对齐与按月动态分配专家,用于全球、区域、极端事件和集合预报 4 类任务。论文给出两项机制:Spatial-Aligned Attention 做边界初始化与细化,Temporal Mixture-of-Experts 用离散高斯分布路由月度变量;摘要未披露参数规模与数据集细节。真正值得盯的是,它把区域边界从静态裁剪改成可学习对齐。
#arXiv#GitHub#Research release#Open source
精选理由
摘要有两处具体机制,HKR-K 成立。文章属于气象科学+AI 交叉研究,缺少 agent、产品或工作流外溢,触发硬排除 4;参数规模、数据集和提升幅度未披露,所以压到 34 分并排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Eluder dimension:把它局部化
论文在 generalized linear model classes 上建立了 eluder dimension 下界,并指出标准 eluder dimension 分析无法导出 first-order regret bounds。作者提出 localisation 方法;摘要称它能恢复并改进 Bernoulli bandits 经典结果,还给出 finite-horizon reinforcement learning 在累计回报有界条件下的首个 genuine first-order bounds。
#Reasoning#Research release
精选理由
命中硬排除:technical-accessibility fail。文章是 bandit/RL regret 理论推进,摘要给出具体新结论,但缺少产品、实验或可直接迁移的实践入口;对通用 AI 读者过深,分数封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于预测 COPD 骨骼肌结局的几何与量子核方法
论文在 213 只 COPD 动物队列上,用几何 SPD 描述符与量子核回归预测胫前肌重量、比力和肌肉质量。五折外层评估里,量子核岭回归用 4 个可解释输入取得最佳肌重结果,RMSE 4.41 mg、R² 0.62,优于紧凑经典基线的 4.68 mg、0.56。仅用生物标志物的 SPD 特征也优于岭回归,4.55 对 4.79 mg;低肌重筛查 ROC-AUC 达 0.91。
#Benchmarking#Research release#Benchmark
精选理由
命中硬排除:传统科学与 AI 交叉,且没有 agent、产品或产业落地含义。HKR 只有 K 成立,数据细节完整,但对 AI 从业者的讨论价值很弱,所以排除并压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
从经典到量子:将 Prometheus 扩展到三维与量子系统的无监督相变发现
论文把 Prometheus 从二维经典系统扩展到三维经典系统和量子多体系统,并在 3D Ising 的 L=32 晶格上把临界温度检测做到与文献值相差 0.01%。正文给出 Tc/J=4.511±0.005、临界指数精度≥70%,且以 p=0.72 识别出 3D Ising 普适类;在横场 Ising 模型上,Q-VAE 用复波函数与保真度损失把量子临界点检测误差做到 2%。真正值得盯的是,它不只找转变点,还在无序 TFIM 中抽出 ψ=0.48±0.08,并与理论值 0.5 一致。
#Benchmarking#Interpretability#Prometheus#Research release
精选理由
HKR-K 成立,因为稿件给出 Tc/J=4.511±0.005、2% 误差和 Q-VAE 设定。它命中“传统科学+AI 交叉”硬排除,主题是相变物理而非 agent 或产品,还叠加技术可达性偏低,所以定为 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用聚类与逻辑模型处理非 SCAR 条件下的 PU 分类方案
该研究提出一套两步法,在 SCAR 条件不满足时处理 PU 分类,并在 11 个真实数据集加 1 个合成数据集上评估。方法先用 2-means 聚类生成清洗标签,再把清洗出的正类与额外真实正样本并入逻辑回归,其余样本标为负类。真正值得盯的是复现条件很直白;标题已给出非 SCAR 场景,正文摘要未披露具体指标与数据集名称。
#Research release
精选理由
论文讨论 Non-SCAR 条件下的 PU 分类,方法是 2-means 生成清洗标签,再把清洗正类并入逻辑回归;摘要只给出 11 个真实数据集和 1 个合成数据集,未披露指标。主题过窄,缺少产品、Agent 或行业后果,触发技术可达性排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
DFedReweighting:面向目标的去中心化联邦学习重加权统一框架
论文提出 DFedReweighting,在去中心化联邦学习每轮末端按目标重加权聚合,以处理公平性与 Byzantine 鲁棒性。方法先用各客户端本地数据构造紧凑辅助集,评估目标性能指标 TPM,再经定制重加权策略 CRS 生成最终权重。作者称在 L-光滑且强凸条件下可线性收敛;摘要未披露实验增益数字,但已给出代码仓库。
#GitHub#Research release#Open source
精选理由
摘要有机制信息,HKR-K成立。题材聚焦去中心化联邦学习、公平性和Byzantine鲁棒性,正文未披露实验增益数字;对通用AI从业者门槛偏高,触发技术可达性排除,分数封顶39。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
表征学习中耦合流的连续极限
这篇 arXiv 论文把去中心化表征学习形式化为黎曼流形上的慢—快耦合动力系统,并在连续极限下证明离散空间转移一致收敛到过阻尼 Langevin 随机微分方程。论文还用 Itô-Poisson resolvent、随机版 LaSalle 不变性原理与联合 Lyapunov 泛函,证明权重无条件不发散,并严格对齐到空间测度的主特征子空间。真正值得盯的是结论边界:这是理论收敛与稳态特征分离结果,正文未披露实验规模、基准数据集与可直接复现代码。
#Reasoning#arXiv#Research release
精选理由
论文主张耦合流在连续极限下收敛到过阻尼 Langevin SDE,并证明权重不发散,但信息停留在高阶数学结论。触发 hard-exclusion「技术可达性失败」:缺少通用读者的进入点,也没有数据集、代码或代理/产品含义,重要性封顶 39。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Emotion Collider:用双曲镜像流形与反情绪反射恢复情感
论文提出 Emotion Collider(EC-Net),用双曲超图建模多模态情绪与情感,在模态缺失或噪声条件下提升标准基准准确率;摘要未披露具体提升数字。方法把模态层级编码到 Poincare 球嵌入,并用节点与超边双向消息传递做融合,再在双曲空间加入径向与角向解耦对比目标。真正值得盯的是鲁棒性来源:自适应超边保留跨时间步与跨模态高阶语义关系,这比单纯堆融合层更可复现。
#Multimodal#Benchmarking#Research release#Benchmark
精选理由
这篇论文有方法信息量,HKR-K 成立:正文至少交代了双曲超图、Poincare 球嵌入和缺模态鲁棒性机制。问题是任务很窄、摘要没给提升数字,且双曲几何细节对通用 AI 从业者门槛偏高,触发 technical-accessibility fail,所以 importance 封顶在 39 以下并归为 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
自适应坐标变换下 Hermite 逼近的收敛理论
论文在 arXiv 发布 v1,给出自适应坐标变换下 Hermite 展开的首个误差估计。核心机制是等价原理:在变换后基底逼近函数,等价于在 Hermite 基底逼近其 pullback;误差由 pullback 的正则性控制。作者还构造单调传输映射,使沿实轴衰减的光滑函数获得谱收敛率;真正值得盯的是,这把 normalizing flows 加速谱逼近的经验结果补上了理论框架。
#arXiv#Research release
精选理由
触发硬排除:technical-accessibility fail。文章讨论 Hermite 展开在自适应坐标变换下的收敛理论,首个误差估计和传输映射条件有学术价值,但门槛高,正文也没有产品、agent 或工程落点。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
Prior-Fitted Functional Flow:用于药代动力学的上下文生成模型
该论文提出 Prior-Fitted Functional Flows,用整个人群的稀疏不规则研究数据训练函数向量场,做零样本人群合成与个体轨迹预测,且无需手动调参。摘要给出的机制是引入文献语料构建先验,并对部分观测患者输出带校准不确定性的预测;数据规模、基准名称、误差指标正文未披露。真正值得盯的是它把群体先验和个体 forecasting 放进同一生成框架,这比单次 PK 曲线拟合更接近 foundation model 路线。
#Benchmarking#Research release
精选理由
论文给出一个清晰机制:用文献先验和稀疏人群数据训练生成式函数流,做 PK 人群合成与个体轨迹预测。它仍是药代动力学研究,正文未披露基准、样本量和误差指标;按“传统科学+AI 交叉且无产品/agent 含义”硬排除。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
StructRL:从分布式强化学习的学习动态中恢复动态规划结构
论文提出 StructRL,在分布式强化学习训练中用时间指标 t*(s) 重排状态采样,贴合类似动态规划的信息传播顺序。t*(s) 表示状态出现最强学习更新的时间;摘要称该排序与动态规划式传播一致。真正该盯的是采样机制,摘要未披露具体基准、增益幅度和计算开销。
#Research release
精选理由
这篇有一条可识别的新机制,HKR-K 成立;但它触发 technical-accessibility fail:distributional RL 与动态规划结构恢复门槛高,摘要也未披露基准、增益幅度和计算开销。按硬排除规则降为 excluded,分数压到 39 以下。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于自适应优化可重构智能表面的路径式量子元学习
论文提出一种分层多目标量子元学习算法,用历史成功率、能耗和当前数据率在量子路径间切换,以优化可重构智能表面(RIS)相位控制。方法把候选控制方向组织为量子神经网络层间路径,并用评分机制选每层最优路径;正文未披露频谱效率、收敛速度提升幅度等具体数值。真正值得盯的是,它不只检索旧配置,而是重组不同解的局部结构来适配新场景。
#Inference-opt#Research release
精选理由
触发 hard-exclusion-4:这是通信/物理系统优化论文,和 agent 或 AI 产品落地距离较远;也部分触发 technical-accessibility fail。HKR 只有 K 勉强成立,正文给了机制,没给提升幅度、基线或复现条件,重要性 capped 在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于实时天气分类的风格化神经网络架构
该论文提出3种神经网络架构,用图像实时分类晴天、雨、雪、雾4类天气。方法包括多尺度补丁的Multi-PatchGAN、仅保留前9层的Truncated ResNet50,以及加入Gram矩阵与注意力加权的变体。摘要称后两者超过现有最佳结果,并在多个公开数据库上泛化更强;具体数据集、指标与延迟正文未披露。
#Vision#Benchmarking#Research release#Benchmark
精选理由
这篇文章落入硬排除:传统领域任务与 AI 交叉,但没有 agent、产品或通用工作流外溢。HKR 三轴都弱,正文也缺少指标、数据集和实时延迟,信息密度不足,只能给 excluded。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K0·R0
04:00
7d ago
arXiv · cs.LG· atomEN04:00 · 04·21
用于偏微分方程参数空间外推的后期融合神经算子
该论文提出 Late Fusion Neural Operator,在4个 PDE 基准上相对次优方法把 RMSE 平均降低72.9%(域内)和71.8%(域外)。方法用 neural operator 学习潜在状态,再用稀疏回归单独注入参数信息,目标是把状态动力学与参数效应解耦。真正值得盯的是外推设定:对 advection、Burgers、1D/2D reaction-diffusion 都报告领先,但正文未披露这里的训练预算与推理开销。
#Benchmarking#Eva van Tegelen#Taniya Kapoor#Peter van Heijster
精选理由
论文有具体结果:4 个 PDE 基准上域内与域外 RMSE 平均下降 72.9% 和 71.8%,HKR-K 成立。分数仍给 excluded,因为它同时触发 hard-exclusion-technical-accessibility fail 与 traditional science + AI crossover:主题是数值 PDE 外推,正文也未披露训练预算与推理开销。
HKR 分解
hook knowledge resonance
打开信源
40
SCORE
H0·K1·R0
03:54
7d ago
● P1HuggingFace 论文 · takara 镜像· rssEN03:54 · 04·21
RARE:面向高相似语料的冗余感知检索评测框架
论文提出 RARE 框架评测高相似语料 RAG 检索,并在 RedQA 上把强基线的 4-hop PerfRecall@10 从 General-Wiki 的 66.4% 拉到 5.0%–27.9%。方法把文档拆成原子事实追踪冗余,再用 CRRF 分别给生成标准打分并做排序融合。真正值得盯的是,常规 QA 基准会低估能取到充分证据的检索器,也掩盖其在金融、法律、专利语料上的鲁棒性缺口。
#RAG#Benchmarking#Tools#Research release
精选理由
这篇稿子命中 HKR 三轴:有反直觉落差,有可复现数字,也有明确行业痛点。它是偏研究的评测框架,不是平台级产品发布,所以到 featured,但还不到必须当天全网跟进的 p1。
编辑点评
RedQA 把强基线 4-hop PerfRecall@10 压到 5.0%–27.9%,这不是检索器突然变差,是大家把“相似语料”这笔账算错太久了。
深度解读
RedQA 让强基线在 4-hop PerfRecall@10 上从 66.4% 掉到 5.0%–27.9%,我对这条的判断很直接:RAG 检索评测长期把“去重后的单一证据命中”错当成“足够支撑回答的证据命中”,所以一进金融、法律、专利这种高相似语料,分数就塌了。 这篇工作的价值,不在于又造了一个 benchmark 名字,而在于它把一个部署里天天遇到、论文里却经常被抹平的问题摊开了。现实语料不是 Natural Questions 那种“答案多半躲在唯一页面里”的设定。10-K、法规条文、专利族文本,本来就会反复改写同一事实。你拿传统 recall 去判,检索器明明找到了能回答问题的等价证据,却因为没命中标注的那几篇文档被扣分。这个误差会把系统往错误方向调:团队会继续堆 embedding、reranker、query rewrite,追逐 benchmark recall,结果线上用户问的还是“为什么这段明明答对了,系统却说没证据”。 我一直觉得,RAG 评测里最被低估的一层,不是生成,而是“证据充足”的定义。RARE 把文档拆成 atomic facts,再追踪冗余,方向是对的。因为高相似语料的问题从来不是 top-k 里有没有同主题文档,而是这些文档覆盖了多少独立事实、彼此差异在哪、缺口落在哪一跳。摘要里给了一个很扎眼的数:4-hop 情况下,General-Wiki 上 66.4%,到了 RedQA 只剩 5.0%–27.9%。这个落差已经不是小幅 domain shift,而是在说现有很多“强检索器”可能只擅长稀疏、低重复、答案边界清楚的公开 QA 分布。 这里有个文章外的背景。我记得过去一年不少 RAG stack 还是沿用 HotpotQA、2WikiMultihopQA、MuSiQue 这类多跳集,外加自建 FAQ 集做回归。它们对链路推理有用,但对冗余污染、近重复文档、版本漂移并不狠。行业里后来开始补 DocBench、LongBench、一些企业私域评测,但多数也更偏长上下文和问答质量,不是真正在检索层定义“等价证据”。所以 RARE 这条线我买账,它打的不是又一个 SOTA 排名,而是评测口径本身。 但我也有保留。第一,摘要只给了 PerfRecall@10 和方法名,没披露强基线到底是谁,是 BM25、Contriever、bge、E5,还是带 reranker 的两阶段系统;没这个信息,5.0%–27.9% 的解释空间很大。第二,CRRF 说是分别打分再做 rank fusion,听着像在降低 LLM 生成 benchmark 时的单点评判噪声,这个思路合理,但正文没给人工一致性、inter-annotator agreement,或者和简单 majority vote 的对比。我对所有“LLM 帮你造更可靠 benchmark”的说法都会先打个问号,因为过去 12 个月这类流程最大的问题从来不是能不能生成样本,而是能不能稳定地产生可审计的判定边界。第三,atomic facts 的切分成本不低。论文里如果没有给每篇文档的分解成本、标注自动化比例、跨领域迁移误差,这套框架在企业里就容易卡在评测构建阶段,而不是运行阶段。 说真的,这条对做企业 RAG 的人比对做通用检索的人更有用。很多团队还在拿公开 benchmark 的 Recall@k、MRR、nDCG 当采购指标,然后把线上事故归因到“模型幻觉”。我不太买这个归因。金融、法务、专利场景里,前半段常常先死在检索评测失真:系统取回 8 篇几乎同义的文件,少了那 1 条版本差异或条款例外,生成端再强也会踩坑。RARE 至少逼你把“等价冗余”和“关键差异”分开记账。 如果你现在在做内部知识库,我会把这篇当成一个提醒:先看你的 gold evidence 是不是把同义文本都当成不同失败样本,再看多跳问题里每一跳缺的是独立事实还是只是没命中指定文档。标题已经给出方向,正文没有披露更细的 benchmark 构造、成本和人工校验细节;在这些信息出来前,我会说这是一篇很对症的评测论文,但还不是能直接抄进生产流程的标准答案。
HKR 分解
hook knowledge resonance
打开信源
87
SCORE
H1·K1·R1
03:49
7d ago
HuggingFace 论文 · takara 镜像· rssEN03:49 · 04·21
从无监督视觉轨迹学习提升动作模型
Kai Xi 等提出从状态图像序列学习提升动作模型,条件是不观测动作标签。框架联合训练状态预测、动作预测和动作模型,并用 MILP 在轨迹子集上求逻辑一致解。实验覆盖多个领域,显示 MILP 校正能减少预测塌缩;正文未披露具体数据集规模。
#Vision#Reasoning#Kai Xi#Stephen Gould
精选理由
HKR-H 与 HKR-K 成立:设定有新意,MILP 校正机制具体。影响面偏窄,未披露数据集规模或 benchmark 数字,适合进 all,不到 featured。
编辑点评
这篇把神经预测拉回 PDDL 逻辑约束里,方向对;但没有规模和运行成本,离机器人世界模型还差一堵墙。
深度解读
Kai Xi 等人把 lifted action model 学习推进到无动作标签的图像轨迹上,并用 MILP 校正状态、动作和动作模型三类预测。这个判断我买一半:它抓住了神经规划学习里最烦人的塌缩问题,但正文给的信息还停在方法摘要层,没披露数据集规模、MILP 变量量级、每轮校正耗时,也没给出和纯神经 baseline 的具体差距。对 AI planning 圈的人来说,这些缺口不是细节,而是这条路线能不能离开 toy domains 的分界线。 这篇的技术姿势很老派,也很实用。模型不是只做视频下一帧预测,而是联合学三件事:图像到状态的预测、隐含动作的预测、lifted action model 的前提和效果。然后它把一小部分轨迹丢进混合整数线性规划,让求解器找一组逻辑一致的状态、动作和动作 schema,并尽量贴近神经网络原预测。MILP 解出来的伪标签再反过来训练网络。这个循环的核心价值不是“多模态”,而是把可组合的符号约束塞回学习过程,避免模型自己骗自己。 我一直觉得,action model learning 被 LLM 热潮遮住了,但它其实是 agent 落地的硬骨头。LLM agent 今天能调工具、写代码、点网页,很多时候靠的是文本先验和重试。到了物理或长程任务,系统必须知道“动作前提”和“动作效果”。STRIPS、PDDL 那套东西看起来古早,但它给的是可验证的因果结构。OpenAI、DeepMind、Google Robotics 近两年都在讲 video world model 或 VLA,RT-2、RT-X、Genie 这类工作更偏表示和策略泛化;这篇走的是另一条路:从视觉轨迹里抽出可规划的 lifted schema。它没那么性感,但更接近 classical planning 想要的接口。 MILP 这一步是亮点,也是我最担心的地方。混合整数规划能把“状态必须满足谓词一致性”“动作效果不能自相矛盾”这类条件写死,确实能救塌缩。问题是,它通常很贵。正文只说在轨迹子集上求解,没有披露子集大小、对象数量、谓词数量、动作 schema 数,也没说求解器超时策略。若一个 BlocksWorld 级别任务有几十个对象和少量谓词,MILP 还撑得住。若换成厨房、仓库或移动机器人场景,对象组合会爆。没有这些数字,我不会把它读成可扩展方案,只能读成“用离散优化给神经模型做 curriculum 和纠错”。 这里还有一个容易被忽略的评价问题。论文摘要说实验覆盖多个 domains,并显示 MILP correction 帮助模型逃出 local optima,收敛到 globally consistent solutions。可正文未披露 domain 名称、轨迹数量、图像复杂度、遮挡条件、随机化程度。若图像来自渲染环境,状态谓词和视觉特征之间的映射通常很干净;若图像来自真实摄像头,分割、遮挡、相机视角、物体同一性都会把“状态预测”这一步拖垮。2017 年到 2018 年那批自监督视觉工作,比如旋转预测、视频前景发现,证明了无标签信号能学到表示;但它们离可执行动作模型仍有很大距离。这里把视觉表示接到 lifted planning,是进步,但不是直接跨到现实机器人。 和 Dreamer、PlaNet 那类 latent dynamics 比,这篇的赌注更明确。Dreamer 系列学的是连续 latent world model,再通过 rollout 做控制;它强在端到端和样本效率,但弱在可解释 planning 接口。这个工作学的是符号动作模型,强在可检查、可组合、可交给 planner,弱在视觉到谓词的瓶颈和离散搜索成本。两者不是谁替代谁。若我是做 embodied agent,我会把它当成高层 planner 学习模块,而不是低层控制或通用视频模型。 我的 pushback 是:论文标题里的“unsupervised visual traces”容易让人高估自动发现能力。它没有动作标签,但不等于完全无先验。lifted action model 通常需要对象、谓词空间、类型或可枚举结构。正文摘要没有说明这些先验给了多少。若谓词集合是人工定义的,那它解决的是“从视觉轨迹和隐动作中归纳 schema”;若谓词也由模型自己发现,那难度大一个量级。标题已给出无动作观测,正文未披露谓词空间来源。这个点必须拆开,不然读者会把它误读成从原始视频直接学 PDDL。 我对这篇的最终判断偏正面,但边界很清楚。它像是在给神经 agent 补一块逻辑骨架,不是再造一个通用世界模型。若 PDF 里给出 SAT/MILP 变量规模、求解时间、对象数外推、真实图像实验,那分量会高很多。若实验只在小型合成域上成立,它仍然有研究价值,但更像规划学习社区的一块好拼图。对 practitioner 来说,最可借鉴的是“用求解器定期纠偏伪标签”这个训练机制,而不是马上照搬整个 MILP pipeline 上生产。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
03:39
7d ago
HuggingFace 论文 · takara 镜像· rssEN03:39 · 04·21
可辩驳推理与一阶 Plausible Logic
该文提出 17 条可辩驳推理原则,并定义一阶 Plausible Logic,称其满足 14 条必要原则且仅缺 2 条理想原则。正文称 PL 含 8 种推理算法,能覆盖文中示例;证明被放在待提交书稿 PRPL,本文未给出完整证明。真正值得盯的是,它试图在不引入概率数字的条件下,形式化“通常为真但可例外”的推理。
#Reasoning#Research release
精选理由
HKR-K 有一部分:正文给出 17 条可辩驳推理原则、8 种算法,并说明完整证明未附。HKR-H 与 HKR-R 都弱,内容偏形式逻辑,缺少产品或 agent 落地,触发 technical-accessibility fail,按规则降为 excluded。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H0·K1·R0
03:35
7d ago
r/LocalLLaMA· rssEN03:35 · 04·21
Gemma 4 对比 Qwen3.5 122A10:真实使用体验
一名 Reddit 用户比较了 RedHatAI 的 gemma-4-31B-it-FP8-block 与 Sehyo 的 Qwen3.5-122B-A10B-NVFP4,称两者都占用约 90GB VRAM。帖文称 Gemma 4 在金融摘要里更简洁,且抓住“resort facility”和“higher-than-expected recoveries”等关键信息;Qwen3.5 在 agentic coding 更好,Gemma 4 有时会中途停住。别把它当基准测试,正文只有单用户案例和截图。
#Agent#Code#Benchmarking#Red Hat AI
精选理由
这篇有一点实测价值:同为约90GB VRAM 下,Gemma 4 和 Qwen3.5-122B 在金融摘要与 agentic coding 上出现分化。问题是证据只有单用户截图与个例,正文未披露统一任务、时延、吞吐或价格,HKR 主要命中 K/R,够进 all,不够 featured。
编辑点评
这帖只给出 1 个用户、2 个任务、约 90GB 显存,我不拿它判胜负;我倒觉得它意外证实了一个老问题:本地模型现在先撞上的不是参数量,是量化后任务稳定性。
深度解读
帖子作者用约 90GB 显存跑了 2 个量化模型,并给出 1 组金融摘要截图和 1 个 agentic coding 体感结论。我的判断很直接:这不是谁强谁弱的证据,这更像一次把“量化后模型性格差异”暴露出来的现场记录。 先说结论部分。gemma-4-31B-it-FP8-block 在这位用户手里,金融摘要更短、更抓关键短语;Qwen3.5-122B-A10B-NVFP4 在 agentic coding 更顺,Gemma 4 还会中途停住。问题在于,正文没披露提示词、上下文长度、采样参数、工具调用链、停止词、并发设置,也没给重复跑的次数。少了这些条件,任何“Gemma 更适合金融”“Qwen 更适合 coding”的判断都没法复现。标题给出了 real usages,正文其实还是 anecdote。 我对这条有兴趣,不是因为它证明了 Gemma 4 赢了 Qwen 3.5,而是它踩中了本地部署里很常见的一件事:同一档显存预算下,大家比的已经不是公开榜单分数,而是量化之后还剩多少任务一致性。31B FP8 和 122B A10B NVFP4 被压到差不多 90GB VRAM,这本身就说明“可用模型”与“原始参数量”早就不是一回事。过去一年 LocalLLaMA 里反复出现同样的故事:账面更大的模型,经过激进量化后,代码和 agent 流程未必稳定;账面更小、量化更保守的模型,在摘要、抽取、分类这类短链路任务里反而更省心。我没看到这帖把变量控住,但现象方向我买账。 再补一点文章外的上下文。Qwen 系模型这两代在社区里一直有个比较稳定的口碑:代码、工具使用、多步跟随通常偏强,尤其在大家自己搭 agent scaffold 时,经常比通用聊天风格模型更听指令。我印象里 Qwen 3.x 之后,这个倾向越来越明显。Gemma 这边,Google 系模型常见优点是摘要和表述收束得更快,句子更干净,缺点是长任务持续性和停止条件偶尔会出怪问题。我自己没跑过这两个具体量化版本,所以不敢把锅直接甩给基座模型,也可能是量化方案、推理后端,甚至 chat template 造成的。Red Hat AI 的 FP8 block 和社区版 NVFP4,压法就不是一回事。 我对“Gemma 4 有时中途停住”这句会更警觉一点,因为这类症状通常不是小瑕疵。对 agentic coding 来说,中途停住会直接把成功率打穿,远比摘要里漏一个短语更致命。问题是正文没说停住发生在第几步,是达到 max tokens、误触 stop sequence、工具回传后上下文错乱,还是模型在低比特量化下出现了退化。如果是停止词或模板问题,那不是模型能力问题;如果是量化导致的长程规划退化,那就很伤。两者差别很大,帖里没给证据。 金融摘要那组例子也要泼点冷水。作者提到 Gemma 抓住了“resort facility”和“higher-than-expected recoveries”,Qwen 漏了 material detail。这个观察有参考价值,但只够说明这条样本里 Gemma 更合作者预期,不够说明它在金融文本上系统性更好。做过摘要评测的人都知道,单条样本极容易被提示词措辞、长度偏好、系统消息里的“be concise”之类设定带偏。很多模型不是看不懂,而是在压缩目标下主动丢掉它觉得次要的信息。你如果把摘要目标从 concise 改成 risk-focused,结果常常会翻转。 这帖还有个更现实的信号:本地推理用户已经开始接受“不同任务绑不同模型”这件事了。以前大家爱问哪个开源模型是 all-round winner,现在越来越像路由问题:金融摘要用一个,agent coding 用一个,显存预算固定在 80 到 96GB 这一档,再看哪个量化版本最稳。这跟 2024 年大家迷恋单榜单总分已经不是同一个阶段。说真的,这反而比截图里谁赢谁输更有信息量。 如果你真想从这帖里拿到可执行结论,我会先要求 4 个补充:同一 prompt 重跑至少 10 次;公开 temperature、top-p、max tokens;说明推理引擎和 chat template;给一组长任务日志,标出 Gemma 4 停住的位置。没有这些,结论最多是“这位用户这台机器上的一次体验”。我不觉得这条能改写模型排序,但它提醒了所有做本地部署的人:量化规格、模板和停止条件,常常比参数表更决定你今天能不能把活跑完。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
02:11
7d ago
持续报道 · 2dHacker News 首页· rssEN02:11 · 04·21
概率语言Trie实现KV缓存顺序压缩突破香农极限
Gregory Magarshak 提出两层顺序 KV Cache 压缩架构,论文称相对 TurboQuant 的理论压缩比约 91.4 万倍。方法由概率前缀去重与预测残差编码组成,并给出每 token 熵上界 3.3 至 4.3 bit,前提是英文文本困惑度约 10 至 20。真正该盯的是结论仍停在理论证明;正文未披露实验结果、实现开销与实际吞吐。
#Inference-opt#Memory#Gregory Magarshak#arXiv
精选理由
标题里的“超 Shannon 极限、91.4 万倍”有点击钩子,正文也给出概率前缀去重、预测残差编码和 3.3–4.3 bit/token 上界。问题在于内容停在高门槛理论证明,未披露实验、吞吐和实现成本,触发技术可达性排除,重要性封顶。
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H1·K1·R0
01:46
7d ago
Hacker News 首页· rssEN01:46 · 04·21
预测市场正在抢先爆出新闻,并成为独立报道条线
Nieman Lab 在 2026 年一篇文章中称,预测市场正在先于传统报道暴露新闻线索,并形成独立报道条线。RSS 只给出标题、链接、15 个 HN 积分和 2 条评论;正文未披露具体案例、平台名称、时间范围与验证方法。别被标题带跑,真正该盯的是它是否给出可复现样本。
#Nieman Lab#Commentary
精选理由
标题有反常识钩子,HKR-H 成立。可输入内容只有标题与少量元数据,正文未给出案例、平台、时间范围或验证方法,HKR-K 失手;题材又偏媒体评论,行业共鸣弱,按 hard-exclusion zero-sourcing 封顶在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H1·K0·R0

更多

频道

后台