ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-04-25

35 items · updated 3m ago
RSS live
2026-04-25 · 星期六2026年4月25日
23:44
48d ago
● P1Hacker News 首页· rssEN23:44 · 04·25
DeepSeek-V4 发布当天,SGLang 和 Miles 就接好了推理和 RL 训练
SGLang 和 Miles 团队在 DeepSeek-V4 发布当天就完成了推理和强化学习训练的适配,覆盖了 1.6T 参数的 Pro 版和 284B 参数的 Flash 版。V4 模型用了混合稀疏注意力,把滑动窗口和两种 KV 压缩(4:1 或 128:1)混在一起,撑住了 100 万 token 的上下文窗口,专家权重还用了 FP4 精度。系统上...
#Inference-opt#Reasoning#Fine-tuning#LMSYS
精选理由
我会先打个折:这篇不是给所有人看的,系统细节多,普通读者容易走神。但它的钩子够硬——V4 发布当天就有推理加验证 RL 的工程栈,而且把上下文长度、压缩比、注意力窗口这些直接影响成本和稳定性的数字都摊开了。ShadowRadix 那部分虽然正文没展开实现细节,但点出了多池一致性这个真正难啃的骨头,对做部署和调优的人比单纯跑分更有参考价值。
一句话点评
SGLang 和 Miles 在 DeepSeek-V4 发布当天就接好了推理和 RL 训练,首发即用,不用等适配。
锐评
这条博客讲的是工程落地,不是模型评测。SGLang 和 Miles 团队在 V4 发布当天就完成了推理和强化学习训练的适配,覆盖了 1.6T 参数的 Pro 版和 284B 参数的 Flash 版。V4 模型本身用了混合稀疏注意力,把滑动窗口和两种 KV 压缩(4:1 或 128:1)混在一起,撑住了 100 万 token 的上下文窗口,专家权重还用了 FP4 精度。系统上,他们搞了个叫 ShadowRadix 的机制,能在三种 KV 缓存池和两种压缩状态池之间保持一致性,这是让长上下文跑起来的关键。 博客里放了一张对比图,显示 SGLang 在 30K token 的《红楼梦》片段上,解码吞吐量比另一个开源引擎高。但要注意,这是他们自己测的,对比的“另一个引擎”没点名,测试配置也说是按官方配方尽力调的,具体公平性得打个问号。正文没披露延迟数据,也没说在真实多轮对话场景下的表现。 RL 训练这边,他们支持了 FP8 训练和全并行策略,但只给了一个训练结果图,没给收敛曲线、训练成本或与 V3 的对比。整体看,这套工具链对想第一时间用上 V4 的团队是实打实的便利,但性能数据目前只有单方口径,缺第三方复现和更多场景的验证。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
22:39
48d ago
Hacker News 首页· rssEN22:39 · 04·25
特朗普解雇美国国家科学基金会全部24名监督委员会成员
特朗普解雇了美国国家科学基金会(NSF)的全部24名监督委员会成员。正文被Cloudflare 403页面拦截,没有披露法律依据、成员名单或后续安排。信息缺口:不清楚这是否合法、是否立即生效、以及NSF的日常拨款和项目审批是否会受影响。
#Trump#U.S. National Science Foundation#Cloudflare#Policy
精选理由
标题给了一个高冲突的新闻钩子——Trump 解雇 NSF 全部 24 名监督委员,但正文被 Cloudflare 403 墙挡住,没有任何实质信息。H 因为标题本身够尖锐,K 只有一条可确认事实(24 人全被炒),R 虽然 NSF 管科研经费,但正文没提对 AI 项目的影响,所以整体落在一般政策新闻的区间。
一句话点评
正文被 Cloudflare 拦了,信息缺口很大。
锐评
标题说特朗普解雇了 NSF 全部 24 名监督委员会成员,但正文被 Cloudflare 403 拦截,没披露法律依据、成员名单或后续安排。关键缺口:不清楚这是否合法、是否立即生效、以及 NSF 的日常拨款和项目审批是否会受影响。如果属实,这比换 NSF 主任更激进——监督委员会负责审批重大资助方向和预算,全员解雇等于直接切断 NSF 的治理链条。但正文没给任何细节,建议先观望,等 Science 或 NSF 官方出完整报道再判断影响。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
21:46
48d ago
r/LocalLLaMA· rssEN21:46 · 04·25
同样显存,选大模型低精度还是小模型高精度?
Reddit 用户抛出一个本地部署的经典选择题:Qwen3.5 122B 压到 2-bit(36.6GB)和 Qwen3.5 35B 跑 8-bit(36.9GB),显存占用几乎一样,哪个写代码和调工具更强?还顺带问 Kimi 2.6 这种超大模型压到 1-bit 能不能打赢同显存下的小模型高精度版。帖子只提了问题,没给任何测试结果或 benchmar...
#Code#Tools#Inference-opt#Qwen
精选理由
Reddit 用户抛出一个经典选择题:同样约 36GB 显存,是选 Qwen3.5 122B 的 2bit 超低精度版,还是 Qwen3.5 35B 的 8bit 高精度版?问题聚焦在编码和工具调用上,还追问 Kimi 2.6 这类大模型 1bit 是否比小模型高精度更好。可惜正文只给了模型体积,没披露任何测试结果或基准,所以这个讨论目前只有问题没有答案。
一句话点评
本地部署的经典二选一:大模型压到极低精度,还是小模型跑高精度?
锐评
Reddit 用户抛出一个本地部署的经典选择题:Qwen3.5 122B 压到 2-bit(36.6GB)和 Qwen3.5 35B 跑 8-bit(36.9GB),显存占用几乎一样,哪个写代码和调工具更强?还顺带问 Kimi 2.6 这种超大模型压到 1-bit 能不能打赢同显存下的小模型高精度版。 帖子只提了问题,没给任何测试结果或 benchmark。目前社区共识是:极低精度(2-bit 以下)对推理和代码任务伤害很大,尤其是工具调用这类需要精确输出格式的场景。如果是真的,122B 压到 2-bit 可能还不如 35B 的 8-bit 靠谱。但正文没披露具体测试方法或量化工具版本,这点先别太激动。 缺的是同场景下的实测对比,比如 HumanEval 或 BFCL 的分数。如果只看显存占用,122B 的 2-bit 确实诱人,但实际效果要打问号。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
20:15
48d ago
r/LocalLLaMA· rssEN20:15 · 04·25
双路 RTX 6000 跑长测,但帖子正文被屏蔽了
Reddit 上有人发帖说正在用两张 RTX 6000 做长时间跑分测试,但正文被 Reddit 的防火墙拦了,看不到具体跑了什么模型、显存占用、吞吐量或测试时长。目前只有标题这一条信息,其他细节全缺。
#Benchmarking#Inference-opt#Reddit#Benchmark
精选理由
只有标题能用:一台2张RTX 6000的机器在跑长时间基准测试,但没有任何可复现的指标。HKR-R通过,HKR-H和HKR-K不通过,所以这条信息价值低,不值得推荐。
一句话点评
帖子正文被 Reddit 防火墙拦截,目前只有标题,没有实际测试数据。
锐评
Reddit 用户发帖称正在用两张 RTX 6000 做长时间跑分测试,但正文被 Reddit 防火墙拦截(403),看不到具体跑了什么模型、显存占用、吞吐量或测试时长。目前只有标题这一条信息,其他细节全缺。对于关注双卡推理性能的从业者来说,这个标题本身有参考价值——RTX 6000 是专业卡,双卡配置常用于本地跑大模型,但缺少关键数字(如模型大小、batch size、token/s),无法判断实际表现。正文没披露任何测试参数,也没有截图或日志,建议等楼主更新或直接去原帖评论区追问。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
20:04
48d ago
Hacker News 首页· rssEN20:04 · 04·25
黑帽 LLM:Nicholas Carlini 的攻防演示视频
Nicholas Carlini 发了一个视频,讲怎么黑 LLM(大语言模型)。目前 HN 上只有 3 个点赞、0 条评论,热度不高。视频标题是“黑帽 LLM”,但正文没披露具体演示了哪种攻击、运行时长或安全发现,信息缺口比较大。如果你关心 LLM 安全攻防,可以先收藏,等评论区或后续讨论补上细节。
#Safety#Nicholas Carlini#Safety/alignment
精选理由
标题有 Carlini 背书,但信息量极低:只有一条视频链接,HN 热度几乎为零。正文没披露视频时长、具体攻击方法或安全结论,没法判断实际价值。如果是 Carlini 的完整 talk 值得看,但当前条目只是一个低信息量的视频入口。
一句话点评
Carlini 的黑帽 LLM 视频,目前热度极低,信息缺口大,先收藏等后续。
锐评
Nicholas Carlini 发了视频讲怎么黑 LLM,标题很唬人叫“黑帽 LLM”,但 HN 上只有 3 个点赞、0 条评论,热度基本为零。正文没披露具体演示了哪种攻击(提示注入、越狱还是数据投毒?)、跑了多久、发现了什么安全漏洞,信息缺口很大。Carlini 本人是知名安全研究员,内容可能有干货,但这点先别太激动——视频本身没给摘要,评论区也没人讨论,目前没法判断是技术演示还是概念科普。如果你关心 LLM 安全攻防,可以先收藏,等后续讨论补上细节再决定要不要看。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
19:15
48d ago
Dwarkesh Patel 访谈· atomEN19:15 · 04·25
小册子、报纸和杂志的诞生——Ada Palmer
这条视频标题讲的是三种媒体形式的历史,但正文完全空白,没有日期、没有具体观点、也没有任何AI相关的内容。所以只能告诉你:标题说的是小册子、报纸和杂志的诞生,主讲人是历史学家Ada Palmer。其他信息一概没有,没法判断它跟AI有什么关系。
#Ada Palmer#Commentary
精选理由
正文为空,标题讲的是历史媒介,不是 AI 产品、模型、研究或行业决策。HKR 三项全不满足,属于跟 AI 几乎无关的噪音。
一句话点评
标题讲媒体史,但正文空白,跟AI无关。
锐评
这条视频标题是历史学家Ada Palmer讲小册子、报纸和杂志的诞生,但正文完全空白,没有日期、观点或任何AI相关内容。信息缺口:无法判断它跟AI有什么关系,可能是标题党或RSS抓取错误。对AI从业者来说,除非你想研究历史上的信息传播模式如何类比今天的AI内容分发,否则这条可以直接跳过。
HKR 分解
hook knowledge resonance
打开信源
18
SCORE
H0·K0·R0
17:40
48d ago
● P1Hacker News 首页· rssEN17:40 · 04·25
一个没受过专业数学训练的 23 岁年轻人,用 ChatGPT 的一条提示词解决了一道 60 年未解的 Erdős 猜想
Liam Price 没有高等数学背景,靠 ChatGPT Pro 的 GPT-5.4 Pro 模型,只输入了一次提示词,就给出了一个关于“原始集合”的证明,并贴在了 erdosproblems.com 上。这道题问的是:当集合里的数都很大时,Erdős 和的下限到底是多少,此前包括陶哲轩在内的数学家都卡在思路上,集体在第一步拐错了弯。Price 的 ...
#Reasoning#Liam Price#OpenAI#Terence Tao
精选理由
HKR三项全中:业余选手加一句提示破60年老题,故事性极强;模型名和证明网站都是可核验的新信息;话题正好踩在推理与专业知识的争议点上。扣到86分是因为正文截断了,没给出完整猜想内容和评审进展,这两块信息缺口让我没法打更高。
一句话点评
一个没受过高等数学训练的 23 岁年轻人,用 ChatGPT 一条提示词就解出了陶哲轩等人都卡住的 60 年难题,但正文没披露完整猜想和同行评审状态,这点先别太激动。
锐评
这条新闻最值得点开的地方是:一个数学外行靠一条提示词,就让 GPT-5.4 Pro 给出了一个关于“原始集合”的证明,而且用的方法人类数学家集体没想到。陶哲轩的原话是,大家“在第一步就集体拐错了弯”,说明问题本身可能没想象中那么难,只是存在某种思维定式。 但正文有几处关键信息是缺失的。第一,Price 到底输入了什么提示词,文章没给。第二,这个证明是否通过了同行评审,也没提,目前只是贴在 erdosproblems.com 上。第三,Erdős 问题的难度和重要性参差不齐,之前不少 AI 解出的题后来被发现有水分,所以单凭这一例还不能说 AI 在数学推理上有了质变。 我会先打个折:这更像是一次漂亮的“外挂式”灵感触发,而不是模型独立完成了严谨的数学研究。真正值得关注的是,这种新方法有没有可能推广到其他问题上,但文章自己也说“现在下结论还太早”。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
17:17
48d ago
● P1TechCrunch AI· rssEN17:17 · 04·25
OpenAI 老板就加拿大枪击案向小镇居民道歉,公司事前已标记过凶手账号但没报警
Sam Altman 给加拿大 Tumbler Ridge 镇的居民写了一封道歉信,说公司“深感抱歉”。事情是这样的:18 岁的 Jesse Van Rootselaar 被警方认定为一起大规模枪击案的嫌疑人,造成 8 人死亡。而 OpenAI 早在 2025 年 6 月就发现她的 ChatGPT 账号在聊枪支暴力内容,当时就封了号。内部员工争论过要不...
#Safety#OpenAI#Sam Altman#Jesse Van Rootselaar
精选理由
三条都踩中了:CEO 为 8 条人命道歉,说明事情够大;账号提前被封、内部讨论过报警却没行动,这些新细节把责任链串起来了;而且这直接关系到 AI 公司以后遇到类似情况要不要、什么时候通知执法部门,是当天必须写的安全与责任事故。
一句话点评
OpenAI 在枪击案发生前就封了嫌疑人的 ChatGPT 账号,但没报警。道歉信承认了这点,但没解释为什么内部争论后还是选择沉默。
锐评
Sam Altman 给加拿大一个小镇的居民写了道歉信,因为 OpenAI 在 2025 年 6 月就发现嫌疑人用 ChatGPT 聊枪支暴力内容,封了号,却没通知警方。今年 4 月,这名 18 岁嫌疑人被指造成 8 人死亡。道歉信说公司“深感抱歉”,但正文没披露当时内部争论的具体分歧点是什么,也没说现在改了哪条流程。 这件事把 AI 公司的安全责任推到了台前:发现危险信号后,除了封号,要不要主动报警?OpenAI 显然选了不报,结果出了人命。道歉是事后表态,但关键缺口在于,他们没公布当时的决策记录,也没说明今后遇到类似情况会怎么处理。这点先别太激动,等看到具体整改措施再判断。
HKR 分解
hook knowledge resonance
打开信源
91
SCORE
H1·K1·R1
15:42
48d ago
r/LocalLLaMA· rssEN15:42 · 04·25
llama.cpp 终于支持 FP4 推理了,NVFP4 和 MXFP4 两种格式落地
llama.cpp 和 ik_llama.cpp 分别合并了 NVFP4 和 MXFP4 推理代码,意味着本地跑模型可以用 4-bit 浮点精度了。FP4 比常见的 INT4 或 FP8 更省显存,理论上能让大模型在更低端显卡上跑起来。但正文被 Reddit 登录墙挡住了,没披露速度、显存占用和具体支持的硬件。所以先别太激动——精度损失和实际吞吐量还得...
#Inference-opt#llama.cpp#ik_llama.cpp#Reddit
精选理由
标题有钩子,但正文只有 Reddit 403 和标题,没有吞吐、显存、硬件或精度损失数据,所以分数压在 60–71 区间。
一句话点评
FP4 推理落地 llama.cpp,但正文被 Reddit 登录墙挡住,速度、显存、硬件支持全没披露。
锐评
llama.cpp 和 ik_llama.cpp 分别合并了 NVFP4 和 MXFP4 推理代码,意味着本地跑模型终于能用 4-bit 浮点精度了。FP4 比常见的 INT4 或 FP8 更省显存,理论上能让大模型在更低端显卡上跑起来——比如 8GB 显存可能跑 70B 模型。但正文被 Reddit 登录墙挡住了,没披露速度、显存占用和具体支持的硬件(比如是否只限 Ada Lovelace 或 Blackwell)。所以先别太激动:FP4 精度损失比 INT4 小,但实际吞吐量、量化后模型质量、以及是否支持所有架构,都得等人跑 benchmark。如果真能无损压缩,本地部署成本会降一截,但验证数据还没出来。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
14:00
49d ago
彭博科技· rssEN14:00 · 04·25
美国创业公司用AI查土地里的中国关联,Bloomberg说这门生意越做越大
Bloomberg报道了犹他州一家叫Strider的创业公司,他们用AI平台去查美国土地所有权里有没有中国背景。文章标题很唬人,但正文基本只有导航和标题,没披露具体怎么查的、客户是谁、赚了多少钱、准确率多高。从业者可以确认这个场景确实存在——用公开数据做国安背景调查,但模型能力到底行不行,这篇报道给不出答案。
#Tools#Strider#Bloomberg#Commentary
精选理由
HKR-H 和 HKR-R 通过:标题有私人 AI 情报的钩子,也踩了安全/地缘政治神经。HKR-K 不通过:正文只有标题和导航,没有机制或指标,信息不够支撑判断。
一句话点评
标题党,正文没干货。
锐评
Bloomberg 报道了犹他州创业公司 Strider,说他们用 AI 平台查美国土地所有权里的中国背景。标题很唬人,但正文只有导航和标题,没披露具体怎么查的、客户是谁、赚了多少钱、准确率多高。从业者可以确认这个场景确实存在——用公开数据做国安背景调查,但模型能力到底行不行,这篇报道给不出答案。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
11:33
49d ago
r/LocalLLaMA· rssEN11:33 · 04·25
小米 MiMo V2.5 Pro 在 AI 评测榜排第 54,权重即将放出
Reddit 帖子标题说小米的 MiMo V2.5 Pro 在 Artificial Analysis Intelligence Index 上排第 54 名,并且权重即将发布。但正文被 Reddit 屏蔽了,看不到模型参数量、跑分细节或发布时间。第 54 名在几百个模型里算中上,但没披露具体跑分,没法判断它跟同梯队模型比到底强在哪。权重放出的话,本地...
#Benchmarking#Xiaomi#Artificial Analysis#Benchmark
精选理由
标题有开源权重钩子,也给了排名第 54 的具体位置,所以 H 和 K 通过。但正文只有 Reddit 403 页面,没披露权重发布日期、参数规模、许可证或评测细分,讨论基础薄弱,因此保留在 all 层级。
一句话点评
小米 MiMo V2.5 Pro 排第 54,权重快来了,但跑分细节全被 Reddit 吞了。
锐评
标题说小米 MiMo V2.5 Pro 在 Artificial Analysis 的模型榜单上排第 54,而且权重即将放出。第 54 名在几百个模型里算中上水平,但正文被 Reddit 屏蔽了,看不到参数量、具体跑分或发布时间。没有跑分细节,没法判断它跟同梯队模型比到底强在哪。权重放出的话,本地部署又多一个选择,但实际效果得等跑分或实测出来才能下结论。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R0
11:16
49d ago
Hacker News 首页· rssEN11:16 · 04·25
LamBench:用λ演算给大模型排座次,GPT-5.4 第一
LamBench 是一个用 λ 演算(函数式编程的数学基础)测试大模型推理能力的榜单,共 120 道题。GPT-5.4 答对 110 题排第一,Opus-4.6 和 GPT-5.3-codex 紧随其后,差距很小。榜单覆盖 21 个模型,从 91.7% 到 11.7% 都有,但正文没披露题目具体怎么设计的、评分脚本和复现条件,所以排名参考价值要打个折扣。
#Reasoning#Code#Benchmarking#Victor Taelin
精选理由
HKR 三项都过,但正文基本就是个排行榜,没披露任务构造、评分脚本和复现条件,信息缺口明显。所以放在 all 档,不到 72+ 的精选线。
一句话点评
GPT-5.4 在 λ 演算推理榜上以 91.7% 胜出,但题目设计和评分细节未公开,排名需谨慎看待。
锐评
LamBench 用 120 道 λ 演算题测了 21 个模型的推理能力,GPT-5.4 答对 110 题(91.7%),Opus-4.6 和 GPT-5.3-codex 分别以 108 和 107 紧随其后,差距很小。λ 演算是函数式编程的数学基础,能测模型对递归、高阶函数的理解,比普通代码题更底层。但正文没披露题目怎么设计的、评分脚本和复现条件,也没说是否允许模型多次尝试或使用外部工具。这些信息缺口让排名参考价值打折扣——比如 GPT-5.3-codex-spark 只答对 14 题(11.7%),可能是版本或配置问题,而非能力差。榜单覆盖从 91.7% 到 11.7% 的宽范围,但缺乏验证细节,建议等开源代码和评分标准后再做判断。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
11:02
49d ago
新智元 · 公众号· rssZH11:02 · 04·25
Anthropic让Claude替人做了186笔交易,Opus版本多赚70%
Anthropic搞了个实验,让Claude代替人类执行186笔买卖操作,结果用Opus版本比人类自己操作多赚了70%。但正文只显示了微信验证页面,没披露实验设置、基准线、指标定义这些关键信息——比如交易品种、本金多少、风险控制怎么做的,都没说。所以这个70%的收益提升到底靠不靠谱,得打个问号。
#Agent#Reasoning#Anthropic#Claude
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过:可见内容只有标题那几个数字,没有实验设置、基线和指标定义。Anthropic 的 agent 交易实验值得讨论,但信源太薄,不适合上推荐位。
一句话点评
标题说Claude替人做买卖多赚70%,但正文只有微信验证页,关键信息全没披露。
锐评
Anthropic这个实验听起来挺唬人:Claude替人类执行186笔买卖,用Opus版本比人类自己操作多赚70%。但正文只有微信验证页面,实验设置、基准线、指标定义全没披露——交易品种是什么、本金多少、风险控制怎么做、70%是相对什么基准算的,一概不知。这个数字目前只能当个营销话术看,别急着当真。如果实验是真的,那186笔交易样本量不算大,金融交易里运气成分影响不小,70%的收益提升可能只是特定条件下的结果。另外,用Opus做交易的成本远高于人类操作,这点正文也没提。想验证这个结论,至少需要知道交易标的、回测周期、夏普比率、最大回撤这些指标。目前信息缺口太大,建议等Anthropic放出完整论文或实验报告再下判断。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
11:02
49d ago
新智元 · 公众号· rssZH11:02 · 04·25
给大模型验DNA:微调和蒸馏的“血缘”藏不住了
一篇被ICLR 2026接收为Oral的论文,主题是检测大模型的“血缘关系”——也就是判断一个模型是不是从另一个模型微调或蒸馏出来的。正文被微信验证页挡住了,没披露具体方法、数据集、准确率或作者信息。目前只能确认研究方向是追踪模型之间的衍生关系,类似给模型做亲子鉴定。
#Fine-tuning#Interpretability#ICLR#Research release
精选理由
HKR-H和HKR-R都成立:标题的“DNA验亲”比喻和血缘溯源/模型来源角度都很强。HKR-K不成立,因为可读正文只有微信验证页,没有方法、数据集、准确率或作者信息。
一句话点评
正文被微信挡了,只能看标题。
锐评
标题说ICLR 2026 Oral接收了一篇给大模型做亲子鉴定的论文,能检测一个模型是不是从另一个微调或蒸馏出来的。方向有意思——模型溯源对版权审计、安全审查都有用,比如查某个开源模型有没有被偷偷蒸馏商用。但正文被微信验证页挡住了,方法、数据集、准确率、作者全没披露。目前只能确认有这个研究方向,具体效果和限制一概不知。如果真能高精度区分微调/蒸馏来源,对行业有价值;但如果是靠输出分布做统计,容易被后训练或量化破坏。等全文出来再判断。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
10:21
49d ago
r/LocalLLaMA· rssEN10:21 · 04·25
Shield 82M:一个专删个人信息的 8200 万参数小模型
Reddit 上有人发帖介绍 Shield 82M,一个 8200 万参数的小模型,专门用来从文本里剥离和过滤个人身份信息(PII,比如姓名、电话、身份证号)。参数规模很小,跑起来应该挺快,适合部署在本地或边缘设备。但帖子正文被 Reddit 屏蔽了,看不到数据集、许可证、评测指标和下载链接。目前没法判断它实际效果怎么样、能不能直接用。
#Safety#Reddit#Shield 82M#Product update
精选理由
标题透露了 82M 参数和 PII 过滤方向,对隐私合规从业者有吸引力,但正文只有 403 拦截页,没给数据集、许可证、评测指标或下载链接。信息缺口太大,只能确认方向,不能评估可用性,分数压在低价值区间。
一句话点评
帖子被 Reddit 屏蔽,正文全空,没法判断模型能不能用。
锐评
Shield 82M 是一个 8200 万参数的小模型,专门用来从文本里剥离姓名、电话、身份证号这类个人身份信息(PII)。参数小意味着跑得快,适合本地或边缘设备部署,这点先别太激动——帖子正文被 Reddit 返回 403 屏蔽了,数据集、许可证、评测指标、下载链接全没披露。目前只能知道有人发了这个标题,实际效果、能不能直接用都判断不了。如果后续有公开评测或代码,再关注不迟。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H1·K1·R1
08:53
49d ago
Hacker News 首页· rssEN08:53 · 04·25
Wuphf:给AI员工用的共享大脑,让Claude、Codex等模型协作干活
Wuphf 是一个开源项目,定位是“AI 员工的 Slack + 共享大脑”。它让多个 AI 模型(比如 Claude、Codex、OpenClaw)通过 Markdown 文件和 Git 共享上下文,协同完成复杂任务,且不会丢失对话历史。项目在 GitHub 上已有 94 颗星和 5 个 fork,但正文没披露具体架构、许可证或部署方式。思路挺有意思...
#Agent#Tools#Memory#nex-crm
精选理由
HKR 三项都过,但项目目前只是一个 GitHub 仓库标题加 94 星,没有架构、许可证、部署路径或测试结果。这是个有趣的小工具,不是 feature 级信号。
一句话点评
让多个AI模型共享一个Markdown/Git仓库当记忆,想法挺野,但94星说明还早。
锐评
Wuphf 的思路是把 Git 仓库当 AI 团队的共享黑板:Claude、Codex 这些模型通过读写 Markdown 文件来交换信息、记住上下文,不会聊着聊着就失忆。Git 天然带版本管理,能回溯谁写了什么,比纯对话窗口靠谱。但项目才 94 颗星、5 个 fork,属于非常早期的玩具。正文没披露架构细节、许可证类型,也没说怎么部署——是跑在本地还是云端?多个模型同时写一个文件时怎么处理冲突?这些都没讲。如果真能低成本让不同模型协作,对复杂任务(比如代码生成+测试+文档一条龙)挺有用,但现阶段验证太弱,别急着上生产。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
06:09
49d ago
机器之心 · 公众号· rssZH06:09 · 04·25
ICLR 2026获奖论文公布:两篇杰出论文,Alec Radford经典工作获时间检验奖
ICLR 2026公布了论文奖项,标题确认有两篇杰出论文和一项时间检验奖。但页面被微信验证拦截,正文没披露具体论文标题、作者、评选标准,也没说Radford哪篇工作获奖。信息缺口明显,目前只能知道获奖数量,没法判断含金量或方向偏好。
#Benchmarking#ICLR#Alec Radford#Research release
精选理由
H和R通过:ICLR奖项和Radford的时间检验奖有研究社区号召力。K弱:正文被微信验证页阻断,没披露论文题名、作者名单或评审标准。
一句话点评
ICLR 2026获奖名单出了,但正文被微信拦截,目前只知道有两篇杰出论文和一项时间检验奖给了Alec Radford。
锐评
标题确认了获奖数量:两篇杰出论文 + 一项时间检验奖,后者给了大神Alec Radford的早期工作。但正文被微信验证墙挡住,没披露具体论文标题、作者、评选标准,也没说Radford哪篇获奖。信息缺口明显,目前只能知道获奖数量,没法判断含金量或方向偏好。建议等官方或非微信渠道的完整名单再下结论,现在这点信息不值得激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
05:00
49d ago
● P1Latent Space· rssEN05:00 · 04·25
DeepSeek 发布 V4 Pro 和 Flash 模型,能在华为昇腾芯片上跑
DeepSeek 终于发了 V4 系列,一共两个型号:V4 Pro 总参数 1.6 万亿,每次激活 490 亿;V4 Flash 总参数 2840 亿,激活 130 亿。两个模型都支持 100 万 token 的上下文,用了新的压缩注意力技术,相比 V3.2,处理长文本时计算量只要 27%,显存占用只要 10%。这次比较特别的是同时发了基础版和指令版,...
#Reasoning#Code#Inference-opt#DeepSeek
精选理由
这条必须写。DeepSeek 这次放出的不只是模型,而是把华为昇腾兼容性摆上台面,等于在 CUDA 依赖上划了一刀。技术报告说 1M token 下只用 V3.2 27% 的算力、10% 的 KV 缓存,省得挺实在。两档参数和 MIT 许可也让落地门槛更低。我会先打个折:正文没提实际推理延迟和昇腾上的吞吐数据,这点先别太激动,但硬件独立性本身已经够重。
一句话点评
DeepSeek V4 发了两个型号,Pro 版 1.6 万亿参数但每次只激活 490 亿,Flash 版更轻量。最大看点是能跑在华为昇腾芯片上,长文本处理成本比 V3.2 省了 73% 算力。
锐评
DeepSeek 这次 V4 系列最值得关注的点不是跑分,而是它明确支持华为昇腾芯片。技术报告里说,在 100 万 token 的长文本场景下,新架构的算力消耗只有 V3.2 的 27%,显存占用更是降到 10%,这个效率提升相当实在。如果数据没注水,意味着用国产卡跑大模型的门槛又降了一截。 不过要打个折:正文没给出和 Kimi K2.6、GPT-5.4 这些同期模型的直接对比数据,只说“大致同级”。另外,虽然发了基础版和指令版,但推理能力到底怎么样,报告里没展开,得等第三方实测。华为昇腾的供应量目前也只有 H100 的四分之一,实际部署规模还得看产能。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
04:48
49d ago
量子位 · 公众号· rssZH04:48 · 04·25
华为乾崑智驾上车燃油SUV,全新奥迪Q5L要搞智能化
文章标题说全新奥迪Q5L会用华为乾崑智驾系统,让燃油SUV也能智能化。但正文只显示了微信验证页面,没披露任何具体功能、配置限制、价格或上市时间。信息缺口很大,没法判断这套智驾在油车上能跑多好。
#Agent#Huawei#Audi#Product update
精选理由
HKR-H通过,因为奥迪燃油SUV搭载华为智驾这个跨界合作本身是具体钩子。HKR-K不通过,正文只有微信验证页,配置、功能边界、价格、上市时间全没披露。HKR-R偏弱,对AI从业者来说缺少能力边界、成本或落地条件信息。
一句话点评
标题党,正文只有微信验证页,没任何干货。
锐评
标题说奥迪Q5L要用华为乾崑智驾,让燃油SUV智能化。但点进去只有微信环境异常验证页,正文一个字都没披露。目前能确认的信息为零:不知道用乾崑哪个版本、有没有激光雷达、油车供电和散热能不能撑住城区智驾、价格加多少、什么时候上市。来源是自媒体,且正文缺失,这条只能当传闻看。如果真落地,对燃油车用户是好事——不用换电车也能用上高阶智驾。但油车智驾的瓶颈在供电、散热和线控响应延迟,华为和奥迪怎么解决这些,正文全没提。建议等官方发布或实测再判断。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
04:00
49d ago
AI 群聊日报· atomZH04:00 · 04·25
GPT 5.5和5.5 Pro API正式上线可用
GPT 5.5 和 5.5 Pro API 正式上线,实测速度提升明显,中文黑话减少,但 5.5 比 5.4 贵,Pro 版价格不变,推测成本主要在推理机制。有用户用 Codex 跑 8 万行 PR 测试,已烧掉 6000 美元 token。Claude Design 被解读为 Claude Code 架构理念的跨岗位复制,本质是把代码领域的 AI 工...
#Agent#Code#Tools#OpenAI
精选理由
硬排除规则“零来源”适用:这是一份群聊日报,没有官方链接、可复现的测试或具名案例。GPT 5.5 如果是真的会是大事,但这里只是未经证实的聊天摘录,评分上限卡在 39。
一句话点评
GPT 5.5 快了不少,但比 5.4 贵;Pro 版价格不变,推测成本主要在推理机制。有用户用 Codex 跑 8 万行 PR 测试,已烧掉 6000 美元 token。
锐评
GPT 5.5 上线,实测速度提升明显(猫仔说以前一小时的工作现在半小时多完成),中文黑话减少。但价格倒挂:5.5 比 5.4 贵,5.5 Pro 却和 5.4 Pro 同价。冷静的麋鹿推测 Pro 的成本大头在推理机制而非基础模型,热情的狮子认为 Pro 本质是多个 base 模型给满推理预算的 ensemble。一位用户用 Codex 检查 8 万行 PR 并让另一个 Codex 从零实现,已烧掉 6000 美元 token——这个数字说明大规模代码审查的成本仍然很高。正文没披露 5.5 的具体定价和推理延迟数据,也没说明 Pro 的 ensemble 具体如何工作。Claude Design 被解读为 Claude Code 架构理念的跨岗位复制,但缺乏实际效果对比。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H1·K0·R1
03:17
49d ago
Hacker News 首页· rssEN03:17 · 04·25
VT Code:一个用 Rust 写的终端 AI 编程助手,支持多种模型
VT Code 是一个刚在 GitHub 上开源的 AI 编程助手,用 Rust 写的,跑在终端里(TUI),支持接入多种大模型。作者说它是“语义 AI 编程代理”,但正文没披露具体支持哪些模型、怎么调用工具、有没有做 agent workflow(让模型进业务流程干活),也没说安装步骤和许可证。目前能看到的就是仓库存在,核心能力还不清楚,先别太激动。
#Agent#Code#Tools#vinhnx
精选理由
这只是一个仓库上线的信号,不是可报道的发布。HKR-H 靠 Rust TUI 的钩子勉强通过;HKR-K 失败是因为帖子没披露任何提供商、工具调用设计、许可证或安装路径;HKR-R 缺乏工作流或性能方面的实质内容。
一句话点评
一个刚开源的终端AI编程助手,Rust写的,但正文没披露具体支持哪些模型、怎么调用工具,先别太激动。
锐评
VT Code 是一个刚在 GitHub 上开源的 AI 编程助手,用 Rust 写的,跑在终端里(TUI),支持接入多种大模型。作者说它是“语义 AI 编程代理”,但正文没披露具体支持哪些模型、怎么调用工具、有没有做 agent workflow(让模型进业务流程干活),也没说安装步骤和许可证。目前能看到的就是仓库存在,核心能力还不清楚,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
03:13
49d ago
彭博科技· rssEN03:13 · 04·25
中国警告美国出口法案可能打乱芯片供应链
中国官方表态,美国新提出的出口法案有打乱芯片供应链的风险。但正文没披露具体法案编号、管制手段、涉及哪些芯片品类,也没说时间表。目前信息量很少,基本就是标题那一句话,没法判断影响面有多大。
#China#United States#Bloomberg#Policy
精选理由
标题直接点出中美芯片政策冲突,从业者会关心。但正文几乎没内容,法案编号、限制机制、芯片范围和生效时间都没披露,这点先别太激动。出口管制确实影响算力供应和GPU定价,后续得盯法案文本和出口管制口径。
一句话点评
中国官方表态,美国新出口法案有打乱芯片供应链的风险。但正文没披露具体法案编号、管制手段、涉及哪些芯片品类,也没说时间表。目前信息量很少,基本就是标题那一句话,没法判断影响面有多大。
锐评
这条新闻信息量极低,基本只有标题一句话。中国官方表态美国新出口法案有打乱芯片供应链的风险,但正文没披露具体法案编号、管制手段、涉及哪些芯片品类,也没说时间表。来源是彭博社,但文章本身没有提供任何可验证的细节,连引用哪位官员、什么场合说的都没写。对于关注芯片管制的人,这条只能当个信号看——中方在持续表达不满,但具体影响面、是否涉及AI芯片或成熟制程、有没有反制措施,一概不知。建议等更详细的报道,目前不值得做任何判断。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
01:52
49d ago
FT · 科技· rssEN01:52 · 04·25
投资者要求 Oracle 140 亿美元数据中心债务提高收益率
Oracle 担保的 140 亿美元数据中心债务,投资者正在要求更高收益率。这笔债务规模很大,但正文没披露票息、期限、资产结构或时间表。关键信号是融资成本在上升,而不是 Oracle 这个品牌本身。
#Oracle#Funding
精选理由
FT标题给了一个具体钩子:投资者要求提高一笔Oracle背书、规模140亿美元的数据中心债务收益率,说明AI基础设施的融资端开始出现压力(HKR-H/R)。HKR-K受限是因为正文没披露票息、期限、资产结构和资金用途,信息缺口明显。
一句话点评
Oracle 担保的 140 亿美元数据中心债,投资者嫌利率低,要求加价。
锐评
核心信号是数据中心融资成本在涨,不是 Oracle 品牌出问题。140 亿美元规模很大,说明 Oracle 在重资产押注算力基建。但正文被 paywall 挡住,没披露票息、期限、资产结构或时间表,所以没法判断这波加价是市场整体利率上行,还是这笔债本身结构有瑕疵。关键缺口:不知道 Oracle 担保的具体条款——是全额担保还是部分信用增级,这直接影响风险定价。另外,投资者要求更高收益率,是二级市场交易折价,还是一级发行时认购不足?正文没写。对 AI 从业者来说,这条消息的实质是:算力军备竞赛的资本成本正在上升,后续可能挤压中小玩家的融资空间。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
00:00
49d ago
彭博科技· rssEN00:00 · 04·25
Oracle 一笔 160 亿美元的数据中心融资落地了
彭博这篇报道的正文被反爬页面挡住了,只能看到标题说 Oracle 搞定了 160 亿美元的数据中心融资。具体结构、出资方、建在哪儿、钱怎么花,正文都没披露。对 AI 从业者来说,能确认的只有金额和用途方向,没法推断会新增多少算力、什么时候投产。
#Oracle#Bloomberg#Funding
精选理由
标题说Oracle数据中心160亿美元融资获批,但点进去是Bloomberg的403反机器人页,融资结构、参与方、地点、用途全没写。AI从业者只能确认金额和对象,不能据此推断算力供给时间表。信息缺口太大,评分卡在低位。
一句话点评
160亿美元融资落地,但正文被反爬挡住了,具体出资方、建在哪、投产时间都不清楚。
锐评
Oracle 这笔 160 亿美元的数据中心融资确认通过了,金额很大,说明他们还在猛砸算力基建。但彭博正文被反爬墙挡住,出资方是谁、建在哪个州、钱是买 GPU 还是建厂房、什么时候投产,一概没披露。对 AI 从业者来说,能确认的只有“Oracle 确实在筹钱建数据中心”这个方向,但没法推断会新增多少算力、对云服务或模型训练成本有什么影响。信息缺口太大,这点先别太激动,等后续披露具体结构和时间表再评估。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
00:00
49d ago
彭博科技· rssEN00:00 · 04·25
AI芯片行情把台湾和韩国股市排名推上去了
截至2026年4月25日,AI芯片股上涨让台湾和韩国在全球股市排名中上升。正文只给了标题和发布时间,没披露具体排名变化、涉及哪些公司、涨了多少、以及排名方法。这是一个市场结果,不是新芯片或模型发布。
#Commentary
精选理由
标题本身有钩子——AI芯片行情推高台湾和韩国股市排名,这是供应链叙事里大家关心的结果。但正文只有标题和发布时间,没有具体排名变化、涉及公司、涨幅区间或统计口径,信息量几乎为零。H和R成立是因为标题直接点出AI芯片与国家级股市排名的关联,能抓住关注供应链和资本流向的读者;K不成立是因为正文没给任何可验证的数据,只能当一条低信息密度的快讯处理。
一句话点评
标题说AI芯片股涨了,但正文没给任何具体数字或公司名。
锐评
这是一条只有标题的短讯,核心信息是AI芯片股上涨让台湾和韩国在全球股市排名上升。但正文完全没披露:涨了多少、涉及哪些公司(台积电?三星?)、排名具体怎么变的、用的什么排名方法。所以这条只能当市场风向标看,不能当操作依据。对AI从业者来说,它反映的是芯片需求还在拉动区域股市,但没新模型或芯片发布,信息密度极低。想看具体数据得等彭博出完整报道。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1

更多

频道

后台