ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-23

48 items · updated 3m ago
RSS live
2026-05-23 · 星期六2026年5月23日
23:39
20d ago
Hacker News 首页· rssEN23:39 · 05·23
ICE 花 2500 万美元采购虹膜扫描设备,合同金额是上次的五倍
美国移民执法局(ICE)在 5 月 22 日与 Bi2 Technologies 签了一份 2500 万美元的虹膜扫描合同,金额是去年 9 月那份合同的五倍多。这次采购 1570 台设备,是上次 200 台的近八倍,预计 6 月底前到位。合同是单一来源(没竞标),而且没要求通过 FedRAMP(美国政府云安全审查),也没有独立审计或国会通知。正文没披露...
#Vision#ICE#Bi2 Technologies#Policy
精选理由
正文只给了标题级别的采购事实,没披露部署地点、技术指标或 AI 系统细节。AI 相关性落在视觉/生物识别政策上,所以留在 all 里。
一句话点评
ICE 花 2500 万美元买 1570 台虹膜扫描仪,6 月底到位,金额是上次的 5 倍,设备量是 8 倍。但合同没竞标、没过 FedRAMP 云安全审查、没独立审计,也没通知国会。设备能查 500 万条在押记录,方便外勤快速验人。便宜吗?单价约 1.6 万美元,不算贵,但安全审查和隐私保障全跳过了,这点先别太激动。正文没披露设备具体部署地点和性能指标。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
23:00
20d ago
r/LocalLLaMA· rssEN23:00 · 05·23
用本地模型做会计月结,慢但能用
一位 Reddit 用户用 Qwen 3.6 27B 跑月结、银行对账、应收应付,还搭了个 SQLite 数据库让模型自己管。他把 Claude 的技能和 Anthropic 的金融仓库整合了进去,说效果还行。但速度很慢——因为买不起 5000 美元的机器,只用一块集成显卡跑 MTP 版模型,得跑一整夜才能出结果。正文没披露准确率、处理了多少笔账、具体...
#Agent#Tools#Code#Qwen
精选理由
这是一个Reddit用户的单点分享,不是系统评测。模型能处理月结和银行对账,听起来很实用,但正文没披露准确率、数据规模或硬件配置,验证力度很弱。适合推送给所有人看,但别当成熟方案。
一句话点评
有人用 Qwen 3.6 27B 跑月结、对账、应收应付,还让模型自己管 SQLite 数据库。他把 Anthropic 的金融仓库和 Claude 技能搬过来用,说效果还行。但速度慢到要跑一整夜——因为买不起 5000 美元的机器,只用集成显卡跑 MTP 版。正文没披露准确率、处理了多少笔账,这点先别太激动。本地模型能干活了,但离替代 QuickBooks 还差得远。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
21:30
20d ago
r/LocalLLaMA· rssEN21:30 · 05·23
本周 GitHub AI 项目涨星榜:代码智能体、个人记忆和本地开发工具最火
Reddit 用户 Sam_Tech1 整理了本周 GitHub 上增长最快的 10 个 AI 开源项目。codegraph 和 openhuman 分别涨了 1.4 万和 1.7 万颗星,领跑榜单。这批项目集中在几个方向:代码智能体(让 AI 自己写代码、修 bug)、个人 AI 助手(带记忆功能,能记住你的偏好)、浏览器自动化(AI 帮你操作网页)...
#Agent#Code#Memory#Sam_Tech1
精选理由
这是一份 Reddit 周榜汇总,没有拆解仓库的技术细节、质量验证或落地证据,所以重要性压在 60–71 区间。榜单本身有排名钩子、有具体 star 数、也切中当前开源 Agent 和记忆方向的热度,H/K/R 都过。
一句话点评
本周 GitHub 上 AI 开源项目涨粉最快的两个是 codegraph(+1.4 万星)和 openhuman(+1.7 万星),方向集中在代码智能体、带记忆的个人助手和浏览器自动化。openhuman 能记住用户偏好,这点对本地部署的个性化助手挺实用;codegraph 则是让 AI 自己写代码修 bug,适合开发者提效。不过榜单来源是 Reddit 用户整理,非官方统计,可能存在采样...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
20:14
20d ago
r/LocalLLaMA· rssEN20:14 · 05·23
Command A+ 218B MoE 跑上苹果芯片,MLX 移植已提 PR
Cohere 刚开源的 Command A+(218B 总参数/25B 激活,128 专家取 8,Apache 2.0)被开发者移植到了 mlx-lm,能在 Apple Silicon 上跑了。架构上有几个特别设计:一个共享专家配大中间层(16384),跟路由输出做 (routed + shared)/2 平均;路由用 sigmoid 而非 softm...
#Inference-opt#Tools#Cohere#Apple
精选理由
H/K/R 都成立,但这是社区 MLX 移植,单机测试,不是 Cohere 或 Apple 官方发布。速度和内存数字有参考价值,但还没到 featured 门槛。
一句话点评
Cohere 的 218B MoE 模型 Command A+ 被移植到 mlx-lm,能在 Apple Silicon 上跑了。实测 BF16 转 Q8 后生成速度 22.9 tok/s,峰值内存 241GB——这意味着你需要一台 256GB 以上的 Mac 才能跑,成本不低。架构上有意思的点:共享专家和路由输出做平均,路由用 sigmoid 而非 softmax,滑动窗口 3:1 加交错...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:51
20d ago
r/LocalLLaMA· rssEN19:51 · 05·23
NVIDIA 的 Nemotron 人物画像向量已开源,支持按年龄、职业、爱好搜人
Feisty_Plant4567 把 NVIDIA 的 Nemotron-Personas 数据集做成了预计算向量,用 Qwen 0.6B 模型对几百万条合成人物画像(含姓名、年龄、职业、爱好)提取了向量。目前覆盖韩国、日本、法国和美国四个国家,在 Hugging Face 上发布了合集,还搭了一个网页 demo 支持语义搜索和 K 近邻分组。正文没披...
#Embedding#Agent#NVIDIA#Qwen
精选理由
K 和 R 通过:帖子给出了具体规模、模型和可用产物。H 偏弱,受众比模型或平台发布窄,所以落在 60-71 区间。
一句话点评
有人把 NVIDIA 的 Nemotron-Personas 合成人物画像数据集做成了预计算向量,用 Qwen 0.6B 模型跑了百万级画像,覆盖韩、日、法、美四国。好处是省了你自己跑 embedding 的算力,直接搜语义或做 K 近邻分组。但注意:0.6B 模型向量质量有限,且只覆盖四个国家,地域偏差明显。正文没披露向量维度、检索延迟和存储成本,这些对实际落地很关键。短评:省力但别当主力...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
19:00
20d ago
AI HOT 精选· aihot-apiZH19:00 · 05·23
Replit Agent 接上 Squidler:说人话就能测 App,测完还能自己修
Replit 的 AI 编程助手 Agent 接入了测试工具 Squidler,用户用自然语言描述想要的功能,Agent 直接生成应用并部署,Squidler 像真人一样点来点去测 bug,测出问题再自动丢回给 Agent 修。整个过程不用写一行测试脚本,等于把“写代码→测 bug→改代码”这个循环全自动化了。正文没披露这套流程跑一轮要多久、Squid...
#Agent#Tools#Code#Replit
精选理由
HKR 三项都过,但来源是官方 X 级别的产品公告,没有可复现的结果、定价或覆盖细节。按中小型 coding agent 集成处理,不到推荐位门槛。
一句话点评
Replit Agent 接上 Squidler 后,你只需用自然语言描述想要的功能,Agent 自动生成应用并部署,Squidler 像真人一样点来点去测 bug,测出问题再自动丢回给 Agent 修——全程不用写一行测试脚本。等于把“写代码→测 bug→改代码”这个循环全自动化了。但正文没披露这套流程跑一轮要多久、Squidler 的测试覆盖率有多高,也没说它能不能测复杂交互或跨页面逻辑...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
18:32
20d ago
r/LocalLLaMA· rssEN18:32 · 05·23
用 OpenRouter 数据给推理服务商按缓存命中率排了个梯队
Reddit 用户用 OpenRouter 的数据给各家推理服务商按缓存命中率排了梯队,但正文只贴了一张图,没披露样本量、具体服务商名单和各自的命中率数字。缓存命中率高意味着重复请求多、推理成本能降不少,但缺少这些关键信息,没法判断这个排名有多靠谱。
#Inference-opt#OpenRouter#Benchmark
精选理由
HKR-H 和 HKR-R 通过:缓存命中率分层对本地模型用户和推理成本决策有实际意义。HKR-K 不通过:正文未披露样本量、服务商名单或命中率数值,信息不完整。
一句话点评
Reddit 用户拿 OpenRouter 数据给推理服务商按缓存命中率排了梯队,但正文只贴了张图,没披露样本量、具体服务商和命中率数字。缓存命中率高意味着重复请求多、推理成本能降不少,但缺关键信息,排名可信度打折。短评:图不错,但缺样本量和具体数字,先别急着信。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
18:10
20d ago
r/LocalLLaMA· rssEN18:10 · 05·23
Chrome 里那个小模型 Gemini Nano 现在能直接跑,不用显卡
一个叫 Dobby 的 Chrome 扩展让你在浏览器里本地跑 Gemini Nano,16GB 内存加硬盘空间就行,不需要 GPU。Chrome 给每个会话设了 9216 个 token 的上限,作者估测速度大概每秒 20 个 token,但没贴实测数据。这个速度偏慢,适合简单任务,比如摘要或分类,别指望实时对话。正文没披露模型参数量或具体延迟测试方法。
#Inference-opt#Tools#Google#Chrome
精选理由
这是个 Reddit 用户发的工具帖,来源和影响力有限,但信息扎实——16GB 内存就能跑,每会话 9216 tokens,对想低成本试本地模型的人挺实用。不过正文没披露推理速度、模型量化精度,这点先别太激动。放在 60–71 分档合适,算个有用的本地推理小技巧,不是行业级事件。
一句话点评
一个叫 Dobby 的 Chrome 扩展让你在浏览器里本地跑 Gemini Nano,16GB 内存加硬盘就行,不用 GPU。Chrome 给每个会话设了 9216 个 token 上限,作者估测速度约每秒 20 个 token,但没贴实测数据。这个速度偏慢,适合摘要或分类,别指望实时对话。正文没披露模型参数量或具体延迟测试方法。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:39
20d ago
r/LocalLLaMA· rssEN17:39 · 05·23
Hermes Agent 建目录失败:报告成功但实际没创建
有用户用 Qwen3.5 9B 跑 Hermes Agent,让它创建一个目录。Agent 返回 mkdir 成功,但文件系统里根本没变化,Hermes 日志也没有任何警告。问题可能是 Agent 对系统调用的反馈做了假阳性判断,或者底层工具链有 bug。正文没披露具体复现步骤和模型版本细节,这点先别太激动,但如果是普遍问题,那 Agent 的可靠性就...
#Agent#Tools#Code#Hermes Agent
精选理由
一条 Reddit 求助帖,症状具体(mkdir 成功但目录没出现),但正文没披露模型版本、Hermes Agent 版本、日志细节或复现条件,也没有任何修复方案。H 和 R 过关,K 不通过,属于低价值可浏览内容。
一句话点评
有用户用 Qwen3.5 9B 跑 Hermes Agent 创建目录,Agent 返回成功但文件系统没变化,日志也无警告。问题可能是 Agent 对系统调用反馈做了假阳性判断,或底层工具链有 bug。正文没披露复现步骤和模型版本,这点先别太激动,但如果是普遍问题,Agent 的可靠性就存疑了。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
16:45
20d ago
r/LocalLLaMA· rssEN16:45 · 05·23
30次跑分实测:MI60显卡跑Gemma 4和Qwen3,HomeAssistant语音指令1.2秒搞定
一位Reddit用户在MI60 32GB显卡上跑了30次llama-bench,测试Gemma 4 26B(Q4_1量化)和Qwen3 35B(Q4_0量化)。固定输入512个token、生成128个token,结果HomeAssistant语音指令耗时不到1.2秒,Frigate视频摘要不到18秒。这个延迟对智能家居场景够用,但注意测试只跑了一次生成...
#Inference-opt#Benchmarking#Reddit#Gemma
精选理由
Reddit 用户自己跑了 30 次测试,在 MI60 32GB 上对比 Gemma 4 26B 和 Qwen3 35B,固定 prompt 和生成长度,报告了 HomeAssistant 语音命令低于 1.2 秒、Frigate 摘要低于 18 秒。数据具体、场景明确,对想用旧显卡跑本地模型的用户有直接参考价值。但来源单一(个人帖),没有对比其他硬件或模型,所以分数在 60–71 区间,不推 featured。
一句话点评
在MI60 32GB显卡上跑了30次llama-bench,Gemma 4 26B和Qwen3 35B的智能家居延迟实测:HomeAssistant语音指令不到1.2秒,Frigate视频摘要不到18秒。对本地部署来说这个速度够用,但注意测试只生成128个token,实际场景如果对话更长或视频片段更多,延迟会明显上升。另外正文没披露功耗和显存占用,MI60的性价比优势缺少数据支撑。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:06
20d ago
Hacker News 首页· rssEN16:06 · 05·23
Claw-Coder:一个全本地跑的 AI 编程助手,带知识图谱和 Docker 沙箱
作者做了一个叫 Claw-Coder 的本地 AI 编程助手,核心思路是给本地小模型(8B、13B 甚至 1B)配上工具链,让它们也能干点正经活。它集成了外挂资料库(RAG)来存代码向量,避免小模型上下文窗口被撑爆;还搭了一个知识图谱,帮模型理解代码之间的关联关系。另外它给了模型搜索工具(防幻觉)、Docker 执行环境(让模型自己跑代码验证结果),以...
#Agent#RAG#Code#Claw-Coder
精选理由
H/K/R 都达标,但这是个人 Show HN 的闭源测试产品,没有公开 benchmark、用户规模或源码。正文没披露任何性能数据或验证结果,所以只能当小产品更新处理,tier 保持 all。
一句话点评
一个本地AI编程助手,给8B、1B等小模型配上RAG(外挂资料库存代码向量)、知识图谱(理清代码关系)、搜索工具(防幻觉)和Docker执行环境(让模型自己跑代码验证结果)。思路对,但项目闭源,正文没披露任何性能基准或延迟数据,小模型到底能跑多快、代码生成质量如何,全是未知数。短评:本地小模型+工具链,思路好但闭源无数据,先别激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:04
20d ago
r/LocalLLaMA· rssEN16:04 · 05·23
跑 RAG 用稠密模型还是 MoE?有人实测 Qwen 35B 稠密比 27B MoE 快 2.5 倍
Reddit 用户用单张 RTX 3090 跑 RAG,对比 Qwen3.6 35B APEX(稠密)和 Qwen3.6 27B MTP(MoE),稠密模型生成速度约 150 tok/s,MoE 只有 60 tok/s,而且稠密模型回答质量更好。不过帖子没交代检索怎么做的、用了什么提示词、量化方式,也没给评估指标,所以这个结论只能当个参考,不能直接推广...
#RAG#Inference-opt#Claude#Qwen
精选理由
一条 Reddit 用户发的非正式 RAG 测速帖,对比了 Qwen3.6 35B dense 和 27B MoE 在单张 3090 上的输出速度(150 vs 60 tok/s)。话题本身有价值,但正文没披露数据集、量化精度、上下文长度等关键变量,也没说是否有人复现。结论可以参考,但别直接当选型依据。
一句话点评
Reddit 用户用单张 RTX 3090 跑 RAG,发现稠密模型 Qwen3.6 35B 生成速度约 150 tok/s,比 MoE 版 27B 的 60 tok/s 快一倍多,回答质量也更好。但帖子没交代检索怎么做、用了什么提示词、量化方式,也没给评估指标,结论只能当个参考。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:38
20d ago
r/LocalLLaMA· rssEN15:38 · 05·23
26M参数模型在CPU上跑函数调用,比0.6B模型快4.4倍,准确率还更高
Reddit用户gvij用4核CPU测了Needle 26M和Qwen3-0.6B在50次工具调用上的表现。Needle工具匹配准确率72.0%,平均延迟10.9秒;Qwen3准确率56.0%,延迟47.9秒。Needle参数少23倍,但准确率高出16个百分点,速度快4.4倍。测试分5个难度等级,正文没披露各等级具体结果。
#Agent#Tools#Benchmarking#Needle
精选理由
HKR 三项都过,但证据来源是 Reddit 上单次测试,只有 50 条查询,复现细节没披露。信号很实用,但源权重不够上精选。
一句话点评
26M参数模型在4核CPU上工具调用准确率72%,比0.6B的Qwen3高16个百分点,速度快4.4倍。参数少23倍反而更强,说明小模型做工具调用不一定输给大模型。但测试仅50次查询,样本太少,统计意义有限;且正文没披露各难度等级的具体结果,高难度下差距可能缩小。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
15:38
20d ago
r/LocalLLaMA· rssEN15:38 · 05·23
GPT-5.5 的“秘密武器”就是让模型用原始人模式思考?
Reddit 用户声称 GPT-5.5 在一次普通对话中意外泄露了它的思考过程,并贴了一个 Gist 日志链接。帖子没有给出可复现的设置、模型来源,也没提这种“原始人思考”到底省不省 token。正文没披露任何效率数据,所以这点先别太激动。
#Reasoning#Fine-tuning#OpenAI#GPT-5.5
精选理由
这是一条 Reddit 用户的单方面爆料,说 GPT-5.5 在普通对话里泄露了思考过程,并附了一个日志链接。但正文没披露怎么复现、模型从哪来、效率数据如何,所以只能当个模型行为传闻,不能当重点报道。HKR 的 H 和 R 都成立,K 因为缺可复现设置和模型来源而不成立。
一句话点评
Reddit 用户声称 GPT-5.5 在一次普通对话中意外泄露了它的思考过程,并贴了一个 Gist 日志链接。帖子没有给出可复现的设置、模型来源,也没提这种“原始人思考”到底省不省 token。正文没披露任何效率数据,所以这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
13:58
20d ago
机器之心 · 公众号· rssZH13:58 · 05·23
没有大模型、没有自有流量,AppLovin 靠预测用户终身价值把广告做到千亿市值
AppLovin 用自研的 Axon 2 广告引擎,把投放逻辑从“按点击出价”换成“按用户终身价值(LTV)预测出价”,2024 年股价涨了 790%,2025 年市值逼近 2500 亿美元。它没有自己的大模型,也没有微信、抖音那样的自有流量池,核心是把广告主的花费用在能长期付费的用户身上。正文没披露 Axon 2 的具体模型架构和训练数据量,但效果数...
#Embedding#Multimodal#Agent#AppLovin
精选理由
HKR三项都过:故事有反差钩子,事实有具体数字和机制(LTV预测替代点击率预估),对AI从业者有参考价值(AI在广告变现中的落地)。分数维持69是因为这是一篇公司商业复盘,不是新模型发布、新产品上线或跨来源事件,信息密度和时效性不足以进更高档。
一句话点评
AppLovin 靠自研的 Axon 2 广告引擎,把投放逻辑从“按点击出价”换成“按用户终身价值(LTV)预测出价”,2024 年股价涨了 790%,2025 年市值逼近 2500 亿美元。它没有自己的大模型,也没有微信、抖音那样的自有流量池,核心是把广告主的花费用在能长期付费的用户身上。正文没披露 Axon 2 的具体模型架构和训练数据量,但效果数据很猛。短评:没大模型没流量,靠 LTV...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
13:54
20d ago
r/LocalLLaMA· rssEN13:54 · 05·23
Apex-Testing 更新:95% 覆盖率的真实仓库编程评测
Apex-Testing 更新了它的真实仓库编程评测,覆盖率达到 95%。评测用了 65-70 个私有 GitHub 仓库、70 个任务、8 个类别,还统计了平均成本、平均耗时、按类别加权得分、ELO 排行榜和模型对比。正文没披露具体哪些模型上榜、成本多低、延迟多高,所以这点先别太激动。不过用私有仓库测编程能力,比公开题库更贴近实际干活场景。
#Agent#Code#Benchmarking#Apex-Testing
精选理由
H/K/R三项都达标,但来源只是一条Reddit帖子,只给了规模数字,没披露评测方法、模型具体表现和可复现性。分数落在60-71区间的高位,不设为精选。
一句话点评
Apex-Testing 更新了编程评测,用 65-70 个私有仓库、70 个任务测模型写代码的真实能力,覆盖率达 95%。比公开题库更贴近干活场景,但正文没披露具体模型排名、成本和耗时,所以先别太激动。缺实测数据,等榜单出来再判断谁真能打。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:45
21d ago
r/LocalLLaMA· rssEN13:45 · 05·23
小米12 Pro 跑本地模型:Llama.cpp 和 LiteRT 谁更快?
有人在改装成 24/7 服务器的小米12 Pro 上测了 Gemma-4-E4B 模型。Llama.cpp 的提示处理速度是 30.6 token/秒,生成速度 5.7 token/秒;LiteRT 生成稍快一点,但会把 CPU 跑满,功耗也更高。正文没披露具体功耗数据和测试条件,所以这点先别太激动。
#Inference-opt#Benchmarking#Xiaomi#Google
精选理由
手机当服务器跑模型这个设定有新鲜感,实测数据也具体(30.6 t/s 提示、5.7 t/s 生成、LiteRT 功耗更高)。但影响范围有限,主要对本地推理爱好者有参考价值,所以落在 60–71 分区间。
一句话点评
有人在改装成服务器的小米12 Pro上测了Gemma-4-E4B模型,Llama.cpp提示处理30.6 token/秒,生成5.7 token/秒;LiteRT生成稍快但CPU跑满、功耗更高。正文没披露具体功耗数据和测试条件,所以这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:29
21d ago
r/LocalLLaMA· rssEN13:29 · 05·23
给 exo 加原生 MTP,Qwen3.6 在 M5 Max 上推理速度翻倍
有人在 exo 分布式推理框架里提交了原生 MTP(多 token 预测)的 PR。实测在 M5 Max 48GB 笔记本上,Qwen3.6 27B 模型从 17.27 tok/s 涨到 34.06 tok/s(K=2,速度翻倍);35B-A3B 混合模型从 85.14 涨到 98.59 tok/s(K=1,提升约 16%)。MTP 让模型一次预测多个...
#Inference-opt#exo#Qwen#Apple
精选理由
开发者给 exo 加原生 MTP 支持,实测 M5 Max 48GB 上 27B 模型在 K=2 时速度翻倍(17.27→34.06 tok/s),35B-A3B 在 K=1 也有 16% 提升(85.14→98.59 tok/s)。数字实在,但正文没披露显存占用、功耗或长序列稳定性,这点先别太激动。对用 Apple Silicon 跑本地大模型的人是个好消息,但受众面窄,不到推荐位。
一句话点评
有人在 exo 分布式推理框架里给 Qwen3.6 的 MLX 模型加上了原生 MTP(多 token 预测),实测在 M5 Max 48GB 笔记本上,27B 模型速度从 17.27 tok/s 翻倍到 34.06 tok/s(K=2),35B-A3B 混合模型从 85.14 涨到 98.59 tok/s(K=1,提升约 16%)。MTP 让模型一次预测多个 token,相当于流水线干活,...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:00
21d ago
TechCrunch AI· rssEN13:00 · 05·23
马斯克放弃地球太阳能,xAI 全面转向天然气
TechCrunch 报道,马斯克的 xAI 已全面押注天然气,SpaceX 则专注轨道数据中心。他早年承诺的“太阳能电力经济”似乎被搁置。正文未披露项目规模、成本、时间线或马斯克本人的直接表态,所以目前只能确认方向转变,具体影响和动机还不清楚。
#Elon Musk#xAI#SpaceX#Commentary
精选理由
HKR-H/R 靠马斯克/xAI 的能源转向和数据中心成本痛点通过。HKR-K 不通过:缺规模、成本、时间表和直接引语,所以这篇只能归入 60-71 分的评论档。
一句话点评
马斯克放弃地球太阳能,xAI 全面押注天然气,SpaceX 专注轨道数据中心。早年承诺的“太阳能电力经济”被搁置。正文未披露项目规模、成本、时间线或马斯克本人直接表态,目前只能确认方向转变,具体影响和动机不清楚。短评:马斯克自己打脸,太阳能梦碎,天然气真香。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
12:53
21d ago
r/LocalLLaMA· rssEN12:53 · 05·23
Qwen3.6 35B-A3B MTP 在 24GB 笔记本显卡上跑到 249 token/秒,比自家 27B 稠密模型快 3.4 倍
有人在笔记本版 RTX 5090(24GB)上跑了 Qwen3.6 的 35B-A3B 混合专家模型(MoE,每次只激活约 3B 参数),配合 MTP 投机解码(让模型先猜几个后续 token,猜对了就一次多出几个 token),10 次 2000 token 测试平均 249 token/秒。对比同系列的 27B 稠密模型(每次全量计算 27B 参数...
#Inference-opt#Code#Benchmarking#Qwen
精选理由
这是一个 Reddit 上的单点跑分,不是官方发布或跨来源事件,但 249 t/s 在 24GB 消费卡上确实亮眼,对本地推理群体有明确参考价值。分数落在 60–71 高位,但不到 featured。
一句话点评
短评:MoE + MTP 让 35B 模型在笔记本 5090 上跑到 249 token/s,比同系列 27B 稠密模型快 3.4 倍,挺离谱的。 点评:Qwen3.6 的 35B-A3B 混合专家模型(每次只激活约 3B 参数)配合 MTP 投机解码(让模型先猜几个后续 token,猜对了就一次多出几个 token),在笔记本版 RTX 5090(24GB)上跑出 249 token/s...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
11:50
21d ago
Hacker News 首页· rssEN11:50 · 05·23
从第一性原理让深度学习跑得更快
这篇博客把深度学习性能优化拆成三个瓶颈:计算(GPU算浮点运算的时间)、内存带宽(搬数据的时间)、开销(其他杂项)。作者用工厂比喻解释——你买了312 teraflops的算力,但大部分时间可能花在搬材料上,而不是真正干活。比如非矩阵乘法的算子(像layer norm)只占BERT总FLOPs的0.2%,却因为内存带宽限制跑得极慢。正文没有披露具体优化...
#Inference-opt#Commentary
精选理由
标题画了个大饼,但正文啥都没给——没方法、没数据、没硬件,连 HN 热度都很低。属于低价值教程,不值得投入时间细看。
一句话点评
这篇把深度学习性能瓶颈拆成计算、内存带宽、开销三个工厂比喻,说人话讲清了为什么非矩阵乘法的算子(如layer norm)只占BERT总FLOPs的0.2%,却因内存带宽限制跑得极慢。正文没披露具体优化方法或硬件条件,更像科普框架而非实操指南。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
11:01
21d ago
彭博科技· rssEN11:01 · 05·23
黄仁勋喊超微收紧合规,台湾审查风暴下供应链承压
彭博报道,英伟达CEO黄仁勋要求超微电脑(Super Micro)加强合规管理,背景是台湾正在收紧对AI服务器出货的审查。正文没披露具体违规细节、超微的回应,也没说台湾审查到底卡了什么环节。这件事的信号是:美国芯片巨头已经在主动要求代工厂配合出口管制,供应链合规成本会继续上升。
#Nvidia#Super Micro#Bloomberg#Policy
精选理由
Bloomberg 标题+ Nvidia/Super Micro 合规话题,对 AI 基础设施读者有钩子和相关性,所以 H 和 R 成立。但正文没披露任何调查细节或合规要求细节,K 不成立,因此归入 all 层级。
一句话点评
黄仁勋亲自催超微电脑加强合规,背景是台湾收紧AI服务器出货审查。信号很明确:美国芯片巨头在主动压代工厂配合出口管制,供应链合规成本只会更高。正文没披露超微具体违规了什么、台湾审查卡在哪个环节,也没给超微的回应。信息缺口不小,但方向已经够清楚——合规不再是法务部门的事,而是直接影响出货节奏的硬约束。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
10:01
21d ago
r/LocalLLaMA· rssEN10:01 · 05·23
本地大模型社区活跃度下降,是不是泡沫快破了?
Reddit 用户 fairydreaming 发帖说 LocalLLaMA 板块的参与度在下降,还引用了 Google Trends 数据。但正文没披露具体趋势数值、时间范围和测量方法,所以这个判断目前只能当个信号看,不能当结论。如果社区活跃度真的持续走低,可能说明大家对本地跑大模型的预期在降温,但这点先别太激动——也可能是用户分流到了其他平台或工具。
#Reddit#LocalLLaMA#Google#Commentary
精选理由
一条Reddit帖子靠标题和情绪信号拿到56分,但正文没披露任何趋势数据或统计方法,验证太弱。单个社区讨论是情绪指标,不足以支撑60分以上的推荐档位。
一句话点评
Reddit LocalLLaMA 板块用户发帖称社区活跃度下降,并引用 Google Trends 数据,但正文没披露具体趋势数值、时间范围和测量方法,所以这个判断目前只能当个信号看,不能当结论。如果社区活跃度真的持续走低,可能说明大家对本地跑大模型的预期在降温,但这点先别太激动——也可能是用户分流到了其他平台或工具。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
09:46
21d ago
AI HOT 精选· aihot-apiZH09:46 · 05·23
Mistral收购Emmi AI,补物理仿真团队做工业AI
Mistral AI宣布收购Emmi AI,后者有30多名物理仿真和数字孪生方向的研发人员。这笔交易的核心是补人——Mistral想用物理仿真能力做工业AI,比如在制造、能源场景里让模型理解真实物理规律。数字孪生就是给设备建一个虚拟副本,可以低成本跑模拟、做预测。30多人不算大团队,但对工业AI这种重垂直场景来说,关键人才比人数重要。正文没披露收购金额...
#Robotics#Mistral AI#Emmi AI#Partnership
精选理由
HKR-H/K 通过,因为 Mistral 确实收购了 Emmi AI 并加了 30 多人。HKR-R 偏弱:没有交易金额、产品路线图或客户验证,所以分数落在 60–71 区间。
一句话点评
Mistral 收购了做物理仿真和数字孪生的 Emmi AI,30 多人团队,想补工业 AI 的物理理解能力。数字孪生就是给设备建虚拟副本,低成本跑模拟。30 人不大,但工业场景关键人才比人数重要。正文没披露收购金额,也没说具体落地客户,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
09:16
21d ago
r/LocalLLaMA· rssEN09:16 · 05·23
DGX Spark 跑 Agent 实测:4 路并发 138 TPS,但 30K 上下文是极限
Reddit 用户用 DGX Spark 跑 RedHatAI/Qwen3.6-35B-A3B-NVFP4,塞了 30K token 的提示词,输出 5000 token。单流约 51 TPS,4 路并发时总吞吐 138.56 TPS。数字看着不错,但注意:30K 上下文已经是极限,再长可能撑不住。正文没披露显存占用和功耗,所以实际部署成本不好判断。
#Agent#Tools#Inference-opt#RedHatAI
精选理由
这是一条 Reddit 用户实测,不是官方发布或权威基准,所以分数卡在 60–71 区间。但数据本身扎实:单流 51 TPS 意味着跑 agent 任务(比如多轮工具调用)延迟约 20ms/token,4 并发还能撑到 138 TPS,说明 DGX Spark 在小模型本地部署上性价比不错。不过正文没披露功耗、显存占用和长上下文稳定性,这些是实际部署前需要验证的。
一句话点评
DGX Spark 跑 Qwen3.6-35B 的 agent 实测:30K 提示词+5K 输出,单流 51 TPS,4 路并发总吞吐 138.56 TPS。数字不错,但 30K 上下文已是极限,再长可能崩。正文没披露显存和功耗,实际部署成本不好判断。短评:单流 51 TPS 够用,但上下文短是硬伤。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:51
21d ago
r/LocalLLaMA· rssEN08:51 · 05·23
求推荐印度语言语音识别模型:Sarvam Saaras v3 被点名,但价格和跑分都没说
Reddit 用户求推荐能识别印地语、南印语言和中英混说的语音识别模型,要求拿来就能用,不想自己微调。有人提了 Sarvam Saaras v3,但正文没披露它的基准分数、定价或部署限制,所以没法判断它到底好不好用、贵不贵。
#Audio#Reddit#Sarvam#Saaras v3
精选理由
HKR-R 通过,因为 Indic 语种和混合语码 ASR 是实际部署中的硬骨头。HKR-H/K 不通过:正文没披露任何评测数字、模型结果或可复现的测试设置。
一句话点评
Reddit 用户求推荐能识别印地语、南印语言和中英混说的语音识别模型,要求拿来就用。有人提了 Sarvam Saaras v3,但正文没披露它的基准分数、定价或部署限制,所以没法判断它到底好不好用、贵不贵。 短评:有人推荐但没给分数和价格,先别急着用。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
07:45
21d ago
AI 群聊日报· atomZH07:45 · 05·23
GPT-5 推翻 80 年数学猜想;DeepSeek V4 Pro 永久降价至 1/4;GLM-5.1 高速版 400 tokens/s;ds4 引擎让 ...
GPT-5 否证了 Erdős 1946 年提出的平面单位距离猜想,Fields 奖得主 Gowers 审阅后说如果是人类投稿他会直接推荐接受。DeepSeek V4 Pro 把促销价永久化,输入缓存命中 0.025 元/百万 token,输出 6 元,群友说正愁六月涨价结果直接变长期价。GLM-5.1 高速版跑到 400 tokens/s,比 Hai...
#Reasoning#Inference-opt#Tools#OpenAI
精选理由
HKR三项都达标,但来源是匿名群聊日报,不是官方发布或可复现的测试。具体数字足够让所有层级都值得看,但不够格上头条。
一句话点评
GPT-5 否证了 Erdős 1946 年的平面单位距离猜想,Fields 奖得主 Gowers 审阅后说如果是人类投稿他会直接推荐接受。关键信号:模型是通用 LLM 而非专为数学训练,说明推理能力跨领域迁移了。DeepSeek V4 Pro 把促销价永久化,输入缓存命中 0.025 元/百万 token,输出 6 元,群友说正愁六月涨价结果直接变长期价。GLM-5.1 高速版跑到 400...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
07:44
21d ago
r/LocalLLaMA· rssEN07:44 · 05·23
有人在 RX 9060 XT 上跑了 Gemma4 26B 量化版,38 token/秒,90k 上下文不崩
Reddit 用户用 mudler 做的 Gemma4 26B A4B Apex GGUF 量化模型,在 RX 9060 XT 16GB 显卡上通过 llama.cpp Vulkan 跑,测出 38 token/秒的生成速度,上下文拉到 90k 也没出现循环或明显的质量下降。这个速度对本地跑 26B 模型来说算快的,而且长上下文没崩说明量化做得比较稳。...
#Inference-opt#Gemma#mudler#llama.cpp
精选理由
HKR 三项都达标,但来源是单条 Reddit 用户测试,不是官方发布或系统评测。90k 上下文和 38 tps 的具体数字让这条信息有用,不过权威性有限,所以分数压在 60–71 区间。正文没披露量化精度对质量的具体影响,这点先别太激动。
一句话点评
Reddit 用户实测,Gemma4 26B A4B 的 Apex 量化版在 RX 9060 XT 16GB 显卡上跑出 38 token/秒,上下文拉到 90k 也没崩。这个速度对本地 26B 模型算快的,长上下文没出循环或质量下降,说明量化做得稳。但注意:来源是单用户自测,显卡是 AMD 中端卡,N 卡表现未知;正文被墙,没披露量化具体参数和测试细节。如果这速度能复现,16GB 显存跑 ...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
07:15
21d ago
AI HOT 精选· aihot-apiZH07:15 · 05·23
飞书里直接调本地 Claude Code,开源项目已上线
feishu-claude-code-bridge 这个开源项目把飞书和本机的 Claude Code CLI 连起来了。你在飞书发消息,它转成 prompt 传给 `claude -p` 执行,再把输出流式同步回飞书。反过来 Claude 也能读飞书里的上下文、创建编辑文档。相当于把飞书当聊天界面,背后跑本地模型干活。项目还能扩展接 Codex 等其...
#Agent#Code#Tools#Feishu
精选理由
HKR 全过:飞书桥接 Claude Code 有具体的工作流钩子(h)、机制和计费日期(k)、以及团队成本痛点(r)。范围就是一条 X 帖里的单个开源连接器,所以分数压在 70 档。
一句话点评
飞书当聊天界面,背后跑本地 Claude Code 干活,挺实用。但注意 6 月 15 日起 `claude -p` 模式要单独计费,成本会涨。项目开源可扩展,但正文没披露延迟和稳定性数据,生产环境需谨慎。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
05:21
21d ago
r/LocalLLaMA· rssEN05:21 · 05·23
给 Gemma4 31B 写了个 Jinja 模板,专治思维标签不闭合
Reddit 用户 ggonavyy 发了个 llama.cpp 用的 Jinja 模板,说在 Pi-coding-agent 测试里不再出现 thinking 标签打开或关闭的错误。帖子没贴跑分,也没说怎么复现,所以效果到底多稳得自己试。
#Code#Agent#Tools#Google
精选理由
一个很小的开源工具帖:HKR-H 和 HKR-K 靠一个具体的 Gemma4 31B 模板和 Pi-coding-agent 场景通过,但没给基准、可复现测试或行业级痛点,分数卡在 60-71 低位段。
一句话点评
一个 Reddit 用户给 Gemma4 31B 做了个 Jinja 模板,号称能修掉 thinking 标签开关错误。没跑分、没复现步骤,效果稳不稳得自己试。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
04:21
21d ago
Latent Space· rssEN04:21 · 05·23
模型厂都在转型做 Agent 了:OpenAI、AI21、DeepSeek 集体转向
Latent Space 汇总了 5 月 4-5 日的 AI 新闻,翻遍 12 个 Reddit 板块和 544 个 Twitter 账号后得出一个判断:OpenAI、AI21、DeepSeek 这些模型公司正在把产品重心从“卖模型”转向“卖 Agent”——也就是把模型装进业务流程、UI、记忆和成本结构里一起卖。OpenAI 的 Greg 直接说“模...
#Agent#Tools#Code#Latent Space
精选理由
这是一篇Latent Space的新闻汇总,核心论点是模型团队都在转向智能体、工具链和UI,而非发布重大新模型或论文。论据有具体来源和案例,但本质是行业观察综述,不是一手发布。重要性68分合理,属于“值得看但别当重磅”的档次。
一句话点评
OpenAI、AI21、DeepSeek 等模型公司集体转向卖 Agent——把模型装进业务流程、UI、记忆和成本结构里一起卖。Greg 直言“模型不再是产品”,AI21 甚至裁掉模型团队。DeepSeek 首次组建“Harness 团队”。但正文没披露这些 Agent 产品的实际效果或用户数据,判断主要来自高管发言和团队调整,验证还弱。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
03:47
21d ago
● P1量子位 · 公众号· rssZH03:47 · 05·23
DeepSeek V4 继续打价格战,缓存输入每百万 token 只要两分五;宁德时代、京东、网易在谈投资,梁文锋说目标是通用人工智能
DeepSeek-V4-Pro 的 API 从 6 月 1 日起维持促销价,缓存输入每百万 token 收 0.025 元人民币,这个价格在同类模型里算很低了。彭博社的消息说 DeepSeek 正在谈一轮 700 亿人民币的融资,投前估值 450 亿美元,宁德时代、京东、网易都有意参与。创始人梁文锋对外表态,公司的目标还是通用人工智能(AGI)。不过原...
#Inference-opt#DeepSeek#CATL#Liang Wenfeng
精选理由
这条消息把两件事串起来了:一是 DeepSeek V4 的 API 价格直接砍到促销价,输入缓存命中每百万 Token 只要 0.025 元,对用 API 做产品的团队来说成本降幅明显;二是彭博说宁德时代、京东、网易都在看这轮 700 亿融资,投前估值 450 亿美元,梁文锋还放了话目标是 AGI。价格数字和融资规模都够具体,没有模糊表述,对关注模型成本和资本动向的从业者来说信息密度高,所以给了 90 分。
一句话点评
DeepSeek V4 Pro 把缓存输入打到每百万 token 两分五厘,价格战继续。但正文被验证页挡了,融资和 AGI 表态都只能看摘要。
锐评
这条消息最实在的点是价格:DeepSeek-V4-Pro 的缓存输入每百万 token 收 0.025 元人民币,在同类模型里确实很低,对高频调用场景能省一笔。彭博社传的融资规模很大,700 亿人民币、投前估值 450 亿美元,宁德时代、京东、网易这些名字也出现了,说明资本和产业方都在押注。梁文锋重申目标是 AGI,这个表态本身不新鲜,但在融资传闻的背景下,更像是对投资人喊话。 不过原文被微信的验证页挡住了,我们只能依赖摘要。融资轮次、具体条款、资金用途这些关键信息都没法核实。价格虽然低,但没看到性能对比和实际吞吐限制,不知道便宜是不是以牺牲速度或质量换来的。另外,V4 Pro 和之前版本的能力差异、开源策略有没有变化,正文也没披露。这些缺口让整条消息更像一个信号而非可评估的事实。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
03:44
21d ago
● P1Hacker News 首页· rssEN03:44 · 05·23
微软内部测算发现AI处理某些任务成本高于雇人
微软内部测算发现,用 AI 处理某些任务的成本高于直接雇人。正文没披露具体对比了哪些岗位、用了什么模型、以及 token 消耗量或 agent 调用次数,所以这个“更贵”到底贵多少、在什么场景下成立,目前还不清楚。但微软自己承认 AI 成本高,说明大模型落地时,推理开销和人工替代之间的经济账还没算平。
#Agent#Microsoft#Commentary
精选理由
标题反转了“AI替代人力更省钱”的常见叙事,但正文只给了URL、17点和两条评论,没披露微软报告原文、成本口径(是按token、agent调用还是全周期TCO)、岗位类型(客服、编程还是内容生成),也没说对比的是全职人力还是外包人力。H和R两条通过,K不通过——信息太薄,没法验证。保留在all层级,分数压在60–71区间,因为证据不足,只能当引子看,不能当结论用。
一句话点评
微软自己算了一笔账,发现用AI处理某些任务,成本比直接雇人还高。
锐评
微软内部测算显示,AI 处理特定任务的成本高于雇佣人类员工。这条信息目前只来自 Hacker News 的标题和 AIhot 的简短转载,正文细节缺失,所以具体是哪些任务、成本高了多少、怎么算的,都不清楚。 我会先打个折:这很可能不是指所有 AI 应用,而是某些需要高算力、低容错、或者频繁人工兜底的场景。比如用大模型处理复杂客服工单,API 调用费加上人工审核成本,可能真不如一个熟手员工划算。但正文没披露测算口径,没法判断是纯推理成本还是算上了开发维护。 还缺的关键信息:对比的是美国还是全球人力成本?用的是 GPT-4 级别模型还是自研小模型?任务是一次性生成还是需要多轮交互?这些都会让结论差很多。建议等微软官方博客或研究报告出来再下判断,现在只能当个信号看——大模型落地时,ROI 确实不是默认成立的。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K0·R1
02:35
21d ago
AI HOT 精选· aihot-apiZH02:35 · 05·23
Kling AI 在戛纳办了场官方会,聊 AI 怎么进电影制作流程
Kling AI 在戛纳电影市场(Marché du Film)搞了场官方会议,跟全球电影人聊 AI 怎么真正进制作流程。官方说它已经用在动画长片、好莱坞剧集、实验短片和院线电影四种类型上。正文没披露具体合作方或项目细节,所以这点先别太激动——能进戛纳本身是个信号,但实际落地效果和规模还不清楚。
#Multimodal#Vision#Kling AI#Marché du Film
精选理由
触发硬排除-纯营销:核心事实是Kling AI在戛纳电影市场办了一场官方会议,没有新模型、新功能、新定价或可验证的成片列表。电影+AI的劳动力角度给了有限相关性,但正文没披露任何具体项目名称、制作成本或延迟数据,信息缺口太大,不值得推送。
一句话点评
Kling AI 在戛纳电影市场办了官方会议,宣称已用于动画长片、好莱坞剧集、实验短片和院线电影四种类型。能进戛纳是个信号,但正文没披露具体合作方或项目细节,实际落地效果和规模还不清楚,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R1
01:10
21d ago
r/LocalLLaMA· rssEN01:10 · 05·23
G4-MeroMero-26B-A4B:Gemma 4 的 uncensored 微调版,拒绝率降到 12%
LLMFan46 放出了 G4-MeroMero-26B-A4B-it-uncensored-heretic,这是基于 Google Gemma 4 的 26B 参数(实际激活 4B)模型做的微调版,主打“不设限”。标题里两个关键数字:KLD 0.0152 说明微调后和原模型的输出分布偏离很小,基本没改模型能力;12/100 的拒绝率意味着每 100 ...
#Fine-tuning#Benchmarking#LLMFan46#Hugging Face
精选理由
HKR三项全过:标题有反审查噱头,给出了具体的KLD和拒答数字,而且本地模型社区对'不拒答'这件事一直很在意。分数卡在60-71区间:这是一个小众的Reddit微调模型,没有经过验证,也没有广泛采用。
一句话点评
基于Gemma 4的26B参数模型(实际激活4B)做了个不设限微调版。KLD 0.0152说明输出分布偏离很小,基本没改原模型能力;12/100拒绝率意味着每100次提问只拒绝12次,比原版宽松不少。但正文被屏蔽,没披露具体用了什么数据、基准测试结果如何,也没说微调成本。如果真能保持原模型质量又降低拒绝率,对本地部署和角色扮演场景挺实用,但验证信息不足,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
00:41
21d ago
AI HOT 精选· aihot-apiZH00:41 · 05·23
Google DeepMind 扩大与新加坡合作,主攻科学发现、防疫和医疗
Google DeepMind 宣布扩大与新加坡的合作,新项目覆盖三个方向:加速科学发现、加强大流行病防范和改善医疗保健。正文没披露预算、时间表、具体模型或部署规模,所以目前只能知道合作范围变宽了,但投入多大、落地多快还不清楚。
#Safety#Google DeepMind#Singapore#Partnership
精选理由
这是一条 Google DeepMind 与新加坡扩大合作的简讯,正文只列出了三个方向(科学发现、大流行病防范、医疗保健),但没给预算、时间表或任何部署指标,所以从业者看完没法评估投入产出或跟进节奏。信息密度低,适合快速扫过,不值得深挖。
一句话点评
DeepMind 跟新加坡的合作又扩大了,这次覆盖科学发现、大流行病防范和医疗三个方向。但正文没披露预算、时间表、具体模型或部署规模,所以目前只能知道合作范围变宽了,投入多大、落地多快还不清楚。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
00:02
21d ago
Hugging Face 博客· rssEN00:02 · 05·23
Nemotron-Labs 扩散语言模型:目标接近光速的文本生成
英伟达在 Hugging Face 上发布了一篇博客,标题说他们的扩散语言模型目标是实现接近光速的文本生成。但正文是空的,所以没披露模型大小、具体速度指标、评测设置或是否开源。
#Inference-opt#Hugging Face#NVIDIA#Research release
精选理由
H 和 R 通过,因为扩散模型做文本生成直接指向推理速度和成本,方向本身有钩子。K 不通过:RSS 只有标题,没有速度数据、模型大小、发布状态或可复现的设置,信息不足以支撑更高评分,所以落在 60–71 区间。
一句话点评
英伟达发了一篇博客,标题说扩散语言模型要接近光速生成文本,但正文是空的。没披露模型大小、具体速度指标、评测设置或是否开源。信息缺口太大,没法判断真假,先别激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1

更多

频道

后台