ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-20

116 items · updated 3m ago
RSS live
2026-05-20 · 星期三2026年5月20日
23:53
23d ago
AI HOT 精选· aihot-apiZH23:53 · 05·20
Grok Build 上线 OpenCode 平台
Grok Build 现在可以直接在 OpenCode 上用了。但正文没交代怎么接入、定价多少、用的是哪个模型版本,也没说能不能稳定复现。想试的话得自己去翻文档或等官方补细节。
#Code#Tools#Grok#OpenCode
精选理由
HKR-K 仅靠“可用”这个事实勉强通过;HKR-H 和 HKR-R 都不达标,因为这是一条很薄的集成通知。正文没披露版本号、定价、接入路径或测试结果,所以只能归为小更新档位。
一句话点评
Grok Build 上了 OpenCode,但正文没交代接入方式、定价和模型版本,想试得自己翻文档。短评:能用但细节全缺,别急着冲。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K1·R0
23:34
23d ago
r/LocalLLaMA· rssEN23:34 · 05·20
用USB上网卡和预付费SIM卡搭短信告警,绕过Twilio审核
Reddit用户用USB GSM上网卡加预付费nano SIM卡,配合pyserial,给OpenWebUI搭了一套短信告警。原因是Twilio两次拒绝了他的营销活动申请。这套方案每月话费大概10到15美元,比Twilio按条计费便宜,但需要自己维护硬件和SIM卡。正文没披露短信延迟和并发上限,如果是高频告警场景,这点先别太激动。
#Tools#Twilio#OpenWebUI#Grok
精选理由
Twilio 拒两次就自己用 GSM 猫发短信,这个土办法对自建用户有吸引力。方案具体、成本低,但只适用于 OpenWebUI 告警这一个场景,范围窄,所以放在 all 层。
一句话点评
Reddit 用户用 USB GSM 上网卡加预付费 SIM 卡,给 OpenWebUI 搭了一套短信告警,每月话费约 10-15 美元,比 Twilio 按条计费便宜。但正文没披露短信延迟和并发上限,高频告警场景先别太激动。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R1
22:30
23d ago
TechCrunch AI· rssEN22:30 · 05·20
Clouted 获 700 万美元种子轮,想用 AI 帮短视频预测爆款
短视频剪辑公司 Clouted 拿到 Slow Ventures 领投的 700 万美元种子轮。它号称能帮创作者预测哪条短视频会火,但正文没披露产品具体怎么运作、有多少客户、定价多少,也没给出任何短视频推荐数据来验证效果。
#Clouted#Slow Ventures#Funding
精选理由
HKR-K 只靠融资额通过;正文没给产品机制、客户规模或推荐数据,AI 相关性很弱。
一句话点评
短视频剪辑公司 Clouted 拿了 700 万美元种子轮,投资方是 Slow Ventures。它号称能预测哪条视频会火,但正文没披露产品怎么运作、有多少客户、定价多少,也没给任何推荐数据来验证效果。目前只能当个融资消息看,产品能力存疑。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K1·R0
21:59
23d ago
Product Hunt · AI· rssEN21:59 · 05·20
Mixpanel 推出 Headless:用 Python SDK 把产品分析接口化,让 AI Agent 和开发者直接在 IDE 里查数据
Mixpanel 今天发布了 Headless,一个 Python SDK,核心是把产品分析能力做成可编程接口,开发者或 AI Agent 不用打开网页后台,直接在 IDE 里就能查用户行为数据。正文没披露 API 的具体范围、定价、认证方式和权限控制,所以实际能查多深、能不能安全地给 Agent 用,目前还不清楚。亮点是“Headless”这个思路—...
#Agent#Tools#Mixpanel#Product update
精选理由
这是一个小产品更新:对 agent 工具链有参考价值,但 API 范围、权限和定价都缺失。HKR-H 和 HKR-R 通过,HKR-K 不通过,所以留在 all 层级。
一句话点评
Mixpanel 把产品分析做成了 Python SDK,开发者或 AI Agent 不用打开网页后台,在 IDE 里就能查用户行为数据。思路挺实用,但正文没披露 API 能查多深、怎么认证、怎么收费,所以实际能安全地给 Agent 用多少还不清楚。短评:分析工具做成 API,Agent 直接查数据,省了切后台,但权限和定价没细说,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
21:54
23d ago
● P1彭博科技· rssEN21:54 · 05·20
Anthropic与SpaceX达成450亿美元三年算力采购协议
根据一份证券文件,Anthropic 跟马斯克的 SpaceX 签了份大单:未来三年支付差不多 450 亿美元,换取计算资源来支撑它的 Claude 模型。这笔钱摊下来每年约 150 亿美元,说明头部 AI 公司抢算力的成本已经拉到天文数字级别。不过正文被 Bloomberg 的机器人验证挡住了,具体是租 GPU 还是包数据中心、交付节奏和退出条款都没披露。
#Inference-opt#Anthropic#SpaceX#Elon Musk
精选理由
我会先打个折:450 亿美元是三年总承诺,不是一次性付款,但数字大到足以让任何 AI 公司重新算账。Anthropic 把算力押在 SpaceX 身上,说明它不想只靠 AWS 或 Google Cloud,分散供应商是明牌。不过正文没披露具体算力规格、交付时间表,也没说 SpaceX 的算力基础设施到底建到什么程度,这点先别太激动。Bloomberg 拿证券文件报出来,可信度比 PR 稿高,值得写。
一句话点评
Anthropic 三年要付给 SpaceX 近 450 亿美元买算力,年均 150 亿,这个数字比它自己的年收入还高,先别太激动,正文没披露具体 GPU 数量和交付节奏。
锐评
这条消息的核心就一个数字:三年 450 亿美元,折合每年 150 亿。放在 AI 行业里,这个采购规模是顶级的,说明 Anthropic 对算力的需求还在急剧膨胀,而且愿意把筹码押在马斯克的体系上。但 Bloomberg 原文被付费墙挡住,我们只能看到标题,正文没披露合同细节——比如用的是 SpaceX 自研芯片还是英伟达 GPU、算力以什么单位计价、交付时间表是什么。这些信息直接决定这笔交易是“真省钱”还是“溢价锁资源”。另外,Anthropic 目前的年收入大概在几十亿美元量级,一年光算力就花 150 亿,资金缺口怎么补、是不是靠新一轮融资撑着,正文也没提。我会先打个折:450 亿是合同上限还是固定承诺,这个区别很大。如果是真的,对 OpenAI 和 Google 的算力竞争格局会有直接冲击,但眼下缺的细节太多,只能当个信号看。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
21:29
23d ago
● P1TechCrunch AI· rssEN21:29 · 05·20
Anthropic 每月要付给 xAI 12.5 亿美元买算力
Anthropic 租下了 xAI 在孟菲斯 Colossus 1 数据中心的全部算力,每月账单 12.5 亿美元,合同签到 2029 年 5 月。头两个月有折扣,因为 xAI 那边还在爬坡。这笔钱来自 SpaceX 的上市文件,xAI 自己说这是在把闲置算力变现。说白了,Grok 用户量最近掉得厉害,服务器空出来了,正好租给竞争对手回血。不过正文没披...
#Inference-opt#Anthropic#xAI#Elon Musk
精选理由
TechCrunch 爆出 Anthropic 每月要给 xAI 付 12.5 亿美元买算力,对手方和价格都挺意外。正文只给了金额,没写买了多少卡、签了多久、跑在什么环境里,所以信息缺口不小。我会先打个折:金额够大,但缺关键细节,没法给到 90 分以上。
一句话点评
Anthropic 每月付 12.5 亿美元包下 xAI 整个数据中心,合同签到 2029 年。这笔钱来自 SpaceX 上市文件,但正文没披露具体算力规模和部署条件,先别急着算性价比。
锐评
Anthropic 租下了 xAI 在孟菲斯 Colossus 1 数据中心的全部算力,每月账单 12.5 亿美元,合同签到 2029 年 5 月。头两个月有折扣,因为 xAI 那边还在爬坡。这笔钱来自 SpaceX 的上市文件,xAI 自己说这是在把闲置算力变现。说白了,Grok 用户量最近掉得厉害,服务器空出来了,正好租给竞争对手回血。不过正文没披露具体有多少张 GPU、什么型号,也没说这 300 兆瓦的电力对应多少浮点运算能力。12.5 亿一个月的数字看着吓人,但不知道单位算力成本就没法判断是贵了还是便宜了。另外,Anthropic 拿这批算力是训练还是推理也没交代,两种场景对硬件要求差别很大。合同细节比如中途退出条款、算力交付标准也都没提,这些缺口让这笔交易的含金量暂时只能打个问号。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
21:28
23d ago
Hacker News 首页· rssEN21:28 · 05·20
Yapsnap:纯 CPU 转录 YouTube/TikTok 视频,一行命令,不用 GPU 和云
Yapsnap 是一个命令行工具,输入视频链接或音频文件就能输出文字稿,主打纯 CPU 运行、不依赖 GPU 和云服务。对个人用户来说,这意味着不用买显卡、不用配云账号,本地就能跑。但正文没披露用了什么模型、转录速度多快、支持哪些语言,也没说开源协议。目前 GitHub 上只有 1 个 Star、0 个 Issue,项目还非常早期。如果速度能接受,这对...
#Audio#Tools#yapsnap#GitHub
精选理由
标题的“纯 CPU 转录社交视频”是个很直接的钩子,从业者会想“不用 GPU 也能跑,成本低还能本地跑”,所以 H 和 R 都成立。但正文只有标题和 GitHub 链接,没有模型、速度、准确率这些关键信息,K 过不了。整体信息太少,只能放 lower all 档。
一句话点评
一个纯 CPU 跑的视频转文字命令行工具,不用 GPU 也不用云,对没显卡的个人用户很友好。但项目太早期了,GitHub 上只有 1 个 Star,正文没披露用了什么模型、转录速度多快、支持哪些语言,也没说开源协议。如果速度能接受,这倒是省钱的本地方案,但这点先别太激动,等作者补上关键信息再说。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
21:12
23d ago
● P1彭博科技· rssEN21:12 · 05·20
Anthropic营收增长加速,预计迎来首个盈利季度
彭博这条消息说 Anthropic 正朝着公司第一个盈利的季度迈进,主要驱动力是市场对它的 AI 软件需求猛涨。不过正文被付费墙挡了,没披露具体收入规模、利润区间,也没说是哪个季度。我会先打个折:盈利趋势是真的,但数字和细节都看不到,这点先别太激动。
#Anthropic#Funding
精选理由
我会先打个折:正文没给具体数字,营收多少、利润多少、哪个季度都不清楚,所以这条消息更像一个方向性信号,不是实锤。但 Bloomberg 的报道本身有信息量——Anthropic 靠卖 AI 软件把营收拉起来了,可能第一次不亏钱。这对一直烧钱的 AI 实验室来说是个转折点,从业者会盯着后续财报验证。
一句话点评
Anthropic跟投资人说自己下季度营收要翻倍到109亿美元,并且首次实现运营盈利。但别急着开香槟,后面算力账单太大,全年不一定能守住盈利。
锐评
Anthropic预计在2026年第二季度营收达到约109亿美元,比上一季度翻了一倍多,并且会首次出现运营利润。这个数字来自它发给投资人的融资材料,由华尔街日报先报出来,TechCrunch等媒体跟进。翻倍增长确实猛,说明Claude在专业用户里的口碑转化成了真金白银,公司也在推小企业服务和律所工具来分散客户群。 但这条消息有两个地方要打折。第一,盈利只是“运营利润”,不是净利润,而且公司自己预警说后面几个季度会因为巨大的算力支出重新掉回亏损。第二,所有数据都是Anthropic单方面给投资人的说法,没有经过审计,公司也拒绝公开评论。同一天OpenAI传出要在九月IPO,这个时间点放盈利消息,多少有点给竞争对手上眼药的意思。 还缺什么?我们看不到成本结构,不知道这109亿营收里推理成本、模型训练成本各吃掉多少,也不知道客户留存率和企业合同的具体条款。没有这些,单季运营盈利更像一个融资节点上的里程碑,而不是商业模式已经跑通的铁证。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
21:06
23d ago
彭博科技· rssEN21:06 · 05·20
英伟达财报电话会要点:分析师聊了啥,但具体数字没披露
彭博采访了Gabelli Funds的John Belton,聊英伟达一季度财报和展望。但正文没披露营收、利润、数据中心业绩或指引区间,所以目前只有分析师观点,没有硬数字可验证。
#Bloomberg#Nvidia#John Belton#Commentary
精选理由
HKR-H 和 HKR-R 通过,因为 Nvidia 财报直接关系 AI 算力预期;但 HKR-K 不通过:正文没给出营收、利润、数据中心或指引数字,属于泛泛的行业报道。
一句话点评
彭博采访了Gabelli Funds的分析师聊英伟达财报,但正文没披露营收、利润、数据中心业绩或指引区间,只有观点没有硬数字。短评:分析师观点为主,缺关键数字,参考价值打折。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
21:04
23d ago
r/LocalLLaMA· rssEN21:04 · 05·20
2026版大模型显存速算:一张卡能跑多大模型?
Reddit LocalLLaMA 板块有人发帖讨论2026年大模型显存计算,但正文被 Reddit 屏蔽了,只留下标题和一张图。标题暗示帖子里应该包含不同精度、模型大小和上下文长度下的显存估算公式,类似“多少B参数配多少GB显存”那种速查表。可惜正文完全没披露具体数字和假设条件,比如是FP16还是INT4、是否算KV Cache、有没有考虑张量并行。...
#Inference-opt#Reddit#LocalLLaMA#XMasterrrr
精选理由
H和R通过:显存计算是本地LLM的真实痛点。K不通过:正文没披露任何公式、示例或可复现条件,信息缺口太大,只能算低带宽的链接转发。
一句话点评
标题说2026版显存速算,但正文被Reddit屏蔽,只留一张图。看不到精度假设(FP16还是INT4)、是否含KV Cache、张量并行配置。如果是本地跑模型的人,这类速查表确实有用,但没披露具体数字和条件,没法直接参考。建议等原帖作者补全或去评论区翻。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
20:55
23d ago
● P1彭博科技· rssEN20:55 · 05·20
SpaceX 2025年资本开支207亿美元用于AI和航天器
SpaceX 在 2025 年花了 207 亿美元,主要用于 AI 和航天器。这个数字比很多国家一年的科技预算都高,说明马斯克在同时押注两条线:一边用 AI 优化火箭发射和卫星网络,一边加速星舰等航天器量产。正文没披露具体哪些 AI 项目在烧钱,也没说 IPO 时间表,所以这点先别太激动——钱花得多不等于马上上市。
#SpaceX#Funding
精选理由
HKR 的 H 和 K 靠体量和具体数字 207 亿美元通过,但 R 弱,因为 AI 关联缺少项目、算力和融资细节。落在 60–71 区间。
一句话点评
SpaceX 上市文件显示 2025 年资本开支 207 亿美元,AI 和航天器是两大烧钱方向,但没拆开各自占多少。
锐评
SpaceX 在 IPO 文件里把 2025 年的资本开支定在 207 亿美元,主要投向 AI 和航天器。这个数字本身很大,但正文没披露 AI 和航天器各自分到多少预算,也没说 AI 这部分是给 Starlink 做网络优化,还是跟 xAI 有算力上的往来。xAI 去年亏了 64 亿美元,SpaceX 这边又在大笔投 AI,钱是不是在两家公司之间流转、怎么流转,文件里看不出来。对想判断 SpaceX 估值的人来说,缺的就是这笔 AI 投入到底能换来什么——是自用降本,还是对外卖算力,目前都只能猜。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R0
20:55
23d ago
Hacker News 首页· rssEN20:55 · 05·20
Anthropic 将入驻 SpaceX 的 Colossus 2,用 GB200 跑 Claude 推理
Anthropic 的 Tom Brown 发推说,他们正在扩大与 SpaceX 的合作,6 月会在 Colossus 2 上扩容 GB200 容量来跑 Claude 推理。Colossus 是马斯克建的超级算力集群,之前主要给 xAI 用,现在 Anthropic 也挤进去了。GB200 是英伟达的下一代 GPU 平台,单卡算力比 H100 高不少,...
#Inference-opt#Anthropic#Product update
精选理由
HKR 三项都通过,但来源只有标题级信息:没有规模、时间表、合同或官方材料。作为 Anthropic 算力供应信号,评分落在 60–71 区间合理。正文没披露具体部署规模、时间节点和采购条件,这点先别太激动。
一句话点评
Anthropic 的 Tom Brown 发推说,6 月会在马斯克的 Colossus 2 集群上扩容 GB200 来跑 Claude 推理。这意味着 Claude 的推理算力要上一个台阶,GB200 单卡算力比 H100 高不少,但正文没披露具体扩容规模、部署时间线或供应商条款。短评:算力军备竞赛从买卡进化到租卡,Anthropic 挤进 xAI 的集群,说明 GPU 确实紧俏。但这条推...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
20:53
23d ago
AI HOT 精选· aihot-apiZH20:53 · 05·20
OpenClaw 2026.5.19 更新:安卓端实时语音对话上线,Mac 界面更清爽
OpenClaw 发了新版本,主要亮点是 Android 端 Talk Mode 终于支持实时对话了,之前可能有点延迟,现在体验更流畅。Mac 版设置界面重新整理过,看着没那么乱。还加了 xAI 的无头登录模式,适合在服务器或后台跑脚本时用。Telegram 话题功能也更稳了。不过正文没提性能提升多少、什么时候全量推送,这些还得等实测。
#Audio#Tools#OpenClaw#xAI
精选理由
HKR-K 靠两个具体功能变化通过,HKR-H 和 HKR-R 都很弱。这是一个小规模开源工具更新,没有指标或规模数据,落在 60–71 区间。
一句话点评
OpenClaw 新版本把 Android 端对话延迟砍了,实时感提升;Mac 设置界面终于不乱了。还加了无头登录,适合服务器跑脚本。但性能提升多少、全量推送时间都没说,得实测。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
20:49
23d ago
● P1彭博科技· rssEN20:49 · 05·20
英伟达公布一季度财报 每股收益超预期营收指引910亿
英伟达刚发了 2026 财年第一季度的财报,每股收益 1.87 美元,比华尔街预期的 1.77 美元高出一截。公司对截至 7 月的当季营收指引是 910 亿美元,也明显高于市场预估的 874 亿左右。这条视频本身是彭博的报道片段,正文没披露各业务线的具体表现和毛利率细节,所以没法判断增长是数据中心业务继续拉动的,还是有别的板块在补位。
#Inference-opt#Nvidia#Bloomberg#Wedbush Securities
精选理由
Nvidia 财报是观察 AI 基础设施热度的关键节点,910 亿的指引给 HKR 三项都提供了实打实的信号。这不是模型或功能发布,所以放在 featured 档位没问题,信息质量够硬。
一句话点评
英伟达一季度每股收益超预期,下季营收指引给到910亿美元,但正文没披露具体利润数字和增长结构,先别急着算估值。
锐评
英伟达这份一季报,目前能确认的是两个点:每股收益比市场预期好,以及公司自己对下个季度的营收指引是910亿美元。这个910亿的数字挺关键,它直接反映了英伟达对接下来芯片需求的判断,尤其是数据中心业务能不能继续猛跑。 不过,现在能看到的信息来自一段视频报道,正文里没有给出本季度的具体营收、净利润、毛利率,也没提各业务线的增速。这就意味着我们没法判断超预期是靠主业拉动,还是有一次性收益。另外,910亿的指引是公司自己给的,市场原本的预期是多少、差距有多大,报道里也没说。 对从业者来说,这份财报最大的信号是需求端还没踩刹车,但缺了成本结构、库存水平和客户集中度的数据,还看不清这轮增长的安全边际有多厚。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
20:25
23d ago
● P1AI HOT 精选· aihot-apiZH20:25 · 05·20
英伟达2027财年Q1净利润583亿美元同比增长211%
英伟达 2027 财年第一财季(截止到 2026 年 4 月 26 日)总收入 816.15 亿美元,净利润 583.21 亿美元,同比直接翻了两倍多。增长主要靠数据中心业务,单这一块就进账 752 亿美元,同比涨了 92%。毛利率也拉到了 75% 左右,比去年同期高了 14 个百分点。公司预计下个季度收入能到 910 亿美元,上下浮动 2%。另外,董...
#Inference-opt#Nvidia#Product update
精选理由
英伟达这份财报就是AI基础设施景气度的温度计。数据中心752亿美元的收入说明大厂还在疯狂囤卡,211%的利润增速比很多AI公司的营收涨得还快。我会先打个折:这是财务数据,不是新模型或新功能发布,所以重要性停在82分。但数字本身已经足够让关注算力成本和供应链的人必须看一眼。
一句话点评
英伟达一个季度净赚583亿美元,同比涨了211%,但股价反而跌了2%,说明市场对它的预期已经高到离谱。
锐评
英伟达这个季度的财报数字确实夸张。总收入816亿美元,其中数据中心业务就占了752亿,同比涨了92%,基本是靠卖AI芯片撑起来的。净利润583亿,比去年同期翻了两倍多,毛利率也提到了75%左右,赚钱效率很高。公司还一口气批了800亿美元的回购计划,股息也涨了25倍,回馈股东的手笔很大。 但有个细节值得注意:下季度营收指引是910亿,只比这季度多了不到100亿,增速在放缓。而且财报这么好,股价反而跌了2%,说明市场之前已经把预期打得太满,现在看到增长没超预期就开始犹豫了。 正文没提具体是哪款芯片卖得最好,也没说竞争对手的情况。如果想知道这波增长还能撑多久,还得看后续大客户的订单是不是在减少,以及有没有更便宜的替代方案冒出来。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
20:23
23d ago
彭博科技· rssEN20:23 · 05·20
英伟达财报指引不及预期,芯片竞争加剧
英伟达最新季度财报显示,公司正努力向投资者证明AI已准备好进入主流市场,强调业务多元化和对大型数据中心运营商的依赖降低。但财报给出的业绩指引令人失望,芯片竞争压力加大。正文未披露具体的营收预测数字、竞争对手名称或收入构成细节。
#Inference-opt#Nvidia#Bloomberg#Commentary
精选理由
Bloomberg 报道 Nvidia 季报,核心看点是公司主动向市场解释 AI 已到主流化阶段,但正文信息密度低——没给财务指引、没点名竞争对手、没拆收入结构。所以 H 和 R 成立,K 不成立。信号强度落在 60–71 的通用信号区间,适合推送给所有关注 AI 芯片和算力趋势的读者。
一句话点评
英伟达最新财报想讲“AI已进入主流市场”的故事,但给出的业绩指引却让市场失望。正文没披露具体营收预测数字,也没点名竞争对手是谁,信息缺口明显。关键看点是:英伟达强调业务多元化和降低对大客户的依赖,这暗示它意识到单一市场风险。但“失望的指引”说明竞争压力(比如定制芯片或AMD)已经影响到预期。短评:故事讲得漂亮,数字没跟上,先别急着信。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K0·R1
20:12
23d ago
彭博科技· rssEN20:12 · 05·20
Baillie Gifford:中国芯片性能仍落后美国与英伟达
Baillie Gifford 的投资经理 Paulina McPadden 在 Bloomberg 视频里说,中国芯片在性能上仍然落后于美国和英伟达。正文没披露具体差多少、用什么基准测的,也没说他们看好哪些 AI 投资标的。所以这条信息更像一个定性判断,没有量化缺口,暂时没法判断差距是在缩小还是拉大。
#Inference-opt#Baillie Gifford#Nvidia#Paulina McPadden
精选理由
HKR-R 靠中美芯片竞争话题过关,但 HKR-H 是常规的“中国 vs 英伟达”角度,HKR-K 缺少基准和差距数字;来源是 Baillie Gifford 的公开评论,有可信度但不足以进精选。
一句话点评
Baillie Gifford 投资经理在 Bloomberg 视频里定性说中国芯片性能仍落后美国/英伟达,但正文没披露具体差多少、用什么基准测的,也没说差距在缩小还是拉大。这条信息更像一个观点表态,没有量化缺口,暂时没法判断趋势。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R1
20:10
23d ago
持续报道 · 22d彭博科技· rssEN20:10 · 05·20
英伟达财报、SpaceX IPO申报、软银追投OpenAI
这期 Bloomberg Tech 聊了三件事:英伟达马上发财报,市场在等数字;SpaceX 准备提交 IPO 文件,号称历史级别;软银继续加注 OpenAI。正文没披露英伟达的具体营收或利润预期,也没说 SpaceX 打算融多少钱、估值多少,软银的投资条款同样没给。信息量有限,适合当个话题索引,具体判断得等更多细节出来。
#Nvidia#SpaceX#SoftBank#Funding
精选理由
低价值资讯汇总:H 靠 Nvidia 财报和 SpaceX IPO 申报撑起标题吸引力;K 和 R 都不及格,因为正文没披露任何指标、规模或投资条款,对从业者没有可落地的信息。
一句话点评
英伟达财报和SpaceX IPO是本周两条主线。英伟达决定AI算力股短期情绪,SpaceX若上市将是近年最大科技IPO之一。Bloomberg这期是视频摘要,正文没披露具体营收预期或估值数字,信息密度偏低。想看细节得等正式财报和招股书。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R0
19:47
23d ago
TechCrunch AI· rssEN19:47 · 05·20
吴恩达投的 IrisGo:一个盯着你屏幕学干活的小助手
IrisGo 是一款桌面 AI 助手,能盯着你的屏幕,自动学会怎么帮你干活。创始人说它像个“AI 管家”,但正文没披露什么时候上线、卖多少钱、支持什么系统、有没有安全控制,也没给可复现的任务执行测试结果。目前只能当个概念听,别急着让它接管电脑。
#Agent#Tools#IrisGo#Andrew Ng
精选理由
我会先打个折:IrisGo 说它的桌面 AI 能观察屏幕、自动学任务,听着像替你干活的数字同事,但正文没披露发布时间、价格、支持平台,也没说能力边界在哪——比如能稳定复现几步操作、会不会误触隐私数据。Andrew Ng 背书让这条消息有传播力,桌面 agent 又正好踩在自动化和工作流痛点上,所以 H 和 R 都成立。K 弱是因为关键落地信息全缺,没法判断是真省钱还是 demo 好看,分数就停在 64。
一句话点评
吴恩达投的 IrisGo 号称能盯着你的屏幕自学干活,像个“AI 管家”。但正文没披露上线时间、价格、支持什么系统,也没给可复现的任务执行测试结果。目前只能当个概念听,别急着让它接管电脑。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
19:38
23d ago
AI HOT 精选· aihot-apiZH19:38 · 05·20
Midjourney V8.1 上线反向提示:用 --no 排除画面元素
Midjourney 在 V8.1 版本中恢复了反向提示功能(旧版已有),通过 --no 标志排除指定元素,比如输入 --no people 就能生成不带人物的图像。操作简单直接,适合需要快速去掉画面中某些内容的场景。正文没披露该功能对生成质量或速度的具体影响,但作为老功能回归,使用门槛很低。
#Vision#Midjourney#Product update
精选理由
Midjourney V8.1 加了 --no 反向提示,用户可以用 --no people 这类指令排除画面元素。功能本身很实用,但正文只给了一个例子和一句话说明,没提生成质量变化、定价或模型其他改动,信息量偏少。
一句话点评
Midjourney V8.1 把老功能“反向提示”捡回来了,用 --no people 就能让画面里不出人,操作跟旧版一样简单。对经常要快速排除特定元素的用户挺实用,不用再靠写长 prompt 绕弯子。但正文没提加了这个 flag 后生成速度会不会变慢、画质有没有折扣,也没说支持多元素组合排除。功能本身门槛低,老用户直接上手,新用户看一眼语法就会。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
19:17
23d ago
r/LocalLLaMA· rssEN19:17 · 05·20
Qwen3-VL-Embedding-2B 跑在 Orange Pi 5b 上,一张图处理约 10 秒
Reddit 用户 atineiatte 把 Qwen3-VL-Embedding-2B 模型跑在了 Orange Pi 5b 开发板上,用的是 rkllm 推理框架。他写了个 demo 脚本,拿实时摄像头画面跟 1300 多条短语做比对,每张图处理时间大约 10 秒。这个速度不算快,但考虑到是在一块几百块的开发板上跑视觉 embedding 模型,成...
#Vision#Embedding#Inference-opt#Qwen
精选理由
H/K/R 三项都达标。第一人称实测,数字和工具链都给了,可信度还行。但来源是 Reddit 单帖,受众偏小众,离 72 分的精选线还差一点。
一句话点评
有人在 Orange Pi 5b(几百块的开发板)上跑通了 Qwen3-VL-Embedding-2B,用实时摄像头画面跟 1300 多条短语做比对,每张图处理约 10 秒。速度不算快,但成本极低,适合离线或边缘场景。正文没披露精度和功耗,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
19:10
23d ago
AI HOT 精选· aihot-apiZH19:10 · 05·20
MiniMax语音模型新增600多种声音
MiniMax Speech 2.8 Turbo 在 Together AI 上新增了 600 多种声音,你可以通过一个语音查找器试听。但正文没披露价格、支持哪些语言、有没有调用次数限制——这些对实际选型很关键,目前只能先当个功能预告看。
#Audio#MiniMax#Together AI#Product update
精选理由
H和K通过:600+声音和Together AI上线是具体信息。但全文只有一个demo链接,没有价格、语种、调用限制或评测对比,所以只能算一个小产品更新,不值得深入分析。
一句话点评
MiniMax 在 Together AI 上一次性塞了 600 多种声音,语音合成选型时选择面更宽了。但正文没披露价格、支持哪些语言、有没有调用次数限制——这些对实际选型很关键,目前只能先当个功能预告看。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
18:36
23d ago
r/LocalLLaMA· rssEN18:36 · 05·20
LLC:一个更轻量的 OpenWebUI 替代品,新增聊天记录转换和自定义工具调用
LocalLightChat v0.6 主打轻量,能直接导入 OpenWebUI 的聊天历史(从 webui.db 读取,图片可存本地或内嵌 base64),还支持自定义工具调用——相当于让本地模型能调用外部函数干活。正文没披露具体性能对比或资源占用数据,但轻量定位意味着对显存和内存要求更低,适合不想跑完整 OpenWebUI 的用户。
#Tools#LocalLightChat#OpenWebUI#LocalLightAI
精选理由
这是一个小型本地大模型工具更新,有具体的迁移和工具调用细节。单一 Reddit 来源且覆盖范围窄,评分落在 60–71 的小产品更新区间。
一句话点评
LocalLightChat v0.6 是个轻量版聊天界面,能直接导入 OpenWebUI 的聊天记录和图片,还支持让本地模型调用外部函数。适合不想跑完整 OpenWebUI 的用户,但正文没披露具体资源占用和性能对比,轻量到底省多少显存、快多少,得自己试。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
18:28
23d ago
AI HOT 精选· aihot-apiZH18:28 · 05·20
Google Gemini 联合 XPRIZE 办全球黑客松,用智能体工具解决现实问题
Google Gemini 和 XPRIZE 搞了个全球黑客松,要求参赛者用 Gemini 的智能体工具(就是让模型能调用工具、执行任务的 agent 能力)去解决真实世界的挑战。目前正文没披露赛程、奖金池、参赛资格和评审标准,想报名得自己去官网看。
#Agent#Tools#Gemini#XPRIZE
精选理由
只有 HKR-H 通过:Gemini 和 XPRIZE 的组合有品牌认知度,但 HKR-K 和 R 都不满足——赛程、奖金、评审、参赛资格全部缺失。没有硬排除规则触发,所以落在 40–59 的低价值区间。
一句话点评
Google Gemini 和 XPRIZE 合办全球黑客松,要求用 Gemini 的智能体工具(让模型能调用工具、执行任务)解决真实世界问题。目前正文没披露赛程、奖金池、参赛资格和评审标准,想报名得自己去官网看。短评:大厂+知名赛事背书,但信息太少,先别激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
18:15
23d ago
Hacker News 首页· rssEN18:15 · 05·20
铜板散热号称让数据中心省电90%,但正文没给任何测试细节
New Atlas 发了一篇报道,标题说铜板散热技术能把数据中心能耗砍掉 90%。但点进去正文只有网站导航和评论区链接,没写铜板怎么工作、跟什么比省了 90%、成本多少、什么时候能用。Hacker News 上目前 11 分、5 条评论,信息量约等于零。这个数字很漂亮,但先别激动——没有基线、没有实验条件,90% 目前就是个标题数字。
#New Atlas#Hacker News
精选理由
H和R通过:90%能耗降低的宣称有吸引力,且切中数据中心电费敏感点。K不通过:RSS正文只给了标题和评分,没提铜板怎么冷却、在什么环境下测的、要花多少钱装,所以整体评分偏低。
一句话点评
标题说铜板散热能砍数据中心90%能耗,但正文只有导航和评论区链接,没写原理、基线、成本、时间线。Hacker News上11分5条评论,信息量约等于零。这个数字很漂亮,但先别激动——没有实验条件,90%目前就是个标题数字。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
17:47
23d ago
FT · 科技· rssEN17:47 · 05·20
扎克伯格承诺Meta不再搞“全公司范围”裁员,此前已砍掉8000个岗位
扎克伯格对Meta员工说,以后不会再搞“全公司范围”的裁员了。此前Meta已经裁了8000人。不过正文没披露这个承诺的具体时间范围、适用条件,也没说是不是正式政策,所以这点先别太激动,可能只是内部安抚。
#Mark Zuckerberg#Meta#Personnel
精选理由
这条消息卡在H/K/R的及格线上,但正文只给了Meta的人事承诺和8000人裁员数字,没提AI部门、模型预算或产品影响,属于大厂人事新闻的常规范畴。
一句话点评
扎克伯格口头承诺Meta不再搞全公司裁员,但之前已裁8000人。正文没披露承诺的时间范围、适用条件,也没说是正式政策,所以先别太激动,可能只是内部安抚。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
17:40
23d ago
The Verge · AI· rssEN17:40 · 05·20
谷歌要把“氛围编程”搬上手机:自己写App放桌面
The Verge 报道,谷歌在 I/O 2026 上宣布 Android AI Studio,让用户直接在手机上写 App 并放到主屏幕。核心是“vibe coding”——用自然语言描述需求,AI 自动生成代码,不用学编程。正文没披露工具的具体机制、上线时间或是否免费,但方向很明确:把 App 开发从电脑 IDE 拉到手机界面,门槛降到“说句话就行...
#Code#Tools#The Verge#Google
精选理由
H 和 R 过关:手机主屏上跑 vibe coding 是个干净的平台钩子。K 偏弱:文章缺工具名、发布时间和 Android AI Studio 机制,所以留在 all 层。
一句话点评
谷歌I/O 2026宣布Android AI Studio,让你在手机上用自然语言写App,直接放主屏幕。核心是“vibe coding”——说句话就生成代码,不用学编程。但正文没披露工具具体机制、上线时间或是否免费。方向很明确:把开发门槛降到“说句话就行”,但实际效果和限制未知。短评:手机写App听着酷,但没细节前先别激动,可能只是高级快捷指令。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
17:21
23d ago
● P1FT · 科技· rssEN17:21 · 05·20
OpenAI 准备最快九月提交 IPO 申请
FT 这篇报道的正文被付费墙和安全验证挡住了,只拿到了标题和摘要。已知信息是:OpenAI 正在准备 IPO 文件,最快今年 9 月挂牌,目标估值冲到 1 万亿美元。承销商名单里有高盛、摩根士丹利和 Cooley 律所。但具体的发行条款、上市交易所、财务数据这些关键信息,正文没披露——或者说我们拿不到。1 万亿这个数字我先打个折看,毕竟现在连 S-1 ...
#OpenAI#Goldman Sachs#Morgan Stanley#Funding
精选理由
我会先打个折:1 万亿估值目标听着很吓人,但正文没披露这个数字是怎么算出来的,也没说收入、利润或用户增长的具体支撑,这点先别太激动。不过,FT 的报道把时间点、承销商和律所都点出来了,信息颗粒度够细,不是捕风捉影。一家基础模型公司走到 IPO 提交这一步,本身就是行业顶格的信号,所以重要性给到 95 没问题。
一句话点评
OpenAI 最快本周提交 IPO 申请,目标九月上市。赢了马斯克的官司后,它立刻把战场转向了华尔街。
锐评
OpenAI 准备上市了,时间点卡得很紧。在马斯克输掉那场威胁公司架构和融资的官司后第二天,消息就放出来了,目标是最快九月挂牌。据华尔街日报的消息源,它已经在跟高盛和摩根士丹利合作,可能几天或几周内就会秘密提交招股书。 这个节奏说明 OpenAI 想趁热打铁,把法律上的胜利直接转化成资本市场的信心。但报道里没提任何财务数据,比如营收、亏损、用户增速,这些才是决定它是不是“重磅 IPO”的关键。另外,SpaceX 的招股书也快公开了,两家公司会在融资能力上直接竞争,这比打官司更考验 Sam Altman。 现在最缺的信息是 OpenAI 的盈利模型到底长什么样。烧钱换规模的故事在 2026 年还能不能讲通,得等招股书出来才知道。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
17:06
23d ago
r/LocalLLaMA· rssEN17:06 · 05·20
5千美元能组一台AI服务器吗?
Reddit用户说自己用Framework台式机跑Qwen 7B,配128GB内存和12GB显存的RTX 3080,然后问大家:5千美元以内买机架式服务器加GPU划算,还是继续用工作站?正文被屏蔽了,看不到具体讨论。不过这个配置跑7B模型显存刚好够,12GB显存跑7B量化模型没问题,但跑更大模型或做微调就吃力了。5千美元预算买二手服务器加一张专业卡(比...
#Inference-opt#Reddit#Qwen#Framework
精选理由
HKR-H/R通过,因为5千美元本地服务器困境很实际且能引发共鸣;但HKR-K不通过:帖子没给出答案、评测或购买建议,属于低价值社区信号。
一句话点评
5千美元预算买AI服务器,Reddit用户纠结是上机架式服务器加GPU还是继续用工作站。他目前用Framework台式机+128GB内存+12GB RTX 3080跑Qwen 7B,显存刚好够,但跑大模型或微调就吃力。正文被屏蔽,看不到具体讨论。关键限制:12GB显存跑7B量化模型还行,但想跑更大模型或做微调,预算得往二手服务器加专业卡方向走。缺的是具体配置方案和性价比对比,比如二手服务器加...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
16:53
23d ago
Hacker News 首页· rssEN16:53 · 05·20
Dari-docs:用多模型并行跑文档测试,自动挑出写得烂的地方
mupt-ai 开源了一个叫 Dari-docs 的工具,核心思路是让多个大模型(支持不同供应商)并行读你的文档,然后各自输出一份 Markdown 反馈,告诉你哪里写得不清、缺例子、逻辑跳。你可以通过网页或命令行上传文档,工具会按任务列表分发给多个 agent 并行跑。好处是能快速拿到不同模型的视角,缺点是目前没有公开的评测数据,不知道这些反馈的准确...
#Agent#Code#Tools#mupt-ai
精选理由
一个Show HN小工具,流程讲得清楚但缺效果数据、定价和落地场景。HKR的h和k能过,r太弱,所以放在常规产品更新all档。
一句话点评
短评:用多个大模型并行审文档,想法不错,但没评测数据,先别太激动。 mupt-ai 开源的 Dari-docs,核心是让你上传文档后,同时派多个大模型(支持不同供应商)去读,每个模型独立输出 Markdown 反馈,指出哪里不清、缺例子、逻辑跳。好处是能快速拿到不同模型的视角,避免单一模型偏见。但正文没披露任何评测数据,比如这些反馈的准确率、漏报率,或者跟人工审校对比的效果。目前只能当个辅...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
16:48
23d ago
AI HOT 精选· aihot-apiZH16:48 · 05·20
Anthropic销售负责人用Claude Cowork管4000个客户,每晚自动打分,每天省90分钟
Anthropic美国中端市场销售负责人Travis Bryant分享了他怎么用自家产品Claude Cowork管4000个客户账户。流程是:每晚让Claude Cowork自动跑一遍所有账户数据,生成客户倾向分(谁更可能成交)、每日简报和每周销售预测。之前这些事要跨部门团队花几百小时才能做完,现在他一个人每天省下大约90分钟。正文没披露具体用了哪些...
#Agent#Tools#Anthropic#Travis Bryant
精选理由
硬排除-纯营销:这是Anthropic自家销售负责人用Claude Cowork的案例。4000个账户和90分钟的数字增加了信号,但“X用Y”的格式封顶39分。
一句话点评
Anthropic销售负责人用自家Claude Cowork每晚自动跑4000个客户账户数据,生成成交倾向分、简报和预测。之前跨部门团队要几百小时,现在他一人每天省90分钟。正文没披露具体用了哪些数据源、倾向分准确率如何,以及是否依赖CRM接口。省时效果直观,但规模化验证和成本细节缺失。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K1·R1
16:47
23d ago
Product Hunt · AI· rssEN16:47 · 05·20
MartinLoop:给AI编程Agent上笼头——设限额、留凭证、能回滚
MartinLoop 是一个控制层,专门管那些自主写代码的 AI Agent。它目前支持 Claude、Codex、OpenCode 等工具,核心功能是给 Agent 设花费上限、做结果校验、加安全规则、支持回滚,并且每次运行都会出一张“运行收据”,记录 Agent 做了什么、为什么继续、为什么停下。说白了就是防止 Agent 失控乱花钱或乱改代码。产...
#Agent#Code#Tools#MartinLoop
精选理由
只有 R 成立:给编码 agent 加限制和运行凭证这个方向对开发者有共鸣,但正文缺价格、集成方式和机制细节,信息缺口太大。当一个小工具发布处理,留在 all 以下即可。
一句话点评
MartinLoop 给写代码的 AI Agent 套了个笼头:设花费上限、做结果校验、支持回滚,每次运行还出一张“收据”记录 Agent 干了什么、为什么停。说白了就是怕 Agent 失控乱花钱或乱改代码。目前支持 Claude、Codex、OpenCode 等工具,免费。但正文没披露具体怎么校验结果、安全规则能细到什么程度,也没说集成深度——是只拦 API 调用还是能 hook 到代码仓...
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
16:03
23d ago
r/LocalLLaMA· rssEN16:03 · 05·20
单块 DGX Spark 跑 Qwen 3.5 122B Int4,速度冲到 40+ tok/s
Reddit 用户 Storge2 分享了一套配置,用 vLLM 在单块 DGX Spark 上把 Qwen 3.5 122B Int4 模型的推理速度推到 40+ tok/s。他自称这个成绩在 spark-arena 的各个上下文长度和并发测试里都是最高分,但没公开完整设置。40+ tok/s 意味着每秒能生成 40 多个 token,对 122B ...
#Inference-opt#Qwen#NVIDIA#vLLM
精选理由
一条 Reddit 帖子,说在单台 DGX Spark 上用 vLLM 跑 Qwen 3.5 122B 的 Int4 版本,能到 40+ tok/s。速度不错,但正文没披露完整参数(比如 batch size、精度、显存占用),复现门槛不低。对想低成本本地跑大模型的人是个信号,但别急着下单硬件,等更多验证。
一句话点评
Reddit 用户 Storge2 声称用 vLLM 在单块 DGX Spark 上把 Qwen 3.5 122B Int4 跑到了 40+ tok/s,自称是 spark-arena 最高分。40+ tok/s 对 122B 模型来说确实快,但正文没披露完整配置,也没说用了什么量化精度和 batch size。这点先别太激动,可能是特定优化技巧,未必能直接复现。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:56
23d ago
AI HOT 精选· aihot-apiZH15:56 · 05·20
OpenRouter 自动路由会锁住会话直到缓存过期
OpenRouter 发帖解释自动路由的缓存行为:一旦路由命中,会话会固定在同一模型或提供商上,直到缓存过期,所以不用担心自动切换导致缓存失效。正文没披露缓存时长、缓存 key 规则以及什么条件下会切换提供商。
#Inference-opt#OpenRouter#Product update
精选理由
HKR三项都成立,但正文只交代了会话亲和性,缓存时长、命中规则、提供商切换条件均未披露。属于有用的AI基础设施细节,不是重大产品发布。
一句话点评
OpenRouter 说自动路由会把会话钉在同一模型上直到缓存过期,所以不会因切换导致缓存失效。但正文没披露缓存时长、key 规则和切换条件,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:45
23d ago
● P1Hacker News 首页· rssEN15:45 · 05·20
字节跳动开源Lance:用单个模型实现图像视频理解与生成编辑
Lance 是字节跳动放出的一个多模态研究项目,把看图、看视频、生成图片、生成视频和编辑这些事塞进了同一个模型里。模型激活参数只有 3B,个头不大,训练用了不到 128 张 GPU,对想复现或微调的人来说门槛不算高。代码、论文和模型权重都公开了,但项目页没写具体的 benchmark 跑分和商用许可条款,这点先别太激动,得自己去翻论文和 HF 页面确认。
#Multimodal#Vision#ByteDance#Lance
精选理由
字节跳动的 Lance 把图像和视频的生成、理解塞进一个模型,激活参数 3B,训练用了不到 128 块 GPU。我会先打个折:正文没披露 benchmark 成绩、没放真实生成样本,授权协议也没说清楚,所以现在只能当研究发布看,别急着对标成熟产品。但单模型覆盖多模态这个方向,对想省部署成本的小团队确实有吸引力。
一句话点评
字节开源了一个3B参数的模型Lance,能同时做图片和视频的理解、生成和编辑,但实际效果和限制正文没细说。
锐评
字节跳动把Lance放出来了,一个模型干三件事:看懂图片/视频、生成新内容、还能编辑。参数量只有3B,属于小模型,好处是本地跑得动,成本低。但正文主要是个GitHub仓库的导航页,没给技术报告、没给评测分数,也没说训练数据怎么来的。光看Star数(445)和Fork数(27),社区还在早期围观阶段。 “统一多模态”这个方向是对的,但小模型同时做理解和生成,通常会在某个任务上妥协——要么生成质量打折扣,要么理解不够细。这点先别太激动,等他们放出论文或demo再看。另外,仓库里Issues只有6个,Pull requests是0,说明外部贡献还没起来,代码成熟度待观察。 目前缺的关键信息:在标准测试集上和专用模型的对比、推理延迟、显存占用,以及生成内容的版权和安全性说明。如果这些不补上,暂时只能当个有趣的研究预览,不适合直接往产品里塞。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
15:42
23d ago
r/LocalLLaMA· rssEN15:42 · 05·20
Qwen 3.6 35B 量化版实测:MTP 比 NTP 快 20-40%,但只限 GPU 负载高时
ByteShape 放出了 Qwen 3.6 35B 的 GGUF 量化版,分 NTP 和 MTP 两种方案,在五张 GPU 和四类 CPU 设备上跑了基准。MTP 在 GPU 负载高时生成速度能快 20-40%,但 CPU 上反而推荐用 NTP。注意:正文没披露具体量化精度和显存占用,所以省显存的效果只能靠猜。如果手头有高负载 GPU 任务,MTP ...
#Inference-opt#Benchmarking#ByteShape#Qwen
精选理由
这是一篇 Reddit 帖子发布的本地量化跑分,针对 Qwen 3.6 35B 的 GGUF 版本,对比 NTP 和 MTP 两种推理模式。对 LocalLLaMA 读者有用,但不算行业级新闻。没有触发硬排除条件。
一句话点评
ByteShape 把 Qwen 3.6 35B 量化成 GGUF,分 NTP 和 MTP 两种方案。MTP 在 GPU 负载高时生成速度快 20-40%,但 CPU 上反而推荐 NTP。注意:正文没披露具体量化精度和显存占用,所以省显存的效果只能靠猜。如果手头有高负载 GPU 任务,MTP 值得一试,但 CPU 用户先别激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:41
23d ago
AI HOT 精选· aihot-apiZH15:41 · 05·20
开源插件让Codex App用上Computer Use和自定义界面
一个开源项目给Codex App做了个插件,即使你是API登录用户,也能开启Computer Use功能(让模型操作电脑界面),还能加Goal指令(设定任务目标)。界面可以改成类似Chrome浏览器的顶部Tab样式,任务开始和完成时能设置音效提醒。项目地址在评论区,正文没披露插件安装难度或对API调用成本的影响。
#Agent#Tools#Open source#Product update
精选理由
正文没披露插件仓库的 star 数、版本兼容范围或社区活跃度,所以验证偏弱。功能本身对 Codex 用户有实用价值,但没提到任何性能数据或使用门槛,这点先别太激动。
一句话点评
短评:给Codex App加Computer Use和Goal指令的开源插件,API用户也能用,但安装门槛和成本影响未知。 点评:这个开源插件让Codex App的API登录用户也能用上Computer Use(模型操作电脑界面)和Goal指令(设定任务目标),算是把原本可能限制在高级订阅的功能下放了。界面还能改成Chrome顶部Tab样式,加任务音效提醒,体验上更像个完整工具。但正文没披...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
15:41
23d ago
r/LocalLLaMA· rssEN15:41 · 05·20
Cohere 开源 Command A+ 模型,BF16 权重已上线 Hugging Face
Reddit 用户分享了一个 Hugging Face 链接,指向 Cohere 的 Command A+ 模型(BF16 精度)。目前正文被 Reddit 屏蔽,无法获取参数量、许可证、发布说明或跑分数据。如果你在找能本地部署的商用级模型,这个值得关注,但具体性能还得等更多信息。
#CohereLabs#Hugging Face#Reddit#Product update
精选理由
HKR-R 通过,因为新 Cohere 检查点对本地模型用户很重要,但 HKR-H/K 不通过:该条目只是一个仓库链接,没有参数、许可证、上下文窗口或基准测试结果。
一句话点评
Cohere 悄悄在 Hugging Face 上传了 Command A+ 的 BF16 权重,但 Reddit 帖子正文被屏蔽,参数量、许可证、跑分全没披露。如果是之前 Command A 的升级版,可能支持 128K 上下文和工具调用,适合本地部署。但这点先别太激动——没跑分没许可证,商用风险未知。正文没披露任何技术细节,连模型卡都看不到。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
15:18
23d ago
r/LocalLLaMA· rssEN15:18 · 05·20
IBM 两个 OCR 模型对比:加了个动态提示到底有没有用?
Reddit 上有人问 granite-docling-258m 和加了动态提示的 2stage 版本到底差在哪。发帖人只说了 2stage 版会用动态提示预先算好页面布局对象,专门应对训练数据里没见过的排版。但正文被 Reddit 屏蔽了,没披露具体效果提升多少、延迟变高还是变低、样本需求有没有减少。如果你在挑 OCR 模型,这点信息还不够做决定,得...
#Vision#IBM#Reddit#Granite Docling
精选理由
一条 Reddit 上的提问帖,没有测试数据、没有效果对比、也没有第三方验证。唯一有价值的信息是 2stage 版本改了预计算方式,但正文没披露这个改动到底省了多少计算量或提升了多少准确率。信息缺口太大,不值得上首页推荐。
一句话点评
IBM 的 granite-docling-258m 和加了动态提示的 2stage 版本,区别在于后者能预先算好页面布局,专门对付训练数据里没见过的排版。但正文被 Reddit 屏蔽了,没披露效果提升多少、延迟变高还是变低。如果你在挑 OCR 模型,这点信息还不够做决定,得等实测。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
15:14
23d ago
FT · 科技· rssEN15:14 · 05·20
黑石50亿美元数据中心计划:创意还是无奈?
黑石集团抛出一个50亿美元的数据中心建设计划,从商业逻辑上看说得通,市场空间也确实大。但正文被付费墙挡住,没披露选址、容量、客户和建设时间表。这点先别太激动——50亿在数据中心行业不算小数目,但没具体信息前只能当个方向性信号。
#Blackstone#Financial Times#Commentary
精选理由
HKR-K靠50亿美元这个数字勉强过关。正文没披露选址、容量、客户和建设时间表,AI相关性停留在数据中心基础设施层面,所以归入低价值区间。
一句话点评
黑石砸50亿美元建数据中心,方向对但细节全无。选址、容量、客户、时间表一概没披露,正文被付费墙挡住。50亿在数据中心行业不算小,但没具体信息前只能当个方向性信号,别太激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
15:10
23d ago
Hacker News 首页· rssEN15:10 · 05·20
Stable Audio 3:Stability AI 开源三款音频生成模型,小模型可在消费级显卡上跑
Stability AI 发布了 Stable Audio 3,一套包含 small、medium、large 三个尺寸的音频生成模型,能生成和编辑几分钟长的音频。核心改进是自研的“语义-声学自编码器”,把音频压进紧凑的隐空间再扩散生成,既保真又让模型更容易理解音频结构。后训练阶段加了对抗训练,减少推理步数、提升生成质量。生成速度:H200 上不到 2...
#Audio#Research release
精选理由
H 和 R 都成立:Stable Audio 出 3 代了,这个钩子对音频生成从业者够直接。K 不成立,因为正文没给任何可验证的细节——参数、数据、时长、评测一概没有,所以分数卡在 60–71 这个区间。
一句话点评
Stability AI 开源了三个尺寸的音频生成模型,小和中模型权重和代码都放了,能在消费级显卡上跑。核心改进是自己搞的“语义-声学自编码器”,把音频压进紧凑空间再扩散生成,几分钟的长音频也能一次生成,不用分段拼接。后训练加了对抗训练,推理步数少了,生成质量反而更高。H200 上生成不到 2 秒,MacBook M4 也就几秒。不过论文没披露训练数据具体规模,也没给和同类模型的客观指标对比...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
15:00
23d ago
AI HOT 精选· aihot-apiZH15:00 · 05·20
PixVerse 用角色分镜保证 AI 视频角色一致
PixVerse 发了一个 15 秒的烹饪短片,核心做法是先画好角色分镜,再拿它当参考生成视频。这样能保证同一个角色、故事节点、镜头方向和动作细节从头到尾不跑偏。正文没披露分镜工作流的具体步骤,但思路很直接:让 AI 在动起来之前先知道角色长什么样、故事怎么走。
#Multimodal#Vision#PixVerse#Product update
精选理由
HKR三项都达标:标题钩子抓人,正文给了具体工作流,且踩中创作者痛点。但只是PixVerse单家社媒帖,不是模型或产品发布,所以评分卡在有用但不值得头条的区间。
一句话点评
PixVerse 用角色分镜当参考,生成了一段 15 秒的烹饪短片,保证角色、故事节点、镜头方向、动作细节从头到尾一致。思路很直接:让 AI 先知道角色长什么样、故事怎么走,再动起来。正文没披露分镜工作流的具体步骤,但这个方法比纯文生视频靠谱,适合做叙事类短片。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:40
23d ago
Hacker News 首页· rssEN14:40 · 05·20
用AI智能体给分布式系统做测试
这是一个GitHub项目,标题说用AI智能体(AI agent)来测试分布式系统。但正文只给了仓库链接和Hacker News讨论链接,目前3颗星、0个issue。项目具体怎么设计智能体、测什么系统、用什么方法、能不能复现、效果如何,全都没披露。这点先别太激动,等作者放出更多细节再说。
#Agent#GitHub#Hacker News#Open source
精选理由
标题的 hook 成立,但正文几乎等于空壳——只有链接和评分,没有方法、没有数字、没有可复现的结论。对从业者来说这就是一个低价值的开源链接,不值得单独推荐。
一句话点评
标题说用AI智能体测分布式系统,但正文只给了GitHub链接,目前3星、0个issue。具体怎么设计、测什么、效果如何,全没披露。这点先别太激动,等作者放出更多细节再说。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
14:00
23d ago
TechCrunch AI· rssEN14:00 · 05·20
NanoClaw 创始人拒了 2000 万美元收购,自己拿了 1200 万美元种子轮
NanoClaw 是 OpenClaw 的安全替代品,跑在容器沙箱里,不让 AI agent 直接接触电脑。创始人拒绝了 2000 万美元收购,转而拿了 1200 万美元种子轮。正文没披露投资方和估值,但拒绝收购说明团队想自己控制方向。
#Agent#Safety#Tools#NanoClaw
精选理由
HKR三项都够,但NanoClaw还太早期——正文没提采用率、性能指标或知名客户,所以重要性压在70分档,没进精选。
一句话点评
NanoClaw 是 OpenClaw 的安全替代品,把 AI agent 关在容器沙箱里跑,不让它直接碰电脑。创始人拒了 2000 万美元收购,拿了 1200 万种子轮——拒绝收购说明团队想自己控方向,但正文没披露投资方和估值,这点先别太激动。短评:安全沙箱 + 拒绝收购,方向对但钱和验证都还缺。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:43
24d ago
Hacker News 首页· rssEN13:43 · 05·20
GitHub 确认 3800 个仓库被恶意 VSCode 插件攻破
GitHub 证实,一个恶意 VSCode 扩展导致 3800 个仓库被入侵。目前正文没披露插件名称、攻击链条和受影响账户范围,只链接了之前 Hacker News 的讨论帖。3800 这个数字说明影响面不小,但具体怎么攻的、哪些仓库遭殃,还得等更多细节。
#Code#Tools#GitHub#VSCode
精选理由
这是一起开发者工具安全事件,不是 AI 模型或产品能力更新,所以放在 interesting 档位,不上 featured。3,800 这个数字和 VSCode 扩展这个攻击入口是硬钩子,但正文信息量不够,没法做更深判断。
一句话点评
GitHub 确认一个恶意 VSCode 扩展搞了 3800 个仓库,数字挺大,但正文没披露插件名字、攻击链条和受影响账户范围,只链了个 HN 讨论帖。目前信息缺口明显,没法判断是供应链投毒还是凭据窃取。短评:数字吓人,细节欠奉,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:33
24d ago
r/LocalLLaMA· rssEN13:33 · 05·20
Hugging Face 排行榜现在能按模型参数量筛选了
Hugging Face 的基准测试页面新增了按模型大小筛选的功能,比如可以直接看 32B 以下哪个模型在 SWE-bench Verified 上表现最好。正文没披露筛选粒度(比如是按 7B/13B 档位还是精确参数量)以及功能上线时间。对挑小模型做部署的人来说,省得自己手动扒数据了。
#Benchmarking#Hugging Face#Product update#Benchmark
精选理由
HKR全通过,因为这项功能改变了本地模型用户看排行榜的方式,而且给出了具体的32B以下SWE-bench Verified例子。重要性维持在60-71区间,因为筛选粒度、上线范围、以及更广泛的影响正文都没披露。
一句话点评
Hugging Face 的排行榜现在能按模型大小筛选了,比如直接看 32B 以下谁在 SWE-bench Verified 上最强。对挑小模型部署的人来说省了手动扒数据的功夫。但正文没披露筛选粒度(是按 7B/13B 档位还是精确参数量)以及上线时间,功能细节还不清楚。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
12:38
24d ago
r/LocalLLaMA· rssEN12:38 · 05·20
有人用 Qwen 3.6-27B 写了个单页 Hugging Face 模型搜索工具
Reddit 用户发了一个纯 HTML 的 Hugging Face 模型搜索工具,代码是用 Qwen 3.6-27B 写的。功能上支持按日期范围和参数量筛选模型,搜索结果会按基础模型和衍生作者分组展示,第一次搜索后会缓存 HF API 结果。工具本身就是一个 HTML 文件,不用装依赖,打开就能用。正文没披露缓存有效期和是否支持私有模型搜索。
#Code#Tools#Qwen#Hugging Face
精选理由
HKR 的 H 和 K 都成立:Qwen 自写单文件工具、缓存 HF API 结果都是具体事实。但来源是 Reddit 个人用户,权威性低,且场景局限在模型搜索体验优化,不触发硬排除条件,所以落在 60–71 的 all 区间。
一句话点评
一个纯 HTML 的 Hugging Face 模型搜索工具,代码是 Qwen 3.6-27B 写的。支持按日期和参数量筛选,结果按基础模型和衍生作者分组,第一次搜索后缓存 HF API 结果。不用装依赖,打开就能用。正文没披露缓存有效期和是否支持私有模型搜索。短评:模型搜索小工具,代码是 AI 写的,胜在轻量,但功能有限。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
11:43
24d ago
r/LocalLLaMA· rssEN11:43 · 05·20
Reddit 用户实测 whichllm:4-6GB 显存笔记本能跑,但精度没给数据
一位 Reddit 用户在办公笔记本(4-6GB 显存)上测了 whichllm,说 qwen2.5-coder-instruct 3b 能当本地命令行工具用。但帖子没披露 gpt-oss-20b 或 qwen3.6-27b 的可复现运行条件,也没给任何精度对比数据。正文被 Reddit 屏蔽,看不到更多细节。结论:低显存能跑,但准确率未知,别急着信。
#Code#Tools#Inference-opt#Qwen
精选理由
这是一条 Reddit 个人测试帖,唯一确定的信息是 3B 模型能在 4-6GB 显存上跑,对低配用户有参考意义。但正文没披露 gpt-oss-20b 和 qwen3.6-27b 的运行条件,这两个大模型能不能跑、跑多慢都是未知数,所以整体价值有限,不能太当真。
一句话点评
Reddit 用户用 4-6GB 显存的办公笔记本跑了 whichllm,说 qwen2.5-coder-instruct 3b 能当本地命令行工具用。但帖子被 Reddit 屏蔽,正文看不到,也没披露 gpt-oss-20b 或 qwen3.6-27b 的可复现运行条件,更没给任何精度对比数据。结论:低显存能跑,但准确率未知,别急着信。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
10:42
24d ago
AI HOT 精选· aihot-apiZH10:42 · 05·20
商汤 SenseNova U1:一个模型同时处理文字和图片
商汤发了 SenseNova U1,号称能同时理解文本和图像,而不是像多数工具那样分开做。正文没披露模型参数量、定价、上线时间,也没给可复现的评测条件,所以实际效果和成本都还不清楚。
#Multimodal#Vision#SenseTime#Product update
精选理由
HKR三项全挂:这是一条厂商自述的多模态产品名,没有参数、上线条件、价格或可复现评测。按0/3 HKR排除规则,分数压在40以下。
一句话点评
商汤发了 SenseNova U1,号称能同时理解文本和图像,而不是像多数工具那样分开做。正文没披露模型参数量、定价、上线时间,也没给可复现的评测条件,所以实际效果和成本都还不清楚。 短评:多模态不新鲜,关键看落地成本。商汤没给任何硬指标,先打个折。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R0
10:35
24d ago
Hacker News 首页· rssEN10:35 · 05·20
Qwen3.7-Max:专为智能体时代设计的旗舰模型
Qwen3.7-Max 是阿里云最新发布的闭源模型,主打智能体(agent)能力,也就是让模型能自己调用工具、写代码、操作软件,完成几百上千步的复杂任务。官方展示了一个例子:模型连续跑了35小时,自主优化了1000多次内核代码。在编码智能体测试中,Terminal Bench 2.0 得分69.7,SWE-Verified 80.4,都略高于对比的 O...
#Agent#Qwen#Hacker News#Product update
精选理由
H 和 R 靠 Qwen3.7-Max 的 Agent 定位能吸引点击和从业者关注,但 K 不通过:RSS 正文只有 HN 元数据,没有模型规格、评测、定价或上线时间,信息缺口太大。
一句话点评
阿里云发了Qwen3.7-Max,闭源模型,主打让模型自己干活——写代码、调内核、操作软件,能连续跑35小时自主优化内核代码,调了1000多次工具。编码测试Terminal Bench 2.0得分69.7,SWE-Verified 80.4,比对比模型略高一点,但差距不大。亮点是跨框架通用,Claude Code、OpenClaw都能跑。不过正文没披露模型参数量、训练成本、API定价,也没说...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
10:32
24d ago
AI HOT 精选· aihot-apiZH10:32 · 05·20
Qwen 2026大会:AI原生云架构蓝图发布
阿里云在Qwen 2026大会上公布了主题演讲议程,核心是AI原生云和Agent原生云架构,以及多模态视觉技术发布。议程强调面向全球规模的工程蓝图,但正文没披露具体架构参数、产品上线时间或可用性。
#Agent#Reasoning#Multimodal#Qwen
精选理由
硬性排除规则适用:这是阿里云的大会议程,只有话题标签,没有规格、可用性或定价。HKR三项全不通过,所以保持排除。
一句话点评
阿里云在 Qwen 大会上画了个 AI 原生云架构的饼,但正文没披露任何具体参数、上线时间或可用性。议程标题看着挺大——Agent 原生云、多模态视觉、推理未来——但全是方向,没细节。目前只能当战略预告看,别当产品发布。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
10:14
24d ago
AI HOT 精选· aihot-apiZH10:14 · 05·20
阿里云MSE AI调度器公测:让Agent自己干活,不用人盯着
阿里云开放了MSE AI调度器的免费公测,主要解决开源Agent方案(比如OpenClaw、Dify)常见的三个问题:容易挂、运维麻烦、出了事不知道哪步错了。它做了分布式调度保证高可用、统一权限管理、弹性伸缩省成本,以及全链路可观测性——就是每一步执行都能追踪到日志和耗时。适合想把Agent放进生产流程、但不想自己搭整套运维体系的团队。公测免费,链接在原文。
#Agent#Tools#Alibaba Cloud#OpenClaw
精选理由
触发硬排除规则2:这是阿里云为自己的MSE AI调度器公测写的功能列表,不是范式转变的产品。HKR-K有一些机制信息,但云厂商推广限制了分数。
一句话点评
阿里云把MSE AI调度器开放免费公测了,主打解决开源Agent方案(OpenClaw、Dify)容易挂、运维麻烦、出问题找不到根因的痛点。它做了分布式调度保证高可用、统一权限管理、弹性伸缩省成本,以及全链路可观测——每一步执行都能追踪日志和耗时。适合想把Agent放进生产流程、但不想自己搭运维体系的团队。公测免费,但正文没披露公测结束后的定价,长期成本未知。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
10:04
24d ago
Hacker News 首页· rssEN10:04 · 05·20
用AI写了10万行Rust代码后的经验总结
作者用AI在约4周内写了10万行Rust代码,实现了一个多Paxos共识引擎,性能从2.3万 ops/s优化到30万 ops/s。核心经验是:让AI写代码合约(前置条件、后置条件、不变式),再让AI根据合约生成测试和属性测试,能提前抓到Paxos安全违规这类深层bug。作者还推荐轻量级规格驱动开发——先用/specify生成用户故事和验收标准,再用/c...
#Code#Commentary
精选理由
H 和 R 过关:10万行 Rust 是个强钩子,也对应了 AI 写代码靠不靠谱的焦虑。K 不过关:工具配置、错误率、工作流细节都没披露,所以分数压在 60–71 区间。
一句话点评
作者用AI在4周内写了10万行Rust代码,实现了一个多Paxos共识引擎,性能从2.3万 ops/s优化到30万 ops/s。核心经验是:让AI写代码合约(前置条件、后置条件、不变式),再让AI根据合约生成测试和属性测试,能提前抓到Paxos安全违规这类深层bug。作者还推荐轻量级规格驱动开发——先用/specify生成用户故事和验收标准,再用/codex或claude code生成实现。...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
08:49
24d ago
Hacker News 首页· rssEN08:49 · 05·20
Raster 上线链上投资组合分析工具,从原始区块链数据重建可审计的盈亏
Raster 发布了一个 DeFi 投资组合分析工具,能从原始链上活动重建可审计的状态,并计算出确定的盈亏(PnL)。页面展示了一个示例钱包,资产净值约 31 万美元,但未实现亏损高达 59 万美元,说明工具能清晰呈现实际盈亏。正文没有披露定价、支持多少条链、以及上线时间,这些信息目前是缺失的。
#Agent#Raster#Product update
精选理由
HKR-K通过链上状态重建和确定性PnL机制,但HKR-H基本是口号,HKR-R过于DeFi小众,对AI从业者吸引力有限。无硬性排除,但属于低价值产品更新区间。
一句话点评
Raster 做了一个 DeFi 投资组合分析工具,能从链上原始数据重建交易历史并算出确定的盈亏(PnL)。示例钱包净值 31 万美元,未实现亏损却高达 59 万美元,说明工具能清晰展示实际盈亏,而不是只看表面数字。这点对 DeFi 用户挺有用,尤其是那些跨链、多协议操作的人。但正文没披露定价、支持多少条链、以及上线时间,这些信息目前是缺失的。如果是真的,能省去手动对账的麻烦,但先别太激动,...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
08:48
24d ago
持续报道 · 1dr/LocalLLaMA· rssEN08:48 · 05·20
Qwen3.6 27B 在两块 Blackwell 6000 上跑到 100–110 tokens/s,还有优化空间吗?
Reddit 用户用 llama.cpp 跑 Qwen3.6-27B,两块 Blackwell 6000 GPU,输出速度 100–110 tokens/s。配置拉满:104 万上下文、并行 4、BF16 GGUF、FlashAttention、MTP draft。速度不慢,但正文没披露延迟分解或每层利用率,所以瓶颈在哪不好说。如果这是纯推理,这个吞吐...
#Inference-opt#llama.cpp#Qwen#AMD
精选理由
一条具体的本地推理跑分帖,H/K/R三项都够,但只是单次Reddit测试,没披露延迟分解或可复现的测试矩阵,所以分数压在60–71区间。
一句话点评
两块Blackwell 6000跑Qwen3.6-27B,输出100–110 tokens/s,配置拉满:104万上下文、BF16、FlashAttention、MTP draft。速度不差,但正文没披露延迟分解或每层利用率,瓶颈在哪不好说。如果纯推理,这个吞吐对27B模型算正常偏上,但两块专业卡的成本够买好几台消费级机器,性价比存疑。短评:速度还行,但两块专业卡的成本够买好几台消费级机器了。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
08:29
24d ago
r/LocalLLaMA· rssEN08:29 · 05·20
LMStudio 的 MTP 功能开了反而让输出变差
一位 Reddit 用户发现,在 LMStudio 里开启 MTP(多 token 预测)功能后,模型输出质量明显下降。他做了两次对比测试,只切换 MTP 开关,提示词用了 52 个短句。但帖子没交代用了什么模型、LMStudio 版本和采样参数,所以这个结论的适用范围还不清楚。
#Inference-opt#LMStudio#LocalLLaMA#Incident
精选理由
信息来自单个 Reddit 帖子,测试只做了两组,模型、版本和采样参数都没披露,证据偏弱。对本地推理用户是个有用的信号,但还不到推荐头条的程度。
一句话点评
Reddit 用户实测发现,在 LMStudio 里打开 MTP(多 token 预测,即一次预测多个后续 token 以加速推理)后,输出质量反而变差。他只做了两次对比测试,提示词用了 52 个短句,但没交代用了什么模型、LMStudio 版本和采样参数。结论适用范围有限,更像是个案提醒:MTP 加速可能牺牲质量,尤其在小模型或特定采样设置下。正文没披露测试模型和版本,建议用户在自己常用配...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
07:40
24d ago
AI HOT 精选· aihot-apiZH07:40 · 05·20
写个提示词就能生成超真实足球场自拍视频
PixVerse 放了一条提示词,目标是生成一段五个朋友在大型体育场用手机自拍的视频。提示词写得很细:五个角色的外貌要一致、球场环境要具体、镜头要模拟真实手机拍摄的抖动和失焦,还得有一连串自然的动作。效果看起来挺真,但正文没披露生成成功率、需要多少算力、或者是不是每次都能保持角色长相不崩——这点先别太激动。
#Multimodal#Vision#PixVerse#Product update
精选理由
HKR-H和HKR-K靠视觉提示钩子和具体约束条件通过。但没交代模型版本、生成参数、失败案例或对比,所以只是个低价值的提示词展示,不触及从业者关心的成本、效果或安全痛点。
一句话点评
PixVerse 放了一条超细提示词,目标是生成五个朋友在球场用手机自拍的视频,效果挺真。但正文没披露生成成功率、算力成本或角色长相是否每次都能保持不崩——这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K1·R0
07:18
24d ago
r/LocalLLaMA· rssEN07:18 · 05·20
Qwen3.7 Max 在 Artificial Analysis 排第五,跟 GPT-5.4 差不多,比 Gemini 3.5 Flash 高一点
Qwen3.7 Max 在 Artificial Analysis 的榜单上排第五,分数跟 GPT-5.4(xhigh 配置)差不多,还比刚发的 Gemini 3.5 Flash 高一截。另一边,DSV4 Flash 和 Qwen3.6 27B 比自家 Max 版本低了 6 分。帖子还提到 Qwen3.7 的 27B 和 35B 版本分数没公布,大家只...
#Benchmarking#Qwen#Artificial Analysis#Google
精选理由
这是一条 Reddit 上关于 Artificial Analysis 排名的摘要,不是正式发布或完整评测报告。排名第5、接近 GPT 5.4 xhigh、高于 Gemini 3.5 Flash 这些信息有看点,但正文没披露测试设置、数据集、成本或延迟等细节,所以信息量有限。分数卡在 60–71 区间合理。
一句话点评
Qwen3.7 Max 在 Artificial Analysis 排第五,分数跟 GPT-5.4 高配版差不多,还压了刚发的 Gemini 3.5 Flash 一头。但注意这是 Max 版,27B/35B 小模型分数还没公布,大家只能干等。同场 DSV4 Flash 和 Qwen3.6 27B 比自家 Max 低了 6 分,说明小模型跟大杯差距不小。正文没披露具体测试集和成本,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:05
24d ago
Product Hunt · AI· rssEN07:05 · 05·20
InstaVM:给 AI agent 开一台“即开即用”的虚拟机,200 毫秒内启动
InstaVM 在 Product Hunt 上线,主打“给 AI agent 的即时电脑”。它用 Firecracker 微虚拟机技术,把 agent 跑在隔离环境里,启动时间不到 200 毫秒。你可以把它理解成给每个 agent 单独开一台轻量服务器,跑完就销毁,安全可控。产品定位是 agent 的生产控制面板,支持监控和权限管理。目前正文没披露定...
#Agent#Tools#InstaVM#Product Hunt
精选理由
一个 Product Hunt 产品页,只有“面向 AI agents 的即时计算机”这个定位。HKR-H 勉强及格,HKR-K/R 都不及格,因为价格、运行环境、部署方式和实际优劣全都没提。
一句话点评
给每个 AI agent 单独开一台轻量虚拟机,跑完就销毁,启动不到 200 毫秒。基于 Firecracker 微VM,主打隔离和安全。目前只看到 Product Hunt 页面,定价、支持哪些 agent 框架、部署方式都没披露。如果是按需计费,对跑短任务的 agent 挺省钱,但长期运行的成本和性能还得看实测。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
06:21
24d ago
Product Hunt · AI· rssEN06:21 · 05·20
Second Brain for AI:给 Claude、ChatGPT 和 Cursor 装一个持久记忆层,免费
每次关掉聊天窗口,AI 就忘了你之前说过什么。这个开源工具(MIT 协议)给 Claude、ChatGPT、Cursor 等 MCP 客户端加了一个自托管的记忆层,存一次上下文,下次靠语义就能召回,不用再翻关键词。它跑在 Cloudflare 上,有免费额度,数据归你自己管。还带了去重和语义搜索功能。去重逻辑分三档:相似度低于 0.85 就存为新条目;...
#Memory#Anthropic#OpenAI#Cursor
精选理由
Product Hunt 的发布信息很薄:HKR-R 落在跨工具记忆痛点上,HKR-H 属于常规产品包装,HKR-K 缺少存储、权限和同步细节。没有硬性排除条件,保留 all 层级。
一句话点评
给 Claude/ChatGPT 加了个自托管记忆层,下次聊天能靠语义召回之前说过的内容,不用再翻关键词。跑在 Cloudflare 上,有免费额度,数据归自己管。去重分三档,相似度低于 0.85 才存为新条目。但正文没披露存储机制、权限边界和保留策略,免费额度具体多少也没说,生产环境慎用。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H0·K0·R1
06:18
24d ago
AI HOT 精选· aihot-apiZH06:18 · 05·20
开源油猴脚本:截图自动上传小红书抖音,还能扒YouTube字幕喂给ChatGPT
一个开源油猴脚本,能让你在浏览器里截图后直接粘贴上传到小红书、抖音和微信公众号后台,省去手动保存再上传的步骤。还顺手加了YouTube字幕复制、倍速播放,以及把内容一键导出到NotebookLM或ChatGPT的功能。作者说这工具让他更愿意把X上的内容同步到国内平台,不过也承认部分平台的上传体验不太好。正文没披露脚本具体支持哪些浏览器、有没有平台封号风险。
#Tools#X#NotebookLM#ChatGPT
精选理由
HKR-H和HKR-K通过:文章给出了一个具体的开源油猴脚本,能跨平台截图、处理字幕、调速并导出到AI工具。但正文没披露仓库星数、安装量或技术细节,所以这只是一个实用小工具更新,对从业者没有紧迫性。
一句话点评
一个油猴脚本,让你在浏览器里截图后直接粘贴上传到小红书、抖音和微信公众号后台,省去手动保存再上传的步骤。还顺手加了YouTube字幕复制、倍速播放,以及把内容一键导出到NotebookLM或ChatGPT。作者说这工具让他更愿意把X上的内容同步到国内平台,不过也承认部分平台的上传体验不太好。正文没披露脚本具体支持哪些浏览器、有没有平台封号风险。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
06:13
24d ago
r/LocalLLaMA· rssEN06:13 · 05·20
给8B小模型加护栏,agent任务从53%跳到99%
Reddit帖子说,给一个80亿参数模型加上护栏(guardrails),在agent任务上准确率从53%拉到99%。数字很漂亮,但正文没披露具体任务集、模型名字、护栏机制和评测条件,所以先别太激动。如果属实,意味着小模型加一层规则或验证就能接近满分,成本比换大模型低很多。
#Agent#Safety#Benchmarking#ACM CAIS
精选理由
H 和 R 通过:数字跳升有话题性,且 agent 可靠性是实操痛点。K 不通过:缺任务集、模型名和评测条件,信息不足以支撑高置信度判断,只能放在“有趣”档。
一句话点评
短评:8B模型加护栏从53%跳到99%,数字漂亮但先别激动。 点评:Reddit帖子称,给一个80亿参数模型加上护栏(guardrails),在agent任务上准确率从53%拉到99%。如果属实,意味着小模型加一层规则或验证就能接近满分,成本比换大模型低很多。但正文没披露具体任务集、模型名字、护栏机制和评测条件,来源是ACM CAIS '26预印本,且Reddit链接被墙,无法验证。这点先...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
05:24
24d ago
Product Hunt · AI· rssEN05:24 · 05·20
Google Antigravity 2.0:桌面端多智能体编排工具
Google 发布了 Antigravity 2.0,一个桌面应用,可以在 IDE 里同时跑多个编码智能体,还支持定时后台任务和子智能体工作流。它原生集成了 AI Studio、Firebase 和 Android,面向做生产级应用的开发者。正文没披露具体能跑多少个智能体、怎么集成、定价多少、什么时候能用,所以实际效果和成本还不清楚。
#Agent#Tools#Google#Product update
精选理由
H 和 R 过关,但 K 缺具体规格。Product Hunt 这条更新信息量太少,所以分数压在 72 以下。
一句话点评
Google 出了个桌面应用 Antigravity 2.0,能在 IDE 里同时跑多个编码智能体,还支持定时后台任务和子智能体工作流。原生集成了 AI Studio、Firebase 和 Android,面向做生产级应用的开发者。但正文没披露具体能跑多少个智能体、怎么集成、定价多少、什么时候能用,所以实际效果和成本还不清楚。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
05:19
24d ago
Product Hunt · AI· rssEN05:19 · 05·20
Google 出了个终端里的编程助手,能同时跑多个代码 agent
Google Antigravity 今天发布了 CLI 版本,让你直接在终端里运行和监控多个编程 agent。支持多步推理、多文件编辑、调用工具,还能记住历史对话。特别优化了 SSH 会话和纯键盘操作,适合那些不想离开命令行的开发者。产品页没说支持哪些模型、怎么安装、价格多少,也没提权限控制。目前有免费选项,今天在 Product Hunt 上排第一...
#Agent#Code#Tools#Google
精选理由
H 和 R 都成立,但 K 太薄:正文只确认了终端跑 coding agent,模型、权限、价格全没披露。当作一个小产品更新处理,保留在 all 层级。
一句话点评
Google 把 Antigravity 的编程 agent 塞进了终端,支持多步推理、多文件编辑和对话历史,专为 SSH 和键盘党设计。今天在 Product Hunt 排第一,有免费选项。但正文没披露支持哪些模型、怎么安装、价格多少,也没提权限控制。这点先别太激动,等具体信息出来再评估。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
05:00
24d ago
FT · 科技· rssEN05:00 · 05·20
特朗普的AI“垃圾宣传”机器
FT报道称,特朗普的Truth Social账号大量使用AI生成的假图片来改变政治传播的边界。正文没披露用了什么生成工具、发了多少张图、提示词是什么、以及发布的时间线。
#Multimodal#Vision#Safety#Donald Trump
精选理由
HKR-H 和 HKR-R 都过,FT 来源权威,但 HKR-K 缺可验证细节。适合作为 AI 政治观察条目,信息密度不够上推荐位。
一句话点评
FT报道特朗普Truth Social账号大量使用AI生成假图,但正文没披露用了什么工具、发了多少张、提示词和发布时间线。关键信息缺口太大,只能当现象看,没法评估规模和技术细节。短评:AI假图进政治传播,但FT这篇信息量不够,工具、数量、时间线全没给。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
04:51
24d ago
Hacker News 首页· rssEN04:51 · 05·20
MiniMax M2.7 实测:在三个真实工作流里当副手,比 Opus 4.7 差在哪
作者拿到 MiniMax M2.7 的 API 额度后,直接把它塞进 Claude Code,跑了三个自己常干的活:重构一个老 PyTorch 项目、给 Obsidian 知识库写笔记、以及更新一个过时的 PyTorch 项目。对比基准是 Claude Opus 4.7。结果挺一致:M2.7 在任务边界清晰、输出格式固定的时候挺好用,但一旦上下文里有些...
#Code#Benchmarking#MiniMax#Hacker News
精选理由
HKR-H 通过,因为标题确实有一个具体的 API 工作流测试角度;但 HKR-K 和 HKR-R 都不通过,因为 RSS 正文只披露了 HN 5 分和 0 条评论,没有任务、指标或结果,信息不足以支撑任何判断。
一句话点评
短评:M2.7 在边界清晰的任务上表现不错,但上下文一模糊就容易翻车。 点评:作者拿到 MiniMax M2.7 API 额度后,把它塞进 Claude Code 跑了三个真实工作流:重构 PyTorch 项目、写 Obsidian 笔记、更新旧项目。对比基准是 Claude Opus 4.7。结果一致:M2.7 在任务边界清晰、输出格式固定时挺好用,但一旦上下文里有些隐含条件没写清楚,它...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0
04:27
24d ago
新智元 · 公众号· rssZH04:27 · 05·20
NUS、牛津等近10家机构合发音视频智能综述,把AVI分成理解、生成、交互三大块
这篇综述把音视频智能(AVI)拆成理解、生成、交互三条线,并列出六个未来方向:因果对齐、音视频世界模型、长上下文记忆、可控生成、验证器奖励和负责任的实时交互。正文没披露具体方法或实验对比,更像一张研究地图,适合刚入这个方向的人快速看全貌。
#Multimodal#Audio#Vision#NUS
精选理由
这篇综述的价值在于把音视频智能拆成了三条主线(理解、生成、交互)和六条未来方向,对做多模态的研究者来说是个不错的参考框架。但正文没披露具体方法对比或实验结论,更像一张地图而非实测报告。没有产品发布、能力跃迁或行业冲突,所以分数卡在60-71档。
一句话点评
这篇综述把音视频智能拆成理解、生成、交互三条线,适合刚入方向的人快速看全貌。但正文没披露具体方法或实验对比,更像一张研究地图,不是技术报告。六个未来方向(因果对齐、世界模型、长上下文记忆等)列得全,但每个都只点了个名,缺深度。如果只想找论文速览可以看,想抄作业还早。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R0
04:10
24d ago
彭博科技· rssEN04:10 · 05·20
木头姐:特斯拉和无人出租车“马上起飞”
Cathie Wood 在 Bloomberg 视频里说,具身 AI 最大的收入机会在交通领域,特斯拉和无人出租车“马上起飞”。正文没披露具体市场规模、落地时间表或车辆状态,所以这点先别太激动——她一贯看好特斯拉,这次更像重申立场,不是新进展。
#Robotics#Cathie Wood#Ark Investment Management#Tesla
精选理由
HKR-H勉强及格,因为知名投资人喊单Robotaxi有标题吸引力;HKR-K直接挂零,没数字、没时间表、没机制。不硬排除,但信号太薄,留在低价值区间。
一句话点评
Cathie Wood 说特斯拉和无人出租车“马上起飞”,但正文没披露市场规模、落地时间表或车辆状态。她一贯看好特斯拉,这次更像重申立场,不是新进展。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
04:00
24d ago
FT · 科技· rssEN04:00 · 05·20
Harvey 联合创始人:AI 会逼律师改收费模式
正文被 paywall 挡住,没披露具体怎么改、什么时候改、以及 Harvey 自己的产品细节。核心判断来自标题:AI 让法律工作变快,按小时计费的模式撑不住。但到底改成按结果收费、订阅制还是按件计价,目前看不到。
#Harvey#Winston Weinberg#Commentary
精选理由
HKR-H 和 HKR-R 通过,因为按小时计费被 AI 冲击这个切入点对法律 AI 领域有时效性和共鸣;但 HKR-K 不通过:正文没有给出任何数据、机制、时间表或产品细节,信息缺口明显。
一句话点评
Harvey 联合创始人说 AI 会逼律师改收费模式,按小时计费要过时了。但正文被 paywall 挡住,没披露具体改成啥——按结果、订阅还是按件?也没说 Harvey 自己的产品细节。标题判断有道理,但缺关键信息,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
04:00
24d ago
FT · 科技· rssEN04:00 · 05·20
FT 问:Sam Altman 到底是 OpenAI 的资产还是负债?
FT 发了一篇评论,核心问题就是 Sam Altman 对 OpenAI 是福是祸。但正文被 paywall 挡住了,没拿到具体事件、财务数据、董事会状态或时间线来支撑这个判断。所以目前只能看到标题抛出的悬念,没有实质信息可以验证。
#Sam Altman#OpenAI#Financial Times#Commentary
精选理由
这篇 FT 标题很唬人,说 Sam Altman 可能成就也可能毁掉 OpenAI,但点进去你会发现正文只是提了个问题:他到底是资产还是负债。没有新披露的事件,没有数据,也没有任何治理细节,等于只给了一个评论框架。我会先打个折,因为信息量太薄,但话题本身确实踩在 OpenAI 治理和创始人依赖的神经上,所以重要性给到 62 分,属于可看可不看的评论。
一句话点评
FT 这篇评论标题说 Sam Altman 是 OpenAI 的成败关键,但正文被 paywall 挡住,没拿到任何具体事件、财务数据或董事会状态来支撑这个判断。目前只能看到悬念,没有实质信息可以验证。短评:标题党,正文没披露任何关键信息,先别信。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
03:58
24d ago
量子位 · 公众号· rssZH03:58 · 05·20
VC、品牌顾问、编剧,正在批量把自己做成AI
Profy在5月19日上线了专家数字分身产品,号称用多智能体协作、隐性知识捕捉和五层认知流水线,把投资尽调从五天缩到两小时以内。正文没披露具体客户案例或效果验证,这点先别太激动。
#Agent#Tools#Memory#Profy
精选理由
H/K/R都达标,但事实全是供应商自述,没有独立测试、定价、用户留存或可复现的工作流。正文没披露具体用了哪些模型、隐性知识怎么捕获、五层管线每层干什么,信息缺口明显。当一个小产品更新看,分数压在60-71区间合理。
一句话点评
Profy 5月19日上线专家数字分身,号称用多智能体协作把投资尽调从五天缩到两小时内。核心卖点是“隐性知识捕捉”和五层认知流水线,说白了就是让多个AI角色分工干活,模仿真人专家的思考流程。但正文没披露具体客户案例或效果验证,这点先别太激动。如果真能稳定跑通,对VC、咨询这类靠人堆时间的行业确实省成本,但多智能体协作的稳定性和幻觉控制仍是公开难题,实际落地效果存疑。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
03:49
24d ago
● P1机器之心 · 公众号· rssZH03:49 · 05·20
Google I/O 发布 Gemini 3.5 Flash,搜索框接入 AI 智能体
谷歌在 I/O 大会上发布了 Gemini 3.5 Flash,并把 AI 模式直接嵌进了搜索框。公司说现在它的 AI 服务每月要处理超过 3200 万亿个 token,已经有超过 850 万开发者在使用 Gemini。不过这篇文章因为微信平台的环境验证问题,正文内容没能加载出来,所以具体的模型参数、性能对比和实际体验细节都没法确认。
#Agent#Multimodal#Code#Google
精选理由
谷歌 I/O 这次把模型更新和搜索入口绑在一起推,AI Mode 直接嵌进搜索框,比普通功能发布重得多。Gemini 3.5 Flash 是新的轻量模型,月 token 消耗 3.2 千万亿说明用量已经很大,850 万开发者这个数字也够扎实。我会先打个折:正文没披露 3.5 Flash 的具体 benchmark 对比和定价,实际性价比还得等实测。但就凭搜索框变智能体这一条,当天必须写。
一句话点评
谷歌把搜索框变成了一个能看图、读文件、替你盯信息的AI助手,但后台智能体功能要付费订阅才能用。
锐评
这次改版把谷歌搜索从“输关键词找链接”直接推到了“让AI替你干活”的阶段。用户现在可以丢图片、视频甚至浏览器标签页进去提问,AI概览也支持连续追问,交互更像聊天。底层跑的是新发布的Gemini 3.5 Flash模型,谷歌说AI模式月活已经破了10亿,查询量每季度翻倍,这个增速说明用户对AI搜索的接受度很高。 比较激进的是“搜索智能体”,它能在后台24小时帮你盯房价、球鞋发售等信息,但正文明确写了,这个功能今年夏天只对Google AI Pro和Ultra付费用户开放。免费用户能拿到的“生成式界面”功能,可以生成交互图表来讲解复杂知识,这点倒是全员可用。 文章没提新版搜索的广告会怎么变,也没说AI生成的回答里引用来源的透明度如何。在搜索这种靠广告吃饭的业务上大改,商业影响和内容生态的冲击都还是未知数。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
03:49
24d ago
机器之心 · 公众号· rssZH03:49 · 05·20
VChain:给视频生成加一条“视觉思维链”,先规划再动笔
南洋理工在ACL 2026 Findings上提出VChain,思路是让视频生成先想好“关键帧”再补中间画面,类似人类画分镜。做法是用GPT-4o这类大模型先输出一组视觉思维链(visual thought keyframes),再在推理时用稀疏LoRA微调一个预训练视频生成器去填充。好处是时空规划更可控,但正文没披露推理延迟和实际生成帧率,落地成本还...
#Multimodal#Reasoning#Vision#Nanyang Technological University
精选理由
这篇是 ACL 2026 Findings 的论文,NTU 团队提的 VChain,核心是用 GPT-4o 这类多模态模型先生成关键帧,再让视频模型在推理时用 LoRA 做稀疏调优来补全中间帧。想法挺直接:把‘先想好再动’的思路塞进视频生成。但正文没披露生成质量指标、推理速度、跟现有方法对比的量化结果,也没说代码或模型会不会开源。所以是个有亮点的研究发布,但离工程落地或产品替换还有距离,暂时不值得提级。
一句话点评
南洋理工在ACL 2026提出VChain,让视频生成先画分镜(关键帧)再补中间画面,类似人类导演思路。用GPT-4o生成视觉思维链,推理时用稀疏LoRA微调预训练生成器填充。好处是时空规划更可控,但正文没披露推理延迟和实际帧率,落地成本未知。短评:思路像画分镜再补帧,比直接生成更可控,但延迟和成本没提,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
03:49
24d ago
机器之心 · 公众号· rssZH03:49 · 05·20
字节奖学金首次全球开放,五年67位得主去向追踪
字节跳动2026年奖学金首次面向全球申请,每人20万元,导师也有10万元配套研究经费。前五届已支持67位年轻研究者,但正文没披露获奖者的具体去向和学术产出,这点先别太激动。
#Multimodal#Robotics#Inference-opt#ByteDance
精选理由
这是一条字节奖学金动态,不是模型、产品或研究发布。数字清晰,但影响力有限,评分落在60–71区间合理。正文没披露67位获奖者的具体去向和领域分布,这点信息缺口值得注意。
一句话点评
字节跳动2026年奖学金首次面向全球开放,每人20万元,导师还有10万元配套经费。前五届已支持67位研究者,但正文没披露获奖者的具体去向和学术产出,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
03:43
24d ago
彭博科技· rssEN03:43 · 05·20
阿里发布新款AI芯片,训练推理都能跑
阿里巴巴发布了一款新的AI处理器,官方说法是把它加进了自己的AI技术栈,既能做训练也能做推理。但正文没披露这颗芯片用多少纳米工艺、性能跑分多少、卖多少钱、谁已经下单、什么时候发货——这些关键信息全都没说。所以目前只能知道阿里又出了一款芯片,具体能不能打、性价比怎么样,还得等更多细节出来才能判断。
#Inference-opt#Alibaba#Product update
精选理由
阿里发了一颗训练+推理都能用的芯片,算力替代的故事线成立,所以 H 和 R 都过。但正文只说了用途,制程、性能、价格、供货时间全没披露,信息缺口太大,K 偏弱。硬件方向重要但事实太薄,分数卡在 60–71 合理。
一句话点评
阿里发了颗新AI芯片,官方说训练推理都能用。但正文没披露工艺、跑分、价格、客户、发货时间——等于只说了个名字。目前没法判断这颗芯片能不能打,性价比如何,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
03:10
24d ago
r/LocalLLaMA· rssEN03:10 · 05·20
LM Studio 终于支持 MTP 投机解码了
LM Studio 在 0.4.14 Build 2 Beta 版本里加入了 MTP 投机解码支持,需要 llama.cpp 引擎 2.15.0。投机解码的思路是用一个轻量小模型先快速生成草稿,大模型再并行验证,理想情况下能降低延迟。但正文没披露实际吞吐能提升多少、支持哪些模型、以及可复现的测试条件,所以这点先别太激动。
#Inference-opt#Tools#LM Studio#llama.cpp
精选理由
LM Studio 终于给 MTP 推测解码了,版本号 0.4.14 Build 2 Beta,得用 llama.cpp engine 2.15.0。这对本地跑模型的人是实打实的优化,但正文没给吞吐提升数据,也没说支持哪些模型,所以只能算个小版本更新,别急着吹。
一句话点评
LM Studio 刚在 Beta 版里加了 MTP 投机解码,用小模型先写草稿、大模型再验,理想情况能降延迟。但正文没披露实际提速多少、支持哪些模型、测试条件,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
02:49
24d ago
r/LocalLLaMA· rssEN02:49 · 05·20
eBay 上 RTX 3080 20GB 卖 600 美元,每 GB 显存 30 美元
有用户在 eBay 花 600 美元买了 RTX 3080 20GB 版,算下来每 GB 显存 30 美元,比新卡便宜不少。需要两个 8-pin 供电,从中国发货要等几周。正文没披露卖家信誉和卡的状态(翻新/二手),这点先别太激动。
#Inference-opt#Reddit#eBay#NVIDIA
精选理由
HKR 三项都过,但这只是一个 Reddit 上的二手显卡交易帖,信息只有价格、显存、供电和发货地。没有产品发布或市场数据,所以分数压在 60–71 的 all 区间。
一句话点评
600美元买RTX 3080 20GB,每GB显存30美元,比新卡便宜一半。但正文没披露卖家信誉和卡是否翻新,从中国发货等几周,到手可能还有矿卡风险。先别太激动,等更多买家反馈。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
02:44
24d ago
彭博科技· rssEN02:44 · 05·20
三星与最大工会谈崩,全球最大存储芯片厂面临罢工风险
三星电子与最大工会的劳资谈判破裂,全球最大存储芯片工厂可能面临工人罢工。正文没披露涉及多少工人、哪些产线受影响,也没有罢工时间表。如果真停工会直接冲击全球存储芯片供应,对依赖三星内存的AI服务器和消费电子厂商来说是个坏消息。
#Samsung Electronics#Incident
精选理由
H和R勉强过关:三星存储芯片中断确实戳中硬件供应链神经;但K不过关,因为罢工规模、产线、时间表以及是否涉及AI/HBM产线均未披露。
一句话点评
三星最大工会谈判破裂,全球最大存储芯片厂可能罢工。正文没披露涉及多少工人、哪些产线,也没有时间表。如果真停工会直接冲击全球存储供应,对依赖三星内存的AI服务器和消费电子厂商是坏消息。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
02:00
24d ago
● P1AI HOT 精选· aihot-apiZH02:00 · 05·20
通义千问发布 Qwen3.7-Max,主打长时间自主干活和跨平台编程
Qwen 团队推出了 Qwen3.7-Max,一个专为智能体场景设计的闭源模型。它最显眼的能力是能长时间自主执行任务,官方演示了一个连续跑 35 小时、调用上千次工具的内核优化任务。在编程方面,它在 Terminal Bench 2.0 上拿了 69.7 分,超过了 DeepSeek-V4-Pro Max 的 67.9 分;在 SWE-Pro 这类复杂...
#Agent#Multimodal#Tools#Qwen Studio
精选理由
Qwen Studio 发了 Qwen3.7,一口气覆盖聊天、图像视频理解、图像生成、文档处理、网页搜索、工具调用和工件生成,摆明要往智能体方向走。我会先打个折:正文没给任何 benchmark、定价、上下文窗口或延迟数据,所以没法判断实际可用性和成本。亮点是工具调用和工件生成这两项,说明模型不只是聊天,而是被设计成能进业务流程干活。这点先别太激动,等看到具体评测和接入方式再说。
一句话点评
Qwen3.7-Max 在 Terminal Bench 2.0 上拿了 69.7 分,比 DeepSeek-V4-Pro Max 高 1.8 分,但正文没披露上下文长度、定价和 API 开放时间,这些先打问号。
锐评
Qwen3.7-Max 把自己定位成“智能体专用模型”,最抓眼球的证据是官方演示了一个连续跑 35 小时、调用上千次工具的内核优化任务。这个数字说明模型能在长时间自主执行中保持连贯推理,不是那种跑几步就断片的玩具。编程智能体方面,它在 Terminal Bench 2.0 上拿了 69.7 分,超过 DeepSeek-V4-Pro Max 的 67.9 分;SWE-Pro 这类复杂软件工程任务上 60.6 分,比对手高 1-2 分,属于小幅领先。通用智能体基准如 MCP-Mark 和 Skillbench 也都有 2-5 分的优势,但幅度不算碾压。 要注意的是,这篇博客是产品发布文,不是技术报告。正文没披露上下文长度上限、API 定价、具体开放时间,也没说明 35 小时任务是否可复现、有没有人工干预。所有基准测试用的都是内部脚手架或特定框架(如 Claude Code),跨框架泛化能力虽然提了,但没给量化对比。STEM 推理部分,GPQA Diamond 92.4 分、HLE 41.4 分确实高,但 CritPT 只有 11.4 分,说明模型在批判性推理这种需要挑错的任务上还有明显短板。 整体看,Qwen3.7-Max 在智能体场景上确实往前拱了一步,尤其是长程自主执行和跨框架兼容性。但缺少上下文长度、成本和可复现细节,让这些数字的实用参考价值打了折扣。等 API 上线后看实际延迟和费用,才能判断是不是真能进生产流程。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
00:00
24d ago
● P1OpenAI 博客· rssEN00:00 · 05·20
OpenAI 模型推翻了一个 80 年的离散几何猜想
OpenAI 发了一篇博文,说他们内部一个通用推理模型自己解决了一道叫“平面单位距离问题”的数学难题,推翻了大家信了几十年的主流猜想。这道题是 Erdős 在 1946 年提出的,简单说就是平面上放 n 个点,最多能有多少对点距离刚好是 1。之前学界普遍认为正方形网格那种摆法已经接近最优了,但这个模型给出了一族新构造,把单位距离对的数量往上提了一个多项...
#Reasoning#OpenAI#Research release
精选理由
我会先打个折:正文没披露模型名称、证明机制和可复现条件,所以没法给更高分。但 OpenAI 模型推翻 80 年几何猜想这件事本身够新、够具体,也够有争议性,HKR 三项全中,85 分放在 P1 合理。
一句话点评
OpenAI 一个通用推理模型自己推翻了 80 年的离散几何猜想,成本不到 1000 美元,但模型细节和训练数据都没说。
锐评
这条新闻最值得看的是:一个没专门为数学定制的通用推理模型,自己找到了反例,推翻了 Erdős 在 1946 年提出的平面单位距离问题猜想。之前学界普遍认为正方形网格的构造已经接近最优,模型却从代数数论里搬来了意想不到的工具,给出了一个多项式级别的改进。Tim Gowers 说如果这是人写的,他会毫不犹豫推荐顶刊接收,这个评价分量很重。 成本方面,Latent Space 提到整个过程花了不到 1000 美元,如果是真的挺省钱。但 OpenAI 官方正文没披露具体用了哪个模型、参数量多大、推理时用了多少算力,也没说训练数据里是否包含过相关数学文献。这点先别太激动——模型可能见过类似思路的论文,只是人类没把它们和这个猜想连起来。 还缺的关键信息:外部数学家验证的范围有多大,是完整验证了证明还是只检查了关键步骤;模型产生这个证明之前失败了多少次、有没有人类在循环里做筛选。这些会直接影响“自主解决”这个说法的含金量。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
00:00
24d ago
OpenAI 博客· rssEN00:00 · 05·20
OpenAI 教育国计划进入下一阶段:新加坡加入,首批国家公布进展
OpenAI 在伦敦教育世界论坛上宣布了“教育国计划”的新进展。首批参与国包括爱沙尼亚、希腊、意大利、斯洛伐克、特立尼达和多巴哥、哈萨克斯坦、阿联酋和约旦。爱沙尼亚已有超过 2 万名学生和 4600 名教师用上 ChatGPT Edu;哈萨克斯坦全国 20 个地区部署后,首月 4.4 万名活跃教师发了 150 万条提示,9 成教师觉得有用;斯洛伐克大学...
#Tools#OpenAI#Product update#Partnership
精选理由
HKR-K 通过,因为文章补充了项目组件,但缺少国家、定价和落地时间。OpenAI 的关联性让它留在 all 层级,但读起来像一条细节不多的合作更新,没有硬排除触发条件。
一句话点评
OpenAI 把 ChatGPT Edu 卖给了爱沙尼亚、哈萨克斯坦等 8 国,爱沙尼亚 2 万学生、4600 教师已用上,哈萨克斯坦首月 4.4 万教师发了 150 万条提示,9 成觉得有用。但正文没披露定价、部署周期和具体效果验证,更像渠道铺货的官宣。如果是真的,这算是大模型进公立教育系统的一次落地,但别急着当标杆——样本量小、验证弱,且各国教育 IT 基础差异大,复制门槛不低。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
00:00
24d ago
OpenAI 博客· rssEN00:00 · 05·20
Ramp工程师用Codex将代码审查时间从数小时缩至数分钟
Ramp 的工程师用 OpenAI 的 Codex(基于 GPT-5.5)做代码审查,原来等人工第一轮反馈要几小时,现在几分钟就能拿到实质性意见。他们还用 Codex 开发了一个叫 On-Call Assistant 的内部工具,帮值班工程师处理复杂的线上事故排查。Ramp 的 AI DevEx 负责人说,Codex 的审查深度比大多数人类 revie...
#Code#Tools#OpenAI#Ramp
精选理由
硬排除-纯营销:来源是 Ramp 为 Codex/GPT-5.5 写的客户用例。HKR-R 因为代码审查的痛点成立,但缺少规模和评测细节,HKR-K 不达标。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K0·R1

更多

频道

后台