ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-05-21 · 星期四2026年5月21日
14:25
23d ago
r/LocalLLaMA· rssEN14:25 · 05·21
LlamaStation v0.9:Windows 上跑大模型的图形界面,支持多后端、TurboQuant 和 MTP
LlamaStation v0.9 给 llama.cpp 套了个 Windows 图形界面,不用敲命令就能跑模型。作者用双 RTX 3060 显卡跑 Qwen3.6 27B 的 Q4_K_M 量化版,上下文窗口撑到了 177k——相当于一次塞进十几本小说,对本地部署来说挺夸张。支持四种后端(CPU、CUDA、Vulkan、Metal),新增 Turb...
#Tools#Inference-opt#Audio#LlamaStation
精选理由
这是一个 Reddit 上发布的 Windows llama.cpp GUI 小版本更新,受众面窄。177k 上下文测试是亮点,但整体仍属于 niche 工具更新,不足以进 featured。
一句话点评
LlamaStation v0.9 给 llama.cpp 套了个 Windows 图形界面,不用敲命令就能跑模型。作者用双 RTX 3060 显卡跑 Qwen3.6 27B 的 Q4_K_M 量化版,上下文窗口撑到了 177k——相当于一次塞进十几本小说,对本地部署来说挺夸张。支持四种后端(CPU、CUDA、Vulkan、Metal),新增 TurboQuant KV 缓存和 MTP 多 ...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
14:01
23d ago
Hacker News 首页· rssEN14:01 · 05·21
用一台2021款MacBook本地索引一整年视频,作者说Gemma 4做到了
作者在肯尼亚马赛马拉拍了一整年视频,素材堆在SSD里没空剪。他试了一圈AI视频编辑工具后发现,这些工具的前提是素材已经标好了标签,而他的文件名叫“IMG_*.mov”和“Mara june 2024 backup final FINAL”。于是他自己搭了一套本地索引流水线:用ffmpeg抽帧、WhisperX做多语种转录、insightface识别人脸...
#Vision#Multimodal#Commentary
精选理由
标题的钩子很实在——Gemma4-31B 在 2021 MacBook 上索引一年视频,还用了 50GB swap,直接点出硬件、模型和规模,对从业者来说成本低、隐私好、门槛低,共鸣点明确。但正文只给了标题级信息,没披露视频总量、索引方法、耗时和效果,信息缺口大,所以分数卡在 60–71 区间。H/K/R 都过,因为钩子够具体、设置够清晰、硬件成本痛点够真实。
一句话点评
作者用一台2021款MacBook(50GB交换内存)跑Gemma4-31B本地索引了一整年视频素材。核心思路是先建索引再编辑:用ffmpeg抽帧、WhisperX多语种转录、insightface识别人脸,最后让模型一次性输出描述、标签、评分等元数据,存为.sidecar文件。关键数字:成本从每月140美元降到22美元,但正文没披露索引耗时、吞吐量或数据集大小。这点先别太激动——50GB交...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:00
23d ago
TechCrunch AI· rssEN14:00 · 05·21
Tony Robbins 和 Calm 前员工做的 AI 心理治疗,安全分 95
The Path 声称其 AI 模型在心理健康安全基准 Vera-MH 上得了 95 分,而市面上的消费级聊天机器人最高才 65 分。分数差距挺大,但正文没披露模型架构、评估细节、定价和上线时间,所以这个 95 分到底多扎实还不好说。
#Safety#Benchmarking#The Path#Tony Robbins
精选理由
创始人噱头(托尼·罗宾斯 + Calm 背景)、Vera-MH 95 vs 65 的对比数字、以及 AI 心理治疗的安全责任痛点,三条都够硬,所以 H/K/R 全过。但正文没披露模型机制、训练样本量,也没有第三方复现验证,信息缺口明显,所以分数压在 64 这个中段,不往上冲。
一句话点评
一家由Tony Robbins和Calm前员工创办的心理健康AI公司,声称其模型在Vera-MH安全基准上拿了95分,而市面消费级聊天机器人最高才65分。分数差距确实大,但正文没披露模型架构、评估细节、定价和上线时间,所以这个95分到底多扎实还不好说。短评:分数差距大,但没披露评估细节和定价,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
13:52
23d ago
TechCrunch AI· rssEN13:52 · 05·21
Google 在 I/O 上推 AI 代理生态,消费者可能不买账
Google 在 I/O 开发者大会上介绍了一种让消费者用 AI 代理上网的新方式,但现场演示让人困惑。正文没披露具体产品列表、上线时间、定价或技术原理,所以目前只能判断:概念方向明确,但落地说服力不足。
#Agent#Google#Product update#Commentary
精选理由
HKR-H和HKR-R通过:TechCrunch用消费者接受度存疑的角度来框Google的I/O Agent推广,有争议性也有行业共鸣。HKR-K不通过:摘要里没有产品名、日期、价格或具体机制,信息缺口太大,只能归到一般评论类。
一句话点评
Google I/O 推了个面向消费者的 AI 代理概念,现场演示却让人看不懂。正文没披露具体产品、上线时间、定价或技术原理,所以目前只能判断:方向明确,但落地说服力不足。短评:概念画饼,演示翻车,消费者买不买账先打个问号。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
13:04
23d ago
Product Hunt · AI· rssEN13:04 · 05·21
Dune Keypad:一个会看屏幕的 Mac 小键盘,按一下就能跑工作流
Dune 是一个放在 Mac 键盘旁边的三键小键盘,它能根据你当前打开的软件(比如 VS Code、Zoom、Claude)自动切换三个按键的功能。这次更新加了两个东西:一个是用自然语言跟 Claude 对话就能创建快捷键,不用自己写脚本;另一个是社区脚本市场,别人写好的工作流可以直接装。正文没披露硬件参数、价格和发货时间,也没说延迟多高。如果真能做到...
#Tools#Dune#Claude#Product update
精选理由
一个产品猎头的小工具发布:HKR-H 在工具形态上有个小钩子,但 HKR-K 信息很薄,HKR-R 没有触及行业神经。评分停留在低价值产品更新区间。
一句话点评
Dune 是一个放在 Mac 键盘旁的三键小键盘,能根据当前打开的软件(VS Code、Zoom、Claude 等)自动切换按键功能。这次更新亮点:一是用自然语言跟 Claude 对话就能创建快捷键,不用写脚本;二是上线了社区脚本市场,别人写好的工作流可以直接装。如果真能做到“对话即配置”,对懒得折腾快捷键的开发者挺友好。但正文没披露硬件参数、价格、发货时间,也没说按键切换的延迟有多高——如...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
13:04
23d ago
Hacker News 首页· rssEN13:04 · 05·21
Gemini 系统提示词意外泄露
有人在 GitHub 上贴出了 Gemini 的系统提示词(system prompt),据称是 Gemini 自己“随机吐出来的”。正文只贴了提示词原文,没有交代触发条件、复现步骤,也没说是在哪个界面或 API 里泄露的。Hacker News 上已有 80 分、26 条讨论,但信息缺口很大——怎么触发的、是不是所有用户都能复现,目前都不清楚。提示词...
#Safety#Gemini#Incident
精选理由
HKR-H 和 HKR-R 通过:Gemini 系统提示词泄露这个标题有点击价值,也跟安全相关。HKR-K 不通过:帖子没给出泄露内容、触发条件和复现方法,信息量不够,只能放在普通关注档位。
一句话点评
Gemini 在对话中随机吐出了自己的系统提示词,有人贴到了 GitHub 上。正文只给了提示词原文,没交代怎么触发的、在哪个界面、是不是所有人都能复现。Hacker News 上已有 80 分讨论,但信息缺口很大。 短评:泄露本身不算严重,但触发方式未知,先别急着下结论。 点评:提示词内容不算敏感——无非是要求模型“平衡共情与事实”“用 LaTeX 处理复杂公式”等常规指令。真正值得关...
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
13:03
23d ago
r/LocalLLaMA· rssEN13:03 · 05·21
Hugging Face 把 safetensors 文件标成不安全?
一位用户在给队友找 MLX 模型时,发现 Hugging Face 页面把某个 safetensors 文件标记为不安全。帖子只贴了截图,没说是哪个仓库、触发了什么扫描规则、能不能复现。正文没披露具体模型名和报错信息,所以没法判断是误报还是真有风险。
#Safety#Hugging Face#Reddit#MLX
精选理由
HKR-H 和 HKR-R 通过:safetensors 文件被 HF 标记为不安全,这个矛盾点有话题性,也触及本地模型用户的供应链信任和文件安全神经。HKR-K 不通过:仓库名、检测规则和复现步骤都没披露,信息缺口明显,所以定级为 all。
一句话点评
有用户在 Hugging Face 上发现 safetensors 文件被标为不安全,但帖子只贴了截图,没说是哪个模型、触发了什么规则。正文没披露具体仓库名和报错信息,所以没法判断是误报还是真有风险。目前信息不足以复现,建议等更多细节。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
13:00
23d ago
● P1The Verge · AI· rssEN13:00 · 05·21
Google Gemini AI Studio 可快速生成原生 Android 应用
The Verge 的编辑 Sean Hollister 用谷歌 AI Studio 试了一把“氛围编程”,一个下午生成了三个安卓 App。其中一个 App 他只输入了 148 个字的提示词,大概 10 分钟后就在自己的安卓手机上装好跑起来了。前提是他提前把手机开了 USB 调试模式并连上电脑,剩下的活 AI Studio 全包了。他感叹这速度让他差点...
#Code#Agent#Tools#Google
精选理由
这不是 Google 官方大发布,而是一篇带实测细节的第一人称体验文,有梗有数字,适合放进精选。
一句话点评
Google AI Studio 现在能直接用对话生成原生安卓应用了,几分钟就能跑起来,但别指望它能替代专业开发。
锐评
Google 在 I/O 大会上把安卓应用生成直接塞进了网页版 AI Studio,你描述需求,它给你一个能安装的 APK。TechCrunch 的报道说,以前要花几周搭环境、写代码的活,现在几分钟就能出原型。这点对想快速验证想法的人确实有用,但正文没提生成的应用在复杂交互、性能优化上能做到什么程度,也没给任何错误率或可用性数据。 Verge 的编辑自己试了一把,感叹速度快,但也没展开讲代码质量。目前看,这工具更适合做 demo 或简单工具类应用,离生产级还差得远。另外,Google 还提到会用 Gemini 帮用户在 Play Store 里搜应用,但具体怎么匹配、会不会影响中小开发者的曝光,都没说清楚。 我会先打个折:生成快不等于能用,没看到大规模测试和开发者反馈之前,把它当成一个高级玩具更合适。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
12:14
23d ago
r/LocalLLaMA· rssEN12:14 · 05·21
有人把微软弃坑的 VS Code 插件修好了
Reddit 用户 Kregano_XCOMmodder 发布了 POML VS Code 扩展 v0.0.10,修复了一个解析 bug——之前代码里“/>”符号会导致直接向大模型发送提示词失败。同时更新了几个过时的依赖库。正文没披露具体修复了哪些依赖,也没说是否兼容最新版 VS Code。如果你在用这个插件写 prompt,这个版本值得升一下。
#Tools#Agent#Code#Microsoft
精选理由
H 分来自作者“微软不肯做”的对抗叙事,有点小戏剧性;K 分有具体版本号和 bug 修复,信息扎实;R 分低是因为这只是 Reddit 上一个扩展的小更新,影响面窄,所以整体落在低分小更新区间。
一句话点评
一个社区开发者修复了 POML VS Code 扩展的解析 bug,之前“/>”符号会导致向大模型发提示词失败。v0.0.10 版本还更新了几个过时的依赖库,但正文没披露具体是哪些,也没说是否兼容最新版 VS Code。如果你在用这个插件写 prompt,这个版本值得升一下。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R0
11:09
23d ago
r/LocalLLaMA· rssEN11:09 · 05·21
12GB显存跑35B模型,速度冲到110 tok/s
有人在RTX 4070 Super(12GB显存)上用ik_llama.cpp跑Qwen3.6-35B-A3B模型,量化到IQ4_XS后平均速度110.24 tok/s,比原版llama.cpp的90.6 tok/s快了约22%。这个速度提升主要靠MTP(多token预测)和q8_0 KV缓存,还用了CPU卸载。不过正文没披露具体延迟和内存占用,实际部...
#Inference-opt#Tools#Qwen#llama.cpp
精选理由
HKR三项全过:110 tok/s在12GB显存上跑35B模型,对本地LLM玩家是个强钩子,数据也够硬(RTX 4070 Super、IQ4_XS、+22%)。没给featured是因为这只是Reddit上的单次跑分,不是可复现的正式发布。
一句话点评
RTX 4070 Super 12GB 跑 Qwen3.6-35B-A3B,量化到 IQ4_XS 后平均 110 tok/s,比原版 llama.cpp 快 22%。提速靠 MTP(多 token 预测)和 q8_0 KV 缓存,还用了 CPU 卸载。但正文没披露具体延迟和内存占用,实际部署时显存瓶颈可能更明显。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
10:26
23d ago
r/LocalLLaMA· rssEN10:26 · 05·21
你的开源推理引擎跟 OpenAI API 长得像吗?有人做了张对照表
一位开发者发布了「Am I OpenAI compatible」工具和文档站,专门记录 vLLM、llama.cpp 等开源项目对 OpenAI API 签名的兼容情况。正文没披露具体哪些接口不兼容、差异有多大,但这类对照表对选型很有用——比如你想换引擎又不想改代码,先查一下它支不支持你用的参数。
#Tools#OpenAI#vLLM#llama.cpp
精选理由
这是一条 Reddit 上的开发者工具帖,H/K/R 都够,但正文只给了兼容性文档的角度,没有项目数量、测试结果或采用数据,所以分数压在 60–71 这个实用信号区间。
一句话点评
短评:开源引擎接口兼容性对照表,换引擎不换代码时有用。但正文没披露具体差异,得自己测。 点评:一位开发者做了个叫「Am I OpenAI compatible」的工具和文档站,专门记录 vLLM、llama.cpp 等开源项目对 OpenAI API 签名的兼容情况。说白了就是一张对照表:你想从 vLLM 换到 llama.cpp 又不想改代码,先查它支不支持你用的参数。想法很实用,但正文...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
09:30
23d ago
● P1新智元 · 公众号· rssZH09:30 · 05·21
Anthropic 收购 SDK 工具开发商 Stainless 完成交易
Anthropic 把 Stainless 给收购了。Stainless 是一家专门帮公司自动生成和维护 API 的 SDK(软件开发工具包)的公司,OpenAI、Meta、Cloudflare 之前都是它的客户。收购之后,Stainless 会关掉它的托管产品,也不再给老客户提供后续支持。不过,之前已经生成的 SDK 代码所有权还归客户自己,只是后续...
#Agent#Tools#Code#Anthropic
精选理由
我会先打个折:这不是模型发布或核心能力更新,所以分数不会顶满。但 Anthropic 这手挺狠,Stainless 是给 API 自动生成 SDK 的,全球据说四分之一开发者都在用,客户包括 OpenAI 和 Meta。收购后 Anthropic 直接要把托管产品关停,等于断了竞争对手一条现成的开发者工具链。正文没披露收购金额和具体关停时间表,但光是“断供 OpenAI”这个动作,就够让依赖这套工具的团队紧张一阵了。
一句话点评
Anthropic 把 OpenAI、Google 都在用的 SDK 工具商 Stainless 买走了,以后这些竞争对手的 API 套件维护可能得另找门路。
锐评
Anthropic 收购 Stainless,等于把 API 开发工具链里一个关键环节抓在了自己手里。Stainless 做的事是自动生成和维护 SDK——就是开发者用来调用 API 的那套代码库。它的客户名单里有 OpenAI、Google 和 Cloudflare,说明这工具在行业里已经是事实标准之一。收购之后,Anthropic 自己的 API 体验肯定会更顺滑,但对手们还能不能继续用、怎么用,正文没细说。交易金额和团队整合方案也没披露,所以现在只能判断这是一步抢基础设施的棋,具体能省多少成本、会不会影响其他公司的开发效率,还得看后续动作。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
09:30
23d ago
新智元 · 公众号· rssZH09:30 · 05·21
阿里 QoderWork 上线 AI 工作台,做设计、写 PPT、写文章,对标 Claude Cowork
阿里 QoderWork 推出了一个 AI 原生自定义工作台,首发三个模式:设计、PPT 和写作。PPT 流程拆成 11 步,支持离线导出 PDF、HTML 和 PPTX。文章直接拿它跟 Claude 的 Cowork 和 Design 比,但没提价格和开放范围。正文没披露具体用了什么模型、是否收费、以及国内用户能不能直接用。
#Agent#Tools#Code#Alibaba
精选理由
阿里QoderWork是个中等体量的产品更新,亮点是PPT流程拆得细(11阶段)和导出格式全,但标题的Claude挑战论缺乏证据支撑。对国内用户来说,多一个能用的AI工作台总比被卡脖子强,不过别指望它立刻颠覆Claude的地位。
一句话点评
阿里QoderWork上线了AI自定义工作台,首发设计、PPT和写作三个模式。PPT拆成11步,能导出PDF、HTML和PPTX,直接对标Claude的Cowork和Design。但正文没披露用了什么模型、是否收费、国内用户能不能直接用——这点先别太激动。如果真能离线导出完整PPTX,对办公场景挺实用,但验证弱,得等开放实测。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
09:22
23d ago
Hacker News 首页· rssEN09:22 · 05·21
Rmux:一个可编程的终端复用器,带 Playwright 风格的 SDK
Rmux 用 Rust 重写了一个终端复用器,兼容约 90 个 tmux 命令,核心卖点是提供一个类型安全的异步 Rust SDK,让你像操作浏览器元素一样(通过稳定的窗格 ID、结构化快照和定位器式等待)来驱动任何命令行或 TUI 应用。它原生跑在 Linux、macOS 和 Windows 上,Windows 下用真正的 ConPTY 而不是 WS...
#Tools#Code#Agent#Rmux
精选理由
HKR-H/K 通过:可编程终端复用器这个方向本身有新鲜感,而且帖子给出了 90 个命令和跨平台支持。HKR-R 弱:没有公开任何 AI agent 集成或生产用例,所以从业者神经没被戳到。
一句话点评
Rmux 用 Rust 写了个终端复用器,兼容约 90 个 tmux 命令,核心卖点是给了一个类型安全的异步 Rust SDK,让你像操作浏览器元素一样(通过稳定的窗格 ID、结构化快照和定位器式等待)来驱动任何命令行或 TUI 应用。它原生跑在 Linux、macOS 和 Windows 上,Windows 下用真正的 ConPTY 而不是 WSL。 短评:给 CLI/TUI 加了个 P...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
09:05
23d ago
● P1AI HOT 精选· aihot-apiZH09:05 · 05·21
美团开源数字人视频框架 LongCat 1.5 音频驱动版
美团开源了 LongCat-Video-Avatar 1.5,一个用音频驱动生成数字人视频的框架。核心升级是用了 Whisper-Large 做音频编码,加上 DMD2 步蒸馏技术,推理时只需要 8 步就能生成视频,比之前快很多。模型已经上传到 Hugging Face,支持 Diffusers 和 Transformers 直接调用。不过正文没披露生...
#Multimodal#Audio#Vision#Meituan
精选理由
HKR-K和HKR-R通过具体架构和成本钩子达标,但HKR-H偏弱。单来源的开源数字人更新缺乏基准验证或广泛行业影响,所以留在all层级。
一句话点评
美团把数字人视频框架升级到1.5版并开源了,主打音频驱动,但模型卡里没给性能数据和对比基准,效果得自己跑跑看。
锐评
美团开源了 LongCat-Video-Avatar-1.5,一个用音频直接驱动数字人说话的视频生成框架。从模型卡看,这次升级的重点是工程优化和“生产就绪”,也就是更强调实际能跑、能用,而不是单纯刷论文指标。它支持用 Diffusers 或 Transformers 库加载,部署门槛不高,对想快速搭数字人应用的团队比较友好。 但信息缺口也很明显。模型卡里没有给出任何量化结果,比如生成一段视频要多久、嘴型同步的准确率是多少、跟自家上一代或同类开源方案比好在哪里。只提了“极端经验优化”和“人工评估”,但没放具体数字,也没给对比表格。这点先别太激动,得等社区跑出实测数据或者官方补上技术报告里的细节,才能判断它到底省不省资源、效果稳不稳。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H0·K1·R1
09:00
23d ago
MIT 科技评论· rssEN09:00 · 05·21
技术研究者起诉特朗普政府,事关在线安全研究的未来
一个叫 CITR 的研究者联盟代表 47 个国家的 500 名成员起诉特朗普政府,要求法院在案件审理期间阻止一项针对事实核查、在线信任与安全以及虚假信息研究人员的签证限制政策。原告认为政府是在用移民法惩罚它不认同的言论,而政府辩称针对的是协助外国政府审查言论的行为。法官还没裁决,但这场官司的结果会直接影响公众能从独立研究者那里获得多少关于社交媒体和 A...
#Safety#Coalition for Independent Technology Research#Trump administration#Marco Rubio
精选理由
诉讼本身有冲突和具体数字,但影响偏政策而非模型/产品变化,所以放在 60–71 的感兴趣区间。正文没披露诉讼具体诉求和 Trump 政府回应,信息缺口在细节。
一句话点评
500名研究者告特朗普政府签证限制,说政府用移民法打压不认同的言论。案子还没判,但一旦限制生效,社交媒体安全研究的外部证据链就断了——没人敢碰虚假信息。正文没披露政府具体指控了哪些“协助外国审查”的行为,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:52
23d ago
Hacker News 首页· rssEN08:52 · 05·21
那个著名的 O3 地理寻宝提示词其实没啥用
去年有人发现 OpenAI 的 o3 模型能靠一张照片猜出拍摄地点,效果堪比人类高手,当时很多人归功于一个精心设计的“魔法提示词”。但作者用 200 张图片做了对照测试:用那个长提示词和只用一句“仔细想想这是哪”的默认提示词,结果默认提示词的中位误差是 83 公里,长提示词反而 102 公里,平均误差也更大。说白了,那个提示词没帮上忙,甚至拖了后腿。作...
#Reasoning#Commentary
精选理由
标题有反转钩子,也涉及 O3 演示的可信度,所以 H 和 R 通过。但正文信息太少,没给测试设置、样本或失败原因,K 不通过。整体适合 all 层级,不用单独提级。
一句话点评
去年传得神乎其神的 o3 地理定位“魔法提示词”,作者用 200 张图做了对照测试:默认提示词中位误差 83 公里,长提示词反而 102 公里,平均误差也更大。说白了,那个提示词没帮上忙,甚至拖了后腿。 短评:提示词被高估了,模型本身才是主力。 关键数字:200 张图、$15 成本、6 小时。验证规模不大,但结论清晰。正文没披露图片来源的多样性(是否覆盖全球各气候带),也没说明 o3 版...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
08:52
23d ago
● P1AI HOT 精选· aihot-apiZH08:52 · 05·21
腾讯开源 Hy-MT2 多语言翻译模型,支持 33 种语言
腾讯放出了 Hy-MT2 多语言翻译模型,支持 33 种语言互译。7B 和 30B-A3B 两个版本在开源模型里翻译质量最好,比很多参数大几十倍的模型还强。更实用的是 1.8B 轻量版,用 AngelSlim 1.25-bit 量化技术把体积压到 440MB,主流手机芯片就能本地跑,推理速度比上一代快 1.5 倍。官方说这个轻量版性能超过了微软等商业翻...
#Inference-opt#Tencent#Hy-MT2#AngelSlim
精选理由
腾讯这次放出的Hy-MT2,最抓人的点是1.8B模型经1.25-bit量化后只有440MB,能在主流手机芯片上本地跑33种语言互译。这对移动端开发者来说,意味着离线翻译、隐私保护和零服务端成本都有了现成方案。我会先打个折:正文没披露翻译质量基准、实际延迟和开源协议,所以没法判断它在真实场景里到底多能打。但光凭这个体积和语言覆盖,已经是个值得关注的端侧AI信号,只是离旗舰级发布还差一口气。
一句话点评
腾讯开源了Hy-MT2翻译模型,有1.8B、7B、30B三个尺寸,覆盖33种语言。小模型能跑本地,这点挺实用。但Reddit原文被屏蔽,具体效果和基准测试数字还没看到,先别急着下结论。
锐评
腾讯放出了Hy-MT2多语言翻译模型,一口气给了三个尺寸:1.8B、7B和30B参数,支持33种语言。对本地部署玩家来说,1.8B和7B这两个小模型意味着可以在自己的机器上跑翻译任务,不用联网调API,隐私和延迟上都有优势。 但这条消息目前只有一个标题和Reddit上的讨论帖,而Reddit原文因为网络限制被屏蔽了,正文里没有披露任何技术细节。模型到底用了什么架构、训练数据怎么来的、在哪些基准上测过、BLEU分或COMET分是多少,这些关键信息全缺。30B的大模型效果能不能打GPT-4o或DeepL,小模型在低资源语言上会不会崩,都还是未知数。 我会先打个折看待这件事。开源是好事,但没看到评测数字之前,只能把它当成一个“有潜力的新选项”,不能直接当生产工具用。建议等Hugging Face上有了模型卡和社区实测再决定要不要切过去。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
08:45
23d ago
r/LocalLLaMA· rssEN08:45 · 05·21
让LLM玩一夜狼人杀,作者开源了一个GitHub项目
作者用任意OpenAI兼容API让多个LLM玩一夜狼人杀,实测了Gemma4 31B/26B和Qwen3.6 36B。项目里加了个skill.md,让每个模型在游戏结束后写技能,供后续游戏使用。正文没披露具体玩法细节和模型表现对比,但思路挺有意思:用多轮对话和角色扮演来测试模型的推理与伪装能力。
#Agent#Tools#Memory#Gemma
精选理由
作者开源了一个让LLM玩一夜狼人杀的项目,支持任意OpenAI API,实测了Gemma4 31B/26B和Qwen3.6 36B,还搞了个skill.md跨局记策略。社交推理和欺骗场景对AI从业者有点启发,但正文没披露具体成本、延迟或胜率数据,就是个个人玩具项目,没到上头条的程度。
一句话点评
让多个LLM玩一夜狼人杀,实测Gemma4 31B/26B和Qwen3.6 36B。项目加了个skill.md,让模型游戏结束后写技能供后续用。思路有趣:用多轮对话和角色扮演测推理与伪装能力。但正文没披露具体玩法细节和模型表现对比,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
08:18
23d ago
r/LocalLLaMA· rssEN08:18 · 05·21
AMD 发布 Ryzen AI Halo 开发平台和 AI Max PRO 400 系列,专为跑 AI Agent 的 PC 设计
AMD 正式推出了 Ryzen AI Halo 开发者平台(代号 Halo Box)和 Ryzen AI Max PRO 400 系列处理器,目标是把 AI Agent(能自主执行任务的 AI 程序)直接跑在本地 PC 上,不用每次都上云。Halo Box 是给开发者用的测试机,AI 400 系列则是面向商用笔记本的芯片。正文没披露具体算力、内存大小或...
#Agent#Inference-opt#AMD#Product update
精选理由
H 和 R 勉强过关:本地 agent PC 加上 AMD 新平台有受众吸引力。K 不过关,因为 NPU/GPU 规格、内存、定价和上市条件都没披露,正文信息量不足,读者没法判断实际价值。
一句话点评
AMD 出了两款本地跑 AI Agent 的硬件:Halo Box 给开发者调试用,AI 400 系列塞进商用笔记本。关键信息几乎全缺——没算力、没内存、没价格、没上市时间。目前只能当个方向信号:AMD 想让你在笔记本上跑自主任务,不用每次都上云。但离真能用还差一截,先别激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
08:02
23d ago
AI HOT 精选· aihot-apiZH08:02 · 05·21
Grok 搞了个四步工作流,几分钟把一张角色图变成能直接导入 Unity 的动画素材
Grok 展示了一套游戏资产生产流程:用提示词生成角色图,转成动画视频,自动拼成 Spritesheet,最后导入 Unity 或 Godot。传统美术和动画师要干几天的活,现在几分钟搞定。这意味着独立开发者也能快速试错,迭代周期从“天”缩到“秒”。不过正文没披露生成动画的时长、画质一致性、以及 Spritesheet 拼接的准确率,实际落地效果还得看实测。
#Agent#Multimodal#Tools#Grok
精选理由
HKR 三项全过:demo 有明确四步工作流,且切中创作者省钱需求。影响力落在 60–71 是因为这只是单次演示帖,不是模型发布或平台更新,信息量有限,正文没披露生成质量、耗时或兼容性细节。
一句话点评
Grok 把游戏资产生产流程压缩到几分钟:提示词出角色图→转动画→拼 Spritesheet→导入 Unity/Godot。传统美术干几天的活,现在秒级迭代,独立开发者试错成本大降。但正文没披露生成动画时长、画质一致性、Spritesheet 拼接准确率,实际落地效果还得看实测。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
07:33
23d ago
AI HOT 精选· aihot-apiZH07:33 · 05·21
谷歌高管打赌:AI 两年内不会让大批人失业
谷歌高级副总裁曼尼卡不认同“AI 将导致大规模失业”的说法,甚至愿意跟人打赌。他引用 2017 年麦肯锡报告指出,自动化带来的结果有三种:岗位消失、新岗位出现、现有岗位被重新定义——争议只在于各自占比多少,而不是会不会发生。他批评 AI 行业自己也在放大焦虑,反复提“50% 岗位消失”反而削弱了技术真正创造价值的机会。他举了银行柜员和放射科医生的例子:...
#Google#James Manyika#McKinsey#Commentary
精选理由
谷歌高管出来唱反调,说AI不会大规模消灭就业,这个立场本身就有话题性。但他只给了岗位会减少、新增、重定义三个方向,没有具体数字或案例支撑,比如没说哪些岗位会消失、新增多少、重定义需要什么技能。正文也没披露他引用了哪些研究或模型。所以这条适合快速浏览,但别当决策依据。
一句话点评
谷歌高管曼尼卡拿2017年麦肯锡报告说AI不会大规模消灭岗位,还愿意跟人打赌。他批评行业自己放大焦虑,反复提“50%岗位消失”反而削弱技术价值。例子是银行柜员和放射科医生——岗位还在,但工作内容早变了。观点本身不新鲜,报告也是8年前的,正文没给任何新数据支撑“短期不会”的判断。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
06:50
23d ago
r/LocalLLaMA· rssEN06:50 · 05·21
100M参数模型比赛,赢RunPod算力券
CompactAI-O 发起了一个每月一次的“模型高尔夫”小比赛,参赛模型参数上限只有100M(约1亿参数,属于超小模型),冠军能拿50美元RunPod云GPU算力券。正文没披露具体评测标准,所以目前只能当个社区娱乐活动看,但门槛低、成本小,适合想练手的小团队或个人。
#Benchmarking#CompactAI-O#RunPod#Hugging Face
精选理由
HKR全过,但这是Reddit社区比赛,奖金50美元,影响力窄。没有硬性排除理由,所以落在低价值到有趣之间。
一句话点评
CompactAI-O 搞了个每月“模型高尔夫”赛,参赛模型上限仅 1 亿参数(超小模型),冠军奖 50 美元 RunPod 算力券。正文没披露评测标准,目前只能当社区娱乐活动看,但门槛低、成本小,适合小团队或个人练手。
HKR 分解
hook knowledge resonance
打开信源
51
SCORE
H1·K1·R1
06:02
23d ago
r/LocalLLaMA· rssEN06:02 · 05·21
同一个编程任务,Qwen3.6 27B 在四个工具上表现差很多
Reddit 用户拿 Qwen3.6 27B 在四个编程助手(GitHub Copilot、Pi、Claude Code、OpenCode)上跑同一个任务——生成一个 pelican.svg 文件。Claude Code、Pi 和 OpenCode 都只用了 4 次 LLM 请求就搞定,而 GitHub Copilot 用了 13 次,而且它的文件编辑...
#Agent#Code#Tools#Qwen
精选理由
HKR 三项都过:同一个画 SVG 任务,四个编码 agent 跑出具体请求次数对比,Copilot 的 13 次是钩子。但来源是 Reddit 单帖,只测了一个任务,没有成功率或更复杂的测试集,所以分数压在 60–71 区间。
一句话点评
同一个任务,Qwen3.6 27B 在 Claude Code、Pi 和 OpenCode 上只用了 4 次 LLM 请求就搞定,GitHub Copilot 却用了 13 次,还卡在文件编辑工具上。差距不在模型本身,而在谁更会调用工具、少绕弯路。不过这只是 Reddit 用户单次测试,样本太少,Copilot 的编辑策略可能对复杂文件更稳,但这次确实显得笨。正文没披露具体任务细节和模型版本...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
05:06
23d ago
r/LocalLLaMA· rssEN05:06 · 05·21
用 iPod touch 4 拍 350 张照片,从零训一个视觉模型
Reddit 用户用 iPod touch 4 拍了约 350 张红色 Solo 杯的照片,从零训练了一个 DCGAN(一种生成图像的神经网络)。计划扩充到 5000 张,换不同背景和光照,看模型能不能学会识别摄像头传感器留下的噪点痕迹。正文没披露模型架构细节和训练参数,所以复现门槛不清楚。数据量很小(350 张),但如果是验证传感器指纹这种偏门任务,...
#Vision#OpenAI#Remarkable-Trick-177#Commentary
精选理由
HKR-H 和 HKR-K 通过:这是一个有具体数字的一手实验,老设备传感器伪影的选题有话题性。范围停留在 Reddit DIY 层面,所以归入 all 而非 featured。
一句话点评
有人用 iPod touch 4 拍了 350 张红色杯子照片,从零训了个 DCGAN 来生成图像。计划扩到 5000 张,换背景和光照,看模型能不能学会识别摄像头传感器留下的噪点痕迹——这思路挺偏门,像数字取证。但正文没披露模型架构和训练参数,复现门槛不清楚。350 张数据量太小,DCGAN 容易崩,结果参考价值有限。如果真能靠传感器指纹区分照片来源,倒是个低成本验证方向,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
04:00
24d ago
FT · 科技· rssEN04:00 · 05·21
顶级投资人詹姆斯·安德森:大型科技公司的软件时代已经结束
曾重仓亚马逊和特斯拉的知名投资人詹姆斯·安德森认为,大型科技公司的软件时代已经结束,AI 的收益将流向硬件供应商。正文未披露他具体指哪些公司、涉及多少金额或投资时间跨度,所以这点先别太激动。
#James Anderson#Baillie Gifford#Commentary
精选理由
James Anderson(Baillie Gifford 前明星基金经理)接受 FT 采访,断言 Big Tech 软件时代结束,AI 带来的收益将主要流向硬件供应商。这个观点本身有冲击力,但 RSS 摘要只给了结论,没披露他具体指哪些公司、投了多少钱、时间跨度多长,所以验证性不足。对 AI 从业者来说,硬件 vs 软件的价值捕获之争是当前关键议题,值得跟踪,但别急着下注。
一句话点评
詹姆斯·安德森(曾重仓亚马逊和特斯拉)说大科技软件时代结束,AI收益流向硬件商。正文没披露具体公司、金额或时间跨度,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
03:28
24d ago
r/LocalLLaMA· rssEN03:28 · 05·21
小代码项目修了90多个bug,现在装起来稳了
Reddit用户Glittering_Focus1538报告说,他维护的smallcode项目已经修复了90多个bug,现在从npm安装或从源码构建都很稳定。帖子还提到该项目在GitHub上已有超过50个fork。正文没披露具体修复了哪些bug或性能提升数据,但修复数量本身说明之前问题不少,现在至少能正常用了。
#Code#Glittering_Focus1538#smallcode#Open source
精选理由
这是一条小规模开源项目的维护更新,标题模糊,但正文给出了具体的bug修复数量和构建稳定性信息,对关注该项目的用户有参考价值。不过项目本身受众窄,缺乏更广泛的行业影响,因此适合作为普通更新推送,不值得重点推荐。
一句话点评
smallcode 修了 90 多个 bug,现在从 npm 装或源码构建都稳了,GitHub 上也有 50 多个 fork。修复数量说明之前问题不少,但至少现在能正常用。正文没披露具体修了哪些 bug 或性能提升,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
03:23
24d ago
Product Hunt · AI· rssEN03:23 · 05·21
Basedash 推出 Skills:把常用分析规则写成可复用的 AI 指令
Basedash 是一个用自然语言生成图表的 BI 平台,今天上线了 Skills 功能。你可以把业务指标的定义、计算口径、过滤条件写成一条条短指令,团队里所有 AI 界面(聊天、仪表盘、报表)都能自动读取。不用每次重复粘贴同样的前提条件。管理员统一维护,其他人直接用。正文没披露 Skills 支持多少条、有没有权限分级、是否单独收费。如果团队经常因为...
#Agent#Tools#Basedash#Product update
精选理由
HKR-K 通过,因为可复用指令机制算新东西;但 HKR-H 和 HKR-R 不通过:这只是一个 Product Hunt 上的小功能发布,正文没披露定价、权限或规模上限,谈不上行业神经。
一句话点评
Basedash 上线了 Skills 功能,本质是把业务指标定义写成短指令,团队所有 AI 界面自动读取,不用每次重复粘贴前提条件。管理员统一维护,其他人直接用。正文没披露 Skills 支持多少条、有没有权限分级、是否单独收费。如果团队经常因为口径不一致吵架,这个功能挺实用,但具体落地效果还得看定价和权限控制。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
03:11
24d ago
r/LocalLLaMA· rssEN03:11 · 05·21
AnythingLLM 能直接读本地 PDF 和 Word 吗?
一个用户在 LocalLLaMA 版问:AnythingLLM 有没有现成的技能或命令,能直接读取本地的 .doc、.pdf 等非文本文件?他目前的做法是把文件拷进 Docker 文件夹做全文搜索,刻意没上 RAG(外挂资料库),因为文件经常变,文件名和内容搜索对他的语料库更管用。正文没披露 AnythingLLM 是否支持这类本地文件读取,也没说用户...
#RAG#Tools#AnythingLLM#Commentary
精选理由
这是 LocalLLaMA 上的一个工具支持提问,用户需要读本地 PDF/.doc 文件,当前只用了文件夹搜索,且因为文件常变而刻意避开了 RAG。正文没给出可复现的方法、版本号或数据,所以 HKR-R 成立,HKR-H 和 HKR-K 不成立,整体归为低优先级全量推送。
一句话点评
用户问 AnythingLLM 能否直接读本地 .doc/.pdf,目前做法是把文件拷进 Docker 文件夹做全文搜索,刻意没上 RAG,因为文件常变,文件名和内容搜索更管用。正文没披露 AnythingLLM 是否支持,也没说用户用的什么模型。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
03:01
24d ago
● P1FT · 科技· rssEN03:01 · 05·21
Samsung与工会达成协议避免AI相关罢工
三星赶在罢工前谈妥了劳资协议,没让工厂停摆。这次冲突的背景是 AI 热潮给三星带来了巨大收益,但员工认为分配不公。不过,这篇报道正文被付费墙挡住了,具体协议条款、涨薪幅度、涉及多少工人,这些关键信息都没披露。
#Samsung#Policy#Incident
精选理由
FT 这篇讲三星赶在罢工前谈成了劳资协议,标题直接点出“AI 财富”这个冲突点,所以 H 和 R 都成立——供应链会不会断、AI 赚的钱工人能不能分到,都是从业者会关心的。但正文对协议具体内容一个字没提,钱数、条款、涉及多少人全缺,K 完全立不住。我会先打个折:信息缺口太大,只能当个信号看,别急着下结论。
一句话点评
三星在罢工前最后一刻和工会谈妥了,芯片产线没停。但协议细节还没公布,涨薪幅度和AI收益怎么分都是未知数。
锐评
三星赶在罢工前几个小时和工会达成了初步协议,保住了存储芯片的生产线。这事之所以跟 AI 有关,是因为工会认为公司在 AI 热潮里赚了大钱,却没有公平分给一线工人。FT 的标题直接点明了“AI 红利”是这次谈判的核心矛盾。 目前双方只宣布暂停罢工计划,具体的涨薪幅度、奖金分配方案都没披露。Bloomberg 的报道引用了韩联社的消息,但协议本身还是暂定状态,需要工会成员投票通过才算数。换句话说,这只是暂时止血,不是彻底解决。 对 AI 从业者来说,这条新闻的价值在于提醒:算力基建不止是 GPU 和算法,芯片厂工人的稳定性也是供应链里的一环。如果后续投票没通过,HBM 高带宽内存的供应风险会重新抬头。现在先别太激动,等最终条款和投票结果出来再看。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K0·R1
03:00
24d ago
AI HOT 精选· aihot-apiZH03:00 · 05·21
首部100%AI生成电影亮相戛纳,计划2026年上院线
AI电影项目RAPHAEL在戛纳电影节亮相,由Mateo AI Studio和韩国MBC C&I的AI内容实验室联合开发,全程用Kling AI视频模型制作。片方说目标是证明纯AI电影能走通工业流程,计划2026年上院线。但正文没披露制作成本、时长、具体画面质量,也没说是不是真的全程无人工介入——这点先别太激动,等更多细节出来再判断。
#Multimodal#Vision#Kling AI#Mateo AI Studio
精选理由
HKR三项都达标,但来源只是Kling自己的X帖子,只披露了项目名、合作方和2026年院线目标。片长、制作流程、发行方、验证方式都没提,所以评分不上精选。
一句话点评
首部100%AI生成电影《RAPHAEL》在戛纳亮相,全程用Kling AI视频模型制作,计划2026年上院线。片方说目标是证明纯AI电影能走通工业流程。但正文没披露制作成本、时长、具体画面质量,也没说是不是真的全程无人工介入——这点先别太激动,等更多细节出来再判断。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
02:36
24d ago
AI HOT 精选· aihot-apiZH02:36 · 05·21
商汤连续十年拿下中国计算机视觉市场第一
IDC最新报告显示,商汤在中国计算机视觉市场连续十年排名第一。官方把原因归结为三点:把生成式AI能力直接塞进视觉系统(也就是CV 2.0架构)、海外业务覆盖12个区域且服务超500家企业客户(客户留存率很高)、从做项目转型成卖AI平台,靠年度经常性收入增长实现盈利。正文没披露具体市场份额或营收数字,所以这个“第一”的含金量(比如和第二名差多少)没法判断。
#Vision#Multimodal#SenseTime#IDC
精选理由
这是一篇商汤的PR稿,核心信息是IDC连续十年把它评为中国计算机视觉市场第一,附带海外覆盖12个区域、500+企业客户。但正文没披露具体市场份额、客户案例、技术迭代或成本变化,纯属品牌宣传。对AI从业者来说,既没有模型能力对比,也没有落地方法论,信息密度低,所以重要性压到35分,全量推送即可。
一句话点评
商汤连续十年CV市场第一,但正文没披露具体份额和与第二名的差距,含金量不好判断。官方归因三点:CV 2.0架构(生成式AI塞进视觉系统)、海外覆盖12区域超500客户(高留存)、从项目转平台靠经常性收入盈利。缺市场份额数字,这个“第一”先打个折。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K1·R0
02:33
24d ago
彭博科技· rssEN02:33 · 05·21
三星AI奖金纠纷,考验韩国亲劳工总统
彭博社报道,三星内部因AI项目奖金分配爆发争议,这成了检验韩国总统李在明亲劳工承诺的试金石。李在明曾承诺加强劳工保护,并让韩国成为能跟中美竞争的AI强国。但正文没披露奖金的具体机制和涉及哪些三星部门,所以暂时没法判断这事到底多大。
#Samsung#Lee Jae Myung#Bloomberg#Policy
精选理由
HKR-H和HKR-R通过,但HKR-K不通过:这是一条围绕三星AI奖金争议的劳工政治新闻,没有披露金额、机制或涉事部门。
一句话点评
三星内部因AI项目奖金分配闹矛盾,被彭博社拿来检验韩国总统李在明的亲劳工承诺。李在明既要加强劳工保护,又想带韩国跟中美拼AI,这两件事在奖金分配上撞车了。但正文没披露奖金的具体机制和涉及哪些部门,所以暂时没法判断这事到底多大。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
02:28
24d ago
AI HOT 精选· aihot-apiZH02:28 · 05·21
开源版Suno:一句话生成任意风格AI音乐,月费10美元
这个开源项目把Suno音乐生成能力做成了可调用的技能,输入“德语空灵风”这类指令就能出歌。月费10美元,不算贵;新增了近6000种音乐风格的检索库,风格覆盖更准。通过谷歌CDP可以免登录直接调用,省了反复登录的麻烦。项目已开源,有GitHub地址和安装说明。不过正文没披露生成一首歌大概要多久、音质如何,也没说这6000种风格是手动标注还是自动抓的。目前...
#Audio#Tools#Suno#Google
精选理由
正文没披露这6000个风格具体怎么检索、CDP调用有没有限制,但月费10美元和免登录调用对普通用户来说门槛低,值得点一下。整体是个Suno周边的小工具更新,不是行业级事件,所以保持tier all就够了。
一句话点评
短评:开源项目把 Suno 包装成可调用的技能,输入“德语空灵风”就能出歌,月费 10 美元,不算贵。但音质和生成速度没提,别急着当生产力工具。 点评:这个项目把 Suno 的音乐生成能力做成了可调用的技能,输入“德语空灵风”这类指令就能出歌,月费 10 美元,比 Suno 官方订阅便宜(官方 Pro 月费 10 美元但限制次数)。亮点是新增了近 6000 种音乐风格的检索库,风格覆盖更准...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
02:24
24d ago
● P1Hacker News 首页· rssEN02:24 · 05·21
OpenAI 准备秘密提交 IPO 申请
CNBC 从消息人士处获悉,OpenAI 准备最早在本周五向 SEC 秘密递交招股书草稿。目前公开信息里没有估值、发行规模和上市时间表,Hacker News 上也只有 41 个赞和 2 条评论,讨论热度不算高。秘密提交意味着我们暂时看不到财务数据,也没法判断它到底能卖多少钱。
#OpenAI#CNBC#Hacker News#Funding
精选理由
这条消息就一句话:OpenAI 可能最早周五秘密交表。我会先打个折——正文只有 CNBC 链接和 HN 上 41 分、2 条评论,没给出估值、募资额或上市时间,信息很薄。但“最早周五”这个时间点把事件拉到了眼前,对关注融资和股权的人冲击力够强,所以还是放在 P1。
一句话点评
OpenAI 要秘密交表上市了,承销商是高盛和摩根士丹利。但 WSJ 正文被付费墙截断,没看到估值、营收和盈利数据,先别急着算打新收益。
锐评
WSJ 独家消息说 OpenAI 正在准备 IPO,最快可能周五就向监管机构秘密提交招股书,合作银行是高盛和摩根士丹利。秘密提交意味着初期财务数据不会马上公开,公司可以在监管反馈里来回改文件,等差不多了再亮底牌。 这条新闻最关键的几个数字——估值多少、年收入多少、亏多少——正文里一个都没给。文章被付费墙卡在第二段,后面有没有披露更多细节不知道。目前只能确认 IPO 流程确实在动了,而且动得很快。 对 AI 从业者来说,OpenAI 上市不只是股价的事。一旦公开财报,大家就能看到它到底烧了多少钱在训练和推理上,企业客户的付费率怎么样,以及它跟微软的分成结构。这些数据比任何技术博客都更能说明大模型公司的真实成本结构。现在缺的就是这些硬数字,等招股书公开了再下判断。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
02:00
24d ago
r/LocalLLaMA· rssEN02:00 · 05·21
模型生成到一半就卡死循环,Qwen 3.6 35B 也没躲过
Reddit 用户 chocofoxy 报告,Qwen 3.6 35B(q4/q5 量化版)在接入 Copilot Chat 或 Hermes 框架后,会在任务中途陷入死循环——要么一口气生成超过 4 万 token,要么输出一个错误的工具调用。正文没披露具体触发条件或复现步骤,但问题在本地模型圈不算新鲜:小模型缺少全局注意力机制,容易在长上下文里“走...
#Agent#Tools#Inference-opt#Qwen
精选理由
H 和 R 成立:量化后的 Qwen 35B 在 Copilot Chat 或 Hermes 里跑到 40k token 才循环,这个现象对跑本地 agent 的人有参考价值。K 不成立:正文没披露采样设置、触发条件或任何修复方法,就是一个论坛求助帖,信息量太低,不值得跟进。
一句话点评
Qwen 3.6 35B 量化版在 Copilot Chat 或 Hermes 框架下会中途死循环,一口气生成超 4 万 token 或输出错误工具调用。问题不算新鲜:小模型缺全局注意力,长上下文容易“走神”。正文没披露具体触发条件或复现步骤,这点先别太激动。如果是框架兼容问题,换个推理后端可能就解决;如果是模型本身注意力缺陷,那得等官方修或换架构。4 万 token 的生成成本不低,本地跑...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
00:54
24d ago
r/LocalLLaMA· rssEN00:54 · 05·21
AMD BC-250 矿卡改跑大模型:解锁核心后推理速度翻倍
Reddit 用户 dugganmania 把 AMD BC-250 矿卡的 CU(计算单元)从 24 个解锁到 40 个,只改了两个 amdgpu 寄存器。在 1500 MHz 下,llama.cpp 的 Vulkan pp512 吞吐从 230 tok/s 涨到 372 tok/s;拉到 2 GHz 时 40 CU 跑到 466 tok/s,功耗 ...
#Inference-opt#Code#AMD#dugganmania
精选理由
HKR 三项全过:一个具体的硬件解锁实验,带着 llama.cpp 实测数据,直接戳中本地推理的成本焦虑。扣分点在于来源单一(Reddit 个人帖)、硬件适配窄(仅 BC-250)、且解锁有烧卡风险,所以分数压在 60–71 区间。正文没披露解锁方法细节和长期稳定性,这点先别太激动。
一句话点评
有人把AMD BC-250矿卡的计算单元从24解锁到40,只改了两个寄存器。llama.cpp跑小模型,吞吐从230涨到372 tok/s,拉到2GHz能到466 tok/s,功耗181W,温度96°C。成本低,但验证弱——只测了pp512小batch,大模型和长上下文没测。正文没披露卡价和主板兼容性,实际部署成本还得算。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
00:44
24d ago
彭博科技· rssEN00:44 · 05·21
特朗普最快本周四签署AI网络安全行政令,已邀请科技公司高管到场
特朗普计划最快本周四签署一项针对AI的网络安全行政令,并邀请了科技公司高管出席。正文没披露具体条款、执行机构或合规时间表,所以目前只能确认这是一个政策信号,具体约束力还不清楚。
#Safety#Donald Trump#Policy
精选理由
Bloomberg信源权威,加上特朗普AI网络安全行政令这个时间点,给了H和R:政策节点近、合规敏感。K弱是因为正文缺条款、机构和截止日,所以放在all层级。
一句话点评
特朗普最快本周四签AI网络安全行政令,还邀了科技公司高管站台。但正文没披露具体条款、执行机构或合规时间表,目前只能确认这是个政策信号,具体约束力还不清楚。先别太激动,等细则出来再评估影响。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
00:28
24d ago
TechCrunch AI· rssEN00:28 · 05·21
黄仁勋说英伟达找到了一个全新的2000亿美元市场
黄仁勋预测英伟达的下一个增长点是AI代理用的CPU,市场规模2000亿美元。正文没披露产品路线图、客户或上市时间。
#Agent#Nvidia#Jensen Huang#Commentary
精选理由
黄仁勋说NVIDIA下一个增长点是AI agent用的CPU市场,规模2000亿美元。这个数字本身有冲击力,但正文没披露具体产品、客户或时间表,信息缺口明显。HKR三项都够,但支撑偏弱,所以分数落在行业报道的高位区间。
一句话点评
黄仁勋说AI代理需要专用CPU,市场2000亿美元。但正文没披露产品路线图、客户或上市时间,更像画饼。英伟达GPU强,CPU设计经验不足,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
00:00
24d ago
AI HOT 精选· aihot-apiZH00:00 · 05·21
SpaceX 招股书拆解:星链年入114亿美元养家,AI一年烧掉64亿
SpaceX 在2025年总收入187亿美元,其中星链贡献61%收入,运营利润率39%,是绝对的现金牛。发射业务亏6.6亿,主要砸在星舰研发上。AI业务(含X平台广告、订阅和xAI算力)收入32亿,但运营亏损64亿,资本开支127亿——相当于微软或亚马逊AI投入的六分之一,但收入只有它们的零头。招股书还透露了远期计划:2028年发射AI计算卫星,利用太...
#SpaceX#Starlink#xAI#Commentary
精选理由
角度把 SpaceX、Starlink 和 xAI 串成一条资本故事线,有营收和利润率撑腰,所以 H/K/R 都成立。但 AI 产品的具体玩法没披露,分数卡在 60–71 区间合理。
一句话点评
SpaceX 招股书首次公开财务细节:2025年总收入187亿美元,星链贡献61%且运营利润率39%,是现金牛;发射业务亏6.6亿,主要砸星舰研发;AI业务(含X平台和xAI)收入32亿,但运营亏损64亿,资本开支127亿——相当于微软或亚马逊AI投入的六分之一,收入却只有零头。招股书还透露2028年计划发射AI计算卫星。亮点是星链用户从230万增至890万,边际成本趋近于零。但AI烧钱速度...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:00
24d ago
AI HOT 精选· aihot-apiZH00:00 · 05·21
Grok 接入开源编程工具 OpenCode,SuperGrok 或 X Premium 用户可直接用
xAI 把 Grok 模型接入了 OpenCode,一个开源编程助手,可以在终端或桌面用。SuperGrok 或 X Premium 订阅用户通过 Grok OAuth 登录就能用上 Grok Build 模型——就是 xAI 自己命令行编程工具背后那个模型。安装流程很简单,一条 curl 命令加一次登录就行。正文没披露 Grok Build 的具体能...
#Agent#Code#Tools#xAI
精选理由
HKR-K 和 HKR-R 通过 OAuth 接入路径和编程工具链相关性达标。HKR-H 不满足,且正文没有给出能力基准、定价变化或实测结果,所以分数落在 60–71 区间。
一句话点评
xAI把Grok接入了开源编程助手OpenCode,终端或桌面都能用。SuperGrok或X Premium用户用Grok OAuth登录就能调用Grok Build模型——就是xAI自己命令行编程工具背后那个模型。安装就一条curl命令加一次登录,门槛很低。但正文没披露Grok Build的具体能力边界,比如上下文多长、支不支持联网搜索、能不能处理大文件。对开发者来说,多一个模型选择总是好...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
2026-05-20 · 星期三2026年5月20日
23:53
24d ago
AI HOT 精选· aihot-apiZH23:53 · 05·20
Grok Build 上线 OpenCode 平台
Grok Build 现在可以直接在 OpenCode 上用了。但正文没交代怎么接入、定价多少、用的是哪个模型版本,也没说能不能稳定复现。想试的话得自己去翻文档或等官方补细节。
#Code#Tools#Grok#OpenCode
精选理由
HKR-K 仅靠“可用”这个事实勉强通过;HKR-H 和 HKR-R 都不达标,因为这是一条很薄的集成通知。正文没披露版本号、定价、接入路径或测试结果,所以只能归为小更新档位。
一句话点评
Grok Build 上了 OpenCode,但正文没交代接入方式、定价和模型版本,想试得自己翻文档。短评:能用但细节全缺,别急着冲。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K1·R0
23:34
24d ago
r/LocalLLaMA· rssEN23:34 · 05·20
用USB上网卡和预付费SIM卡搭短信告警,绕过Twilio审核
Reddit用户用USB GSM上网卡加预付费nano SIM卡,配合pyserial,给OpenWebUI搭了一套短信告警。原因是Twilio两次拒绝了他的营销活动申请。这套方案每月话费大概10到15美元,比Twilio按条计费便宜,但需要自己维护硬件和SIM卡。正文没披露短信延迟和并发上限,如果是高频告警场景,这点先别太激动。
#Tools#Twilio#OpenWebUI#Grok
精选理由
Twilio 拒两次就自己用 GSM 猫发短信,这个土办法对自建用户有吸引力。方案具体、成本低,但只适用于 OpenWebUI 告警这一个场景,范围窄,所以放在 all 层。
一句话点评
Reddit 用户用 USB GSM 上网卡加预付费 SIM 卡,给 OpenWebUI 搭了一套短信告警,每月话费约 10-15 美元,比 Twilio 按条计费便宜。但正文没披露短信延迟和并发上限,高频告警场景先别太激动。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R1
22:30
24d ago
TechCrunch AI· rssEN22:30 · 05·20
Clouted 获 700 万美元种子轮,想用 AI 帮短视频预测爆款
短视频剪辑公司 Clouted 拿到 Slow Ventures 领投的 700 万美元种子轮。它号称能帮创作者预测哪条短视频会火,但正文没披露产品具体怎么运作、有多少客户、定价多少,也没给出任何短视频推荐数据来验证效果。
#Clouted#Slow Ventures#Funding
精选理由
HKR-K 只靠融资额通过;正文没给产品机制、客户规模或推荐数据,AI 相关性很弱。
一句话点评
短视频剪辑公司 Clouted 拿了 700 万美元种子轮,投资方是 Slow Ventures。它号称能预测哪条视频会火,但正文没披露产品怎么运作、有多少客户、定价多少,也没给任何推荐数据来验证效果。目前只能当个融资消息看,产品能力存疑。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K1·R0
21:59
24d ago
Product Hunt · AI· rssEN21:59 · 05·20
Mixpanel 推出 Headless:用 Python SDK 把产品分析接口化,让 AI Agent 和开发者直接在 IDE 里查数据
Mixpanel 今天发布了 Headless,一个 Python SDK,核心是把产品分析能力做成可编程接口,开发者或 AI Agent 不用打开网页后台,直接在 IDE 里就能查用户行为数据。正文没披露 API 的具体范围、定价、认证方式和权限控制,所以实际能查多深、能不能安全地给 Agent 用,目前还不清楚。亮点是“Headless”这个思路—...
#Agent#Tools#Mixpanel#Product update
精选理由
这是一个小产品更新:对 agent 工具链有参考价值,但 API 范围、权限和定价都缺失。HKR-H 和 HKR-R 通过,HKR-K 不通过,所以留在 all 层级。
一句话点评
Mixpanel 把产品分析做成了 Python SDK,开发者或 AI Agent 不用打开网页后台,在 IDE 里就能查用户行为数据。思路挺实用,但正文没披露 API 能查多深、怎么认证、怎么收费,所以实际能安全地给 Agent 用多少还不清楚。短评:分析工具做成 API,Agent 直接查数据,省了切后台,但权限和定价没细说,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
21:54
24d ago
● P1彭博科技· rssEN21:54 · 05·20
Anthropic与SpaceX达成450亿美元三年算力采购协议
根据一份证券文件,Anthropic 跟马斯克的 SpaceX 签了份大单:未来三年支付差不多 450 亿美元,换取计算资源来支撑它的 Claude 模型。这笔钱摊下来每年约 150 亿美元,说明头部 AI 公司抢算力的成本已经拉到天文数字级别。不过正文被 Bloomberg 的机器人验证挡住了,具体是租 GPU 还是包数据中心、交付节奏和退出条款都没披露。
#Inference-opt#Anthropic#SpaceX#Elon Musk
精选理由
我会先打个折:450 亿美元是三年总承诺,不是一次性付款,但数字大到足以让任何 AI 公司重新算账。Anthropic 把算力押在 SpaceX 身上,说明它不想只靠 AWS 或 Google Cloud,分散供应商是明牌。不过正文没披露具体算力规格、交付时间表,也没说 SpaceX 的算力基础设施到底建到什么程度,这点先别太激动。Bloomberg 拿证券文件报出来,可信度比 PR 稿高,值得写。
一句话点评
Anthropic 三年要付给 SpaceX 近 450 亿美元买算力,年均 150 亿,这个数字比它自己的年收入还高,先别太激动,正文没披露具体 GPU 数量和交付节奏。
锐评
这条消息的核心就一个数字:三年 450 亿美元,折合每年 150 亿。放在 AI 行业里,这个采购规模是顶级的,说明 Anthropic 对算力的需求还在急剧膨胀,而且愿意把筹码押在马斯克的体系上。但 Bloomberg 原文被付费墙挡住,我们只能看到标题,正文没披露合同细节——比如用的是 SpaceX 自研芯片还是英伟达 GPU、算力以什么单位计价、交付时间表是什么。这些信息直接决定这笔交易是“真省钱”还是“溢价锁资源”。另外,Anthropic 目前的年收入大概在几十亿美元量级,一年光算力就花 150 亿,资金缺口怎么补、是不是靠新一轮融资撑着,正文也没提。我会先打个折:450 亿是合同上限还是固定承诺,这个区别很大。如果是真的,对 OpenAI 和 Google 的算力竞争格局会有直接冲击,但眼下缺的细节太多,只能当个信号看。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
21:29
24d ago
● P1TechCrunch AI· rssEN21:29 · 05·20
Anthropic 每月要付给 xAI 12.5 亿美元买算力
Anthropic 租下了 xAI 在孟菲斯 Colossus 1 数据中心的全部算力,每月账单 12.5 亿美元,合同签到 2029 年 5 月。头两个月有折扣,因为 xAI 那边还在爬坡。这笔钱来自 SpaceX 的上市文件,xAI 自己说这是在把闲置算力变现。说白了,Grok 用户量最近掉得厉害,服务器空出来了,正好租给竞争对手回血。不过正文没披...
#Inference-opt#Anthropic#xAI#Elon Musk
精选理由
TechCrunch 爆出 Anthropic 每月要给 xAI 付 12.5 亿美元买算力,对手方和价格都挺意外。正文只给了金额,没写买了多少卡、签了多久、跑在什么环境里,所以信息缺口不小。我会先打个折:金额够大,但缺关键细节,没法给到 90 分以上。
一句话点评
Anthropic 每月付 12.5 亿美元包下 xAI 整个数据中心,合同签到 2029 年。这笔钱来自 SpaceX 上市文件,但正文没披露具体算力规模和部署条件,先别急着算性价比。
锐评
Anthropic 租下了 xAI 在孟菲斯 Colossus 1 数据中心的全部算力,每月账单 12.5 亿美元,合同签到 2029 年 5 月。头两个月有折扣,因为 xAI 那边还在爬坡。这笔钱来自 SpaceX 的上市文件,xAI 自己说这是在把闲置算力变现。说白了,Grok 用户量最近掉得厉害,服务器空出来了,正好租给竞争对手回血。不过正文没披露具体有多少张 GPU、什么型号,也没说这 300 兆瓦的电力对应多少浮点运算能力。12.5 亿一个月的数字看着吓人,但不知道单位算力成本就没法判断是贵了还是便宜了。另外,Anthropic 拿这批算力是训练还是推理也没交代,两种场景对硬件要求差别很大。合同细节比如中途退出条款、算力交付标准也都没提,这些缺口让这笔交易的含金量暂时只能打个问号。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
21:28
24d ago
Hacker News 首页· rssEN21:28 · 05·20
Yapsnap:纯 CPU 转录 YouTube/TikTok 视频,一行命令,不用 GPU 和云
Yapsnap 是一个命令行工具,输入视频链接或音频文件就能输出文字稿,主打纯 CPU 运行、不依赖 GPU 和云服务。对个人用户来说,这意味着不用买显卡、不用配云账号,本地就能跑。但正文没披露用了什么模型、转录速度多快、支持哪些语言,也没说开源协议。目前 GitHub 上只有 1 个 Star、0 个 Issue,项目还非常早期。如果速度能接受,这对...
#Audio#Tools#yapsnap#GitHub
精选理由
标题的“纯 CPU 转录社交视频”是个很直接的钩子,从业者会想“不用 GPU 也能跑,成本低还能本地跑”,所以 H 和 R 都成立。但正文只有标题和 GitHub 链接,没有模型、速度、准确率这些关键信息,K 过不了。整体信息太少,只能放 lower all 档。
一句话点评
一个纯 CPU 跑的视频转文字命令行工具,不用 GPU 也不用云,对没显卡的个人用户很友好。但项目太早期了,GitHub 上只有 1 个 Star,正文没披露用了什么模型、转录速度多快、支持哪些语言,也没说开源协议。如果速度能接受,这倒是省钱的本地方案,但这点先别太激动,等作者补上关键信息再说。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
21:12
24d ago
● P1彭博科技· rssEN21:12 · 05·20
Anthropic营收增长加速,预计迎来首个盈利季度
彭博这条消息说 Anthropic 正朝着公司第一个盈利的季度迈进,主要驱动力是市场对它的 AI 软件需求猛涨。不过正文被付费墙挡了,没披露具体收入规模、利润区间,也没说是哪个季度。我会先打个折:盈利趋势是真的,但数字和细节都看不到,这点先别太激动。
#Anthropic#Funding
精选理由
我会先打个折:正文没给具体数字,营收多少、利润多少、哪个季度都不清楚,所以这条消息更像一个方向性信号,不是实锤。但 Bloomberg 的报道本身有信息量——Anthropic 靠卖 AI 软件把营收拉起来了,可能第一次不亏钱。这对一直烧钱的 AI 实验室来说是个转折点,从业者会盯着后续财报验证。
一句话点评
Anthropic跟投资人说自己下季度营收要翻倍到109亿美元,并且首次实现运营盈利。但别急着开香槟,后面算力账单太大,全年不一定能守住盈利。
锐评
Anthropic预计在2026年第二季度营收达到约109亿美元,比上一季度翻了一倍多,并且会首次出现运营利润。这个数字来自它发给投资人的融资材料,由华尔街日报先报出来,TechCrunch等媒体跟进。翻倍增长确实猛,说明Claude在专业用户里的口碑转化成了真金白银,公司也在推小企业服务和律所工具来分散客户群。 但这条消息有两个地方要打折。第一,盈利只是“运营利润”,不是净利润,而且公司自己预警说后面几个季度会因为巨大的算力支出重新掉回亏损。第二,所有数据都是Anthropic单方面给投资人的说法,没有经过审计,公司也拒绝公开评论。同一天OpenAI传出要在九月IPO,这个时间点放盈利消息,多少有点给竞争对手上眼药的意思。 还缺什么?我们看不到成本结构,不知道这109亿营收里推理成本、模型训练成本各吃掉多少,也不知道客户留存率和企业合同的具体条款。没有这些,单季运营盈利更像一个融资节点上的里程碑,而不是商业模式已经跑通的铁证。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
21:06
24d ago
彭博科技· rssEN21:06 · 05·20
英伟达财报电话会要点:分析师聊了啥,但具体数字没披露
彭博采访了Gabelli Funds的John Belton,聊英伟达一季度财报和展望。但正文没披露营收、利润、数据中心业绩或指引区间,所以目前只有分析师观点,没有硬数字可验证。
#Bloomberg#Nvidia#John Belton#Commentary
精选理由
HKR-H 和 HKR-R 通过,因为 Nvidia 财报直接关系 AI 算力预期;但 HKR-K 不通过:正文没给出营收、利润、数据中心或指引数字,属于泛泛的行业报道。
一句话点评
彭博采访了Gabelli Funds的分析师聊英伟达财报,但正文没披露营收、利润、数据中心业绩或指引区间,只有观点没有硬数字。短评:分析师观点为主,缺关键数字,参考价值打折。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
21:04
24d ago
r/LocalLLaMA· rssEN21:04 · 05·20
2026版大模型显存速算:一张卡能跑多大模型?
Reddit LocalLLaMA 板块有人发帖讨论2026年大模型显存计算,但正文被 Reddit 屏蔽了,只留下标题和一张图。标题暗示帖子里应该包含不同精度、模型大小和上下文长度下的显存估算公式,类似“多少B参数配多少GB显存”那种速查表。可惜正文完全没披露具体数字和假设条件,比如是FP16还是INT4、是否算KV Cache、有没有考虑张量并行。...
#Inference-opt#Reddit#LocalLLaMA#XMasterrrr
精选理由
H和R通过:显存计算是本地LLM的真实痛点。K不通过:正文没披露任何公式、示例或可复现条件,信息缺口太大,只能算低带宽的链接转发。
一句话点评
标题说2026版显存速算,但正文被Reddit屏蔽,只留一张图。看不到精度假设(FP16还是INT4)、是否含KV Cache、张量并行配置。如果是本地跑模型的人,这类速查表确实有用,但没披露具体数字和条件,没法直接参考。建议等原帖作者补全或去评论区翻。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
20:55
24d ago
● P1彭博科技· rssEN20:55 · 05·20
SpaceX 2025年资本开支207亿美元用于AI和航天器
SpaceX 在 2025 年花了 207 亿美元,主要用于 AI 和航天器。这个数字比很多国家一年的科技预算都高,说明马斯克在同时押注两条线:一边用 AI 优化火箭发射和卫星网络,一边加速星舰等航天器量产。正文没披露具体哪些 AI 项目在烧钱,也没说 IPO 时间表,所以这点先别太激动——钱花得多不等于马上上市。
#SpaceX#Funding
精选理由
HKR 的 H 和 K 靠体量和具体数字 207 亿美元通过,但 R 弱,因为 AI 关联缺少项目、算力和融资细节。落在 60–71 区间。
一句话点评
SpaceX 上市文件显示 2025 年资本开支 207 亿美元,AI 和航天器是两大烧钱方向,但没拆开各自占多少。
锐评
SpaceX 在 IPO 文件里把 2025 年的资本开支定在 207 亿美元,主要投向 AI 和航天器。这个数字本身很大,但正文没披露 AI 和航天器各自分到多少预算,也没说 AI 这部分是给 Starlink 做网络优化,还是跟 xAI 有算力上的往来。xAI 去年亏了 64 亿美元,SpaceX 这边又在大笔投 AI,钱是不是在两家公司之间流转、怎么流转,文件里看不出来。对想判断 SpaceX 估值的人来说,缺的就是这笔 AI 投入到底能换来什么——是自用降本,还是对外卖算力,目前都只能猜。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R0
20:55
24d ago
Hacker News 首页· rssEN20:55 · 05·20
Anthropic 将入驻 SpaceX 的 Colossus 2,用 GB200 跑 Claude 推理
Anthropic 的 Tom Brown 发推说,他们正在扩大与 SpaceX 的合作,6 月会在 Colossus 2 上扩容 GB200 容量来跑 Claude 推理。Colossus 是马斯克建的超级算力集群,之前主要给 xAI 用,现在 Anthropic 也挤进去了。GB200 是英伟达的下一代 GPU 平台,单卡算力比 H100 高不少,...
#Inference-opt#Anthropic#Product update
精选理由
HKR 三项都通过,但来源只有标题级信息:没有规模、时间表、合同或官方材料。作为 Anthropic 算力供应信号,评分落在 60–71 区间合理。正文没披露具体部署规模、时间节点和采购条件,这点先别太激动。
一句话点评
Anthropic 的 Tom Brown 发推说,6 月会在马斯克的 Colossus 2 集群上扩容 GB200 来跑 Claude 推理。这意味着 Claude 的推理算力要上一个台阶,GB200 单卡算力比 H100 高不少,但正文没披露具体扩容规模、部署时间线或供应商条款。短评:算力军备竞赛从买卡进化到租卡,Anthropic 挤进 xAI 的集群,说明 GPU 确实紧俏。但这条推...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
20:53
24d ago
AI HOT 精选· aihot-apiZH20:53 · 05·20
OpenClaw 2026.5.19 更新:安卓端实时语音对话上线,Mac 界面更清爽
OpenClaw 发了新版本,主要亮点是 Android 端 Talk Mode 终于支持实时对话了,之前可能有点延迟,现在体验更流畅。Mac 版设置界面重新整理过,看着没那么乱。还加了 xAI 的无头登录模式,适合在服务器或后台跑脚本时用。Telegram 话题功能也更稳了。不过正文没提性能提升多少、什么时候全量推送,这些还得等实测。
#Audio#Tools#OpenClaw#xAI
精选理由
HKR-K 靠两个具体功能变化通过,HKR-H 和 HKR-R 都很弱。这是一个小规模开源工具更新,没有指标或规模数据,落在 60–71 区间。
一句话点评
OpenClaw 新版本把 Android 端对话延迟砍了,实时感提升;Mac 设置界面终于不乱了。还加了无头登录,适合服务器跑脚本。但性能提升多少、全量推送时间都没说,得实测。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
20:49
24d ago
● P1彭博科技· rssEN20:49 · 05·20
英伟达公布一季度财报 每股收益超预期营收指引910亿
英伟达刚发了 2026 财年第一季度的财报,每股收益 1.87 美元,比华尔街预期的 1.77 美元高出一截。公司对截至 7 月的当季营收指引是 910 亿美元,也明显高于市场预估的 874 亿左右。这条视频本身是彭博的报道片段,正文没披露各业务线的具体表现和毛利率细节,所以没法判断增长是数据中心业务继续拉动的,还是有别的板块在补位。
#Inference-opt#Nvidia#Bloomberg#Wedbush Securities
精选理由
Nvidia 财报是观察 AI 基础设施热度的关键节点,910 亿的指引给 HKR 三项都提供了实打实的信号。这不是模型或功能发布,所以放在 featured 档位没问题,信息质量够硬。
一句话点评
英伟达一季度每股收益超预期,下季营收指引给到910亿美元,但正文没披露具体利润数字和增长结构,先别急着算估值。
锐评
英伟达这份一季报,目前能确认的是两个点:每股收益比市场预期好,以及公司自己对下个季度的营收指引是910亿美元。这个910亿的数字挺关键,它直接反映了英伟达对接下来芯片需求的判断,尤其是数据中心业务能不能继续猛跑。 不过,现在能看到的信息来自一段视频报道,正文里没有给出本季度的具体营收、净利润、毛利率,也没提各业务线的增速。这就意味着我们没法判断超预期是靠主业拉动,还是有一次性收益。另外,910亿的指引是公司自己给的,市场原本的预期是多少、差距有多大,报道里也没说。 对从业者来说,这份财报最大的信号是需求端还没踩刹车,但缺了成本结构、库存水平和客户集中度的数据,还看不清这轮增长的安全边际有多厚。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
20:25
24d ago
● P1AI HOT 精选· aihot-apiZH20:25 · 05·20
英伟达2027财年Q1净利润583亿美元同比增长211%
英伟达 2027 财年第一财季(截止到 2026 年 4 月 26 日)总收入 816.15 亿美元,净利润 583.21 亿美元,同比直接翻了两倍多。增长主要靠数据中心业务,单这一块就进账 752 亿美元,同比涨了 92%。毛利率也拉到了 75% 左右,比去年同期高了 14 个百分点。公司预计下个季度收入能到 910 亿美元,上下浮动 2%。另外,董...
#Inference-opt#Nvidia#Product update
精选理由
英伟达这份财报就是AI基础设施景气度的温度计。数据中心752亿美元的收入说明大厂还在疯狂囤卡,211%的利润增速比很多AI公司的营收涨得还快。我会先打个折:这是财务数据,不是新模型或新功能发布,所以重要性停在82分。但数字本身已经足够让关注算力成本和供应链的人必须看一眼。
一句话点评
英伟达一个季度净赚583亿美元,同比涨了211%,但股价反而跌了2%,说明市场对它的预期已经高到离谱。
锐评
英伟达这个季度的财报数字确实夸张。总收入816亿美元,其中数据中心业务就占了752亿,同比涨了92%,基本是靠卖AI芯片撑起来的。净利润583亿,比去年同期翻了两倍多,毛利率也提到了75%左右,赚钱效率很高。公司还一口气批了800亿美元的回购计划,股息也涨了25倍,回馈股东的手笔很大。 但有个细节值得注意:下季度营收指引是910亿,只比这季度多了不到100亿,增速在放缓。而且财报这么好,股价反而跌了2%,说明市场之前已经把预期打得太满,现在看到增长没超预期就开始犹豫了。 正文没提具体是哪款芯片卖得最好,也没说竞争对手的情况。如果想知道这波增长还能撑多久,还得看后续大客户的订单是不是在减少,以及有没有更便宜的替代方案冒出来。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
20:23
24d ago
彭博科技· rssEN20:23 · 05·20
英伟达财报指引不及预期,芯片竞争加剧
英伟达最新季度财报显示,公司正努力向投资者证明AI已准备好进入主流市场,强调业务多元化和对大型数据中心运营商的依赖降低。但财报给出的业绩指引令人失望,芯片竞争压力加大。正文未披露具体的营收预测数字、竞争对手名称或收入构成细节。
#Inference-opt#Nvidia#Bloomberg#Commentary
精选理由
Bloomberg 报道 Nvidia 季报,核心看点是公司主动向市场解释 AI 已到主流化阶段,但正文信息密度低——没给财务指引、没点名竞争对手、没拆收入结构。所以 H 和 R 成立,K 不成立。信号强度落在 60–71 的通用信号区间,适合推送给所有关注 AI 芯片和算力趋势的读者。
一句话点评
英伟达最新财报想讲“AI已进入主流市场”的故事,但给出的业绩指引却让市场失望。正文没披露具体营收预测数字,也没点名竞争对手是谁,信息缺口明显。关键看点是:英伟达强调业务多元化和降低对大客户的依赖,这暗示它意识到单一市场风险。但“失望的指引”说明竞争压力(比如定制芯片或AMD)已经影响到预期。短评:故事讲得漂亮,数字没跟上,先别急着信。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K0·R1
20:12
24d ago
彭博科技· rssEN20:12 · 05·20
Baillie Gifford:中国芯片性能仍落后美国与英伟达
Baillie Gifford 的投资经理 Paulina McPadden 在 Bloomberg 视频里说,中国芯片在性能上仍然落后于美国和英伟达。正文没披露具体差多少、用什么基准测的,也没说他们看好哪些 AI 投资标的。所以这条信息更像一个定性判断,没有量化缺口,暂时没法判断差距是在缩小还是拉大。
#Inference-opt#Baillie Gifford#Nvidia#Paulina McPadden
精选理由
HKR-R 靠中美芯片竞争话题过关,但 HKR-H 是常规的“中国 vs 英伟达”角度,HKR-K 缺少基准和差距数字;来源是 Baillie Gifford 的公开评论,有可信度但不足以进精选。
一句话点评
Baillie Gifford 投资经理在 Bloomberg 视频里定性说中国芯片性能仍落后美国/英伟达,但正文没披露具体差多少、用什么基准测的,也没说差距在缩小还是拉大。这条信息更像一个观点表态,没有量化缺口,暂时没法判断趋势。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R1
20:10
24d ago
彭博科技· rssEN20:10 · 05·20
英伟达财报、SpaceX IPO申报、软银追投OpenAI
这期 Bloomberg Tech 聊了三件事:英伟达马上发财报,市场在等数字;SpaceX 准备提交 IPO 文件,号称历史级别;软银继续加注 OpenAI。正文没披露英伟达的具体营收或利润预期,也没说 SpaceX 打算融多少钱、估值多少,软银的投资条款同样没给。信息量有限,适合当个话题索引,具体判断得等更多细节出来。
#Nvidia#SpaceX#SoftBank#Funding
精选理由
低价值资讯汇总:H 靠 Nvidia 财报和 SpaceX IPO 申报撑起标题吸引力;K 和 R 都不及格,因为正文没披露任何指标、规模或投资条款,对从业者没有可落地的信息。
一句话点评
英伟达财报和SpaceX IPO是本周两条主线。英伟达决定AI算力股短期情绪,SpaceX若上市将是近年最大科技IPO之一。Bloomberg这期是视频摘要,正文没披露具体营收预期或估值数字,信息密度偏低。想看细节得等正式财报和招股书。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R0
19:47
24d ago
TechCrunch AI· rssEN19:47 · 05·20
吴恩达投的 IrisGo:一个盯着你屏幕学干活的小助手
IrisGo 是一款桌面 AI 助手,能盯着你的屏幕,自动学会怎么帮你干活。创始人说它像个“AI 管家”,但正文没披露什么时候上线、卖多少钱、支持什么系统、有没有安全控制,也没给可复现的任务执行测试结果。目前只能当个概念听,别急着让它接管电脑。
#Agent#Tools#IrisGo#Andrew Ng
精选理由
我会先打个折:IrisGo 说它的桌面 AI 能观察屏幕、自动学任务,听着像替你干活的数字同事,但正文没披露发布时间、价格、支持平台,也没说能力边界在哪——比如能稳定复现几步操作、会不会误触隐私数据。Andrew Ng 背书让这条消息有传播力,桌面 agent 又正好踩在自动化和工作流痛点上,所以 H 和 R 都成立。K 弱是因为关键落地信息全缺,没法判断是真省钱还是 demo 好看,分数就停在 64。
一句话点评
吴恩达投的 IrisGo 号称能盯着你的屏幕自学干活,像个“AI 管家”。但正文没披露上线时间、价格、支持什么系统,也没给可复现的任务执行测试结果。目前只能当个概念听,别急着让它接管电脑。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
19:38
24d ago
AI HOT 精选· aihot-apiZH19:38 · 05·20
Midjourney V8.1 上线反向提示:用 --no 排除画面元素
Midjourney 在 V8.1 版本中恢复了反向提示功能(旧版已有),通过 --no 标志排除指定元素,比如输入 --no people 就能生成不带人物的图像。操作简单直接,适合需要快速去掉画面中某些内容的场景。正文没披露该功能对生成质量或速度的具体影响,但作为老功能回归,使用门槛很低。
#Vision#Midjourney#Product update
精选理由
Midjourney V8.1 加了 --no 反向提示,用户可以用 --no people 这类指令排除画面元素。功能本身很实用,但正文只给了一个例子和一句话说明,没提生成质量变化、定价或模型其他改动,信息量偏少。
一句话点评
Midjourney V8.1 把老功能“反向提示”捡回来了,用 --no people 就能让画面里不出人,操作跟旧版一样简单。对经常要快速排除特定元素的用户挺实用,不用再靠写长 prompt 绕弯子。但正文没提加了这个 flag 后生成速度会不会变慢、画质有没有折扣,也没说支持多元素组合排除。功能本身门槛低,老用户直接上手,新用户看一眼语法就会。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
19:17
24d ago
r/LocalLLaMA· rssEN19:17 · 05·20
Qwen3-VL-Embedding-2B 跑在 Orange Pi 5b 上,一张图处理约 10 秒
Reddit 用户 atineiatte 把 Qwen3-VL-Embedding-2B 模型跑在了 Orange Pi 5b 开发板上,用的是 rkllm 推理框架。他写了个 demo 脚本,拿实时摄像头画面跟 1300 多条短语做比对,每张图处理时间大约 10 秒。这个速度不算快,但考虑到是在一块几百块的开发板上跑视觉 embedding 模型,成...
#Vision#Embedding#Inference-opt#Qwen
精选理由
H/K/R 三项都达标。第一人称实测,数字和工具链都给了,可信度还行。但来源是 Reddit 单帖,受众偏小众,离 72 分的精选线还差一点。
一句话点评
有人在 Orange Pi 5b(几百块的开发板)上跑通了 Qwen3-VL-Embedding-2B,用实时摄像头画面跟 1300 多条短语做比对,每张图处理约 10 秒。速度不算快,但成本极低,适合离线或边缘场景。正文没披露精度和功耗,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
19:10
24d ago
AI HOT 精选· aihot-apiZH19:10 · 05·20
MiniMax语音模型新增600多种声音
MiniMax Speech 2.8 Turbo 在 Together AI 上新增了 600 多种声音,你可以通过一个语音查找器试听。但正文没披露价格、支持哪些语言、有没有调用次数限制——这些对实际选型很关键,目前只能先当个功能预告看。
#Audio#MiniMax#Together AI#Product update
精选理由
H和K通过:600+声音和Together AI上线是具体信息。但全文只有一个demo链接,没有价格、语种、调用限制或评测对比,所以只能算一个小产品更新,不值得深入分析。
一句话点评
MiniMax 在 Together AI 上一次性塞了 600 多种声音,语音合成选型时选择面更宽了。但正文没披露价格、支持哪些语言、有没有调用次数限制——这些对实际选型很关键,目前只能先当个功能预告看。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
18:36
24d ago
r/LocalLLaMA· rssEN18:36 · 05·20
LLC:一个更轻量的 OpenWebUI 替代品,新增聊天记录转换和自定义工具调用
LocalLightChat v0.6 主打轻量,能直接导入 OpenWebUI 的聊天历史(从 webui.db 读取,图片可存本地或内嵌 base64),还支持自定义工具调用——相当于让本地模型能调用外部函数干活。正文没披露具体性能对比或资源占用数据,但轻量定位意味着对显存和内存要求更低,适合不想跑完整 OpenWebUI 的用户。
#Tools#LocalLightChat#OpenWebUI#LocalLightAI
精选理由
这是一个小型本地大模型工具更新,有具体的迁移和工具调用细节。单一 Reddit 来源且覆盖范围窄,评分落在 60–71 的小产品更新区间。
一句话点评
LocalLightChat v0.6 是个轻量版聊天界面,能直接导入 OpenWebUI 的聊天记录和图片,还支持让本地模型调用外部函数。适合不想跑完整 OpenWebUI 的用户,但正文没披露具体资源占用和性能对比,轻量到底省多少显存、快多少,得自己试。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
18:28
24d ago
AI HOT 精选· aihot-apiZH18:28 · 05·20
Google Gemini 联合 XPRIZE 办全球黑客松,用智能体工具解决现实问题
Google Gemini 和 XPRIZE 搞了个全球黑客松,要求参赛者用 Gemini 的智能体工具(就是让模型能调用工具、执行任务的 agent 能力)去解决真实世界的挑战。目前正文没披露赛程、奖金池、参赛资格和评审标准,想报名得自己去官网看。
#Agent#Tools#Gemini#XPRIZE
精选理由
只有 HKR-H 通过:Gemini 和 XPRIZE 的组合有品牌认知度,但 HKR-K 和 R 都不满足——赛程、奖金、评审、参赛资格全部缺失。没有硬排除规则触发,所以落在 40–59 的低价值区间。
一句话点评
Google Gemini 和 XPRIZE 合办全球黑客松,要求用 Gemini 的智能体工具(让模型能调用工具、执行任务)解决真实世界问题。目前正文没披露赛程、奖金池、参赛资格和评审标准,想报名得自己去官网看。短评:大厂+知名赛事背书,但信息太少,先别激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
18:15
24d ago
Hacker News 首页· rssEN18:15 · 05·20
铜板散热号称让数据中心省电90%,但正文没给任何测试细节
New Atlas 发了一篇报道,标题说铜板散热技术能把数据中心能耗砍掉 90%。但点进去正文只有网站导航和评论区链接,没写铜板怎么工作、跟什么比省了 90%、成本多少、什么时候能用。Hacker News 上目前 11 分、5 条评论,信息量约等于零。这个数字很漂亮,但先别激动——没有基线、没有实验条件,90% 目前就是个标题数字。
#New Atlas#Hacker News
精选理由
H和R通过:90%能耗降低的宣称有吸引力,且切中数据中心电费敏感点。K不通过:RSS正文只给了标题和评分,没提铜板怎么冷却、在什么环境下测的、要花多少钱装,所以整体评分偏低。
一句话点评
标题说铜板散热能砍数据中心90%能耗,但正文只有导航和评论区链接,没写原理、基线、成本、时间线。Hacker News上11分5条评论,信息量约等于零。这个数字很漂亮,但先别激动——没有实验条件,90%目前就是个标题数字。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
17:47
24d ago
FT · 科技· rssEN17:47 · 05·20
扎克伯格承诺Meta不再搞“全公司范围”裁员,此前已砍掉8000个岗位
扎克伯格对Meta员工说,以后不会再搞“全公司范围”的裁员了。此前Meta已经裁了8000人。不过正文没披露这个承诺的具体时间范围、适用条件,也没说是不是正式政策,所以这点先别太激动,可能只是内部安抚。
#Mark Zuckerberg#Meta#Personnel
精选理由
这条消息卡在H/K/R的及格线上,但正文只给了Meta的人事承诺和8000人裁员数字,没提AI部门、模型预算或产品影响,属于大厂人事新闻的常规范畴。
一句话点评
扎克伯格口头承诺Meta不再搞全公司裁员,但之前已裁8000人。正文没披露承诺的时间范围、适用条件,也没说是正式政策,所以先别太激动,可能只是内部安抚。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
17:40
24d ago
The Verge · AI· rssEN17:40 · 05·20
谷歌要把“氛围编程”搬上手机:自己写App放桌面
The Verge 报道,谷歌在 I/O 2026 上宣布 Android AI Studio,让用户直接在手机上写 App 并放到主屏幕。核心是“vibe coding”——用自然语言描述需求,AI 自动生成代码,不用学编程。正文没披露工具的具体机制、上线时间或是否免费,但方向很明确:把 App 开发从电脑 IDE 拉到手机界面,门槛降到“说句话就行...
#Code#Tools#The Verge#Google
精选理由
H 和 R 过关:手机主屏上跑 vibe coding 是个干净的平台钩子。K 偏弱:文章缺工具名、发布时间和 Android AI Studio 机制,所以留在 all 层。
一句话点评
谷歌I/O 2026宣布Android AI Studio,让你在手机上用自然语言写App,直接放主屏幕。核心是“vibe coding”——说句话就生成代码,不用学编程。但正文没披露工具具体机制、上线时间或是否免费。方向很明确:把开发门槛降到“说句话就行”,但实际效果和限制未知。短评:手机写App听着酷,但没细节前先别激动,可能只是高级快捷指令。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
17:21
24d ago
● P1FT · 科技· rssEN17:21 · 05·20
OpenAI 准备最快九月提交 IPO 申请
FT 这篇报道的正文被付费墙和安全验证挡住了,只拿到了标题和摘要。已知信息是:OpenAI 正在准备 IPO 文件,最快今年 9 月挂牌,目标估值冲到 1 万亿美元。承销商名单里有高盛、摩根士丹利和 Cooley 律所。但具体的发行条款、上市交易所、财务数据这些关键信息,正文没披露——或者说我们拿不到。1 万亿这个数字我先打个折看,毕竟现在连 S-1 ...
#OpenAI#Goldman Sachs#Morgan Stanley#Funding
精选理由
我会先打个折:1 万亿估值目标听着很吓人,但正文没披露这个数字是怎么算出来的,也没说收入、利润或用户增长的具体支撑,这点先别太激动。不过,FT 的报道把时间点、承销商和律所都点出来了,信息颗粒度够细,不是捕风捉影。一家基础模型公司走到 IPO 提交这一步,本身就是行业顶格的信号,所以重要性给到 95 没问题。
一句话点评
OpenAI 最快本周提交 IPO 申请,目标九月上市。赢了马斯克的官司后,它立刻把战场转向了华尔街。
锐评
OpenAI 准备上市了,时间点卡得很紧。在马斯克输掉那场威胁公司架构和融资的官司后第二天,消息就放出来了,目标是最快九月挂牌。据华尔街日报的消息源,它已经在跟高盛和摩根士丹利合作,可能几天或几周内就会秘密提交招股书。 这个节奏说明 OpenAI 想趁热打铁,把法律上的胜利直接转化成资本市场的信心。但报道里没提任何财务数据,比如营收、亏损、用户增速,这些才是决定它是不是“重磅 IPO”的关键。另外,SpaceX 的招股书也快公开了,两家公司会在融资能力上直接竞争,这比打官司更考验 Sam Altman。 现在最缺的信息是 OpenAI 的盈利模型到底长什么样。烧钱换规模的故事在 2026 年还能不能讲通,得等招股书出来才知道。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
17:06
24d ago
r/LocalLLaMA· rssEN17:06 · 05·20
5千美元能组一台AI服务器吗?
Reddit用户说自己用Framework台式机跑Qwen 7B,配128GB内存和12GB显存的RTX 3080,然后问大家:5千美元以内买机架式服务器加GPU划算,还是继续用工作站?正文被屏蔽了,看不到具体讨论。不过这个配置跑7B模型显存刚好够,12GB显存跑7B量化模型没问题,但跑更大模型或做微调就吃力了。5千美元预算买二手服务器加一张专业卡(比...
#Inference-opt#Reddit#Qwen#Framework
精选理由
HKR-H/R通过,因为5千美元本地服务器困境很实际且能引发共鸣;但HKR-K不通过:帖子没给出答案、评测或购买建议,属于低价值社区信号。
一句话点评
5千美元预算买AI服务器,Reddit用户纠结是上机架式服务器加GPU还是继续用工作站。他目前用Framework台式机+128GB内存+12GB RTX 3080跑Qwen 7B,显存刚好够,但跑大模型或微调就吃力。正文被屏蔽,看不到具体讨论。关键限制:12GB显存跑7B量化模型还行,但想跑更大模型或做微调,预算得往二手服务器加专业卡方向走。缺的是具体配置方案和性价比对比,比如二手服务器加...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
16:53
24d ago
Hacker News 首页· rssEN16:53 · 05·20
Dari-docs:用多模型并行跑文档测试,自动挑出写得烂的地方
mupt-ai 开源了一个叫 Dari-docs 的工具,核心思路是让多个大模型(支持不同供应商)并行读你的文档,然后各自输出一份 Markdown 反馈,告诉你哪里写得不清、缺例子、逻辑跳。你可以通过网页或命令行上传文档,工具会按任务列表分发给多个 agent 并行跑。好处是能快速拿到不同模型的视角,缺点是目前没有公开的评测数据,不知道这些反馈的准确...
#Agent#Code#Tools#mupt-ai
精选理由
一个Show HN小工具,流程讲得清楚但缺效果数据、定价和落地场景。HKR的h和k能过,r太弱,所以放在常规产品更新all档。
一句话点评
短评:用多个大模型并行审文档,想法不错,但没评测数据,先别太激动。 mupt-ai 开源的 Dari-docs,核心是让你上传文档后,同时派多个大模型(支持不同供应商)去读,每个模型独立输出 Markdown 反馈,指出哪里不清、缺例子、逻辑跳。好处是能快速拿到不同模型的视角,避免单一模型偏见。但正文没披露任何评测数据,比如这些反馈的准确率、漏报率,或者跟人工审校对比的效果。目前只能当个辅...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
16:48
24d ago
AI HOT 精选· aihot-apiZH16:48 · 05·20
Anthropic销售负责人用Claude Cowork管4000个客户,每晚自动打分,每天省90分钟
Anthropic美国中端市场销售负责人Travis Bryant分享了他怎么用自家产品Claude Cowork管4000个客户账户。流程是:每晚让Claude Cowork自动跑一遍所有账户数据,生成客户倾向分(谁更可能成交)、每日简报和每周销售预测。之前这些事要跨部门团队花几百小时才能做完,现在他一个人每天省下大约90分钟。正文没披露具体用了哪些...
#Agent#Tools#Anthropic#Travis Bryant
精选理由
硬排除-纯营销:这是Anthropic自家销售负责人用Claude Cowork的案例。4000个账户和90分钟的数字增加了信号,但“X用Y”的格式封顶39分。
一句话点评
Anthropic销售负责人用自家Claude Cowork每晚自动跑4000个客户账户数据,生成成交倾向分、简报和预测。之前跨部门团队要几百小时,现在他一人每天省90分钟。正文没披露具体用了哪些数据源、倾向分准确率如何,以及是否依赖CRM接口。省时效果直观,但规模化验证和成本细节缺失。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K1·R1
16:47
24d ago
Product Hunt · AI· rssEN16:47 · 05·20
MartinLoop:给AI编程Agent上笼头——设限额、留凭证、能回滚
MartinLoop 是一个控制层,专门管那些自主写代码的 AI Agent。它目前支持 Claude、Codex、OpenCode 等工具,核心功能是给 Agent 设花费上限、做结果校验、加安全规则、支持回滚,并且每次运行都会出一张“运行收据”,记录 Agent 做了什么、为什么继续、为什么停下。说白了就是防止 Agent 失控乱花钱或乱改代码。产...
#Agent#Code#Tools#MartinLoop
精选理由
只有 R 成立:给编码 agent 加限制和运行凭证这个方向对开发者有共鸣,但正文缺价格、集成方式和机制细节,信息缺口太大。当一个小工具发布处理,留在 all 以下即可。
一句话点评
MartinLoop 给写代码的 AI Agent 套了个笼头:设花费上限、做结果校验、支持回滚,每次运行还出一张“收据”记录 Agent 干了什么、为什么停。说白了就是怕 Agent 失控乱花钱或乱改代码。目前支持 Claude、Codex、OpenCode 等工具,免费。但正文没披露具体怎么校验结果、安全规则能细到什么程度,也没说集成深度——是只拦 API 调用还是能 hook 到代码仓...
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
16:03
24d ago
r/LocalLLaMA· rssEN16:03 · 05·20
单块 DGX Spark 跑 Qwen 3.5 122B Int4,速度冲到 40+ tok/s
Reddit 用户 Storge2 分享了一套配置,用 vLLM 在单块 DGX Spark 上把 Qwen 3.5 122B Int4 模型的推理速度推到 40+ tok/s。他自称这个成绩在 spark-arena 的各个上下文长度和并发测试里都是最高分,但没公开完整设置。40+ tok/s 意味着每秒能生成 40 多个 token,对 122B ...
#Inference-opt#Qwen#NVIDIA#vLLM
精选理由
一条 Reddit 帖子,说在单台 DGX Spark 上用 vLLM 跑 Qwen 3.5 122B 的 Int4 版本,能到 40+ tok/s。速度不错,但正文没披露完整参数(比如 batch size、精度、显存占用),复现门槛不低。对想低成本本地跑大模型的人是个信号,但别急着下单硬件,等更多验证。
一句话点评
Reddit 用户 Storge2 声称用 vLLM 在单块 DGX Spark 上把 Qwen 3.5 122B Int4 跑到了 40+ tok/s,自称是 spark-arena 最高分。40+ tok/s 对 122B 模型来说确实快,但正文没披露完整配置,也没说用了什么量化精度和 batch size。这点先别太激动,可能是特定优化技巧,未必能直接复现。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:56
24d ago
AI HOT 精选· aihot-apiZH15:56 · 05·20
OpenRouter 自动路由会锁住会话直到缓存过期
OpenRouter 发帖解释自动路由的缓存行为:一旦路由命中,会话会固定在同一模型或提供商上,直到缓存过期,所以不用担心自动切换导致缓存失效。正文没披露缓存时长、缓存 key 规则以及什么条件下会切换提供商。
#Inference-opt#OpenRouter#Product update
精选理由
HKR三项都成立,但正文只交代了会话亲和性,缓存时长、命中规则、提供商切换条件均未披露。属于有用的AI基础设施细节,不是重大产品发布。
一句话点评
OpenRouter 说自动路由会把会话钉在同一模型上直到缓存过期,所以不会因切换导致缓存失效。但正文没披露缓存时长、key 规则和切换条件,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:45
24d ago
● P1Hacker News 首页· rssEN15:45 · 05·20
字节跳动开源Lance:用单个模型实现图像视频理解与生成编辑
Lance 是字节跳动放出的一个多模态研究项目,把看图、看视频、生成图片、生成视频和编辑这些事塞进了同一个模型里。模型激活参数只有 3B,个头不大,训练用了不到 128 张 GPU,对想复现或微调的人来说门槛不算高。代码、论文和模型权重都公开了,但项目页没写具体的 benchmark 跑分和商用许可条款,这点先别太激动,得自己去翻论文和 HF 页面确认。
#Multimodal#Vision#ByteDance#Lance
精选理由
字节跳动的 Lance 把图像和视频的生成、理解塞进一个模型,激活参数 3B,训练用了不到 128 块 GPU。我会先打个折:正文没披露 benchmark 成绩、没放真实生成样本,授权协议也没说清楚,所以现在只能当研究发布看,别急着对标成熟产品。但单模型覆盖多模态这个方向,对想省部署成本的小团队确实有吸引力。
一句话点评
字节开源了一个3B参数的模型Lance,能同时做图片和视频的理解、生成和编辑,但实际效果和限制正文没细说。
锐评
字节跳动把Lance放出来了,一个模型干三件事:看懂图片/视频、生成新内容、还能编辑。参数量只有3B,属于小模型,好处是本地跑得动,成本低。但正文主要是个GitHub仓库的导航页,没给技术报告、没给评测分数,也没说训练数据怎么来的。光看Star数(445)和Fork数(27),社区还在早期围观阶段。 “统一多模态”这个方向是对的,但小模型同时做理解和生成,通常会在某个任务上妥协——要么生成质量打折扣,要么理解不够细。这点先别太激动,等他们放出论文或demo再看。另外,仓库里Issues只有6个,Pull requests是0,说明外部贡献还没起来,代码成熟度待观察。 目前缺的关键信息:在标准测试集上和专用模型的对比、推理延迟、显存占用,以及生成内容的版权和安全性说明。如果这些不补上,暂时只能当个有趣的研究预览,不适合直接往产品里塞。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
15:42
24d ago
r/LocalLLaMA· rssEN15:42 · 05·20
Qwen 3.6 35B 量化版实测:MTP 比 NTP 快 20-40%,但只限 GPU 负载高时
ByteShape 放出了 Qwen 3.6 35B 的 GGUF 量化版,分 NTP 和 MTP 两种方案,在五张 GPU 和四类 CPU 设备上跑了基准。MTP 在 GPU 负载高时生成速度能快 20-40%,但 CPU 上反而推荐用 NTP。注意:正文没披露具体量化精度和显存占用,所以省显存的效果只能靠猜。如果手头有高负载 GPU 任务,MTP ...
#Inference-opt#Benchmarking#ByteShape#Qwen
精选理由
这是一篇 Reddit 帖子发布的本地量化跑分,针对 Qwen 3.6 35B 的 GGUF 版本,对比 NTP 和 MTP 两种推理模式。对 LocalLLaMA 读者有用,但不算行业级新闻。没有触发硬排除条件。
一句话点评
ByteShape 把 Qwen 3.6 35B 量化成 GGUF,分 NTP 和 MTP 两种方案。MTP 在 GPU 负载高时生成速度快 20-40%,但 CPU 上反而推荐 NTP。注意:正文没披露具体量化精度和显存占用,所以省显存的效果只能靠猜。如果手头有高负载 GPU 任务,MTP 值得一试,但 CPU 用户先别激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:41
24d ago
AI HOT 精选· aihot-apiZH15:41 · 05·20
开源插件让Codex App用上Computer Use和自定义界面
一个开源项目给Codex App做了个插件,即使你是API登录用户,也能开启Computer Use功能(让模型操作电脑界面),还能加Goal指令(设定任务目标)。界面可以改成类似Chrome浏览器的顶部Tab样式,任务开始和完成时能设置音效提醒。项目地址在评论区,正文没披露插件安装难度或对API调用成本的影响。
#Agent#Tools#Open source#Product update
精选理由
正文没披露插件仓库的 star 数、版本兼容范围或社区活跃度,所以验证偏弱。功能本身对 Codex 用户有实用价值,但没提到任何性能数据或使用门槛,这点先别太激动。
一句话点评
短评:给Codex App加Computer Use和Goal指令的开源插件,API用户也能用,但安装门槛和成本影响未知。 点评:这个开源插件让Codex App的API登录用户也能用上Computer Use(模型操作电脑界面)和Goal指令(设定任务目标),算是把原本可能限制在高级订阅的功能下放了。界面还能改成Chrome顶部Tab样式,加任务音效提醒,体验上更像个完整工具。但正文没披...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
15:41
24d ago
r/LocalLLaMA· rssEN15:41 · 05·20
Cohere 开源 Command A+ 模型,BF16 权重已上线 Hugging Face
Reddit 用户分享了一个 Hugging Face 链接,指向 Cohere 的 Command A+ 模型(BF16 精度)。目前正文被 Reddit 屏蔽,无法获取参数量、许可证、发布说明或跑分数据。如果你在找能本地部署的商用级模型,这个值得关注,但具体性能还得等更多信息。
#CohereLabs#Hugging Face#Reddit#Product update
精选理由
HKR-R 通过,因为新 Cohere 检查点对本地模型用户很重要,但 HKR-H/K 不通过:该条目只是一个仓库链接,没有参数、许可证、上下文窗口或基准测试结果。
一句话点评
Cohere 悄悄在 Hugging Face 上传了 Command A+ 的 BF16 权重,但 Reddit 帖子正文被屏蔽,参数量、许可证、跑分全没披露。如果是之前 Command A 的升级版,可能支持 128K 上下文和工具调用,适合本地部署。但这点先别太激动——没跑分没许可证,商用风险未知。正文没披露任何技术细节,连模型卡都看不到。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
15:18
24d ago
r/LocalLLaMA· rssEN15:18 · 05·20
IBM 两个 OCR 模型对比:加了个动态提示到底有没有用?
Reddit 上有人问 granite-docling-258m 和加了动态提示的 2stage 版本到底差在哪。发帖人只说了 2stage 版会用动态提示预先算好页面布局对象,专门应对训练数据里没见过的排版。但正文被 Reddit 屏蔽了,没披露具体效果提升多少、延迟变高还是变低、样本需求有没有减少。如果你在挑 OCR 模型,这点信息还不够做决定,得...
#Vision#IBM#Reddit#Granite Docling
精选理由
一条 Reddit 上的提问帖,没有测试数据、没有效果对比、也没有第三方验证。唯一有价值的信息是 2stage 版本改了预计算方式,但正文没披露这个改动到底省了多少计算量或提升了多少准确率。信息缺口太大,不值得上首页推荐。
一句话点评
IBM 的 granite-docling-258m 和加了动态提示的 2stage 版本,区别在于后者能预先算好页面布局,专门对付训练数据里没见过的排版。但正文被 Reddit 屏蔽了,没披露效果提升多少、延迟变高还是变低。如果你在挑 OCR 模型,这点信息还不够做决定,得等实测。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
15:14
24d ago
FT · 科技· rssEN15:14 · 05·20
黑石50亿美元数据中心计划:创意还是无奈?
黑石集团抛出一个50亿美元的数据中心建设计划,从商业逻辑上看说得通,市场空间也确实大。但正文被付费墙挡住,没披露选址、容量、客户和建设时间表。这点先别太激动——50亿在数据中心行业不算小数目,但没具体信息前只能当个方向性信号。
#Blackstone#Financial Times#Commentary
精选理由
HKR-K靠50亿美元这个数字勉强过关。正文没披露选址、容量、客户和建设时间表,AI相关性停留在数据中心基础设施层面,所以归入低价值区间。
一句话点评
黑石砸50亿美元建数据中心,方向对但细节全无。选址、容量、客户、时间表一概没披露,正文被付费墙挡住。50亿在数据中心行业不算小,但没具体信息前只能当个方向性信号,别太激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
15:10
24d ago
Hacker News 首页· rssEN15:10 · 05·20
Stable Audio 3:Stability AI 开源三款音频生成模型,小模型可在消费级显卡上跑
Stability AI 发布了 Stable Audio 3,一套包含 small、medium、large 三个尺寸的音频生成模型,能生成和编辑几分钟长的音频。核心改进是自研的“语义-声学自编码器”,把音频压进紧凑的隐空间再扩散生成,既保真又让模型更容易理解音频结构。后训练阶段加了对抗训练,减少推理步数、提升生成质量。生成速度:H200 上不到 2...
#Audio#Research release
精选理由
H 和 R 都成立:Stable Audio 出 3 代了,这个钩子对音频生成从业者够直接。K 不成立,因为正文没给任何可验证的细节——参数、数据、时长、评测一概没有,所以分数卡在 60–71 这个区间。
一句话点评
Stability AI 开源了三个尺寸的音频生成模型,小和中模型权重和代码都放了,能在消费级显卡上跑。核心改进是自己搞的“语义-声学自编码器”,把音频压进紧凑空间再扩散生成,几分钟的长音频也能一次生成,不用分段拼接。后训练加了对抗训练,推理步数少了,生成质量反而更高。H200 上生成不到 2 秒,MacBook M4 也就几秒。不过论文没披露训练数据具体规模,也没给和同类模型的客观指标对比...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
15:00
24d ago
AI HOT 精选· aihot-apiZH15:00 · 05·20
PixVerse 用角色分镜保证 AI 视频角色一致
PixVerse 发了一个 15 秒的烹饪短片,核心做法是先画好角色分镜,再拿它当参考生成视频。这样能保证同一个角色、故事节点、镜头方向和动作细节从头到尾不跑偏。正文没披露分镜工作流的具体步骤,但思路很直接:让 AI 在动起来之前先知道角色长什么样、故事怎么走。
#Multimodal#Vision#PixVerse#Product update
精选理由
HKR三项都达标:标题钩子抓人,正文给了具体工作流,且踩中创作者痛点。但只是PixVerse单家社媒帖,不是模型或产品发布,所以评分卡在有用但不值得头条的区间。
一句话点评
PixVerse 用角色分镜当参考,生成了一段 15 秒的烹饪短片,保证角色、故事节点、镜头方向、动作细节从头到尾一致。思路很直接:让 AI 先知道角色长什么样、故事怎么走,再动起来。正文没披露分镜工作流的具体步骤,但这个方法比纯文生视频靠谱,适合做叙事类短片。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:40
24d ago
Hacker News 首页· rssEN14:40 · 05·20
用AI智能体给分布式系统做测试
这是一个GitHub项目,标题说用AI智能体(AI agent)来测试分布式系统。但正文只给了仓库链接和Hacker News讨论链接,目前3颗星、0个issue。项目具体怎么设计智能体、测什么系统、用什么方法、能不能复现、效果如何,全都没披露。这点先别太激动,等作者放出更多细节再说。
#Agent#GitHub#Hacker News#Open source
精选理由
标题的 hook 成立,但正文几乎等于空壳——只有链接和评分,没有方法、没有数字、没有可复现的结论。对从业者来说这就是一个低价值的开源链接,不值得单独推荐。
一句话点评
标题说用AI智能体测分布式系统,但正文只给了GitHub链接,目前3星、0个issue。具体怎么设计、测什么、效果如何,全没披露。这点先别太激动,等作者放出更多细节再说。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
14:00
24d ago
TechCrunch AI· rssEN14:00 · 05·20
NanoClaw 创始人拒了 2000 万美元收购,自己拿了 1200 万美元种子轮
NanoClaw 是 OpenClaw 的安全替代品,跑在容器沙箱里,不让 AI agent 直接接触电脑。创始人拒绝了 2000 万美元收购,转而拿了 1200 万美元种子轮。正文没披露投资方和估值,但拒绝收购说明团队想自己控制方向。
#Agent#Safety#Tools#NanoClaw
精选理由
HKR三项都够,但NanoClaw还太早期——正文没提采用率、性能指标或知名客户,所以重要性压在70分档,没进精选。
一句话点评
NanoClaw 是 OpenClaw 的安全替代品,把 AI agent 关在容器沙箱里跑,不让它直接碰电脑。创始人拒了 2000 万美元收购,拿了 1200 万种子轮——拒绝收购说明团队想自己控方向,但正文没披露投资方和估值,这点先别太激动。短评:安全沙箱 + 拒绝收购,方向对但钱和验证都还缺。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:43
24d ago
Hacker News 首页· rssEN13:43 · 05·20
GitHub 确认 3800 个仓库被恶意 VSCode 插件攻破
GitHub 证实,一个恶意 VSCode 扩展导致 3800 个仓库被入侵。目前正文没披露插件名称、攻击链条和受影响账户范围,只链接了之前 Hacker News 的讨论帖。3800 这个数字说明影响面不小,但具体怎么攻的、哪些仓库遭殃,还得等更多细节。
#Code#Tools#GitHub#VSCode
精选理由
这是一起开发者工具安全事件,不是 AI 模型或产品能力更新,所以放在 interesting 档位,不上 featured。3,800 这个数字和 VSCode 扩展这个攻击入口是硬钩子,但正文信息量不够,没法做更深判断。
一句话点评
GitHub 确认一个恶意 VSCode 扩展搞了 3800 个仓库,数字挺大,但正文没披露插件名字、攻击链条和受影响账户范围,只链了个 HN 讨论帖。目前信息缺口明显,没法判断是供应链投毒还是凭据窃取。短评:数字吓人,细节欠奉,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:33
24d ago
r/LocalLLaMA· rssEN13:33 · 05·20
Hugging Face 排行榜现在能按模型参数量筛选了
Hugging Face 的基准测试页面新增了按模型大小筛选的功能,比如可以直接看 32B 以下哪个模型在 SWE-bench Verified 上表现最好。正文没披露筛选粒度(比如是按 7B/13B 档位还是精确参数量)以及功能上线时间。对挑小模型做部署的人来说,省得自己手动扒数据了。
#Benchmarking#Hugging Face#Product update#Benchmark
精选理由
HKR全通过,因为这项功能改变了本地模型用户看排行榜的方式,而且给出了具体的32B以下SWE-bench Verified例子。重要性维持在60-71区间,因为筛选粒度、上线范围、以及更广泛的影响正文都没披露。
一句话点评
Hugging Face 的排行榜现在能按模型大小筛选了,比如直接看 32B 以下谁在 SWE-bench Verified 上最强。对挑小模型部署的人来说省了手动扒数据的功夫。但正文没披露筛选粒度(是按 7B/13B 档位还是精确参数量)以及上线时间,功能细节还不清楚。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
12:38
24d ago
r/LocalLLaMA· rssEN12:38 · 05·20
有人用 Qwen 3.6-27B 写了个单页 Hugging Face 模型搜索工具
Reddit 用户发了一个纯 HTML 的 Hugging Face 模型搜索工具,代码是用 Qwen 3.6-27B 写的。功能上支持按日期范围和参数量筛选模型,搜索结果会按基础模型和衍生作者分组展示,第一次搜索后会缓存 HF API 结果。工具本身就是一个 HTML 文件,不用装依赖,打开就能用。正文没披露缓存有效期和是否支持私有模型搜索。
#Code#Tools#Qwen#Hugging Face
精选理由
HKR 的 H 和 K 都成立:Qwen 自写单文件工具、缓存 HF API 结果都是具体事实。但来源是 Reddit 个人用户,权威性低,且场景局限在模型搜索体验优化,不触发硬排除条件,所以落在 60–71 的 all 区间。
一句话点评
一个纯 HTML 的 Hugging Face 模型搜索工具,代码是 Qwen 3.6-27B 写的。支持按日期和参数量筛选,结果按基础模型和衍生作者分组,第一次搜索后缓存 HF API 结果。不用装依赖,打开就能用。正文没披露缓存有效期和是否支持私有模型搜索。短评:模型搜索小工具,代码是 AI 写的,胜在轻量,但功能有限。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
11:43
24d ago
r/LocalLLaMA· rssEN11:43 · 05·20
Reddit 用户实测 whichllm:4-6GB 显存笔记本能跑,但精度没给数据
一位 Reddit 用户在办公笔记本(4-6GB 显存)上测了 whichllm,说 qwen2.5-coder-instruct 3b 能当本地命令行工具用。但帖子没披露 gpt-oss-20b 或 qwen3.6-27b 的可复现运行条件,也没给任何精度对比数据。正文被 Reddit 屏蔽,看不到更多细节。结论:低显存能跑,但准确率未知,别急着信。
#Code#Tools#Inference-opt#Qwen
精选理由
这是一条 Reddit 个人测试帖,唯一确定的信息是 3B 模型能在 4-6GB 显存上跑,对低配用户有参考意义。但正文没披露 gpt-oss-20b 和 qwen3.6-27b 的运行条件,这两个大模型能不能跑、跑多慢都是未知数,所以整体价值有限,不能太当真。
一句话点评
Reddit 用户用 4-6GB 显存的办公笔记本跑了 whichllm,说 qwen2.5-coder-instruct 3b 能当本地命令行工具用。但帖子被 Reddit 屏蔽,正文看不到,也没披露 gpt-oss-20b 或 qwen3.6-27b 的可复现运行条件,更没给任何精度对比数据。结论:低显存能跑,但准确率未知,别急着信。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
10:42
24d ago
AI HOT 精选· aihot-apiZH10:42 · 05·20
商汤 SenseNova U1:一个模型同时处理文字和图片
商汤发了 SenseNova U1,号称能同时理解文本和图像,而不是像多数工具那样分开做。正文没披露模型参数量、定价、上线时间,也没给可复现的评测条件,所以实际效果和成本都还不清楚。
#Multimodal#Vision#SenseTime#Product update
精选理由
HKR三项全挂:这是一条厂商自述的多模态产品名,没有参数、上线条件、价格或可复现评测。按0/3 HKR排除规则,分数压在40以下。
一句话点评
商汤发了 SenseNova U1,号称能同时理解文本和图像,而不是像多数工具那样分开做。正文没披露模型参数量、定价、上线时间,也没给可复现的评测条件,所以实际效果和成本都还不清楚。 短评:多模态不新鲜,关键看落地成本。商汤没给任何硬指标,先打个折。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R0
10:35
24d ago
Hacker News 首页· rssEN10:35 · 05·20
Qwen3.7-Max:专为智能体时代设计的旗舰模型
Qwen3.7-Max 是阿里云最新发布的闭源模型,主打智能体(agent)能力,也就是让模型能自己调用工具、写代码、操作软件,完成几百上千步的复杂任务。官方展示了一个例子:模型连续跑了35小时,自主优化了1000多次内核代码。在编码智能体测试中,Terminal Bench 2.0 得分69.7,SWE-Verified 80.4,都略高于对比的 O...
#Agent#Qwen#Hacker News#Product update
精选理由
H 和 R 靠 Qwen3.7-Max 的 Agent 定位能吸引点击和从业者关注,但 K 不通过:RSS 正文只有 HN 元数据,没有模型规格、评测、定价或上线时间,信息缺口太大。
一句话点评
阿里云发了Qwen3.7-Max,闭源模型,主打让模型自己干活——写代码、调内核、操作软件,能连续跑35小时自主优化内核代码,调了1000多次工具。编码测试Terminal Bench 2.0得分69.7,SWE-Verified 80.4,比对比模型略高一点,但差距不大。亮点是跨框架通用,Claude Code、OpenClaw都能跑。不过正文没披露模型参数量、训练成本、API定价,也没说...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
10:32
24d ago
AI HOT 精选· aihot-apiZH10:32 · 05·20
Qwen 2026大会:AI原生云架构蓝图发布
阿里云在Qwen 2026大会上公布了主题演讲议程,核心是AI原生云和Agent原生云架构,以及多模态视觉技术发布。议程强调面向全球规模的工程蓝图,但正文没披露具体架构参数、产品上线时间或可用性。
#Agent#Reasoning#Multimodal#Qwen
精选理由
硬性排除规则适用:这是阿里云的大会议程,只有话题标签,没有规格、可用性或定价。HKR三项全不通过,所以保持排除。
一句话点评
阿里云在 Qwen 大会上画了个 AI 原生云架构的饼,但正文没披露任何具体参数、上线时间或可用性。议程标题看着挺大——Agent 原生云、多模态视觉、推理未来——但全是方向,没细节。目前只能当战略预告看,别当产品发布。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
10:14
24d ago
AI HOT 精选· aihot-apiZH10:14 · 05·20
阿里云MSE AI调度器公测:让Agent自己干活,不用人盯着
阿里云开放了MSE AI调度器的免费公测,主要解决开源Agent方案(比如OpenClaw、Dify)常见的三个问题:容易挂、运维麻烦、出了事不知道哪步错了。它做了分布式调度保证高可用、统一权限管理、弹性伸缩省成本,以及全链路可观测性——就是每一步执行都能追踪到日志和耗时。适合想把Agent放进生产流程、但不想自己搭整套运维体系的团队。公测免费,链接在原文。
#Agent#Tools#Alibaba Cloud#OpenClaw
精选理由
触发硬排除规则2:这是阿里云为自己的MSE AI调度器公测写的功能列表,不是范式转变的产品。HKR-K有一些机制信息,但云厂商推广限制了分数。
一句话点评
阿里云把MSE AI调度器开放免费公测了,主打解决开源Agent方案(OpenClaw、Dify)容易挂、运维麻烦、出问题找不到根因的痛点。它做了分布式调度保证高可用、统一权限管理、弹性伸缩省成本,以及全链路可观测——每一步执行都能追踪日志和耗时。适合想把Agent放进生产流程、但不想自己搭运维体系的团队。公测免费,但正文没披露公测结束后的定价,长期成本未知。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
10:04
24d ago
Hacker News 首页· rssEN10:04 · 05·20
用AI写了10万行Rust代码后的经验总结
作者用AI在约4周内写了10万行Rust代码,实现了一个多Paxos共识引擎,性能从2.3万 ops/s优化到30万 ops/s。核心经验是:让AI写代码合约(前置条件、后置条件、不变式),再让AI根据合约生成测试和属性测试,能提前抓到Paxos安全违规这类深层bug。作者还推荐轻量级规格驱动开发——先用/specify生成用户故事和验收标准,再用/c...
#Code#Commentary
精选理由
H 和 R 过关:10万行 Rust 是个强钩子,也对应了 AI 写代码靠不靠谱的焦虑。K 不过关:工具配置、错误率、工作流细节都没披露,所以分数压在 60–71 区间。
一句话点评
作者用AI在4周内写了10万行Rust代码,实现了一个多Paxos共识引擎,性能从2.3万 ops/s优化到30万 ops/s。核心经验是:让AI写代码合约(前置条件、后置条件、不变式),再让AI根据合约生成测试和属性测试,能提前抓到Paxos安全违规这类深层bug。作者还推荐轻量级规格驱动开发——先用/specify生成用户故事和验收标准,再用/codex或claude code生成实现。...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
08:49
24d ago
Hacker News 首页· rssEN08:49 · 05·20
Raster 上线链上投资组合分析工具,从原始区块链数据重建可审计的盈亏
Raster 发布了一个 DeFi 投资组合分析工具,能从原始链上活动重建可审计的状态,并计算出确定的盈亏(PnL)。页面展示了一个示例钱包,资产净值约 31 万美元,但未实现亏损高达 59 万美元,说明工具能清晰呈现实际盈亏。正文没有披露定价、支持多少条链、以及上线时间,这些信息目前是缺失的。
#Agent#Raster#Product update
精选理由
HKR-K通过链上状态重建和确定性PnL机制,但HKR-H基本是口号,HKR-R过于DeFi小众,对AI从业者吸引力有限。无硬性排除,但属于低价值产品更新区间。
一句话点评
Raster 做了一个 DeFi 投资组合分析工具,能从链上原始数据重建交易历史并算出确定的盈亏(PnL)。示例钱包净值 31 万美元,未实现亏损却高达 59 万美元,说明工具能清晰展示实际盈亏,而不是只看表面数字。这点对 DeFi 用户挺有用,尤其是那些跨链、多协议操作的人。但正文没披露定价、支持多少条链、以及上线时间,这些信息目前是缺失的。如果是真的,能省去手动对账的麻烦,但先别太激动,...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
08:48
24d ago
r/LocalLLaMA· rssEN08:48 · 05·20
Qwen3.6 27B 在两块 Blackwell 6000 上跑到 100–110 tokens/s,还有优化空间吗?
Reddit 用户用 llama.cpp 跑 Qwen3.6-27B,两块 Blackwell 6000 GPU,输出速度 100–110 tokens/s。配置拉满:104 万上下文、并行 4、BF16 GGUF、FlashAttention、MTP draft。速度不慢,但正文没披露延迟分解或每层利用率,所以瓶颈在哪不好说。如果这是纯推理,这个吞吐...
#Inference-opt#llama.cpp#Qwen#AMD
精选理由
一条具体的本地推理跑分帖,H/K/R三项都够,但只是单次Reddit测试,没披露延迟分解或可复现的测试矩阵,所以分数压在60–71区间。
一句话点评
两块Blackwell 6000跑Qwen3.6-27B,输出100–110 tokens/s,配置拉满:104万上下文、BF16、FlashAttention、MTP draft。速度不差,但正文没披露延迟分解或每层利用率,瓶颈在哪不好说。如果纯推理,这个吞吐对27B模型算正常偏上,但两块专业卡的成本够买好几台消费级机器,性价比存疑。短评:速度还行,但两块专业卡的成本够买好几台消费级机器了。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
08:29
24d ago
r/LocalLLaMA· rssEN08:29 · 05·20
LMStudio 的 MTP 功能开了反而让输出变差
一位 Reddit 用户发现,在 LMStudio 里开启 MTP(多 token 预测)功能后,模型输出质量明显下降。他做了两次对比测试,只切换 MTP 开关,提示词用了 52 个短句。但帖子没交代用了什么模型、LMStudio 版本和采样参数,所以这个结论的适用范围还不清楚。
#Inference-opt#LMStudio#LocalLLaMA#Incident
精选理由
信息来自单个 Reddit 帖子,测试只做了两组,模型、版本和采样参数都没披露,证据偏弱。对本地推理用户是个有用的信号,但还不到推荐头条的程度。
一句话点评
Reddit 用户实测发现,在 LMStudio 里打开 MTP(多 token 预测,即一次预测多个后续 token 以加速推理)后,输出质量反而变差。他只做了两次对比测试,提示词用了 52 个短句,但没交代用了什么模型、LMStudio 版本和采样参数。结论适用范围有限,更像是个案提醒:MTP 加速可能牺牲质量,尤其在小模型或特定采样设置下。正文没披露测试模型和版本,建议用户在自己常用配...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
07:40
24d ago
AI HOT 精选· aihot-apiZH07:40 · 05·20
写个提示词就能生成超真实足球场自拍视频
PixVerse 放了一条提示词,目标是生成一段五个朋友在大型体育场用手机自拍的视频。提示词写得很细:五个角色的外貌要一致、球场环境要具体、镜头要模拟真实手机拍摄的抖动和失焦,还得有一连串自然的动作。效果看起来挺真,但正文没披露生成成功率、需要多少算力、或者是不是每次都能保持角色长相不崩——这点先别太激动。
#Multimodal#Vision#PixVerse#Product update
精选理由
HKR-H和HKR-K靠视觉提示钩子和具体约束条件通过。但没交代模型版本、生成参数、失败案例或对比,所以只是个低价值的提示词展示,不触及从业者关心的成本、效果或安全痛点。
一句话点评
PixVerse 放了一条超细提示词,目标是生成五个朋友在球场用手机自拍的视频,效果挺真。但正文没披露生成成功率、算力成本或角色长相是否每次都能保持不崩——这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K1·R0
07:18
24d ago
r/LocalLLaMA· rssEN07:18 · 05·20
Qwen3.7 Max 在 Artificial Analysis 排第五,跟 GPT-5.4 差不多,比 Gemini 3.5 Flash 高一点
Qwen3.7 Max 在 Artificial Analysis 的榜单上排第五,分数跟 GPT-5.4(xhigh 配置)差不多,还比刚发的 Gemini 3.5 Flash 高一截。另一边,DSV4 Flash 和 Qwen3.6 27B 比自家 Max 版本低了 6 分。帖子还提到 Qwen3.7 的 27B 和 35B 版本分数没公布,大家只...
#Benchmarking#Qwen#Artificial Analysis#Google
精选理由
这是一条 Reddit 上关于 Artificial Analysis 排名的摘要,不是正式发布或完整评测报告。排名第5、接近 GPT 5.4 xhigh、高于 Gemini 3.5 Flash 这些信息有看点,但正文没披露测试设置、数据集、成本或延迟等细节,所以信息量有限。分数卡在 60–71 区间合理。
一句话点评
Qwen3.7 Max 在 Artificial Analysis 排第五,分数跟 GPT-5.4 高配版差不多,还压了刚发的 Gemini 3.5 Flash 一头。但注意这是 Max 版,27B/35B 小模型分数还没公布,大家只能干等。同场 DSV4 Flash 和 Qwen3.6 27B 比自家 Max 低了 6 分,说明小模型跟大杯差距不小。正文没披露具体测试集和成本,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:05
24d ago
Product Hunt · AI· rssEN07:05 · 05·20
InstaVM:给 AI agent 开一台“即开即用”的虚拟机,200 毫秒内启动
InstaVM 在 Product Hunt 上线,主打“给 AI agent 的即时电脑”。它用 Firecracker 微虚拟机技术,把 agent 跑在隔离环境里,启动时间不到 200 毫秒。你可以把它理解成给每个 agent 单独开一台轻量服务器,跑完就销毁,安全可控。产品定位是 agent 的生产控制面板,支持监控和权限管理。目前正文没披露定...
#Agent#Tools#InstaVM#Product Hunt
精选理由
一个 Product Hunt 产品页,只有“面向 AI agents 的即时计算机”这个定位。HKR-H 勉强及格,HKR-K/R 都不及格,因为价格、运行环境、部署方式和实际优劣全都没提。
一句话点评
给每个 AI agent 单独开一台轻量虚拟机,跑完就销毁,启动不到 200 毫秒。基于 Firecracker 微VM,主打隔离和安全。目前只看到 Product Hunt 页面,定价、支持哪些 agent 框架、部署方式都没披露。如果是按需计费,对跑短任务的 agent 挺省钱,但长期运行的成本和性能还得看实测。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
06:21
24d ago
Product Hunt · AI· rssEN06:21 · 05·20
Second Brain for AI:给 Claude、ChatGPT 和 Cursor 装一个持久记忆层,免费
每次关掉聊天窗口,AI 就忘了你之前说过什么。这个开源工具(MIT 协议)给 Claude、ChatGPT、Cursor 等 MCP 客户端加了一个自托管的记忆层,存一次上下文,下次靠语义就能召回,不用再翻关键词。它跑在 Cloudflare 上,有免费额度,数据归你自己管。还带了去重和语义搜索功能。去重逻辑分三档:相似度低于 0.85 就存为新条目;...
#Memory#Anthropic#OpenAI#Cursor
精选理由
Product Hunt 的发布信息很薄:HKR-R 落在跨工具记忆痛点上,HKR-H 属于常规产品包装,HKR-K 缺少存储、权限和同步细节。没有硬性排除条件,保留 all 层级。
一句话点评
给 Claude/ChatGPT 加了个自托管记忆层,下次聊天能靠语义召回之前说过的内容,不用再翻关键词。跑在 Cloudflare 上,有免费额度,数据归自己管。去重分三档,相似度低于 0.85 才存为新条目。但正文没披露存储机制、权限边界和保留策略,免费额度具体多少也没说,生产环境慎用。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H0·K0·R1
06:18
24d ago
AI HOT 精选· aihot-apiZH06:18 · 05·20
开源油猴脚本:截图自动上传小红书抖音,还能扒YouTube字幕喂给ChatGPT
一个开源油猴脚本,能让你在浏览器里截图后直接粘贴上传到小红书、抖音和微信公众号后台,省去手动保存再上传的步骤。还顺手加了YouTube字幕复制、倍速播放,以及把内容一键导出到NotebookLM或ChatGPT的功能。作者说这工具让他更愿意把X上的内容同步到国内平台,不过也承认部分平台的上传体验不太好。正文没披露脚本具体支持哪些浏览器、有没有平台封号风险。
#Tools#X#NotebookLM#ChatGPT
精选理由
HKR-H和HKR-K通过:文章给出了一个具体的开源油猴脚本,能跨平台截图、处理字幕、调速并导出到AI工具。但正文没披露仓库星数、安装量或技术细节,所以这只是一个实用小工具更新,对从业者没有紧迫性。
一句话点评
一个油猴脚本,让你在浏览器里截图后直接粘贴上传到小红书、抖音和微信公众号后台,省去手动保存再上传的步骤。还顺手加了YouTube字幕复制、倍速播放,以及把内容一键导出到NotebookLM或ChatGPT。作者说这工具让他更愿意把X上的内容同步到国内平台,不过也承认部分平台的上传体验不太好。正文没披露脚本具体支持哪些浏览器、有没有平台封号风险。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
06:13
24d ago
r/LocalLLaMA· rssEN06:13 · 05·20
给8B小模型加护栏,agent任务从53%跳到99%
Reddit帖子说,给一个80亿参数模型加上护栏(guardrails),在agent任务上准确率从53%拉到99%。数字很漂亮,但正文没披露具体任务集、模型名字、护栏机制和评测条件,所以先别太激动。如果属实,意味着小模型加一层规则或验证就能接近满分,成本比换大模型低很多。
#Agent#Safety#Benchmarking#ACM CAIS
精选理由
H 和 R 通过:数字跳升有话题性,且 agent 可靠性是实操痛点。K 不通过:缺任务集、模型名和评测条件,信息不足以支撑高置信度判断,只能放在“有趣”档。
一句话点评
短评:8B模型加护栏从53%跳到99%,数字漂亮但先别激动。 点评:Reddit帖子称,给一个80亿参数模型加上护栏(guardrails),在agent任务上准确率从53%拉到99%。如果属实,意味着小模型加一层规则或验证就能接近满分,成本比换大模型低很多。但正文没披露具体任务集、模型名字、护栏机制和评测条件,来源是ACM CAIS '26预印本,且Reddit链接被墙,无法验证。这点先...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
05:24
24d ago
Product Hunt · AI· rssEN05:24 · 05·20
Google Antigravity 2.0:桌面端多智能体编排工具
Google 发布了 Antigravity 2.0,一个桌面应用,可以在 IDE 里同时跑多个编码智能体,还支持定时后台任务和子智能体工作流。它原生集成了 AI Studio、Firebase 和 Android,面向做生产级应用的开发者。正文没披露具体能跑多少个智能体、怎么集成、定价多少、什么时候能用,所以实际效果和成本还不清楚。
#Agent#Tools#Google#Product update
精选理由
H 和 R 过关,但 K 缺具体规格。Product Hunt 这条更新信息量太少,所以分数压在 72 以下。
一句话点评
Google 出了个桌面应用 Antigravity 2.0,能在 IDE 里同时跑多个编码智能体,还支持定时后台任务和子智能体工作流。原生集成了 AI Studio、Firebase 和 Android,面向做生产级应用的开发者。但正文没披露具体能跑多少个智能体、怎么集成、定价多少、什么时候能用,所以实际效果和成本还不清楚。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
05:19
24d ago
Product Hunt · AI· rssEN05:19 · 05·20
Google 出了个终端里的编程助手,能同时跑多个代码 agent
Google Antigravity 今天发布了 CLI 版本,让你直接在终端里运行和监控多个编程 agent。支持多步推理、多文件编辑、调用工具,还能记住历史对话。特别优化了 SSH 会话和纯键盘操作,适合那些不想离开命令行的开发者。产品页没说支持哪些模型、怎么安装、价格多少,也没提权限控制。目前有免费选项,今天在 Product Hunt 上排第一...
#Agent#Code#Tools#Google
精选理由
H 和 R 都成立,但 K 太薄:正文只确认了终端跑 coding agent,模型、权限、价格全没披露。当作一个小产品更新处理,保留在 all 层级。
一句话点评
Google 把 Antigravity 的编程 agent 塞进了终端,支持多步推理、多文件编辑和对话历史,专为 SSH 和键盘党设计。今天在 Product Hunt 排第一,有免费选项。但正文没披露支持哪些模型、怎么安装、价格多少,也没提权限控制。这点先别太激动,等具体信息出来再评估。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
05:00
24d ago
FT · 科技· rssEN05:00 · 05·20
特朗普的AI“垃圾宣传”机器
FT报道称,特朗普的Truth Social账号大量使用AI生成的假图片来改变政治传播的边界。正文没披露用了什么生成工具、发了多少张图、提示词是什么、以及发布的时间线。
#Multimodal#Vision#Safety#Donald Trump
精选理由
HKR-H 和 HKR-R 都过,FT 来源权威,但 HKR-K 缺可验证细节。适合作为 AI 政治观察条目,信息密度不够上推荐位。
一句话点评
FT报道特朗普Truth Social账号大量使用AI生成假图,但正文没披露用了什么工具、发了多少张、提示词和发布时间线。关键信息缺口太大,只能当现象看,没法评估规模和技术细节。短评:AI假图进政治传播,但FT这篇信息量不够,工具、数量、时间线全没给。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
04:51
24d ago
Hacker News 首页· rssEN04:51 · 05·20
MiniMax M2.7 实测:在三个真实工作流里当副手,比 Opus 4.7 差在哪
作者拿到 MiniMax M2.7 的 API 额度后,直接把它塞进 Claude Code,跑了三个自己常干的活:重构一个老 PyTorch 项目、给 Obsidian 知识库写笔记、以及更新一个过时的 PyTorch 项目。对比基准是 Claude Opus 4.7。结果挺一致:M2.7 在任务边界清晰、输出格式固定的时候挺好用,但一旦上下文里有些...
#Code#Benchmarking#MiniMax#Hacker News
精选理由
HKR-H 通过,因为标题确实有一个具体的 API 工作流测试角度;但 HKR-K 和 HKR-R 都不通过,因为 RSS 正文只披露了 HN 5 分和 0 条评论,没有任务、指标或结果,信息不足以支撑任何判断。
一句话点评
短评:M2.7 在边界清晰的任务上表现不错,但上下文一模糊就容易翻车。 点评:作者拿到 MiniMax M2.7 API 额度后,把它塞进 Claude Code 跑了三个真实工作流:重构 PyTorch 项目、写 Obsidian 笔记、更新旧项目。对比基准是 Claude Opus 4.7。结果一致:M2.7 在任务边界清晰、输出格式固定时挺好用,但一旦上下文里有些隐含条件没写清楚,它...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0
04:27
25d ago
新智元 · 公众号· rssZH04:27 · 05·20
NUS、牛津等近10家机构合发音视频智能综述,把AVI分成理解、生成、交互三大块
这篇综述把音视频智能(AVI)拆成理解、生成、交互三条线,并列出六个未来方向:因果对齐、音视频世界模型、长上下文记忆、可控生成、验证器奖励和负责任的实时交互。正文没披露具体方法或实验对比,更像一张研究地图,适合刚入这个方向的人快速看全貌。
#Multimodal#Audio#Vision#NUS
精选理由
这篇综述的价值在于把音视频智能拆成了三条主线(理解、生成、交互)和六条未来方向,对做多模态的研究者来说是个不错的参考框架。但正文没披露具体方法对比或实验结论,更像一张地图而非实测报告。没有产品发布、能力跃迁或行业冲突,所以分数卡在60-71档。
一句话点评
这篇综述把音视频智能拆成理解、生成、交互三条线,适合刚入方向的人快速看全貌。但正文没披露具体方法或实验对比,更像一张研究地图,不是技术报告。六个未来方向(因果对齐、世界模型、长上下文记忆等)列得全,但每个都只点了个名,缺深度。如果只想找论文速览可以看,想抄作业还早。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R0
04:10
25d ago
彭博科技· rssEN04:10 · 05·20
木头姐:特斯拉和无人出租车“马上起飞”
Cathie Wood 在 Bloomberg 视频里说,具身 AI 最大的收入机会在交通领域,特斯拉和无人出租车“马上起飞”。正文没披露具体市场规模、落地时间表或车辆状态,所以这点先别太激动——她一贯看好特斯拉,这次更像重申立场,不是新进展。
#Robotics#Cathie Wood#Ark Investment Management#Tesla
精选理由
HKR-H勉强及格,因为知名投资人喊单Robotaxi有标题吸引力;HKR-K直接挂零,没数字、没时间表、没机制。不硬排除,但信号太薄,留在低价值区间。
一句话点评
Cathie Wood 说特斯拉和无人出租车“马上起飞”,但正文没披露市场规模、落地时间表或车辆状态。她一贯看好特斯拉,这次更像重申立场,不是新进展。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
04:00
25d ago
FT · 科技· rssEN04:00 · 05·20
Harvey 联合创始人:AI 会逼律师改收费模式
正文被 paywall 挡住,没披露具体怎么改、什么时候改、以及 Harvey 自己的产品细节。核心判断来自标题:AI 让法律工作变快,按小时计费的模式撑不住。但到底改成按结果收费、订阅制还是按件计价,目前看不到。
#Harvey#Winston Weinberg#Commentary
精选理由
HKR-H 和 HKR-R 通过,因为按小时计费被 AI 冲击这个切入点对法律 AI 领域有时效性和共鸣;但 HKR-K 不通过:正文没有给出任何数据、机制、时间表或产品细节,信息缺口明显。
一句话点评
Harvey 联合创始人说 AI 会逼律师改收费模式,按小时计费要过时了。但正文被 paywall 挡住,没披露具体改成啥——按结果、订阅还是按件?也没说 Harvey 自己的产品细节。标题判断有道理,但缺关键信息,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
04:00
25d ago
FT · 科技· rssEN04:00 · 05·20
FT 问:Sam Altman 到底是 OpenAI 的资产还是负债?
FT 发了一篇评论,核心问题就是 Sam Altman 对 OpenAI 是福是祸。但正文被 paywall 挡住了,没拿到具体事件、财务数据、董事会状态或时间线来支撑这个判断。所以目前只能看到标题抛出的悬念,没有实质信息可以验证。
#Sam Altman#OpenAI#Financial Times#Commentary
精选理由
这篇 FT 标题很唬人,说 Sam Altman 可能成就也可能毁掉 OpenAI,但点进去你会发现正文只是提了个问题:他到底是资产还是负债。没有新披露的事件,没有数据,也没有任何治理细节,等于只给了一个评论框架。我会先打个折,因为信息量太薄,但话题本身确实踩在 OpenAI 治理和创始人依赖的神经上,所以重要性给到 62 分,属于可看可不看的评论。
一句话点评
FT 这篇评论标题说 Sam Altman 是 OpenAI 的成败关键,但正文被 paywall 挡住,没拿到任何具体事件、财务数据或董事会状态来支撑这个判断。目前只能看到悬念,没有实质信息可以验证。短评:标题党,正文没披露任何关键信息,先别信。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
03:58
25d ago
量子位 · 公众号· rssZH03:58 · 05·20
VC、品牌顾问、编剧,正在批量把自己做成AI
Profy在5月19日上线了专家数字分身产品,号称用多智能体协作、隐性知识捕捉和五层认知流水线,把投资尽调从五天缩到两小时以内。正文没披露具体客户案例或效果验证,这点先别太激动。
#Agent#Tools#Memory#Profy
精选理由
H/K/R都达标,但事实全是供应商自述,没有独立测试、定价、用户留存或可复现的工作流。正文没披露具体用了哪些模型、隐性知识怎么捕获、五层管线每层干什么,信息缺口明显。当一个小产品更新看,分数压在60-71区间合理。
一句话点评
Profy 5月19日上线专家数字分身,号称用多智能体协作把投资尽调从五天缩到两小时内。核心卖点是“隐性知识捕捉”和五层认知流水线,说白了就是让多个AI角色分工干活,模仿真人专家的思考流程。但正文没披露具体客户案例或效果验证,这点先别太激动。如果真能稳定跑通,对VC、咨询这类靠人堆时间的行业确实省成本,但多智能体协作的稳定性和幻觉控制仍是公开难题,实际落地效果存疑。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
03:49
25d ago
● P1机器之心 · 公众号· rssZH03:49 · 05·20
Google I/O 发布 Gemini 3.5 Flash,搜索框接入 AI 智能体
谷歌在 I/O 大会上发布了 Gemini 3.5 Flash,并把 AI 模式直接嵌进了搜索框。公司说现在它的 AI 服务每月要处理超过 3200 万亿个 token,已经有超过 850 万开发者在使用 Gemini。不过这篇文章因为微信平台的环境验证问题,正文内容没能加载出来,所以具体的模型参数、性能对比和实际体验细节都没法确认。
#Agent#Multimodal#Code#Google
精选理由
谷歌 I/O 这次把模型更新和搜索入口绑在一起推,AI Mode 直接嵌进搜索框,比普通功能发布重得多。Gemini 3.5 Flash 是新的轻量模型,月 token 消耗 3.2 千万亿说明用量已经很大,850 万开发者这个数字也够扎实。我会先打个折:正文没披露 3.5 Flash 的具体 benchmark 对比和定价,实际性价比还得等实测。但就凭搜索框变智能体这一条,当天必须写。
一句话点评
谷歌把搜索框变成了一个能看图、读文件、替你盯信息的AI助手,但后台智能体功能要付费订阅才能用。
锐评
这次改版把谷歌搜索从“输关键词找链接”直接推到了“让AI替你干活”的阶段。用户现在可以丢图片、视频甚至浏览器标签页进去提问,AI概览也支持连续追问,交互更像聊天。底层跑的是新发布的Gemini 3.5 Flash模型,谷歌说AI模式月活已经破了10亿,查询量每季度翻倍,这个增速说明用户对AI搜索的接受度很高。 比较激进的是“搜索智能体”,它能在后台24小时帮你盯房价、球鞋发售等信息,但正文明确写了,这个功能今年夏天只对Google AI Pro和Ultra付费用户开放。免费用户能拿到的“生成式界面”功能,可以生成交互图表来讲解复杂知识,这点倒是全员可用。 文章没提新版搜索的广告会怎么变,也没说AI生成的回答里引用来源的透明度如何。在搜索这种靠广告吃饭的业务上大改,商业影响和内容生态的冲击都还是未知数。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
03:49
25d ago
机器之心 · 公众号· rssZH03:49 · 05·20
VChain:给视频生成加一条“视觉思维链”,先规划再动笔
南洋理工在ACL 2026 Findings上提出VChain,思路是让视频生成先想好“关键帧”再补中间画面,类似人类画分镜。做法是用GPT-4o这类大模型先输出一组视觉思维链(visual thought keyframes),再在推理时用稀疏LoRA微调一个预训练视频生成器去填充。好处是时空规划更可控,但正文没披露推理延迟和实际生成帧率,落地成本还...
#Multimodal#Reasoning#Vision#Nanyang Technological University
精选理由
这篇是 ACL 2026 Findings 的论文,NTU 团队提的 VChain,核心是用 GPT-4o 这类多模态模型先生成关键帧,再让视频模型在推理时用 LoRA 做稀疏调优来补全中间帧。想法挺直接:把‘先想好再动’的思路塞进视频生成。但正文没披露生成质量指标、推理速度、跟现有方法对比的量化结果,也没说代码或模型会不会开源。所以是个有亮点的研究发布,但离工程落地或产品替换还有距离,暂时不值得提级。
一句话点评
南洋理工在ACL 2026提出VChain,让视频生成先画分镜(关键帧)再补中间画面,类似人类导演思路。用GPT-4o生成视觉思维链,推理时用稀疏LoRA微调预训练生成器填充。好处是时空规划更可控,但正文没披露推理延迟和实际帧率,落地成本未知。短评:思路像画分镜再补帧,比直接生成更可控,但延迟和成本没提,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
03:49
25d ago
机器之心 · 公众号· rssZH03:49 · 05·20
字节奖学金首次全球开放,五年67位得主去向追踪
字节跳动2026年奖学金首次面向全球申请,每人20万元,导师也有10万元配套研究经费。前五届已支持67位年轻研究者,但正文没披露获奖者的具体去向和学术产出,这点先别太激动。
#Multimodal#Robotics#Inference-opt#ByteDance
精选理由
这是一条字节奖学金动态,不是模型、产品或研究发布。数字清晰,但影响力有限,评分落在60–71区间合理。正文没披露67位获奖者的具体去向和领域分布,这点信息缺口值得注意。
一句话点评
字节跳动2026年奖学金首次面向全球开放,每人20万元,导师还有10万元配套经费。前五届已支持67位研究者,但正文没披露获奖者的具体去向和学术产出,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
03:43
25d ago
彭博科技· rssEN03:43 · 05·20
阿里发布新款AI芯片,训练推理都能跑
阿里巴巴发布了一款新的AI处理器,官方说法是把它加进了自己的AI技术栈,既能做训练也能做推理。但正文没披露这颗芯片用多少纳米工艺、性能跑分多少、卖多少钱、谁已经下单、什么时候发货——这些关键信息全都没说。所以目前只能知道阿里又出了一款芯片,具体能不能打、性价比怎么样,还得等更多细节出来才能判断。
#Inference-opt#Alibaba#Product update
精选理由
阿里发了一颗训练+推理都能用的芯片,算力替代的故事线成立,所以 H 和 R 都过。但正文只说了用途,制程、性能、价格、供货时间全没披露,信息缺口太大,K 偏弱。硬件方向重要但事实太薄,分数卡在 60–71 合理。
一句话点评
阿里发了颗新AI芯片,官方说训练推理都能用。但正文没披露工艺、跑分、价格、客户、发货时间——等于只说了个名字。目前没法判断这颗芯片能不能打,性价比如何,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
03:10
25d ago
r/LocalLLaMA· rssEN03:10 · 05·20
LM Studio 终于支持 MTP 投机解码了
LM Studio 在 0.4.14 Build 2 Beta 版本里加入了 MTP 投机解码支持,需要 llama.cpp 引擎 2.15.0。投机解码的思路是用一个轻量小模型先快速生成草稿,大模型再并行验证,理想情况下能降低延迟。但正文没披露实际吞吐能提升多少、支持哪些模型、以及可复现的测试条件,所以这点先别太激动。
#Inference-opt#Tools#LM Studio#llama.cpp
精选理由
LM Studio 终于给 MTP 推测解码了,版本号 0.4.14 Build 2 Beta,得用 llama.cpp engine 2.15.0。这对本地跑模型的人是实打实的优化,但正文没给吞吐提升数据,也没说支持哪些模型,所以只能算个小版本更新,别急着吹。
一句话点评
LM Studio 刚在 Beta 版里加了 MTP 投机解码,用小模型先写草稿、大模型再验,理想情况能降延迟。但正文没披露实际提速多少、支持哪些模型、测试条件,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
02:49
25d ago
r/LocalLLaMA· rssEN02:49 · 05·20
eBay 上 RTX 3080 20GB 卖 600 美元,每 GB 显存 30 美元
有用户在 eBay 花 600 美元买了 RTX 3080 20GB 版,算下来每 GB 显存 30 美元,比新卡便宜不少。需要两个 8-pin 供电,从中国发货要等几周。正文没披露卖家信誉和卡的状态(翻新/二手),这点先别太激动。
#Inference-opt#Reddit#eBay#NVIDIA
精选理由
HKR 三项都过,但这只是一个 Reddit 上的二手显卡交易帖,信息只有价格、显存、供电和发货地。没有产品发布或市场数据,所以分数压在 60–71 的 all 区间。
一句话点评
600美元买RTX 3080 20GB,每GB显存30美元,比新卡便宜一半。但正文没披露卖家信誉和卡是否翻新,从中国发货等几周,到手可能还有矿卡风险。先别太激动,等更多买家反馈。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
02:44
25d ago
彭博科技· rssEN02:44 · 05·20
三星与最大工会谈崩,全球最大存储芯片厂面临罢工风险
三星电子与最大工会的劳资谈判破裂,全球最大存储芯片工厂可能面临工人罢工。正文没披露涉及多少工人、哪些产线受影响,也没有罢工时间表。如果真停工会直接冲击全球存储芯片供应,对依赖三星内存的AI服务器和消费电子厂商来说是个坏消息。
#Samsung Electronics#Incident
精选理由
H和R勉强过关:三星存储芯片中断确实戳中硬件供应链神经;但K不过关,因为罢工规模、产线、时间表以及是否涉及AI/HBM产线均未披露。
一句话点评
三星最大工会谈判破裂,全球最大存储芯片厂可能罢工。正文没披露涉及多少工人、哪些产线,也没有时间表。如果真停工会直接冲击全球存储供应,对依赖三星内存的AI服务器和消费电子厂商是坏消息。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
02:00
25d ago
● P1AI HOT 精选· aihot-apiZH02:00 · 05·20
通义千问发布 Qwen3.7-Max,主打长时间自主干活和跨平台编程
Qwen 团队推出了 Qwen3.7-Max,一个专为智能体场景设计的闭源模型。它最显眼的能力是能长时间自主执行任务,官方演示了一个连续跑 35 小时、调用上千次工具的内核优化任务。在编程方面,它在 Terminal Bench 2.0 上拿了 69.7 分,超过了 DeepSeek-V4-Pro Max 的 67.9 分;在 SWE-Pro 这类复杂...
#Agent#Multimodal#Tools#Qwen Studio
精选理由
Qwen Studio 发了 Qwen3.7,一口气覆盖聊天、图像视频理解、图像生成、文档处理、网页搜索、工具调用和工件生成,摆明要往智能体方向走。我会先打个折:正文没给任何 benchmark、定价、上下文窗口或延迟数据,所以没法判断实际可用性和成本。亮点是工具调用和工件生成这两项,说明模型不只是聊天,而是被设计成能进业务流程干活。这点先别太激动,等看到具体评测和接入方式再说。
一句话点评
Qwen3.7-Max 在 Terminal Bench 2.0 上拿了 69.7 分,比 DeepSeek-V4-Pro Max 高 1.8 分,但正文没披露上下文长度、定价和 API 开放时间,这些先打问号。
锐评
Qwen3.7-Max 把自己定位成“智能体专用模型”,最抓眼球的证据是官方演示了一个连续跑 35 小时、调用上千次工具的内核优化任务。这个数字说明模型能在长时间自主执行中保持连贯推理,不是那种跑几步就断片的玩具。编程智能体方面,它在 Terminal Bench 2.0 上拿了 69.7 分,超过 DeepSeek-V4-Pro Max 的 67.9 分;SWE-Pro 这类复杂软件工程任务上 60.6 分,比对手高 1-2 分,属于小幅领先。通用智能体基准如 MCP-Mark 和 Skillbench 也都有 2-5 分的优势,但幅度不算碾压。 要注意的是,这篇博客是产品发布文,不是技术报告。正文没披露上下文长度上限、API 定价、具体开放时间,也没说明 35 小时任务是否可复现、有没有人工干预。所有基准测试用的都是内部脚手架或特定框架(如 Claude Code),跨框架泛化能力虽然提了,但没给量化对比。STEM 推理部分,GPQA Diamond 92.4 分、HLE 41.4 分确实高,但 CritPT 只有 11.4 分,说明模型在批判性推理这种需要挑错的任务上还有明显短板。 整体看,Qwen3.7-Max 在智能体场景上确实往前拱了一步,尤其是长程自主执行和跨框架兼容性。但缺少上下文长度、成本和可复现细节,让这些数字的实用参考价值打了折扣。等 API 上线后看实际延迟和费用,才能判断是不是真能进生产流程。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
00:00
25d ago
● P1OpenAI 博客· rssEN00:00 · 05·20
OpenAI 模型推翻了一个 80 年的离散几何猜想
OpenAI 发了一篇博文,说他们内部一个通用推理模型自己解决了一道叫“平面单位距离问题”的数学难题,推翻了大家信了几十年的主流猜想。这道题是 Erdős 在 1946 年提出的,简单说就是平面上放 n 个点,最多能有多少对点距离刚好是 1。之前学界普遍认为正方形网格那种摆法已经接近最优了,但这个模型给出了一族新构造,把单位距离对的数量往上提了一个多项...
#Reasoning#OpenAI#Research release
精选理由
我会先打个折:正文没披露模型名称、证明机制和可复现条件,所以没法给更高分。但 OpenAI 模型推翻 80 年几何猜想这件事本身够新、够具体,也够有争议性,HKR 三项全中,85 分放在 P1 合理。
一句话点评
OpenAI 一个通用推理模型自己推翻了 80 年的离散几何猜想,成本不到 1000 美元,但模型细节和训练数据都没说。
锐评
这条新闻最值得看的是:一个没专门为数学定制的通用推理模型,自己找到了反例,推翻了 Erdős 在 1946 年提出的平面单位距离问题猜想。之前学界普遍认为正方形网格的构造已经接近最优,模型却从代数数论里搬来了意想不到的工具,给出了一个多项式级别的改进。Tim Gowers 说如果这是人写的,他会毫不犹豫推荐顶刊接收,这个评价分量很重。 成本方面,Latent Space 提到整个过程花了不到 1000 美元,如果是真的挺省钱。但 OpenAI 官方正文没披露具体用了哪个模型、参数量多大、推理时用了多少算力,也没说训练数据里是否包含过相关数学文献。这点先别太激动——模型可能见过类似思路的论文,只是人类没把它们和这个猜想连起来。 还缺的关键信息:外部数学家验证的范围有多大,是完整验证了证明还是只检查了关键步骤;模型产生这个证明之前失败了多少次、有没有人类在循环里做筛选。这些会直接影响“自主解决”这个说法的含金量。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
00:00
25d ago
OpenAI 博客· rssEN00:00 · 05·20
OpenAI 教育国计划进入下一阶段:新加坡加入,首批国家公布进展
OpenAI 在伦敦教育世界论坛上宣布了“教育国计划”的新进展。首批参与国包括爱沙尼亚、希腊、意大利、斯洛伐克、特立尼达和多巴哥、哈萨克斯坦、阿联酋和约旦。爱沙尼亚已有超过 2 万名学生和 4600 名教师用上 ChatGPT Edu;哈萨克斯坦全国 20 个地区部署后,首月 4.4 万名活跃教师发了 150 万条提示,9 成教师觉得有用;斯洛伐克大学...
#Tools#OpenAI#Product update#Partnership
精选理由
HKR-K 通过,因为文章补充了项目组件,但缺少国家、定价和落地时间。OpenAI 的关联性让它留在 all 层级,但读起来像一条细节不多的合作更新,没有硬排除触发条件。
一句话点评
OpenAI 把 ChatGPT Edu 卖给了爱沙尼亚、哈萨克斯坦等 8 国,爱沙尼亚 2 万学生、4600 教师已用上,哈萨克斯坦首月 4.4 万教师发了 150 万条提示,9 成觉得有用。但正文没披露定价、部署周期和具体效果验证,更像渠道铺货的官宣。如果是真的,这算是大模型进公立教育系统的一次落地,但别急着当标杆——样本量小、验证弱,且各国教育 IT 基础差异大,复制门槛不低。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
00:00
25d ago
OpenAI 博客· rssEN00:00 · 05·20
Ramp工程师用Codex将代码审查时间从数小时缩至数分钟
Ramp 的工程师用 OpenAI 的 Codex(基于 GPT-5.5)做代码审查,原来等人工第一轮反馈要几小时,现在几分钟就能拿到实质性意见。他们还用 Codex 开发了一个叫 On-Call Assistant 的内部工具,帮值班工程师处理复杂的线上事故排查。Ramp 的 AI DevEx 负责人说,Codex 的审查深度比大多数人类 revie...
#Code#Tools#OpenAI#Ramp
精选理由
硬排除-纯营销:来源是 Ramp 为 Codex/GPT-5.5 写的客户用例。HKR-R 因为代码审查的痛点成立,但缺少规模和评测细节,HKR-K 不达标。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K0·R1
2026-05-19 · 星期二2026年5月19日
23:47
25d ago
r/LocalLLaMA· rssEN23:47 · 05·19
Claude Code 插件可能威胁本地开源生态
Reddit 用户指出,Claude Code 插件把技能、斜杠命令和子代理打包成一个基于 plugin.json 的目录,微软的 deep-wiki 项目大约 3500 行代码就实现了类似功能。但插件不是开放标准,作者说 Qwen Code 是唯一一个能从 Claude 市场安装 Code 插件的开源代理。这意味着如果 Claude 插件生态做大,本...
#Agent#Code#Tools#Anthropic
精选理由
这是一条 Reddit 帖子,不是官方发布或已验证的生态迁移,信息量有限——正文只提了一个兼容性例子(Qwen Code),没有披露其他插件或实际影响数据。作为生态评论,60–71 分合理。
一句话点评
Claude Code 插件把技能、斜杠命令和子代理打包成一个目录,微软的 deep-wiki 项目约 3500 行代码就实现了类似功能。但插件不是开放标准,作者说 Qwen Code 是唯一能从 Claude 市场装插件的开源代理。如果 Claude 插件生态做大,本地模型可能被边缘化。正文没披露插件协议细节,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
23:05
25d ago
AI HOT 精选· aihot-apiZH23:05 · 05·19
Ramp用Gemini托管代理功能做了个财务AI助手
Ramp利用Gemini API新出的托管代理功能,快速搭了一个高级财务代理,而且不用自己管后端基础设施。正文没披露上线时间、定价和评估指标,所以实际效果和成本还不清楚。
#Agent#Tools#Ramp#Google
精选理由
触发硬排除-云厂商推广和纯营销:这是一篇 Google/Ramp 的 Gemini API 托管代理客户案例,没有上线时间、定价、评测或独立结果,因此重要性上限低于 40。
一句话点评
Ramp 用 Gemini API 新出的托管代理功能,快速搭了一个高级财务代理,不用自己管后端基础设施。这点挺省事,但正文没披露上线时间、定价和评估指标,所以实际效果和成本还不清楚。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K1·R0
23:05
25d ago
彭博科技· rssEN23:05 · 05·19
松下、纽约人寿、Kyndryl、Citizens 高管聊人+AI 团队怎么搭
彭博一场活动上,四家公司高管聊了怎么让员工和 AI 一起干活。核心思路是“人机协作”而不是用 AI 换人,具体做法包括给员工做 AI 技能培训、重新设计岗位流程。但正文没披露任何一家公司的培训规模、预算或落地时间表,所以目前只能当方向性讨论看,不是可复用的方案。
#Agent#Panasonic#New York Life#Kyndryl
精选理由
HKR-R勉强通过,因为AI workforce training确实戳中打工人对岗位变化的担忧。HKR-H和HKR-K不通过:标题太泛,正文没有给出培训规模、预算、落地时间表或可复用的方法。
一句话点评
四家公司高管聊人机协作,方向是培训员工、重设流程,不是用AI换人。但正文没披露任何一家的培训规模、预算或落地时间表,目前只能当方向性讨论看,不是可复用方案。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
23:01
25d ago
FT · 科技· rssEN23:01 · 05·19
韩国股市18个月涨两倍,AI芯片热把Kospi推得比纳斯达克泡沫期还猛
韩国Kospi指数在18个月内涨了两倍,涨幅超过了纳斯达克在互联网泡沫时期的纪录。推动力来自三星和SK海力士,两家公司都搭上了AI芯片需求的快车。正文没披露当前估值水平、资金流向、指数权重变化,也没说明对比纳斯达克用的是哪个时间段,所以这个“超越”到底有多扎实,还得打个问号。
#Samsung#SK Hynix#Kospi#Commentary
精选理由
HKR三项都过,但正文只给了指数涨幅和两家公司名字,没披露估值水平、资金流向或成分股权重。这是AI基础设施的市场情绪信号,不是核心AI产业新闻。
一句话点评
韩国Kospi指数18个月涨了两倍,涨幅超过纳斯达克互联网泡沫时期。推动力是三星和SK海力士,两家都搭上AI芯片需求快车。但正文没披露当前估值、资金流向、指数权重变化,也没说对比纳斯达克用的是哪个时间段,这个“超越”到底多扎实得打个问号。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R1
22:30
25d ago
Hacker News 首页· rssEN22:30 · 05·19
一个能去掉 Gemini 可见水印和 SynthID 隐形水印的命令行工具
GitHub 上有个新项目,叫 remove-ai-watermarks,号称能去掉 AI 图片上的水印。它针对的是 Gemini 的可见水印,以及 SynthID、C2PA、EXIF 这类隐形水印。项目目前有 72 个星标和 12 个 fork,但正文没披露具体用什么方法、支持哪些模型、以及复现条件。这点先别太激动,效果和可靠性都还不清楚。
#Safety#GitHub#Hacker News#Open source
精选理由
H 和 R 通过:标题本身有对抗性钩子,且触及安全与信任议题。K 不通过:正文只有 HN 数据,没有方法、范围或可复现的声明,所以归入低价值 all 档。
一句话点评
GitHub 上一个新项目声称能去掉 Gemini 的可见水印和 SynthID、C2PA、EXIF 等隐形水印。目前只有 72 个星标和 12 个 fork,项目太小,方法、支持模型和复现条件都没披露。这点先别太激动,效果和可靠性都不清楚。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
22:16
25d ago
The Verge · AI· rssEN22:16 · 05·19
DeepMind CEO 说我们正站在“奇点”的山脚下,但没给时间表
Google DeepMind 的 Demis Hassabis 在 Google I/O 闭幕时称当前是“奇点的山脚”,并说 AGI 会放大人类智慧、开启科学发现新纪元。但整段发言没有披露 AGI 何时到来、需要多少算力或数据,也没有展示任何技术证据。正文没提产品参数或路线图,更像一个愿景宣言而非可验证的判断。
#Reasoning#Demis Hassabis#Google DeepMind#Google
精选理由
HKR-H 和 HKR-R 通过:Demis 在 Google I/O 用‘奇点的山麓’这个说法,有话题性,也容易引发从业者站队讨论。HKR-K 不通过:全文只有一句引述,没有时间表、规格或可验证的机制,信息量不足,所以定级为 all。
一句话点评
Demis Hassabis 在 Google I/O 闭幕时说现在是“奇点的山脚”,AGI 会放大人类智慧、开启科学黄金时代。但整段发言没给 AGI 时间表、算力需求或数据支撑,更像愿景宣言而非可验证判断。正文没披露任何产品参数或路线图,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
21:44
25d ago
r/LocalLLaMA· rssEN21:44 · 05·19
从 Claude 换到本地 Qwen,3 万行 Pygame 项目跑起来了
一位 Reddit 用户把自己约 3 万行、55 个模块的 Python Pygame 项目,从 Claude Sonnet 4.6 换到了 Qwen3.6-35B-A3B-UD-Q6_K 上跑。硬件是 RTX 5090 加 4000 Pro,56GB 显存,Cline 里开了 25 万 token 上下文窗口。正文没披露具体效果对比,但能跑通 3 万...
#Code#Tools#Claude#Qwen
精选理由
一个 Reddit 用户用 Qwen3.6-35B-A3B-UD-Q6_K 接手了原本 Claude 在跑的 3 万行 Pygame 项目,硬件是 5090 加 4000 Pro、56GB VRAM,在 Cline 里跑 25 万上下文。三个钩子都成立:替换关系明确(h),测试条件具体(k),戳中开发者对 Claude 成本和本地模型可行性的焦虑(r)。但证据只有一个 Pygame 项目,没有对比实验或失败率,所以放在 all 而不是 featured。
一句话点评
一位 Reddit 用户把 3 万行 Pygame 项目从 Claude 换到 Qwen3.6-35B 本地跑,硬件是 RTX 5090 + 56GB 显存,开了 25 万 token 上下文。正文没披露效果对比,但能跑通 3 万行代码本身说明本地模型在长上下文场景下已可用。不过 56GB 显存门槛太高,普通开发者暂时够不着。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
21:34
25d ago
r/LocalLLaMA· rssEN21:34 · 05·19
Reddit 上有人发了个 1B 模型号称新 SOTA,但啥证据都没给
Reddit 用户发帖讨论 HRM-Text-1B,标题直接写“新 SOTA 1B 模型”。但帖子只贴了 GitHub、Hugging Face 和 YouTube 链接,正文被 Reddit 屏蔽,看不到任何数据集、评测分数或可复现条件。目前没法判断它到底强在哪,甚至不知道它是不是真的跑过标准 benchmark。如果你打算试,建议先当个“声称”看,...
#Benchmarking#HRM-Text#Sapient#Reddit
精选理由
H和R两条成立:标题的SOTA宣称有吸引力,小模型性能也戳中本地部署痛点。但K很弱——正文没给任何分数、数据集或复现步骤,全靠Reddit用户一张嘴,所以这条线索信号低,只能当社区传闻看。
一句话点评
Reddit 上有人发帖说 HRM-Text-1B 是新的 SOTA 1B 模型,但正文被屏蔽了,只留了 GitHub、Hugging Face 和 YouTube 链接。目前看不到任何数据集、评测分数或可复现条件,没法判断它到底强在哪。如果你打算试,建议先当个“声称”看,等有人跑过标准 benchmark 再说。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
21:31
25d ago
AI HOT 精选· aihot-apiZH21:31 · 05·19
Claude Code v2.1.145:新增会话列表命令和追踪支持,修复权限绕过等漏洞
Anthropic 发布了 Claude Code 的 v2.1.145 版本,主要加了两个功能:一是 JSON 格式的会话列表命令,方便脚本或工具批量管理对话;二是给 agent 模式加上了 OTEL 父-子追踪,也就是把模型调用的链路串起来,方便排查多步任务中哪一步出了问题。修复方面比较关键:之前有用户发现可以绕过权限提示直接执行操作,这次堵上了;...
#Agent#Code#Tools#Anthropic
精选理由
HKR-K/R 通过,因为这次更新包含了具体的 CLI 命令、追踪功能和安全性修复。HKR-H 不通过:这只是 Claude Code 的一个常规补丁,范围比模型发布或重大 Agent 功能更新窄得多。
一句话点评
Claude Code 小版本更新,主要加了两个实用功能:JSON 格式的会话列表命令,方便脚本批量管理对话;agent 模式加了 OTEL 父-子追踪,把多步调用的链路串起来,排查问题更直观。修复了一个安全漏洞——之前有人能绕过权限提示直接执行操作,这次堵上了。另外修了终端 resize 后卡死、非 ASCII 文件名调用 API 失败等 bug。没有性能或成本数据,就是一次常规迭代。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
21:24
25d ago
The Verge · AI· rssEN21:24 · 05·19
Google 搜索框要包办一切:打字变长、AI 猜你想搜
Google 在 I/O 2026 上给搜索框加了两个功能:输入框会随着你打长句子自动拉宽,以及 AI 会给出比传统自动补全更“聪明”的搜索建议。说白了就是搜索框想替你多干点活,不只是补关键词,而是直接猜你真正想问什么。不过正文没披露什么时候上线、支持哪些地区、以及这个 AI 建议是不是默认打开的——所以这点先别太激动,可能只是演示阶段的功能。
#Agent#Tools#Google#The Verge
精选理由
H/K/R 都过线,但正文只给了 I/O 上的交互变化;上线时间、覆盖地区和默认开关都没披露。作为中等体量的 Google 产品更新,放在 featured 以下合适。
一句话点评
Google I/O 2026 给搜索框加了两个小更新:输入框随长句子自动拉宽,以及 AI 给出比自动补全更“聪明”的建议。说白了就是搜索框想替你多干点活,不只是补关键词,而是直接猜你真正想问什么。不过正文没披露什么时候上线、支持哪些地区、以及这个 AI 建议是不是默认打开的——所以这点先别太激动,可能只是演示阶段的功能。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
21:16
25d ago
TechCrunch AI· rssEN21:16 · 05·19
Google 推出“信息代理”:让 AI 在后台盯着你关心的话题,有变化主动通知你
Google 在 I/O 2026 上发布了新的 AI 信息代理,跟传统搜索不一样——你不用每次手动搜,它可以 24 小时在后台监控你设定的主题,比如竞品动态、政策变化,然后主动推送更新,还会帮你总结“为什么这事重要”以及不同角度的观点。说白了就是 Google Alerts 的 AI 升级版,但正文没披露具体什么时候上线、要不要额外付费,以及触发推送...
#Agent#Google#Product update
精选理由
HKR 三项都过,但这是一篇偏教程的 Google 产品介绍,缺少上线范围、定价和触发机制等关键信息,属于中等权重内容,落在 60–71 区间,不推荐 featured。
一句话点评
Google I/O 上发布了AI信息代理,相当于给Google Alerts装上大模型:设定主题(比如竞品动态),它24小时后台监控,主动推送更新并总结“为什么重要”和不同观点。不用再手动搜了。但正文没披露上线时间、是否额外付费,以及触发推送的灵敏度——是每天一次还是实时?这点先别太激动,等定价和延迟细节出来再说。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:09
25d ago
r/LocalLLaMA· rssEN21:09 · 05·19
Google AI Edge Gallery 更新:Gemma 4 支持一次预测多个 token,Pixel 手机也能跑 TPU 了
Google 的 AI Edge Gallery 发布了 v1.0.13 和 v1.0.14 两个版本,主要给手机端本地跑模型加了几个实用功能。Gemma 4 现在支持多 token 预测(一次生成多个词,理论上能提速),还开始支持 Pixel 手机的 TPU 芯片(本地推理延迟更低)。新增了实验性的 MCP(模型上下文协议,让模型能调用外部工具),以...
#Inference-opt#Tools#Memory#Google
精选理由
HKR 三项都过,因为更新提到了具体的端侧功能,但正文没披露参数、性能数字或可复现的设置细节。这属于普通产品更新档位,不值得加精。
一句话点评
Google 给手机端本地跑模型加了两个实用更新:Gemma 4 支持多 token 预测(一次生成多个词,理论上能提速),还开始支持 Pixel 手机的 TPU 芯片(本地推理延迟更低)。新增实验性 MCP(让模型能调用外部工具)和聊天记录保存。但正文被屏蔽,没披露具体参数、速度提升倍数或兼容机型范围,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:08
25d ago
TechCrunch AI· rssEN21:08 · 05·19
从少年黑客到铁穹研究员,他拿了2800万美元做AI反钓鱼邮件
Ocean 是一家主打“agentic email security”的创业公司,说白了就是让AI代理逐封分析邮件上下文,判断是不是钓鱼或冒充。创始人Shay Shwartz 16岁当黑客被抓,后来在以色列国防和情报部门干了近十年,参与过铁穹项目。这次融了2800万美元,金额不小,但正文没披露具体模型设计、客户数量、定价或检测准确率,所以产品到底多能打...
#Agent#Safety#Ocean#Iron Dome
精选理由
HKR三项都过:创始人故事有钩子,2800万融资和上下文分析算新信息,AI钓鱼安全方向踩中企业痛点。重要性压在60–71是因为正文没披露检测指标、客户数量和模型细节,判断只能挂在融资和产品宣称上,没法给更高分。
一句话点评
Ocean 拿了 2800 万美元做“代理式邮件安全”,让 AI 逐封分析邮件上下文来抓钓鱼和冒充。创始人 16 岁当黑客被抓,后来在以色列搞过铁穹,背景挺硬。但正文没披露模型设计、客户数、定价或检测准确率,产品到底多能打还不好说。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
21:00
25d ago
● P1彭博科技· rssEN21:00 · 05·19
SoftBank向OpenAI投资600亿美元引发内部担忧
软银已向 OpenAI 承诺投入超过 600 亿美元,部分内部人士对孙正义如此力挺 Sam Altman 感到不安。正文没披露具体交易条款、资金到位时间表,也没说有多少人表达了担忧,以及这些担忧在内部是否被正式讨论过。
#SoftBank#OpenAI#Sam Altman#Funding
精选理由
我会先打个折:正文没披露具体的投资条款、时间表,也没说内部到底有多少人反对,所以很多判断还悬着。但 Bloomberg 能拿到“内部人士担忧”这种料,本身就说明 SoftBank 这笔超过 600 亿美元的押注在内部有争议。孙正义对 Altman 的个人投入被单独拎出来说事,这比单纯报一个融资额更有信号意义——它暗示了决策可能不够冷静,也把 OpenAI 的资本结构风险又翻了出来。这点先别太激动,但值得盯着后续条款和反对声浪会不会公开化。
一句话点评
孙正义押注OpenAI超600亿美元,内部人怕他像当年迷信WeWork创始人一样迷信奥特曼,而且投了这么多连个董事会席位都没拿到。
锐评
这条新闻的核心不是钱多,而是权力结构和决策机制出了问题。软银对OpenAI的总投资承诺已超过600亿美元,持股超过10%,但既没有董事会席位,连观察员席位都没有。这意味着软银对这笔巨额押注几乎没有决策影响力,只能被动跟随奥特曼的节奏。内部人士向彭博社透露,孙正义曾多次不耐烦地驳回关于“OpenAI万一失败怎么办”的提问,下属后来干脆不再提了。 有几个数字值得注意:软银上一财年利润增长超过三倍,达到创纪录的320亿美元,大部分收益来自OpenAI估值上升。但这只是账面浮盈,OpenAI还没上市。而软银股价已从去年10月高点下跌超过20%,标普也下调了对软银的展望,担心这笔押注会消耗流动性。另外,软银已经缩减了一笔以OpenAI股份为担保的100亿美元保证金贷款计划,说明债权人也在犹豫。 文章没披露的是:OpenAI具体的上市时间表和估值依据、软银内部是否有正式的风险对冲方案、以及孙正义本人对Anthropic近期突破的具体看法。这些信息缺口让“高度信心”的说法显得更像表态而非论证。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
20:56
25d ago
彭博科技· rssEN20:56 · 05·19
ADI以15亿美元收购电源芯片公司Empower
ADI 宣布以 15 亿美元现金收购私有公司 Empower Semiconductor,这是一家做数据中心电源芯片的公司。15 亿全现金,说明 ADI 很想要这块业务,但正文没披露交易时间表、监管条件,也没说具体买了哪几款电源芯片产品。
#Inference-opt#Analog Devices#Empower Semiconductor#Funding
精选理由
HKR-K靠15亿美元现金收购通过。HKR-H和HKR-R不通过,因为正文缺少AI数据中心产品细节、时间表,以及从业者能感知的利害关系。
一句话点评
ADI 花 15 亿美元现金买下数据中心电源芯片公司 Empower,全现金说明志在必得。但正文没披露具体买了哪几款芯片、交易时间表和监管条件,信息缺口不小。对 AI 从业者来说,数据中心电源效率直接影响算力成本,这笔收购值得关注,但具体影响还得等细节。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H0·K1·R0
20:47
25d ago
● P1FT · 科技· rssEN20:47 · 05·19
Google 要出智能眼镜,还会在搜索引擎里塞进 AI 代理
Google 准备发布智能眼镜,同时给搜索引擎加上 AI 代理功能。CEO Sundar Pichai 说这些功能靠新的 Gemini 模型驱动,目标是缩小跟 Anthropic 和 OpenAI 的差距。不过这篇付费墙后面的正文没披露具体规格、上市时间和价格,所以眼镜长什么样、卖多少钱、什么时候能买到,现在都还不知道。
#Agent#Google#Sundar Pichai#Anthropic
精选理由
我会先打个折:正文没披露参数、时间表和价格,所以没法判断落地有多快。但 Google 把 Gemini agent 塞进搜索,再配上智能眼镜,等于在用户每天用的入口上同时推两个 AI 触点。Pichai 自己说新功能要缩小跟 Anthropic、OpenAI 的差距,这话本身就说明他们承认落后,也在用产品动作追。对从业者来说,看点不是技术多新,而是 Google 怎么用分发优势把 agent 推到普通人面前。这点先别太激动,等具体上线和实测再说。
一句话点评
Google 要发智能眼镜,还给搜索加了能替你干活的 AI 代理,但全文卡在付费墙后,规格、价格、上市时间一概没写。
锐评
这条消息本身挺重磅:Google 终于要出智能眼镜,同时把 AI 代理塞进搜索引擎,CEO 说靠新的 Gemini 模型来追赶 Anthropic 和 OpenAI。但尴尬的是,FT 这篇正文完全在付费墙后面,我们能看到的只有标题和摘要,所以眼镜长什么样、卖多少钱、什么时候能买到,现在全是问号。 我会先打个折:Google 在硬件上翻过车,智能眼镜能不能成,得看它解决了什么实际问题,而不是又画一个“未来生活”的饼。搜索加代理这事倒更值得关注——如果真能让模型直接帮你订机票、比价、填表,那是对现有搜索体验的改造,而不只是多一个聊天窗口。但正文没披露代理能调用哪些服务、权限边界在哪、出错谁兜底,这些才是落地时真正要命的问题。 还缺的关键信息:新 Gemini 模型在哪些指标上缩小了差距,是跑分、延迟还是实际任务完成率?眼镜的交互方式是语音、手势还是别的?这些 FT 都没给,只能等后续报道或 Google 自己公布。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
20:30
25d ago
NVIDIA 博客· rssEN20:30 · 05·19
英伟达和谷歌云为开发者社区推出新学习资源和推理优化教程
英伟达和谷歌云给联合社区的10万多名开发者加了新资源:一条JAX在英伟达GPU上的学习路径,和一个用Dynamo在GKE上做推理优化的codelab(手把手教程)。下个月上线,但正文没披露要不要额外付费或有没有使用限制。
#Agent#RAG#Inference-opt#NVIDIA
精选理由
触发硬排除规则cloud-vendor-promo:NVIDIA和Google Cloud在推广学习路径、GKE codelab和直播。HKR-K有具体资源和10万数字,但HKR-H和R不满足,因此上限为excluded。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0

更多

频道

后台