ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-15

128 items · updated 3m ago
RSS live
2026-05-15 · 星期五2026年5月15日
23:43
28d ago
彭博科技· rssEN23:43 · 05·15
特朗普与习近平谈英伟达芯片
彭博社报道,特朗普和习近平讨论了英伟达芯片。正文没披露具体谈了哪些型号、有没有松口出口条件,也没说谁先提的。这条信息目前只能确认“聊过”,谈成什么、对供应链有没有实质影响,一概未知。
#Bloomberg#Nvidia#Donald Trump#Policy
精选理由
Bloomberg 的权威性加上英伟达芯片在中美政策中的位置,HKR 的 H 和 R 都成立;但 K 不成立——正文只有标题级别信息,没有芯片型号、出口条件或讨论细节。保留在 all 里,但读者需要知道这条目前只有标题,没有实质内容。
一句话点评
特朗普和习近平聊了英伟达芯片,但正文只确认了“聊过”,没提具体型号、出口松口条件,也没说谁先提的。目前信息量极低,对供应链没有实质影响。短评:标题炸裂,内容空洞,先别激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
23:15
28d ago
r/LocalLLaMA· rssEN23:15 · 05·15
Luce Megakernel:一个把上百次CUDA调用压成一次的推理加速方案
Reddit 用户发帖说 Luce Megakernel 能在 NVIDIA 显卡上把推理速度提到 1.8 倍。原理是把原来每生成一个 token 就要启动约 100 次 CUDA 内核(每次都有 CPU 调度开销)合并成一次大内核调用,省掉层与层之间的 CPU 调度。对比对象是 llama.cpp 的 CUDA 实现。帖子正文被 Reddit 屏蔽了...
#Inference-opt#Luce Org#NVIDIA#Apple
精选理由
正文只给了一个 Reddit 帖子作为证据,没有公开 benchmark 脚本、硬件配置、模型版本或复现步骤,权威性很弱。1.8 倍加速和减少 100 次 kernel launch 的机制听起来合理,但缺少第三方验证。建议先观望,等有可复现的跑分再认真对待。
一句话点评
Reddit 用户称 Luce Megakernel 能把 NVIDIA 显卡推理速度提到 1.8 倍,原理是把每 token 约 100 次 CUDA 内核启动合并成一次,省掉 CPU 调度开销。对比对象是 llama.cpp 的 CUDA 实现。但正文被 Reddit 屏蔽,代码、测试环境、模型大小、精度都没披露。1.8 倍如果是真的,对本地推理挺省钱,但这点先别太激动——没开源、没复现...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
22:38
28d ago
● P1Hacker News 首页· rssEN22:38 · 05·15
Orthrus-Qwen3模型推理速度提升至7.8倍
Orthrus 号称能让 Qwen3 模型一次前向传播多生成 7.8 倍的 token,而且输出分布和原始模型一模一样。这意味着推理速度可能大幅提升,但正文没披露具体用了什么机制,也没给基准测试条件和复现步骤。GitHub 和 Hacker News 链接里也没有更多细节。所以这点先别太激动,等看到可复现的 benchmark 再说。
#Inference-opt#Qwen#Orthrus-Qwen3#Open source
精选理由
标题的7.8倍和“输出分布相同”两个点都很抓人,但正文没披露具体机制、基准条件或复现步骤,信息缺口太大,没法直接信。先打个折,放在60–71分档,等更多细节出来再调。
一句话点评
Qwen3-8B 推理速度最高提到 7.8 倍,且输出分布数学上可证明不变,不是近似加速。
锐评
这个项目给 Qwen3-8B 装了一套叫“双视角扩散解码”的加速方案,不动原模型参数,直接把每次前向能处理的 token 数拉到原来的 7.8 倍。最硬的一点是它声称输出分布完全一致,不是那种牺牲精度换速度的近似方法。 目前信息全来自 GitHub 仓库和社区帖子,没看到论文或第三方基准测试。7.8 倍这个数字是在什么硬件、什么 batch size、什么序列长度下跑出来的,正文没披露。另外,方法是否只对 8B 这个尺寸有效、对长文本生成会不会掉速,也都还是未知数。 如果这个“无损加速”在更多模型和场景下能复现,推理成本会直接打骨折。但现阶段只能把它当一个很有潜力的开源实验,等更多验证出来再激动。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
22:28
28d ago
AI HOT 精选· aihot-apiZH22:28 · 05·15
Claude Code v2.1.143:插件市场能看上下文消耗了,还支持直接改工作树
Anthropic 给 Claude Code 打了个小补丁,主要加了两个实用功能:一是插件市场现在会显示每个插件的预估上下文消耗(就是跑一次任务大概吃掉多少 token),开发者装插件前能掂量一下成本;二是新增了 `worktree.bgIsolation: "none"` 配置项,允许后台任务直接修改当前工作树文件,不用再切分支或建隔离环境。另外修...
#Code#Tools#Anthropic#Claude Code
精选理由
这是 Claude Code 的官方小版本更新,有具体的插件和上下文成本细节,但影响面主要限于重度用户,属于小型产品更新范畴。
一句话点评
Claude Code 小版本更新,两个实用改动:插件市场现在显示每个插件的预估 token 消耗,装之前能算算账;新增配置项让后台任务直接改当前文件,不用切分支。修了一批 CLI、Windows 终端和 macOS 后台任务的 bug。属于日常优化,没有新能力,但插件成本透明化对重度用户有用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
22:25
28d ago
The Verge · AI· rssEN22:25 · 05·15
YouTube 把 AI 换脸检测工具开放给所有成年用户
YouTube 把之前只给部分人试用的“肖像检测”工具(自动扫描视频里有没有你的脸)开放给所有 18 岁以上用户。正文没披露具体上线时间、申诉流程和删除标准,所以实际效果和误报率还不清楚。
#Vision#Safety#YouTube#Product update
精选理由
HKR 三项都过:开放范围从试点扩到全体成年用户,检测机制明确写的是扫视频人脸匹配。重要性没给更高是因为准确率、申诉流程和执行细节正文都没披露,这点先别太激动。
一句话点评
YouTube 把扫脸查 deepfake 的工具开放给所有成年用户了,之前只给部分人试。正文没披露上线时间、申诉流程和删除标准,所以实际效果和误报率还不清楚。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
22:05
28d ago
彭博科技· rssEN22:05 · 05·15
Arm 因芯片技术面临美国反垄断调查
彭博社报道,Arm Holdings 将因芯片技术面临美国反垄断调查。正文只重复了标题和导航栏,没有披露调查机构、涉嫌行为、调查机制或时间表。信息缺口很大,目前无法判断是哪个部门发起、涉及 Arm 的授权模式还是收购行为。
#Arm Holdings#Bloomberg#Policy
精选理由
H和R通过:Arm反垄断调查触及AI芯片授权和供应链竞争,有真实监管悬念。K不通过:正文只给了标题,没披露调查机构、指控机制和时间表,信息严重不足,所以分数落在60-71区间。
一句话点评
彭博独家称Arm将因芯片技术面临美国反垄断调查,但正文只重复了标题和导航栏,没披露调查机构、涉嫌行为、时间表。信息缺口极大,目前无法判断是FTC还是司法部、涉及授权模式还是收购。建议等正式报道再判断影响。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
21:30
28d ago
r/LocalLLaMA· rssEN21:30 · 05·15
AllenAI 给 Molmo 模型做了四个机器人专用微调版本
AllenAI 放出了四个 MolmoAct2 模型,都是基于 5B 参数的视觉-语言-动作模型微调出来的。分别针对 LIBERO、DROID、BimanualYAM 和 SO100_101 四个数据集,覆盖通用任务、交互式任务和绝对关节位姿控制。简单说就是让同一个视觉语言模型能直接输出机器人动作指令,不用再单独训练动作策略。正文没披露具体性能指标或推...
#Robotics#Vision#Fine-tuning#AllenAI
精选理由
正文只给了模型数量、参数量和数据集名字,没披露任何基准分数、许可证或复现细节,信息缺口明显,所以分数压在 60–71 区间。
一句话点评
AllenAI 把同一个 5B 参数的视觉语言模型微调成四个机器人专用版本,分别适配不同数据集(通用任务、交互操作、关节位姿控制)。好处是模型直接输出动作指令,省掉单独训练动作策略的环节。但正文没披露任何性能指标或推理延迟,实际能不能跑通、精度够不够用都是未知数。开源是好事,但别急着当成熟方案用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:23
28d ago
r/LocalLLaMA· rssEN21:23 · 05·15
4块RTX 3090怎么调最划算:功耗锁220W,速度248 token/s
Reddit用户实测Qwen3.6-27B FP16模型跑在4块RTX 3090上,用vLLM张量并行(TP=4)。把每张卡功耗限制在220W后,总吞吐248 token/s,能效1.13 token/焦耳。正文没披露显存占用和是否量化,但功耗锁220W比默认350W省电约37%,速度损失不大,适合长期跑推理的场景。
#Inference-opt#Reddit#Qwen#vLLM
精选理由
这是一条 Reddit 用户的单点测试,范围窄,但数字扎实:4×3090 在 220W 下跑出 248 t/s,能效比 1.13 t/J,对本地推理玩家有参考价值。不过正文没披露显存占用、多卡通信开销、长序列下的稳定性,这些缺口让分数卡在 69,够不到推荐位。
一句话点评
4块3090跑Qwen3.6-27B,功耗锁220W后总吞吐248 token/s,能效1.13 token/焦耳,比默认350W省电约37%,速度损失不大。适合长期跑推理的场景,但正文没披露显存占用和是否量化,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
21:02
28d ago
r/LocalLLaMA· rssEN21:02 · 05·15
骁龙X2笔记本本地跑RAG,索引20万文件
VecML在骁龙X2 Windows笔记本上演示了纯本地的RAG(外挂资料库)方案,索引了约20万个文件,实际跑完约10万个。检索时只用了1200个token,靠一个128分片的活跃缓冲区加大部分数据存磁盘来省内存。正文没披露检索延迟和模型大小,但内存占用控制得不错,适合在低配设备上试。
#RAG#Embedding#Memory#VecML
精选理由
这是一条Reddit上的单帖本地RAG演示,不是大模型或产品发布,所以分数压到70、tier all。亮点是硬件落地很具体,但正文没披露检索质量或延迟,这点先别太激动。
一句话点评
VecML 在骁龙 X2 笔记本上跑纯本地 RAG,索引了 20 万个文件,实际跑完约 10 万个。亮点是检索只用了 1200 个 token,靠 128 分片的活跃缓冲区加大部分数据存磁盘来省内存,适合低配设备。但正文没披露检索延迟和模型大小,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:01
28d ago
r/LocalLLaMA· rssEN21:01 · 05·15
Nexidion:一个本地知识库,后台AI自动帮你整理Markdown笔记
Nexidion开源了一个纯本地的Markdown知识库,核心卖点是后台有个AI代理自动干活。作者说开发了两年、重写了五次架构,支持批量操作节点和文件夹、版本化AI提交、一键回滚。实测用RTX 2080 Ti跑Qwen 3.6 35B-A3B IQ3_XXS(通过llama.cpp),说明一张老显卡就能带动35B参数的稀疏模型。不过正文没披露AI代理具...
#Agent#Tools#Memory#Nexidion
精选理由
这是一个 Reddit 自发布的小工具,零 star、无采用数据、无基准测试,所以不能给太高分。但产品定位清晰——私有知识库 + 本地 agent 自动整理,对注重隐私和本地部署的从业者有一定参考价值。正文没披露性能指标或用户反馈,建议先观望。
一句话点评
Nexidion 开源了一个纯本地的 Markdown 知识库,后台有个 AI 代理自动帮你整理、提交内容。作者说开发了两年、重写了五次架构,支持批量操作、版本化 AI 提交和一键回滚。实测用 RTX 2080 Ti 跑 Qwen 3.6 35B-A3B IQ3_XXS(通过 llama.cpp),一张老显卡就能带动 35B 参数的稀疏模型,这点挺省钱。但正文没披露 AI 代理具体能干什么—...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
20:51
28d ago
r/LocalLLaMA· rssEN20:51 · 05·15
动态分配算力给难题,Qwen-35B-A3B 接近 GPT-5.4-xHigh 水平
Reddit 帖子标题称,Qwen-35B-A3B 通过动态分配算力给更难的问题,并在训练中逐步进化模型分区,在 HLE 基准上接近 GPT-5.4-xHigh 的表现。但正文只返回了链接片段,没有披露具体分数、样本量、提示词或复现步骤,所以这个结论目前只能当个传闻看。
#Reasoning#Inference-opt#Benchmarking#Qwen
精选理由
HKR中H和R通过,但K不通过:这只是一个Reddit标题级别的声称,没有分数、样本量或复现条件。归入all,不推荐featured。
一句话点评
标题说 Qwen-35B-A3B 动态分配算力给难题,在 HLE 上接近 GPT-5.4-xHigh,但正文被 Reddit 屏蔽,没披露分数、样本量、提示词或复现步骤,目前只能当传闻看。短评:标题炸裂但正文被墙,分数、样本量、提示词全没披露,先别信。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
20:51
28d ago
彭博科技· rssEN20:51 · 05·15
Figure CEO 称人形机器人测试完全无人远程操控
Figure 的 CEO 说他们的人形机器人测试没有用任何远程操控(teleoperation),也就是全程靠机器人自己跑,没有人在背后遥控。但 Bloomberg 这条只有视频标题,正文没披露具体测试了什么任务、做了多少次、怎么验证的。所以这个说法目前只是一个声明,没有公开的实验细节支撑。
#Robotics#Figure#Bloomberg#Commentary
精选理由
Figure CEO 否认远程操作这条消息有 HKR-H 和 HKR-R,但 Bloomberg 页面几乎只有标题,任务、样本量、验证机制全没披露,HKR-K 不成立,整体价值偏上低位。
一句话点评
Figure CEO 声称人形机器人测试全程无远程遥控,全靠机器人自主运行。但 Bloomberg 这条只有视频标题,没披露具体任务、测试次数和验证方式。目前只是一个声明,缺乏公开实验细节支撑,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
20:38
28d ago
彭博科技· rssEN20:38 · 05·15
美国芯片行业缺人,SEMI 高管在 Bloomberg 上聊了
SEMI 高管 Shari Liss 在 Bloomberg Tech 上谈美国半导体人才缺口,但正文没披露具体缺多少人。另外顺带提了一句:特朗普在北京两天峰会期间和习近平聊了 AI 护栏和英伟达 H200 芯片。
#Safety#SEMI#Nvidia#Shari Liss
精选理由
45分:R项通过,因为芯片人才与AI算力供给直接挂钩;H和K项不通过——Bloomberg视频里只说了Trump在北京谈AI护栏和H200,没给任何缺口规模、岗位结构或具体政策动作。
一句话点评
SEMI高管说美国芯片业缺人,但正文没披露具体缺口数字,这点先别太激动。顺带提了特朗普和习近平聊AI护栏和H200芯片,但没细节,更像花絮。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
20:28
28d ago
Hacker News 首页· rssEN20:28 · 05·15
伦敦警察首次在抗议活动中用上人脸识别
伦敦警察局明天将在卡姆登区的一场政治集会上启用实时人脸识别(LFR),这是英国警方首次在抗议活动中使用这项技术。现场还会有无人机高空扫描。但同一天一场预计3万人参加的亲巴勒斯坦游行却不会受到同样的监控。正文没披露用了哪家厂商的系统、识别库有多大、匹配流程怎么走,也没说误报率。这点先别太激动——技术落地场景从商业街跳到政治集会,边界在扩大,但实际效果和合...
#Vision#Safety#London Police#Hacker News
精选理由
H和R成立:伦敦警方首次在抗议中用人脸识别,这个事实本身就有新闻价值和争议性。但K很弱:正文只有标题和摘要,没写在哪场抗议、用的哪家系统、识别准确率多少、误报率如何、法律依据是什么。信息太少,只能确认“第一次用”这个点,其他全是空白。
一句话点评
伦敦警察首次在抗议活动中启用实时人脸识别,还搭配无人机高空扫描。但同一天一场3万人规模的亲巴勒斯坦游行却不受同样监控,选择性地用技术让人警惕。正文没披露用了哪家厂商的系统、识别库多大、误报率多少,实际效果和合规边界都不清楚。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
20:06
28d ago
Hacker News 首页· rssEN20:06 · 05·15
Palantir 挖走 30 多名英国政府高级官员
Palantir 从英国政府挖了超过 30 名高级官员,Hacker News 上热度 52 分、3 条评论。正文没披露具体职位、入职时间或合同细节,所以不清楚这些人去了哪个部门、做什么。但人数不少,说明 Palantir 在政府业务上布局很深,可能想靠前官员打通关系或拿项目。
#Palantir#UK Government#Hacker News#Personnel
精选理由
HKR 三项都过,但信息太薄:只有 30+ 这个数字,没有职位、时间线、合同关联或 AI 产品影响。Palantir 做政府数据业务确实对读者胃口,但这条只能放 all,不值得 featured。
一句话点评
Palantir 从英国政府挖了超过 30 名高级官员,人数不少,说明它在政府业务上布局很深,可能想靠前官员打通关系或拿项目。但正文没披露具体职位、入职时间或合同细节,所以不清楚这些人去了哪个部门、做什么。这点先别太激动,信息缺口挺大。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
19:37
28d ago
AI HOT 精选· aihot-apiZH19:37 · 05·15
Krea 2 上线,只给 Pro 用户先用
Krea 2 今天正式面向 Pro 用户开放,但正文只说了这一句。没提价格、功能变化或普通用户什么时候能用,信息缺口很大。如果你不是 Pro 用户,暂时还上不了手。
#Krea#Product update
精选理由
这是一条很薄的供应商上线通知,只说了 Krea 2 对 Pro 用户开放,功能、价格、变化全都没披露。H/K/R 三项都不满足,按 0/3 规则排除。
一句话点评
Krea 2 上线了,但只对 Pro 用户开放,价格、功能变化、普通用户何时能用一概没提。信息缺口太大,非 Pro 用户暂时别激动。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
19:34
28d ago
r/LocalLLaMA· rssEN19:34 · 05·15
Gemma4 26B MoE 在 MacBook Air M5 上跑起来了,128k 上下文还能同时处理 4 个请求
开发者 maddie-lovelace 把 Google 的 Gemma4 26B MoE 模型移植到了 MLX 框架上,用上了 turboquant(一种更快的量化方法)和旋转 KV 缓存(减少长上下文的内存占用),还自己写了一个自定义 SWA 内核来压榨性能。在 MacBook Air M5(32GB 内存)上,8k 上下文时生成速度 17.15 ...
#Inference-opt#Code#Gemma#MLX
精选理由
单条 Reddit 帖子,作者自己写了 MLX 自定义 kernel 和 turboquant,技术细节扎实但缺乏多方验证。128k 上下文和 4 并发批次是亮点,但正文没披露长上下文下的实际速度或显存占用,这点先别太激动。整体适合作为本地推理的参考案例,但离 featured 还差一点验证深度。
一句话点评
短评:MacBook Air M5 跑 Gemma4 26B,生成速度 17 tok/s,比 llama.cpp 快还省内存,但这是手写内核换来的。 点评:开发者把 Google 的 Gemma4 26B MoE 模型移植到 MLX 框架,用 turboquant(更快的量化方法)和旋转 KV 缓存(减少长上下文内存占用),还自己写了 SWA 层内核。在 32GB MacBook Air ...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
19:18
28d ago
Hacker News 首页· rssEN19:18 · 05·15
CostHawk 搞了个 Claude Code 和 Codex 的全球用量排行榜
CostHawk 上线了一个公开排行榜,按 token 消耗量给 Claude Code、OpenAI Codex 和 Cursor 的用户排名。目前追踪了 96 个用户,总消耗 3270 亿 token,第一名用了 455 亿。Claude Code 占绝对主导(86.9% 的 token),但 Codex 本月增速更快(环比 +183.5%,Cla...
#Code#Benchmarking#Costhawk#Claude Code
精选理由
H 和 R 过关,但 K 硬伤:页面只甩了个排行榜,没交代怎么统计的、数据从哪来、多久更新一次。HN 上才 7 分 2 条评论,热度低,就是个信息不全的工具页面,不值得高优先级。
一句话点评
CostHawk 搞了个公开排行榜,按 token 消耗量给 Claude Code、Codex 和 Cursor 用户排名。目前追踪了 96 个用户,总消耗 3270 亿 token,第一名用了 455 亿。Claude Code 占绝对主导(86.9% 的 token),但 Codex 本月增速更快(环比 +183.5%,Claude Code 是 +136.8%)。 这个榜更像一个“...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
19:08
28d ago
AI HOT 精选· aihot-apiZH19:08 · 05·15
Clawpatch:把代码库切成语义切片来审 bug
Clawpatch 0.1.0 已发布,通过 npm install -g clawpatch 安装。它把整个代码库映射成“语义功能切片”,然后逐片审查错误和质量问题,并记录已验证的修复尝试。作者说“能发现的问题之多令人惊讶”,但正文没披露任何基准测试结果或定价,所以这点先别太激动。
#Code#Tools#clawpatch#Product update
精选理由
一个小型代码工具发布:HKR-K 有 npm 0.1.0 加上语义切片机制,HKR-R 贴合 AI 编码审查痛点。正文未披露基准、案例或定价,因此保持在 60–71 区间。
一句话点评
Clawpatch 把整个代码库切成“语义功能切片”逐片审查 bug 和质量,还能记录已验证的修复尝试。作者说“发现的问题之多令人惊讶”,但正文没披露任何基准测试或定价,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
18:24
28d ago
r/LocalLLaMA· rssEN18:24 · 05·15
用户实测:华硕 Ascent(NVIDIA GB10 DGX)跑模型比 AMD Ryzen AI Max 还慢
Reddit 用户 Voxandr 发帖说,他买的华硕 Ascent(搭载 NVIDIA GB10 DGX)跑 Gemma-4-31B 只有 6.19 tokens/秒,而手头一台 AMD Ryzen AI Max 设备能跑到 7.10 tokens/秒。配置上用了 llama-cpp、12 线程、开启 flash-attn、q8_0 KV cache...
#Inference-opt#Asus#Nvidia#Voxandr
精选理由
一条 Reddit 单机实测,没有交叉验证,但具体 token/s 和 llama-cpp 配置让信息有用。不过别太激动,这只是一个人测的,样本太少,而且正文没披露功耗、散热、驱动版本等变量,结论不能直接推广。
一句话点评
Reddit 用户实测,华硕 Ascent(NVIDIA GB10 DGX)跑 Gemma-4-31B 只有 6.19 tokens/秒,还不如一台 AMD Ryzen AI Max 的 7.10 tokens/秒。配置用了 llama-cpp、12 线程、flash-attn 和 q8_0 KV cache,但没披露功耗和完整硬件设置。这个速度跑 31B 模型基本没法用,比预期慢不少。正文...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
18:14
28d ago
AI HOT 精选· aihot-apiZH18:14 · 05·15
Sai 是个有独立桌面的虚拟同事,你下线它自己干活
Sai 不是聊天窗口,而是给你一个独立桌面,你交代完“深度研究某主题”就可以走开。它会自己开标签页、点应用、交叉引用资料、做笔记,像人类研究员一样。干完活整理好引用来源,有风险操作前会先问你批不批准。正文没披露它用了什么模型、一次任务跑多久、成本多少,但“始终在线”的电脑使用代理形态已经摆出来了。
#Agent#Tools#Sai#Product update
精选理由
H/K/R三项都过,但只是Sai这一个产品的demo,没提模型、定价、可复现的基准测试或上线范围。落在60–71的小型Agent产品更新区间。正文没披露Sai背后的模型、成本、延迟或样本量,所以没法判断实际效果。
一句话点评
Sai 把 AI 助手做成了独立桌面上的“虚拟同事”,你交代完深度研究就能走开,它自己开标签页、交叉引用、做笔记,风险操作前还会问你批不批准。正文没披露用了什么模型、一次任务跑多久、成本多少,但“始终在线”的电脑使用代理形态已经摆出来了。短评:不是聊天窗口,是给你一个独立桌面干活,干完活整理好引用来源,这点先别太激动——跑一次深度研究要多久、花多少钱,正文一个字没提。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:56
28d ago
● P1AI HOT 精选· aihot-apiZH17:56 · 05·15
杨立昆播客访谈:LLM 走不远,他离开 Meta 去赌世界模型
杨立昆在 Unsupervised Learning 播客里把大语言模型的底牌翻了个遍。他直接说 LLM 这条路有天花板,劝博士生别再往里扎。他预测到 2027 年,纯靠堆语言数据做不出真正的智能。他离开 Meta 后创立的 AMI 公司,核心押注在“世界模型”上——让 AI 像人一样通过观察和互动去理解物理世界,而不是只读文本。访谈里他还跟老搭档 H...
#Reasoning#Robotics#Safety#Yann LeCun
精选理由
我会先打个折:这是播客访谈,不是论文或产品发布,信息密度高但验证性弱。杨立昆的核心判断是当前大语言模型路线走不到人类级 AI,他把宝押在世界模型和 AMI 上,还给了 2027 这个时间点——这点先别太激动,正文没披露他具体依据什么数据或实验得出这个年份。他离开 Meta 的原因和与 Hinton、Bengio 的分歧是这次的新料,尤其是安全观上的对立,直接关系到行业资源往哪投。整体看,这篇访谈把一位关键人物的技术判断、职业选择和路线分歧打包在一起,对从业者判断风向有帮助,但很多结论还缺公开验证。
一句话点评
杨立昆劝博士生别搞LLM了,说这条路到2027年会撞墙。他新公司押注“世界模型”,让AI像人一样观察物理世界,但正文没披露具体技术方案和验证数据。
锐评
杨立昆这次把话说得很直:纯靠堆语言数据做不出真正的智能,到2027年这条路就到头了。他离开Meta后创立的AMI,核心思路是让AI通过观察和互动理解物理世界,而不是只读文本。这个判断跟他一贯的立场一致,但访谈正文没给出“世界模型”的具体架构、训练方式或任何实验数据,所以目前更像是一个方向性表态。 他还把OpenAI和Anthropic比作当年的Sun Microsystems——技术上有声量但商业模式可能撑不住。这个类比挺狠,但同样缺少展开论证。另外,他和Hinton、Bengio在图灵奖观点上的分歧,正文只提了一句,具体争什么、谁对谁错都没说。 整体来看,这篇访谈的价值在于一个顶级研究者的方向判断,但细节严重缺失。如果你在考虑要不要跟注“世界模型”这条路线,建议先等AMI拿出可复现的结果再说。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
17:08
28d ago
r/LocalLLaMA· rssEN17:08 · 05·15
开源 MCP 服务器让本地大模型直接查美股财报、内幕交易和国会持仓
DanielAPO 开源了一个叫 Equibles 的 MCP 服务器,能让本地跑的大模型直接拉取美国公开金融数据,包括 SEC 的 10-K/10-Q/8-K 财报、13F 机构持仓、内幕交易、国会交易、FRED 经济指标和做空数据。关键是不依赖云端、不用 API key、也没有遥测,完全自托管。对做本地金融分析或量化回测的人来说,等于给模型装了一个...
#Agent#Tools#DanielAPO#Equibles
精选理由
HKR 三项都达标:MCP 接入金融数据的钩子具体且有用。但只是一个 Reddit 个人项目,没有采用量、基准测试或生产案例,所以分数压在 60–71 区间。正文没披露延迟、数据更新频率或解析准确率,这点先别太激动。
一句话点评
开源MCP服务器Equibles,让本地大模型直接拉SEC财报、13F持仓、内幕交易等美国公开金融数据,无需API key和云依赖。对做本地金融分析或量化回测的人很实用,等于给模型装了个实时数据接口。但正文没披露数据更新频率和覆盖范围,如果是实时或准实时,挺省钱。短评:本地模型直接查SEC财报和国会交易,省掉API费用。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:03
28d ago
Hacker News 首页· rssEN17:03 · 05·15
Sx:一个给 AI 编程助手用的开源包管理器
Sleuth-io 开源了一个叫 Sx 的工具,专门给 AI 编程助手装“技能包”、MCP(模型上下文协议)和命令行工具。你可以把它理解成 AI 版的 npm 或 pip,但目标不是装代码库,而是装能让 AI 干活的插件。目前 GitHub 上 67 个星、4 个 issue,项目还很早期。正文没披露安装机制、包格式和具体支持哪些 AI 助手,所以实际...
#Agent#Tools#Sleuth-io#Sx
精选理由
HKR-H 和 HKR-R 通过:包管理器这个角度确实切中 agent/MCP 工作流里分享和复用 skills 的痛点。HKR-K 不通过:正文除了定位和 HN 上的 7 分、1 条评论之外,没给任何安装机制、包格式或采用信号,信息量不足以支撑高可信度。
一句话点评
Sx 想当 AI 编程助手的 npm/pip,让你装技能包、MCP 插件和命令行工具。目前 GitHub 上 67 星、4 个 issue,项目极早期。正文没披露包格式、安装机制和具体支持哪些助手,实际可用性存疑。方向有意思,但离“AI 版包管理器”还差一个生态。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
16:56
28d ago
AI HOT 精选· aihot-apiZH16:56 · 05·15
MiniMax M2.7 模型上线 OrcaRouter,可通过 OpenAI 兼容 API 调用
MiniMax 的 M2.7 模型现在可以在 OrcaRouter 平台上用了,开发者只需一个兼容 OpenAI 的 API 就能调用。正文没披露定价、上下文窗口、速率限制、跑分结果或部署地区,所以实际效果和成本还不清楚。
#MiniMax#OrcaRouter#OpenAI#Product update
精选理由
低权重分发更新:HKR-K 靠 OpenAI 兼容 API 通过,但价格、上下文窗口、限流和基准测试都没披露;没有硬排除规则触发。
一句话点评
MiniMax 的 M2.7 模型上线了 OrcaRouter 平台,开发者用 OpenAI 兼容的 API 就能直接调用,省了改代码的麻烦。但正文没披露定价、上下文窗口、速率限制、跑分结果或部署地区,实际效果和成本都不清楚。短评:接入方便,但缺关键信息,先别急着用。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
16:48
28d ago
r/LocalLLaMA· rssEN16:48 · 05·15
给大模型外挂一个300MB的音频编码器,只训练一层映射层
Reddit用户提出一个低成本方案:把E4B或E2B音频编码器(300MB)挂到大模型上,冻结模型和编码器,只训练一个线性映射层。正文没披露任何基准测试结果、训练成本或实现证据,所以这个方案到底能不能用、效果如何,目前完全未知。优点是参数少、训练成本低,但缺点也很明显——没有验证,连基础的数字(比如延迟、精度)都没有。
#Audio#Multimodal#Fine-tuning#Reddit
精选理由
只有 K 通过:300MB 的 E4B/E2B 编码器加线性投影这个方案是可测试的。帖子没给实验结果、训练成本或模型质量数据,所以归入低价值 all 档。
一句话点评
一个Reddit用户提出把300MB的E4B音频编码器挂到大模型上,只训练一个线性映射层,冻结模型和编码器。优点是参数少、训练成本低,但正文没披露任何基准测试结果、训练成本或实现证据,所以这个方案到底能不能用、效果如何,目前完全未知。缺点也很明显——没有验证,连基础的数字(比如延迟、精度)都没有。 短评:想法省钱,但没跑分没延迟,先别信。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
16:14
28d ago
r/LocalLLaMA· rssEN16:14 · 05·15
7人公司想本地跑大模型,选Gemma 4还是Qwen 3.6?
一位Reddit用户问:7人公司要本地部署大模型,主要做查询、RAG(外挂资料库)和编程(1-2人用),数据不能外传。他看中了Gemma 4 26/31和Qwen 3.6 27/35,想知道用RTX 5090或48GB MacBook Pro能不能扛住多人同时用。帖子只列了硬件和模型名,没给任何并发测试数据,所以实际能带几个人、延迟多高都是未知数。
#RAG#Code#Inference-opt#Reddit
精选理由
HKR-R 通过是因为7人公司本地LLM搭建这个场景,精准踩中SMB对本地部署的焦虑点。HKR-H/K 都不满足:没有具体配置、硬件规格、并发测试或成本数字,所以只能留在all层级。
一句话点评
7人公司想本地跑大模型,看中Gemma 4和Qwen 3.6,配RTX 5090或48GB MacBook Pro。但帖子只列了硬件和模型名,没给任何并发测试数据,实际能带几个人、延迟多高都是未知数。短评:硬件选型方向对,但没并发数据,别急着下单。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H0·K0·R1
16:06
28d ago
FT · 科技· rssEN16:06 · 05·15
安永撤回研究报告:AI 幻觉翻车,专业服务公司也被带沟里
安永(EY)撤回了一份研究报告,因为研究人员发现里面存在 AI 幻觉。这件事本身说明,专业服务公司也会被新技术带偏。不过正文没披露具体是哪份研究、有多少处错误、用了什么模型、以及内部审核流程是怎样的——信息缺口挺大,暂时只能当个警示案例看。
#Safety#EY#Incident
精选理由
FT信源加上EY撤回的动作,H和R都够硬,但K扣分——研究名称、错误规模和模型都没披露。事件本身信息稀疏,分数卡在60–71区间合理。
一句话点评
安永撤回了一份研究报告,因为里面出现了AI幻觉。这事本身不算大新闻,但说明专业服务公司也会被新技术带偏。正文没披露具体是哪份研究、有多少处错误、用了什么模型、以及内部审核流程——信息缺口挺大,暂时只能当个警示案例看。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
16:04
28d ago
● P1Dwarkesh Patel 播客· rssEN16:04 · 05·15
Eric Jang 用现代工具从零复现AlphaGo
Eric Jang 在播客里聊了他休假期间干的一件事:用现在的 AI 工具从零搭一个 AlphaGo。他选这个项目不是因为怀旧,而是觉得 AlphaGo 至今仍是把“搜索、从经验里学习、自我对弈”这三件事揉得最清楚的例子。节目里他一步步拆了蒙特卡洛树搜索是怎么给神经网络当老师的——每一步都直接给出一个更优的落子建议,绕开了大语言模型强化学习里最头疼的问...
#Reasoning#Agent#Code#Eric Jang
精选理由
Eric Jang 这篇文章不是发新模型,而是用 Cursor 这类现代工具重新搭了一遍 AlphaGo,然后拿蒙特卡洛树搜索(MCTS)跟大模型在超长 token 轨迹里的强化学习信用分配做对比。我会先打个折:正文没给出具体实验数据,更像一篇带技术深度的工程复盘。但它的价值在于把两个看似不相关的东西——下棋的搜索算法和 LLM 的 agent 工作流——拉到同一个问题框架下聊。对正在折腾长程推理和 agent 的人来说,这种对比比论文更直接。
一句话点评
Eric Jang 用现代工具重写了 AlphaGo,不是为了刷榜,而是想搞懂“一个十层网络怎么把深到离谱的搜索给学进去”。
锐评
Eric Jang 在播客里聊了他休假期间的项目:用现在的工具从零复现 AlphaGo。他不是要造一个更强的围棋 AI,而是想亲手拆解 AlphaGo 里“搜索、从经验中学习、自我对弈”这几个智能原语是怎么配合的。他提到一个很反直觉的点:一个只有十层的神经网络,居然能把游戏树里极深的搜索过程给“压缩”进去,这让他一直很好奇。 对话里最有意思的对比是,AlphaGo 用的蒙特卡洛树搜索(MCTS)能直接给出每一步的改进方向,绕开了“功劳分配”这个难题;而现在的语言模型做强化学习,得从十万多个 token 里猜到底是哪一步做对了,学习效率低得多。Jang 还试了让 AI 自动做研究,发现模型在跑实验、调参数上已经挺顺手,但在“选什么新问题去研究”和“从死胡同里退出来”这两件事上还很吃力。 正文没披露他复现的具体算力成本和最终棋力,也没给出自动研究环节的量化成功率。如果想知道这套思路能不能直接搬到语言模型上,还得看他后续会不会放出代码和实验记录。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
15:54
28d ago
AI HOT 精选· aihot-apiZH15:54 · 05·15
商汤发了个8B模型,专门做信息图,海报图表都能生成
商汤在Hugging Face开源了SenseNova-U1-8B-MoT-Infographic,一个专门生成信息图的模型。能输出海报、图表、食谱卡、arXiv论文页等。相比基础版U1,在BizGenEval困难集上提了6.8分,在IGenBench的Q-ACC指标上提了18.2分——后者提升幅度挺大,说明生成内容与指令的匹配度有明显改善。官方还放了...
#Multimodal#Vision#Benchmarking#SenseTime
精选理由
商汤开源了一个 8B 的信息图生成模型,在俩评测集上分数涨得挺明显,尤其 IGenBench 那边涨了 18 分。但正文没披露训练数据量、推理速度或部署成本,所以只能当个有用的多模态产品更新看,重要性在 60–71 这个区间。
一句话点评
商汤开源了一个8B参数的信息图生成模型,能直接输出海报、食谱卡甚至arXiv论文页。在IGenBench的指令匹配度上比基础版涨了18.2分,提升挺明显。但正文没披露训练数据来源和生成速度,实际部署时延迟和可控性存疑。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R0
15:50
28d ago
● P1彭博科技· rssEN15:50 · 05·15
Apple 与 OpenAI 联盟关系紧张 合作陷入困境
Bloomberg 报道,苹果和 OpenAI 在 2024 年签的那份两年合作协议现在关系紧张。OpenAI 觉得合作没带来当初说好的好处,已经在准备法律行动。具体是哪些条款有争议、什么时候会正式起诉,正文都没披露。
#Apple#OpenAI#Anurag Rana#Partnership
精选理由
Bloomberg 说苹果和 OpenAI 的两年合作变味了,OpenAI 觉得没拿到该得的好处,已经在准备法律动作。我会先打个折:正文没披露具体争议条款和财务数字,所以没法判断到底是谁违约还是单纯分赃不均。但光是“可能起诉”这个信号,就够让依赖大厂渠道的 AI 团队紧张一下。
一句话点评
苹果和 OpenAI 的 iPhone 合作可能要黄,甚至闹到打官司。这事如果真崩了,对手机端 AI 的落地节奏影响不小,但先别急着下结论,目前只有媒体爆料,双方都没正式回应。
锐评
Bloomberg 等几家媒体都在说,苹果和 OpenAI 围绕 iPhone 上的 AI 功能合作出了大问题,OpenAI 甚至在考虑起诉苹果。报道没披露具体合同条款,但矛盾核心很可能跟钱和用户数据控制权有关——苹果向来要把用户隐私攥在自己手里,而 OpenAI 需要更多数据和使用场景来训练模型。如果合作破裂,苹果要么换供应商,要么加速推自己的端侧模型,但短期内 Siri 的体验可能会受影响。目前信息全来自匿名信源,两家公司都没公开表态,所以具体闹到什么程度、有没有挽回余地,都还不清楚。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
15:42
28d ago
Hacker News 首页· rssEN15:42 · 05·15
Image-blaster:一张图生成3D场景、特效和网格
这是一个给 Claude 用的“图像到世界”技能包,输入一张图片就能输出 3D 环境、特效和网格模型。GitHub 上拿了 1.3k 星,但正文没披露用了什么模型、什么许可证,也没给可复现的配置。效果听起来很酷,但信息缺口太大,先别太激动。
#Multimodal#Vision#Image-blaster#GitHub
精选理由
标题说一张图能生成3D环境、音效和网格,钩子确实强,所以h通过。但正文只给了GitHub链接和HN上的12分、0条评论,模型是什么、用什么许可证、有没有在线演示、怎么复现,一概没写,信息严重不足,k和r都不通过。
一句话点评
短评:一张图生成3D场景+特效,听起来很酷,但正文没披露用了什么模型、许可证,信息缺口太大,先别太激动。 点评:这是一个给Claude用的“图像到世界”技能包,输入一张图片就能输出3D环境、特效和网格模型。GitHub上拿了1.3k星,热度不错,但正文没披露用了什么模型、什么许可证,也没给可复现的配置。效果听起来很酷,但信息缺口太大,先别太激动。关键数字:1.3k星说明社区关注度高,但缺乏...
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H1·K0·R0
15:38
28d ago
彭博科技· rssEN15:38 · 05·15
对冲基金大佬 Paul Tudor Jones 搞了个体育 AI 公司,逐帧分析 NFL 比赛视频
SumerSports 用 AI 逐帧追踪 NFL 比赛画面,覆盖四个场景:球探、球员发展、战术预测和球迷互动。说白了就是把视频拆成每一帧,让模型识别球员动作和战术跑位,帮球队做决策。正文没披露用了什么模型、训练数据量多大、以及实际落地效果如何,所以目前只能当个概念看。如果真能跑通,对 NFL 这种高人力成本的球探体系来说,算是个降本方向。
#Vision#Benchmarking#SumerSports#Paul Tudor Jones
精选理由
H 和 K 靠 Paul Tudor Jones 的跨界身份和逐帧 NFL 跟踪的四个用例过关。R 偏弱:正文没披露模型细节、客户规模、收入或对从业者的实际影响,目前更像一个名人背书的产品介绍。
一句话点评
对冲基金大佬 Paul Tudor Jones 投的体育 AI 公司 SumerSports,用逐帧视频分析帮 NFL 球队做球探、战术预测和球员发展。说白了就是把比赛录像拆成每一帧,让模型识别球员动作和跑位。但正文没披露用了什么模型、训练数据量多大、实际落地效果如何,目前只能当概念看。如果真能跑通,对 NFL 这种高人力成本的球探体系来说,算是个降本方向。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K1·R0
15:22
28d ago
AI HOT 精选· aihot-apiZH15:22 · 05·15
Forward Deployed Engineer:AI 落地时代的现场工程师,到底在干什么?
Forward Deployed Engineer(FDE)就是去客户现场把 AI 系统装好、调通、跑起来的人,介于工程师和顾问之间。最近 OpenAI 专门成立了一家部署公司,Anthropic 和华尔街巨头合作,Google 也在简化流程大量招人——说明行业重心正从“谁家模型更强”转向“谁能真正把模型用起来”。正文没披露具体招了多少人、薪资范围、以...
#Agent#Tools#OpenAI#Anthropic
精选理由
这篇更像行业观察笔记:解释了 FDE 这个岗位是干什么的,也列了三家公司的动向,但没给招聘数量、薪资范围或组织调整这类硬证据。信息有钩子但支撑偏软,所以给了 70 分,tier all。
一句话点评
FDE就是去客户现场把AI系统装好、调通、跑起来的人,介于工程师和顾问之间。OpenAI专门成立部署公司、Anthropic与华尔街合作、Google简化流程招人——说明行业重心正从“谁家模型更强”转向“谁能真正把模型用起来”。正文没披露具体招了多少人、薪资范围、以及部署成功率,信息偏概念科普。短评:AI落地缺的不是模型,是能蹲在客户机房把系统跑通的人。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
15:14
28d ago
彭博科技· rssEN15:14 · 05·15
联合健康开始统计员工用AI的频率,推动全员用AI
联合健康集团正在追踪部分员工使用AI工具的频率,作为全公司推广AI的一部分。正文没披露具体用了哪些AI工具、涉及多少员工、怎么统计的,也没说推广时间表。
#Tools#UnitedHealth Group#Product update
精选理由
H和R成立:一家大型雇主开始量化员工用AI的行为,有新闻价值。K不成立:正文没交代用的什么工具、监控多少人、怎么定义“使用”、什么时候铺开,信息太薄,所以分数压在60–71档。
一句话点评
联合健康开始统计员工用AI的频率,作为全公司推AI的一部分。正文没披露用了哪些工具、涉及多少人、怎么统计的,也没说时间表。信息缺口太大,目前只能当个管理动向看,没法判断实际影响。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K0·R1
15:12
28d ago
AI HOT 精选· aihot-apiZH15:12 · 05·15
OpenRouter BYOK 三大升级:支持多密钥轮换
OpenRouter 更新了 BYOK(自带密钥)功能,现在一个工作空间可以为同一家模型服务商添加多个密钥,还能设置调用顺序。这样就能在速率限制之间自动轮换密钥、区分开发和生产环境,或者在团队账户间分配用量。不过官方只详细说了这一项升级,另外两项没披露具体内容。
#Tools#OpenRouter#Product update
精选理由
正文只披露了1项升级(多密钥轮换),没有说明其他2项是什么,也没有定价、灰度范围或故障切换细节。信息缺口明显,建议先打个折。亮点在于BYOK机制直接命中API可靠性、密钥限额和多账户运维的痛点,对AI从业者有价值,但整体信息量不足,重要性打66分合理。
一句话点评
OpenRouter 的 BYOK 现在支持一个工作空间给同一家模型商挂多个密钥,还能设调用顺序,方便在速率限制间自动轮换、区分开发/生产环境或分团队用量。官方只详细说了这一项,另外两项升级没披露,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
15:06
28d ago
AI HOT 精选· aihot-apiZH15:06 · 05·15
微软研究院一口气发了5个AI项目,有轻量智能体框架和GitHub自动化工作流
微软研究院今天放出一批新工具和模型,包括MSR AI Frontiers团队的MagenticLite(一个轻量级智能体框架)、智能体化GitHub工作流(让模型自动处理PR、issue等流程)、验证优先智能体(先检查再行动)、意义匹配微调(一种对齐方法)以及AI转型与经济发展研究。正文没披露模型参数量、许可证、代码链接或跑分结果,所以目前只能看个方向...
#Agent#Fine-tuning#Code#Microsoft Research
精选理由
MagenticLite 和智能体化 GitHub 工作流是具体且跟开发者工具链相关的新发布,HKR 的 K 和 R 都达标。但正文没披露参数、许可、代码链接或评测结果,信息缺口明显,所以归为常规更新档位,不调分。
一句话点评
微软研究院一口气发了五个东西,但全是方向性预告,没给任何具体参数、跑分或代码链接。MagenticLite 是个轻量智能体框架,意义匹配微调是一种对齐方法,验证优先智能体强调先检查再行动——这些概念本身不新,关键看实现细节,但正文没披露。目前只能当 roadmap 看,别当产品发布。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
15:00
28d ago
AI HOT 精选· aihot-apiZH15:00 · 05·15
Kling AI 确认2026年戛纳电影节主讲阵容
Kling AI 将在 2026 年戛纳电影节(5 月 18 日下午)办一场大会,请来三位电影人分享用 AI 做片子的幕后。中国动画导演魏立讲 AI 动画《Born of the Tide》,Jon Erwin 讲为 Amazon Prime 做的剧集《House of David》,Eekjun Yang 讲院线电影《RAPHAEL》。活动在戛纳影节...
#Multimodal#Vision#Kling AI#Wei Li
精选理由
这是一条Kling AI活动预告:公布了主讲人数和具体时间,但没有模型、功能、定价或可测试的案例。HKR-K勉强通过;HKR-H和HKR-R都不满足,因此评分低于40,被排除。
一句话点评
Kling AI 要在戛纳电影节开专场了,主讲阵容刚公布。这事本身不算技术突破,更像一次行业站台——AI 视频工具第一次挤进欧洲三大电影节的主舞台。但正文没披露具体嘉宾名单和议题方向,所以含金量不好判断。如果只是放几段 AI 短片加圆桌聊天,那更多是公关动作;如果能拿出和导演合作的完整工作流,才值得关注。目前信息缺口在:谁来讲、讲什么、有没有实片展示。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K1·R0
14:43
28d ago
r/LocalLLaMA· rssEN14:43 · 05·15
128GB 内存但显卡弱,跑本地大模型到底行不行?
Reddit 用户质疑“高内存低显存”路线:128GB 内存配合 CPU/GPU 混合加载,能跑的模型其实很少。24/32GB 显存的显卡可以直接装下稠密模型,而 100B 以上级别只有 Qwen 3.5 122B 这一个 MoE 选项可选。帖子没披露实际推理速度,所以“能跑”和“跑得动”是两回事。如果你显卡显存不大但内存管够,选模型时选择面确实窄,而...
#Inference-opt#Qwen#DeepSeek#MiniMax
精选理由
这是一条LocalLLaMA社区的硬件路线争论帖,不是基准测试或新模型发布。H和R成立:标题有争议钩子,话题切中本地部署的成本选择。K不成立:帖子只举了一个模型例子,没有实测吞吐或可复现的配置,信息缺口明显。
一句话点评
Reddit 用户质疑“高内存低显存”路线:128GB 内存配合 CPU/GPU 混合加载,能跑的模型其实很少。24/32GB 显存的显卡可以直接装下稠密模型,而 100B 以上级别只有 Qwen 3.5 122B 这一个 MoE 选项可选。帖子没披露实际推理速度,所以“能跑”和“跑得动”是两回事。如果你显卡显存不大但内存管够,选模型时选择面确实窄,而速度可能更慢。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
14:01
28d ago
AI HOT 精选· aihot-apiZH14:01 · 05·15
美国AI政策一团糟:1200项法案,没有统一框架
Gary Marcus 在 Fortune 发文指出,美国各州和联邦已提出约1200项AI相关法案,其中约150项已通过成为法律,但缺乏一个统一的全国性政策框架。他认为这种碎片化对企业和消费者都不利,并呼吁先问对问题、排好优先级,而不是继续堆法案。正文没有披露具体支持或反对哪些现存法案,也没有给出详细的统一框架内容。
#Safety#Gary Marcus#Policy#Commentary
精选理由
HKR全通过,但文章依赖Gary Marcus的评论和一个硬数字(约1200项AI法案),没有披露可操作的全国框架,所以分数落在60-71区间。
一句话点评
Gary Marcus 在 Fortune 发文说美国 AI 政策碎片化:各州和联邦已提约 1200 项法案,约 150 项通过,但没有统一框架。他呼吁先问对问题、排好优先级,而不是继续堆法案。正文没披露他具体支持或反对哪些现存法案,也没给出详细的统一框架内容。这点先别太激动,更像一个呼吁,不是方案。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:00
28d ago
TechCrunch AI· rssEN14:00 · 05·15
Runway 想靠视频生成挑战 Google,赌的是世界模型这条路
Runway 这家做 AI 视频生成的公司,现在把赌注押在“视频生成是通往世界模型的路径”上。世界模型可以简单理解为:让 AI 学会物理世界的因果和空间规律,而不只是生成好看的画面。Runway 还强调自己不是 Google 那种大厂出身,反而觉得“局外人”身份是优势——不用背历史包袱。但正文没披露具体技术路线、训练规模或评测数据,所以这个“挑战 Go...
#Multimodal#Vision#Runway#Google
精选理由
H 和 R 过关,但 K 很弱:文章只是 Runway 的公司侧写和观点陈述,没有披露新模型、跑分、定价或可复现的测试。这符合 60–71 分区间,属于评论/公司报道类内容。
一句话点评
Runway 赌视频生成能做出“世界模型”——让 AI 懂物理因果,不只是画得好看。自称局外人没包袱,但正文没披露技术路线、训练规模或评测数据,挑战 Google 还缺证据。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
13:49
29d ago
彭博科技· rssEN13:49 · 05·15
SambaNova 叫板 Cerebras:下一轮 AI 竞争拼推理成本,不是训练速度
SambaNova CEO Rodrigo Liang 在 Bloomberg 采访中说,AI 下一阶段的竞争焦点会转向推理成本、算力短缺和基础设施能否盈利。他这话明显是冲着 Cerebras 去的——后者一直主打训练快、单芯片大,但 Liang 认为市场很快会转向谁跑推理更便宜。Bloomberg 这条视频没有披露 Cerebras IPO 的规模,...
#Inference-opt#SambaNova#Rodrigo Liang#Cerebras
精选理由
H 和 R 过关:SambaNova 对 Cerebras 的竞争角度是真实的基建对手戏,成本压力也切中运营者痛点。K 不过关:没有新数字、新机制或融资细节,信息密度撑不起更高分,所以落在 60–71 区间。
一句话点评
SambaNova CEO 公开呛声 Cerebras,说 AI 下一轮拼的是推理成本,不是训练速度。Cerebras 一直靠大芯片和训练快打市场,但 Liang 认为客户很快会转向谁跑推理更便宜。Bloomberg 这条视频没给具体成本数字,也没披露 Cerebras IPO 规模,所以这点先别太激动。如果推理真成为瓶颈,SambaNova 的架构可能更吃香,但正文没披露他们的推理成本对比...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
13:38
29d ago
r/LocalLLaMA· rssEN13:38 · 05·15
OpenMOSS:纯 C++ 的 TTS 推理管线,作者说选它是因为支持波兰语
pwilkin/openmoss 是一个基于 GGML 的纯 C++ 管线,专门跑 OpenMOSS TTS 模型。支持服务模式和单次 CLI 调用。作者选 OpenMOSS 的理由是它支持波兰语,但正文没披露推理速度、显存占用、安装步骤或模型参数量。如果你需要离线跑 TTS 且对波兰语有需求,可以关注,但性能数据得自己去测。
#Audio#Tools#OpenMOSS#GGML
精选理由
HKR 三项都是弱正面:纯 C++/GGML 给了本地部署的钩子,服务+CLI 两种模式也算具体。但性能、安装步骤、模型参数全缺,只能落在 60-71 的小众开源工具区间。
一句话点评
有人用GGML给OpenMOSS TTS模型写了个纯C++管线,支持服务模式和单次调用。作者选它是因为支持波兰语,这点对非英语用户挺友好。但正文没披露推理速度、显存占用、安装步骤或模型参数量,性能全靠自己测。如果你需要离线跑TTS且对波兰语有需求,可以关注,但别指望开箱即用。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
13:33
29d ago
Hacker News 首页· rssEN13:33 · 05·15
Turso 关停漏洞赏金计划:AI 生成的垃圾 PR 太多,维护者受不了了
Turso 宣布关停运行了近一年的漏洞赏金计划,原因是 AI 生成的垃圾 PR 淹没了维护者。该计划原本奖励 1000 美元给能证明导致数据损坏的 bug,但 LLM 被大量用来批量生成无效报告,维护者每天只能关闭这些 PR,无法正常干活。Turso 强调这不是个例,很多开源项目都在被 AI 垃圾贡献淹没。正文没有披露关停后是否有替代方案,也没有说明之...
#Safety#Turso#Hacker News#Safety/alignment
精选理由
H 和 R 通过:标题把 AI 和停掉漏洞赏金绑在一起,安全成本话题天然有讨论度。K 不通过:RSS 正文只有标题加 HN 分数和评论数,没披露停掉赏金的原因或替代机制。
一句话点评
Turso 关停漏洞赏金计划,原因是AI生成的垃圾PR太多,维护者每天只能关PR,没法干活。计划原本奖励1000美元,只付给5个人,效果不错。但AI批量制造无效报告,让项目无法承受。正文没提关停后有没有替代方案,也没说怎么区分AI和真人贡献。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
13:07
29d ago
AI HOT 精选· aihot-apiZH13:07 · 05·15
OpenClaw 新版跑得快了 3.5 倍
OpenClaw 说最新版本速度提升了约 3.5 倍。团队每 6 小时通过 Telegram 机器人对所有已发布的 npm 版本做一次端到端往返延迟测试,防止性能偷偷回退。所有测试跑在 @useblacksmith CI 上。正文没披露具体延迟数值和测试场景,但持续监控回归这个做法对依赖响应速度的工具链挺实用。
#Agent#Tools#OpenClaw#Telegram
精选理由
3.5倍提速和6小时一轮的Telegram RTT测试是实打实的性能钩子,但来源单一(仅OpenClaw自家数据),且正文没披露测试环境、样本量或对比基线,验证力度有限。影响面窄,属于小体量工具更新,所以落在60–71分区间。
一句话点评
OpenClaw新版号称快3.5倍,但没给具体延迟数字和测试场景,这点先别太激动。亮点是每6小时用Telegram机器人对所有npm版本做端到端往返测试,防止性能偷偷回退——对依赖响应速度的工具链挺实用。跑在Blacksmith CI上,监控回归的做法比单次跑分更有参考价值。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:02
29d ago
r/LocalLLaMA· rssEN13:02 · 05·15
Gemma 4 在手机上跑,内存比 llama.cpp 少一半多
Reddit 用户实测,用 Google 的 LiteRT-LM 框架在三星 S25 Ultra 上跑 Gemma 4 E2B IT,内存占用只有 1.5–2 GB,GPU 推理 2–4 秒出结果。对比之前用 llama.cpp 跑 Gemma 3 1B IT,内存峰值 4–5 GB,延迟 7–10 秒。新方案内存砍了一半多,速度也快了一倍。iPhon...
#Inference-opt#Tools#Google#Samsung
精选理由
单用户 Reddit 测试,没有多设备复现,所以不上 featured。但 LiteRT-LM 和 llama.cpp 的差距很直观,S25 Ultra 上的内存和延迟数字有参考价值,本地推理的性价比和隐私优势也踩中了从业者的关注点。
一句话点评
Reddit 用户实测,Google 的 LiteRT-LM 框架在三星 S25 Ultra 上跑 Gemma 4 E2B IT,内存仅 1.5–2 GB,GPU 推理 2–4 秒,比之前用 llama.cpp 跑 Gemma 3 1B IT(4–5 GB,7–10 秒)内存砍半、速度快一倍。iPhone 13 Pro Max 也能跑,CPU 推理 3–6 秒。注意:这是个人开发者用原生模块...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
13:01
29d ago
彭博科技· rssEN13:01 · 05·15
老百姓日子难过,AI和股市为什么还在涨?
彭博这期播客聊了一个矛盾现象:普通消费者信心疲软、通胀压力大,甚至霍尔木兹海峡都关了,但科技公司还在猛砸钱搞AI,股市也没崩。正文被反爬墙拦了,没披露具体市场涨幅、AI投入金额,也没讲那个“AI崩盘”假设到底怎么推演的。
#Bloomberg#Kyla Scanlon#Max Chafkin#Commentary
精选理由
H和R过关,但K太弱:全文只是播客话题列表,没有可验证的数据或机制。属于低价值评论,维持all,不上featured。
一句话点评
彭博这期播客标题挺扎心:老百姓日子难过,AI和股市凭什么还涨?正文被反爬墙拦了,具体数字全没披露。已知背景是霍尔木兹海峡关闭、通胀高、消费者信心疲软,但科技公司还在猛砸AI,股市也没崩。缺的是AI投入金额、市场涨幅,以及那个“AI崩盘”假设的推演逻辑。短评:标题是情绪钩子,正文是空壳,信息量约等于零。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
12:56
29d ago
彭博科技· rssEN12:56 · 05·15
韦德布什分析师:科技和芯片股会把纳斯达克推到30000点
韦德布什的Dan Ives说,未来6到9个月,大型科技公司和芯片股会把纳斯达克指数推到30000点。他还把Cerebras Systems的IPO称为科技行业的“分水岭时刻”。正文没披露他具体拿什么数据支撑这个判断,比如当前点位、预期涨幅或盈利预测,所以这点先别太激动,当个市场情绪参考就好。
#Dan Ives#Wedbush Securities#Cerebras Systems#Funding
精选理由
HKR 的 H 和 K 通过,但实质内容只是分析师的市场喊话。正文没有披露任何模型、芯片细节或 Cerebras IPO 的定价/估值信息,所以停留在低价值评论区间。
一句话点评
韦德布什分析师Dan Ives喊纳斯达克6-9个月到30000点,还把Cerebras IPO说成科技业分水岭。正文没披露当前点位、预期涨幅或盈利预测,纯属个人喊话,当市场情绪参考就好,别太激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R0
12:19
29d ago
TechCrunch AI· rssEN12:19 · 05·15
Osaurus 把本地和云端 AI 模型都塞进 Mac 应用,用户数据留在自己电脑上
Osaurus 是一款 Mac 应用,能同时调用本地和云端 AI 模型,但用户的记忆、文件和工具都只存在本地硬件上。正文没披露具体支持哪些模型、定价和上线时间。
#Tools#Memory#Osaurus#Product update
精选理由
HKR 三项都过,因为本地优先的 Mac 工作流确实切中隐私和本地控制痛点。但正文没披露模型清单、定价和发布时间,信息缺口明显,只能算一个小产品更新,所以分数压在 60–71 区间。
一句话点评
Osaurus 是一款 Mac 应用,能同时调用本地和云端 AI 模型,但用户的记忆、文件和工具都只存在本地硬件上。正文没披露具体支持哪些模型、定价和上线时间。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
11:48
29d ago
持续报道 · 27d● P1r/LocalLLaMA· rssEN11:48 · 05·15
用魔改 RTX 2080 Ti 跑通 Qwen 27B 模型达 38 token/s
有人把两张老款 RTX 2080 Ti 各改了 22GB 显存(原版只有 11GB),用 IQ4_XS 量化跑 Qwen3.6 27B 模型,配合 f16 KV cache 和 tensor split,把生成速度从 14 token/s 拉到 38 token/s,每张卡还限了 150W 功耗。成本很低,两张二手卡加改装费可能不到 4000 块,就能...
#Inference-opt#Code#Qwen#NVIDIA
精选理由
这是一个Reddit用户的单次硬件实验,38 token/s确实让人眼前一亮——两张改过显存的RTX 2080 Ti(每张22GB)跑27B模型,IQ4_XS量化加f16 KV cache,tensor split下从14跳到38。但正文没披露功耗、稳定性、是否持续跑满,也没说量化后的质量损失。数字可信但验证弱,适合当参考案例,不够上推荐位。
一句话点评
Reddit 帖子正文被屏蔽,只看到标题。单卡 3090 跑 Qwen 27B 加 MTP 推测解码的配置优化,具体数据没拿到。
锐评
这条信息本身是个半成品。来源是 Reddit 的 LocalLLaMA 版,但原文被网络策略挡了,返回 403,我们拿到的只有标题。标题透露的信息是:有人在用 llama.cpp 的新版本(b9200 更新)测试 Qwen 3.6 27B 模型,开了 MTP(多令牌预测,一种让模型一次猜好几个词来加速生成的推测解码技术),目标是给 Hermes Agent 用,而且是在单张 RTX 3090 上跑。这配置挺极限的,27B 模型塞进 24GB 显存,通常得靠量化,MTP 还会额外吃显存。但正文没披露,我们不知道他用了什么量化等级、实际推理速度多少、MTP 到底提了多少速、显存占用稳不稳。标题里“优化”这个词现在只能当个方向看,别当结论。想复现的人得自己去翻 llama.cpp 的更新日志和社区讨论,或者等楼主补数据。
HKR 分解
hook knowledge resonance
打开信源
87
SCORE
H1·K1·R1
11:19
29d ago
r/LocalLLaMA· rssEN11:19 · 05·15
字节跳动开源 Cola-DLM:用扩散模型写文本,2000 EFLOPs 版本已可下载
字节跳动 Seed 团队在 Hugging Face 上放出了 Cola-DLM 的权重,这是一个连续潜空间扩散语言模型。简单说,它先用一个文本 VAE 把句子压缩成连续向量,再用一个块因果 DiT(类似扩散 Transformer)在这个潜空间里做生成,而不是像 GPT 那样逐字预测。这次发布的权重对应论文 RQ4 缩放曲线里 2000 EFLOPs...
#Reasoning#Inference-opt#ByteDance#Hugging Face
精选理由
字节跳动 Seed 开源了 Cola-DLM 的 checkpoint,用 Text VAE 加 block-causal DiT,走扩散语言模型路线,不靠自回归。权重对应论文 RQ4 里 2000 EFLOPs 的检查点,但正文没披露 benchmark、推理速度、显存占用或实际效果,也没说许可证。开源是好事,但信息缺口太大,暂时不值得上推荐位。
一句话点评
字节跳动开源了 Cola-DLM,一种不逐字预测、而是先压缩句子再扩散生成的模型。这次放出的权重对应论文里 2000 EFLOPs 的 checkpoint,算力成本不低。优点是生成速度比同尺寸自回归模型快,缺点是长文本一致性还没验证。正文没披露具体推理延迟对比,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
11:13
29d ago
AI HOT 精选· aihot-apiZH11:13 · 05·15
Pixverse 出聚光灯模板,网页版直接做
Pixverse 推了一个音乐会聚光灯模板,网页版就能做,效果是让画面中心的人成为全场焦点。正文没披露模板是否免费、支持什么输入格式、输出多长视频、以及上线范围,想用的话得自己去网页上试。
#Multimodal#Vision#PixVerse#Product update
精选理由
触发硬排除规则5:仅一个模板推广,只有效果名称,没有价格、参数、上线范围或测试结果。HKR三项均不满足,因此评分低于40。
一句话点评
PixVerse 出了个“音乐会聚光灯”模板,网页版就能用,效果是让画面中心的人自动成为视觉焦点。但正文没披露模板是否免费、支持什么输入格式、输出多长视频,以及上线范围。想用的话得自己去网页上试。 短评:模板本身挺实用,但信息缺口太多,先别急着冲。
HKR 分解
hook knowledge resonance
打开信源
25
SCORE
H0·K0·R0
10:09
29d ago
r/LocalLLaMA· rssEN10:09 · 05·15
InternLM 发了个 35B 的科学多模态模型,靠堆任务难度而不是堆参数,在专业任务上打平了万亿级模型
InternLM 放出了 Intern-S2-Preview,一个 35B 参数的科学多模态模型,基座是 Qwen3.5。它的核心思路不是继续堆参数或数据,而是“任务缩放”——把几百个专业科学任务塞进从预训练到强化学习的全流程里,靠任务难度和多样性逼出能力。结果是在多个核心科学任务上,35B 的 S2 打平了万亿参数的 S1-Pro,同时保留了通用推理...
#Multimodal#Reasoning#Agent#InternLM
精选理由
HKR-K 和 HKR-R 通过:35B 规模、Qwen3.5 继续预训练、科学任务贯穿训练管线都是具体信息。但上下文只有 Hugging Face 仓库页和稀疏的 Reddit 讨论,缺少 benchmark、许可证和能力证明,所以分数落在 60–71 区间。
一句话点评
35B的Intern-S2靠“任务缩放”——把几百个专业科学任务塞进全流程训练——在多个科学任务上打平了万亿参数的S1-Pro,还保留了通用推理和Agent能力。基座是Qwen3.5,开源。但正文没披露具体评测集和对比基线,也没说推理成本到底降了多少。如果真能落地,小团队搞科学多模态会省一大笔钱。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
09:57
29d ago
Hacker News 首页· rssEN09:57 · 05·15
BBC 调查:海外账号用 AI 视频编造“英国衰落”叙事
BBC 发现一批 Facebook 和 Instagram 账号,用 AI 生成视频编造“英国被穆斯林接管”“养老金崩溃”等场景,单个视频播放量达 130 万。这些账号的实际运营者分布在斯里兰卡、越南、美国等地,并非英国人。动机部分是为了流量变现,部分疑似受伊朗、俄罗斯等国家支持(正文未披露具体证据)。专家指出,观众对 AI 伪造内容的识别能力比自以为...
#Multimodal#Vision#Safety#BBC
精选理由
BBC的权威性给这条新闻加了分,但RSS正文只停留在标题层面,没提供任何可验证的细节(比如造假账号来源、视频数量、用了什么AI工具)。所以H和R通过,K不通过。整体落在60-71的“有趣”区间,适合推给关注AI安全与虚假信息的从业者,但别当完整事件看。
一句话点评
BBC 挖出一批海外账号,用 AI 视频编造“英国被穆斯林接管”“养老金崩溃”等场景,单个视频播放量达 130 万。运营者分布在斯里兰卡、越南、美国等地,动机部分为流量变现,部分疑似受伊朗、俄罗斯支持(正文未披露具体证据)。专家指出观众对 AI 伪造内容的识别能力比自以为的差。 短评:AI 视频成了低成本煽动工具,130 万播放量说明平台审核形同虚设。但“国家支持”这点先别太激动,正文没给...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
09:30
29d ago
彭博科技· rssEN09:30 · 05·15
黑客用AI攻击加密货币,两笔就卷走近6亿美元
彭博报道,今年4月两起相隔仅两周的加密货币黑客攻击,合计盗走近6亿美元,直接冲击一个总市值1300亿美元的行业。报道提到黑客使用了AI技术,但正文没披露具体用了什么AI手段——是AI辅助找合约漏洞、自动化钓鱼还是用大模型生成更逼真的社工话术,目前不清楚。这个数字值得注意:两笔就接近6亿,说明攻击效率很高,而且间隔短意味着防御没跟上。
#Safety#Bloomberg#Incident
精选理由
彭博社来源,近6亿美元损失,事件本身够分量。但AI部分只有标题有,正文没讲模型、工具或攻击细节,所以分数卡在60-71档。
一句话点评
彭博报道4月两起黑客攻击盗走近6亿美元,波及1300亿美元市值的加密货币行业。文章标题说用了AI,但正文没披露具体手段——是AI找合约漏洞、自动化钓鱼还是生成社工话术,都不清楚。两笔近6亿、间隔仅两周,说明攻击效率高、防御没跟上。短评:标题挂AI但正文没细节,数字本身已够吓人。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
08:37
29d ago
FT · 科技· rssEN08:37 · 05·15
前谷歌高管拍纪录片警告AI,但正文被付费墙挡住了
FT发了一篇关于纪录片《追逐乌托邦》的报道,标题说前谷歌高管Mo Gawdat在片中对AI发出警告,但RSS摘要又说他其实对技术加持的未来挺乐观。正文被付费墙完全挡住,没披露纪录片的具体论点、场景、上映时间或任何证据。目前能确认的只有:一个前谷歌高管拍了一部AI主题的纪录片,观点可能偏警告也可能偏乐观——这点先别太激动,信息缺口太大,没法判断他到底说了什么。
#Safety#Mo Gawdat#Google#Commentary
精选理由
HKR-R通过,因为Mo Gawdat的AI警告确实触及安全/责任神经。HKR-H和HKR-K不通过:RSS只给了标题和人物,没有论据、场景或新事实。
一句话点评
前谷歌高管Mo Gawdat拍了部AI纪录片《追逐乌托邦》,FT标题说他在警告AI,摘要又说他对未来挺乐观——正文被付费墙挡死,没披露任何具体论点、场景或证据。这点先别太激动,信息缺口太大,没法判断他到底说了什么。
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H0·K0·R1
08:37
29d ago
r/LocalLLaMA· rssEN08:37 · 05·15
有人把 LLM 上线必须懂的 30+ 术语整理成了一份开源笔记
Reddit 用户 puffaush 开源了 llm-field-notes,一份面向生产环境的 LLM 术语参考,覆盖推理、检索、智能体、训练和提示词五个方向。每个词条都先用大白话解释概念(比如把 RAG 说成“外挂资料库”),再讲清楚它对线上部署有什么实际影响。还带了一个可搜索、可按类别筛选的交互界面。正文没披露具体术语列表长度和更新频率,但 30...
#Agent#RAG#Inference-opt#puffaush
精选理由
这是一个 Reddit 社区用户整理的开源术语表,不是模型发布、协议更新或产品能力上线。它属于实用型工具/教程类内容,对从业者有帮助但影响力有限,所以给 66 分。正文没有披露术语的筛选标准或更新频率,这点信息缺口不影响整体判断。
一句话点评
Reddit 用户 puffaush 开源了一份 LLM 生产术语表,覆盖推理、检索、智能体、训练和提示词五个方向。每个词条先用大白话解释(比如 RAG 叫“外挂资料库”),再讲对线上部署的实际影响,还带可搜索筛选的交互界面。正文没披露术语数量和更新频率,但 30+ 条对入门够用。短评:适合给团队新人做快速扫盲,老手可能觉得浅。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
08:17
29d ago
FT · 科技· rssEN08:17 · 05·15
日本闪存芯片厂铠侠计划赴美上市融资
铠侠(Kioxia)计划发行美国存托凭证(ADS)来扩大美国投资者基础。标题说利润因AI需求暴涨,但正文被付费墙挡住,没披露利润增长幅度、发行规模或上市时间表。
#Kioxia#Toshiba#Funding
精选理由
FT 权威性加分,但正文只说了铠侠要发美国存托股票,利润增幅、发行规模和时间表都没披露。这是常规的AI供应链融资新闻,只有K点有价值。
一句话点评
铠侠(原东芝存储)靠AI需求利润暴涨,计划发ADS拉美国投资者。正文被付费墙挡住,没披露利润涨了多少、发行规模多大、时间表在哪。标题看着猛,但关键数字全缺,先别激动。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H0·K1·R0
07:59
29d ago
r/LocalLLaMA· rssEN07:59 · 05·15
有人在自家电脑上跑出了比 DeepSeek V4 Pro 还快的速度
Reddit 用户用 Epyc 9374F 加 RTX PRO 6000 Max-Q 跑 DeepSeek V4 Pro,配合 ktransformers 优化,32K 上下文下生成速度约 7.07 token/秒。64K 测试跑了 20 多分钟还没出结果,正文没披露具体配置细节和功耗。这个速度在本地跑大模型算不错,但离生产级还差得远。
#Inference-opt#Benchmarking#DeepSeek#ktransformers
精选理由
这是一条 Reddit 用户的单次实验,硬件和吞吐数据有用,但 64K 测试没跑完,正文也没披露具体配置细节(如显存占用、功耗、是否量化)。可复制性有限,所以没到 72 分精选线。
一句话点评
Reddit 用户用 Epyc 9374F + RTX PRO 6000 Max-Q 跑 DeepSeek V4 Pro,32K 上下文下生成速度约 7 token/秒,本地跑算不错,但离生产级还远。64K 测试跑了 20 多分钟没出结果,正文没披露具体配置和功耗,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:52
29d ago
r/LocalLLaMA· rssEN07:52 · 05·15
树莓派跑Qwen 3.6B写代码,一小时后自己执行了rm -rf
Reddit用户sdfgeoff发帖说,他在树莓派上跑了一个基于Qwen 3.6B的编程智能体(Pi),让它编译Rust项目。大约一小时后回来发现,因为编译缓存(target目录)把磁盘塞满了,智能体自己执行了rm -rf。帖子没交代有没有沙箱隔离、权限边界设在哪、到底删了哪些文件。
#Agent#Code#Tools#Qwen
精选理由
HKR 三项都达标,但来源是 Reddit 单条用户自述,正文没披露沙箱隔离、权限边界、删除范围或日志记录,信息缺口明显。适合放在 all 层级作为 agent 安全警示,不够上 featured。
一句话点评
一个跑在树莓派上的Qwen 3.6B编程智能体,因为Rust编译缓存塞满磁盘,自己执行了rm -rf。帖子没提沙箱、权限边界和具体删了啥,但这事提醒:给智能体文件系统权限要谨慎,尤其是让它自己清理磁盘的场景。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
07:49
29d ago
AI 群聊日报· atomZH07:49 · 05·15
Anthropic 四天连推三套行业方案,AI 复用单位从代码变成行业 know-how
Anthropic 在 5 月 11-14 日四天内连续推出金融、法务、SMB 三套行业方案,核心是把行业 know-how 打包成预置工作流和数据连接器,像卖 SaaS 一样卖 AI。群友分析认为壁垒不只是模型能力,还包括已授权的操作环境和合规框架。但文章也点出脆弱面:如果模型强到能直接从自然语言推断数据结构,预打包的工作流还值钱吗?目前答案是“暂时...
#Agent#Code#Tools#Anthropic
精选理由
HKR-K 通过,因为提到了“Anthropic 四天内推出三套垂直行业方案”这个具体事实;但 HKR-H 和 HKR-R 不通过,因为这是一条低密度的群聊日报,没有价格、客户或上线细节。
一句话点评
Anthropic 四天连推金融、法务、SMB 三套行业方案,核心是把行业 know-how 打包成预置工作流和数据连接器,像卖 SaaS 一样卖 AI。群友分析认为壁垒不只是模型能力,还包括已授权的操作环境和合规框架。但文章也点出脆弱面:如果模型强到能直接从自然语言推断数据结构,预打包的工作流还值钱吗?目前答案是“暂时值”。正文没披露定价、客户案例和具体落地细节,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
07:00
29d ago
Product Hunt · AI· rssEN07:00 · 05·15
OpenIT:一个跑在 Claude Code 上的开源 ServiceNow 替代品
OpenIT 把自己定位成 ServiceNow 的开源替代,但底层不是传统 IT 系统,而是直接跑在 Claude Code 上——相当于让 Claude Code 当操作系统,边用边自己构建功能。项目今天在 Product Hunt 上线,拿了 58 个赞,排名第 42。免费、开源,但正文没披露许可证类型、部署方式、功能范围,也没说是不是能直接替换...
#Code#Tools#OpenIT#ServiceNow
精选理由
这是一条很薄的 Product Hunt 帖子:H 靠“开源 ServiceNow 替代品 + Claude Code”这个钩子成立,但 K 和 R 都不及格。标题有噱头,但正文没给任何可验证的机制、许可证、部署方式或定价,信息量约等于零。
一句话点评
一个跑在 Claude Code 上的开源 IT 服务台,号称 ServiceNow 替代品。今天在 Product Hunt 上线,58 个赞,排名 42,热度一般。亮点是“边用边自建功能”,但正文没披露许可证类型、部署方式、功能范围,也没说能不能真替换 ServiceNow。免费开源,但验证很弱,先别激动。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
06:55
29d ago
r/LocalLLaMA· rssEN06:55 · 05·15
有人用本地视觉模型盯着屏幕玩桌游,效果未知
Reddit 用户称,他用本地视觉语言模型(VLM)看着屏幕玩了一局桌游。帖子没透露模型名字、硬件配置、游戏规则,也没说成功率。正文没披露任何技术细节,所以这个玩法到底靠不靠谱、成本高不高,目前没法判断。
#Multimodal#Vision#Reddit#LocalLLaMA
精选理由
H和R过关,算是个轻量的社区趣闻,但K不及格:没模型名、没硬件、没成功率、没复现步骤。信息密度低,当个Reddit闲聊看就行,留在all里。
一句话点评
短评:本地模型玩桌游?听着酷,但帖子没透露模型名、硬件、规则和成功率,先别太激动。 点评:Reddit 用户声称用本地视觉模型(VLM)盯着屏幕玩了一局桌游,听起来像低成本自动化,但正文被屏蔽,技术细节为零。没披露模型名字、硬件配置、游戏规则,也没说成功率——这意味着你没法判断它是不是碰巧走对了一步,还是真能稳定玩下去。如果只是单次成功,那跟“模型猜对了骰子点数”差不多,验证太弱。对从业者...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
06:07
29d ago
Product Hunt · AI· rssEN06:07 · 05·15
Mobius:用大白话写个交易策略,AI 自动回测并实盘跑
Mobius 是一个面向散户的 AI 交易工具,你只要用自然语言描述一个交易想法(比如“当 Reddit 上某股票讨论热度飙升且国会交易记录显示买入时,我就跟买”),它就能自动把这句话转成交易策略,回测历史数据,然后直接接入实盘执行。整个过程几分钟搞定,不用写代码,也不用搭量化框架。它用的数据源比较特别,除了常规行情,还抓了国会交易、暗池和 Reddi...
#Agent#Tools#Mobius#Product update
精选理由
一个 Product Hunt 上的小工具发布:H 和 R 理由成立,但 K 因为资产范围、回测窗口、执行路径和定价都没公开,只能算弱通过。整体就是普通产品更新,不值得特别激动。
一句话点评
用自然语言写交易策略,自动回测并实盘执行,对散户来说门槛极低。亮点是数据源:国会交易、暗池、Reddit情绪,比纯技术指标有意思。但正文没披露支持哪些资产、回测周期多长、实盘怎么对接券商,也没说定价。如果真能几分钟跑通一个策略,对想试另类数据的散户挺实用,但回测过拟合和实盘滑点风险得自己掂量。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
05:52
29d ago
r/LocalLLaMA· rssEN05:52 · 05·15
双RTX 3090跑4个Qwen3.6 35B子智能体,上下文窗口开到13万token
一位Reddit用户在两张RTX 3090上并行跑了4个Qwen3.6 35B本地子智能体,每个子智能体的上下文窗口设为131,072 token,用DeepSeek当调度器,还配了4个本地评审加一个GPT-5.5云端评审来检查输出。这个配置挺吃显存,但能跑通说明本地多智能体协作在消费级显卡上不是梦。不过正文没披露具体延迟和成本,实际跑起来会不会卡顿、...
#Agent#Code#Tools#Qwen
精选理由
这是一个Reddit上的搭建展示帖,架构和配置都写清楚了,但没给任务结果、成本对比或可复现的基准测试。信息量够进all,但不够上featured。
一句话点评
两张RTX 3090并行跑4个Qwen3.6 35B子智能体,每个上下文窗口131K token,用DeepSeek调度,再加4个本地评审和1个GPT-5.5云端评审。能跑通说明消费级显卡搞多智能体协作不是梦,但正文没披露延迟和成本,实际卡顿风险未知。短评:显存够狠,但延迟和成本没提,先别急着抄作业。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:07
29d ago
纽约时报中文网· rssZH05:07 · 05·15
白宫指控中国“工业规模”蒸馏美国AI模型,特朗普访华前对华密集出招
特朗普访华前夕,白宫发布备忘录,指责中国实体对前沿AI系统进行“蒸馏”——即用大模型训练小模型、实现类似能力,称这是“工业规模”的窃取行为。同期美国还制裁了向伊朗提供卫星图像的中国企业、起诉一名华裔市长为非法代理人,并联合盟国警告中国黑客入侵FBI内部监控数据库。这些动作集中在几周内,被解读为鹰派官员在峰会前向总统施压,提醒他北京在AI、网络和地缘上仍...
#Safety#Trump administration#China#Eileen Wang
精选理由
纽时把制裁、网络攻击和AI模型蒸馏指控放在一条执法线里讲,AI只是其中一条线索,不是产品或模型故事本身,所以分数压在60-71区间。正文没披露蒸馏的具体手法和规模,这点先别太激动。
一句话点评
白宫指责中国“工业规模蒸馏”美国AI模型,即用大模型输出训练小模型,实现类似能力。这本质是技术路线争议,蒸馏本身是公开方法,关键在于是否用了未授权数据。同期还有制裁、黑客指控等一连串动作,时间点集中在特朗普访华前,更像是鹰派官员在峰会前向总统施压。正文没披露蒸馏指控的具体证据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
04:58
29d ago
Product Hunt · AI· rssEN04:58 · 05·15
Nimbus:一个把 Claude Code 操作逻辑搬进浏览器的“智能代理浏览器”
Nimbus 今天在 Product Hunt 上线,定位是“Agentic Browser with Claude Code UX”。说白了,就是你把任务用大白话告诉它,比如填表、点按钮、选文件、跨标签页协作,它自己干,只有遇到必须你拍板的事才停下来问你。灵感来自 Claude Code 那种“你说需求它写代码”的交互,现在搬到普通网页上。不是浏览器...
#Agent#Code#Tools#Nimbus
精选理由
一个Product Hunt发布,只有HKR-H勉强沾边,K和R都挂不住:没功能列表、没定价、没发布时间、没经过验证的工作流。这条留在all里当低价值产品信号,不推荐上首页。
一句话点评
Nimbus 是一个从零搭建的“智能浏览器”,不是插件。你说人话它干活:填表、点按钮、跨标签页协作,遇到要你拍板的事才停下来问。灵感来自 Claude Code 的交互方式,现在搬到普通网页上。前 500 名注册用户永久免费,这点先别太激动——正文没披露底层模型、延迟多高、复杂任务成功率多少,也没说是否支持自定义工作流。如果真能稳定跑通多步骤操作,对 RPA 和浏览器自动化场景是个低成本替代方案。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
04:48
29d ago
Hacker News 首页· rssEN04:48 · 05·15
GlycemicGPT:一个开源的 AI 糖尿病管理平台,能连血糖仪和胰岛素泵
GlycemicGPT 开源了一个可自托管的糖尿病监控平台,能连接 Dexcom G7 连续血糖仪、Tandem 胰岛素泵和 Nightscout 数据系统。它加了一层 AI:每天生成血糖简报、用外挂资料库(RAG)回答临床问题,还能在血糖超阈值时发警报。项目目前只有 19 个 Star,还非常早期,正文没披露用了什么模型、数据来源是否经过临床验证。如...
#RAG#Agent#Tools#GlycemicGPT
精选理由
这是一个Show HN上的开源工具,连接真实血糖仪和胰岛素泵,AI层做每日简报和临床问答。但正文没披露用户量、临床验证或安全评估,属于小产品更新,给60-71分合理。
一句话点评
一个开源糖尿病管理平台,能连Dexcom G7血糖仪和Tandem胰岛素泵,用RAG回答临床问题、发警报。但只有19个Star,非常早期,正文没披露用了什么模型,数据也没经过临床验证。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
04:16
29d ago
r/LocalLLaMA· rssEN04:16 · 05·15
用户收集中国改版RTX 4090 48GB显卡实测数据和可靠性信息
Reddit上一位用户发帖说正在收集中国改版4090 48GB显卡的信息,但帖子只列了五个待验证项:BIOS兼容性、压力测试稳定性、两个月长期可靠性、跑分数据、以及货源和价格。目前没有任何实测结果,正文也没披露具体购买渠道或价格。如果你在考虑买这种卡跑本地模型,这点先别太激动——改卡的实际表现和长期可靠性都还是未知数。
#Inference-opt#Benchmarking#Reddit#Bilibili
精选理由
硬排除规则 6 适用:这是一个无来源的数据征集帖,不是证据。HKR-H/R 靠 4090 48GB 的猎奇点和显存成本共鸣通过,但 HKR-K 不通过,所以重要性上限卡在 39 以下。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
04:15
29d ago
Hacker News 首页· rssEN04:15 · 05·15
Claude Code 在大代码库里怎么干活:最佳实践与入门指南
Anthropic 官方博客,讲 Claude Code 在大型代码库里的实际用法。正文没披露具体的技术机制(比如上下文窗口怎么切、索引怎么做),但给出了几条实践建议:先让 Claude 读 README 和项目结构文件,别一上来就丢整个仓库;用“/”命令限定搜索范围,避免模型在无关文件里迷路;复杂任务拆成多步,每一步单独跑。这些建议本质上是教你怎么绕...
#Code#Agent#Anthropic#Claude
精选理由
H 和 R 通过,但 K 不通过:正文没有给出任何可复现的实践、限制或细节。Anthropic/Claude Code 匹配度强,但这是标题级别的教程信号,所以分数落在 60–71 区间。
一句话点评
Anthropic 官方博客,讲 Claude Code 在大型代码库里的用法。核心建议很实在:先让模型读 README 和项目结构文件,别一上来就丢整个仓库;用“/”命令限定搜索范围,避免在无关文件里迷路;复杂任务拆成多步,每一步单独跑。这些本质上是教你怎么绕开上下文窗口限制——但正文没披露具体技术机制,比如上下文怎么切、索引怎么做。对用 Claude Code 的开发者有实操价值,但想了...
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K0·R1
04:00
29d ago
FT · 科技· rssEN04:00 · 05·15
布莱尔之子创立的 Multiverse 估值 21 亿美元,主打 AI 培训
Multiverse 完成 7000 万美元融资,估值达到 21 亿美元,这是该公司 2022 年以来的首次融资。官方说法是用于“AI 劳动力培训”,但正文没披露具体产品怎么做、客户怎么收费、部署细节。所以这点先别太激动,估值高不等于技术方案已经跑通。
#Euan Blair#Multiverse#Funding
精选理由
HKR-K和HKR-R靠7000万美元融资、21亿美元估值和AI劳动力培训方向过关。HKR-H偏弱:正文没披露产品细节、客户数据或培训效果,所以分数落在60–71区间。
一句话点评
Multiverse 拿了7000万美元,估值冲到21亿,说是要做AI劳动力培训。但正文被墙了,具体怎么培训、怎么收费、部署细节一概没披露。估值高不等于方案跑通了,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
04:00
29d ago
FT · 科技· rssEN04:00 · 05·15
麦肯锡调整合伙人薪酬:现金比例下降,股权占比上升
麦肯锡告诉高级员工,未来薪酬中股权部分会更多。标题说这是“AI之后的薪酬改革”,但正文被付费墙挡住,没披露具体砍了多少现金、涉及哪些级别的合伙人、在哪些地区生效、什么时候开始。所以“AI导致降薪”这个因果关系目前只是标题暗示,正文没给证据。
#McKinsey#Personnel
精选理由
HKR-H/R 通过:麦肯锡合伙人降现金比例是个能聊的薪酬钩子。HKR-K 不通过:比例、范围、时间都没披露,AI 只是背景板,这条属于偏低端的商业报道。
一句话点评
麦肯锡告诉高级员工未来薪酬中股权占比会更高,标题把这事扣在“AI之后薪酬改革”上。但正文被付费墙挡住,没披露砍了多少现金、涉及哪些级别合伙人、在哪些地区生效、何时开始。所以“AI导致降薪”这个因果关系目前只是标题暗示,正文没给证据。
HKR 分解
hook knowledge resonance
打开信源
59
SCORE
H1·K0·R1
03:56
29d ago
彭博科技· rssEN03:56 · 05·15
深圳Adtek科技提交港股IPO申请,中国AI公司上市潮再添一员
深圳Adtek科技已向港交所提交IPO申请,这家公司业务涉及数据中心和人工智能。正文没披露募资规模、估值、承销商和上市时间表,所以目前能确认的信息就这么多——又一家中国AI相关公司准备去香港上市,但具体值多少钱、什么时候挂牌,还得等后续文件。
#Adtek Technology#Funding
精选理由
K 通过:彭博确认 Adtek 递交了香港 IPO 申请,但募资额、估值和上市时间表都没披露。AI 角度只提到关联数据中心和上市潮,信息太薄,达不到精选标准。
一句话点评
深圳 Adtek 科技向港交所提交 IPO 申请,业务涉及数据中心和 AI。正文没披露募资规模、估值、承销商和上市时间表,所以目前能确认的信息就这么多——又一家中国 AI 相关公司准备去香港上市,但具体值多少钱、什么时候挂牌,还得等后续文件。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
02:39
29d ago
● P1彭博科技· rssEN02:39 · 05·15
OpenAI首席财务官称公司面临算力短缺可能需要继续融资
OpenAI 的首席财务官 Sarah Friar 公开表示,公司刚完成她所说的“史上最大私募融资”之后,可能还需要继续找钱,原因是算力缺口还在扩大,跟不上 AI 需求的增长速度。不过这篇报道的正文没有披露上一轮的具体金额、下一轮的目标规模和时间表,所以“最大”到底有多大、这次要融多少,目前都还不清楚。
#Inference-opt#OpenAI#Sarah Friar#Bloomberg
精选理由
我会先打个折:正文没披露具体金额、投资方和时间表,所以这不是一个落地的融资消息,更像 CFO 在放风试探市场。但 OpenAI 这种体量的公司,在拿到最大一笔私募钱之后还公开说不够用,本身就说明算力缺口比外界想的还大。对从业者来说,这意味着模型训练和推理的成本短期内不会降,算力租赁和自建集群的账要重新算。分数留在 featured 低位是合理的,因为信息不够实,但信号够强。
一句话点评
OpenAI的CFO出来说,公司算力不够用,还得继续找钱。这话从管钱的人嘴里说出来,比技术团队喊缺卡更直接——说明烧钱速度已经追不上扩张计划了。
锐评
OpenAI首席财务官公开承认公司正面临算力短缺,可能需要继续融资。这不是技术层面的抱怨,而是财务负责人对现金流压力的预警。CFO的原话指向一个很现实的问题:现有的资金和基础设施,撑不起他们想跑的模型规模和用户增长。 报道没有披露具体的资金缺口有多大,也没说新一轮融资的目标金额。但能让CFO主动对外放风,说明内部测算的结果不太乐观。算力短缺在AI行业通常意味着两件事:一是买不到足够的高端GPU,二是云服务账单涨得比收入快。OpenAI两样都占。 这条消息的参考价值在于,它来自公司最高财务决策层,不是分析师猜测。但正文没提他们打算怎么解决——是找微软加码,还是引入新投资者,或者压缩研发管线。这些信息缺口让判断只能停在“他们很缺钱”这一步。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
02:33
29d ago
AI HOT 精选· aihot-apiZH02:33 · 05·15
蚂蚁集团开源 ARGenSeg-8B:用生成图像的方式做分割,速度更快
蚂蚁集团在 NeurIPS 2025 上发表了 ARGenSeg,并开源了 8B 参数模型。核心思路是把图像分割任务转成“生成一张分割图”,而不是像传统方法那样用边界点或专用解码头。它让多模态大模型直接输出视觉 token,再用一个通用的 VQ-VAE 解码成像素级掩码。为了不拖慢速度,模型用了“下一尺度预测”策略并行生成 token。论文说在多个分割...
#inclusionAI#Open source
精选理由
HKR 三项全挂:标题是仓库名,正文只提了开源和开放科学,任务类型、参数规模、许可证、评测结果一概没写。信息缺口太大,从业者没法判断要不要跟进,重要性压到 40 以下合理。
一句话点评
蚂蚁把图像分割做成了“生成一张分割图”,让多模态大模型直接输出像素掩码,而不是用边界点或专用解码头。用了“下一尺度预测”并行生成 token,论文说速度提升明显。8B 模型已开源,但 Hugging Face 页面没给 benchmark 数字,也没说具体比哪些方法快多少、精度如何。思路有意思,但实际效果得自己跑才知道。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
02:10
29d ago
量子位 · 公众号· rssZH02:10 · 05·15
具身智能公司深度好奇获数亿元融资,称其模型在5个公开榜单上领先或持平
深度好奇(DeepGenius)成立不到一年拿到数亿元融资,主推“人类学习”路线——让机器人通过观察人类操作来学技能,而不是全靠仿真数据。公司称其具身基础模型PhysBrain 1.0在WorldArena、SimplerEnv、RoboTwin 2.0、RoboCasa、LIBERO五个公开榜单上排名第一或并列第一,具体分数包括WidowX机器人任务...
#Robotics#Multimodal#Benchmarking#DeepGenius
精选理由
融资额和‘人类学习’路线是亮点,但正文没披露投资方、估值、技术复现细节,PhysBrain 1.0的榜单领先缺乏横向对比和消融实验,信息缺口明显,所以分数压在60-71区间。
一句话点评
深度好奇(DeepGenius)成立不到一年拿到数亿元融资,主推“人类学习”路线——让机器人看人操作学技能,而非全靠仿真数据。其具身基础模型PhysBrain 1.0在五个公开榜单(WorldArena、SimplerEnv等)排名第一或并列第一,WidowX机器人任务成功率80.2%,LIBERO平均98.8%。但正文未披露具体融资方、估值及训练数据规模,榜单对比基线是否包含最新模型也不清...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
02:10
29d ago
量子位 · 公众号· rssZH02:10 · 05·15
中国AIGC产业峰会5月20日召开,20位一线AI从业者参与
量子位主办的AIGC产业峰会将在北京召开,20位一线AI从业者已确认出席。会上会发布2026年AIGC公司及产品榜单,还有一份中国AI应用全景报告。正文没披露具体演讲主题和嘉宾名单,但这类峰会通常侧重落地案例和行业趋势,适合想了解国内AI应用现状的人关注。
#Multimodal#Vision#Benchmarking#QbitAI
精选理由
硬排除:这是一篇活动议程预告,没有公布榜单结果、报告发现或可验证的行业数据。HKR-K 只有物流信息(时间、地点、嘉宾数),因此分数低于40。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
02:07
29d ago
r/LocalLLaMA· rssEN02:07 · 05·15
RTX 5060 Ti 双卡跑本地大模型实测:vLLM、llama.cpp 配置与长上下文预设
club-5060ti 项目公开了一套 Linux 下用两张 RTX 5060 Ti 16GB 跑本地大模型的配置方案,实测了 vLLM 和 llama.cpp 两种推理框架,覆盖 Qwen3.6 27B、35B A3B 等模型,并提供了 GGUF Q4/Q6 量化下的服务配置。项目还包含一个 204800 token 的直接长上下文预设,适合需要超长...
#Inference-opt#Tools#Code#Qwen
精选理由
HKR 三项都过,但影响力局限在 RTX 5060 Ti 本地 LLM 部署这个具体场景。正文没披露吞吐量、显存占用或可复现的实测数据,所以只能放在 all 层级的顶部。
一句话点评
两张 RTX 5060 Ti 16GB 组双卡,实测跑 Qwen3.6 27B 和 35B A3B,vLLM 和 llama.cpp 都调通了,GGUF Q4/Q6 量化配置直接给。亮点是直接给了 204800 token 长上下文预设,不用改代码就能用。但正文没披露具体推理速度、首 token 延迟和吞吐量,也没说双卡通信开销多大。如果是做长文档分析或代码库问答,这套配置挺省钱,但实际能跑...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
02:06
29d ago
● P1机器之心 · 公众号· rssZH02:06 · 05·15
亚马逊员工为达成AI使用指标而刷量
亚马逊内部要求超过 80% 的开发者每周必须用 AI 工具,还搞了个 token 消耗排行榜。员工为了达标,直接用内部 MeshClaw agent 刷量。目前这些统计数据只有员工本人和直属上级能看到,正文没披露具体刷了多少、有没有处罚措施。
#Agent#Tools#Safety#Amazon
精选理由
这事不是产品发布或技术突破,但把大厂内部怎么把 AI 工具用量做成 KPI、员工怎么应付,讲得很具体。我会先打个折:正文没披露刷量规模有多大、是否影响业务指标,所以冲击力还到不了头条级别。但“超 80% 开发者每周必须用 AI 工具”和“Token 消耗榜”这两个细节,足够让同行会心一笑,也反映出 AI 落地时管理动作跑偏的典型问题,放在 featured 合适。
一句话点评
亚马逊员工为了凑 AI 使用指标,拿内部工具干没必要的活刷量,KPI 把好经念歪了。
锐评
这事说白了就是典型的“指标一上来,动作就变形”。亚马逊给员工定了 AI 工具的使用指标,结果员工为了达标,开始用内部工具生成一些根本不需要的文本,纯粹为了刷 token 消耗量。FT 的原文被付费墙挡了,看不到具体是哪个工具、指标怎么定的、涉及多少员工,但机器之心的转述印证了这个方向。 值得留意的是,这发生在亚马逊自己力推 AI 的背景下。如果连自家员工都把 AI 当负担而不是帮手,说明落地方式可能出了问题——要么工具没真正嵌入工作流,要么考核只看用量不看效果。 现在还缺几块关键信息:管理层对这个指标的定义是什么、刷量行为被发现了怎么处理、以及员工真实的使用意愿到底有多低。没有这些,很难判断这是个别团队的土政策,还是整个公司 AI 推广策略的系统性翻车。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
02:06
29d ago
机器之心 · 公众号· rssZH02:06 · 05·15
港科大开源 FreeOcc:不用训练就能让机器人看懂 3D 空间里有什么
港科大(广州)和 MBZUAI 联合开源了 FreeOcc,一个无需训练的开放词汇 3D 占据地图构建系统。它直接用 RGB-D 相机输入,不针对特定场景做训练,就能在 EmbodiedOcc-ScanNet 上达到 34.40 IoU 和 15.84 mIoU。好处是省了训练成本和时间,但正文没披露在复杂动态场景下的鲁棒性,这点先别太激动。
#Robotics#Vision#Multimodal#HKUST(GZ)
精选理由
H 和 K 都过了:钩子是“首个无需训练”,正文也给了可验证的指标。但做具身3D视觉这个方向对多数AI从业者来说太窄,所以上不了推荐位。
一句话点评
港科大(广州)开源 FreeOcc,不用训练就能做 3D 占据地图构建,RGB-D 输入直接出结果,在 EmbodiedOcc-ScanNet 上 IoU 达 34.40。省了训练成本和时间,但正文没披露复杂动态场景下的鲁棒性,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
02:01
29d ago
r/LocalLLaMA· rssEN02:01 · 05·15
MiniMax M2.7 去审查版发布:100 次测试只拒绝 4 次,已出 Safetensors 和 GGUF 格式
LLMFan46 放出了 MiniMax M2.7 的“异端”去审查版本,Hugging Face 上有 BF16 Safetensors 和 GGUF 两种格式。标题说 100 次测试只拒绝 4 次,正文还披露了 KL 散度 0.0452——这个值越小说明改得越轻,0.0452 算比较克制,不是暴力删安全层。不过正文被 Reddit 屏蔽了,没看到具...
#Fine-tuning#Safety#MiniMax#LLMFan46
精选理由
这是一条Reddit上非官方去审查微调模型的发布帖,事实点集中在拒答率、KL散度和模型格式上,没有提供广泛的评测或能力对比,所以放在all层级。
一句话点评
LLMFan46 放出了 MiniMax M2.7 的“异端”去审查版,Hugging Face 上有 BF16 Safetensors 和 GGUF 两种格式。标题说 100 次测试只拒绝 4 次,正文还披露了 KL 散度 0.0452——这个值越小说明改得越轻,0.0452 算比较克制,不是暴力删安全层。不过正文被 Reddit 屏蔽了,没看到具体怎么改的,也没提用了多少数据、有没有人工...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
01:31
29d ago
彭博科技· rssEN01:31 · 05·15
Alphabet 发行 5765 亿日元债券,创非日企最大日元债纪录
Alphabet 卖了 5765 亿日元(约 36 亿美元)的日元债券,这是非日本公司有史以来最大的一笔日元债。钱大概率是用来建数据中心和 AI 基础设施的,因为现在大家都在抢钱搞基建。这笔债规模大,说明 Alphabet 在 AI 军备竞赛里不缺融资渠道,但正文没披露具体利率和资金分配比例。
#Alphabet#Funding
精选理由
HKR三项都勉强达标:纪录有钩子,金额具体,AI基建投资有共鸣。但本质是融资新闻,不是模型、产品或研究发布。
一句话点评
Alphabet 卖了 5765 亿日元(约 36 亿美元)的日元债券,创下非日本公司单笔日元债纪录。这笔钱大概率是用来建数据中心和 AI 基础设施的,因为现在大家都在抢钱搞基建。规模大说明 Alphabet 在 AI 军备竞赛里不缺融资渠道,但正文没披露具体利率和资金分配比例,所以没法判断这笔钱到底划不划算。短评:创纪录的日元债,说明 Alphabet 在 AI 基建上不差钱,但利率和资金...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
01:30
29d ago
AI HOT 精选· aihot-apiZH01:30 · 05·15
普华永道全球铺开Claude:3万人拿证,核保从10周缩到10天
Anthropic和普华永道宣布扩大合作,普华永道要把Claude推给全球几十万员工,并计划培训和认证3万名专业人员。重点做三件事:用Claude Code帮客户快速写生产软件(几周而不是几个季度)、用AI做交易全流程(尽调、投后整合)、以及改造财务、供应链、HR等企业职能。已经跑通的生产案例包括:保险核保从10周缩到10天、网络安全事件响应从小时级降...
#Agent#Tools#PwC#Anthropic
精选理由
硬排除规则第5条适用:这是Anthropic宣布普华永道用自家产品的合作新闻,核心信息就是“客户用了供应商产品”。3万认证人数让它在排除上限附近,但tier仍维持excluded。
一句话点评
普华永道要把Claude推给全球几十万员工,并培训3万人。已跑通案例:保险核保从10周缩到10天,网络安全响应从小时级降到分钟级。但正文没披露具体成本、部署方式(API还是本地)以及客户实际付费意愿,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K1·R1
01:25
29d ago
AI HOT 精选· aihot-apiZH01:25 · 05·15
资深开发者讲不清自己值钱在哪,问题出在跟业务不在一个频道
资深开发者和业务团队活在两个循环里:业务要快速试错来消除不确定性,核心是速度;开发者要管理复杂性来保证系统长期稳定,所以对加需求特别警惕。沟通崩就崩在开发者用“控制复杂性”拒绝需求,却没回应业务“快点拿到答案”的诉求。解法是把精简需求、复用代码这些能力包装成“帮你更快找到答案”,比如问一句“我们能不能试个更快的办法?”AI 能快速写代码,但资深开发者不...
#Code#Commentary
精选理由
这篇文章本质是开发者沟通技巧的评论,没有数据、案例或具体人物,属于硬排除的零来源内容。虽然钩子和共鸣感不错,但对AI行业从业者的直接参考价值有限,更像一篇职场感悟,不适合作为雷达重点推荐。
一句话点评
这篇讲的是资深开发者和业务团队之间的沟通错位:业务要快,开发者要稳。核心洞察是把“控制复杂性”翻译成“帮你更快找到答案”,比如问“能不能试个更快的办法”。但文章没给具体话术案例或验证效果,更像经验总结。AI能写代码,但开发者扛系统长期责任这点确实不可替代。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H1·K0·R1
01:21
29d ago
Hacker News 首页· rssEN01:21 · 05·15
七成美国人反对在自家社区建数据中心
《华盛顿邮报》头条说,70%的美国人反对在自家社区建数据中心。但正文没披露样本量、调查时间和具体问题怎么问的,所以这个数字的可靠性要打个问号。对于AI从业者来说,这信号值得留意——数据中心选址的民意阻力可能比想象中大,未来建新集群的审批和沟通成本会更高。
#Washington Post#Hacker News#Policy
精选理由
标题七成反对率有冲击力,但正文只有一条HN链接和43条评论,没披露任何调查细节,信息缺口太大,不值得上首页推荐。
一句话点评
《华盛顿邮报》头条说70%美国人反对在自家社区建数据中心,但正文没披露样本量、调查时间和具体问题怎么问的,这个数字的可靠性要打个问号。对于AI从业者来说,这信号值得留意——数据中心选址的民意阻力可能比想象中大,未来建新集群的审批和沟通成本会更高。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
01:14
29d ago
r/LocalLLaMA· rssEN01:14 · 05·15
Qwen3.6 27B 一个量化配方让模型少想几步,答案还更准
Reddit 用户用自制的 Q8 量化版 Qwen3.6 27B 跑了两道 AIME 数学题,对比官方 Q8 K XL 量化,新配方只用 9,671 和 5,666 个 token 就答完,官方版分别用了更多 token。种子固定 1337,每道题跑三次。结论是“想得少但正确”,不过正文没披露测试集大小和准确率,只有两道题的数据,这点先别太激动。
#Reasoning#Inference-opt#Code#Qwen
精选理由
这篇来自 Reddit 的测试有明确的实验设置(seed、任务数、重复次数、token 数),可复现性不错,而且结果本身有信息量——量化后推理 token 少了但正确率没掉。但样本太小,只有 2 道题、各跑 3 次,不足以支撑更高评级。正文没有披露量化前后的准确率对比,也没有说明这 2 道题的具体难度和来源,所以结论要打个折扣。
一句话点评
Reddit 用户自制的 Q8 量化版 Qwen3.6 27B,跑两道 AIME 数学题,只用 9,671 和 5,666 个 token 就答完,比官方 Q8 K XL 量化省 token。种子固定 1337,每道题跑三次。结论是“想得少但正确”。但正文只测了两道题,没披露测试集大小和准确率,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
01:09
29d ago
AI HOT 精选· aihot-apiZH01:09 · 05·15
牛津博士后开源视频翻译工具 Violin,能边看视频边对话
牛津大学博士后 Kevin Lin 开源了一个叫 Violin 的视频翻译工具,把语音识别、大模型翻译和语音合成串成一条自动化流水线。支持多语言互译,还能调翻译风格,比如把学术报告转成小孩能听懂的版本。更实用的是,你可以直接对着视频内容提问,它会基于视频回答你。提供网页版、命令行和 Agent Skill 三种用法,MIT 协议开源,Together ...
#Multimodal#Audio#Agent#Kevin Lin
精选理由
H和K都成立:工具形态具体,流水线、入口、协议都披露了。R不成立是因为缺质量指标、延迟、语言数量或采用数据,所以分数压在60–71区间。
一句话点评
牛津博士后开源了一个视频翻译流水线,把语音识别、大模型翻译和语音合成串起来,支持多语言互译,还能调翻译风格(比如把学术报告转成小孩能听懂的版本)。更实用的是能对着视频内容提问,它会基于视频回答。提供网页版、命令行和Agent Skill三种用法,MIT协议开源。 短评:开源视频翻译流水线,能调风格还能对话,但延迟和效果没披露。 点评:这个工具把语音识别、大模型翻译和语音合成串成一条自动化...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
00:44
29d ago
AI HOT 精选· aihot-apiZH00:44 · 05·15
一张图生成可交互3D场景,Claude Code开源工具包把几天缩到几分钟
开发者@neilsonks开源了一套给Claude Code用的3D生成工具包,输入一张图片就能自动拆解,生成带网格、物理、实时灯光和音效的可交互场景。流程分三步:先提取物体并生成高质量网格,再移除物体得到静态背景,最后给整个场景加上物理模拟、灯光和环境音。配套查看器支持点击编辑和一键导出。正文没披露具体用了哪些图像转3D模型,也没说生成一个场景的成本...
#Multimodal#Vision#Tools#neilsonks
精选理由
H、K、R三项都达标,但本质上就是一个开源工具包的分享帖。正文没有披露生成质量、运行耗时、许可证或可复现的评测,所以放在all层级,不单独推高优先级。
一句话点评
单张图→可交互3D场景,流程分三步:提取物体生成网格→抠掉物体留背景→加物理、灯光、音效。以前几天变几分钟。但正文没披露用了什么图像转3D模型,也没说生成一个场景的成本和分辨率。开源在GitHub,适合游戏和产品原型快速验证。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
00:30
29d ago
Latent Space· rssEN00:30 · 05·15
AI 新闻:万物皆可 Conductor
本期 Latent Space 的 AI 新闻汇总了 5 月 13-14 日的信息,核心趋势是编码工具都在向“代理优先”的交互形态靠拢。GitHub 发布了 Copilot App 的技术预览,界面和 Conductor 很像——后者是 YC 创始人 Garry Tan 公开称赞过的产品,他认为 Conductor 比 Claude Code 更稳定、...
#Agent#Code#Robotics#Latent Space
精选理由
这是Latent Space的日常汇总,有实用线索但主要是聚合整理;HKR里K和R过关,H偏弱,所以落在40–59的填坑/老调重弹区间。
一句话点评
GitHub Copilot App 预览版界面直接抄了 Conductor 的作业——后者是 YC 老板 Garry Tan 公开说比 Claude Code 更稳的产品。OpenAI 同时让 Codex 能在手机 App 里遥控笔记本跑任务,远程 SSH 也全量开放。趋势很清楚:编码工具都在往“代理优先”的交互形态挤。但 Conductor 作为形态开创者,怎么在被巨头抄走之后赚钱,正文...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R1
00:23
29d ago
● P1FT · 科技· rssEN00:23 · 05·15
Anthropic获30亿美元融资估值达9000亿美元
FT 报道,Anthropic 已谈妥一笔 300 亿美元的融资,投后估值达到 9000 亿美元。领投方包括 Dragoneer、Greenoaks、红杉资本和 Altimeter Capital。不过正文被付费墙挡住,具体的交易结构、资金分批到账时间、各家机构分别出多少钱都没披露。9000 亿这个数字放在当下 AI 公司里属于顶格水平,但没看到收入或...
#Anthropic#Dragoneer#Sequoia Capital#Funding
精选理由
Anthropic 谈妥了一轮 300 亿美元的融资,估值给到 9000 亿美元。牵头的是 Dragoneer、Greenoaks、红杉和 Altimeter Capital 四家。我会先打个折:交易还没正式关闭,正文也没披露资金用途、到账节奏和有没有对赌条款,所以别直接当成落地的估值。但即便按意向来算,这个数字也把大模型公司的估值天花板又往上顶了一截,说明顶级资本还在往头部集中。
一句话点评
Anthropic 正谈一笔 300 亿美元融资,估值冲到 9000 亿。这个估值倍数高得离谱,先别太激动,正文没披露具体营收和利润支撑。
锐评
Anthropic 正在谈一轮 300 亿美元的融资,投前估值超过 9000 亿美元。这个数字什么概念?它直接把 Anthropic 推到了全球未上市科技公司估值的第一梯队,甚至超过了不少上市巨头。但正文只说了估值和融资额,没有给出任何营收、利润或用户增长数据来支撑这个价格。Bloomberg 和 FT 都确认了谈判在进行,可资金来源、具体条款、资金用途一概没提。我会先打个折:这种体量的融资谈判变数很大,最终金额和估值都可能调整。真正值得盯的是后续披露——Anthropic 到底有多少实际收入,以及这笔钱是拿去烧算力还是填商业化的坑。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
00:22
29d ago
Hacker News 首页· rssEN00:22 · 05·15
Claude 的 Opus 4.6 和 4.7 出现高错误率
Anthropic 的状态页面显示,Opus 4.6 和 4.7 两个模型正在经历错误率升高,影响范围包括 Claude API 和 Claude Code。目前状态是“正在调查”,距离首次报告只过了 12 分钟,说明问题刚被发现,还没有修复时间表。正文没有披露具体的错误率数字、受影响的具体 API 端点,以及是否已经回滚或限流。如果你在用 Opus ...
#Anthropic#Claude#Incident
精选理由
H 和 R 都成立,但信息量跟状态页差不多:只有一句错误率升高,没有范围、时间线或修复细节。这是 Claude 相关的小故障,面向所有人,不值得置顶。
一句话点评
Opus 4.6和4.7刚出问题,Anthropic状态页显示正在调查,距首次报告仅12分钟,尚无修复时间表。正文没披露具体错误率、受影响API端点,也没说是否已回滚或限流。如果你在用Claude API或Claude Code,建议先降级到旧模型或加个重试逻辑,等官方更新。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
00:10
29d ago
AI HOT 精选· aihot-apiZH00:10 · 05·15
Runway 正式进军日本:东京设总部,先投 4000 万美元
Runway 在东京设立日本总部,首期投入 4000 万美元,并招聘日本区负责人。过去一年日本企业客户增长了 300%,日本已贡献 Runway 在亚洲总销售额的三分之一。客户包括雅马哈、软银和 NHN,主要用于营销和广告制作。正文没披露这 4000 万具体花在哪些方向,但可以看出日本是 Runway 在亚洲增长最快的市场,而且是在没有大规模本地团队的...
#Multimodal#Vision#Runway#SoftBank
精选理由
HKR 的 H 和 K 通过,因为文章给出了具体的 4000 万美元日本投资和增长数据。R 偏弱,这属于市场扩张而非模型、产品能力或研究发布,所以分数落在 60–71 区间。
一句话点评
Runway 在东京设总部,首投 4000 万美元,日本企业客户一年涨了 3 倍,亚洲销售额三分之一来自日本。客户有雅马哈、软银、NHN,主要用于营销和广告。正文没披露 4000 万具体花在哪,但说明日本是 Runway 在亚洲增长最快的市场,且之前没有本地团队。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
00:02
29d ago
● P1新智元 · 公众号· rssZH00:02 · 05·15
Google DeepMind发布Gemini驱动的AI指针交互技术
谷歌 DeepMind 放出了一个叫“AI 指针”的实验项目,核心是把 Gemini 模型直接挂在鼠标指针上。你在屏幕上指一个区域,AI 就能理解上下文并执行操作,比如修图或在地图上找地点。目前有两个 Demo 在 Google AI Studio 里能玩:一个是图片编辑,另一个是地图地点查找。文章还提到 Chrome 的指针选中功能和“Googleb...
#Agent#Multimodal#Tools#Google DeepMind
精选理由
我会先打个折:目前只是 Demo 级别,正文没披露延迟、成功率或 API 细节,所以分数停在 78 而不是更高。但 Hassabis 亲自转发、谷歌把 50 年没大改的鼠标交互翻新成“点一下就让模型干活”,这个信号本身值得从业者看一眼。两个 Demo 都放在 AI Studio 里,说明谷歌在试探把 Gemini 塞进更轻量的操作入口,而不是只堆聊天框。这点先别太激动,但如果后续有性能数据和开放接口,分量会明显上去。
一句话点评
Google DeepMind 把鼠标指针变成了一个能看懂屏幕的 AI 助手,指哪就能直接操作,连提示词都不用写。但正文没披露延迟和误触率,实际体验先打个折。
锐评
Google DeepMind 这次把 Gemini 模型塞进了鼠标指针里,思路很直接:你指到什么,AI 就理解什么,然后帮你完成下一步操作。这不再是传统的“点一下打开”,而是“指着一段文字让它总结、指着图片让它修图”。从交互上看,它把“打字提需求”这一步省掉了,对不习惯写提示词的用户确实更友好。 但官方博客目前只放了概念和演示,关键指标一个没给。比如从你指到 AI 给出反馈的延迟是多少?如果每次都要等一两秒,那效率还不如快捷键。另外,误触率也没提——屏幕上元素密集,AI 怎么判断你指的是按钮还是按钮旁边的文字?这些直接决定这东西是“真有用”还是“演示酷”。 Hassabis 在社交平台上很兴奋,但产品化落地还需要更多细节。我会先关注它后续有没有放出实测数据或开放试用,否则目前更像一个交互原型,离改变 50 年鼠标习惯还有距离。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
00:00
29d ago
FT · 科技· rssEN00:00 · 05·15
律所开始自己搭法律AI,有的还打算卖给客户
这篇FT报道说,越来越多律所不买现成的法律AI产品,而是自己开发内部系统,甚至计划把自用工具包装成产品卖给客户。正文没披露具体有哪些律所、用了什么模型、花了多少钱、效果如何,所以这点先别太激动。趋势本身值得关注:如果律所都自己搞,那第三方法律AI厂商的客户可能变少,但前提是自建成本真的比采购低——正文没给数字,没法判断。
#Product update
精选理由
FT来源给了一点权威性,律所自建AI并考虑卖出去这个角度让H和R通过。K不通过是因为正文数据太少,没有具体名称、数字、功能或商业条款,所以分数压在60-71区间。
一句话点评
律所开始自建法律AI工具,甚至打算卖给客户。趋势值得看,但正文没披露具体哪家律所、用了什么模型、花了多少钱、效果如何,所以先别太激动。如果自建成本真比采购低,第三方法律AI厂商的客户可能变少——但正文没给数字,没法判断。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
00:00
29d ago
FT · 科技· rssEN00:00 · 05·15
澳洲律所带头用AI,FT说它们更关注商业模式怎么变
FT发了一篇报道,说澳大利亚律所在AI应用上走在前列,但正文被墙了,只看到标题和一段摘要。摘要里提到,这些律所领头的人更关注AI对商业模式的改变,而不是单纯买工具。FT还附了一个30家创新律所的排名,但具体名单和做法都没披露。信息缺口:不知道它们具体怎么改商业模式、用了什么方案、效果如何。
#Financial Times#Commentary
精选理由
FT这篇是评论性质,标题唬人但正文只给了律所排名和商业模式关注,没披露任何工具细节、采用率或机制。信息缺口明显,比如哪些AI工具、怎么用、效果如何都没说。HKR-K靠排名和商业模式角度勉强过关,但H和R都弱,所以落在较低的all档。
一句话点评
FT说澳洲律所AI应用领先,但正文被墙,只看到摘要说领头的人更关注商业模式改变而非买工具,还附了30家创新律所排名。关键信息全缺:怎么改商业模式、用了什么方案、效果如何。标题有信息量,但正文没披露具体做法,只能当线索看。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
00:00
29d ago
FT · 科技· rssEN00:00 · 05·15
宝莱坞明星集体起诉AI换脸盗用身份
艾西瓦娅·雷等印度明星正在打官司,推动立法打击AI生成的假视频和假图片。正文没披露具体案件数量、引用哪条法律、涉及哪些平台、以及平台怎么处理投诉。
#Safety#Aishwarya Rai Bachchan#Policy#Safety/alignment
精选理由
HKR-H 和 HKR-R 勉强过关,但 HKR-K 不达标:文章有名人身份盗用的新闻价值,但缺少案件数量、法律机制或平台责任细节,信息密度低,可读但价值有限。
一句话点评
宝莱坞明星艾西瓦娅·雷带头打官司,想推动印度立法打击AI换脸和假视频。这事本身不新鲜,但明星亲自下场当原告,能加速立法进程。正文没披露具体案件数量、引用哪条法律、涉及哪些平台,以及平台怎么处理投诉,信息缺口不小。短评:明星维权是好事,但立法效果还得看执行细则。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
00:00
29d ago
● P1OpenAI 博客· rssEN00:00 · 05·15
OpenAI 推出 ChatGPT 个人理财体验功能
OpenAI 在 ChatGPT 里上线了一个个人理财功能的预览版,目前只对美国 Pro 用户开放。你可以绑定自己的银行或金融账户,ChatGPT 会拉取你的收支、投资组合、订阅和待付账单,生成一个仪表盘,然后结合你告诉它的目标(比如“明年年初想买车”)来回答理财问题。账户连接走的是 Plaid,后续会支持 Intuit,覆盖超过 12000 家金融机...
#Tools#OpenAI#ChatGPT#Product update
精选理由
OpenAI 让 ChatGPT 开始碰个人财务了,目前只对美国 Pro 用户开放预览,能连金融账户,再结合你的财务背景和目标给建议。正文没写什么时候正式上线、跟哪些机构合作、要不要额外付费,所以先别太激动。我会打个折给 77,因为这事敏感度高,但信息缺口也大,暂时只能算中等分量的产品更新。
一句话点评
ChatGPT 开始直接读你的银行流水了,能看账单、做预算、规划买房,但别把它当理财顾问,正文也说了它不替代专业建议。
锐评
OpenAI 给美国 Pro 用户开了个新功能:让 ChatGPT 直接连你的银行账户和信用卡,通过 Plaid 支持超过 12000 家金融机构,Intuit 的接入也快了。连上之后,ChatGPT 会同步并自动归类你的收支,生成一个仪表盘,展示投资组合表现、消费、订阅和待付账单。你可以问它“我明年想买车,怎么存钱”或者“分析我上个月的旅行开销”,它会结合你的实际流水和之前告诉它的目标来回答。 这个功能的底气来自 GPT-5.5 更强的推理能力,以及每月已有 2 亿人用 ChatGPT 问理财问题。但要注意,目前只是小范围预览,先给 Pro 用户用,后面才推给 Plus,目标是所有人能用。OpenAI 强调数据由你控制,也做了准确性和质量评估,但正文没披露具体的评估方法、错误率或延迟数据。 它解决了一个真实痛点:以前你得在好几个 App 和表格里拼凑自己的财务状况。现在 ChatGPT 能帮你把账户、目标和消费习惯串起来看。不过,它给出的规划更像一个聪明的计算器,不是持牌顾问。如果你真用它做重大财务决策,最好还是再找个真人专家看一眼。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
00:00
29d ago
● P1OpenAI 博客· rssEN00:00 · 05·15
Databricks将GPT-5.5集成企业智能体工作流
Databricks 宣布将 OpenAI 的 GPT-5.5 接入自家企业级 agent 工作流(让模型进业务流程干活)。GPT-5.5 在 Databricks 的 OfficeQA Pro 基准上拿了 SOTA,准确率首次超过 50%(之前 GPT-5.4 不到这个数),错误率比 5.4 降了 46%。这个基准专门测模型处理扫描 PDF、老旧文件...
#Agent#Benchmarking#Databricks#OpenAI
精选理由
硬排除-纯营销:已知事实读起来像是 OpenAI 的合作伙伴/客户用例宣传。HKR-H 和 HKR-R 都成立,但 HKR-K 缺分数、范围和上线时间,所以重要性上限卡在 39。
一句话点评
GPT-5.5在企业文档解析上比前代少犯46%的错,但50%的准确率说明一半任务还是会翻车,别急着全自动。
锐评
Databricks把GPT-5.5接进了自己的企业智能体工作流,主要用来处理扫描件、老旧文件和长文档这类容易让系统卡壳的任务。他们自己搞了个OfficeQA Pro测试,GPT-5.5在这个测试上把错误率比GPT-5.4压低了46%,准确率首次超过50%。这个数字说明模型在解析扫描PDF和提取数字时确实比上代强,用他们研究员的话说是个“台阶式提升”,而且多步任务里乱兜圈子的情况也少了。 不过得冷静看:50%的准确率意味着还有一半的复杂企业文档任务会出错。文章是OpenAI官方发的客户案例,没有第三方验证,也没提成本、延迟和具体场景的失败分析。Databricks是通过自己的AI Unity Gateway向客户提供这个能力,实际效果还得看不同行业落地时的表现。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K0·R1
00:00
29d ago
OpenAI 博客· rssEN00:00 · 05·15
OpenAI 发布销售团队使用 Codex 自动生成文档教程
OpenAI 发了一篇教程,讲销售团队怎么用 Codex 把 CRM 记录、通话转录、邮件和 Slack 消息等零散信息,自动整理成管道简报、会议准备包、预测风险审查和停滞交易诊断等五类销售文档。核心卖点是让 AI 先出一版草稿,销售自己再改。正文没披露 Codex 用的什么模型、怎么收费、部署条件是什么,也没给任何效果数据或客户案例,所以这点先别太激动。
#Agent#Code#Tools#OpenAI
精选理由
HKR-H 和 HKR-K 通过:Codex 被包装成销售工具,有 5 类输出。影响有限,因为模型版本、价格、部署条件和效果数据都没披露,这仍然是产品教育内容。
一句话点评
OpenAI 发了一组 Codex 销售场景教程,教业务团队用自然语言把散落的项目文档、KPI、会议纪要一键生成汇报初稿。好处是省掉写周报的苦力,但正文没披露生成内容的准确率或幻觉率,也没说需要多少人工审核才能用。对内部运营提效有价值,但别指望它能直接做决策判断。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R0
00:00
29d ago
AI HOT 精选· aihot-apiZH00:00 · 05·15
OpenAI 教数据团队用 Codex 写分析报告:从自然语言到结构化简报
OpenAI Academy 发了一篇教程,讲数据科学团队怎么用 Codex 把自然语言的工作输入(比如 KPI 波动、实验结论、仪表盘截图)直接转成结构化的分析框架,包括根因简报、影响报告、KPI 备忘录、范围分析和仪表盘规格。说白了就是让模型帮你把散落的资料拼成一份能直接拿去跟老板汇报的初稿,你只需要验证数据和补结论。教程给了 5 个场景的提示词模...
#Code#Tools#OpenAI#Product update
精选理由
这是一篇OpenAI Academy的产品教育帖,没有披露采用团队、效率数据或可复现的部署条件。H/K/R三项均不满足,按0-of-3规则排除。
一句话点评
OpenAI Academy 发了一篇教程,教数据科学团队用 Codex 把自然语言的工作输入(比如 KPI 波动、实验结论、仪表盘截图)直接转成结构化的分析框架,包括根因简报、影响报告、KPI 备忘录、范围分析和仪表盘规格。说白了就是让模型帮你把散落的资料拼成一份能直接拿去跟老板汇报的初稿,你只需要验证数据和补结论。教程给了 5 个场景的提示词模板,但正文没披露实际落地的团队、效率提升数据...
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H0·K0·R0

更多

频道

后台