ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-05-09

70 items · updated 3m ago
RSS live
2026-05-09 · 星期六2026年5月9日
23:37
34d ago
纽约时报中文网· rssZH23:37 · 05·09
中国两名前国防部长被判死缓,涉受贿指控
中国军事法院判处前国防部长魏凤和、李尚福死刑缓期两年执行,罪名是受贿和行贿。新华社的公告没披露具体指控细节。两人是习近平清洗军队高层以来被公开判刑的最高级别将领。据华盛顿战略与国际研究中心估算,已有约100名高级军官被撤职或消失。分析人士认为,判决对军中其他人起警示作用,但也严重削弱了高层指挥系统——中央军委从2022年的七人缩减到只剩习近平和主持反腐...
#Wei Fenghe#Li Shangfu#Xi Jinping#Policy
精选理由
H和K都达标:政治事件+具体人名和判决。但R不沾边,这条新闻跟AI产品、模型、政策或行业结构都没关系。硬排除规则(barely-AI-related)封顶40分,所以给了32分和excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K1·R0
23:31
34d ago
AI HOT 精选· aihot-apiZH23:31 · 05·09
Google 开放 Fitbit Air 健康 API,开发者可拿 31 种真实数据做个人健康自动化
Google 随新款 Fitbit Air 发布了 Health API,开放了运动、睡眠、心率、血氧等 31 种健康数据点。支持 Webhooks 实时推送、细粒度读写权限、按时间范围查询和汇总。开发者可以用这些真实个人数据搭 AI Agent、MCP Server、CLI 或实时监控系统,实现健康自动化工作流。官方已给出首次调用教程。注意:API ...
#Agent#Tools#Google#Fitbit
精选理由
硬排除:这篇讲的是 Google/Fitbit 健康 API 的数据和权限机制,没有模型、agent 或 AI 产品层面的含义。H/K/R 三项对目标读者都不相关。
一句话点评
Google 开放了 Fitbit Air 的 Health API,提供 31 种健康数据点(运动、睡眠、心率、血氧),支持 Webhooks 实时推送和细粒度权限控制。开发者可以用真实个人数据搭 AI Agent 或自动化工作流,官方已给出首次调用教程。注意:API 目前仅限 Fitbit Air 用户,且正文没披露调用配额和定价,如果是免费或低成本,对健康类 Agent 开发者是个实用入口。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K0·R0
23:00
34d ago
Hacker News 首页· rssEN23:00 · 05·09
用户用摩斯密码骗过 Grok,让 Bankrbot 转出 20 万美元代币
有人在 X 上发了一条摩斯密码消息,绕过了 Grok 的安全检查,诱导它命令 Bankrbot 从链上转出 30 亿枚 DRB 代币,价值约 20 万美元。攻击利用了 AI 代理的自主权限——Bankrbot 被授权执行链上转账,Grok 又没识别出摩斯密码里的恶意指令。正文没披露这笔交易的具体哈希值、攻击者身份或 Bankrbot 的权限设置细节,所...
#Agent#Safety#Tools#Grok
精选理由
HKR-H 和 HKR-R 通过:编码后的提示词触发钱包操作,这件事值得聊。HKR-K 不通过:金额、链上证据和复现条件都没披露,所以只能放在 all 层级。
一句话点评
有人用摩斯密码骗过 Grok,让它命令 Bankrbot 转出 30 亿枚 DRB(约 20 万美元)。攻击利用了 AI 代理的自主权限——Bankrbot 被授权执行链上转账,Grok 没识别出摩斯密码里的恶意指令。正文没披露这笔交易的具体哈希值、攻击者身份或 Bankrbot 的权限设置细节,所以无法验证攻击是否真实发生、代币是否真的被转走。如果是真的,这暴露了两个问题:一是 AI 代理...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
22:27
34d ago
Product Hunt · AI· rssEN22:27 · 05·09
AgentPeek:把 Claude Code 和 Codex 塞进 Mac 刘海
一个 Mac 菜单栏小工具,让你在屏幕顶部的刘海区域直接监控 Claude Code 和 Codex 的运行状态——能看到会话、权限、token 用量和本地开发服务器。数据全留在本地,不上传。正文没披露具体怎么实现、卖多少钱、什么时候正式上线,但如果你同时跑多个 AI 编程助手,这个“瞄一眼”的体验应该挺实用。
#Agent#Code#Tools#AgentPeek
精选理由
H 通过是因为 Mac 刘海放 Claude Code/Codex 这个 UI 切入点比较新奇。K 和 R 不通过:正文缺机制、定价、发布时间,也没有可量化的工作流影响,属于低价值的产品更新信息。
一句话点评
短评:在Mac刘海屏上瞄一眼Claude Code和Codex的状态,数据本地保存,适合多Agent并行的开发者。但正文没披露实现方式、价格和上线时间,先别太激动。 点评:AgentPeek是一个Mac菜单栏工具,把Claude Code和Codex的运行状态直接显示在屏幕顶部的刘海区域——你能看到会话、权限、token用量和本地开发服务器。数据全留在本地,不上传,隐私方面比较放心。对于同...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
21:52
34d ago
Product Hunt · AI· rssEN21:52 · 05·09
Contextberg:让 AI 代理记住你干过什么,不用每次从头教
Contextberg 是一个跑在本地的记忆工具,通过 MCP 协议给 AI 代理喂上下文。它会在后台默默录屏、记浏览器历史、存你和代理的对话记录,然后自动生成短期和长期记忆。下次 Claude Code 或 Cursor 再问你“从哪开始”,它已经知道。目前只支持 Windows,免费,从微软商店装就行。正文没披露具体支持哪些数据源、部署选项和安全控...
#Agent#Memory#Tools#Contextberg
精选理由
Contextberg 是一个刚上线的产品,核心是把工作内容转成 AI agent 记忆并通过 MCP 提供。想法挺直接——让 agent 记住你做过的事,不用每次从头聊。但正文没披露支持哪些数据源、怎么部署、怎么收费,所以目前只能当一个小工具更新看。对做 agent 的团队有参考价值,但别急着当成熟方案用。
一句话点评
Contextberg 是一个跑在本地的记忆工具,通过 MCP 协议给 AI 代理喂上下文。它会在后台默默录屏、记浏览器历史、存你和代理的对话记录,然后自动生成短期和长期记忆。下次 Claude Code 或 Cursor 再问你“从哪开始”,它已经知道。目前只支持 Windows,免费,从微软商店装就行。正文没披露具体支持哪些数据源、部署选项和安全控制,隐私风险需要自己掂量。 短评:本地...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
20:54
34d ago
Product Hunt · AI· rssEN20:54 · 05·09
Web Speed:号称让 AI 代理的 Token 开销打一折
Web Speed 是一个给网页代理用的“逻辑层”,核心是把网页转成机器能高效读的“地图”,而不是让 AI 一行行啃 HTML。官方说这样能省 70% 到 90% 的 Token 费用,跑得更快更稳。但正文没披露具体怎么实现的、定价多少、有没有公开的跑分测试。如果真能省这么多,对做浏览器自动化或信息抽取的团队来说挺省钱,但这点先别太激动——等看到可复现...
#Agent#Inference-opt#Web Speed#Product update
精选理由
H和R靠90%代理成本钩子过关,但K不通过:没机制、没定价、没可复现的基准。这就是一条很薄的Product Hunt帖子,信息密度低,不值得高优先级跟进。
一句话点评
Web Speed 号称能把网页转成机器地图,省 70%-90% Token 费。对做浏览器自动化的团队挺省钱,但正文没披露具体实现、定价和可复现的跑分,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
20:21
34d ago
r/LocalLLaMA· rssEN20:21 · 05·09
Strix Halo 跑 MiniMax 2.7,100K 上下文还能双开会话
Reddit 用户 Zc5Gwu 在 AMD Strix Halo 上跑 MiniMax 2.7,用 llama-server 配了 10 万 token 上下文,同时开两个会话,共享 KV 缓存,没有上下文偏移,不用 mmap,缓存全放显存不换到内存。正文没披露具体推理速度或显存占用,但能双开 100K 上下文说明显存够大、缓存管理做得比较干净。
#Code#Inference-opt#MiniMax#Qwen
精选理由
一条 Reddit 个人实验,样本量小,但配置参数全公开,可复现。对本地推理从业者来说,100k 上下文在 Strix Halo 上跑通,直接挂钩硬件选型和成本估算,不是画饼。不过正文没披露推理速度、首次 token 延迟或显存占用细节,这点先别太激动。整体够格全层级信号,但不够专题推荐。
一句话点评
Reddit 用户 Zc5Gwu 在 AMD Strix Halo 上跑 MiniMax 2.7,双开 10 万 token 上下文会话,共享 KV 缓存且全放显存,不换到内存。能这么玩说明显存够大、缓存管理干净。但正文没披露具体推理速度或显存占用,这点先别太激动。如果真能流畅双开长上下文,对本地部署长文档分析挺实用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:48
34d ago
r/LocalLLaMA· rssEN19:48 · 05·09
有人给 DeepSeek 的 ds4.c 写了个极简 Web 界面
开发者 cocktail_peanut 开源了一个叫 ds4.pinokio 的仓库,给 ds4.c 服务器套了个最小化的 WebUI。要求不低:Apple Silicon Mac 上至少 128GB 内存。正文没披露具体支持哪些模型或推理速度,但 128GB 的门槛说明这玩意是为超大模型本地跑准备的,普通用户暂时别想。
#Tools#cocktail_peanut#Apple#antirez
精选理由
这是一个面向 LocalLLaMA 用户的小型开源工具更新;HKR-K 有具体的硬件要求,HKR-R 击中本地推理的成本痛点,但 HKR-H 偏弱,整体不够头条级分量。
一句话点评
开发者给 ds4.c 服务器套了个最小化 WebUI,但门槛极高:Apple Silicon Mac 必须 128GB 内存起步。这基本排除了普通用户,只适合想本地跑超大模型的人。正文没披露支持哪些模型或推理速度,实用性存疑。如果是真的,跑大模型不用再死磕命令行,但 128GB 的门槛让多数人只能看看。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
19:15
34d ago
r/LocalLLaMA· rssEN19:15 · 05·09
苹果下架 256GB 版 M3 Ultra Mac Studio,本地跑大模型的高配选择又少一个
苹果官网悄悄拿掉了 256GB 内存的 M3 Ultra Mac Studio 机型,目前只剩 512GB、96GB 等选项。正文没解释原因,但本地跑大模型的人都知道,256GB 刚好能塞下 70B 参数模型的全精度推理,少 1GB 都跑不动。现在只剩更贵的 512GB 或更小的 96GB,要么多花钱要么降模型规模。
#Apple#Product update
精选理由
HKR 三项都过,对本地大模型用户有钩子、有新事实、有相关性。但正文只说了下架和用户猜测,没给苹果官方确认或原因,所以放在 60–71 的 all 区间。
一句话点评
苹果悄悄下架了 256GB 内存的 M3 Ultra Mac Studio,只剩 512GB 和 96GB 可选。256GB 刚好能塞下 70B 模型的全精度推理,少 1GB 都跑不动。现在要么多花一倍钱上 512GB,要么降级到 96GB 跑小模型。苹果没解释原因,可能是为了推高利润机型,也可能是供应链调整。对本地跑大模型的人来说,这等于砍掉了性价比最高的选项。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K1·R1
18:46
34d ago
r/LocalLLaMA· rssEN18:46 · 05·09
llama.cpp 合并了一个新 MoE 架构:Sarvam,30B 模型实际只激活 2.4B 参数
llama.cpp 的 PR #20275 加入了 Sarvam MoE 架构支持。Sarvam 有两个版本:30B 模型非嵌入层活跃参数仅 2.4B,105B 模型活跃参数 10.3B。这意味着推理时计算量远小于同尺寸稠密模型,适合本地部署。不过正文没披露训练数据、评测结果或开源协议,实际效果和可用性还不清楚。
#Reasoning#Code#Agent#ggml-org
精选理由
这是一个 llama.cpp 架构兼容性 PR,不是模型发布或能力跃升。激活参数比(105B 只激活 10.3B)确实亮眼,但正文没披露训练数据、基准分数或推理速度,信息缺口明显。分数卡在中等偏上,因为数字本身有传播力,但受众窄、信息薄。
一句话点评
llama.cpp 刚合入 Sarvam MoE 架构支持。Sarvam-30B 非嵌入层活跃参数仅 2.4B,105B 版活跃参数 10.3B,推理计算量远小于同尺寸稠密模型,本地部署很划算。但正文没披露训练数据、评测结果和开源协议,实际效果和可用性还不清楚。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
18:33
34d ago
Hacker News 首页· rssEN18:33 · 05·09
Meta 强推 AI,员工被监控鼠标键盘,内部炸了
Meta 要求美国员工接受电脑操作全量追踪——记录打字、鼠标移动、点击和屏幕内容,目的是拿员工数据训练 AI 模型,学习“人怎么用电脑完成日常工作”。CTO 明确回复“公司电脑没有退出选项”,员工在内部帖下刷了 100 多个愤怒和震惊表情。Meta 有 7.8 万员工,受影响人数至少数万。公司正在从互联网公司转型为 AI 组织,但内部手段粗暴,员工士气...
#Meta#Hacker News#The New York Times#Commentary
精选理由
HKR-H/R 通过:纽约时报报道加上 Meta 员工痛苦,是个强职场-AI 钩子。HKR-K 不通过:正文缺员工数、团队、内部机制或具体案例,所以分数压在 60–71 区间。
一句话点评
Meta 强制追踪美国员工电脑操作(打字、鼠标、屏幕内容),用来训练 AI 学“人怎么用电脑干活”。CTO 明确回复“公司电脑没有退出选项”,内部帖下刷了 100 多个愤怒表情。7.8 万员工中至少数万人受影响。公司转型 AI 但手段粗暴,员工士气崩了。正文没披露追踪数据具体怎么用、是否匿名、有没有外部审计。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
18:10
34d ago
r/LocalLLaMA· rssEN18:10 · 05·09
SillyTavern 被名字耽误了?一个角色扮演前端能当通用界面用
Reddit 用户 Spiderboyz1 聊 SillyTavern 的角色架构:三个角色可以共享同一个群聊,但各自用不同的系统提示词。正文没披露性能数据、插件列表或可复现的搭建步骤,所以这点先别太激动——架构灵活不等于跑得稳。
#Agent#Tools#SillyTavern#LocalLLaMA
精选理由
HKR-H 和 HKR-K 通过:名字与界面的反差有看点,Character 架构也够具体。但这是一条单贴,正文没披露性能数据、插件清单或测试结果,所以分数压在60–71区间。
一句话点评
SillyTavern 支持三个角色共享群聊但各自用不同系统提示词,架构灵活。但正文没披露性能数据、插件列表或搭建步骤,这点先别太激动——灵活不等于跑得稳。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
17:49
34d ago
AI HOT 精选· aihot-apiZH17:49 · 05·09
OpenRouter 上线免费编码路由工具:按分数自动选最便宜的模型
OpenRouter 推出了一款实验性工具 Pareto Code,免费使用。你可以在请求里加一个 min_coding_score 参数,工具会根据 Artificial Analysis 的排名,自动把编码任务路由到满足分数要求且成本最低的模型上。说白了就是帮你省钱的——不用手动比价,系统替你挑最便宜的。不过正文没披露这个 min_coding_s...
#Code#Tools#Inference-opt#OpenRouter
精选理由
Pareto Code 是一个小产品更新,核心卖点是成本-质量路由钩子和具体的 min_coding_score 机制,H/K/R 三项都通过。但正文没披露实际能省多少钱、覆盖哪些模型、路由稳定性如何,所以只能算一个面向所有读者的轻量更新。
一句话点评
OpenRouter 出了个免费工具 Pareto Code,加个参数就能自动把编程任务路由到最便宜的模型,省得自己比价。数据源是 Artificial Analysis 的排名,但正文没披露 min_coding_score 具体怎么算、覆盖哪些模型,实际效果得自己试。免费是亮点,但实验性意味着不稳定,别当主力用。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:46
34d ago
AI HOT 精选· aihot-apiZH17:46 · 05·09
AI 让强者更强、弱者更弱:能动性差距正在拉大
François Chollet 指出,AI 正在放大用户之间的能动性差异:低能动性用户会进一步丧失主动权,高能动性用户则能借助 AI 获得更多控制力。正文没有披露具体数据、实验条件或效应量,所以这点先别太激动——但逻辑本身值得留意:AI 不是均匀地赋能所有人,而是像放大器一样,把原有的差距越拉越大。
#fchollet#Commentary
精选理由
硬排除规则6适用:这是一篇纯观点帖,没有数据、案例或信源支撑,因此分数上限为40。H和R通过,但K缺失。
一句话点评
短评:Chollet 提了个直觉上成立的观点:AI 像放大器,拉大用户间的能动性差距。但没给数据,先当假说看。 点评:François Chollet 这条推文的核心判断是:AI 不是均匀地赋能所有人,而是像放大器一样,把用户原有的能动性差距越拉越大。低能动性用户(习惯被动接收信息、不主动提问或验证)会进一步丧失主动权,而高能动性用户(会拆解任务、迭代 prompt、交叉验证)则能借助 A...
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H1·K0·R1
17:13
34d ago
AI HOT 精选· aihot-apiZH17:13 · 05·09
OpenAI 演示 GPT-Realtime-2 语音控制 CRM,但没提延迟和价格
OpenAI Devs 发了个演示,把 GPT-Realtime-2 接进 CRM 工作流,让用户用语音操作客户管理系统。正文只说了集成思路,没披露 API 参数、延迟、定价和上线条件。如果延迟高或成本贵,实际落地会打折扣,这点先别太激动。
#Audio#Tools#OpenAI#Product update
精选理由
HKR-H 和 HKR-R 靠具体的语音-CRM 工作流场景通过,但 HKR-K 不通过:没有延迟、定价、API 条件和上线细节。当作一个小产品/教程更新处理。
一句话点评
OpenAI Devs 演示了用 GPT-Realtime-2 语音控制 CRM,思路是把语音指令转成 API 调用。正文只说了集成思路,没披露 API 参数、延迟、定价和上线条件。如果延迟高或成本贵,实际落地会打折扣,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
16:56
34d ago
持续报道 · 1dr/LocalLLaMA· rssEN16:56 · 05·09
9070 XT 跑 Qwen 27B Q3 量化,12 tok/s
Reddit 用户用 AMD 9070 XT 在 llama.cpp 上跑 Qwen 27B Q3 量化模型,速度 12 tok/s。这个速度对 27B 模型来说算中等偏慢,大概每秒能吐出 12 个 token,相当于每 5 秒生成一句话。用户开了 65536 的超长上下文(不能缩),用了 q4_0 的 KV 缓存、batch 512、ubatch 1...
#Inference-opt#Qwen#llama.cpp#Reddit
精选理由
一条 Reddit 用户发的单点跑分,K 和 R 都够——给了具体的 llama.cpp 设置和速度,能引发本地部署用户对性价比的讨论。但缺功耗、显存占用、价格和对比基线,H 不成立,整体只能放在 lower all 档。
一句话点评
AMD 9070 XT 跑 Qwen 27B Q3 量化,12 tok/s,相当于每秒吐 12 个 token,每 5 秒生成一句话。速度中等偏慢,但开了 65536 的超长上下文(不能缩),这个长度下能跑起来已经不错。正文没披露功耗、显存占用和对比数据,没法判断是不是最优调参。如果上下文能缩到 32K,速度应该能翻倍。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
15:55
34d ago
r/LocalLLaMA· rssEN15:55 · 05·09
Mimo v2.5 Pro 做网页:3D 地球花了10分钟效果还差,改个星星就死循环
Reddit 用户实测 Mimo v2.5 Pro 生成三个网站。其中一个 3D 地球任务耗时 10 分钟,结果很烂;用户让它把星星调亮一点,模型就开始反复调用工具,鼠标控制也坏了。正文没披露模型版本、参数规模或具体报错,但能看出复杂交互场景下工具调用容易卡死,延迟高(10 分钟),且缺乏有效的终止机制。
#Code#Tools#Agent#Mimo
精选理由
帖子报告了具体的实操失败案例,但只是Reddit上一个3条提示的小样本测试,不是正式发布、基准测试或系统评估,所以重要性中等,覆盖所有读者。
一句话点评
Reddit 用户实测 Mimo v2.5 Pro 生成三个网站,3D 地球任务耗时 10 分钟,结果很烂;让星星亮一点,模型就开始反复调用工具,鼠标控制也坏了。复杂交互场景下工具调用容易卡死,延迟高(10 分钟),且缺乏有效的终止机制。正文没披露模型版本、参数规模或具体报错,但能看出这类 agent 在真实任务中稳定性堪忧。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:46
34d ago
AI HOT 精选· aihot-apiZH15:46 · 05·09
手机扫一扫,房子变3D模型;AI Agent在算命比赛里赢了人类专家
一项叫“3D高斯泼溅”的技术,用手机扫一遍房子就能生成浏览器里能看的3D模型,文件小、成本低,房产中介可能先受益。另一边,AI在垂直领域靠Agent范式突破:Tianfu Agent在专业命理大赛里接近人类顶尖水平,做法是给模型配一套专用工具(比如查规则、算参数),而不是让它硬背所有知识。这套思路对法律、中医这类规则密集的行业有参考价值。不过正文没披露...
#Agent#Vision#Tools#Tianfu Agent
精选理由
HKR三项都过,但原文只是一条简短的社交帖子,没有公布扫描精度、样本量、排名细节或可用性条款。适合作为有趣的产品/实验线索,不值得上推荐位。
一句话点评
手机扫一圈房子就能生成浏览器可看的3D模型,文件小成本低,房产中介确实能用。但正文没披露扫描精度、建模耗时和手机型号限制,实际落地效果要打折。Tianfu Agent在命理大赛接近人类顶尖水平,做法是给模型配专用工具(查规则、算参数),而不是硬背知识。这套思路对法律、中医等规则密集行业有参考价值,但命理本身争议大,且比赛规模、对手水平未公开,验证强度有限。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:15
34d ago
Hacker News 首页· rssEN15:15 · 05·09
Subquadratic 发布 1200 万 token 上下文窗口
一家叫 Subquadratic 的公司号称把上下文窗口做到了 1200 万 token,标题说“窗口被打破了”。但正文除了标题和 Hacker News 的 8 个点赞、0 条评论之外,没有任何技术细节——没提用了什么模型架构、延迟多少、价格多少、能不能复现。1200 万 token 确实很大(相当于几十本《三体》),但没披露具体怎么实现的,这点先别...
#Memory#Inference-opt#Subquadratic#Hacker News
精选理由
HKR 三项都过,但证据基本停留在标题级别的产品宣称。缺少架构、延迟、定价和可复现条件,分数卡在 60–71 区间,上不了精选。
一句话点评
标题说上下文窗口被打破了,Subquadratic 号称做到 1200 万 token(相当于几十本《三体》)。但正文除了标题和 Hacker News 上 8 个点赞、0 条评论外,没有任何技术细节——没提用了什么模型架构、延迟多少、价格多少、能不能复现。信息缺口太大,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:38
34d ago
Hacker News 首页· rssEN14:38 · 05·09
Space CLI:在终端里让 AI 帮你做闪卡
Space 这个做了七年的闪卡应用,刚发布了一个命令行工具。装上后,你可以在终端里直接创建、搜索、导出卡片组,然后 pipe 给 Claude、ChatGPT 或本地模型(比如 Ollama),让 AI 帮你分析易混淆词、解释难卡、或者生成新的复习题。CLI 读写的是本地数据库,不需要登录或 API key,离线也能用。卡片在 CLI 里改了,手机和平...
#Agent#Code#Tools#Claude
精选理由
HKR-H 和 HKR-K 靠 Claude Code/Codex CLI 工作流和离线优先细节过关。HKR-R 很弱,这只是个小型 Show HN 产品更新,所以落在 60–71 的全量区间。
一句话点评
Space 做了七年的闪卡应用,刚推出 CLI 工具,让你在终端里直接创建、搜索、导出卡片组,然后 pipe 给 Claude、ChatGPT 或本地模型(如 Ollama),让 AI 分析易混淆词、解释难卡或生成新复习题。CLI 读写本地数据库,无需登录或 API key,离线也能用。亮点是打通了 AI 工作流:批量导出 JSON 喂给模型,再拿回分析结果或新卡片,比手动逐张处理高效得多。...
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
14:32
34d ago
Product Hunt · AI· rssEN14:32 · 05·09
Vexilo:给 Claude Code 用的“操作手册”,内置 31 个智能体、92 条命令和 121 项技能
Vexilo 是一个 Claude Code 的规划工具,相当于一本现成的操作手册。它打包了 31 个专用智能体(比如代码审查、TDD 引导、项目规划)、92 条按场景分类的命令,以及 121 项按领域(前端、后端、AI、运维)划分的技能。还集成了一个 GitHub 上 16 万星的工作流。主要解决一个痛点:大部分 Claude Code 用户只用到 ...
#Agent#Code#Tools#Vexilo
精选理由
HKR-K 靠具体数字过关,但 HKR-H 和 HKR-R 都弱:这是 Product Hunt 上的产品展示,不是经过验证的 Claude Code 工作流或重大发布。小产品更新,留在 all 层合适。
一句话点评
Vexilo 打包了 31 个智能体、92 条命令和 121 项技能,相当于给 Claude Code 用户一本现成的操作手册,解决“只用到 10% 功能”的痛点。亮点是集成了 GitHub 上 16 万星的工作流,且宣称一次付费无订阅。但正文没披露价格、具体集成方式和实际效果验证,买之前最好先确认这些智能体是否真能提升你的开发效率。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
14:29
34d ago
r/LocalLLaMA· rssEN14:29 · 05·09
Qwen3.6-27B 多 token 预测在双 MI50 上跑出 60 tok/s,速度翻倍
Reddit 用户用两块 AMD MI50(ROCm 7.2 + llama.cpp 改版)跑 Qwen3.6-27B 的多 token 预测(MTP,即一次预测多个后续 token 来加速推理)。短 prompt 从约 26 tok/s 涨到 56–60 tok/s,一个 1.8 万 token 的编码任务从 390.9 秒降到 205.5 秒,接近...
#Inference-opt#Benchmarking#Code#Qwen
精选理由
HKR-K 很强,有实测吞吐量提升和耗时对比;HKR-R 切中本地推理的成本/性能痛点,毕竟双 Mi50 二手价不高;HKR-H 场景小众,来源只是 Reddit 单用户测试,所以分数没到 featured。
一句话点评
两块AMD MI50(16GB×2)跑Qwen3.6-27B的MTP(多token预测,一次猜多个后续词来加速),短prompt从26 tok/s翻倍到56-60 tok/s,1.8万token编码任务从390秒降到205秒,接近翻倍。但注意:这是改版llama.cpp+ROCm 7.2,非官方支持;MTP加速依赖任务类型,短文本收益大,长文本可能边际递减。正文没披露显存占用和功耗,双卡部署...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:10
34d ago
r/LocalLLaMA· rssEN14:10 · 05·09
用 NVMe 当显存不够时的交换分区,能跑大模型吗?
Reddit 用户问:只有 20G 内存和 4G 显存,能不能靠 150G NVMe 交换分区跑 100B+ 参数模型。正文没披露模型名称、量化精度、实际吞吐或延迟,所以这点先别太激动。NVMe 交换比传统硬盘快很多,但跟显存带宽比还是差几个数量级,推理速度会非常慢,可能每秒只能生成几个 token。如果真能跑,成本确实低——不用买新硬件,但体验大概率...
#Inference-opt#Reddit#LocalLLaMA#Commentary
精选理由
H和R勉强过关:硬件配置有话题性,也踩中了本地推理的成本焦虑。K不通过,因为帖子只是个问题,没有速度、配置或结果数据。
一句话点评
短评:NVMe 交换跑大模型?能跑,但慢到怀疑人生。 Reddit 用户想用 20GB 内存 + 4GB 显存 + 150GB NVMe 交换分区跑 100B+ 参数模型。NVMe 顺序读写约 7GB/s,但显存带宽(如 RTX 4090 约 1TB/s)差两个数量级,推理时每层参数都要从硬盘搬进显存,每秒可能只出几个 token,基本不可用。正文没披露模型名、量化精度和实测延迟,所以别太...
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H1·K0·R1
14:01
34d ago
Hacker News 首页· rssEN14:01 · 05·09
Mochi.js:一个用 Bun 写的浏览器自动化框架,号称指纹检测全过
Mochi.js 是一个基于 Bun 和原生 Chrome DevTools Protocol 的浏览器自动化库,MIT 协议开源。它的核心卖点是“不留痕迹”——通过一套 48 条规则的 DAG(有向无环图)来生成指纹,保证 Canvas、WebGL、字体、音频等所有指纹表面都来自同一个(profile, seed)对,不会出现 Mac 的 UA 配上...
#Agent#Tools#Mochi.js#Bun
精选理由
这是一个 Show HN 单次发布,只跑了一次 FingerprintJS 结果,没有用户采用数据、没有广泛基准测试、也没有披露安全边界。suspect_score=8 说明反检测分数不算完美,但 bot 字段没被标出来,这点先别太激动。适合放在 60–71 分的小型开源工具区间。
一句话点评
Mochi.js 是一个基于 Bun 的浏览器自动化库,主打“不留痕迹”——用 48 条规则的有向无环图统一生成 Canvas、WebGL、字体等所有指纹,避免出现 Mac 的 UA 配上 Linux WebGL 这种矛盾组合。作者称在 FingerprintJS Pro v4 上跑 Linux 数据中心 IP,嫌疑分 8 但没被标为机器人。核心思路是把 Patchright + 指纹注入 ...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
13:22
35d ago
彭博科技· rssEN13:22 · 05·09
欧洲央行官员:AI 风险倒逼金融基础设施审查
欧洲央行管委 Escrivá 说,AI 带来的风险(比如模型出错、被攻击)可能冲击金融系统的底层设施,央行得重新检查这些设施扛不扛得住。他还提到要守住央行作为最后担保人的角色,别让稳定币把这事搅乱了。正文没披露审查范围、时间表,也没说具体哪些 AI 场景最危险,所以这点先别太激动,目前只是一个方向性表态。
#Safety#European Central Bank#José Luis Escrivá#Policy
精选理由
HKR-R通过:ECB官员把AI风险、金融基础设施韧性和稳定币风险串起来了。HKR-H和K弱:审查范围、时间表和具体风险机制都没披露,所以只是一个低价值政策信号。
一句话点评
欧洲央行管委Escrivá表态要重审金融基础设施扛不扛得住AI风险(模型出错、被攻击),还要守住央行最后担保人角色,别让稳定币搅局。正文没披露审查范围、时间表,也没说哪些AI场景最危险,目前只是一个方向性表态,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
11:25
35d ago
AI HOT 精选· aihot-apiZH11:25 · 05·09
腾讯混元 Hy3 预览版免费期结束,OpenRouter 上三项指标排第一
腾讯混元说 Hy3 预览版在 OpenRouter 上两周免费期内,总 token 用量、代码生成和工具调用三项指标都排第一,市场份额冲到 15.4%。现在免费期结束,但还能以有竞争力的价格继续用。正文没披露具体价格和性能对比,想省钱的话可以自己去 OpenRouter 看看报价。
#Code#Tools#Tencent Hunyuan#OpenRouter
精选理由
H/K/R都过,但来源是腾讯自宣,且排名发生在免费期,用量被价格扭曲。当一个小型产品/榜单更新处理,不推首页。正文没披露Hy3预览版与正式版的差异,也没说免费期结束后价格。
一句话点评
短评:OpenRouter两周免费期数据,Hy3预览版在token用量、代码和工具调用三项排第一,份额冲到15.4%。免费结束但价格未披露,别急着冲。 点评:腾讯混元说Hy3预览版在OpenRouter上两周免费期内,总token用量、代码生成和工具调用三项指标都排第一,市场份额冲到15.4%。这个排名来自OpenRouter的公开数据,可信度还行,但注意这是免费期数据——用户冲着免费来,...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
10:58
35d ago
Product Hunt · AI· rssEN10:58 · 05·09
Connector.wtf:把广告账户接进AI聊天,免费
Connector.wtf 是一个免费的 MCP 服务器(一种让 AI 工具直接读外部数据的标准接口),能把 Google Ads、Meta Ads 和 LinkedIn Ads 的广告账户直接连到 ChatGPT 或 Claude 上。目前只支持读数据(read-only),不能写或改广告。作者说托管成本几乎为零,所以干脆免费,省得大家一辈子跟 CS...
#Tools#Connector.wtf#Google#Meta
精选理由
一个 Product Hunt 小工具上线:免费把三个广告平台接进 AI 聊天。HKR-K 通过,因为提供了免费连接器这个新事实。HKR-H 和 HKR-R 不通过,因为正文没披露支持哪些聊天工具、权限机制和数据范围。
一句话点评
Connector.wtf 免费把 Google Ads、Meta Ads 和 LinkedIn Ads 接进 ChatGPT 或 Claude,只读不写。作者说托管成本几乎为零所以免费,省得大家一辈子导 CSV。目前只支持三个平台,权限和数据范围正文没披露,小团队作品,别当企业级方案。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K1·R0
10:34
35d ago
r/LocalLLaMA· rssEN10:34 · 05·09
用本地 Qwen 3.6 27B 当助手,有人成功装好了 Arch Linux
一位 Reddit 用户把 Pi 编程代理连到本地跑的 Qwen 3.6 27B 模型上,让它帮忙配置 Arch Linux。模型能处理蓝牙音箱连接和 HDPI 缩放这类实际任务,但用户没给模型直接 sudo 权限——相当于让模型提建议、自己动手执行。正文没披露具体用了多少样本或微调细节,但能跑通本地模型做系统配置,说明 27B 规模在 agent 场...
#Agent#Code#Tools#Qwen
精选理由
HKR 三项都过,但证据只有一条 Reddit 帖子。正文没披露具体命令、耗时、失败率或可复现步骤,所以留在 all 层,先别太激动。
一句话点评
短评:本地模型当系统管理员,27B 够用但别给 sudo。 点评:Reddit 用户把 Pi 编程代理接上本地 Qwen 3.6 27B,让它帮忙配 Arch Linux——连蓝牙音箱、调 HDPI 缩放都搞定了。关键限制:用户没给模型 sudo 权限,相当于模型只出建议、人动手执行,安全但效率打折。27B 规模能跑通 agent 任务,说明本地模型在系统配置场景已经够用,成本比调 API...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
09:27
35d ago
r/LocalLLaMA· rssEN09:27 · 05·09
Reddit 用户实测:Qwen 写代码强,但写 App Store 文案和对话不如 Sonnet 4.6
一位 Reddit 用户对比了 Qwen 和 Sonnet 4.6 在创意写作与对话直觉上的表现,结论是 Qwen 在编程任务上很强,但在写 App Store 文案和简洁对话上不如 Sonnet 4.6。帖子没有披露测试次数、具体提示词、模型版本或评估标准,所以这个结论只能当个人感受看,不能当严谨评测。
#Code#Fine-tuning#Qwen#Anthropic
精选理由
一条 Reddit 个人经验分享,靠选模型焦虑过了 HKR-R。HKR-H 缺钩子,HKR-K 缺样本量、提示词和可复现的测试条件,所以留在 all 层。
一句话点评
一位 Reddit 用户说 Qwen 写 App Store 文案和简洁对话不如 Sonnet 4.6,但没披露测试次数、提示词和模型版本,结论只能当个人感受。短评:个人体感,缺评测细节。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
09:25
35d ago
Ben's Bites· rssEN09:25 · 05·09
Ben 用 AI 搭了个 Gmail 客户端,自己用,还给 agent 留了后门
Ben 用 Codex 和 Factory 给自己写了一个本地 Gmail 客户端,Gmail 还是数据主库。功能包括分栏收件箱、快捷键、命令面板、回复/写邮件、20 秒撤回、一键退订、搜索、规则同步、缓存刷新,以及给 agent 用的隐藏选择器和调试接口。一开始很卡,原因是频繁请求 Gmail API,后来加了本地缓存和后台预取才变快。规则部分踩了坑...
#Agent#Code#Tools#Ben's Bites
精选理由
HKR 三项都过,但这是个人项目,不是产品发布或模型更新。正文没给代码仓库、成本、耗时和失败细节,所以分数压在 60–71 区间。
一句话点评
Ben 用 Codex 和 Factory 给自己写了个本地 Gmail 客户端,核心思路是 Gmail 做数据主库,前端自己控。一开始卡是因为频繁调 Gmail API,加了本地缓存和后台预取才解决。规则同步也踩了坑,agent 默认写本地规则文件,没跟 Gmail 同步。亮点是给 agent 留了隐藏接口,但正文没披露具体怎么用。整体是个 AI 辅助写个人工具的实战记录,不是产品发布,别...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
09:10
35d ago
Product Hunt · AI· rssEN09:10 · 05·09
Yeta AI:给 YouTube 视频实时配音,贴链接选语言就行
Yeta AI 是一个浏览器工具,你贴一个 YouTube 链接、选目标语言,它就能实时把视频里的语音换成另一种语言的 AI 配音,不用上传也不用等。支持 10 种以上语言,免费起步,不用绑信用卡。正文没披露具体延迟多高、用了什么模型、音色质量如何,也没说支持哪些语言。如果延迟能控制在几秒内、音色自然,那对看外语视频的用户挺实用,但这点先别太激动,得等实测。
#Audio#Yeta AI#YouTube#Product update
精选理由
一个小型 Product Hunt 工具发布,只有 HKR-H 成立:YouTube 实时配音这个角度确实有吸引力,但正文没披露语种、延迟、价格或机制,所以只能归为低价值的产品更新。
一句话点评
Yeta AI 是一个浏览器工具,贴 YouTube 链接就能实时把语音换成 AI 配音,不用上传。支持 10 种以上语言,免费起步,不绑信用卡。正文没披露具体延迟、用了什么模型、音色质量,也没说支持哪些语言。如果延迟能控制在几秒内、音色自然,对看外语视频的用户挺实用,但这点先别太激动,得等实测。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
09:10
35d ago
r/LocalLLaMA· rssEN09:10 · 05·09
有人用两张专业卡跑 MiMo-V2.5 量化版,测了 104 万 token 上下文
LegacyRemaster 在本地用 llama-server 跑了 MiMo-V2.5 的 IQ3_S 量化版,上下文拉到 1,048,576 token。机器是双卡:RTX 6000(96GB 显存)加 W7800(48GB 显存),49 层全卸到 GPU,开了 FlashAttention,16 线程。他的体感是,超过 5 万 token 后,...
#Inference-opt#Code#MiMo#MiniMax
精选理由
HKR三项都过:钩子是104万上下文实测,50k后比MiniMax稳但会循环,直接戳中本地模型用户对长上下文稳定性的焦虑;知识给了完整硬件和软件配置,但没披露速度或显存占用;共鸣点在于长上下文和显存成本是社区常聊的话题。不过这只是单次Reddit本地推理测试,不是模型发布或产品更新,范围太窄,所以定在all层。
一句话点评
有人在双卡(RTX 6000 96GB + W7800 48GB)上把 MiMo-V2.5 的量化版跑到了 100 万 token 上下文,5 万 token 后速度比 MiniMax 稳。但温度低于 0.2、重复惩罚 1.1 时会循环,说明长文生成质量还有坑。正文被 Reddit 屏蔽了,没披露具体速度和显存占用,如果是真的,这个硬件门槛对本地部署不算友好。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
09:07
35d ago
r/LocalLLaMA· rssEN09:07 · 05·09
现在这显卡价格,到底谁在买啊?
Reddit 用户吐槽当前 GPU 和 DDR5 定价离谱:8GB 显存卡卖到以前 16GB 卡的价格,RTX 4090 比刚发布的 RTX 5090 还贵 1000 美元。帖子没披露实际销量或渠道库存数据,所以这到底是厂商硬扛价还是真有人接盘,正文没说。
#Inference-opt#Reddit#Nvidia#AMD
精选理由
HKR 三项都过,但证据来源是 Reddit 用户吐槽加几个 SKU 对比,正文没披露销量、渠道或供需数据,所以不上精选。
一句话点评
Reddit 用户吐槽显卡定价离谱:8GB 显存卡卖到以前16GB卡的价格,RTX 4090比刚发布的RTX 5090还贵1000美元。帖子没披露实际销量或渠道库存数据,所以这到底是厂商硬扛价还是真有人接盘,正文没说。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
08:52
35d ago
AI HOT 精选· aihot-apiZH08:52 · 05·09
Qwen 3.5 和 3.6 全系列模型上线 SiliconFlow,从 9B 到 397B 都有
SiliconFlow 平台一口气上了阿里 Qwen 3.5 和 3.6 两个系列共 7 个模型,覆盖 9B 到 397B 参数,既有稠密(Dense)也有混合专家(MoE)架构,还带原生多模态能力。具体型号包括 Qwen3.6-35B-A3B(35B 总参数,每次推理只激活 3B,省显存)、Qwen3.6-27B、Qwen3.5-397B-A17B(...
#Multimodal#Inference-opt#SiliconFlow#Qwen
精选理由
这是一条 SiliconFlow 上架 Qwen 新模型的公告,属于云厂商常规产品更新。信息价值在于给出了模型规格(9B-397B、MoE/Dense、7个模型名),但缺少定价、速度或独家能力等关键指标,对从业者来说只能当个模型列表看,不值得高优先级推送。
一句话点评
SiliconFlow 一口气上了阿里 Qwen 3.5 和 3.6 共 7 个模型,从 9B 到 397B 都有,MoE 和稠密架构全包。最亮眼的是 Qwen3.6-35B-A3B,总参数 35B 但每次只激活 3B,显存省得离谱,推理成本能压到很低。Qwen3.5-397B-A17B 则是超大杯 MoE,适合不差钱的场景。原生多模态是加分项,但正文没披露具体跑分或延迟数据,实际效果得自己...
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
08:44
35d ago
Hacker News 首页· rssEN08:44 · 05·09
把文档交给大模型改,改完反而坏了
这篇论文说,让大模型帮你改文档,改着改着内容就坏了。作者搞了一套叫 DELEGATE-52 的测试,覆盖编程、晶体学、乐谱等 52 个专业领域,模拟长流程的文档编辑任务。测了 19 个模型,结果 Gemini 3.1 Pro、Claude 4.6 Opus、GPT 5.4 这些顶级模型,在长流程结束时平均搞坏了 25% 的内容,其他模型更惨。论文还发现...
#Agent#Research release
精选理由
标题的钩子很锋利,但正文信息量几乎为零——没披露实验设置、模型名单和错误率,没法判断这个“破坏”是普遍现象还是特定场景下的个例。如果是真的,对 agent 落地是个警示,但这点先别太激动,等论文出来再看具体数字。
一句话点评
这篇论文给所有让AI帮忙改文档的人泼了盆冷水。作者搞了套DELEGATE-52测试,覆盖编程、乐谱等52个专业领域,模拟长流程编辑。测了19个模型,结果Gemini 3.1 Pro、Claude 4.6 Opus、GPT 5.4这些顶级模型,在长流程结束时平均搞坏了25%的内容,其他模型更惨。而且用工具(agentic tool use)也没用,文档越长、交互越多、干扰文件越多,错误越严重。...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
07:23
35d ago
彭博科技· rssEN07:23 · 05·09
字节跳动今年AI基建预算上调25%,达到2000亿元
字节跳动把今年AI基础设施的投入计划提高了25%,总金额来到2000亿人民币(约294亿美元)。这个数字挺吓人的,但文章说主要是因为内存芯片涨价了,加上TikTok母公司自己在AI上铺得更开。不过正文没披露这2000亿具体花在哪——是买GPU、建数据中心还是租算力,也没说这笔钱比去年实际花了多少。所以这个涨幅有多大、是不是真超预期,还得看后续细节。
#ByteDance#South China Morning Post#TikTok#Funding
精选理由
HKR三项都过,但文章只给了南华早报报道的预算数字和内存成本背景,没有披露GPU型号配比、模型路线图或产品落地细节;这条消息停留在高层的行业报道层面,适合全量推送。
一句话点评
字节跳动今年AI基础设施预算上调25%至2000亿人民币,约294亿美元。涨幅看着大,但文章提到主因是内存芯片涨价,并非纯业务扩张。正文没披露这2000亿具体花在哪——买GPU、建数据中心还是租算力,也没说去年实际花了多少。所以这个涨幅有多大、是不是真超预期,还得看后续细节。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
07:09
35d ago
● P1AI HOT 精选· aihot-apiZH07:09 · 05·09
百度发布ERNIE 5.1大语言模型,预训练成本仅为对标模型6%
百度在 ERNIE 5.0 的基础上做了 5.1,主要提升搜索、推理、知识问答、创意写作和智能体能力。最抓眼球的数字是预训练成本只有对标模型的 6%,但正文没披露对标的是谁、怎么算出来的,也没给具体金额或技术细节。我会先打个折——成本低到这个程度,要么是用了 5.0 的底子省了大笔算力,要么是统计口径有讲究。另外,模型在哪些基准上测了、效果提升多少,帖...
#Reasoning#Agent#Baidu#ERNIE
精选理由
百度发了ERNIE 5.1,最抓人的一句话是“预训练成本约为对标模型的6%”。这个数字让一条模型更新变成了成本效率的故事,从业者会立刻想知道对标模型是谁、成本口径怎么算的,正文没展开说,所以冲击力有,但信息缺口也大。搜索、推理、问答、写作和智能体能力都提了升级,但没给具体评测或对比数据,技术细节偏薄。我会先打个折:话题性够强,靠成本数字和国产旗舰身份撑到了p1,但缺细节让它进不了90分以上的档位。
一句话点评
百度说 ERNIE 5.1 预训练成本只有对标模型的 6%,但正文没给对标谁、怎么算的,先当个方向看。
锐评
这条消息的核心卖点是省钱——预训练成本压到对标模型的 6%。但正文是空的,我们只能从标题里抓信息,所以判断要打折扣。首先,没说是跟哪个模型比,如果是跟 GPT-4 级别的模型比,那确实是个工程突破;如果对标的是自家上一代,意义就小很多。其次,成本怎么算的也没交代,是只算算力,还是包括了数据清洗、人力、试错?这些都会影响 6% 这个数字的含金量。另外,参数规模、性能 benchmark、推理成本都没提,光训练便宜还不够,用起来贵不贵、效果好不好才是关键。我会先把这个消息当成一个技术方向的信号,说明百度在训练效率上做了压缩,但具体怎么做到的、能不能复现,还得等论文或技术报告出来再看。
HKR 分解
hook knowledge resonance
打开信源
97
SCORE
H1·K1·R1
05:29
35d ago
r/LocalLLaMA· rssEN05:29 · 05·09
Caliby 开源:一个给 AI Agent 用的嵌入式向量数据库,号称比 pgvector 快 4 倍
Sea-Land AI 和数据库大佬 Michael Stonebraker 的团队开源了 Caliby,一个嵌入式向量检索库,支持 HNSW、DiskANN 和 IVF+PQ 三种索引。标题说比 pgvector 快 4 倍,磁盘存储性能也超过 FAISS。不过正文没披露完整的基准测试方法,这个 4 倍到底在什么场景、什么数据量下测的,目前不清楚。C...
#Agent#RAG#Embedding#Sea-Land AI
精选理由
HKR 三项都过,因为速度对比很具体,而且切中 RAG/Agent 的基础设施需求。但来源是 Reddit 自荐帖,没有公开 benchmark 的复现方法、没有 license 说明、也没有第三方验证,所以分数卡在高 all 区间。正文没披露测试环境、数据集大小、召回率对比,这些缺口让 4x 的结论暂时只能当个参考。
一句话点评
Caliby 是一个嵌入式向量检索库,支持 HNSQ、DiskANN 和 IVF+PQ 三种索引,由 Sea-Land AI 和数据库大佬 Michael Stonebraker 团队开源。标题说比 pgvector 快 4 倍、磁盘性能超 FAISS,但正文没披露基准测试方法,这个 4 倍在什么场景、数据量下测的,目前不清楚。短评:速度宣称很猛,但没给测试细节,先打个折。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
05:24
35d ago
AI HOT 精选· aihot-apiZH05:24 · 05·09
YC创始人公开AI提示词:让模型学会重复干活,别每次都从头教
Garry Tan 公开了 OpenClaw 提示词,核心是让 AI 代理从一次性工具变成能积累技能的自动系统。规则包括:禁止只干一次活、用 MECE 原则拆任务、把重复问当作失败信号,以及用标准六步流程让模型自己学并攒技能库。有人试过,系统能自动处理日报、邮件这类重复工作。另外,文章还提了个观点:在 AI 时代,HTML 比 Markdown 更适合...
#Agent#Tools#Memory#Garry Tan
精选理由
HKR三项都达标,但事实仅限于一条X帖里的提示词工作流。没有模型发布、产品数据或可复现的实验,所以分数压在70档。
一句话点评
YC 创始人 Garry Tan 公开了 OpenClaw 提示词,核心是让 AI 代理从一次性工具变成能积累技能的自动系统。规则包括:禁止只干一次活、用 MECE 原则拆任务、把重复问当作失败信号,以及用标准六步流程让模型自己学并攒技能库。有人试过,系统能自动处理日报、邮件这类重复工作。另外,文章还提了个观点:在 AI 时代,HTML 比 Markdown 更适合做沟通语言,因为能生成交互...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
05:21
35d ago
r/LocalLLaMA· rssEN05:21 · 05·09
llama.cpp 网页版聊天界面:优点和缺什么
一位 Reddit 用户对比了五款开发用聊天界面,觉得 llama.cpp 的网页版好在有上下文 token 计数器。但问题也很明显:工具调用失败后对话会丢失、没有项目级系统提示词、也没有内置的 MCP 工具隐藏控制。正文被屏蔽了,看不到更多细节。
#Tools#Memory#llama.cpp#Jan.ai
精选理由
HKR-K/R通过:摘要对比了5个UI,给出了llama.cpp WebUI的具体短板,对本地模型从业者有参考价值。HKR-H偏弱,且仅来自一条Reddit帖子,不足以进入精选。
一句话点评
短评:本地部署党选聊天界面,llama.cpp WebUI 有 token 计数器,但工具调用失败会丢对话,没有项目级系统提示词。 点评:一位 Reddit 用户对比了五款本地开发用聊天界面,认为 llama.cpp 的网页版唯一亮点是上下文 token 计数器,方便监控显存占用。但问题更突出:工具调用失败后整个对话丢失,没有项目级系统提示词(每次换项目得手动改),也没有内置的 MCP 工...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
04:53
35d ago
Hacker News 首页· rssEN04:53 · 05·09
用 Claude Code 写 HTML:效果出奇地好
一篇博客展示了用 Claude Code 直接生成 HTML 页面的效果,链接里放了几个示例。正文没交代具体任务设置、评估条件或方法细节,所以目前只能看个热闹——效果看起来不错,但不知道是模板简单还是真的能处理复杂布局。38 个点赞和 14 条评论,社区在讨论但还没形成定论。
#Code#Anthropic#Claude#Commentary
精选理由
标题的对比钩子(HTML 这种老东西在 Agent 手里反而好用)和 HN 热度说明它抓住了从业者的注意力,所以 H 和 R 成立。但正文几乎没给方法、样本或评测条件,信息量不足,K 不通过,因此维持 all 层级。
一句话点评
Claude Code 直接生成 HTML 页面,效果看着不错,但正文没交代任务复杂度、评估条件或方法细节,目前只能当个 Demo 看。38 个点赞、14 条评论,社区在讨论但没定论。如果是真的能处理复杂布局,那挺省前端时间,但这点先别太激动——可能只是模板简单。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
04:05
35d ago
AI HOT 精选· aihot-apiZH04:05 · 05·09
阶跃星辰 StepAudio 2.5 TTS 在语音盲测中排全球第三,比 Eleven Labs 高 8 分
阶跃星辰的 StepAudio 2.5 TTS 在 Artificial Analysis 语音竞技场盲测中拿到 Elo 1187 分,排全球第三,仅次于 Inworld TTS 1.5 Max 和 Google Gemini 3.1 Flash TTS。它比 Eleven Labs 的 v3 模型高了 8 分,语音自然度有明显提升。定价是每百万字符 ...
#Audio#StepFun#Artificial Analysis#Google
精选理由
HKR 三项都达标,但信息来源只是厂商的一条 X 帖子,只披露了排名、Elo 和价格,没有测试样本、对手差距或可复现性。这属于小产品/榜单更新,所以定 tier all。
一句话点评
阶跃星辰 StepAudio 2.5 TTS 在 Artificial Analysis 语音盲测中拿到 Elo 1187,全球第三,比 Eleven Labs v3 高 8 分。定价每百万字符 85 美元,生成速度 37.6 字符/秒,支持全局上下文和行内情感标签。盲测排名有参考价值,但没披露训练数据规模和中文效果,实际落地还得看场景。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
03:47
35d ago
r/LocalLLaMA· rssEN03:47 · 05·09
Qwen3-coder 在 Mac 上跑得比 Qwen 3.5-35B 还快,但没人知道它有多少参数
Reddit 用户实测发现,Qwen3-coder-next 的 MLX 版在 M2 Ultra 192GB Mac 上只占约 80GB 内存,跑得比 Qwen 3.5-35B-a3B 还快。但正文没披露它的参数量,所以没法判断这个“快”是靠模型变小还是架构优化。如果参数量真比 35B 小很多,那 80GB 内存占用算偏高的,得等官方数据才能下结论。
#Code#Fine-tuning#Inference-opt#Qwen
精选理由
一条Reddit用户发的实测帖:Qwen3-coder-next for MLX在M2 Ultra 192GB上只占80GB内存,速度还比Qwen 3.5-35B-a3B快。硬件、内存、速度对比都给了,但参数量、跑什么任务、有没有日志都没披露。单条帖子证据弱,但信息本身对本地部署党有参考价值,所以放在60-71这个'有意思'区间。
一句话点评
Reddit 用户实测,Qwen3-coder-next 的 MLX 版在 M2 Ultra 192GB Mac 上只占约 80GB 内存,跑得比 Qwen 3.5-35B-a3B 还快。但正文没披露参数量,所以没法判断这个“快”是靠模型变小还是架构优化。如果参数量真比 35B 小很多,那 80GB 内存占用算偏高的,得等官方数据才能下结论。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
03:27
35d ago
AI HOT 精选· aihot-apiZH03:27 · 05·09
Codex Chrome插件能用,但安装有门槛
有人用Codex Chrome插件成功完成了一次购物,证明它确实能用。但安装有几个硬性条件:Codex必须升到最新版,登录得用官方订阅账号,不支持第三方API模式。网络节点也有讲究,比如香港就不行。装好后要在Codex对话里输入“@ Chrome”才能调出插件功能。建议把Chrome设成默认浏览器,遇到连接问题可以重启电脑试试。正文没披露具体购物场景和...
#Agent#Tools#Codex#Chrome
精选理由
这是一条用户实测笔记,不是官方发布,所以信息量有限:只做了 1 个任务,没提稳定性、定价、权限边界或正式上线时间。但胜在真实,对关注 agent 落地的从业者来说,能快速判断 Codex 在 Chrome 里的可用性和限制。66 分合理,放在 all 层让更多人看到。
一句话点评
短评:Codex 的 Chrome 插件真能下单了,但门槛不少——必须用官方订阅账号,不支持第三方 API,香港节点也不行。 正文确认有人用 Codex Chrome 插件完成了一次购物,证明它不再是画饼。但安装限制很具体:Codex 必须最新版、登录得用官方订阅(第三方 API 模式不支持)、网络节点有讲究(香港不行)。装好后要在对话里输入“@ Chrome”才能调出插件,建议把 Chr...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
03:06
35d ago
AI HOT 精选· aihot-apiZH03:06 · 05·09
GPT Image 2 提示词模板:水墨风格幻灯片
这篇帖子分享了一个生成水墨风幻灯片图片的提示词模板,包含标题、要点、视觉元素、布局、文字层级和延续说明六个部分。模板强调宣纸背景、水墨山水等东方元素,追求静谧、侘寂或当代东亚奢华的美学风格。正文没披露模型设置、价格或可复现的生成参数,所以想直接拿来用还得自己试。
#Multimodal#Vision#GPT Image 2#Codex
精选理由
H和K通过:水墨幻灯片这个钩子够具体,6类提示词结构也提供了可复用的脚手架。但R不达标:没有测试结果、模型细节或行业影响,所以分数落在60–71区间。
一句话点评
一个水墨风PPT提示词模板,结构挺清楚:标题、要点、视觉元素、布局、文字层级、延续说明。但正文没披露模型设置、价格或可复现参数,想直接拿来用还得自己试。短评:模板不错,但缺参数,得自己调。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
02:59
35d ago
● P1机器之心 · 公众号· rssZH02:59 · 05·09
DeepSeek 融资 73 亿美元,估值 515 亿美元,创始人个人出资四成
这条消息来自机器之心,但原文页面被微信判定环境异常,需要验证才能看,所以正文内容没拿到。标题和摘要里提到的关键数字是:融资额约 500 亿人民币(折合约 73 亿美元),估值约 3500 亿人民币(折合约 515 亿美元)。梁文锋个人计划出资 40%,腾讯和 600 亿规模的国家 AI 基金也在谈。这些数字如果属实,说明 DeepSeek 这轮融资规模...
#Agent#Reasoning#Benchmarking#DeepSeek
精选理由
这条DeepSeek融资传闻数字大、出资比例明确、资方有名有姓,HKR三项都站得住。但正文也说了还在谈,没有官方确认,所以分数和级别不动,保持84分和featured,不升p1。
一句话点评
DeepSeek 拿了 73 亿美元融资,估值冲到 515 亿美元,创始人梁文锋自己掏了四成。这条消息目前只有媒体爆料,官方还没确认,先打个折看。
锐评
这条融资消息如果属实,DeepSeek 会成为全球估值最高的 AI 初创之一。73 亿美元的单轮融资额放在整个科技行业都算顶格,创始人个人出资近 30 亿美元,说明他对公司控制权和长期路线非常坚持,不想被外部资本牵着走。 但要注意,目前两个信源都是科技媒体引用“曝料”,机器之心那篇原文甚至因为微信环境异常根本打不开,等于我们看不到一手细节。融资方是谁、钱怎么花、有没有对赌条款,正文全都没披露。估值 515 亿美元这个数字也需要对照收入来看——DeepSeek 至今没有公开过商业化数据,这个估值更多反映的是市场对开源模型头部玩家的预期,而不是实打实的营收倍数。 还缺几个关键信息:这轮是纯股权融资还是含了债权?新进来的钱主要投向算力基建还是人才?创始人自掏四成是现金还是股权折算?这些没搞清楚之前,别急着把这当成行业风向标。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
02:44
35d ago
AI HOT 精选· aihot-apiZH02:44 · 05·09
GPT Image 2 提示词框架:一键生成中文科技新闻爆款封面
这是一个提示词框架,让AI根据文章内容自动生成16:9的中文科技新闻封面图。框架要求AI扮演顶级视觉设计师,从文章里提取核心新闻、关键数字、产品信息和行业情绪,然后拼出一张高信息密度的封面。构图分五个区:顶部新闻区、中央超大标题、主视觉产品图、数据卡片和底部总结。配色、字体、背景会根据行业、品牌和情绪动态调整。目标是3秒内让读者抓住重点,风格参考中国科...
#Multimodal#Vision#GPT Image 2#Product update
精选理由
HKR-K 通过,因为帖子提供了一个可复用的 GPT Image 2 封面布局机制。HKR-H 和 HKR-R 偏弱,所以分数落在 60–71 区间,算一个小 workflow 技巧。
一句话点评
这个提示词框架让 GPT Image 2 自动生成中文科技新闻封面,把文章拆成新闻区、标题、产品图、数据卡和底部总结五个区块,配色字体随行业情绪变。目标是 3 秒抓眼球,模仿中国科技媒体和 B 站爆款风格。但正文没披露实测效果——生成一张图要多久、成本多少、跟人工设计比差多远。如果真能稳定输出高信息密度封面,对缺设计师的小团队挺省钱。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
02:32
35d ago
彭博科技· rssEN02:32 · 05·09
中国最高经济规划机构呼吁加强AI协调监管
中国最高经济规划机构公开要求加强对AI的协调与监管,但正文只提供了彭博社的页面框架,没有披露具体是哪个部门、协调机制是什么、涉及哪些公司、何时落地。信息缺口很大,目前只能确认高层在推动这件事,但具体怎么管、管多严,都还没说。
#Bloomberg#Policy
精选理由
HKR-R通过,因为中国AI监管影响合规成本和市场准入。HKR-H/K不通过:摘要没有给出政策工具、执行时间表或任何新数字,所以它属于低价值政策简报区间。
一句话点评
彭博标题说中国最高经济规划机构要求加强AI协调监管,但正文只有页面框架,没披露具体部门、协调机制、涉及公司或落地时间。信息缺口很大,目前只能确认高层在推这件事,具体怎么管、管多严都还没说。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R1
01:49
35d ago
r/LocalLLaMA· rssEN01:49 · 05·09
Gemma4 写代码用工具,三四轮对话就犯迷糊
Reddit 用户实测 Gemma4 的 31B Q5 和 27B Q8 量化版,用来在 Windows 上写代码和调用工具。结果发现模型在 3-4 轮对话后就开始分不清“调用 pi 工具”和“直接回答”的区别——比如让它用工具获取信息,它可能直接编个答案。正文没披露具体测试用例和量化损失,但这点先别太激动,量化版本身就有精度折损,而且 31B 规模在...
#Code#Tools#Vision#Gemma
精选理由
这是一条Reddit用户实测帖,不是基准测试或官方发布,信息量有限但具体:31B Q5和27B Q8两个量化版本在Windows上跑编码和工具调用,3-4轮对话后模型仍难区分skill和tool——这个细节对本地部署用户有参考意义。不过样本单一,结论不能外推,所以兴趣度偏低。
一句话点评
Reddit 用户实测 Gemma4 量化版(31B Q5、27B Q8),发现 3-4 轮对话后模型就分不清“调用工具”和“直接回答”,比如让它用工具查信息,它可能直接编答案。量化版本身有精度折损,31B 规模在工具调用上本就不算强,但这个问题在 Qwen 2.5 同规模量化版上没那么明显。正文没披露具体测试用例和量化损失,所以这点先别太激动,可能是特定场景翻车。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1

更多

频道

后台