ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-05-23 · 星期六2026年5月23日
07:45
21d ago
AI 群聊日报· atomZH07:45 · 05·23
GPT-5 推翻 80 年数学猜想;DeepSeek V4 Pro 永久降价至 1/4;GLM-5.1 高速版 400 tokens/s;ds4 引擎让 ...
GPT-5 否证了 Erdős 1946 年提出的平面单位距离猜想,Fields 奖得主 Gowers 审阅后说如果是人类投稿他会直接推荐接受。DeepSeek V4 Pro 把促销价永久化,输入缓存命中 0.025 元/百万 token,输出 6 元,群友说正愁六月涨价结果直接变长期价。GLM-5.1 高速版跑到 400 tokens/s,比 Hai...
#Reasoning#Inference-opt#Tools#OpenAI
精选理由
HKR三项都达标,但来源是匿名群聊日报,不是官方发布或可复现的测试。具体数字足够让所有层级都值得看,但不够格上头条。
一句话点评
GPT-5 否证了 Erdős 1946 年的平面单位距离猜想,Fields 奖得主 Gowers 审阅后说如果是人类投稿他会直接推荐接受。关键信号:模型是通用 LLM 而非专为数学训练,说明推理能力跨领域迁移了。DeepSeek V4 Pro 把促销价永久化,输入缓存命中 0.025 元/百万 token,输出 6 元,群友说正愁六月涨价结果直接变长期价。GLM-5.1 高速版跑到 400...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
07:44
21d ago
r/LocalLLaMA· rssEN07:44 · 05·23
有人在 RX 9060 XT 上跑了 Gemma4 26B 量化版,38 token/秒,90k 上下文不崩
Reddit 用户用 mudler 做的 Gemma4 26B A4B Apex GGUF 量化模型,在 RX 9060 XT 16GB 显卡上通过 llama.cpp Vulkan 跑,测出 38 token/秒的生成速度,上下文拉到 90k 也没出现循环或明显的质量下降。这个速度对本地跑 26B 模型来说算快的,而且长上下文没崩说明量化做得比较稳。...
#Inference-opt#Gemma#mudler#llama.cpp
精选理由
HKR 三项都达标,但来源是单条 Reddit 用户测试,不是官方发布或系统评测。90k 上下文和 38 tps 的具体数字让这条信息有用,不过权威性有限,所以分数压在 60–71 区间。正文没披露量化精度对质量的具体影响,这点先别太激动。
一句话点评
Reddit 用户实测,Gemma4 26B A4B 的 Apex 量化版在 RX 9060 XT 16GB 显卡上跑出 38 token/秒,上下文拉到 90k 也没崩。这个速度对本地 26B 模型算快的,长上下文没出循环或质量下降,说明量化做得稳。但注意:来源是单用户自测,显卡是 AMD 中端卡,N 卡表现未知;正文被墙,没披露量化具体参数和测试细节。如果这速度能复现,16GB 显存跑 ...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
07:15
21d ago
AI HOT 精选· aihot-apiZH07:15 · 05·23
飞书里直接调本地 Claude Code,开源项目已上线
feishu-claude-code-bridge 这个开源项目把飞书和本机的 Claude Code CLI 连起来了。你在飞书发消息,它转成 prompt 传给 `claude -p` 执行,再把输出流式同步回飞书。反过来 Claude 也能读飞书里的上下文、创建编辑文档。相当于把飞书当聊天界面,背后跑本地模型干活。项目还能扩展接 Codex 等其...
#Agent#Code#Tools#Feishu
精选理由
HKR 全过:飞书桥接 Claude Code 有具体的工作流钩子(h)、机制和计费日期(k)、以及团队成本痛点(r)。范围就是一条 X 帖里的单个开源连接器,所以分数压在 70 档。
一句话点评
飞书当聊天界面,背后跑本地 Claude Code 干活,挺实用。但注意 6 月 15 日起 `claude -p` 模式要单独计费,成本会涨。项目开源可扩展,但正文没披露延迟和稳定性数据,生产环境需谨慎。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
05:21
21d ago
r/LocalLLaMA· rssEN05:21 · 05·23
给 Gemma4 31B 写了个 Jinja 模板,专治思维标签不闭合
Reddit 用户 ggonavyy 发了个 llama.cpp 用的 Jinja 模板,说在 Pi-coding-agent 测试里不再出现 thinking 标签打开或关闭的错误。帖子没贴跑分,也没说怎么复现,所以效果到底多稳得自己试。
#Code#Agent#Tools#Google
精选理由
一个很小的开源工具帖:HKR-H 和 HKR-K 靠一个具体的 Gemma4 31B 模板和 Pi-coding-agent 场景通过,但没给基准、可复现测试或行业级痛点,分数卡在 60-71 低位段。
一句话点评
一个 Reddit 用户给 Gemma4 31B 做了个 Jinja 模板,号称能修掉 thinking 标签开关错误。没跑分、没复现步骤,效果稳不稳得自己试。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
04:21
21d ago
Latent Space· rssEN04:21 · 05·23
模型厂都在转型做 Agent 了:OpenAI、AI21、DeepSeek 集体转向
Latent Space 汇总了 5 月 4-5 日的 AI 新闻,翻遍 12 个 Reddit 板块和 544 个 Twitter 账号后得出一个判断:OpenAI、AI21、DeepSeek 这些模型公司正在把产品重心从“卖模型”转向“卖 Agent”——也就是把模型装进业务流程、UI、记忆和成本结构里一起卖。OpenAI 的 Greg 直接说“模...
#Agent#Tools#Code#Latent Space
精选理由
这是一篇Latent Space的新闻汇总,核心论点是模型团队都在转向智能体、工具链和UI,而非发布重大新模型或论文。论据有具体来源和案例,但本质是行业观察综述,不是一手发布。重要性68分合理,属于“值得看但别当重磅”的档次。
一句话点评
OpenAI、AI21、DeepSeek 等模型公司集体转向卖 Agent——把模型装进业务流程、UI、记忆和成本结构里一起卖。Greg 直言“模型不再是产品”,AI21 甚至裁掉模型团队。DeepSeek 首次组建“Harness 团队”。但正文没披露这些 Agent 产品的实际效果或用户数据,判断主要来自高管发言和团队调整,验证还弱。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
03:47
21d ago
● P1量子位 · 公众号· rssZH03:47 · 05·23
DeepSeek V4 继续打价格战,缓存输入每百万 token 只要两分五;宁德时代、京东、网易在谈投资,梁文锋说目标是通用人工智能
DeepSeek-V4-Pro 的 API 从 6 月 1 日起维持促销价,缓存输入每百万 token 收 0.025 元人民币,这个价格在同类模型里算很低了。彭博社的消息说 DeepSeek 正在谈一轮 700 亿人民币的融资,投前估值 450 亿美元,宁德时代、京东、网易都有意参与。创始人梁文锋对外表态,公司的目标还是通用人工智能(AGI)。不过原...
#Inference-opt#DeepSeek#CATL#Liang Wenfeng
精选理由
这条消息把两件事串起来了:一是 DeepSeek V4 的 API 价格直接砍到促销价,输入缓存命中每百万 Token 只要 0.025 元,对用 API 做产品的团队来说成本降幅明显;二是彭博说宁德时代、京东、网易都在看这轮 700 亿融资,投前估值 450 亿美元,梁文锋还放了话目标是 AGI。价格数字和融资规模都够具体,没有模糊表述,对关注模型成本和资本动向的从业者来说信息密度高,所以给了 90 分。
一句话点评
DeepSeek V4 Pro 把缓存输入打到每百万 token 两分五厘,价格战继续。但正文被验证页挡了,融资和 AGI 表态都只能看摘要。
锐评
这条消息最实在的点是价格:DeepSeek-V4-Pro 的缓存输入每百万 token 收 0.025 元人民币,在同类模型里确实很低,对高频调用场景能省一笔。彭博社传的融资规模很大,700 亿人民币、投前估值 450 亿美元,宁德时代、京东、网易这些名字也出现了,说明资本和产业方都在押注。梁文锋重申目标是 AGI,这个表态本身不新鲜,但在融资传闻的背景下,更像是对投资人喊话。 不过原文被微信的验证页挡住了,我们只能依赖摘要。融资轮次、具体条款、资金用途这些关键信息都没法核实。价格虽然低,但没看到性能对比和实际吞吐限制,不知道便宜是不是以牺牲速度或质量换来的。另外,V4 Pro 和之前版本的能力差异、开源策略有没有变化,正文也没披露。这些缺口让整条消息更像一个信号而非可评估的事实。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
03:44
21d ago
● P1Hacker News 首页· rssEN03:44 · 05·23
微软内部测算发现AI处理某些任务成本高于雇人
微软内部测算发现,用 AI 处理某些任务的成本高于直接雇人。正文没披露具体对比了哪些岗位、用了什么模型、以及 token 消耗量或 agent 调用次数,所以这个“更贵”到底贵多少、在什么场景下成立,目前还不清楚。但微软自己承认 AI 成本高,说明大模型落地时,推理开销和人工替代之间的经济账还没算平。
#Agent#Microsoft#Commentary
精选理由
标题反转了“AI替代人力更省钱”的常见叙事,但正文只给了URL、17点和两条评论,没披露微软报告原文、成本口径(是按token、agent调用还是全周期TCO)、岗位类型(客服、编程还是内容生成),也没说对比的是全职人力还是外包人力。H和R两条通过,K不通过——信息太薄,没法验证。保留在all层级,分数压在60–71区间,因为证据不足,只能当引子看,不能当结论用。
一句话点评
微软自己算了一笔账,发现用AI处理某些任务,成本比直接雇人还高。
锐评
微软内部测算显示,AI 处理特定任务的成本高于雇佣人类员工。这条信息目前只来自 Hacker News 的标题和 AIhot 的简短转载,正文细节缺失,所以具体是哪些任务、成本高了多少、怎么算的,都不清楚。 我会先打个折:这很可能不是指所有 AI 应用,而是某些需要高算力、低容错、或者频繁人工兜底的场景。比如用大模型处理复杂客服工单,API 调用费加上人工审核成本,可能真不如一个熟手员工划算。但正文没披露测算口径,没法判断是纯推理成本还是算上了开发维护。 还缺的关键信息:对比的是美国还是全球人力成本?用的是 GPT-4 级别模型还是自研小模型?任务是一次性生成还是需要多轮交互?这些都会让结论差很多。建议等微软官方博客或研究报告出来再下判断,现在只能当个信号看——大模型落地时,ROI 确实不是默认成立的。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K0·R1
02:35
22d ago
AI HOT 精选· aihot-apiZH02:35 · 05·23
Kling AI 在戛纳办了场官方会,聊 AI 怎么进电影制作流程
Kling AI 在戛纳电影市场(Marché du Film)搞了场官方会议,跟全球电影人聊 AI 怎么真正进制作流程。官方说它已经用在动画长片、好莱坞剧集、实验短片和院线电影四种类型上。正文没披露具体合作方或项目细节,所以这点先别太激动——能进戛纳本身是个信号,但实际落地效果和规模还不清楚。
#Multimodal#Vision#Kling AI#Marché du Film
精选理由
触发硬排除-纯营销:核心事实是Kling AI在戛纳电影市场办了一场官方会议,没有新模型、新功能、新定价或可验证的成片列表。电影+AI的劳动力角度给了有限相关性,但正文没披露任何具体项目名称、制作成本或延迟数据,信息缺口太大,不值得推送。
一句话点评
Kling AI 在戛纳电影市场办了官方会议,宣称已用于动画长片、好莱坞剧集、实验短片和院线电影四种类型。能进戛纳是个信号,但正文没披露具体合作方或项目细节,实际落地效果和规模还不清楚,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R1
01:10
22d ago
r/LocalLLaMA· rssEN01:10 · 05·23
G4-MeroMero-26B-A4B:Gemma 4 的 uncensored 微调版,拒绝率降到 12%
LLMFan46 放出了 G4-MeroMero-26B-A4B-it-uncensored-heretic,这是基于 Google Gemma 4 的 26B 参数(实际激活 4B)模型做的微调版,主打“不设限”。标题里两个关键数字:KLD 0.0152 说明微调后和原模型的输出分布偏离很小,基本没改模型能力;12/100 的拒绝率意味着每 100 ...
#Fine-tuning#Benchmarking#LLMFan46#Hugging Face
精选理由
HKR三项全过:标题有反审查噱头,给出了具体的KLD和拒答数字,而且本地模型社区对'不拒答'这件事一直很在意。分数卡在60-71区间:这是一个小众的Reddit微调模型,没有经过验证,也没有广泛采用。
一句话点评
基于Gemma 4的26B参数模型(实际激活4B)做了个不设限微调版。KLD 0.0152说明输出分布偏离很小,基本没改原模型能力;12/100拒绝率意味着每100次提问只拒绝12次,比原版宽松不少。但正文被屏蔽,没披露具体用了什么数据、基准测试结果如何,也没说微调成本。如果真能保持原模型质量又降低拒绝率,对本地部署和角色扮演场景挺实用,但验证信息不足,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
00:41
22d ago
AI HOT 精选· aihot-apiZH00:41 · 05·23
Google DeepMind 扩大与新加坡合作,主攻科学发现、防疫和医疗
Google DeepMind 宣布扩大与新加坡的合作,新项目覆盖三个方向:加速科学发现、加强大流行病防范和改善医疗保健。正文没披露预算、时间表、具体模型或部署规模,所以目前只能知道合作范围变宽了,但投入多大、落地多快还不清楚。
#Safety#Google DeepMind#Singapore#Partnership
精选理由
这是一条 Google DeepMind 与新加坡扩大合作的简讯,正文只列出了三个方向(科学发现、大流行病防范、医疗保健),但没给预算、时间表或任何部署指标,所以从业者看完没法评估投入产出或跟进节奏。信息密度低,适合快速扫过,不值得深挖。
一句话点评
DeepMind 跟新加坡的合作又扩大了,这次覆盖科学发现、大流行病防范和医疗三个方向。但正文没披露预算、时间表、具体模型或部署规模,所以目前只能知道合作范围变宽了,投入多大、落地多快还不清楚。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
00:02
22d ago
Hugging Face 博客· rssEN00:02 · 05·23
Nemotron-Labs 扩散语言模型:目标接近光速的文本生成
英伟达在 Hugging Face 上发布了一篇博客,标题说他们的扩散语言模型目标是实现接近光速的文本生成。但正文是空的,所以没披露模型大小、具体速度指标、评测设置或是否开源。
#Inference-opt#Hugging Face#NVIDIA#Research release
精选理由
H 和 R 通过,因为扩散模型做文本生成直接指向推理速度和成本,方向本身有钩子。K 不通过:RSS 只有标题,没有速度数据、模型大小、发布状态或可复现的设置,信息不足以支撑更高评分,所以落在 60–71 区间。
一句话点评
英伟达发了一篇博客,标题说扩散语言模型要接近光速生成文本,但正文是空的。没披露模型大小、具体速度指标、评测设置或是否开源。信息缺口太大,没法判断真假,先别激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
2026-05-22 · 星期五2026年5月22日
23:59
22d ago
● P1AI HOT 精选· aihot-apiZH23:59 · 05·22
Gemini 月活破 9 亿,新增两个能替你干活的代理功能
Google 说 Gemini 应用月活用户超过 9 亿了。这次更新把 Gemini 从问答工具往主动干活的个人代理方向推了一步。新模型叫 Gemini 3.5 Flash,还换了套叫“Neural Expressive”的设计语言,另外 Gemini Omni 模型能把提示词直接生成视频。重点在两项代理功能:Daily Brief 会给你出个性化每日...
#Agent#Multimodal#Google#Gemini
精选理由
Google 这次更新核心就两件事:一是 Gemini 应用月活冲到 9 亿,盘子确实大;二是推出了 Daily Brief 和 Gemini Spark 两个代理功能,后者可以在用户授权下 24 小时跑任务。我会先打个折,正文没披露代理功能的具体完成率和延迟数据,实际干活靠不靠谱还不知道。但 9 亿这个量级加上“常驻后台的个人代理”定位,对做 agent 产品的团队来说是个明确的信号——大厂开始用自家分发渠道推代理了,竞争门槛在抬高。
一句话点评
Gemini 月活破 9 亿,但 Google 没说是怎么算的。新推的 Daily Brief 和 Spark 代理功能听起来像能替你干活,实际能接管多少任务、会不会翻车,正文没给细节,先别太激动。
锐评
Google 这次把 Gemini 从问答工具往主动干活的个人代理方向推了一步。月活 9 亿这个数字挺大,但正文没披露统计口径,是打开过就算,还是真在用的,不知道。新模型叫 Gemini 3.5 Flash,还换了套设计语言,另外 Omni 模型能把提示词直接生成视频,这点如果效果稳定,对内容创作挺省事。 重点在两项代理功能:Daily Brief 给你出个性化每日简报,Gemini Spark 号称能 7x24 小时替你管理任务。听着像能帮你订票、回消息、整理日程,但授权范围、出错率、隐私怎么处理,正文全没提。这种主动代理一旦翻车,代价比问答答错大得多。 还缺的是实际体验数据和限制条件。比如 Spark 能接管哪些 App,跨平台支持怎么样,延迟高不高。这些不说清楚,9 亿用户更像是个宣传数字,产品到底能不能用,还得等上手。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
22:41
22d ago
彭博科技· rssEN22:41 · 05·22
Zoom 2023 年初投了 Anthropic,现在账面赚了 10 亿美元
Zoom 在 2023 年初投了 Anthropic,目前这笔投资已经赚了大约 10 亿美元。正文没披露 Zoom 当初投了多少钱、拿了多少股份,也没说它是怎么退出的——是卖了股票还是公司回购。10 亿美元这个数字本身挺大,但因为没有本金和持股比例,没法算实际回报倍数。对 AI 从业者来说,这条消息更像一个信号:早期押注头部模型公司,回报空间确实惊人,...
#Zoom#Anthropic#Funding
精选理由
正文只说了 Zoom 从 Anthropic 投资赚了约 10 亿美元,但没披露投了多少、占多少股、怎么退出的。这个数字本身有信息量——说明早期押注头部 AI 公司的回报确实可观,但缺少投资成本,没法算实际收益率。对 AI 从业者来说,这是一个有用的 AI 财务信号,不是当天必须写的产品或融资事件。
一句话点评
Zoom 2023年初投了Anthropic,现在账面赚了约10亿美元。但正文没披露本金和持股比例,也没说怎么退出的——是卖了股票还是公司回购。10亿美元这个数字挺大,但没成本基数就没法算回报倍数。对AI从业者来说,这条消息更像一个信号:早期押注头部模型公司,回报空间确实惊人。不过,如果Zoom只投了几千万,那回报倍数就很高;如果投了几个亿,那也就一般。缺关键信息,没法判断这笔投资到底多成功。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
22:11
22d ago
r/LocalLLaMA· rssEN22:11 · 05·22
8GB 显卡跑 26 万 token 上下文,速度还能到 30+ token/秒
有人在 8GB 的 RTX 3070 Ti 上跑了 Qwen3.6-35B-A3B 的 Q4 量化版,上下文长度开到 262144 token,实测生成速度约 34–37 token/秒(Ubuntu 系统),Windows 下不到 27 token/秒。用的是 llama.cpp,KV 缓存精度 q8_0,系统内存 32GB DDR4-2666。这个...
#Inference-opt#Code#Qwen#NVIDIA
精选理由
这是一条 Reddit 用户实测数据,不是官方发布或广泛验证的产品更新。亮点是 262k 上下文在 8GB 显存卡上达到 30+ tps,对本地部署党有吸引力。但只有单点测试,缺乏多环境对比或稳定性验证,所以分数卡在 60-71 区间。正文没披露功耗、温度或长时间运行稳定性,这点先别太激动。
一句话点评
8GB显存跑35B模型,262K长上下文,每秒34-37 token——这个数字很实在。Qwen3.6-35B-A3B的Q4量化版在3070 Ti上跑出了接近实时对话的速度,Ubuntu比Windows快30%左右。代价是32GB系统内存和q8_0 KV缓存,长上下文下内存带宽是瓶颈。正文没披露具体推理框架版本和prompt长度,实测可能打折扣。对本地部署党来说,这个配置门槛不高,但别指望同...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
22:10
22d ago
AI HOT 精选· aihot-apiZH22:10 · 05·22
ViggleAI 说动捕和角色动画变简单了,但没给细节
ViggleAI 发帖称动作捕捉和角色动画制作变得更容易,但正文只说了“持续构建,更多功能即将推出”。没有披露具体能力、技术参数、定价或发布日期,信息量很少,无法判断实际效果。
#Vision#Multimodal#ViggleAI#Product update
精选理由
硬排除规则5适用:这是一条产品预告,没有具体功能、规格、发布日期或可验证的机制。HKR-H、HKR-K、HKR-R均不满足。
一句话点评
ViggleAI 发了条帖子,说动捕和角色动画变简单了,但正文就一句“持续构建,更多功能即将推出”。没提具体能力、技术参数、定价或发布日期,信息量约等于零。短评:画饼帖,等真东西出来再说。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
21:46
22d ago
彭博科技· rssEN21:46 · 05·22
美国考虑对进口芯片加关税,贸易代表称暂无具体计划
美国贸易代表Jamieson Greer说,特朗普政府仍在考虑对进口半导体加征关税,目的是刺激本土芯片制造。但短期内不会落地新税。正文没披露税率范围或时间表,所以这点先别太激动——目前只是放风阶段,离真正执行还有距离。
#Jamieson Greer#Trump administration#Policy
精选理由
这是一条政策动态,不是AI技术突破。正文只确认了“还在评估、暂无新关税”,没披露税率、范围和具体时间表。对AI从业者来说,算力成本是命门,所以这条值得关注,但信息缺口明显,不能当重磅新闻推。
一句话点评
美国贸易代表放风要对进口芯片加关税,刺激本土制造。但正文没披露税率和时间表,目前只是口头施压,离落地还远。关键看后续细则,别急着下注。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
21:09
22d ago
r/LocalLLaMA· rssEN21:09 · 05·22
Blackwell 新特性 PDL 实测:推理提速最多 9%,Prefill 几乎没变
Llama.cpp 最新版 b9282 开始支持 Nvidia 的 PDL(程序化依赖启动),但仅限计算能力 >= 90 的 Blackwell 架构显卡,Ada 系列用不了。有人在 RTX Pro 4500 Blackwell 32GB 上跑了四个模型,结果 token 生成速度提升了 2.2% 到 9.17%,但 prefill(预填充)阶段几乎没...
#Inference-opt#Benchmarking#Tools#Llama.cpp
精选理由
Llama.cpp新版b9282支持了Nvidia PDL(一种推理加速库),实测RTX Pro 4500上预填充速度没变,四个模型的token生成快了2.2%到9.17%。加速幅度不大,但胜在免费升级,对跑本地模型的用户算个小甜头。正文没披露PDL具体怎么起效、功耗有没有变化,这点先别太激动。
一句话点评
Llama.cpp 新版 b9282 给 Blackwell 显卡开了个叫 PDL 的硬件加速,RTX Pro 4500 32GB 实测 token 生成速度最多提了 9%,但 prefill 几乎没变化。注意:只有计算能力 >= 90 的 Blackwell 能用,Ada 系列被排除。提升幅度不大,且来源是 Reddit 单用户测试,缺少多卡、长上下文或大 batch 的对比数据。正文没披...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
20:17
22d ago
r/LocalLLaMA· rssEN20:17 · 05·22
给 Cohere 的语音转文字模型加了个说话人分离和时间戳,误差不到 0.1 秒
Reddit 用户 iamMess 微调了 Cohere Transcribe,加上了说话人分离(谁在什么时候说话)和时间戳功能。实测平均时间戳误差 0.097 秒,每 30 秒片段最多能识别 4 个说话人。正文没披露用了多少训练数据、微调成本或模型大小,所以这点先别太激动——效果看着不错,但验证还不够充分。
#Audio#Fine-tuning#Cohere#Hugging Face
精选理由
HKR 三项都过,但这是单个 Reddit 用户的实验,范围窄。0.097 秒误差和 4 说话人条件有用,但没公布训练数据量、微调成本、是否开源模型权重,也没说在更长音频或嘈杂环境下的表现。信息缺口明显,不够上精选。
一句话点评
Reddit 用户微调 Cohere Transcribe,加上了说话人分离和时间戳。实测平均时间戳误差 0.097 秒,每 30 秒片段最多识别 4 个说话人。误差不到 0.1 秒,效果不错。但正文没披露训练数据量、微调成本和模型大小,验证还不够充分,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
20:16
22d ago
AI HOT 精选· aihot-apiZH20:16 · 05·22
Codex 差异视图新增经典 +/- 标记选项
OpenAI 给 Codex 功能加了个外观设置:差异视图现在可以切换成传统的 +/- 标记,而不是只有彩色条。默认还是彩色条,需要你手动去开。就是个界面小调整,不影响功能。
#Code#Tools#OpenAI#Product update
精选理由
这是 OpenAI 开发者工具里一个很小的 UI 设置更新:HKR-K 靠具体机制(新增标记选项)通过,HKR-H 和 HKR-R 都很弱。属于小产品更新的低端,不值得推荐。
一句话点评
OpenAI 给 Codex 的差异视图加了个外观选项,可以切回传统的 +/- 标记,默认还是彩色条。就是个界面小调整,不影响功能,别激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
20:15
22d ago
r/LocalLLaMA· rssEN20:15 · 05·22
Strix Halo 核显 + 双 3090 外接显卡,硬塞 124GB 显存跑大模型
作者在 Strix Halo 系统(124GB 统一显存)上外挂两块 RTX 3090,用 vLLM 跑 Qwen 3.6 27B 模型。实测支持 131K 或 262K 超长上下文,同时处理 4 个并发请求,并开启了 MTP=3(预测下一个 token 时多看 3 步)。这套组合把核显统一内存和独立显卡显存全堆在一起,显存总量很夸张,但外接显卡走 P...
#Inference-opt#Code#Tools#Qwen
精选理由
一篇 Reddit 个人魔改帖,用 Strix Halo 的 124GB 统一显存加上双 3090 外接显卡跑 Qwen 3.6 27B,vLLM 测试条件写得很清楚:131K/262K 上下文、4 并发、MTP=3。亮点是显存够大,能塞下 27B 模型的长上下文,但来源单一、配置小众,所以分数压在 60–71 区间。正文没披露具体吞吐数值和功耗,这点先别太激动。
一句话点评
一个玩家在 Strix Halo 系统(124GB 统一显存)上外挂两块 RTX 3090,用 vLLM 跑 Qwen 3.6 27B 模型,实测支持 131K 或 262K 超长上下文,同时处理 4 个并发请求,并开启了 MTP=3(预测下一个 token 时多看 3 步)。这套组合把核显统一内存和独立显卡显存全堆在一起,显存总量很夸张,但外接显卡走 PCIe 带宽有限,实际推理速度会打折...
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
20:06
22d ago
彭博科技· rssEN20:06 · 05·22
AI 行情把收益都吸走了,华尔街主动基金经理被架在火上烤
彭博发了一篇报道,说 AI 板块的持续上涨让市场收益高度集中在少数几只股票上,导致那些靠选股吃饭的主动基金经理很难跑赢大盘。文章提到 AI 热潮正在扭曲市场信号,让人类投资者屡屡受挫。不过正文没有披露具体样本数量、管理资产规模、业绩对比数据或统计时间段,所以这个“被套住”到底有多普遍、多严重,目前只能当个现象描述来看,先别急着下结论。
#Bloomberg#Commentary
精选理由
Bloomberg 的标题有冲击力,H和R都过关。但正文太短,没有给出任何具体数字或案例来支撑判断,K不通过。整体属于行业评论,不是硬新闻,所以放在通用报道档位。
一句话点评
彭博说AI板块集中上涨,主动选股基金跑不赢大盘。但正文没给样本数量、管理规模、业绩对比数据和时间段,这个“被套住”有多普遍只能当现象看,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
19:57
22d ago
● P1AI HOT 精选· aihot-apiZH19:57 · 05·22
Anthropic 的 Project Glasswing 一个月内发现超万个高危软件漏洞
Anthropic 说,他们和大约 50 家合作伙伴用 Claude Mythos Preview 模型,在全球最关键的基础软件里找到了超过一万个高危或严重级别的漏洞。现在瓶颈已经不是找漏洞的速度,而是验证、通报和打补丁的速度。在开源软件扫描这块,模型自己估算发现了 6,202 个高危或严重漏洞,其中 1,752 个已经过独立安全公司或 Anthrop...
#Code#Agent#Benchmarking#Anthropic
精选理由
Anthropic 这次放出的不是模型跑分,而是 Claude 在真实关键系统里挖漏洞的战报。约 50 家合作伙伴用 Claude Mythos Preview 扫出超过一万个高危或严重漏洞,独立验证准确率 90.6%,说明模型在安全自动化这条线上已经从“能看”走到“能干活”了。我会先打个折:正文没披露漏洞类型分布、误报率和修复成本,也没说这 90.6% 是在什么条件下测的,所以准确率数字先别太激动。但不管怎么说,一万多个高危漏洞这个量级,加上 Mozilla、Cloudflare 这类合作方背书,对做安全自动化和关键基础设施防护的团队来说,是一个...
一句话点评
Anthropic 用新模型一个月扫出上万个高危漏洞,但具体细节要等补丁铺开才能说,现在看到的数字先打个折。
锐评
Anthropic 公布了 Project Glasswing 的首月数据:约 50 家合作方用 Claude Mythos Preview 模型,在各自的核心软件里总共发现了超过一万个高危或严重漏洞。Cloudflare 一家就找到 2000 个 bug,其中 400 个是高危或严重级别,而且误报率比人类测试员还低。Mozilla 测 Firefox 150 时挖出 271 个漏洞,是上一版用 Claude Opus 4.6 时的十倍多。这些数字说明 AI 找漏洞的速度已经远超人类,现在瓶颈变成了怎么快速验证、通报和打补丁。 在开源软件扫描上,Anthropic 自己用 Mythos Preview 扫了 1000 多个项目,模型自己估计有 6202 个高危或严重漏洞。其中 1752 个已经过外部安全公司复核,90.6% 是真漏洞,62.4% 确认是高危或严重级别。按这个比例推算,光开源项目就能筛出近 3900 个高危漏洞。wolfSSL 那个例子挺直观——模型直接构造了一个能伪造证书的攻击,影响数十亿设备。 不过要冷静看。Anthropic 自己说了,因为行业惯例是漏洞发现后 90 天才公开细节,现在披露的都是滞后指标。正文没给出漏洞的具体类型分布,也没说这些漏洞里有多少是模型独立发现、多少需要人工引导。英国 AISI 和 XBOW 的外部评测都夸模型能力强,但评测基准的覆盖面和真实攻防场景的差距有多大,文章没展开。另外,微软和甲骨文都说补丁量在猛增,但没提这些补丁对应的漏洞修复成本有多高。等补丁大规模部署后 Anthropic 承诺会放出更多细节,那时候才能判断这波 AI 挖漏洞到底改变了什么。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
19:52
22d ago
r/LocalLLaMA· rssEN19:52 · 05·22
双卡混搭成功:R9700 PRO + 7800 XT 凑出 48GB 显存跑 llama.cpp
Reddit 用户 Jorlen 在 Kubuntu 24.04 上把一张 R9700 AI PRO(32GB)和一张 7800 XT(16GB)拼在一起,用 llama.cpp 跑通了推理。Vulkan 后端能快速出结果,但 ROCm 不支持这种 RDNA4 和 RDNA3 混插,直接罢工。48GB 显存够跑 70B 模型,但跨卡通信开销和驱动兼容性...
#Inference-opt#Reddit#Jorlen#AMD
精选理由
这是一个 Reddit 上的折腾笔记,不是模型或产品发布。它证明了 AMD 混搭双卡跑 llama.cpp 可行,但正文没披露推理速度、功耗、稳定性等关键指标,实用价值有限。影响范围在 60–71 分档合理。
一句话点评
Reddit 用户 Jorlen 把一张 R9700 AI PRO(32GB)和一张 7800 XT(16GB)混插,用 llama.cpp 的 Vulkan 后端跑通了推理,48GB 显存够跑 70B 模型。但 ROCm 不支持 RDNA4 和 RDNA3 混插,直接罢工。跨卡通信开销和驱动兼容性是硬伤,实际推理速度可能打折。正文没披露具体延迟和吞吐量,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
19:42
22d ago
● P1彭博科技· rssEN19:42 · 05·22
Anthropic融资超300亿美元,估值突破900亿
彭博社援引知情人士消息,Anthropic 计划最快下周关闭一轮超过 300 亿美元的融资,投后估值超过 9000 亿美元。这个数字会让它超过 OpenAI,成为全球最值钱的 AI 创业公司。不过正文被 Bloomberg 的机器人验证墙挡住了,具体条款、投资方和资金用途都没披露。
#Anthropic#OpenAI#Bloomberg#Funding
精选理由
彭博说 Anthropic 最快下周就能把这轮超过 300 亿美元的融资关掉,投后估值冲到 9000 亿美元以上,按这个数字它会超过 OpenAI 成为估值最高的 AI 初创公司。我会先打个折:正文没披露具体投资人、资金用途和估值计算方式,而且交易还没落袋,所以重要性停在 91 分,没往 95 以上推。但这条消息本身够直接——钱、时间、排名三个要素都给了,对关注前沿实验室资本动态的人就是一条硬消息。
一句话点评
Anthropic 这轮融的钱比原定目标还多,估值直接反超 OpenAI,但 9000 亿这个数字得看最终条款会不会缩水。
锐评
Anthropic 这轮融资的规模和速度都挺夸张。超过 300 亿美元、估值破 9000 亿,如果下周真能敲定,它会直接超过 OpenAI 成为估值最高的 AI 创业公司。这个估值背后有收入数据在撑:公司预计第二季度营收 109 亿美元,比上季度翻了一倍多,而且可能首次实现盈利。年化营收目标也喊到了 500 亿美元,去年 7 月这个数字才 40 亿,增长曲线很陡。 不过这些数字目前都来自彭博社引用的匿名消息源,最终投资承诺和条款还在谈,存在变数。文章没披露这轮融资的具体领投方和资金用途,也没说 9000 亿估值是投前还是投后。另外,年化营收是按短期收入推算全年,如果后续季度增速放缓,这个数字会打折扣。 我会先打个折看这件事:收入增长是真的猛,但估值已经跑到很前面了。还缺的是具体的投资人名单、资金怎么花,以及这轮融资后离上市还有多远。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
19:34
22d ago
AI HOT 精选· aihot-apiZH19:34 · 05·22
ChatGPT语音模式现在能帮你填表了
拍一张表单照片,用嘴说你要填什么,ChatGPT就能把填好的版本吐出来。正文没提支持哪些格式、哪些语言、要不要额外付费、以及什么时候上线。
#Multimodal#Vision#Audio#ChatGPT
精选理由
HKR中H和K通过,因为语音+图像的表单填写是一个具体可用的新交互流程,用户能直观理解价值。R偏弱,这只是OpenAI的一个小产品更新,没有披露支持的文件格式、语言范围、定价或上线时间,信息缺口明显,所以分数落在60-71区间。
一句话点评
拍张表单照片,用嘴说填什么,ChatGPT 就能吐出填好的版本。这功能把语音和视觉串起来了,省了打字和手写。但正文没提支持哪些格式、哪些语言、要不要额外付费、以及什么时候上线。如果是免费且支持中文,日常填表确实方便;要是只限英文 PDF 或 Plus 用户独享,那实用性就大打折扣。等具体上线范围和定价出来再判断值不值得激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
19:34
22d ago
Hacker News 首页· rssEN19:34 · 05·22
Linux 音频子系统也迎来大量 AI 驱动的补丁
继网络子系统之后,Linux 音频子系统也出现了大量由 AI 生成的补丁。维护者 Takashi Iwai 表示,本周的修复中大部分是小问题,包括 HD-audio 中断处理、UAF(释放后使用)漏洞修复,以及针对 HP、ASUS 笔记本的 Realtek 声卡 quirks。邮件列表里能看到不少补丁标注了“assisted-by”,来自 Claude...
#Code#Linux#Phoronix#Hacker News
精选理由
H 和 R 通过:AI 参与 Linux 音频修复值得聊。K 不通过:缺补丁数、模型名、工作流,且内核维护这个角度太窄,受众有限。
一句话点评
Linux 7.1 音频子系统的修复补丁里,不少标注了“assisted-by”,来自 Claude Code 和 GPT-5.5。维护者说大部分是小问题,比如中断处理、UAF 漏洞和笔记本声卡 quirks。但正文没披露具体补丁数量,也没说 AI 贡献占比。真正该担心的是 review 负担——AI 写补丁快,但人工审核跟不上,质量风险就堆在那了。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
18:46
22d ago
Hacker News 首页· rssEN18:46 · 05·22
伪装成领域术语的注入攻击,多智能体系统几乎防不住
这篇论文发现,现有的 LLM 注入检测器有一个系统性盲区:如果攻击指令伪装成目标文档的领域术语和权威结构(作者叫“领域伪装注入”),检测率会从 93.8% 暴跌到 9.7%(Llama 3.1 8B),Gemini 2.0 Flash 也从 100% 掉到 55.6%。更夸张的是,生产级安全分类器 Llama Guard 3 一个都没拦住,检测率直接归...
#Agent#Safety#Research release#Safety/alignment
精选理由
H 和 R 通过,但 K 不通过:正文只有标题级信号,HN 7 分且零评论,缺乏机制、实验或指标。信息缺口太大,只能给 66 分,维持 tier all。
一句话点评
攻击指令伪装成目标文档的术语和格式,Llama 3.1 8B 检测率从 93.8% 暴跌到 9.7%,Gemini 2.0 Flash 从 100% 掉到 55.6%,生产级分类器 Llama Guard 3 一个都没拦住。论文只测了单作者、单轮注入,没披露多轮对话或实时流场景下的表现。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
18:17
22d ago
Hacker News 首页· rssEN18:17 · 05·22
KanBots:开源看板桌面应用,每张卡片上跑一个 AI 代理
KanBots 是一个开源桌面应用,把看板上的每张卡片变成一个独立的工作区,每个卡片可以并行跑一个 Claude Code 或 Codex 代理。你丢一个文件夹进去,它就自动生成看板,然后可以手动派代理干活,或者开“自动驾驶”模式——让产品经理、工程师、测试等角色自动拆任务、并行执行、互相检查输出。所有数据存在本地的 SQLite 里,代码不出机器,没...
#Agent#Tools#Kanbots#Hacker News
精选理由
标题说开源看板应用能在每张卡片上跑并行 agent,这个点对从业者很有吸引力——相当于把项目管理工具直接变成 agent 执行层。但正文信息严重不足:没给仓库地址、没讲 agent 怎么调度、没提支持哪些模型、也没说系统要求。目前只能当个概念钩子看,想复现或评估可行性还得等更多资料。
一句话点评
KanBots 把看板每张卡片变成一个独立工作区,并行跑 Claude Code 或 Codex 代理,还能开“自动驾驶”让产品经理、工程师等角色自动拆任务、互相检查。所有数据存在本地 SQLite,代码不出机器,这点对隐私敏感团队友好。开源 MIT 许可,免费,也有付费云版。但正文没披露并行代理的调度机制、任务冲突怎么处理,也没说支持多少卡片同时跑、延迟如何。如果只是简单轮询,大规模并行可...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
18:01
22d ago
r/LocalLLaMA· rssEN18:01 · 05·22
VPO:用向量奖励替代标量奖励,让模型在搜索时更愿意尝试不同答案
VPO(Vector Policy Optimization)把GRPO里单一的标量奖励改成了向量奖励,相当于给模型多个维度的反馈,而不是只给一个总分。实验显示,在四个任务上,VPO在pass@k和best@k这类测试时搜索指标上持平或超过了标量RL基线,搜索预算越大优势越明显。简单说,就是训练时鼓励模型生成更多样化的回答,这样在推理时多试几次就能找到...
#Reasoning#Code#Fine-tuning#Vector Policy Optimization
精选理由
HKR-H/K通过:钩子有反直觉点(多样性提升搜索),正文给出了具体替代方案(向量奖励换掉GRPO优势估计)和4个任务的pass@k/best@k测试结果。来源和影响都还在研究社区层面,所以分数维持在60-71区间。
一句话点评
VPO把GRPO的单一奖励改成向量奖励,训练时鼓励模型生成更多样化的回答。实验显示,在四个任务上,VPO在pass@k和best@k等测试时搜索指标上持平或超过标量RL基线,搜索预算越大优势越明显。简单说,就是训练时鼓励模型生成更多样化的回答,这样在推理时多试几次就能找到更好的答案。 关键数字:四个任务、pass@k和best@k指标。来源是Reddit帖子,正文被屏蔽,无法验证实验细节。...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
18:00
22d ago
AI HOT 精选· aihot-apiZH18:00 · 05·22
Google I/O 2026对话环节回顾
这篇博客回顾了Google I/O 2026的对话环节,主题涵盖AI、量子计算、机器人和创造力。但正文没有披露具体演讲者、产品发布或技术细节,信息量有限。
#Robotics#Google#Commentary
精选理由
这是一篇Google I/O 2026对话环节的回顾,正文只提到讨论了AI、量子计算、机器人和创造力,没有披露嘉宾名单、产品发布或任何技术参数。HKR三项全挂:没有悬念或发布钩子(h),信息量太少连关键事实都不够(k),对从业者来说没有可用的产品、成本或竞争信息(r)。按0/3规则直接排除。
一句话点评
Google I/O 2026 对话环节回顾,但正文没提任何具体演讲者、产品发布或技术细节,信息量约等于零。标题看着大,实际是篇活动总结,对从业者没参考价值。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
17:34
22d ago
r/LocalLLaMA· rssEN17:34 · 05·22
BeeLlama v0.2.0 发布:单张 RTX 3090 跑 Qwen 3.6 27B,速度冲到 164 tok/s
BeeLlama 新版本主打 DFlash 优化,单卡 RTX 3090 上 Qwen 3.6 27B 的生成速度达到 164 tok/s,是基线(未优化)的 4.4 倍;Gemma 4 31B 跑到 177.8 tok/s,提速 4.93 倍。提示词处理速度基本没掉(1214 vs 1229 tok/s),说明加速主要靠解码阶段。不过正文只贴了部分跑...
#Inference-opt#Vision#Tools#BeeLlama
精选理由
HKR 三项全过:单卡 RTX 3090、27B/31B 模型、4.40x/4.93x 加速比,既有钩子又有证据。分数维持 all,因为这是 Reddit 项目帖,基准表被截断,缺少复现细节,正文没披露完整对比数据。
一句话点评
BeeLlama v0.2.0 在单张 RTX 3090 上把 Qwen 3.6 27B 的生成速度拉到 164 tok/s,比基线快 4.4 倍;Gemma 4 31B 跑到 177.8 tok/s,提速近 5 倍。提示词处理速度几乎没掉,说明加速主要靠解码阶段,对长上下文场景友好。不过正文只贴了部分跑分表,Gemma 4 的完整数据没披露,实测条件(精度、上下文长度、batch size...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
17:25
22d ago
AI HOT 精选· aihot-apiZH17:25 · 05·22
Warp 终端现在能直接调 OpenRouter 的模型了
Warp 这个终端工具接入了 OpenRouter,工程师演示了怎么连 DeepSeek。正文只给了文档链接,没提价格和具体上线时间。
#Agent#Tools#OpenRouter#Warp
精选理由
这是一个小型的开发者工具集成。正文只给了文档链接,没有披露定价、模型覆盖范围或 Warp 具体能力变化,所以分数维持在 60–71 区间。
一句话点评
Warp终端现在能直接调OpenRouter的模型了,包括DeepSeek。对开发者来说,等于少装一个插件,在命令行里就能切换模型。但正文只给了文档链接,没提价格、延迟和具体上线时间,实际体验和成本未知。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
17:17
22d ago
The Verge · AI· rssEN17:17 · 05·22
别硬推 Grok 了,美国政府几乎不用它
路透社查了 400 多个美国政府 AI 使用案例,其中提到 Grok 或 xAI 的只有 3 个,而且都是写文档、管社交媒体这类基础活。正文没披露具体采购金额或用户数,但光看这个渗透率,Grok 在政府市场基本没存在感。Musk 一边把它吹成史上最大 IPO 的核心,一边实际落地数据却很骨感。
#Agent#Elon Musk#xAI#Reuters
精选理由
核心信息是路透社的硬数字:400 多个案例里 Grok 只出现 3 次,说明政府市场渗透率极低。但这是媒体评论,不是模型发布或政策变动,所以分数压在 60–71 区间。正文没披露那 3 个案例的具体部门或采购金额,信息缺口留着了。
一句话点评
路透社查了400多个美国政府AI使用案例,提到Grok或xAI的只有3个,还都是写文档、管社交媒体这类基础活。正文没披露具体采购金额或用户数,但光看这个渗透率,Grok在政府市场基本没存在感。Musk一边把它吹成史上最大IPO的核心,一边实际落地数据却很骨感。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:03
22d ago
AI HOT 精选· aihot-apiZH17:03 · 05·22
Perplexity 开源了供应链安全扫描器 Bumblebee
Perplexity 今天开源了一个叫 Bumblebee 的工具,专门扫描 macOS 和 Linux 开发者机器上的高风险软件包、扩展和 AI 工具配置。它是只读的,不会改你系统。亮点是连上他们的 Computer 平台后,一旦有新的供应链风险出现,可以自动触发更深的扫描。目前只支持 macOS 和 Linux,Windows 用户暂时用不了。代码...
#Tools#Perplexity#Open source#Product update
精选理由
HKR 三项都过:Perplexity 出安全工具出乎意料,扫描范围具体(包、扩展、AI 配置),供应链安全焦虑真实。但原文只是一条简短社交更新,没披露规则集、误报率、集成方式或采用数据,所以分数压在 60–71 区间。
一句话点评
Perplexity 开源了 Bumblebee,一个只读扫描器,专查 macOS/Linux 开发者机器上的高危包、扩展和 AI 工具配置。亮点是连上他们的 Computer 平台后,新风险出现能自动触发深度扫描。目前只支持 macOS 和 Linux,Windows 用户暂时用不了。 短评:开源供应链扫描工具,只读不写系统,连平台能自动触发深度扫描。但只支持 macOS/Linux,W...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:41
22d ago
r/LocalLLaMA· rssEN16:41 · 05·22
用 DeepSeek 和 65MB 模型在浏览器里检测提示注入,F1 达 99%
Reddit 用户 Everlier 用 ml-intern 和 DeepSeek v4 Flash 训练了一个 DistilBERT 分类器,专门检测提示注入攻击。模型转成 ONNX int8 后只有 65MB,能在浏览器里通过 Transformers.js v3 跑推理,F1 分数宣称达到 99%。不过作者自己提醒,训练和测试用的数据都是合成生成...
#Agent#Safety#Inference-opt#DeepSeek
精选理由
HKR三项都达标,但这是Reddit上的个人实验,99% F1背后的数据集和外部验证都没披露。具体模型大小和浏览器运行条件让这个方案有实用价值,但还不到专题推荐的程度。
一句话点评
一个 Reddit 用户用 DeepSeek v4 Flash 合成数据,训练了一个 65MB 的提示注入检测模型,宣称 F1 达 99%,还能在浏览器里跑。关键问题是训练和测试数据都是合成生成的,可能太像,真实场景效果要打折。正文没披露合成数据的具体分布和多样性,也没提对抗性测试结果。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:41
22d ago
AI HOT 精选· aihot-apiZH16:41 · 05·22
Luma Agents 上线 Seedance 2.0,一键生成电影级画面
Luma Agents 推出了 Seedance 2.0,主打人像、风景、科幻、奇幻四种风格,声称能一键生成电影级画面。正文没披露模型参数、分辨率、生成速度或价格,所以实际效果和可用性还不清楚。如果你对 AI 视频生成感兴趣,可以点链接试试,但先别太激动。
#Agent#Multimodal#Vision#Luma Labs
精选理由
H/K 通过,因为 Seedance 2.0 集成和场景覆盖算新事实;但正文没提价格、分辨率、生成时长和基准对比,属于常规小版本更新,从业者参考价值有限。
一句话点评
Luma Agents 上线了 Seedance 2.0,主打四种风格一键生成电影级画面。但正文没披露分辨率、生成速度或价格,实际效果和可用性未知。如果你对 AI 视频生成感兴趣可以试试,但先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
16:19
22d ago
Hacker News 首页· rssEN16:19 · 05·22
儿子用AI把老爸的法务会计工作自动化了62%
作者是12年经验的软件工程师,他老爸是法务会计(查欺诈、离婚藏钱那种)。他们拆了老爸15个旧案(1084小时、34.5万美元收费),算出62%的工作量可以自动化。大头是文档录入(占26%工时,90%可自动)——以前两周的活压缩到几小时,就能同时接10个案而不是3个。他们做了个叫CaseTrail的产品:先让AI逐页分类PDF、识别不同银行的流水单(这块...
#Tools#Hacker News#Product update
精选理由
H和R通过:标题钩子强,且切中职业自动化焦虑。K不通过:任务拆解、系统机制、可验证结果均未披露,信息不足。
一句话点评
一个软件工程师帮做法务会计的老爸拆了15个旧案,算出62%工作量可自动化。大头是文档录入(占26%工时,90%可自动),以前两周的活压缩到几小时,就能同时接10个案而不是3个。他们做了个叫CaseTrail的产品,让AI逐页分类PDF、识别不同银行流水单,还能按自然语言指令(比如“找离婚案隐藏资产”)自动跑分析并标记风险。上个月真在离婚案里几分钟就揪出一笔异常税务付款。 短评:数字扎实,场...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
16:17
22d ago
AI HOT 精选· aihot-apiZH16:17 · 05·22
Suno AI 做的《波多黎各》成夏日神曲,被美国早间节目 GMA 推荐
Suno 官方发帖说,今年夏天一首叫《波多黎各》的歌是用他们的 AI 工具做的,还上了美国早间节目 GMA 的推荐。帖子没透露播放量、创作者是谁、以及具体怎么生成的。
#Audio#Suno#GMA#Product update
精选理由
硬排除——纯营销:Suno 自己发帖说《Puerto Rico》用了它的工具、上了 GMA,但播放量、创作者、制作流程一概没披露,也没有第三方验证。
一句话点评
Suno 官方说《波多黎各》是AI做的,还上了GMA早间节目。但没提播放量、创作者和生成细节,更像品牌宣传。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H1·K0·R0
16:10
22d ago
AI HOT 精选· aihot-apiZH16:10 · 05·22
GitHub 连续第三年拿下 Gartner 企业级 AI 编程代理领导者象限
Gartner 把 GitHub 放在企业级 AI 编程代理的领导者象限,这是第三年。正文没披露具体的评估标准、竞争对手位置,也没说 Copilot 的企业采用数据。所以这个排名更多是品牌背书,不能直接当采购决策依据。
#Agent#Code#GitHub#Gartner
精选理由
触发硬排除规则5:这是一篇厂商获奖公告,核心事实是 GitHub 被 Gartner 认可,但正文没披露评估方法、竞品排名或 Copilot 采用数据。HKR 三项均不满足,因此排除。
一句话点评
GitHub Copilot 连续第三年被 Gartner 评为企业级 AI 编程代理领导者。但正文没披露评估标准、竞品位置和企业采用数据,这个排名更像品牌背书,不能直接当采购依据。短评:Gartner 连续三年把 GitHub 放领导者象限,但没给评分细节,当品牌新闻看就好。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K0·R0
16:10
22d ago
r/LocalLLaMA· rssEN16:10 · 05·22
ByteShape 量化让 35B 模型在 6GB 笔记本上跑出 33 tok/s,比 Unsloth 快 30%
ByteShape 发布了一种新的量化方法,在 6GB 显存的 RTX 3060 笔记本上运行 Qwen3.6-35B-A3B 模型,生成速度达到 33.1 tok/s,比 Unsloth 的 UD-IQ4_XS 量化快 30%。不过预填充速度是 564 tok/s,反而慢了 4%。测试基于 llama.cpp,上下文长度 65,536,部分计算交给了...
#Inference-opt#Code#ByteShape#Qwen
精选理由
一条Reddit基准测试,亮点是35B-A3B在6GB笔记本上输出速度33.1 tok/s,比Unsloth快30%,对本地推理用户有吸引力。但PP(首token延迟)反而慢了4%,且只测了单卡单模型,没有多轮对话或长上下文数据。正文没披露量化精度损失或实际任务效果,所以分数卡在60-71区间。
一句话点评
ByteShape 新量化方法在 6GB 显存笔记本上跑 35B 模型,生成速度 33.1 tok/s,比 Unsloth 快 30%,但预填充慢了 4%。实测基于 llama.cpp,上下文 65K,部分计算交给 CPU。注意这是单点测试,没披露其他模型或硬件下的表现,且预填充慢可能影响首字延迟。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:06
22d ago
彭博科技· rssEN16:06 · 05·22
渣打CEO称AI会让部分人变成“低价值人类”,道歉后工会仍不满
渣打银行CEO Bill Winters在一次发言中称AI可能导致部分员工沦为“低价值人类”,引发工会强烈抗议。他随后道歉,但全球最大工会联合会之一认为道歉不够,未能安抚劳工组织。正文未披露他原话的完整上下文、道歉的具体措辞,以及可能受影响的员工规模。
#Bill Winters#Commentary
精选理由
彭博信源加上CEO在AI与劳工问题上的失言,满足了HKR-H和HKR-R。HKR-K弱是因为帖子没给出原话、道歉文本、员工规模或具体政策跟进。
一句话点评
渣打CEO说AI可能让部分员工变'低价值人类',工会炸了,道歉也没用。正文没披露原话完整上下文、道歉具体措辞和受影响员工规模,信息缺口大。这事更多是公关危机,不是技术新闻。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
15:35
22d ago
r/LocalLLaMA· rssEN15:35 · 05·22
Qwen3-Coder 量化横评:UD-Q5_K_M 在 55GB 模型上保住 94% 的 top-1 准确率
Reddit 用户 alphatrad 用 3 块 Radeon Pro 9700 跑了一轮 Qwen3-Coder-Next 的量化对比测试。测试数据是 wikitext-2,切了 583 段,每段 512 token。结果里表现最好的 UD-Q5_K_M 量化版(55.2 GB)跟原版比,top-1 一致率 94%,平均 KL 散度 0.0217,...
#Code#Inference-opt#Benchmarking#Qwen
精选理由
Reddit 用户 alphatrad 用 3 张 R9700 PRO 在 llama.cpp Vulkan 上测了 Qwen3-Coder-Next 的量化版本,UD-Q5_K_M 在 wikitext-2 的 583 个块、上下文 512 下 top-1 达到 94.0%。测试条件偏窄——只用了 wikitext-2 一个数据集、上下文也短,所以分数压在 70 档,没到推荐位。信息够用:硬件、框架、数据集、准确率都给了,但没披露推理速度、显存占用或对比其他量化档位的完整表格,想自己复现的话得补这些。
一句话点评
Reddit 用户用 3 块 Radeon Pro 9700 测了 Qwen3-Coder-Next 的量化版,UD-Q5_K_M 跟原版 top-1 一致率 94%,KL 散度平均 0.0217,文件 55.2 GB。数据来自 wikitext-2,只切了 583 段、每段 512 token,测试规模偏小,结论参考价值有限。正文被屏蔽,没披露具体推理速度或显存占用,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
15:27
22d ago
彭博科技· rssEN15:27 · 05·22
理财App十年内会消失?AI助手替你管钱,你连界面都不用打开
Atomic Invest CEO David Dindi 在彭博视频里说,投资类App可能十年内就没了——AI助手会直接替你管组合,你连界面都不用打开。这个判断挺狠,但正文没披露具体产品怎么跑(是让模型直接下单还是只给建议),也没说监管怎么看待AI代客理财,更没有用户接受度的数据。所以这点先别太激动,方向有意思,但验证还很弱。
#Agent#Atomic Invest#David Dindi#Bloomberg
精选理由
Bloomberg采访里Atomic Invest CEO David Dindi放了个10年预言:投资App会被AI助手取代。观点够猛,但正文没披露任何产品、数据或实现机制,属于纯评论,所以落在60–71分档。
一句话点评
Atomic Invest CEO 在彭博视频里说,投资类App十年内会消失——AI助手直接替你管组合,连界面都不用打开。方向有意思,但正文没披露产品怎么跑(模型直接下单还是只给建议),也没说监管态度和用户接受度数据。这点先别太激动,验证还很弱。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:17
22d ago
彭博科技· rssEN15:17 · 05·22
Axon 总裁谈 AI 公共安全:无人机、企业安防与警务软件
Axon 总裁 Josh Isner 在 Bloomberg 访谈中透露,公司 AI 战略覆盖无人机、企业安防和公共安全软件三大块。正文没披露具体收入目标、产品参数、部署规模或上线时间表,所以目前只能听个方向,没法评估实际落地深度。
#Agent#Vision#Axon#Josh Isner
精选理由
HKR-R通过,但HKR-H太泛,HKR-K缺数字和机制。Bloomberg采访有来源价值,但事实只停在Axon的策略框架上,属于低价值行业报道区间。
一句话点评
Axon总裁在Bloomberg访谈里聊了AI安防三大块:无人机、企业安防、公共安全软件。但全文没披露任何收入目标、产品参数、部署规模或上线时间表,目前只能听个方向,没法评估实际落地深度。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
15:08
22d ago
r/LocalLLaMA· rssEN15:08 · 05·22
Qwen3.6 跑 MTP 反而变差,显存还涨了
一位用户在双卡 16GB+12GB 的本地环境里测了 Qwen3.6 27B 和 35B A3B,用 GLM 5.1 当裁判,给了一个模糊的 React 应用任务。结果开了 MTP(多 token 预测)后显存占用更高,生成质量反而下降;而 ngram-mod 没有出现这种退化。正文没披露具体测试次数和置信区间,所以这点先别太激动,但至少说明在显存吃紧...
#Inference-opt#Code#Benchmarking#Qwen
精选理由
一条 Reddit 帖子,有人用 GLM 5.1 测了 Qwen3.6 27B 和 35B A3B 两个模型,发现 MTP 在双 GPU 16GB+12GB 配置下不仅多占显存,还损伤效果,而 ngram-mod 没有类似退化。这个反直觉结果对本地跑模型的人是个意外发现,但帖子没交代样本量、具体任务和评测细节,所以只能当线索看,不能当结论。
一句话点评
有人在双卡16GB+12GB本地跑Qwen3.6 27B和35B A3B,发现开MTP(多token预测)反而显存更高、生成质量下降,而ngram-mod没这问题。测试次数和置信区间没披露,结论先打折。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:00
22d ago
Product Hunt · AI· rssEN15:00 · 05·22
Orchestria:AI 音乐引擎,能单独改鼓点或贝斯,不用整首重来
Orchestria 把 AI 生成的音乐拆成鼓、贝斯、旋律等独立音轨(stem),你可以用自然语言单独改某个乐器,比如“让贝斯更拨弦一点”,而不会破坏整体混音。输出是 24-bit / 44.1kHz 的 WAV 文件,音质达到录音室级别,且 100% 免版税。正文没披露用了什么模型、定价多少、什么时候开放,也没说生成一首歌要多久、算力成本高不高。目...
#Audio#Orchestria#Product update
精选理由
K勉强过关:颗粒级音轨控制是个可测试的功能点。H和R都不达标,整篇读起来像一张信息很薄的Product Hunt卡片——没模型、没定价、没上线条件,所以归入低价值浏览层级。
一句话点评
Orchestria 把 AI 生成的音乐拆成鼓、贝斯等独立音轨,你可以用自然语言单独改某个乐器,比如“让贝斯更拨弦一点”,不会破坏整体混音。输出是 24-bit / 44.1kHz 的 WAV,音质达到录音室级别,且 100% 免版税。但正文没披露用了什么模型、定价多少、什么时候开放,也没说生成一首歌要多久、算力成本高不高。目前只是个产品页,技术细节和可用性都是盲区,想用还得等。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
14:36
22d ago
● P1AI HOT 精选· aihot-apiZH14:36 · 05·22
BitCPM-CANN开源发布,华为昇腾NPU原生训练1.58比特大模型
ModelBest、清华和OpenBMB搞了个BitCPM-CANN,从0.5B到8B都有,全程用华为昇腾910B NPU训练,没走英伟达路线。1.58比特三元量化意味着每个权重只取三种值,内存比BF16省了约6倍,能塞进手机、电脑和车载设备里跑。基准测试成绩保住了全精度模型的95-97%,这点挺实在。我会先打个折:正文没披露具体推理延迟和功耗数据,也...
#Inference-opt#Benchmarking#ModelBest#Tsinghua University
精选理由
HKR三项都站得住:昇腾910B全栈训练1.58比特开源模型这个角度够新,数据也扎实。没给P1是因为目前只有发布事实,缺少独立复现或实际落地效果的佐证,所以先放在featured。
一句话点评
面壁智能在华为昇腾 NPU 上原生训练并开源了 1.58-bit 大模型,显存省了约 6 倍,能力保留率 90% 以上,但正文没给具体评测基准和延迟数据。
锐评
这条消息最值得看的是“全栈国产算力跑通了极低比特训练”。BitCPM-CANN 从量化算子到训练框架全在昇腾 910B 上完成,意味着以后在华为卡上做 1.58-bit 模型有了公共基础设施,不用每家从头搭一遍。四个尺寸(0.5B 到 8B)都开源了,官方说推理显存比 BF16 省约 6 倍,能力保留率在 90% 到 97.2% 之间,8B 模型能塞进旗舰手机跑。 但先别太激动。文章没交代这个“能力保留率”是在哪些基准上测的,也没提推理延迟和吞吐。极低比特模型最怕的是生成质量在长文本或复杂任务上掉得厉害,光看一个百分比不够。另外,训练成本、与同尺寸全精度模型在真实业务场景下的对比也都没给。如果后续能补上这些,才能判断它是不是真能当端侧主力模型用。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
14:30
22d ago
The Verge · AI· rssEN14:30 · 05·22
英联邦短篇小说奖得主被指用AI写稿,文学圈还没准备好
《The Verge》报道,今年英联邦短篇小说奖的一篇获奖作品《The Serpent in the Grove》被怀疑是AI写的。作者Jamir Nazir的文章里出现了混合隐喻、排比句和“三点式”列举——这些都是大语言模型生成文本的常见特征。Granta杂志从2012年起刊登该奖的区域得主,但这次没有公布任何验证证据,只靠文本特征判断。正文没披露作...
#The Verge#Granta#Jamir Nazir#Commentary
精选理由
H和R过关,但K很弱:文章只提供了怀疑和Granta的背景,没有可验证的证据、检测方法或市场数据。这是文化信号,不是模型、产品或政策故事。
一句话点评
英联邦短篇小说奖一篇获奖作品被指AI生成,特征包括混合隐喻、排比和三点式列举。Granta杂志仅凭文本特征判断,未公布验证证据。正文没披露作者回应或检测工具。判断靠风格而非证据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
14:16
22d ago
Product Hunt · AI· rssEN14:16 · 05·22
Cohere 发布 Command A+:开源企业模型,主打跑 Agent 效率
Cohere 今天在 Product Hunt 上架了 Command A+,号称是自家最快最强的语言模型,开源、面向企业,专门用来跑高绩效的 AI Agent。正文没披露参数量、定价、上下文窗口和具体发布时间,所以性能到底多强、能不能本地跑、成本多少,目前都只能看他们自己说的“最高效率”。不过既然打“开源企业工作马”的标签,推测是想让企业拿它做业务流...
#Cohere#Product Hunt#Product update
精选理由
Cohere 给这条消息带来一定权重,但正文只提了 Command A+ 及其企业定位;参数、价格、上下文窗口和评测结果都没披露。HKR 只有 K 通过,所以属于低价值的产品更新。
一句话点评
Cohere 在 Product Hunt 上架了 Command A+,号称自家最快最强的开源模型,专为企业跑 AI Agent 设计。但正文没披露参数量、定价、上下文窗口和发布时间,性能多强、能不能本地跑、成本多少,目前只能看他们自己说的“最高效率”。打“开源企业工作马”标签,推测是想让企业拿它做业务流,但缺关键数字,建议等第三方跑分和定价出来再评估。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
14:11
22d ago
彭博科技· rssEN14:11 · 05·22
英国IT分销商Softcat上调利润预期,股价涨13%,自称AI赢家
Softcat上调了全年利润预期,股价当天跳涨13%。公司把自己重新定位成AI受益者,但正文没披露具体上调了多少、AI业务怎么赚钱。投资者态度在转,这点先别太激动——目前只知道市场信了,但不知道信的是什么。
#Softcat#Commentary
精选理由
HKR-H勉强过关,因为AI股票叙事反转有话题性;但HKR-K/R都不及格:没给指引上调幅度、财务指标或AI收入机制。属于低价值浏览项,不推荐重点展示。
一句话点评
Softcat 上调全年利润预期,股价当天涨 13%。公司把自己包装成 AI 受益者,但正文没披露具体上调了多少、AI 业务怎么赚钱。投资者态度在转,这点先别太激动——目前只知道市场信了,但不知道信的是什么。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
13:43
22d ago
r/LocalLLaMA· rssEN13:43 · 05·22
Qwen 3.6 写德语文档翻车,本地模型处理非英语任务还差点意思
一位用户用 Whisper 转录了一小时的心理治疗录音,然后让本地模型生成德语病历文档。Qwen 3.6 的 27B 和 35B 版本以及 Gemma 41B 都出现了用词不自然、重点信息筛选能力弱的问题。正文没披露具体用了多少条样本、提示词怎么写、跑在什么硬件上,也没给量化评估指标。结论是:本地模型处理德语这类非英语的垂直场景任务,质量还不太够用。
#Audio#Fine-tuning#Agent#Qwen
精选理由
HKR-H 和 HKR-R 靠一个具体的本地 LLM 德语翻车案例通过;HKR-K 不通过,因为帖子没有可复现的提示词、输出、样本量或评分指标。
一句话点评
一位用户用 Whisper 转录一小时心理治疗录音,让本地模型写德语病历。Qwen 3.6 的 27B/35B 和 Gemma 41B 都出现用词不自然、抓不住重点的问题。正文没披露用了多少样本、提示词怎么写、跑在什么硬件上,也没给量化评估。结论:本地模型处理德语这类非英语垂直场景,质量还不太够用。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
13:28
22d ago
Product Hunt · AI· rssEN13:28 · 05·22
Vibedock:菜单栏一键开关 Claude Code 的 MCP 服务器
Vibedock 是一个 macOS 菜单栏工具,让你一键开关 Claude Code 的 MCP 服务器。每个 MCP 服务器都会在每次对话时把它的工具定义塞进上下文窗口,不管你这轮用不用。Vibedock 帮你按需开关,省 token 也省上下文空间。它会自动杀掉并重启 Claude 会话让改动生效。目前只支持 macOS,免费,正文没披露是否支持...
#Code#Tools#Vibedock#Claude
精选理由
一个小工具发布,绑定 Claude Code 和 MCP 工作流,所以 HKR-R 成立,HKR-H 和 HKR-K 都弱。平台、价格、版本、配置方式全没披露,只能算普通产品更新。
一句话点评
Claude Code 每轮对话都会把所有 MCP 工具定义塞进上下文,不管用不用。Vibedock 是个 macOS 菜单栏工具,让你一键开关 MCP 服务器,省 token 也省上下文空间。免费,但只支持 macOS,正文没披露是否支持 Windows/Linux,也没说配置机制。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K0·R1
13:07
22d ago
Hacker News 首页· rssEN13:07 · 05·22
Sam Altman 赢了官司,但我们都输了
《纽约客》评论说,Altman 赢了 Musk 的诉讼,但这场官司不像 Elizabeth Holmes 或 SBF 案那样让人看到恶有恶报——两边都是硅谷大佬,谁赢都谈不上正义。正文没有披露具体诉讼请求、判决细节、审理法院或案件时间线。
#Sam Altman#Elon Musk#OpenAI#Policy
精选理由
标题有钩子,但正文只给了 HN 元数据,没写任何案件细节、判决或法院,信息缺口太大,没法判断实际价值。
一句话点评
《纽约客》评论Altman赢了Musk的官司,但说两边都是硅谷大佬,谁赢都不代表正义。正文没披露具体诉讼请求、判决细节或法院信息,更像一篇立场评论而非案件报道。想了解法律影响的话,信息缺口很大。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
12:34
22d ago
r/LocalLLaMA· rssEN12:34 · 05·22
SupraLabs发布Supra-50M轻量级语言模型
SupraLabs 放出了 Supra-50M,一个 50M 参数的 Llama 风格解码器模型,用 20B 的 fineweb-edu 数据训练。Base 和 Instruct 两个版本都已上传 Hugging Face。50M 参数意味着它可以在普通 CPU 或低端 GPU 上跑推理,适合资源受限的场景。20B tokens 的训练量不算大,但 f...
#Reasoning#Code#Benchmarking#SupraLabs
精选理由
HKR-K和HKR-R通过:帖子给出了具体的模型大小和训练数据量,对本地部署有吸引力。HKR-H较弱:只是Reddit上一条发布帖,没有跑分、许可证或实际用例证明。
一句话点评
SupraLabs 刚放出一个 50M 参数的小模型,用 20B tokens 的 fineweb-edu 数据训练。50M 意味着普通 CPU 或低端显卡就能跑,适合嵌入式或边缘设备。20B tokens 训练量不大,但 fineweb-edu 是高质量教育数据,效果可能比同尺寸模型好一点。Base 和 Instruct 两个版本已上传 Hugging Face。短评:小模型赛道又添一员,...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
12:00
22d ago
AI HOT 精选· aihot-apiZH12:00 · 05·22
Cursor 被 Gartner 评为 2026 年企业级 AI 编码代理魔力象限领导者
Gartner 把 Cursor 放到了 2026 年企业级 AI 编码代理魔力象限的领导者象限,而且它在“愿景完整性”这个维度上得分最高。超过 70% 的财富 500 强公司已经在用 Cursor 来部署和管理编码代理(就是让 AI 帮忙写代码、修 Bug 的自动化工具)。Cursor 接下来打算自己训练更强的模型(已经和 SpaceXAI 合作了)...
#Agent#Code#Tools#Cursor
精选理由
Cursor 自己发稿说被 Gartner 评为 2026 年企业级 AI 编码代理领导者,还提到超过 70% 的财富 500 强在用。这个渗透率数字挺实在,说明企业市场确实在批量上编码代理。但来源是 Cursor 自家的分析师奖项通稿,权威性打点折扣,而且领导者标签本身不意外——更像市场验证而非技术突破。对关注企业级开发工具采购和编码代理竞争格局的从业者来说,这条值得扫一眼,但不用太激动。
一句话点评
Gartner 把 Cursor 评为企业级 AI 编码代理的领导者,愿景完整性得分最高。超过 70% 的财富 500 强在用,这个渗透率挺高。但 Gartner 报告本身是付费内容,正文没披露具体评估细节,比如对比了哪些竞品、评分标准是什么。Cursor 说自己要自研模型,还找了 SpaceXAI 合作,这点先别太激动——合作细节和模型进展都没说。短评:Gartner 背书+大客户覆盖率是...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
11:28
22d ago
Hacker News 首页· rssEN11:28 · 05·22
安娜的档案馆向大语言模型发布公开信提供数据获取方案
安娜的档案(Anna's Archive)发布了一篇标题为“如果你是大模型,请读一下”的博客。正文核心是告诉爬虫机器人:网站有验证码防爬,但所有数据其实都可以通过GitLab、种子文件或JSON API免费批量下载。如果大模型需要更快更稳定的SFTP访问,可以付费捐赠获得。文章还调侃说“你训练时大概率用过我的数据”,建议把省下来的验证码破解成本直接捐给...
#Anna's Archive#Hacker News#Commentary
精选理由
触发硬排除规则6:可见文本除了标题和HN数据外,没有任何数据、示例或机制说明。HKR-H靠标题噱头成立,但HKR-K和HKR-R因为正文信息缺口太大,无法给出实质性判断。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R0
11:17
22d ago
● P1AI HOT 精选· aihot-apiZH11:17 · 05·22
阿里千问 App、PC 及网页端上线 Qwen3.7-Max,免费可用
千问 App 更新到 6.9.7 版就能在对话框里切到 Qwen3.7-Max,PC 和网页端也一样,目前免费。官方说这个模型主打“让模型进业务流程干活”,能写代码、自动跑办公流程,还能扛住长任务——他们自己测了一次 35 小时、调用工具超过 1000 次的内核优化实验,全程没断思路。不过这些数据来自官方测试,实际体验会不会打折还得自己试。另外,API...
#Agent#Code#Tools#Alibaba
精选理由
阿里把 Qwen3.7-Max 铺到千问全线产品,门槛降到免费,还特意强调 35 小时连续工具调用没崩,摆明了在打 agent 可靠性和零成本体验这两张牌。我会先打个折:正文没给基准测试、上下文窗口和 API 定价,所以实际能力上限和商用成本还看不清。但就凭多端同步上线和这个压测结果,对正在选模型做工具链集成的人来说,是个值得立刻上手试的信号。
一句话点评
千问 App 更新后能免费用 Qwen3.7-Max,官方说它能跑 35 小时不断思路,但这是自家测试,实际稳不稳还得自己上手试。
锐评
阿里把最新的 Qwen3.7-Max 直接塞进了千问 App、PC 和网页端,更新到 6.9.7 版就能免费用。这个模型的核心卖点是“让模型进业务流程干活”,也就是所谓的智能体能力。官方给了一个很具体的数字:在一次内核优化实验里,它自主跑了 35 个小时,调用了超过 1000 次工具,全程没断思路。这个数字如果真实,说明它在处理长链条、多步骤任务时的稳定性确实不错,至少比动不动就忘掉上下文的模型强。 但这里有个关键信息缺口:这个 35 小时的测试是官方自己跑的,任务场景、失败重试次数、人工干预比例都没披露。所以这个数字更像一个上限参考,实际用起来,比如让它自动处理几十封邮件或写一个复杂项目,效果可能会打折。另外,文章提到它能跨框架部署,在 Claude Code 等工具里也能用,这对开发者是个好消息,不用被绑在单一工具上。 目前 API 还没上线,只能通过官方客户端体验。想评估它到底能不能扛住真实业务,最好等 API 开放后,用自己的任务跑一遍,重点关注它在第 20 步、第 50 步时的逻辑连贯性和错误恢复能力。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
10:57
22d ago
AI HOT 精选· aihot-apiZH10:57 · 05·22
PixVerse App 上线图像生成,手机端也能文生图
PixVerse 在自家 App 里加了图像生成功能,输入提示词或传参考图就能在手机上出图。5月24日到31日每人免费3次,之后要花钱。转发关注还能抽300积分,限72小时。功能本身不新鲜,但说明视频生成工具开始往多模态走。
#Multimodal#Vision#PixVerse#Product update
精选理由
PixVerse App 新增图像生成功能,支持文生图和参考图生图,5月24-31日每人免费3次。属于小版本更新,有具体使用细节,所以 K 通过、归入 all。H 和 R 不通过,因为没提生成质量、定价、分发规模或竞争对比。
一句话点评
PixVerse 在自家 App 里塞了个文生图/图生图功能,手机端直接出图。5月24-31日每人免费3次,之后收费。功能本身不新鲜,但说明视频生成工具开始往多模态走,先抢个入口。短评:视频工具加个图生图,功能不新但补模态,免费3次算尝鲜,后续收费看留存。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K1·R0
10:44
22d ago
r/LocalLLaMA· rssEN10:44 · 05·22
GGUF 模型突然掉速?先检查文件是否损坏
Reddit 用户 yeah-ok 发现两个 GGUF 模型从 20+ token/s 掉到 5 token/s,用 sha256sum 一查是文件损坏了,重新下载就恢复。推测是手动嵌入 MTP 层时搞坏了文件。如果你本地跑模型突然变慢,先跑个校验,别急着调参数。
#Inference-opt#Qwen#Unsloth#Incident
精选理由
一条本地模型跑飞后的排查记录:Reddit 用户 yeah-ok 发现 Qwen 的 GGUF 文件下载损坏,导致推理速度从 20+ tg/s 暴跌到 5 tg/s,用 sha256sum 校验后重下恢复。正文没披露具体是哪个 Qwen 版本或量化格式,也没说损坏原因(可能是下载中断或存储介质问题)。对跑本地模型的人来说,这个排查路径(先查文件完整性)有参考价值,但只是一个用户案例,不是系统性漏洞或优化方案,所以重要性中等,适合所有关注本地推理的读者看一眼。
一句话点评
本地跑 GGUF 突然从 20+ token/s 掉到 5 token/s,别急着调参数——先跑 sha256sum 校验文件完整性。Reddit 用户 yeah-ok 发现是手动嵌入 MTP 层时搞坏了文件,重下就恢复。正文没披露具体模型和损坏机制,但这条提醒对自部署用户很实用:文件损坏比参数调错更隐蔽,校验成本几乎为零。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
10:38
22d ago
Hacker News 首页· rssEN10:38 · 05·22
Antigravity 2.0 在 OpenSCAD 建筑 3D 模型评测中排第一
ModelRift 团队用万神殿(Pantheon)的参考图,让六个模型写 OpenSCAD 代码生成 3D 建筑。评测结果:Antigravity 2.0 综合最好,Cursor Composer 跑得最快但效果最差。OpenSCAD 的好处是代码即几何,模型可以直接说“绕半径排 28 根柱子”,比让模型操作 3D 软件更直接。不过正文没披露测试集大...
#Benchmarking#Code#Antigravity 2.0#OpenSCAD
精选理由
H 钩子成立,因为 3D CAD/代码评测少见。K 不成立,因为分数、测试条件、模型列表都没披露,属于低价值榜单。
一句话点评
Antigravity 2.0 在 OpenSCAD 写 3D 建筑评测里综合第一,Cursor Composer 最快但效果垫底。评测用万神殿参考图,让模型写代码生成柱廊、穹顶等结构,比让模型操作 3D 软件更直接。但正文没披露测试集大小、评分指标和对比模型版本,结果只能当参考。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H1·K0·R0
10:11
22d ago
r/LocalLLaMA· rssEN10:11 · 05·22
Box for Linux:一个跑本地模型的桌面应用,但闭源且只支持 Ubuntu 26.04
开发者发布了 Box 0.1.0 for Linux,一个基于 GTK4/libadwaita 的桌面应用,专门跑 Gemma 4 E2B/E4B 的 LiteRT-LM 模型。首次运行要下载约 2.59GB 的模型文件,支持语音、摄像头实时视觉、文档问答、网页搜索、文件系统访问和记忆功能,还内置了可选的 agent 工具(让模型进业务流程干活)。但注...
#Agent#Vision#Audio#Box
精选理由
一个开发者工具的小版本发布,但离线跑 Gemma 4 这个点对本地部署党有吸引力。信息够具体(版本、系统、模型大小),不过正文没披露推理速度或硬件要求,这点先别太激动。影响面窄,给 68 分合理。
一句话点评
一个 Linux 桌面应用,专跑 Gemma 4 的 LiteRT-LM 模型,首次下载约 2.59GB。支持语音、摄像头实时视觉、文档问答、网页搜索和记忆,还内置了可选的 agent 工具。但正文没披露模型跑在什么硬件上、推理速度如何,也没说是否开源。如果真能在普通笔记本上流畅跑视觉和 agent,那挺实用,但这点先别太激动——等实测。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:51
22d ago
彭博科技· rssEN08:51 · 05·22
AI动画长片《Critterz》因OpenAI关停Sora错过戛纳首映,正在找新AI伙伴
一部全长AI动画《Critterz》原本计划在戛纳电影节首映,展示OpenAI视频生成工具Sora的潜力,结果OpenAI把Sora关了,片子没赶上首映。团队现在得重新找一家AI公司合作。正文没披露Sora关停的具体原因,也没说新伙伴找得怎么样了。
#Multimodal#Vision#OpenAI#Sora
精选理由
HKR三项都成立:Sora、戛纳、合作方断联,构成一个具体的供应商风险故事。来源是彭博社,但事件本身是电影制作受挫,不是OpenAI的重大产品或政策变动,所以重要性中等偏上,不调分。
一句话点评
一部全长AI动画《Critterz》原计划在戛纳首映,结果OpenAI把Sora关了,片子没赶上。团队现在得重新找AI公司合作。正文没披露Sora关停的具体原因,也没说新伙伴找得怎么样了。这事说明:依赖单一AI工具做长内容风险很高,平台一关项目就卡住。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:49
22d ago
r/LocalLLaMA· rssEN08:49 · 05·22
ztok:一个用 Zig 写的快几倍的分词器,能直接加载 tiktoken / HF / SentencePiece
FaustAg 开源了 ztok,一个用 Zig 写的分词库,能直接加载 .tiktoken、HuggingFace tokenizer.json、SentencePiece .model、TokenMonster 和 Mistral Tekken 这些格式。实测在 EPYC 24核48线程机器上,单线程比 tiktoken 快约2倍,批量处理快3.8...
#Tools#RAG#Code#ztok
精选理由
HKR 三项都成立:速度声称、基准数字、本地推理成本角度都很具体。不过这只是个关于小众工程库的单帖,所以分数没到 72 的精选线。
一句话点评
ztok 是一个用 Zig 写的分词库,能直接加载 tiktoken、HuggingFace、SentencePiece 等主流格式。实测在 EPYC 24核48线程机器上,单线程比 tiktoken 快约2倍,批量处理快3.8-5.5倍。还提供了8种语言绑定,通过一个 C ABI 调用。 短评:分词速度翻倍,批量场景更明显,但实测只在 AMD EPYC 上跑过,Intel 和 Apple...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
08:45
22d ago
量子位 · 公众号· rssZH08:45 · 05·22
LeCun 砸10亿美元押注的世界模型,这家中国视觉团队早就开始做了
LeCun 最近高调押注的“潜在空间世界模型”,北京时识科技(Shiqi Future)说自己已经布局了。5月15日他们和百度智能云联合发布了 EgoTwin,一个给自动驾驶和机器人用的视觉理解系统。核心卖点是手部3D对齐引擎,号称采集训练数据的效率是主流方案的3.75倍。但正文没披露具体对比对象和测试场景,这个倍数先打个折看。团队之前主要做手势识别和...
#Vision#Robotics#Multimodal#Shiqi Future
精选理由
HKR三项都过,但事实来源是一篇产品稿,3.75倍这个数字没披露测试条件或第三方验证。这条放在中等权重的机器人/视觉更新档位,不到推荐位。
一句话点评
时识科技说自己的手部3D对齐引擎采集训练数据效率是主流方案的3.75倍,但正文没披露对比对象和测试场景,这个倍数先打个折看。团队之前主要做手势识别,这次搭上LeCun的“潜在空间世界模型”概念,实际落地效果还缺第三方验证。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
08:45
22d ago
量子位 · 公众号· rssZH08:45 · 05·22
周鸿祎给虾塘装了个云端办公室:360安全云虾版上线,设备关机任务不中断
360发布了安全云虾云端版和云虾教练,核心卖点是云主机、云存储、云浏览器加1000多个预设专家智能体。文章说设备关机后任务还能继续跑,配置一个自定义写作智能体大约两分钟。但正文没披露云虾教练的具体训练数据来源和效果验证,这点先别太激动。
#Agent#Tools#Memory#360
精选理由
360 这个安全龙虾云端版和龙虾教练,核心卖点是云上跑Agent、关机也能用、两分钟生成一个专属Agent。标题的龙虾梗有点意思,但正文没解释为什么叫龙虾,也没披露定价、模型参数或跟竞品比怎么样。功能点够具体,但缺少成本、性能或生态层面的信息,所以分数压在60-71区间。
一句话点评
360 把云电脑包装成“云虾”,主打设备关机后任务不中断,配了 1000 多个预设智能体,号称两分钟搭一个写作助手。但正文没披露训练数据来源和效果验证,这点先别太激动。如果真能低成本跑长任务,对个人开发者算个便利,但安全性和实际延迟存疑。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
08:10
22d ago
AI HOT 精选· aihot-apiZH08:10 · 05·22
18年老粉与微软GitHub决裂:平台天天崩,代码还被偷,我走了
GitHub 18年老用户、Ghostty终端作者Mitchell Hashimoto公开宣布弃用GitHub,原因是平台频繁宕机,每天把他锁在外面好几个小时,没法正经写代码。他打包所有项目资产走人。这只是一个缩影:GitHub最近被黑客攻破3800多个内部仓库,源代码被挂网叫卖5万美元,起因是一名工程师装了带毒的VS Code插件,凭证被偷。更早前还...
#Code#GitHub#Microsoft#Mitchell Hashimoto
精选理由
H/K/R三项都成立,但这是开发者平台可靠性和安全事件,不是AI模型、智能体、Copilot或AI产品更新。AI RADAR匹配度弱,所以分数压在40以下。
一句话点评
GitHub 18年老用户、Ghostty作者Mitchell Hashimoto因平台频繁宕机(每天被锁几小时)公开弃用,并打包项目走人。更严重的是,黑客攻破3800+内部仓库,源代码被挂网叫卖5万美元,起因是一名工程师装了带毒VS Code插件。微软收购后GitHub并入CoreAI团队、取消CEO职位,管理层动荡。正文未披露GitHub后续修复计划及用户迁移数据。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H1·K1·R1
07:38
22d ago
r/LocalLLaMA· rssEN07:38 · 05·22
柠檬MLX引擎新版本:AMD ROCm跑本地大模型,修了Qwen3/3.5/3.6的bug
lemon-mlx-engine 发布了基于 ROCm 7.13 的新版本,让 AMD 显卡用户也能用 MLX 引擎跑本地大模型。这次更新主要修了 Qwen3、3.5 和 3.6 的 MoE 和密集模型里的一些内核和 bug,但正文没披露跑分数据,所以实际性能提升多少还不清楚。如果你手头有 AMD 卡想试新 ROCm 栈,可以更新看看,但别急着下结论—...
#Inference-opt#Tools#lemon-mlx-engine#ROCm
精选理由
一个小型开源推理引擎更新:HKR-K 有具体的 ROCm/Qwen 修复,HKR-R 切中本地推理 AMD 用户的痛点。信息来源单薄,没有跑分或生态影响,所以停留在常规产品更新区间。
一句话点评
lemon-mlx-engine 新版本集成了 ROCm 7.13,让 AMD 显卡用户也能用 MLX 引擎跑本地大模型。主要修了 Qwen3/3.5/3.6 的 MoE 和密集模型里的内核和 bug,但正文没披露跑分数据,实际性能提升多少还不清楚。如果你手头有 AMD 卡想试新 ROCm 栈,可以更新看看,但别急着下结论——没跑分就是没证据。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
07:34
22d ago
AI HOT 精选· aihot-apiZH07:34 · 05·22
X平台发帖体验太差,开发者用ChatGPT做了个插件救场
一条推文吐槽X平台的产品经理不行,发文章体验很烂。有开发者直接用ChatGPT(通过codex/goal)写了个Markdown转换插件,拖拽文件就能生成X文章格式,开源且提供了谷歌插件版本。正文没披露插件具体安装量或用户反馈,但至少说明原生体验确实有痛点,逼得用户自己动手。
#Code#Tools#X#ChatGPT
精选理由
痛点具体、产物明确、能引起同类开发者共鸣,HKR三项都过。但这是个轻量工具,正文没披露下载量、GitHub星数或实际使用反馈,信息缺口明显,所以分数压在60–71区间。
一句话点评
短评:X发文章体验差到逼用户自己写插件,ChatGPT顺手就搓了一个。 点评:X平台发文章体验烂到用户自己动手写插件,这本身就是个产品事故。开发者用ChatGPT(通过codex/goal)搞了个Markdown转X文章格式的插件,拖拽文件就能用,开源还上了谷歌插件商店。这事说明两点:一是原生编辑器确实拉胯,二是现在用AI搓工具的门槛低到离谱,一个人半天就能补上大厂产品缺口。不过正文没披露...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
06:35
22d ago
Product Hunt · AI· rssEN06:35 · 05·22
Faby:一个住在 Slack 里、自带电脑的虚拟同事
Faby 是一个嵌入 Slack 的 AI 代理,它有自己的电脑、浏览器和编程环境,能直接在 Slack 里接任务并端到端执行,比如拉数据、做报表、写代码、修工单。创始人说,大多数 AI 工具只给建议,不干活,Faby 想解决的是“把活干完”这一步。它背后用了 Cursor、Claude Code 和 OpenAI Codex 3.0 来驱动执行。目前...
#Agent#Tools#Faby#Product Hunt
精选理由
HKR-H 靠'Slack 虚拟同事+独立电脑'这个产品钩子过关,但 K 和 R 都挂掉,因为正文没给模型、权限、价格或任务证据。这只是一个低价值的产品亮相,先别太激动。
一句话点评
Faby 相当于在 Slack 里塞了一个自带电脑、浏览器和编程环境的虚拟同事,能直接拉数据、写代码、修工单,而不是只给建议。背后用了 Cursor、Claude Code 和 OpenAI Codex 3.0 来干活,听起来挺全能。但正文没披露定价、权限模型和任务成功率,实际跑复杂流程时会不会翻车、成本高不高,都得打个问号。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
06:00
22d ago
AI HOT 精选· aihot-apiZH06:00 · 05·22
DeepSeek V4 Flash 冲上周榜第一
OpenRouter 发帖说 DeepSeek V4 Flash 登顶周排行榜,但没说是哪个榜、评测指标是什么、对比了哪些模型、样本量多大。目前只能确认排名结果,其他细节一概缺失,建议等官方或第三方详细报告再下结论。
#Benchmarking#DeepSeek#OpenRouter#Benchmark
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过:正文只说了登顶周榜,没有方法论、指标或可复现的对比,信息不足以支撑判断。
一句话点评
OpenRouter 发帖说 DeepSeek V4 Flash 登顶周榜,但没说是哪个榜、评测指标、样本量、对比了哪些模型。目前只能确认排名结果,其他细节一概缺失,建议等官方或第三方详细报告再下结论。短评:榜名、指标、样本量全没提,先别急着信。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
05:50
22d ago
r/LocalLLaMA· rssEN05:50 · 05·22
花两年半搭了个“准本地”AI工作站,9个本地模型+云端兜底
一位Reddit用户花了2.5年,用Msty Studio+LiteLLM搭了一套混合AI工作流:本地跑了9个模型端点,算力约25.3 TFLOPs(大概相当于一块中端显卡),还做了Docker容器监控、模型降级链和成本追踪。核心思路是“能本地就不上云”,本地搞不定再自动切云端API兜底。正文没披露具体硬件配置和延迟数据,但25.3 TFLOPs这个数...
#Agent#Tools#Inference-opt#Msty Studio
精选理由
HKR 三项都过,但这就是一个 Reddit 个人展示帖,没有可复现的基准测试、开源仓库或采用信号。第一人称的搭建数字拉高了可读性,但不足以进 featured。
一句话点评
一位Reddit用户花2.5年搭了一套“准本地”AI工作流:本地跑9个模型(约25.3 TFLOPs算力,相当于一块中端显卡),搞不定再自动切云端API兜底。还做了Docker监控、模型降级链和成本追踪。核心思路务实:能本地就不上云。但正文没披露具体硬件和延迟数据,25.3 TFLOPs这个数偏保守,实际体验可能打折。适合想省API费、又不想全自建的人参考。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K1·R1
04:54
22d ago
Hacker News 首页· rssEN04:54 · 05·22
CODA:将Transformer块重写为GEMM后处理程序
训练 Transformer 时,除了矩阵乘法(GEMM)这种密集计算,还有大量内存搬运操作——归一化、激活函数、残差连接、归约等。这些算子本身算得少、搬得多,在优化得很好的训练栈里越来越拖后腿。CODA 的思路是把它们写成 GEMM 的“尾段程序”(epilogue),让这些操作在 GEMM 的输出块还留在片上缓存时就执行完,不用写回全局内存再读。论...
#Inference-opt#Research release
精选理由
触发硬排除——技术可及性不足:GEMM-Epilogue 重写需要内核和编译器背景才能理解,而 RSS 正文只给了 arXiv 和 HN 链接,没有披露任何性能数据、方法细节或可复现的配置,信息缺口太大,无法判断实际价值。
一句话点评
这篇论文把Transformer里那些零散的归一化、激活函数、残差连接等操作,直接塞进矩阵乘法(GEMM)的尾声阶段,让数据在芯片上算完再写回内存,省掉大量读写开销。核心思路是把这些算子重写成GEMM的“后处理程序”,保持高性能的同时还能灵活组合。作者用人类手写和LLM生成的kernel都跑出了不错的效果,说明这条路在工程上可行。不过论文目前只覆盖了标准Transformer块,没提对注意力...
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K1·R0
04:47
22d ago
Hacker News 首页· rssEN04:47 · 05·22
KVBoost:给 HuggingFace 模型加个 KV 缓存复用,首 token 延迟快 5–48 倍
KVBoost 是一个即插即用的推理加速库,核心思路是把 prompt 切成小块并哈希,命中缓存块就直接跳过 attention,只算新 token。实测多轮对话的缓存命中率从第 2 轮的 45% 涨到第 5 轮后的 85%,首 token 延迟从 HuggingFace 默认的 850ms 降到 210ms。它还支持 AWQ 量化后的层流式加载,32...
#Inference-opt#HuggingFace#KVBoost#Product update
精选理由
HKR 三项都过,但正文只给了机制和 5–48x 的 TTFT 加速倍数,没披露测试模型、硬件和复现条件。当一个小型 Show HN 工具看,分数压在 60–71 合理。
一句话点评
KVBoost 把 prompt 切成小块哈希,命中缓存块就跳过 attention,只算新 token。多轮对话第 5 轮后缓存命中率 85%,首 token 延迟从 850ms 降到 210ms,比 HuggingFace 默认快 3-5 倍。还支持 AWQ 量化后层流式加载,32B 模型跑在 8GB 显存卡上,但解码速度只有 0.11 tok/s——PCIe 带宽瓶颈,适合省显存不适合...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
04:30
22d ago
● P1AI HOT 精选· aihot-apiZH04:30 · 05·22
DeepSeek推进七百亿元融资,承诺坚持开源而非商业化
DeepSeek 正在敲定一笔约 700 亿元人民币的首轮外部融资,投前估值约 450 亿美元。腾讯、IDG 资本和砺思资本接近参投,梁文锋个人也可能注资约 200 亿元。他在投资者会议上明确表示,公司会继续做开源模型,目标是通用人工智能,而不是急着商业化。如果这笔钱到位,将创下中国科技初创公司首轮融资的最高纪录。不过文章也提到,具体金额和最终参投方仍...
#DeepSeek#Liang Wenfeng#Tencent#Funding
精选理由
HKR 三项都踩中了。700 亿融资规模本身就够炸,加上梁文锋个人可能跟投 200 亿,这种资金体量在开源模型公司里不常见,所以 H 给了。K 这边,450 亿美元估值、腾讯和 IDG 接近入局,以及梁文锋明确说坚持开源不急着商业化,都是能帮人判断行业水温的关键事实。R 更直接,这笔钱怎么花、开源路线能不能扛住商业化压力,会直接影响国内 AI 创业的资本逻辑和开源生态。分数没给到 95 以上,是因为交易还在推进,最终条款和交割都没披露,先打个折。
一句话点评
700亿融资、450亿美元估值,梁文锋自己还要再掏200亿,但承诺继续开源不急着变现——这个组合挺少见,先别太激动,钱到账再说。
锐评
DeepSeek这轮融资如果落地,700亿元人民币的规模会是中国科技初创公司首轮融资的最高纪录。投资前估值约450亿美元,腾讯、IDG和砺思资本接近确定参投,国家队也在里面。梁文锋个人可能注资约200亿,同时明确表示继续开发开源模型,目标是通用人工智能而不是短期变现。 这些数字很大,但正文没披露资金的具体用途——是买算力、养团队还是做生态?也没说开源会开到什么程度,是只放权重还是连训练方法、数据配比都公开。另外,报道来源是彭博社援引知情人士,最终参与者和金额都可能变,现在下结论还早。 如果梁文锋真的用个人资金跟投200亿,那他对控制权和长期路线的坚持会比口头承诺更有说服力。但反过来,这么大一笔钱进来,投资方对回报的耐心能有多久,正文完全没提。
HKR 分解
hook knowledge resonance
打开信源
99
SCORE
H1·K1·R1
04:25
22d ago
AI HOT 精选· aihot-apiZH04:25 · 05·22
Antigravity付费版Gemini周配额再翻三倍
Antigravity把付费用户的Gemini每周调用额度又提了三倍,而且已经重置了。之前翻倍过,这次再翻,对高频用户来说能省不少钱,不用频繁买包了。正文没披露具体数字,但连续翻倍说明用量增长快,或者他们在压成本。
#Google#Antigravity#Gemini#Product update
精选理由
HKR三项都过,但事实只是Antigravity付费用户的Gemini配额增加。没有新模型、新能力或定价细节,属于小产品更新,分数卡在66。
一句话点评
Antigravity 把付费用户的 Gemini 每周调用额度又提了三倍,而且已经重置了。之前翻倍过,这次再翻,对高频用户来说能省不少钱,不用频繁买包了。正文没披露具体数字,但连续翻倍说明用量增长快,或者他们在压成本。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
02:58
23d ago
● P1彭博科技· rssEN02:58 · 05·22
DeepSeek 创始人把目标定为通用人工智能,同时一笔 100 亿美元的融资在推进
彭博这条快讯只给了标题,正文被付费墙挡住了。标题说 DeepSeek 创始人公开把 AGI(通用人工智能)设为目标,并且公司正在推进一轮 100 亿美元的融资。但创始人具体怎么说的、钱从哪来、谁领投、估值多少、钱打算怎么花,这些关键信息正文都没披露。100 亿这个数字放在 AI 创业公司里非常夸张,如果是真的,说明资本市场对 DeepSeek 的预期已...
#Reasoning#DeepSeek#Bloomberg#Funding
精选理由
标题信息量不小,但正文基本是空壳,没给出创始人原话、融资细节或任何时间线。我会先打个折:这条消息的传播价值在于 DeepSeek 把 AGI 目标和巨额融资同时抛出来,信号很强,但事实支撑很弱。Bloomberg 的稿子只给了标题级事实,投资人是谁、钱怎么花、估值多少全没写,所以重要性停在 86 分是合理的,不能再往上拉。
一句话点评
DeepSeek 创始人公开把 AGI 当目标,同时 100 亿美元融资在推进。但正文被付费墙挡住,具体谁投、估值多少、钱怎么花全没披露,先别太激动。
锐评
这条消息只有标题,正文被彭博的付费墙挡得严严实实,所以能确认的事实非常有限。标题透露了两件事:一是 DeepSeek 创始人首次公开把 AGI(通用人工智能)设为公司目标,二是公司正在推进一轮 100 亿美元的融资。100 亿这个数字放在 AI 创业公司里极其夸张,如果属实,说明资本市场对 DeepSeek 的预期已经拉到了和 OpenAI 差不多的量级。但关键信息全是缺口——创始人原话怎么说的、是内部信还是公开演讲、这轮融资谁领投、估值多少、钱打算砸在算力还是人才上,正文都没披露。另外,喊 AGI 目标本身在 2026 年这个节点不算新鲜事,各家头部公司都在喊,重点要看有没有配套的路线图或阶段性验证指标。这条新闻目前更像一个信号,说明 DeepSeek 在资本层面要搞大动作,但具体怎么搞、能不能搞成,还得等更多细节出来才能判断。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
02:39
23d ago
彭博科技· rssEN02:39 · 05·22
三星代工合作伙伴 SemiFive 上市后首份财报:营收增长 137%,AI 需求把产能预订率拉到 74%
SemiFive 是三星晶圆代工的合作伙伴,去年 12 月在韩国 Kosdaq 上市。CEO Brandon Cho 在 Bloomberg 访谈里说,公司一季度营收同比涨了 137%,产能预订率冲到 74%,主要靠 AI 芯片订单。74% 这个数字说明产线已经接近满负荷,后续扩产压力不小。正文没披露具体客户名单和毛利率,所以暂时没法判断这波增长是靠大...
#Samsung#SemiFive#Brandon Cho#Commentary
精选理由
HKR-K通过,因为有两个AI相关芯片需求的运营指标。HKR-H/R较弱:这是一段财报视频摘要,不是模型、产品或重大基础设施变化。
一句话点评
SemiFive 是三星晶圆代工的合作伙伴,去年12月在韩国上市。一季度营收同比涨137%,产能预订率冲到74%,接近满负荷。AI芯片订单是主要推手。但正文没披露具体客户名单和毛利率,所以暂时没法判断这波增长是靠大客户还是分散订单。74%的预订率说明产线快满了,后续扩产压力不小。短评:三星代工伙伴靠AI订单营收翻倍,产能快满了,但客户和利润细节没给,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
02:37
23d ago
纽约时报中文网· rssZH02:37 · 05·22
17位CEO陪特朗普访华,各家公司在中国都有什么“卡脖子”的麻烦
特朗普带17位CEO去中国开会,表面是谈生意,实际每家都有具体麻烦。特斯拉想从苏州迈为买近30亿美元的太阳能设备,被中国卡住没放行;英伟达的H200芯片中国还没批准采购,尽管美国已经同意卖给阿里、腾讯等;Coherent拿不到中国出口的磷化铟,做光子芯片缺材料;因美纳还在“不可靠实体清单”上;Meta被要求取消收购AI公司Manus;高通被反垄断调查;...
#Tesla#Nvidia#Apple#Policy
精选理由
HKR三项都过,但AI只是这篇中美商业外交大故事里的一条线。H200审批被卡是具体的算力政策信号,所以分数落在60–71区间。
一句话点评
特朗普带17个CEO去中国开会,每家都有具体麻烦。特斯拉想从苏州迈为买近30亿美元太阳能设备被卡;英伟达H200芯片中国没批;Coherent缺磷化铟;因美纳还在黑名单;Meta被要求取消收购Manus;高通被反垄断调查。波音十年没在中国卖出一架飞机。维萨拿不到人民币结算牌照。贝莱德收购港口被反对。通用电气缺稀土。嘉吉被关税报复。每家公司都在逐案解决许可、市场准入和供应链问题。正文没披露这些...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
02:35
23d ago
Hacker News 首页· rssEN02:35 · 05·22
MATLAB 之父 Cleve Moler 去世,享年 86 岁
MathWorks 联合创始人、首席数学家 Cleve Moler 于 2026 年 5 月 20 日在家中去世。他是 MATLAB 的第一版作者,也是数值计算库 LINPACK 和 EISPACK 的合著者——这两个 Fortran 库是早期科学计算的基石。正文没有披露死因。
#Cleve Moler#MathWorks#MATLAB#Personnel
精选理由
HKR-H 和 HKR-R 靠 MATLAB 创始人讣告的钩子通过,但 HKR-K 信息太薄,且不是 AI 行业事件。留在 all 层级,不上精选。
一句话点评
MATLAB 之父 Cleve Moler 于 5 月 20 日去世,享年 86 岁。他是数值计算库 LINPACK 和 EISPACK 的合著者,这两个 Fortran 库是早期科学计算的基石。正文未披露死因。对 AI 从业者来说,Moler 的遗产——MATLAB——仍是学术界和工业界做快速原型验证的标配工具,但它在深度学习时代正被 Python 生态快速替代。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
02:08
23d ago
彭博科技· rssEN02:08 · 05·22
川崎重工与英伟达合作搞物理AI机器人,股价单日涨12%
川崎重工宣布将与英伟达等公司合作开发物理AI机器人技术,消息一出股价最高涨12%,创2月9日以来最大单日涨幅。不过正文没披露项目具体范围、投资金额、产品时间表或部署目标,所以这波上涨更多是市场对“英伟达合作”标签的短期反应,实际落地细节还全是空白。
#Robotics#Kawasaki Heavy Industries#Nvidia#Partnership
精选理由
股价涨12%和Nvidia physical AI机器人方向让这条新闻有H/K/R价值,但正文没披露产品规格、时间表或具体技术路径,属于合作消息的常规区间。
一句话点评
川崎重工宣布与英伟达合作开发物理AI机器人,股价单日涨12%。但正文没披露项目范围、投资金额或时间表,这波上涨基本是炒“英伟达合作”标签,落地细节全是空白。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
02:00
23d ago
机器之心 · 公众号· rssZH02:00 · 05·22
人形机器人手指里的微型电机,这家公司花898天搞定了国产化
上海马新芯动建成了国内首条高精度空心杯电机产线,全长32米,年产能40万台,覆盖4毫米到80毫米规格。空心杯电机是人形机器人手指关节的核心驱动件,相当于指尖的“小心脏”。之前这类电机基本靠进口,价格贵、供货不稳定。这条产线跑通后,成本有望降下来,国产机器人厂商不用再被卡脖子。不过正文没披露具体客户和量产时间,实际落地节奏还要再观察。
#Robotics#上海马赫智造#Figure AI#Maxon
精选理由
这是一条国产零部件产线投产消息,不是模型或机器人整机发布,所以分数压在60-71区间。数字够具体(898天、32米、40万只),'指尖心脏'的比喻也让人能快速理解这东西用在哪儿。但全文是公司宣传口径,没披露客户是谁、良率多少、跟Maxon比性能差多少,信息缺口明显。对关注人形机器人供应链的人有价值,但对模型或平台层从业者参考意义有限。
一句话点评
上海马新芯动建成了国内首条高精度空心杯电机产线,年产能40万台,覆盖4mm到80mm规格。空心杯电机是人形机器人手指关节的核心驱动件,之前基本靠进口,价格贵、供货不稳。这条产线跑通后,成本有望降下来,国产机器人厂商不用再被卡脖子。不过正文没披露具体客户和量产时间,实际落地节奏还要再观察。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
00:15
23d ago
FT · 科技· rssEN00:15 · 05·22
外资收购基金最后10亿美元退出中国数据中心,买家未披露
Princeton Digital Group的出售流程标志着外资从中国敏感数字基础设施撤退,这笔交易规模约10亿美元。正文没披露买家身份和具体条款,但金额本身说明这是外资在中国数据中心领域的最后一笔大额退出。对AI从业者来说,这意味着国内算力基础设施的资本来源将进一步本土化,外资对数据主权和监管风险的顾虑在加速兑现。
#Princeton Digital Group#Funding
精选理由
HKR的K和R都通过了:10亿美元级别的中国数据中心出售,直接关联算力基础设施的控制权转移和外资撤退。H不通过:正文没提GPU容量、客户、买方或交易条款,信息量停留在行业报道层面,没有技术或产品层面的新东西。
一句话点评
Princeton Digital Group 以约 10 亿美元出售中国数据中心,这是外资从国内敏感数字基础设施退出的最后一笔大额交易。对 AI 从业者来说,算力基础设施的资本来源将进一步本土化,外资对数据主权和监管风险的顾虑在加速兑现。正文没披露买家身份和具体条款,但金额本身说明退出规模。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
00:00
23d ago
● P1Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·22
智谱发布GLM-5.1高速版API,输出速度达每秒400个token
智谱在 5 月 22 日放出了 GLM-5.1 高速版 API,输出速度标称 400 tokens/s,是人类阅读速度的 80 倍以上。这个速度不是靠传统编译优化“调”出来的,而是底层的 TileRT 推理引擎把 GPU 的工作模式从“批处理车间”改成了“连续流水线”——取消计算步骤之间的等待和隔离,让数据持续流动,GPU 不再频繁启停。模型本身也做了...
#Inference-opt#Zhipu#GLM-5.1#TileRT
精选理由
400 tokens/s 是个好钩子,但正文没交代测试条件、并发数、输入长度和计费规则,所以速度先打个折看。TileRT 的说法有信息量,不过没展开具体怎么重构执行模型,技术细节偏薄。整体对从业者有提醒价值,但缺少独立验证,所以分数停在 78 不动。
一句话点评
智谱把旗舰模型的速度拉到400 tokens/s,不是靠换小模型,而是重写了推理引擎。这点挺狠,但正文没提价格和实际延迟,先别急着喊“最快”。
锐评
智谱这次发布的GLM-5.1高速版,直接把API输出速度干到了每秒400个token,刷新了全球大模型厂商的公开纪录。更值得关注的是,它没走“用小模型换速度”的老路,而是声称在旗舰级模型上做到了低延迟。技术实现上,他们和TileRT团队合作,在推理引擎、调度系统和基础设施三个层面做了系统级优化。简单说,就是通过提前编译、把计算任务常驻在GPU里,省掉了大量调度和同步的开销,让单卡吞吐能力更高,多卡协同也更聪明。 不过,这篇IT之家的报道主要来自厂商通稿,缺少第三方实测数据。400 tokens/s是稳定输出还是瞬时峰值?在高并发下尾延迟到底压到了多少?这些关键指标都没给。另外,价格也没披露,速度快但成本如果翻倍,对生产环境来说意义就大打折扣。目前这个API只开放给部分企业客户,普通开发者还没法验证。 总的来说,技术思路有突破,但实际效果还得等更多独立评测和定价信息出来才能下判断。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
00:00
23d ago
OpenAI 博客· rssEN00:00 · 05·22
OpenAI被Gartner评为企业编码智能体领导者
Gartner 在 2026 年企业 AI 编码智能体魔力象限中把 OpenAI 列为领导者,主要靠的是 Codex。Codex 现在每周有超过 400 万人使用,客户包括 Cisco、Datadog、Dell 和 NVIDIA。Gartner 认可了它在智能体开发、企业治理、沙箱隔离和灵活部署上的能力。OpenAI 自己说,Codex 已经是增长最快...
#Agent#Code#OpenAI#Gartner
精选理由
触发硬排除-纯营销:OpenAI 引用 Gartner 领导者徽章,未提供方法论、评分或 Codex 新能力。HKR 均缺乏具体钩子,评分上限低于 40。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K0·R0
2026-05-21 · 星期四2026年5月21日
23:58
23d ago
阮一峰的网络日志· rssZH23:58 · 05·21
财富正在向 AI 集中
阮一峰周刊这期核心观点是:社会财富正快速向 AI 行业集中,连韩国股市都被两家内存公司从 2600 点拉到 7600 点。SK 海力士按利润分成算,今年连门卫平均都能拿 610 万奖金;OpenAI 去年向 600 员工回购了 66 亿美元股票,人均近 1000 万。但如果你不在 AI 相关行业,可能反而被伤害——铜铝涨价、电子设备涨价、本行业投资减少...
#Agent#Vision#Tools#OpenAI
精选理由
这是一篇周报性质的评论,价值在于把韩国股市涨幅和OpenAI回购两个现象串起来,说明钱在往AI行业涌。没有披露任何新机制或一手测试,所以放在interesting/all档位,不升级。
一句话点评
阮一峰这期核心观点:财富正快速向AI行业集中,韩国股市被两家内存公司从2600点拉到7600点。SK海力士按利润分成算,今年连门卫平均都能拿610万奖金;OpenAI去年向600员工回购了66亿美元股票,人均近1000万。但如果你不在AI相关行业,可能反而被伤害——铜铝涨价、电子设备涨价、本行业投资减少。 短评:财富向AI集中,数据很震撼,但来源是阮一峰周刊,非一手信源,数字需交叉验证。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
23:37
23d ago
Hacker News 首页· rssEN23:37 · 05·21
受够了AI生成的回答
一位HN用户吐槽了三个AI代答的案例:在GitHub上举报恶意软件仓库,收到的回复是AI生成的套话,删了又来一条一模一样的;在公司问业务问题,老板直接转发ChatGPT截图,连内容都不看;在Reddit上跟人私信聊了半天,才发现对方是个AI agent。更让人崩溃的是,就算对面是真人,他们也习惯把你的问题丢给AI,再把AI的答案转发给你。正文没披露具体...
#Agent#Safety#GitHub#ChatGPT
精选理由
HKR-R通过,因为AI垃圾内容和信任成本是当下从业者的敏感神经。HKR-H和HKR-K不通过:角度老套,帖主只给了3个遭遇案例,没有可复现的链接或数据支撑。
一句话点评
用户吐槽三个AI代答案例:GitHub举报恶意软件仓库收到AI套话、老板转发ChatGPT截图不看内容、Reddit私聊半天发现对方是AI agent。更糟的是真人也会把你的问题丢给AI再转发答案。正文没披露具体模型、平台处理细节或可复现链接,但现象真实——AI正在变成人际沟通的中间人,而不是工具。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K0·R1
23:30
23d ago
彭博科技· rssEN23:30 · 05·21
AI 投资热钱从台积电流向联发科、三星
彭博报道,投资者正在把 AI 押注从台积电(长期被视为亚洲的英伟达替代标的)转向其他芯片股,比如联发科和三星。正文没有披露具体资金流向数据或新赢家的涨幅,只说台积电不再是唯一焦点。
#Bloomberg#TSMC#Nvidia#Commentary
精选理由
标题有悬念,但正文信息缺口太大:没写新赢家是谁、资金怎么流、估值多高。对从业者来说,既没有可参考的标的,也没有可验证的数据,所以整体价值低,只适合泛读。
一句话点评
彭博说投资者开始从台积电转向联发科和三星,但正文没给具体资金流向或涨幅数据。台积电长期被当作亚洲的英伟达替代标的,现在AI行情扩散,市场在找新标的。这点先别太激动——没披露新赢家涨了多少、资金规模多大,更像一个趋势判断而非硬数据支撑。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
23:08
23d ago
r/LocalLLaMA· rssEN23:08 · 05·21
Qwen 3.6 和 Gemma4 比写 MySQL 查询,只有一个能交出合格结果
有人在本地用 Q4_K_M 量化跑了一遍 Qwen 3.6 和 Gemma4(MoE 和 Dense 版本都试了),让它们写一条中等复杂的 MySQL 查询。结果只有一个模型给出了可接受的结果。帖子正文被 Reddit 屏蔽了,所以没透露到底是哪个模型赢了。
#Code#Benchmarking#Qwen#Gemma
精选理由
标题有明确的 Qwen/Gemma SQL 对比钩子,也触及本地模型选型焦虑,所以 H 和 R 通过。但正文只有 403 页面,没有赢家、prompt、输出或评分细则,K 不通过。
一句话点评
有人在本地用 Q4_K_M 量化跑了一遍 Qwen 3.6 和 Gemma4(MoE 和 Dense 版本都试了),让它们写一条中等复杂的 MySQL 查询。结果只有一个模型给出了可接受的结果。帖子正文被 Reddit 屏蔽了,所以没透露到底是哪个模型赢了。 短评:本地跑 SQL 测试,只有一个模型过关,但赢家没公布,先别急着站队。 点评:这个测试有意思的地方在于它用了 Q4_K_M 量...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
23:00
23d ago
最佳拍档· atomZH23:00 · 05·21
Alex Albert 聊下一代 Claude 怎么做:模型即产品、自适应思考、性格训练
Anthropic 的 Alex Albert 在视频里聊下一代 Claude 的设计思路,核心是把模型本身当产品来打磨,而不是只堆参数。他提到几个方向:编程能力要更强、产品功能要一体化(比如把对话、工具调用、记忆全揉在一起)、让模型学会“自适应思考”——根据任务难度自动调整推理深度。还讲了“Dreaming”机制(模型在空闲时自我复盘)和性格训练(让...
#Reasoning#Code#Alignment#Alex Albert
精选理由
HKR-H 和 HKR-R 过关:有具体人物和话题,能戳中 Claude 用户对产品方向和模型性格的神经。HKR-K 不过:这是一篇产品方向访谈的标题汇总,不是有数字或可测机制的更新披露,正文没给出任何硬参数或验证结果。
一句话点评
Anthropic的Alex Albert聊下一代Claude设计思路:把模型当产品打磨,而非只堆参数。方向包括强化编程、产品一体化(对话+工具+记忆揉一起)、自适应思考(任务难则多算,易则少算),以及Dreaming机制(空闲时自我复盘)和性格训练。想法挺务实,但正文没披露具体参数、发布时间或基准测试结果,目前只是方向性讨论,离落地还有距离。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
22:45
23d ago
Product Hunt · AI· rssEN22:45 · 05·21
DCP:给AI Agent一个加密的钥匙保险柜,用之前先问你
DCP 是一个本地加密权限管理工具,专门解决 AI Agent 直接持有私钥或 API 密钥的安全问题。它的做法是:密钥加密存在你自己机器上,Agent 要用时得先申请,你在 Telegram 或 App 里批准,DCP 在本地完成签名,密钥全程不进模型上下文。支持 Solana 钱包签名、API 凭据存储、每日预算和即时撤销。开源、非托管,兼容 Cl...
#Agent#Tools#DCP#Product update
精选理由
这是一个相关但信息量很薄的 Agent 工具发布:HKR-R 通过,HKR-H 和 HKR-K 不通过。没有硬性排除条件,但正文缺机制、集成方式和定价,所以留在低价值浏览层。
一句话点评
DCP 给 AI Agent 上了把本地锁:密钥加密存在你机器上,Agent 要用得先申请,你在 Telegram 或 App 里批准,签名在本地完成,密钥全程不进模型上下文。支持 Solana 钱包签名、API 凭据存储、每日预算和即时撤销。开源、非托管,兼容 Claude、Cursor 等。 短评:Agent 私钥裸奔的痛点抓得准,本地签名+人工审批的设计比纯软件方案更踏实。 关键信...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
22:43
23d ago
r/LocalLLaMA· rssEN22:43 · 05·21
b9274 修了一个 MTP 显存泄漏
Reddit 上有人发帖说最新版 b9274 修了 MTP(多 token 预测)的显存泄漏。但正文被 Reddit 屏蔽了,看不到复现步骤、影响版本和泄漏了多少显存。所以目前只能知道修了,但不知道修得彻不彻底、对谁影响大。
#Inference-opt#Reddit#Product update
精选理由
b9274 修了 MTP 显存泄漏,对跑本地推理的用户算个好消息。但正文被 Reddit 403 挡了,没写复现条件、影响哪些版本、修完显存降了多少,信息缺口太大,只能当一条低价值的小版本更新处理。
一句话点评
Reddit 用户称最新版 b9274 修了多 token 预测(MTP)的显存泄漏,但正文被 Reddit 屏蔽,看不到复现步骤、影响版本和泄漏量。目前只能确认有修复,但修得彻不彻底、对谁影响大都不清楚。短评:标题说修了泄漏,但正文被屏蔽,信息缺口大,先别急着升级。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K1·R1
21:28
23d ago
彭博科技· rssEN21:28 · 05·21
Yann LeCun 谈 AI 下一步:从聊天走向物理世界
Yann LeCun 和 JP Vert 在彭博节目上聊了 AI 和 LLM 如何落地到物理世界。正文被 paywall 挡住了,没披露具体技术路线、基础设施需求、组件位置或时间表。
#Robotics#Yann LeCun#JP Vert#Bloomberg
精选理由
Bloomberg 加 LeCun 的背书让这条链接在具身 AI 讨论上有参考价值,但正文没披露任何具体技术、基础设施清单或时间表,信息密度低,低于正常行业报道水平。
一句话点评
Yann LeCun 和 JP Vert 在彭博聊 AI 落地物理世界,但正文被 paywall 挡住,实际内容为零。标题看着像要讲具身智能或机器人,但没披露任何技术路线、基础设施需求或时间表。短评:标题党,信息量约等于零。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
21:21
23d ago
彭博科技· rssEN21:21 · 05·21
Workday 财报超预期,股价涨 10%,市场暂时不怕 AI 抢生意了
Workday 一季度财报好于预期,股价应声涨了 10%。之前市场担心 AI 会直接替代它的 HR 软件业务,这份财报暂时压住了这种恐慌。正文没披露具体营收、利润和 AI 影响机制,所以不确定是 AI 威胁被夸大了,还是 Workday 自己也在用 AI 扛住了冲击。
#Workday#Product update
精选理由
Workday一季度业绩超预期,股价涨了,暂时缓解了市场对AI冲击的担忧。但正文没给营收、利润、涨幅这些硬数字,也没说AI到底怎么影响业务——是客户用AI替代了Workday功能,还是Workday自己加了AI功能留住了客户?信息不够,没法判断这个反转有多扎实。对做企业软件或SaaS的人来说,这个信号值得留意,但先别太激动。
一句话点评
Workday 财报超预期,股价涨 10%,暂时压住了市场对 AI 替代 HR 软件的恐慌。但正文没披露具体营收、利润数字,也没说清 AI 到底怎么影响业务——是威胁被夸大,还是 Workday 自己也在用 AI 扛住了冲击。这点先别太激动,等更多数据。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
21:09
23d ago
● P1彭博科技· rssEN21:09 · 05·21
Cursor 年化收入冲到 30 亿美元,赶在与 SpaceX 签约前
AI 编程工具 Cursor 在 4 月底的年化经常性收入(ARR)达到了 30 亿美元。这个数字在 2 月时还只是 20 亿出头,两个月涨了快一半。目前有超过 3000 个客户每年至少付 10 万美元。文章没披露利润和具体成本结构,所以不知道这 30 亿里实际赚了多少。另外,这个增长节点正好卡在它要和 SpaceX 签一笔大单之前,但交易的金额和条款...
#Code#Cursor#SpaceX#Elon Musk
精选理由
这条消息硬在数字和客户规模上。Cursor 从 2 月到 4 月年化收入从 20 亿跳到 30 亿美元,增速很快;3000 多家客户年付 10 万美元以上,说明不是小团队尝鲜,而是企业级采购在发生。SpaceX 的 deal 正文没披露具体金额和合作范围,这点先别太激动,但能挂上这种客户本身就说明产品在复杂工程环境里能用。对 AI 从业者来说,这是编程助手赛道商业化跑通的一个节点,不是模型发布也不是 IPO,但比很多技术博客有信息量。
一句话点评
Cursor 年化收入冲到 30 亿美元,两个月涨了近一半,但文章没提利润,这数字得先打个折看。
锐评
Cursor 的赚钱速度确实快。4 月底年化经常性收入到了 30 亿美元,2 月时这个数还只是 20 亿出头,相当于两个月涨了快 50%。目前有超过 3000 个客户每年至少付 10 万美元,说明大客户不少,不是只靠个人开发者的小额订阅撑起来的。 不过,文章没披露任何利润或成本数据。AI 编程工具的推理成本不低,收入高不代表赚得多,这点先别太激动。另外,这个增长节点正好卡在它要和 SpaceX 签一笔大单之前,但交易的金额和条款正文都没提,所以不清楚这 30 亿里有没有提前计入这笔预期收入。 还缺两个关键信息:一是用户留存和续费率,二是跟 GitHub Copilot 等竞品的市场份额对比。没有这些,光看收入增速只能说明它卖得好,不能说明它站得稳。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
20:23
23d ago
r/LocalLLaMA· rssEN20:23 · 05·21
Qwen3.6 35B A3 本地跑,一条语音直接生成落地页
一位 Reddit 用户用本地 Qwen3.6 35B A3 配合 pi(临时计算实例),把 WhatsApp 语音转成了可上线的落地页。整个流程用了 8 个 pi 实例,每个实例都是全新上下文,跑完就销毁,中间还做了 git 提交和 VPS 部署。这套工作流之前他用 Codex 写过文档。正文没披露语音转文字用的什么模型、总耗时和成本,但 8 个实例...
#Agent#Code#Tools#Qwen
精选理由
HKR 三项都过:本地 Qwen 工作流有钩子,8 个 ticket 到 VPS 的流程很具体,本地 agent 话题有共鸣。来源是 Reddit 单用户经验,所以分数压在 70 附近。
一句话点评
用户用本地Qwen3.6 35B A3配合临时计算实例,把WhatsApp语音转成落地页并部署上线。流程用了8个实例,每个都是全新上下文,跑完就销毁,中间还做了git提交和VPS部署。亮点是模型能处理多步工具调用和代码生成,但正文没披露语音转文字用的模型、总耗时和成本。8个实例的成本可能不低,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
20:00
23d ago
The Verge · AI· rssEN20:00 · 05·21
毕业生在毕业典礼上对吹捧AI的CEO们喝倒彩
2026年毕业季,包括前谷歌CEO埃里克·施密特在内的多位科技高管在毕业典礼演讲中鼓吹AI“不可避免且必须接受”,结果被台下学生持续喝倒彩。相关视频在社交媒体上疯传,反映出年轻人对就业市场悲观、对科技巨头强推AI的反感。正文未披露涉及多少所大学或具体视频数量。
#The Verge#Eric Schmidt#Google#Commentary
精选理由
H和R过关:毕业典礼上嘘AI大佬这个角度有黏性,也踩中了社会情绪。K不过关:全文只有个案,没有学校数量、样本规模或具体的行业后果,信息支撑不足。
一句话点评
毕业生在毕业典礼上对鼓吹AI的高管喝倒彩,视频疯传。这事说明年轻人对就业市场悲观,反感科技巨头强推AI。正文没披露涉及多少学校或视频数量,但情绪很真实——高管们觉得AI“不可避免”,学生却用嘘声回应。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
19:52
23d ago
AI HOT 精选· aihot-apiZH19:52 · 05·21
Gemini 现在能直接订餐厅、做传单、买杂货
Gemini 新增了对 OpenTable(订位)、Canva(做传单)和 Instacart(买杂货)三个应用的连接能力,用户可以直接在对话里完成这些操作,不用再跳转 App。正文没披露支持的地区、是否需要登录账号、以及具体怎么触发这些连接。
#Agent#Tools#Gemini#OpenTable
精选理由
HKR-K 通过,因为文章明确给出了三个具体的 Gemini 应用连接及使用场景。HKR-H 和 HKR-R 较弱:上线范围、调用规则和生态影响均未披露,因此这只是一条面向所有用户的小产品更新。
一句话点评
Gemini 现在能直接连 OpenTable、Canva、Instacart 干活,订位、做传单、买杂货一步到位,不用跳 App。但正文没提支持哪些地区、要不要登录、怎么触发,实际体验可能打折扣。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R0
19:46
23d ago
AI HOT 精选· aihot-apiZH19:46 · 05·21
谷歌DeepMind在亚太启动AI气候加速器,三个月项目不公布资助金额
谷歌DeepMind在亚太地区推出了首个“AI for the Planet”加速器,为期三个月,面向初创公司、研究团队和非营利组织。入选团队能获得专家指导、定制化支持和谷歌AI模型的使用权限。但正文没披露招募多少人、给多少钱,这点先别太激动。如果是真的,能免费蹭到Gemini等模型做环保项目,对资源有限的团队挺划算。
#Google DeepMind#Google#Product update
精选理由
这是一条企业加速器启动的常规新闻,信息完整但缺乏从业者关心的竞争、成本或安全要素,因此保留在all层级。
一句话点评
谷歌DeepMind在亚太启动AI气候加速器,为期三个月,入选团队能免费蹭Gemini等模型和专家指导。但正文没披露招募多少人、给多少钱,这点先别太激动。如果是真的,对缺算力的环保团队挺划算。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K1·R0
19:37
23d ago
Hacker News 首页· rssEN19:37 · 05·21
多流LLM:让模型同时读、写、想,不再排队干活
这篇论文提出一个思路:别让大模型像聊天那样一条消息接一条消息地处理,而是把“读输入”、“写输出”、“内部思考”拆成三个并行的流。这样模型可以一边读一边写,或者一边想一边输出,不用等上一步做完才能干下一步。作者说这能提升效率、安全性(不同流之间更好隔离)和可监控性。不过正文没披露具体加速比或评测指标,目前只有37页预印本和GitHub代码,效果有多大还得...
#Reasoning#Inference-opt#Research release
精选理由
标题给的 hook 很具体——把提示、思考、I/O 分开并行,直击推理延迟和 agent 阻塞的工程痛点,所以 H 和 R 都成立。但正文信息量几乎为零,只有链接和 HN 分数,没有方法、实验或指标,K 不通过,只能放 all 不能进 featured。
一句话点评
这篇论文提出把大模型的“读输入”、“内部思考”、“写输出”拆成三个并行流,不用等上一步做完再干下一步。想法挺直观,但正文没披露具体加速比或评测指标,目前只有37页预印本和GitHub代码。效果有多大还得看实测。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
19:19
23d ago
TechCrunch AI· rssEN19:19 · 05·21
Google 越来越不像 Google 了,这六个搜索引擎值得试试
TechCrunch 说 Google 马上要大变样,如果你不喜欢 AI Overview(搜索结果顶部直接生成摘要),那接下来的变化可能更让你头疼。文章推荐了六个替代搜索引擎,但正文只提了 AI Overview 这个槽点,没披露具体是哪六个产品、评测标准、价格或测试条件。信息缺口明显,想换引擎的朋友可以先观望,等具体名单出来再试。
#Tools#TechCrunch#Google#Commentary
精选理由
H 和 R 都成立:标题有吸引力,话题切中用户痛点。但 K 不成立——RSS 正文没有给出六个产品的名单或任何测试依据,更像一篇轻量级的替代品清单预告,不是强 AI 行业信号。
一句话点评
TechCrunch 说 Google 要大变样,推荐了六个替代搜索引擎,但正文只提了 AI Overview 这个槽点,没披露具体是哪六个产品、评测标准、价格或测试条件。信息缺口明显,想换引擎的朋友可以先观望,等具体名单出来再试。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
19:16
23d ago
AI HOT 精选· aihot-apiZH19:16 · 05·21
Viggle 上线 3D 格斗游戏:上传照片就能当角色,公测免费还送礼品卡
Viggle 推出了一款 3D 派对格斗游戏 Fight Anyone 3D,核心玩法是上传任何人的照片,AI 自动生成一个可玩的 3D 格斗角色,附带语音、个性和招牌动作。公测期间完全免费,还送 20 张礼品卡,玩得越多赢面越大。适合跟同事、朋友随便来一局。不过正文没披露支持哪些平台(手机/PC/网页),也没说用了什么模型或引擎细节,想评估技术门槛的...
#Multimodal#Vision#Viggle#Product update
精选理由
Viggle 这个产品是个轻量级的消费者游戏,不是模型能力或商业数据的发布。文章给了玩法和公测条件,但没披露技术细节、用户规模或营收数据,所以分数压在60–71区间。
一句话点评
Viggle 把照片变格斗角色,上传谁就能用谁打拳,还带语音和招牌动作。公测免费,送20张礼品卡,玩越多赢面越大。但正文没提支持手机还是PC,也没说用了什么模型,想评估技术门槛的得再等等。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
19:16
23d ago
AI HOT 精选· aihot-apiZH19:16 · 05·21
Cloudflare CEO 自述:我怎么决定用 AI 换掉哪些员工
Cloudflare 的 CEO 在《华尔街日报》发文,公开了公司用 AI 替代部分员工的决策逻辑。文章发表于 2026 年 5 月 21 日,在 Hacker News 上拿到 100 个点赞,说明技术圈讨论挺热。但正文没披露具体按什么岗位或绩效标准来裁人,也没说替代比例,所以这点先别太激动——更像一个态度声明,不是操作手册。
#Agent#Cloudflare#WSJ#Hacker News
精选理由
H 和 R 成立:Cloudflare CEO 在 WSJ 发文谈 AI 替代员工,天然有冲突感和职场焦虑触发点。K 不成立:正文只说了 2026 年 5 月 21 日发布,没给任何岗位标准、替代比例或操作细节,信息量不足。
一句话点评
Cloudflare CEO 在 WSJ 公开了用 AI 替代员工的决策逻辑,但正文没披露具体按什么岗位或绩效标准裁人,也没说替代比例。这点先别太激动——更像一个态度声明,不是操作手册。Hacker News 上 100 个点赞说明技术圈讨论挺热,但信息缺口明显:缺岗位类型、替代比例、时间表。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
19:01
23d ago
彭博科技· rssEN19:01 · 05·21
马斯克用 SpaceX 的现金流把利息砍了一半
马斯克把 SpaceX、xAI 和 X 绑成一个更紧密的集团,每年省下近 10 亿美元利息。操作逻辑是用 SpaceX 的盈利能力和信用去置换高息债务,相当于拿集团里最赚钱的子公司当担保人。正文没披露具体债务结构和融资条款,所以不清楚省下来的利息是来自利率下降还是本金重组。对 AI 从业者来说,这条新闻的看点不在技术,而在 xAI 被纳入一个现金流更充...
#Elon Musk#SpaceX#xAI#Funding
精选理由
核心是马斯克旗下公司之间的财务腾挪,xAI 只是受益方之一。不算产品、模型或直接融资新闻,放在行业报道的下限档位。
一句话点评
马斯克把SpaceX、xAI和X绑成集团,拿SpaceX的盈利当担保,每年省近10亿美元利息。对AI从业者来说,xAI被纳入现金流更强的体系,意味着后续训练和推理的烧钱压力可能缓解。但正文没披露具体债务结构和融资条款,不清楚省下的利息是来自利率下降还是本金重组,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
18:48
23d ago
r/LocalLLaMA· rssEN18:48 · 05·21
Latitude Games 发布 Equinox-31B:基于 Gemma 的微调模型,主打平衡混合训练数据
Latitude Games 放出了 Equinox-31B,一个基于 Gemma 31B 的微调模型。据帖子介绍,训练数据用了 Wayfarer 2 和 Hearthfire 的平衡混合,但正文没披露具体配比和训练细节。模型已在 Hugging Face 上提供 GGUF 格式,方便本地部署。如果你在找能直接跑在消费级硬件上的 31B 模型,这个可以...
#Fine-tuning#LatitudeGames#Hugging Face#Gemma
精选理由
HKR-K 通过是因为文章明确给出了一个具体的 Gemma 31B 微调模型及其训练来源;HKR-H 和 HKR-R 不通过,因为没有基准测试、许可证、上下文窗口或对从业者有实际影响的角度。
一句话点评
Latitude Games 出了个 Equinox-31B,基于 Gemma 31B 微调,号称用了 Wayfarer 2 和 Hearthfire 的平衡混合数据。模型已提供 GGUF 格式,方便本地跑。但正文没披露具体配比和训练细节,这点先别太激动。如果你在找能直接跑在消费级硬件上的 31B 模型,这个可以试试,但效果如何还得看实测。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
18:45
23d ago
● P1FT · 科技· rssEN18:45 · 05·21
特朗普因白宫争执在签署前叫停AI行政令
特朗普原本计划签署一项关于人工智能的行政命令,但在最后关头反悔,理由是担心美国创新者会在与中国的竞争中落后。目前这篇文章的正文被付费墙挡住,只显示了安全验证页面,所以命令的具体条款、推迟后的新时间表,以及白宫内部到底是哪几派在角力,这些关键信息都没法看到。
#Donald Trump#White House#China#Policy
精选理由
FT 这篇报道说特朗普在签字前几小时拒批了一份 AI 行政令,H 和 R 分都拉满,因为时间点和内部冲突够抓人,政策摇摆对行业影响也大。K 分我给得保守一点,毕竟正文没披露条款到底写了什么,只知道拒批理由跟中国竞争有关。这不是最终规则,但信号很强,我会先打个折。
一句话点评
特朗普在签字前叫停AI安全行政令,表面理由是措辞不满意,但多家媒体指出真正原因是科技公司CEO来不及赶到华盛顿拍照。
锐评
这条新闻最值得看的是叫停的真实原因。特朗普公开说行政令的措辞“可能成为阻碍”,担心影响美国在AI上领先中国。但Axios和The Verge的记者都提到,真正让签字推迟的是科技公司CEO们没法临时飞过来——没有合影的签字仪式,白宫觉得不值得办。 行政令本身要求AI公司在发布模型前14到90天把模型交给政府做安全审查,直接起因是Anthropic的Mythos和OpenAI的GPT-5.5 Cyber被发现能快速找到并利用安全漏洞。这个提前交模型的时间窗口是争议焦点,CNN说这是草案里最卡壳的部分。 不过两篇报道都没说清楚行政令最终会不会签、什么时候签,也没披露科技公司到底对哪些条款有意见。TechCrunch和FT都只引用了特朗普对记者说的几句话,没有拿到草案原文或白宫内部讨论细节。这点先别太激动,等看到具体文本再判断这个行政令到底有多严。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
18:33
23d ago
AI HOT 精选· aihot-apiZH18:33 · 05·21
Codex 周四更新:Appshots 功能上线
OpenAI Devs 在 Codex 周四更新中推出了 Appshots 功能。Mac 用户按两下 Command 键,就能把当前应用窗口的截图和文字(包括屏幕外内容)直接贴到 Codex 对话里。目前 Mac 各计划已可用,企业版稍后开放。
#Code#Tools#OpenAI#Product update
精选理由
这是一个很小的 Codex 产品更新,机制清楚但能力范围窄。H 和 K 都成立:新手势降低了把上下文喂给模型的门槛,对 Mac 用户是实打实的便利。R 不成立:没有成本变化、没有岗位冲击、没有安全风险、也没有改变竞争格局,所以落在 60–71 区间。
一句话点评
Codex 周四更新上线 Appshots,Mac 用户双击 Command 键就能把当前应用窗口的截图和文字(包括屏幕外内容)直接贴进对话。这比手动截图再拖拽省几步,尤其适合调试或写文档时快速给模型看上下文。目前 Mac 各计划可用,企业版稍后。正文没披露是否支持 Windows 或 Linux,也没提截图隐私处理方式。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
18:32
23d ago
● P1彭博科技· rssEN18:32 · 05·21
Waymo因洪水风险暂停五城服务并关闭高速通行
Waymo 在亚特兰大的一辆车直接开进了被淹路段,导致公司暂停了五个城市的服务。问题出在车辆对积水路面的识别和决策上——它判断不出“水有多深、能不能过”,就硬着头皮往前开。这跟之前导致数千辆车被召回的是同一个毛病。不过正文没披露具体是哪五个城市,也没说什么时候恢复运营。
#Robotics#Safety#Waymo#Incident
精选理由
我会先打个折:正文没披露具体是哪五个城市、也没说什么时候恢复,所以影响范围还看不清。但 Waymo 作为头部的 robotaxi 玩家,因为积水这种真实路况直接触发数千辆车召回并暂停多城服务,说明物理世界的安全边界比实验室难控得多。这点先别太激动,但确实暴露了无人车在恶劣天气下大规模运营的脆弱性,对行业信心是个实在的磕碰。
一句话点评
Waymo 因为洪水风险暂停了五个城市的服务并关闭高速通行,说明无人车对积水路面的判断还是个大短板。
锐评
Waymo 这次不是小修小补,而是直接暂停了亚特兰大等五个城市的运营,同时禁止车辆上高速。起因是有车直接开进积水路段,说明现有的传感器和算法在识别洪水深度、判断路面是否可通行上存在明显盲区。这不是第一次出现类似问题,但一次波及五个城市、主动关闭高速,规模上比以往都大。 从公开信息看,Waymo 没有披露具体有多少辆车涉水、有没有乘客受伤,也没说这次暂停会持续多久。Bloomberg 的报道只提到暂停与洪水风险直接相关,但没有给出技术层面的详细解释。这点需要打个折:我们不知道是纯视觉方案在暴雨天失效,还是高精地图没更新积水信息,或者是决策模型对“水坑”和“深水区”的区分能力不够。 对从业者来说,这件事提醒我们,自动驾驶在极端天气下的安全边界依然很窄。Waymo 作为行业标杆,选择一刀切暂停服务,说明他们内部评估的风险等级很高。后续值得关注的是,他们会不会公开事故数据,以及这次暂停对商业扩张节奏的影响有多大。
HKR 分解
hook knowledge resonance
打开信源
87
SCORE
H1·K1·R1
18:01
23d ago
FT · 科技· rssEN18:01 · 05·21
英国部长开放无人出租车招标,伦敦交通局质疑安全性
英国部长邀请企业投标无人出租车项目,但伦敦交通局官员质疑这类车是否真的比人类驾驶更安全。正文没披露招标规模、试点城市、参与运营商或时间表,信息缺口很大。
#Robotics#TfL#Policy
精选理由
FT 这条新闻的 HKR 来自清晰的 robotaxi 政策冲突和 TfL 的安全反对意见。重要性压在 60–71 区间,因为招标规模、测试城市和时间表都没披露,信息完整度不够,暂时不值得更高分。
一句话点评
英国部长放标无人出租车,但伦敦交通局直接质疑:这玩意儿真比人开安全吗?正文被付费墙挡住,没披露招标规模、试点城市、运营商和时间表,信息缺口很大。目前只能看出英国中央和地方在安全标准上还没对齐,政策落地前还有得吵。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:43
23d ago
AI HOT 精选· aihot-apiZH17:43 · 05·21
Claude Opus 在网络安全上的三个真实用法:Wiz 每周扫 15 万资产,Accenture 覆盖 1600 个应用
Anthropic 发了篇合作伙伴用 Claude Opus 做网络安全的博客,三个案例:Wiz 每周对超过 15 万个生产资产做一轮安全测试(规模不小,但正文没披露误报率);Palo Alto Networks 用 Opus 做代码安全审查,能发现传统工具漏掉的逻辑漏洞;Accenture 把扫描范围扩大到 1600 个应用和超过 50 万个 API...
#Agent#Code#Tools#Anthropic
精选理由
触发了硬排除-5:核心是 Wiz、Palo Alto Networks 和 Accenture 使用 Claude Opus 的合作伙伴案例。具体的规模数字有助于 HKR-K/R,但本质仍是厂商营销,分数上限 40。
一句话点评
Anthropic 发了篇合作伙伴用 Opus 做网络安全的博客,三个案例:Wiz 每周对超 15 万个生产资产做一轮安全测试(规模不小,但正文没披露误报率);Palo Alto Networks 用 Opus 做代码安全审查,能发现传统工具漏掉的逻辑漏洞;Accenture 把扫描范围扩大到 1600 个应用和超 50 万个 API。 关键数字:15 万资产/周、1600 应用、50 万...
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H0·K1·R1
17:32
23d ago
AI HOT 精选· aihot-apiZH17:32 · 05·21
OpenAI 用推理模型解了一道 80 年数学难题,但别急着说它比数学家聪明
OpenAI 昨天宣布,他们用未发布的推理模型(靠“边想边写”的链式思考)找到了一个反例,推翻了数学家 Erdős 在 1946 年提出的平面单位距离猜想。专业数学家从模型的长篇推理记录里提取关键步骤,改写成标准证明。但别急着吹:第一,模型跑一次可能贵得离谱,正文没披露具体成本;第二,数学圈早就用计算机辅助工具做这类系统搜索了,这次的新意只是链式思考能...
#Benchmarking#Inference-opt#OpenAI#Anthropic
精选理由
HKR三项都沾边但偏薄:两家头部实验室、一个50%降价数字、模型成本竞争。缺少基准细节、测试设置和营收来源,只能归入60–71分的评论档。
一句话点评
OpenAI 用未发布的推理模型(链式思考,边想边写)找到了一个反例,推翻了数学家 Erdős 1946 年提出的平面单位距离猜想。专业数学家从模型的长篇推理记录里提取关键步骤,改写成标准证明。但别急着吹:第一,模型跑一次可能贵得离谱,正文没披露具体成本;第二,数学圈早就用计算机辅助工具做这类系统搜索了,这次的新意只是链式思考能替代更复杂的脚手架。另外,数学家 Thomas Bloom 指出...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:28
23d ago
● P1彭博科技· rssEN17:28 · 05·21
SpaceX 向纳斯达克提交 IPO 申请
Bloomberg 报道,SpaceX 已正式申请在纳斯达克上市,并在路演材料里画了一个 28.5 万亿美元的大饼,把业务从 AI 一路讲到了火星。同一天的消息还说,OpenAI 也在准备 IPO 文件,最快周五就会提交。视频本身是 Bloomberg 的每日科技节目,没有放出完整的招股书细节,所以估值、发行价和具体时间表都还没公开。
#SpaceX#OpenAI#Nvidia#Funding
精选理由
Bloomberg 这条稿子把 SpaceX 和 OpenAI 的 IPO 进度绑在一起报,信息密度很高。SpaceX 那边给了个 28.5 万亿美元的投资者叙事,数字很大,但正文没展开算这笔账的细节,我会先打个折看。OpenAI 这边最值钱的是“最快周五交表”这个时间点,比之前模糊的传闻进了一步,不过估值、募资规模、具体承销商这些关键信息都没披露,所以重要性到不了 90 以上。两条消息都是 Bloomberg 独家,来源可信,对关注 AI 和科技股的人有直接参考价值。
一句话点评
SpaceX 正式提交 IPO 申请,代码 SPCX。但正文只给了视频页面框架,没披露估值、募资额和财务数据,先别急着算市值。
锐评
SpaceX 向纳斯达克递交了公开上市申请,股票代码定为 SPCX,这可能是史上规模最大的 IPO 之一。不过,目前能看到的 Bloomberg 报道只是一个视频页面,正文里全是网站导航和页脚链接,没有招股书里的关键数字——比如计划募多少钱、公司整体估值、收入利润情况,甚至连上市时间表都没提。FT 的标题虽然提到“史上最大 IPO”和“小行星采矿”,但同样没给出具体数据支撑。 所以现在能确认的只有“提交了申请”这件事本身。对从业者来说,真正值得关注的是 SpaceX 把星链、星舰这些烧钱业务的财务底牌亮出来之后,现金流和成本结构到底怎么样。这些信息都得等完整的 S-1 文件公开才能判断。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
17:00
23d ago
The Verge · AI· rssEN17:00 · 05·21
Polyend 出了一款 299 美元的 AI 吉他效果器,用文字描述就能生成音色
Polyend 的 Endless 是一款 299 美元的可编程吉他效果踏板,跑在 ARM 处理器上。配套的 Playground 是一组互相连接的 AI 智能体,你输入文字描述,它就能生成对应的效果。正文没披露具体用了什么模型、效果链架构细节,也没说延迟多高。优点是门槛低——不用拧旋钮,打字就行;缺点是 299 美元不算便宜,而且 AI 生成的效果能...
#Agent#Audio#Polyend#The Verge
精选理由
HKR-H 和 HKR-K 都过了:一个 299 美元的踏板,靠多智能体系统把文字提示变成吉他效果。HKR-R 偏弱,因为这事落在小众音乐硬件里,不是 AI 核心工作流或竞争格局。
一句话点评
Polyend 出了个 299 美元的 AI 吉他效果踏板 Endless,跑在 ARM 上。配套的 Playground 是一组 AI 智能体,你打字描述想要什么效果,它就能生成。门槛确实低,不用拧旋钮,但 299 美元不算便宜。正文没披露具体用了什么模型、效果链怎么搭,也没说延迟多高——这点先别太激动,AI 生成效果能不能实时跟上弹奏才是关键。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
16:51
23d ago
r/LocalLLaMA· rssEN16:51 · 05·21
Gorgon Halo 比上一代快 6.7%,但这是网友拿内存频率算的
Reddit 用户根据内存频率推算,Gorgon Halo 比 Strix Halo 快 6.7%(8533 MHz vs 8000 MHz),前提是 AI 负载卡在内存带宽上。AMD 没公布 Gorgon Halo 的真实内存带宽,所以这个数字只是估算。另外 Medusa Halo 号称 AI 性能提升 50%,但官方还没放出具体规格,建议先观望。
#Inference-opt#AMD#Tom's Hardware#Commentary
精选理由
HKR-K 靠 8533MHz 对 8000MHz 的计算通过;HKR-R 仅限于关注本地推理成本/性能的读者。正文未披露带宽或 token/s 数据,Reddit 来源的角度价值偏低。
一句话点评
Reddit 用户根据内存频率推算,Gorgon Halo 比 Strix Halo 快 6.7%(8533 MHz vs 8000 MHz),前提是 AI 负载卡在内存带宽上。AMD 没公布真实带宽,所以这个数字只是估算。另外 Medusa Halo 号称 AI 性能提升 50%,但官方还没放出具体规格,建议先观望。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K1·R1
16:42
23d ago
Hacker News 首页· rssEN16:42 · 05·21
Agent.email:让 AI 自己用 curl 注册邮箱,人类用 OTP 认领
AgentMail 做了一个实验性产品 Agent.email,让 AI 代理能像人一样注册邮箱。流程是:代理通过 curl 请求注册,拿到一个受限的收件箱——每天只能发 10 封邮件,且只能发给自己关联的人类。然后代理发邮件向人类索要 OTP,人类回复验证码后,代理的邮箱才解除限制,变成完整功能。目前一个代理只能绑定一个人,下一步支持一个人管多个代理...
#Agent#Tools#AgentMail#Haakam
精选理由
HKR 全过,因为 agent 邮箱的注册机制和滥用限制都很具体。重要性没上 featured,因为这只是个 Show HN 小项目,正文没披露用户量、定价或安全审计,先别太激动。
一句话点评
AgentMail 搞了个实验:让 AI 代理自己通过 curl 注册邮箱,注册后只能给自己的人类发邮件(每天限10封),人类回复 OTP 验证后才解锁全部功能。目前一个代理只能绑一个人。想法挺有意思,但正文没披露注册接口的防滥用细节,IP 限流够不够用不好说。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
16:35
23d ago
AI HOT 精选· aihot-apiZH16:35 · 05·21
Gemini 上线每日简报,自动把待办事项整理成清单
Gemini 现在能主动把当天重要事项整理成待办清单,让你在早餐前就规划好一天。正文没披露推送范围、触发条件、是否收费以及支持哪些语言。
#Agent#Memory#Gemini#Product update
精选理由
HKR-K 通过,因为 Gemini Daily Brief 新增了一个具体的助手动作:主动创建待办清单。HKR-H 和 HKR-R 较弱;上线范围、触发机制、价格和支持语言均未披露。
一句话点评
Gemini 现在能主动把当天重要事项整理成待办清单,让你在早餐前就规划好一天。正文没披露推送范围、触发条件、是否收费以及支持哪些语言。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
16:33
23d ago
AI HOT 精选· aihot-apiZH16:33 · 05·21
Google 推出 Gemini for Home,给智能家居厂商和运营商一套带 AI 的全栈方案
Google 在 I/O 上发布了 Gemini for Home,把摄像头识别、自然语言问答、每日活动摘要打包成一套方案,直接给运营商(比如 AT&T)和硬件厂商用。摄像头不再是“检测到人”,而是能说“有人把快递放门口了”;用户也能直接问“狗是不是咬了沙发上的鞋”。Google 还提供了摄像头和智能音箱的参考设计,合作伙伴可以跳过自研硬件,直接贴牌出...
#Vision#Tools#Google#Gemini
精选理由
HKR-K/R 通过:文章给出了具体的家庭 AI 能力和 API,也触及智能家居平台竞争。但正文没披露价格、上线时间和硬件清单,信息缺口明显,所以分数压在 60–71 区间。
一句话点评
Google I/O 上发布了 Gemini for Home,把摄像头识别、自然语言问答和每日活动摘要打包成一套方案,直接给运营商(如 AT&T)和硬件厂商用。摄像头不再是“检测到人”,而是能说“有人把快递放门口了”;用户也能直接问“狗是不是咬了沙发上的鞋”。Google 还提供了摄像头和智能音箱的参考设计,合作伙伴可以跳过自研硬件,直接贴牌出货。 亮点是“全栈”打包,降低了智能家居的 ...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
16:19
23d ago
r/LocalLLaMA· rssEN16:19 · 05·21
Strix Halo 128GB vs M5 Pro 64GB:三千美元买谁跑大模型?
Reddit 用户发帖对比两款设备:AMD Strix Halo(128GB 统一内存)和苹果 M5 Pro(64GB),价格都在 3000 美元左右。发帖人想知道 LM Studio 的推理速度,以及能不能外接 eGPU 来跑更大模型。帖子正文没披露任何跑分或实测数据,所以目前只能看纸面参数:Strix Halo 内存翻倍,能塞下更大参数的模型,但 ...
#Inference-opt#Reddit#LM Studio#Strix Halo
精选理由
H 和 R 通过:硬件对比和 3000 美元预算确实能抓住本地 LLM 用户的注意力。K 不通过:没有跑分、模型、量化或可复现的设置,信息量不够支撑判断。
一句话点评
Reddit 用户拿 Strix Halo(128GB 统一内存)和 M5 Pro(64GB)比,价格都在 3000 美元左右。Strix Halo 内存翻倍,能塞下更大参数的模型,但正文没披露任何跑分或实测数据,目前只能看纸面参数。用户还问了能不能外接 eGPU 来跑更大模型,这点也没答案。短评:纸面参数好看,但没实测,先别急着下单。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
16:05
23d ago
AI HOT 精选· aihot-apiZH16:05 · 05·21
PixVerse 上线 Shoplift:贴个商品链接,几分钟自动生成平台原生广告视频
PixVerse 推出 Shoplift,面向 DTC(直接面向消费者)团队。用户只需粘贴产品 URL,几分钟就能生成适配 TikTok、Instagram 等平台风格的广告视频,不用请工作室、不用排队等剪辑。官方称专为“持续做创意测试”的团队设计,适合快速出多版素材跑投放。目前开放免费早期访问,72 小时内转发+关注+回复可领 300 积分(积分能换...
#Tools#PixVerse#Product update
精选理由
PixVerse 新出的 Shoplift 让 DTC 团队贴个产品链接就能几分钟生成平台原生广告视频,还搞了个 72 小时内互动送 300 积分的拉新活动。但正文没披露视频质量、成本对比或实际投放效果,这点先别太激动。对 AI 从业者来说,这只是个小厂商的产品推文加早期访问营销,价值低,适合全量推送但不值得加精。
一句话点评
PixVerse 出了个叫 Shoplift 的工具,专给 DTC 品牌做广告视频。贴个产品链接,几分钟就能生成适配 TikTok、Instagram 风格的视频,不用找工作室排队。官方说适合“持续做创意测试”的团队,快速出多版素材跑投放。目前免费早期访问,72 小时内转发+关注+回复送 300 积分(积分能换生成次数)。 短评:省了外包和剪辑排队时间,适合小团队快速测素材。但生成质量、平...
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H0·K1·R0
16:01
23d ago
AI HOT 精选· aihot-apiZH16:01 · 05·21
Replit企业版开放自助购买,几分钟就能开搞
Replit企业版现在可以直接在网页上自助下单,不用签合同、不用等销售。买了之后马上配SSO和SCIM,团队就能开始协作开发。正文没披露具体定价和座位数限制,但自助购买意味着门槛比之前低了不少。
#Code#Replit#Product update
精选理由
HKR-K通过:Replit 把企业版购买从销售流程变成了自助下单,还附带SSO/SCIM配置,对想快速上手的团队是个实在的改进。HKR-H和R偏弱:没提价格、席位上限或功能变化,所以这条属于低价值的产品更新,不值得过度关注。
一句话点评
Replit企业版开放自助购买,不用找销售签合同,直接网页下单就能用上SSO和SCIM,几分钟开搞团队协作。门槛确实降了,但正文没提定价和座位数,小团队能不能用得起还不清楚。
HKR 分解
hook knowledge resonance
打开信源
54
SCORE
H0·K1·R0
15:45
23d ago
r/LocalLLaMA· rssEN15:45 · 05·21
llama.cpp 修了个 OpenCode/Pi 的 bug:不再反复处理提示词
llama.cpp 的 PR #22929 修复了一个问题:用 OpenCode 或 Pi 跑推理时,模型会反复处理同一段提示词,浪费算力。帖子只贴了 GitHub PR 链接,没提合并状态、复现步骤、性能对比或受影响版本。如果你在用这两个工具,可以关注一下这个 PR 的进展。
#Code#Inference-opt#Tools#llama.cpp
精选理由
一个狭窄的开源工具修复,只有 PR 链接,没有性能或复现细节;HKR-R 通过,HKR-H/K 不通过,所以留在 all 以下,不进入 featured。
一句话点评
llama.cpp 一个 PR 修了 OpenCode 和 Pi 反复处理同一段提示词的 bug,浪费算力。帖子只贴了 GitHub 链接,没提合并状态、性能提升倍数或受影响版本。如果你在用这两个工具,可以关注一下 PR #22929 的进展。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
15:45
23d ago
● P1FT · 科技· rssEN15:45 · 05·21
Spotify与环球音乐集团达成协议推出AI生成音乐工具
Spotify 跟环球音乐集团谈成了一笔授权,打算在 Spotify 应用内加一个付费的 AI 音乐生成功能,主要瞄准那些花钱不手软的重度乐迷。目前正文被付费墙挡住,看不到具体定价、上线时间、支持哪些国家,也没提用的是什么模型。
#Audio#Spotify#Universal Music Group#Product update
精选理由
我会先打个折:定价、上线时间和钱怎么分,正文都没说,所以这条还到不了必写的程度。但 Spotify 和环球音乐把 AI 音乐从技术演示变成应用内付费产品,方向很明确——瞄准愿意多花钱的铁粉,用 AI 工具让他们自己生成内容。这比单纯放个 AI 歌单更进一步,等于把生成能力直接卖给用户。版权和收入分配是绕不开的雷区,正文没披露分成细节,这点先别太激动。
一句话点评
Spotify 和环球音乐谈成了,以后付费用户能用 AI 翻唱和混音正版歌曲,但价格和上线时间都没说。
锐评
Spotify 跟环球音乐签了授权,打算让 Premium 用户掏钱用 AI 做翻唱和混音。这事的核心是版权方第一次正式点头,让粉丝拿正版内容玩生成式 AI,产生的歌还会给艺人分钱。听起来比 Suno 那种“先上车后补票”的模式稳当,但正文没披露分账比例、技术细节和定价,也没说哪些艺人会参与。 目前只有环球一家入局,其他两大唱片公司还没表态。如果工具做得好,确实可能把一部分玩 AI 翻唱的人拉回正版平台;但如果收费太高或者生成质量一般,用户可能还是回去用免费工具。另外,这种“超级粉丝”付费加购的定位,到底有多少人愿意买单,也得等上线后看数据。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
15:30
23d ago
The Verge · AI· rssEN15:30 · 05·21
AI 视频不再只是“片段垃圾”,Luma 和 Wonder Project 合开了一家制片公司
The Verge 专栏说,AI 视频正在从低质量的病毒短片转向正经的制片流程。Luma 和 Wonder Project 联合成立了一家叫 Innovative Dreams 的制作公司,目标不是让 AI 只做视频片段,而是渗透到好莱坞的整个制作环节。文章没有披露用了什么模型、多少钱、什么时候上线,也没有给出具体的制作数据,所以这点先别太激动——方向...
#Multimodal#Vision#The Verge#Luma
精选理由
HKR 在角度、新实体和创作者工作流焦虑上成立,但正文缺少模型规格、上线时间或可复现的生产证据,因此分数落在 60–71 区间,不推荐加精。
一句话点评
Luma 和 Wonder Project 合开了一家叫 Innovative Dreams 的制作公司,目标是把 AI 视频塞进好莱坞制片流程,而不是只做病毒短片。方向有意思,但正文没披露用了什么模型、多少钱、什么时候上线,也没有具体制作数据——这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:27
23d ago
TechCrunch AI· rssEN15:27 · 05·21
Spotify 出了个桌面版播客制作工具,直接对标 Google 的 NotebookLM
Spotify 发布了一个桌面应用,目前以研究预览形式在 20 多个市场上线。标题直接说这是跟 Google NotebookLM 竞争的产品,但正文没披露具体功能、定价或正式上线时间,只说了是预览版。
#Tools#Spotify#Google#NotebookLM
精选理由
HKR-H 和 HKR-K 靠 Spotify 对打 NotebookLM 的竞争钩子和 20+ 市场研究预览过关。但功能、定价、工作流证据缺失,只能放在普通产品更新档位,够不上精选。
一句话点评
Spotify 出了个桌面应用,标题直接对标 Google NotebookLM,但正文只说是研究预览版,没提具体功能、定价和上线时间。目前只在 20 多个市场能试,信息缺口很大,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
14:51
23d ago
FT · 科技· rssEN14:51 · 05·21
瑞士最大液流电池项目选了英国公司,给AI数据中心供电
全球最大的钒液流电池项目选了英国Invinity Energy Systems的设备,专门给数据中心供电。液流电池的好处是寿命长、不易燃,适合长时间储能,但能量密度低、占地大。正文没披露项目规模、合同金额、部署地点和交付时间,所以暂时没法判断这笔单子到底多大、什么时候落地。
#Invinity Energy Systems#Partnership
精选理由
HKR靠AI供电基础设施的钩子和供应商选择通过,但正文缺容量、金额和交付时间,属于外围基础设施,不是模型、产品或政策更新,所以落在40–59分区间。
一句话点评
全球最大钒液流电池项目选了英国Invinity的设备给数据中心供电。液流电池寿命长、不易燃、适合长时间储能,但能量密度低、占地大。正文没披露项目规模、合同金额、部署地点和交付时间,暂时没法判断这笔单子到底多大、什么时候落地。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R1
14:50
23d ago
r/LocalLLaMA· rssEN14:50 · 05·21
Meta 给开源模型 Heretic 发了律师函,要求下架 Llama 衍生版
Heretic 收到 Meta 委托律师的邮件通知,随后主动删除了自己控制的仓库里所有基于 Llama 的模型权重,并另建了一个托管在德国的 Codeberg 镜像站。正文没披露 Meta 具体指控哪条条款,也没说 Heretic 后续会不会应诉。目前看,Meta 对开源协议的执行开始动真格了,尤其是针对那些改了模型名但没改权重的衍生项目。
#Heretic#Meta#Codeberg#Policy
精选理由
H/K/R 都达标,但消息来源只是一条 Reddit 帖子,正文没披露 Meta 具体诉求、通知原文和项目规模。对关注 Llama 开源授权的人有参考价值,不到头条级别。
一句话点评
Meta 这次动真格了,给 Heretic 发了律师函,要求删除基于 Llama 的衍生模型。Heretic 照做了,但把仓库镜像迁到了德国,摆明不想完全认怂。正文没披露 Meta 具体指控哪条条款,也没说 Heretic 会不会应诉。对开源社区来说,这信号很明确:改个模型名但权重照搬,Meta 可能不再睁只眼闭只眼。后续看 Meta 会不会扩大打击面,以及 Heretic 在德国能否规避美...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:33
23d ago
r/LocalLLaMA· rssEN14:33 · 05·21
本地跑 Llama 3 70B 想联网,最便宜的方案是什么?
有人在本地跑 Llama 3 70B,想通过 function calling 让模型上网查资料。试了 SearXNG(自建元搜索引擎),结果太乱;Brave Search API 给的摘要又太短,不够用。核心需求是找一个便宜甚至免费的 API,能返回有用的网页正文片段。正文没披露具体预算或可接受的延迟,但问题很实际:本地大模型联网,卡在搜索结果的可用性上。
#Agent#Tools#RAG#SearXNG
精选理由
一篇 Reddit 求助帖,用户抱怨 SearXNG 搜索结果太乱,Brave Search API 摘要又太短,想找更便宜的内容块 API。痛点真实,但正文没披露任何价格、延迟或可复现的配置,属于纯经验吐槽,没有新工具、定价、基准测试或可复现结果。
一句话点评
本地跑 Llama 3 70B 想联网,但自建搜图引擎 SearXNG 结果太乱,Brave Search API 摘要又太短。核心痛点:缺一个便宜或免费的 API 能返回网页正文片段。正文没披露预算和可接受的延迟,但问题很实际——本地大模型联网卡在搜索结果可用性上。短评:联网不难,难在搜到能用的内容。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
14:30
23d ago
● P1MIT 科技评论· rssEN14:30 · 05·21
Anthropic伦敦开发者大会显示开发者越来越多直接上线AI生成代码
Anthropic 在伦敦的 Code with Claude 大会上展示了一个趋势:开发者越来越愿意把写代码的活直接交给 AI。工程师 Jeremy Hadfield 在现场问谁上周发过完全由 Claude 写的 pull request(提交审核的代码改动),近一半人举手;再问谁没读代码就直接发了,大部分手还举着。Anthropic 说公司内部大部...
#Agent#Code#Memory#Anthropic
精选理由
这篇 MIT Tech Review 的现场报道不是产品发布稿,但抓到了一个很实的信号:开发者已经在把 Claude 写的代码直接往仓库里合,而且不少人连看都不看。我会先打个折,这个数字来自活动现场举手统计,样本量和代表性都有限,不能直接推成行业常态。但“近一半”这个比例还是够高,说明在重度用户里,对 AI 代码的信任已经跨过了一道心理门槛。文章没给 PR 的复杂度或后续回滚率,这点信息缺口让判断只能停在“行为在发生”而不是“行为没问题”。整体适合放进 featured,因为它比功能更新更能让人停下来想一下自己的工作流。
一句话点评
开发者大会现场近半数人举手表示,自己最近提交的代码完全由Claude生成且没看代码就直接上线了。这个信号比任何技术指标都直接。
锐评
Anthropic伦敦开发者大会最值得关注的一点,不是他们又发了什么新功能,而是现场举手的人数。工程师问“谁最近提交的代码完全由Claude写的”,近一半人举手;再问“谁连代码都没看就提交了”,大部分手还举着。这说明AI写代码已经从“辅助”变成了“直接上线”的默认流程,开发者对模型的信任度已经高到愿意跳过人工审查。 Anthropic在会上推了一个叫“dreaming”的新机制,让Claude Code的智能体自己写工作笔记,后续的智能体接手时能读笔记、总结常见错误,理论上能让模型越用越懂你的代码库。这个思路是把人进一步从纠错环节里摘出去,让模型自己测试、自己修。但正文没披露这套机制在复杂项目里的实际错误率和返工成本,也没给出对比数据。 另外,文章提到场外有不少开发者在论坛上抱怨,管理层追着效率指标推AI工具,结果代码量是上去了,审查负担反而更重。这个矛盾在大会现场完全没体现,所有人都很兴奋。所以这条新闻的判断得打个折:现场气氛说明趋势是真的,但“直接上线不审查”到底是效率提升还是技术债积累,目前还缺真实项目的长期跟踪数据。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
14:29
23d ago
AI HOT 精选· aihot-apiZH14:29 · 05·21
Krea 2 上线 LoRA 微调,用户可自训练风格/角色
Krea 在 2 测试版里加入了 LoRA 微调系统,号称目前最强,能让你用高精度训练特定风格、物体或角色。不过正文没披露训练集大小、定价、训练时长和开放范围,实际效果和成本还得等实测。
#Fine-tuning#Krea#Product update
精选理由
Krea 2 测试版新增 LoRA 微调,支持训练风格、物体或角色,属于产品更新。但正文没披露训练数据量、价格、耗时和上线范围,信息缺口明显,只能算小更新,不值得高调关注。
一句话点评
Krea 2 测试版上线了 LoRA 微调,号称“迄今最强”,能高精度训练特定风格、物体或角色。但正文没披露训练集大小、定价、训练时长和开放范围,实际效果和成本还得等实测。短评:画饼阶段,先别激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
14:25
23d ago
r/LocalLLaMA· rssEN14:25 · 05·21
LlamaStation v0.9:Windows 上跑大模型的图形界面,支持多后端、TurboQuant 和 MTP
LlamaStation v0.9 给 llama.cpp 套了个 Windows 图形界面,不用敲命令就能跑模型。作者用双 RTX 3060 显卡跑 Qwen3.6 27B 的 Q4_K_M 量化版,上下文窗口撑到了 177k——相当于一次塞进十几本小说,对本地部署来说挺夸张。支持四种后端(CPU、CUDA、Vulkan、Metal),新增 Turb...
#Tools#Inference-opt#Audio#LlamaStation
精选理由
这是一个 Reddit 上发布的 Windows llama.cpp GUI 小版本更新,受众面窄。177k 上下文测试是亮点,但整体仍属于 niche 工具更新,不足以进 featured。
一句话点评
LlamaStation v0.9 给 llama.cpp 套了个 Windows 图形界面,不用敲命令就能跑模型。作者用双 RTX 3060 显卡跑 Qwen3.6 27B 的 Q4_K_M 量化版,上下文窗口撑到了 177k——相当于一次塞进十几本小说,对本地部署来说挺夸张。支持四种后端(CPU、CUDA、Vulkan、Metal),新增 TurboQuant KV 缓存和 MTP 多 ...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
14:01
23d ago
Hacker News 首页· rssEN14:01 · 05·21
用一台2021款MacBook本地索引一整年视频,作者说Gemma 4做到了
作者在肯尼亚马赛马拉拍了一整年视频,素材堆在SSD里没空剪。他试了一圈AI视频编辑工具后发现,这些工具的前提是素材已经标好了标签,而他的文件名叫“IMG_*.mov”和“Mara june 2024 backup final FINAL”。于是他自己搭了一套本地索引流水线:用ffmpeg抽帧、WhisperX做多语种转录、insightface识别人脸...
#Vision#Multimodal#Commentary
精选理由
标题的钩子很实在——Gemma4-31B 在 2021 MacBook 上索引一年视频,还用了 50GB swap,直接点出硬件、模型和规模,对从业者来说成本低、隐私好、门槛低,共鸣点明确。但正文只给了标题级信息,没披露视频总量、索引方法、耗时和效果,信息缺口大,所以分数卡在 60–71 区间。H/K/R 都过,因为钩子够具体、设置够清晰、硬件成本痛点够真实。
一句话点评
作者用一台2021款MacBook(50GB交换内存)跑Gemma4-31B本地索引了一整年视频素材。核心思路是先建索引再编辑:用ffmpeg抽帧、WhisperX多语种转录、insightface识别人脸,最后让模型一次性输出描述、标签、评分等元数据,存为.sidecar文件。关键数字:成本从每月140美元降到22美元,但正文没披露索引耗时、吞吐量或数据集大小。这点先别太激动——50GB交...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:00
23d ago
TechCrunch AI· rssEN14:00 · 05·21
Tony Robbins 和 Calm 前员工做的 AI 心理治疗,安全分 95
The Path 声称其 AI 模型在心理健康安全基准 Vera-MH 上得了 95 分,而市面上的消费级聊天机器人最高才 65 分。分数差距挺大,但正文没披露模型架构、评估细节、定价和上线时间,所以这个 95 分到底多扎实还不好说。
#Safety#Benchmarking#The Path#Tony Robbins
精选理由
创始人噱头(托尼·罗宾斯 + Calm 背景)、Vera-MH 95 vs 65 的对比数字、以及 AI 心理治疗的安全责任痛点,三条都够硬,所以 H/K/R 全过。但正文没披露模型机制、训练样本量,也没有第三方复现验证,信息缺口明显,所以分数压在 64 这个中段,不往上冲。
一句话点评
一家由Tony Robbins和Calm前员工创办的心理健康AI公司,声称其模型在Vera-MH安全基准上拿了95分,而市面消费级聊天机器人最高才65分。分数差距确实大,但正文没披露模型架构、评估细节、定价和上线时间,所以这个95分到底多扎实还不好说。短评:分数差距大,但没披露评估细节和定价,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
13:52
23d ago
TechCrunch AI· rssEN13:52 · 05·21
Google 在 I/O 上推 AI 代理生态,消费者可能不买账
Google 在 I/O 开发者大会上介绍了一种让消费者用 AI 代理上网的新方式,但现场演示让人困惑。正文没披露具体产品列表、上线时间、定价或技术原理,所以目前只能判断:概念方向明确,但落地说服力不足。
#Agent#Google#Product update#Commentary
精选理由
HKR-H和HKR-R通过:TechCrunch用消费者接受度存疑的角度来框Google的I/O Agent推广,有争议性也有行业共鸣。HKR-K不通过:摘要里没有产品名、日期、价格或具体机制,信息缺口太大,只能归到一般评论类。
一句话点评
Google I/O 推了个面向消费者的 AI 代理概念,现场演示却让人看不懂。正文没披露具体产品、上线时间、定价或技术原理,所以目前只能判断:方向明确,但落地说服力不足。短评:概念画饼,演示翻车,消费者买不买账先打个问号。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
13:04
23d ago
Product Hunt · AI· rssEN13:04 · 05·21
Dune Keypad:一个会看屏幕的 Mac 小键盘,按一下就能跑工作流
Dune 是一个放在 Mac 键盘旁边的三键小键盘,它能根据你当前打开的软件(比如 VS Code、Zoom、Claude)自动切换三个按键的功能。这次更新加了两个东西:一个是用自然语言跟 Claude 对话就能创建快捷键,不用自己写脚本;另一个是社区脚本市场,别人写好的工作流可以直接装。正文没披露硬件参数、价格和发货时间,也没说延迟多高。如果真能做到...
#Tools#Dune#Claude#Product update
精选理由
一个产品猎头的小工具发布:HKR-H 在工具形态上有个小钩子,但 HKR-K 信息很薄,HKR-R 没有触及行业神经。评分停留在低价值产品更新区间。
一句话点评
Dune 是一个放在 Mac 键盘旁的三键小键盘,能根据当前打开的软件(VS Code、Zoom、Claude 等)自动切换按键功能。这次更新亮点:一是用自然语言跟 Claude 对话就能创建快捷键,不用写脚本;二是上线了社区脚本市场,别人写好的工作流可以直接装。如果真能做到“对话即配置”,对懒得折腾快捷键的开发者挺友好。但正文没披露硬件参数、价格、发货时间,也没说按键切换的延迟有多高——如...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0

更多

频道

后台