ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-06-12

75 items · updated 3m ago
RSS live
2026-06-12 · 星期五2026年6月12日
23:00
14h ago
TechCrunch AI· rssEN23:00 · 06·12
Meta 新 AI 部门被员工称为“精神摧残的古拉格”,6500 人濒临造反
一篇报道称 Meta 成立仅几个月的 AI 部门(6500 人)内部士气极差,工程师形容为“精神摧残的古拉格”,接近集体反抗。报道没具体说员工在抱怨什么——是加班、管理混乱还是方向不明——但标题已经说明氛围有多糟。如果你在考虑跳槽去 Meta AI,这点先别太激动,正文没披露具体槽点,只能先当情绪信号看。
#Meta
精选理由
标题钩子(H)和话题共鸣(R)都很强,但正文几乎没给任何具体信息(K 缺失)——没有具体抱怨、没有数据、没有员工直接引语。分数卡在 68 是因为信息缺口太大,没法当事实报道处理。
一句话点评
Meta 那个 6500 人的 AI 部门才成立几个月,内部就被工程师形容成“精神摧残的古拉格”,接近集体反抗。报道没具体说槽点是加班、管理混乱还是方向不明,标题已经说明氛围有多糟。如果你在考虑跳槽去 Meta AI,这点先别太激动,正文没披露具体槽点,只能先当情绪信号看。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
22:48
14h ago
AI HOT 精选· aihot-apiZH22:48 · 06·12
Oran Ge 开源了一个写作 skill,专门解决 AI 改稿越改越没人味的问题
Oran Ge 用 Claude Fable 5 把同一篇文案改了三遍,发现改得越讲究,人味越淡。他跟 AI 聊完把问题归结为“存在感”——作者在某个具体位置付出过具体代价,AI 没法复现这个。于是他做了《人味儿写作心法.skill》,用在你自己写完或口述后让 AI 润色的场景,尽量保住文字里的活人气。skill 已开源,免费挂在 GitHub 上。
#Oran Ge#Claude Fable 5#Open source
精选理由
作者用 Claude Fable 5 做了三轮对比改写,把“人味”拆成“存在感”这个可操作的概念,然后开源了 skill 文件。对做 AI 辅助写作的人有直接参考价值。分数卡在 featured 门槛是因为这还是一个个人实验,正文没披露更大规模的验证或效果数据,所以先别太激动。
一句话点评
这条值得看的是他做了实验:同一篇文案让 Claude Fable 5 改三遍,越改越“讲究”,人味越淡。他把问题归结为“存在感”——作者在某个具体位置付出过具体代价,AI 没法复现。skill 的逻辑是让你先自己写或口述,再让 AI 润色,尽量保住活人气。 但正文没披露 skill 的具体规则和测试样本量,也没说“人味”怎么衡量、跟谁比。开源免费挂在 GitHub 上,这点先别太激动——没...
HKR 分解
hook knowledge resonance
打开信源
72
SCORE
H1·K1·R1
21:00
16h ago
NVIDIA 博客· rssEN21:00 · 06·12
NVIDIA 称 Blackwell 在首个 AI Agent 基础设施基准测试中领先
NVIDIA 发博客说,他们的 Blackwell 平台在 Artificial Analysis 发布的第一个专门测 AI Agent 基础设施的基准测试里拿了第一。博客没给具体跑分和对比细节,只强调 Blackwell 在延迟和吞吐量上有优势。说白了就是,让模型进业务流程干活(agent workflow)时,Blackwell 响应更快、单位时间...
#Benchmarking#NVIDIA#Blackwell#Artificial Analysis
精选理由
NVIDIA 发博客说 Blackwell 在 Artificial Analysis 发布的第一个 AI Agent 基础设施基准测试里拿了第一,但正文没披露任何跑分、对比细节或测试方法,只笼统说延迟和吞吐量有优势。全文就是一篇营销声明,没有实质信息。三个 HKR 轴全部不达标,归类为低价值内容。
一句话点评
NVIDIA 发博客说 Blackwell 在首个 AI Agent 基础设施基准测试里拿了第一,但没给具体分数和对比细节。这个测试由 Artificial Analysis 做,专门测让模型进业务流程干活(agent workflow)时的延迟和吞吐量。博客只强调 Blackwell 响应更快、单位时间处理更多请求,但没披露跑了什么模型、用了多少卡、对手是谁。如果是真的,对做 agent ...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
20:39
17h ago
持续报道 · 1dHacker News 首页· rssEN20:39 · 06·12
Palantir在瑞士法院诉讼案中败诉,媒体监督权获法律支持
Palantir 起诉瑞士一家调查杂志,但法院判它败诉,维持了媒体监督权。正文被 FT 付费墙挡住,没披露具体判决理由和 Palantir 下一步会不会上诉。对 AI 从业者来说,Palantir 的政府合同经常涉及数据隐私争议,这次司法受挫可能影响它在欧洲的公关和合规策略,但信息缺口明显——不知道法院具体认定了哪些事实。
#Palantir#Policy
精选理由
正文被 FT 付费墙完全挡住,零可提取的事实、数据或判断。触发硬排除规则第6条(零来源内容)。重要性上限39,等级设为 excluded。
一句话点评
Palantir 在瑞士告一家调查杂志社,结果败诉了。法院支持媒体监督权,这对 Palantir 这种靠政府合同吃饭的公司是个公关和法律上的麻烦。正文被 FT 的付费墙挡住了,具体判决理由和后续影响没披露。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K0·R0
20:34
17h ago
持续报道 · 1dHacker News 首页· rssEN20:34 · 06·12
有人用Claude和Fable 5“氛围编程”搓了个魔兽世界风格MMO,已经能玩了
World of ClaudeCraft 是一个用 Fable 5 和 Claude 通过“氛围编程”(vibe coding,即靠自然语言描述需求让AI生成代码)搞出来的魔兽世界风格MMORPG。支持在线多人或离线单人,有9个职业(战士、法师等)和经典魔兽操作(WASD移动、技能栏、任务日志)。代码已开源在GitHub。页面已经能玩,但正文没披露用了...
#Code#Claude#Fable 5#World of ClaudeCraft
精选理由
一个用Claude和Fable 5靠氛围编程搞出来的魔兽世界风格MMORPG——能玩、9个职业、开源。H(新颖概念)和K(AI编程的具体产出)都够,但R不行:这是个人演示,不是行业事件。重要性65分——有意思但不够上推荐位。
一句话点评
一个人用Claude和Fable 5靠嘴说需求就搓出了个魔兽世界风格MMORPG,支持9职业、WASD移动、多人同服或离线单机,代码已开源。页面能玩,但没披露用了哪个Claude模型、服务器架构和并发上限——如果是真的挺省钱,但这点先别太激动,正文没披露验证细节。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R0
17:34
20h ago
持续报道 · 1dHacker News 首页· rssEN17:34 · 06·12
在 Mac 上搭一个本地写代码的 AI 助手,代码不出门
这是一篇实操教程,教你在 macOS 上跑一个本地编程助手,所有代码都留在自己电脑里,不上传云端。文章没说是用哪个模型或工具链,所以具体效果和成本得自己试。好处是隐私有保障,坏处是本地跑模型对硬件有要求,速度可能不如云端。如果你在意代码保密,可以照着搭一套试试。
精选理由
一篇教你在 macOS 上搭本地编程助手的教程,但正文没披露用哪个模型、工具链或跑分数据——信息密度极低。HKR 三项全不沾,属于低价值内容。
一句话点评
一篇实操教程,教你在 macOS 上搭本地编程助手,所有代码不上云。作者用 M1 Max 实测,Gemma 4 26B 量化版 + llama.cpp + MTP 投机解码,生成速度从 58 tok/s 提到 72 tok/s,提升约 24%。注意:这是 16GB 模型,M1 Max 64GB 内存才能跑,普通 Mac 可能扛不住。文章没对比云端方案(如 Copilot)的延迟和成本,也没说...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
17:17
20h ago
The Verge · AI· rssEN17:17 · 06·12
Siri 终于能用了?苹果新版本实测:不惊艳但够用
苹果发布了新版 Siri,The Verge 的主播们试了之后说:居然真的变好用了。不是那种“哇塞”的突破,而是日常设闹钟、查信息终于不翻车了。文章没提具体有哪些新功能,也没说什么时候正式上线,所以这点先别太激动。但如果你受够了旧版 Siri 的智障表现,这次至少能松口气。
#Apple#The Verge
精选理由
标题有钩子,受众共鸣强,但正文缺乏任何具体信息——没有新功能、技术细节或发布时间,只有主播的主观感受。H 和 R 达标,K 完全缺失,所以分数压在 60-71 区间的低端,最终定在 55。
一句话点评
The Verge 主播实测后说新版 Siri 终于不智障了,设闹钟、查信息基本不翻车。但文章没提具体新功能,也没说上线时间,所以先别太激动。至少日常用能松口气,但别指望有什么突破性体验。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
16:58
20h ago
持续报道 · 1dHacker News 首页· rssEN16:58 · 06·12
BitBoard:让AI和人类共用同一个数据分析仪表盘
YC P25 团队 BitBoard 做了一个分析工作台,核心卖点是:人类和 AI 代理(比如写代码的 agent)可以共享同一个仪表盘,而不是各看各的。创始人 Connor 和 Ambar 原本做医疗行政 agent,客户老问他们怎么处理散落的数据和表格,于是干脆转型。做法是:人和 agent 用同一套数据,但各自有合适的工具——agent 写 SQ...
#BitBoard#YC P25#DuckDB
精选理由
YC 新项目,产品设计有想法(共享数据、人机分离工具),但属于 niche 工具,没有行业级信号。H 和 K 都够,R 不够。分数卡在 60 出头合理。
一句话点评
BitBoard 做了一个让 AI agent 和人共用同一套仪表盘的分析工作台。核心卖点:agent 写 SQL 出图,人看板子协作,每次查询可追溯、可复现。底层用 DuckDB 和 Arrow 做列式分析,LLM 只负责发现问题,修复靠确定性代码——这点先别太激动,因为正文没披露 LLM 准确率或误报率。创始人从医疗行政 agent 转型,客户痛点真实:数据散落、表格满天飞。但产品刚上线...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
16:43
21h ago
持续报道 · 1dr/LocalLLaMA· rssEN16:43 · 06·12
llama.cpp 的网页界面现在能装成桌面应用了
llama.cpp 合并了一个 PR,让自带的网页 UI 支持 PWA(渐进式网页应用)。装好后可以像原生应用一样放到桌面、有独立窗口和图标,打开更快,更新和缓存也更稳定。算是一个很实在的体验升级。正文没提具体支持哪些浏览器和平台,Chrome 和 Edge 大概率没问题,Safari 可能得看版本。
#llama.cpp#ggml-org
精选理由
llama.cpp 合并了 PWA 支持,算是一个实在的体验升级——装好后可以像原生应用一样放到桌面、有独立窗口和图标,打开更快,更新和缓存也更稳定。但正文太薄了,没披露具体支持哪些浏览器和平台(Chrome 和 Edge 大概率没问题,Safari 可能得看版本),也没提性能提升的具体数字或实现细节。信息缺口太大,HKR 三项全挂,落在低价值区间。
一句话点评
llama.cpp 的网页 UI 现在可以装成桌面应用了,有独立窗口和图标,打开更快、缓存更稳。对本地跑模型的用户来说,省了每次开浏览器输地址的麻烦。不过正文没提具体支持哪些浏览器,Chrome 和 Edge 大概率行,Safari 可能挑版本。短评:本地模型用户的小确幸,省一步是一步。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
16:25
21h ago
新 · 2 信源彭博科技· rssEN16:25 · 06·12
马斯克成为全球首位万亿富翁
彭博社报道,埃隆·马斯克成为全球首位身家突破1万亿美元的人。正文没披露他的财富具体构成和达到这一里程碑的具体时间点。
#Elon Musk#Bloomberg
精选理由
硬排除规则4:纯财经新闻,与AI无关。正文只有视频页导航,零实质内容。HKR三项全空,重要性上限39。
一句话点评
彭博发视频称马斯克成全球首位万亿富翁,但正文只有导航栏和版权信息,没披露财富构成、估值依据或时间点。标题很响,信息量几乎为零,建议等有具体数字和来源的报道再转。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K0·R0
16:14
21h ago
持续报道 · 1dAI HOT 精选· aihot-apiZH16:14 · 06·12
Anthropic 第一次做大规模民意调查:美国人最想让 AI 治癌症,但更怕它抢饭碗
Anthropic 委托 YouGov 在 2025 年 11 到 12 月线上问了约 5.2 万美国人,样本按人口普查加权过。48% 的人把“治愈癌症这类疾病”排在最想 AI 做成的事里,36% 希望 AI 帮残障人士生活更方便。担心的事更集中:64% 怕失业,56% 怕人对 AI 产生认知依赖,52% 怕假消息泛滥。超过七成支持政府出手监管,最在意...
#Anthropic#YouGov
精选理由
Anthropic 首次大规模民意调查本身有信号意义,但它终究是一份情绪报告,不是产品更新或技术突破。HKR 三项都踩中了,但缺一个硬核的产品钩子,所以定在 72 分,刚好卡在值得推荐的门槛上。
一句话点评
Anthropic 自己掏钱做了个覆盖 5.2 万美国人的民调,结果不意外:近一半人最想让 AI 去治病,但六成以上怕丢工作。这个数据来自 2025 年底的线上问卷,样本按人口普查加权过,但正文没放完整问卷和交叉分析表,所以没法判断问题怎么问的、选项有没有引导。我会先打个折:48% 把“治愈癌症”排进前三,这个数字看着高,但它是从 17 个选项里挑三个,不是单选,不能直接解读成“近半美国人最...
HKR 分解
hook knowledge resonance
打开信源
72
SCORE
H1·K1·R1
16:00
21h ago
AI HOT 精选· aihot-apiZH16:00 · 06·12
Hermes Agent 接入 OpenRouter 教程:一个 API Key 调 400+ 模型,还能自动切换备用供应商
OpenRouter 发了一篇教程,教你怎么把 Hermes Agent 连到它的 API 网关。Hermes Agent 是 Nous Research 的开源命令行智能体,不是 Hermes 3 或 Hermes 4 模型——很多人搞混。接上 OpenRouter 后,一个 API Key 就能调 60 多家供应商的 400 多个模型,主模型挂了自...
#Agent#OpenRouter#Nous Research#Hermes Agent
精选理由
OpenRouter 发了一篇教程,教你怎么把 Hermes Agent 连到它的 API 网关。全文就是配置步骤和模型路由建议,跟 OpenRouter 现有文档重复。没有新能力,也没有新洞察。三个 HKR 轴一个都没中,所以 tier = all。
一句话点评
Hermes Agent 是 Nous Research 的开源命令行智能体,不是 Hermes 3/4 模型——很多人搞混。接上 OpenRouter 后,一个 API Key 就能调 60 多家供应商的 400 多个模型,主模型挂了自动切换。默认主模型是 Claude Sonnet,侧任务(如起标题、看图)可以换更便宜的模型跑。配置写在 ~/.hermes/config.yaml。代理本...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
16:00
21h ago
持续报道 · 1dAI HOT 精选· aihot-apiZH16:00 · 06·12
OpenRouter 官方省钱指南:加个 :floor 后缀自动选最便宜供应商
OpenRouter 发了一篇官方教程,核心技巧是在模型名后面加 `:floor` 后缀,系统会自动把请求路由到该模型最便宜的供应商。以 Llama 3.3 70B 为例,不同供应商每百万 token 的输入价格从 0.10 美元到 1 美元以上不等,`:floor` 直接选最低价。还可以用 `max_price` 设硬预算上限——如果所有供应商都超预...
#OpenRouter#Llama 3.3 70B
精选理由
OpenRouter 官方教程,教用户加 `:floor` 自动选最便宜的供应商,还能用 `max_price` 设硬预算。有个具体可用的技巧(K 命中),但标题和正文都是纯文档——没有悬念或情绪共鸣(H 不命中),也不像能引发讨论(R 不命中)。
一句话点评
OpenRouter 官方教程:在模型名后加 `:floor` 后缀,系统自动选最便宜的供应商。以 Llama 3.3 70B 为例,不同供应商每百万 token 输入价格从 0.10 美元到 1 美元以上,`:floor` 直接选最低价。还可用 `max_price` 设硬预算上限,超了就报错。免费模型每天 50 次请求,充 10 美元后涨到 1000 次。注意:最低价可能是量化版,精度敏...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
15:50
21h ago
新 · 2 信源● P1TechCrunch AI· rssEN15:50 · 06·12
MANGOS概念浮现 多家AI公司计划今夏寻求IPO
这期播客聊了一件事:IPO 市场热起来了,但主角换人了。以前大家盯着 FAANG,现在新缩写是 MANGOS——Meta(也有人说是微软)、Anthropic、Nvidia、Google、OpenAI 和 SpaceX。这六家里有一半要在同一个窗口期冲击上市,等于同时考验投资人的胃口和这些公司的估值成色。正文是 RSS 片段,没给出具体时间表和估值区间...
#Meta#Microsoft#Anthropic#Funding
精选理由
这期播客抛出的 MANGOS 概念把潜在的 IPO 扎堆——Anthropic、OpenAI、SpaceX——包装成了一个好记的叙事。我会先打个折:正文只是 RSS 片段,没给时间表和估值区间,所以这更像一个信号,不是能直接拿来交易的硬情报。
一句话点评
TechCrunch 造了个新词 MANGOS,把几家头部 AI 公司打包成今夏 IPO 概念股,但正文是空的,具体估值和上市时间表都没给。
锐评
这条消息更像一个市场情绪信号,而不是实打实的上市公告。TechCrunch 用 MANGOS 这个缩写把可能今夏 IPO 的 AI 公司串在一起,从标题看至少包括 SpaceX、Anthropic 和 OpenAI。但文章正文是空的,我们只能从标题和事件标签去推断。 “今夏 IPO”这个说法本身就需要打个折。这几家公司里,SpaceX 传上市传了很久,Anthropic 和 OpenAI 的营收结构和商业化节奏还没完全跑稳,直接跳到夏季挂牌,时间上很紧。正文没披露任何财务数据、估值区间或承销行信息,所以目前只能当作风向观察:市场在给 AI 赛道造叙事,把头部玩家打包成新的 FAANG。 还缺什么?缺各家真实的上市意愿、SEC 文件进展,以及它们能否在公开市场撑住当前私募轮的高估值。这些才是判断 MANGOS 是熟果还是青果的关键。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
15:42
22h ago
持续报道 · 1dHacker News 首页· rssEN15:42 · 06·12
Keygen.music:哼一段旋律,生成一个软件激活码
这个网站让你用一段音乐生成软件激活码。玩法很直观:播放或哼一段旋律,网站就给你一个对应的 license key。正文没披露背后的算法逻辑,也没说支持哪些音频格式,所以具体怎么把声音转成合法激活码还是个黑盒。不过 32 个 HN 点赞说明社区觉得这个点子挺有意思,至少是个好玩的 demo。
精选理由
点子新颖有趣(H 命中),但信息太薄——没讲算法细节、格式支持或验证机制。好玩归好玩,不值得作为重点报道。Tier: all。
一句话点评
用一段旋律生成软件激活码,玩法像把音乐当密码。32个HN点赞说明点子有趣,但算法和格式都没披露,目前就是个好玩的demo,别当真key用。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R0
15:33
22h ago
持续报道 · 1dAI HOT 精选· aihot-apiZH15:33 · 06·12
豆包上线任务模式,能定时干活、自动做网页和PPT,思考模式改名专家模式
豆包这次把Agent能力直接塞进了App里。新加的“任务模式”可以定时执行任务、零代码生成网页、一键做PPT,还能做数据可视化分析。原来的“思考模式”升级成“专家模式”,底层换成了豆包大模型2.0 Pro,推理会更深一些。App顶栏现在三个模式切换:快速、专家、任务。基础功能免费,高阶服务要付费,标准版68元/月,加强版200元/月,专业版500元/月...
#Code#ByteDance#Doubao
精选理由
豆包把 Agent 包装成“任务模式”塞进 App,能定时干活、零代码出网页和 PPT,还换了 2.0 Pro 模型做“专家模式”。我会先打个折:这不是底层模型升级,更像把已有能力重新打包,让普通用户更容易上手。功能清单和付费档位都给了,对关注 C 端 AI 产品落地的人有参考价值,但正文没提实际延迟、成功率这些硬指标,也没给出和竞品的对比。整体是扎实的产品迭代,不是能引发讨论的行业事件。
一句话点评
豆包把能干活儿的 Agent 直接塞进了 App 顶栏,现在可以定时执行任务、零代码生成网页和做 PPT。这不再是聊天,而是让模型进业务流程干活。但正文没披露任务模式的实际执行成功率、延迟和专家模式的推理基准,所以“深度推理”到底多深还不好说。付费最高每年五千多,值不值要看它能不能稳定交付可用成品,而不是只给个半成品让你自己改。
HKR 分解
hook knowledge resonance
打开信源
72
SCORE
H1·K1·R0
15:31
22h ago
持续报道 · 1dHacker News 首页· rssEN15:31 · 06·12
Mac 终于能远程开机了:插电即启动,不用再按电源键
macOS 26.5 新增了一个选项,让 Mac 在接通电源时自动开机,不再需要手动按电源键。Jeff Geerling 用 M4 Mac mini 实测:关机后通过智能插座断电再通电,Mac 在 2 秒内启动。支持机型:Mac mini(2024 后)、Mac Studio(2025 后)、iMac(2024 后)。两个注意点:开了 FileVaul...
#Apple#Jeff Geerling#M4 Mac mini
精选理由
macOS 26.5 新增了接通电源自动开机的选项,Jeff Geerling 用 M4 Mac mini 实测:关机后通过智能插座断电再通电,Mac 在 2 秒内启动。支持机型为 Mac mini(2024 后)、Mac Studio(2025 后)、iMac(2024 后)。对 AI 从业者来说,远程启动 Mac 是一个小众便利功能,不是普遍痛点。该功能是系统设置,与 AI 无关。命中 H 和 K,但未命中 R。
一句话点评
macOS 26.5 终于让 Mac 能在通电后自动开机,实测 M4 Mac mini 关机后断电再通电,2 秒内启动。支持 2024 后 Mac mini、2025 后 Mac Studio、2024 后 iMac。注意:开了 FileVault 得先 SSH 登录解锁;有个 bug——在登录界面关机后通电不会启动。正文没提是否支持 Intel Mac。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R0
15:26
22h ago
持续报道 · 1dHacker News 首页· rssEN15:26 · 06·12
WebAssembly 可以直接调 GPU 了:WASI WebGPU 提案落地
这个提案让 WebAssembly 模块能直接跟 GPU 通信做计算和渲染,不用再经过 JavaScript 桥接。对 AI 从业者来说,意味着在浏览器或边缘设备上跑推理时,可以绕过 JS 直接调用 GPU,省掉一层开销。不过目前仓库只有接口定义,没提支持哪些后端(Vulkan/Metal/DX12),也没有任何跑分数据。所以实际性能提升多少、兼容性如...
#WebAssembly#WASI
精选理由
WASI 定义 GPU 接口是一个基础设施信号,对边缘推理和浏览器端 AI 部署有长期影响。但仓库目前只有接口定义——没有后端支持列表(Vulkan/Metal/DX12),也没有跑分数据。实际性能提升多少、兼容性如何,正文都没披露,所以先别太激动。
一句话点评
WASI WebGPU 提案让 WebAssembly 模块直接调 GPU 做计算和渲染,跳过 JavaScript 桥接层。对 AI 从业者来说,在浏览器或边缘设备跑推理时能省掉一层开销,理论上延迟更低、吞吐更高。但仓库目前只有接口定义,没提支持哪些后端(Vulkan/Metal/DX12),也没有任何跑分数据。实际性能提升多少、兼容性如何,全是未知数。这点先别太激动,等跑分和浏览器支持落...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
15:26
22h ago
持续报道 · 1dHacker News 首页· rssEN15:26 · 06·12
StackScope 爬了 4 万多独立开发者产品,看他们上线时到底用了什么技术栈
Jonathan 做了一个叫 StackScope 的爬虫,专门盯着 Product Hunt、Show HN 和 PeerPush 上的新发布,然后去扒每个产品的公开网站,看它们用了什么托管、框架、分析工具、DNS、安全头、法律页面,还有没有 AI 生成的痕迹。跟那些扫全网的工具不一样,它只关心独立开发者在产品刚上线那一刻选了什么。技术实现上,它用 ...
#StackScope#Product Hunt#Hacker News (Show HN)
精选理由
一个扎实的独立开发者圈数据项目,H 和 K 都很强,但工具向的焦点让它缺了 AI 从业者层面的广泛共鸣。按规则落在 60-71 分档,给了 68。
一句话点评
Jonathan 爬了 4 万多个独立产品首发页,扒出它们用的托管、框架、分析工具等。一个实用发现:1/3 的独立产品跑在 Vercel 上,去掉它后 Tailwind 和 React 占比明显下降。目前 Cloudflare 没给它 bot 白名单,约 10% 的站爬不到。正文没披露这 4 万条数据的时间跨度,也没给整体技术分布汇总,只有标题和功能列表是确定的。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
15:08
22h ago
持续报道 · 1dHacker News 首页· rssEN15:08 · 06·12
Claude 网页端没有批量删聊天功能,这个脚本帮你一键清空
Claude 网页版不像 ChatGPT 那样有批量删除按钮,聊天多了只能手动一条条删,很麻烦。Matteo Leonesi 写了个脚本自动执行删除操作。缺点是删除过程很慢,要持续几分钟,而且浏览器标签页不能关,关了就中断。正文没提脚本的许可证,也没说是否支持其他模型。
#Matteo Leonesi
精选理由
一个解决 Claude 网页版缺少批量删除功能的实用脚本。H 成立,因为用户会好奇怎么绕过这个痛点;K 成立,因为脚本给出了具体操作和两个真实限制(慢、不能关标签页),没有隐瞒缺陷;R 不成立,因为这只是个工具,不是能引发行业讨论的话题。整体属于 40-59 低价值区间,小众工具,不是行业级新闻。
一句话点评
Claude 网页版没有批量删聊天功能,Matteo Leonesi 写了个脚本自动删。缺点是删得慢,要几分钟,而且浏览器标签页不能关,关了中断。正文没提许可证,也没说是否支持其他模型。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K1·R0
14:53
22h ago
持续报道 · 1dr/LocalLLaMA· rssEN14:53 · 06·12
MiniMax M3 上线 HuggingChat,支持直接跑代码和网页
MiniMax M3 模型现在可以在 HuggingChat 上直接用了,还带 Artifacts 功能——你让它写段代码或生成一个网页,它能在对话里直接渲染出可运行的结果,不用复制到别处跑。正文没披露模型参数、是否开源、以及跟其他模型的跑分对比,所以目前只能当个新玩具试试手。如果你需要一个能边聊边出可执行代码或页面的聊天模型,值得点进去玩一下。
#Code#MiniMax#HuggingChat#Open source
精选理由
MiniMax M3 上架 HuggingChat 并支持 Artifacts 是个不错的演示,但正文没给任何规格、跑分或开源状态——太薄了,不值得推荐。H 成立,K 和 R 不成立。62 分,全量推送。
一句话点评
MiniMax M3 上线 HuggingChat,支持 Artifacts 功能,能直接在对话里渲染代码和网页,省去复制粘贴的麻烦。但正文没披露模型参数、是否开源、跑分对比,目前只能当新玩具试试。如果你需要边聊边出可执行结果,值得点进去玩一下。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R0
14:48
22h ago
持续报道 · 1dHacker News 首页· rssEN14:48 · 06·12
AI 生成前端代码太啰嗦?这篇博客教你手动去冗余
一篇博客给出了清理 AI 生成前端代码中“废话”的实操建议:删掉多余的包裹 div、去掉过度抽象的 CSS 类、检查逻辑是否真的在用。作者没推荐具体工具或插件,但建议很实在——适合用 AI 写 UI 的开发者。正文没披露这些建议在多大规模的项目上验证过,所以效果可能因项目复杂度而异。
精选理由
一篇清理AI生成前端代码的实操指南,建议很实在但都是常识,没有新数据、机制或可验证的结论。正文没披露验证规模,效果因项目复杂度而异。HKR只命中K,适合all feed。
一句话点评
一篇博客分享了一个去 AI 前端代码“废话”的偏方:让 AI 把界面风格改成 Qt 样式,作者说这样能去掉大部分“AI 味”。他拿一个选举地图可视化页面试了,觉得效果不错,后来把自己所有个人软件都改成了 Qt 风。但正文没披露这些建议在多大规模的项目上验证过,也没说 Qt 风格是否适合复杂交互或移动端。短评:偏方挺有意思,但效果可能因项目复杂度而异,先别急着全盘照搬。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
14:11
23h ago
持续报道 · 1d● P1AI HOT 精选· aihot-apiZH14:11 · 06·12
MiniMax 开源 M3 模型,428B 总参数 23B 激活 100 万 token 上下文
MiniMax 把 M3 的权重传上了 HuggingFace,技术报告和完整权重大概还要等 10 天。这是个混合模型,总参数量 428B,但每次只激活 23B,靠 MiniMax 自研的稀疏注意力把上下文窗口撑到 100 万 token,还原生支持多模态。跑分方面:SWE-Bench Pro 59.0%、Terminal Bench 2.1 66.0...
#Code#Agent#Multimodal#MiniMax
精选理由
MiniMax 第一次把旗舰模型权重开源,428B 的混合专家模型,激活 23B,百万 token 上下文,代码和智能体跑分能跟 DeepSeek、Qwen 掰手腕。技术报告还没出,权重刚上传,信息缺口明显,但开源这个动作本身对开发者生态有直接价值。
一句话点评
MiniMax 开源了一个 428B 总参数、每次激活 23B 的 MoE 模型,支持 100 万 token 上下文,但 Reddit 源被屏蔽,正文没披露具体评测和训练细节。
锐评
这条消息最值得看的是参数配置:总参数量 428B,但每次推理只激活 23B。这种混合专家(MoE)架构的好处是,跑起来对算力的要求和 23B 的稠密模型差不多,但知识容量和推理能力理论上能对标大得多的模型。如果这个激活比例带来的性能属实,部署成本会低不少。 不过现在能确认的信息很有限。Reddit 的帖子直接被网络策略挡了,HuggingFace 页面也没提供技术报告或详细跑分。100 万 token 的上下文窗口听起来很长,但实际长文本任务里的检索精度、首尾信息一致性这些关键指标,正文都没披露。 我会先打个折:开源是好事,但没看到独立评测之前,别急着拿它跟同规模的模型比。后续得看有没有人跑通标准测试集,以及长上下文场景下的真实表现。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
14:11
23h ago
持续报道 · 1dr/LocalLLaMA· rssEN14:11 · 06·12
35B模型在12GB显存显卡上跑,两轮提示就生成频谱GIF
Reddit用户yes2matt用RTX 3060 12GB显卡跑Qwen3.6-35B的4-bit量化版(llama.cpp),只用了两轮提示就让模型写Python代码,生成一个80年代收音机风格的频谱分析GIF。第一轮让模型写FFT脚本输出15fps、320像素的GIF;第二轮要求跳过前200毫秒、只显示低频段、做对数变换,模型都正确执行了。正文没...
#Code#Qwen3.6-35B#Hermes#RTX 3060
精选理由
一个本地模型的手工实验,硬件规格和提示迭代细节都很具体。对本地LLM社区有用,但对更广泛的AI从业者来说太窄——没有产品发布或研究论文的角度。
一句话点评
RTX 3060 12GB跑35B模型,两轮提示就写对了FFT频谱GIF脚本,说明4-bit量化后小显存也能跑大模型。但正文没披露推理速度,12GB跑35B大概率很慢,实用价值要打折。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
13:49
23h ago
持续报道 · 1dHacker News 首页· rssEN13:49 · 06·12
Meta 旗下 Facebook 和 Instagram 大面积宕机
Facebook 和 Instagram 现在挂了。Meta 自己的服务状态页 metastatus.com 上却没显示任何故障,说明这次中断可能比页面反映的范围更大。帖子没提影响哪些地区,也没给恢复时间。
#Meta#Facebook#Instagram#Incident
精选理由
一次大宕机天然有注意力价值,但帖子太薄——没原因、没范围、没恢复时间,只能给到 55 分。
一句话点评
Facebook 和 Instagram 挂了,但 Meta 自己的状态页 metastatus.com 没显示故障,说明这次中断可能比官方承认的范围更大。DownDetector 也报了 404 错误。帖子没提影响哪些地区,也没给恢复时间,信息有限。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
13:11
1d ago
r/LocalLLaMA· rssEN13:11 · 06·12
Open Dungeon:用 Gemma 4 在本地跑文字冒险,8GB 显存就能带 256K 上下文,还能让 FLUX 给场景配图
作者用 Gemma 4 12B 模型(QAT Q4 量化版)搭了一个完全本地运行的 AI 文字冒险游戏,类似 AI Dungeon 但不需要联网。模型通过 Ollama 驱动,负责讲故事;遇到值得画的场景,会调用本地的 FLUX 模型生成图片。全程没有 API 调用,数据不出电脑。比较意外的一点是,12B 模型在 256K 的完整上下文窗口下运行,显存...
#Gemma 4#Ollama#FLUX#Open source
精选理由
一个用 Gemma 4 12B 量化版搭的本地文字冒险游戏,全程不联网,数据不出电脑。亮点是 256K 上下文全开、显存压在 8GB 以下,还接了个 FLUX 模型自动配图。技术参数给得实在,但本质是个人项目分享,没披露延迟、生成质量或稳定性数据,我会先打个折,当个有趣的动手参考看。
一句话点评
这条消息本身被 Reddit 的网络安全机制拦截了,正文没拿到,只能根据摘要判断。摘要说作者用 Gemma 4 12B 的 QAT 量化版跑了一个本地文字冒险游戏,全程不联网,数据不出电脑。比较亮眼的是 12B 模型在 256K 完整上下文窗口下只吃 7.7GB 左右内存,因为 Gemma 4 的 KV 缓存增长很慢。超出上下文的旧场景会被压缩成摘要,让模型还记得第一章的事。支持 Do/Sa...
HKR 分解
hook knowledge resonance
打开信源
72
SCORE
H1·K1·R0
12:55
1d ago
r/LocalLLaMA· rssEN12:55 · 06·12
16GB显存跑Qwen 3.6 27B + Openclaw,有人试成了
一位用户用5070 Ti(16GB显存)跑Qwen 3.6 27B(4bpw GGUF量化版)加Openclaw。之前试35B版时工具调用会死循环,换成27B就稳了。加载模型前关掉所有程序,腾出约15.2GB显存,加载后只剩800MB空闲,连浏览器都不敢开。上下文窗口开到100K,工具调用正常,但只测了2小时,长期稳定性未知。正文没提推理速度,也没说O...
#Qwen#Openclaw#NVIDIA GeForce RTX 5070 Ti
精选理由
一个本地部署实验,有具体硬件规格和量化参数,对自部署用户有用。但正文没提推理速度、工具调用成功率,只测了 2 小时——信息密度低。H 和 K 各中一次,R 没中,适合 all 层级。
一句话点评
Qwen 3.6 27B量化版(4bpw GGUF)配合Openclaw工具调用,能在16GB显存的5070 Ti上跑起来,上下文开到100K,实测2小时没崩。之前35B版会死循环,27B反而稳了。代价是加载后只剩800MB显存,连浏览器都不敢开。正文没提推理速度,也没说Openclaw版本,长期稳定性未知。如果是真的,低成本跑工具调用挺省钱,但别急着上生产。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R0
12:51
1d ago
r/LocalLLaMA· rssEN12:51 · 06·12
ContextSpy:像分析 CPU 性能一样分析 LLM 的上下文,帮你省 token
ContextSpy 是一个本地代理,插在你的编程助手和 LLM API 之间,记录每次请求并拆解输入 token 都花在了哪里——系统提示词、工具定义、文件内容、对话历史,一目了然。作者受 PyCon 启发,想用“性能分析”的思路优化 token 用量,而不是靠暴力压缩。目前还是早期项目,正文没披露支持哪些模型、代理本身会带来多少额外延迟。如果你在用...
#ContextSpy#PyCon
精选理由
ContextSpy 的想法挺有意思:在编程助手和 LLM API 之间插一个本地代理,像性能分析器一样拆解每次请求的 token 都花在哪——系统提示词、工具定义、文件内容、对话历史,一目了然。作者受 PyCon 启发,想用“分析”代替“暴力压缩”来省 token,对日常调 API 的人很实用。但项目太早期:正文没披露支持哪些模型,也没说代理本身会带来多少额外延迟,读者没法立刻判断能不能用、用了会不会更慢。
一句话点评
ContextSpy 是个本地代理,插在编程助手和 LLM API 之间,帮你拆解每次请求的 token 都花在哪——系统提示词、工具定义、文件内容、对话历史,一目了然。作者受 PyCon 启发,想用“性能分析”思路优化 token 用量,而不是暴力压缩。目前还是早期项目,正文没披露支持哪些模型、代理本身会带来多少额外延迟。如果你在用编程助手且 token 开销大,这个思路值得关注,但先别直...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
12:28
1d ago
r/LocalLLaMA· rssEN12:28 · 06·12
Supra Title 350M:一个只干一件事的小模型——给聊天记录起标题
SupraLabs 放出了一个 3.5 亿参数的小模型,专门用来给聊天对话生成标题。它基于 LFM2.5-350M 微调,不需要写 system prompt,直接把用户消息丢进去就能返回一个标题。模型已经转成了 GGUF 格式,文件大小从 177 MB 到 711 MB 不等,官方推荐用 Q8_0 或 Q6_K 量化版。目前还是实验阶段,团队说后面会...
#Fine-tuning#SupraLabs#LFM2.5-350M
精选理由
一个不知名团队放出的 3.5 亿参数小模型,只干一件事:给聊天对话生成标题。基于 LFM2.5-350M 微调,不用写 system prompt,直接把用户消息丢进去就返回标题。已转 GGUF 格式,文件 177–711 MB,推荐用 Q8_0 或 Q6_K 量化版。目前还是实验阶段,团队说后面会更新。参数极小(350M),任务单一(标题生成),团队没名气,没有行业影响力或传播潜力。分数卡在 55 合理。
一句话点评
SupraLabs 放了个 3.5 亿参数的小模型,专给聊天对话生成标题。基于 LFM2.5-350M 微调,不用写 system prompt,丢用户消息就能返回标题。GGUF 格式,177 MB 到 711 MB,推荐 Q8_0 或 Q6_K 量化版。目前还是实验阶段,团队说后面会扩 SFT 数据集并做偏好优化。正文没披露推理速度或延迟,但这么小的模型本地跑应该很快。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
12:00
1d ago
Hacker News 首页· rssEN12:00 · 06·12
Maxproof:让AI推理过程可验证,不再只给答案
这篇新论文提出让模型在输出答案的同时,附带一个可独立验证的“证明”,而不是只给一个黑盒结果。正文没披露具体技术细节或实验数据,但方向很明确:解决AI推理的“黑箱”问题,让输出能被外部检查。做可解释性和安全对齐的人值得一看。
#Reasoning#Interpretability
精选理由
论文方向(让模型输出可验证的证明)概念上有意思,但正文零技术细节和实验数据,只有高层面描述。HKR 三个轴都没落到具体事实上,重要性落在 60-71 区间。
一句话点评
MiniMax 发的新论文,核心是让模型在数学证明上同时做生成、验证和修复,最后用“锦标赛”方式从一堆候选里挑一个最优答案。结果挺猛:IMO 2025 拿了 35/42,USAMO 2026 拿了 36/42,都超过人类金牌线。关键设计是那个“低误报率验证器”,保证挑出来的证明不是瞎编的。但正文没披露训练数据量、计算成本,也没说这套方法在非数学任务上表现如何。如果是真的,等于给推理模型加了一...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K0·R0
10:42
1d ago
● P1Hacker News 首页· rssEN10:42 · 06·12
Moonshot AI开源Kimi K2.7-Code编程模型
Moonshot AI 在 Hugging Face 上放出了 Kimi K2.7-Code,一个开源代码模型,声称 token 利用率比同类更好。不过目前只有模型卡,没有技术报告、没有基准测试成绩,连参数量都没说。HN 上 42 个赞、4 条讨论。我会先打个折——没有第三方评测之前,能判断的东西太少。
#Code#Moonshot AI#Kimi#Open source
精选理由
Moonshot 开源代码模型本身值得留意,但模型卡信息量极低——没论文、没跑分、没参数规模。目前只能标成“值得关注但无法判断”,等有独立评测再重新打分。
一句话点评
Kimi 开源了代码模型 K2.7-Code,跑分挺高,但 Reddit 源被屏蔽,具体评测细节和社区真实反馈暂时看不到。
锐评
Moonshot AI 把 Kimi K2.7-Code 开源了,这是个专门写代码的模型。从标题看,性能提升“显著”,但具体跑分和对比基准,因为 Reddit 帖子被网络策略挡了,正文没披露,没法核实。开源是好事,意味着开发者能直接拿来用、自己微调。不过,代码模型的实际表现很看具体场景,跑分高不代表在你项目里就不出 bug。现在缺的是:它在 HumanEval 这类标准测试上的具体分数、对主流编程语言的支持细节、以及模型参数量和硬件要求。这些信息决定了它到底能不能在本地跑起来,以及值不值得从其他开源代码模型切过去。建议去 Hugging Face 模型卡上直接看技术报告和社区实测,别只看标题里的“显著”二字。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K0·R1
10:00
1d ago
持续报道 · 1dOpenAI 博客· rssEN10:00 · 06·12
OpenAI推出三门新课程教企业构建可重复AI工作流
OpenAI 今天上线了三门 Academy 课程:AI 基础、应用 AI 基础、以及智能体与工作流。内容从提示词和输出检查讲起,再到把一次性用法变成可重复的流程,最后教你怎么指挥智能体干活。合作方包括 BCG、埃森哲和 BBVA。每门课学完发证书。正文没透露课程时长和价格。
#OpenAI#BCG#Accenture
精选理由
OpenAI 上线了三门 Academy 课程,从 AI 基础讲到智能体工作流,合作方有 BCG、埃森哲。但大纲太通用,时长和价格都没披露,三个维度都不够。常规产品更新,定级为 all。
一句话点评
OpenAI 出了三门新课,教企业怎么把 AI 从“问一句答一句”变成能重复用的工作流。课程分三层:基础用法、搭流程、用 agent 干活。合作方有 BCG、埃森哲、BBVA,背书还行。但正文没披露课程定价、时长、具体案例效果,也没说证书含金量。对企业来说,如果免费或低价,当个内部培训素材挺划算;但别指望上完课就能落地——真正难的是组织变革,不是学几个 prompt 模板。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H0·K0·R0
09:21
1d ago
r/LocalLLaMA· rssEN09:21 · 06·12
浏览器操作Agent跑在WASM里,零服务器成本
开发者用Snapdom、WASM、WebGPU和ShowUi-2b模型,在浏览器里跑了一个完全自包含的浏览器操作Agent,不需要后端服务器。它能打字、点链接、改下拉菜单,还能做多步操作(点输入框→打字→点提交),成功率大概50%。作者说浏览器自动化非常难,目前只支持有限的操作,代码还是超早期alpha版。测试用了Mind2Web和MiniWob来提精...
#Snapdom#WASM#WebGPU#Open source
精选理由
这是个挺酷的技术实验——把浏览器操作Agent塞进WASM和WebGPU里跑,完全不要后端服务器,成本确实为零。作者给了具体技术栈和50%成功率,信息够实。但项目太早期,操作有限、成功率低,实用价值有限。H和K都够,R不够,落在60-71区间,tier all。
一句话点评
一个开发者用WASM+WebGPU在浏览器里跑了个能点链接、打字、改下拉菜单的Agent,完全不需要后端服务器。用的是ShowUi-2b小模型,多步操作成功率约50%。成本确实为零,但正文没披露延迟和模型精度,这点先别太激动。代码还是超早期alpha,只支持有限操作,离实用还远。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
09:00
1d ago
r/LocalLLaMA· rssEN09:00 · 06·12
Kimi K2.6 的思考链突然变短了,写代码也变好了
有用户发现 Kimi Code 里的 K2.6 模型今天思考链(CoT)变得非常短,写代码的表现也比之前好了。帖子没说是模型更新了还是用户心理作用,也没给出更新日志。另外提到 GLM 5.2 快发布了,希望国产模型继续开源,跟 Fable 5 竞争。
#Code#Reasoning#Kimi#Kimi K2.6
精选理由
纯用户体感帖,零硬信息——没有更新日志、没有跑分、没有官方确认。H和R勉强及格,K是零。上限55分,tier all。
一句话点评
有用户发现 Kimi Code 里的 K2.6 模型思考链变短了,写代码表现也变好了。但帖子没给出任何更新日志或官方确认,可能是心理作用。如果是真的,推理成本可能降低了,但这点先别太激动。另外提到 GLM 5.2 快发布了,希望国产模型继续开源。正文没披露模型是否真的更新了。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
08:06
1d ago
r/LocalLLaMA· rssEN08:06 · 06·12
PP-OCRv6 正式发布:轻量 OCR 模型,参数从 150 万到 3450 万
百度 PaddleOCR 发布了 PP-OCRv6,提供 Tiny(150 万参数)、Small(770 万)、Medium(3450 万)三个版本。相比 v5,检测准确率提升 4.9%,识别准确率提升 5.1%。用 OpenVINO 在 CPU 上跑推理,速度最高能快 5.2 倍,这对不想上 GPU 的场景挺实用。一个模型支持 50 种语言,还新增了...
#PaddleOCR#OpenVINO#Open source
精选理由
百度PaddleOCR v6发布了三个尺寸的模型(150万到3450万参数),检测准确率提升4.9%,识别提升5.1%,用OpenVINO在CPU上推理速度最高快5.2倍。数字扎实,对选型有用,但OCR领域成熟,这次只是常规升级,没有引爆点或颠覆性。重要性55,面向所有人。
一句话点评
百度开源 PP-OCRv6,三个模型从 150 万到 3450 万参数,检测和识别准确率分别涨了 4.9% 和 5.1%。用 OpenVINO 在 CPU 上跑能快 5.2 倍,不上 GPU 也能用。一个模型支持 50 种语言,新增了 PCB、CAD 图纸等场景。Apache 2.0 协议,浏览器和边缘设备都能跑。正文没披露训练数据量和具体硬件配置,实际效果得自己跑一遍。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
07:40
1d ago
r/LocalLLaMA· rssEN07:40 · 06·12
EAGLE3 投机解码已并入 llama.cpp,辅助模型不再自己瞎猜,而是由主模型给提示
开发了半年,EAGLE3 终于合进 llama.cpp 了。它跟 MTP 思路类似,但区别在于辅助模型不是独立猜测下一个 token,而是从主模型那里拿到额外指引,相当于让“小助手”照着“大模型”的提示来写,理论上猜得更准。帖子只给了这个定性描述,没提具体能快多少、多占多少显存、支持哪些模型,这些关键数字都还没公布,所以实际效果先别太激动。
#llama.cpp#EAGLE3
精选理由
EAGLE3 进 llama.cpp 对本地推理圈是个好消息,机制解释也比以前好懂。但帖子只给了定性描述,没披露速度、显存占用、支持哪些模型,真实收益还是未知数。H 和 K 都打中了,R 偏弱,所以放 all tier 没问题。
一句话点评
EAGLE3 合进 llama.cpp 了,思路是让一个小助手模型照着主模型的提示来猜下一个 token,比独立瞎猜更准。但帖子只给了定性描述,没提加速多少、多占多少显存、支持哪些模型,这些关键数字都还没公布,所以实际效果先别太激动。
HKR 分解
hook knowledge resonance
打开信源
72
SCORE
H1·K1·R0
07:00
1d ago
The Verge · AI· rssEN07:00 · 06·12
苹果软件主管:新 Siri 不会学 OpenAI 和谷歌那套拍马屁话术
苹果软件主管 Craig Federighi 在采访中明确说,新版 Siri 不会像 OpenAI 和谷歌的聊天机器人那样靠奉承用户来拉长对话时长。他批评现有 bot 用“你太棒了”这类话术诱导用户自我暴露,而苹果刻意让 Siri 学会“该闭嘴时就闭嘴”。正文没披露具体功能或发布时间,只强调了设计理念上的差异。
#Apple#Craig Federighi#OpenAI
精选理由
Craig Federighi 公开表态新版 Siri 不会学 OpenAI/谷歌聊天机器人那种奉承用户的风格——这个立场有话题性——但正文零干货:没有功能、没有时间表、没有技术细节。命中 H 和 R,完全缺失 K。重要性上限 55,因为理念表态有价值但信息密度太低,不适合作为行业关键信号推送。
一句话点评
苹果软件主管说新版Siri不会像OpenAI和谷歌的聊天机器人那样靠夸你“太棒了”来拉长对话,而是学会该闭嘴时就闭嘴。目前只有设计理念,没披露具体功能或发布时间。这点先别太激动,理念和落地之间差着好几个iOS版本。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
06:42
1d ago
r/LocalLLaMA· rssEN06:42 · 06·12
为什么主流游戏还没把大模型塞进NPC里?
技术演示已经不少了,但没有一款正式发售的游戏真的把大模型用在了NPC对话上。发帖人问:到底是延迟太高搞不定,还是游戏公司压根没兴趣?帖子没点明具体瓶颈在哪,也没提哪个工作室正在试。
精选理由
问题有共鸣,但帖子没给出任何新信息——没有延迟数据、没有点名在试的工作室、没有分析瓶颈在哪。纯讨论帖,适合社区闲聊,不适合当新闻推。
一句话点评
短评:技术演示多但没游戏真用上,延迟和成本是明面上的坎,但更可能是游戏公司没找到非用不可的玩法。 点评:Reddit 帖子问为什么主流游戏还没把大模型塞进 NPC 对话里。技术演示不少,但正式发售的游戏一个都没有。发帖人没点明具体瓶颈,只说要么延迟太高搞不定,要么工作室压根没兴趣。正文被屏蔽了,信息缺口很大——没提哪个工作室在试、延迟具体多少、成本多高。如果是延迟问题,本地跑小模型(比如 ...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
06:12
1d ago
Product Hunt · AI· rssEN06:12 · 06·12
Qursor:点一下网页元素,把结构信息直接喂给 AI
Qursor 是一个 Chrome 插件,让你点一下网页上的任意 UI 元素,就能把它的选择器、样式、字体、颜色等结构化信息复制到剪贴板,然后粘贴给 AI 用。作者 Omkar Birje 说自己之前跟 AI 描述“那个蓝色按钮”经常说半天,AI 还改错元素,浪费 token,干脆做了这个工具。免费版每天 3 次,终身买断 39 美元。正文没披露它具体...
#Qursor#Omkar Birje
精选理由
一个 Chrome 插件,解决“跟 AI 描述 UI 元素”的痛点,角度新颖。但信息太薄——没提支持哪些 AI 平台、选择器准确度、动态元素怎么处理。免费版每天 3 次,终身买断 39 美元。对前端开发者有吸引力,但非 AI 用户不关心。打分 55:有趣但验证不足。
一句话点评
一个Chrome插件,点一下网页元素就能把它的选择器、样式、颜色等结构化信息复制给AI用,省去描述“那个蓝色按钮”的麻烦。免费版每天3次,终身买断39美元。痛点真实,但正文没披露它支持哪些AI平台,也没说能不能用于Figma这类设计工具,实用性得自己试。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R0
06:02
1d ago
r/LocalLLaMA· rssEN06:02 · 06·12
上下文压缩做到 16 倍,声称精度不降、还比 KV 缓存强
VentureBeat 一篇文章说,有新研究能把大模型输入压缩到原来的 1/16,精度没掉,效果还比标准的 KV 缓存好。但原帖只贴了个标题和链接,正文没披露用了什么方法、什么模型、跑分基准,也没提延迟数据。我会先打个折,等论文放出来再看具体怎么做的。
#VentureBeat
精选理由
标题的 16 倍压缩比 KV 缓存强,是个让人想点进去的数字。但原帖就一个标题加链接,方法、模型、基准、延迟全没写,等于空有一个数字。按零信源规则先给 55 分,等论文放出来有具体数据再看要不要调。
一句话点评
新研究号称能把大模型输入压缩16倍,精度不降反超标准KV缓存。但原帖只有标题和链接,没披露方法、模型、跑分基准,延迟数据也缺。如果是真的挺省钱,但信息缺口太大,等论文出来再判断。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R0
05:59
1d ago
持续报道 · 1dHacker News 首页· rssEN05:59 · 06·12
Arch Linux AUR 软件包遭恶意软件入侵,包含信息窃取器和内核级后门
Arch Linux 的 AUR(用户维护的软件仓库)有 400 个包被植入了恶意代码。攻击者要么篡改了上游源码,要么黑了维护者账号。恶意软件先偷浏览器密码和 SSH 密钥,再装一个内核级别的 rootkit 后门。正文没披露感染窗口有多长、有多少用户中招,但建议立刻检查系统并重装可疑包。400 个包这个量级说明攻击面不小,但具体影响范围还不清楚。
#Arch Linux#AUR
精选理由
硬排除规则第4条:传统安全事件,没有 AI 交叉或 agent/产品影响。400 个 AUR 包被投毒是安全新闻,不是 AI 行业新闻。评分上限 39,层级 excluded。
一句话点评
Arch Linux AUR 有 400 多个包被投毒,塞了信息窃取器和内核级 rootkit。攻击者可能是通过维护者账号或 CI 管道下手的,影响面不小,但官方说已经控制住,清理了 1500+ 包。正文没披露具体入侵路径和恶意代码细节,这点先别太激动,等更多技术分析出来再评估实际风险。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H0·K0·R0
04:42
1d ago
Hacker News 首页· rssEN04:42 · 06·12
AI Agent 扫描 DN42 网络,流量费把运营者搞破产了
一个 AI Agent 在扫描 DN42 网络时产生了巨额流量费,直接让运营者破产。文章没透露具体账单金额,但“破产”这个词说明成本失控到了什么程度。DN42 是一个去中心化的实验网络,类似一个大型 BGP 游乐场。给所有搭 agent workflow 的人提个醒:在让模型撒欢之前,先设好预算上限和流量限制,否则账单会跑得比产出快。
#DN42
精选理由
一个 AI Agent 在扫描 DN42 实验网络时跑出了失控的带宽费用,直接让运营者破产。故事有悬念(H)和警示价值(K),但 DN42 这个 niche 场景限制了共鸣(R 缺失)。正文没披露具体账单金额——这是个信息缺口,但“破产”一词已经说明成本失控到了什么程度。给所有搭 agent workflow 的人提个醒:在让模型撒欢之前,先设好预算上限和流量限制,否则账单会跑得比产出快。
一句话点评
一个AI agent在扫描DN42实验网络时,24小时内跑出6531美元AWS流量费,直接让运营者破产。DN42是个去中心化BGP测试网,agent用大量EC2实例全速扫IPv6段,出站流量按AWS标准收费,成本瞬间失控。正文没披露agent具体任务目标,但账单数字说明一切:让模型撒欢前不设预算上限和流量限制,账单会跑得比产出快。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R0
04:35
1d ago
Product Hunt · AI· rssEN04:35 · 06·12
Basedash 在 Slack 里塞了个 AI 数据分析师,@它就能查数据并返回图表
Basedash 把 AI 数据分析师直接放进了 Slack,产品已上架 Slack Marketplace。你在任意频道 @Basedash,它就会去连好的数据源查数据,然后在对话线程里回复文字答案和一张内嵌图表。它还支持定时推送报表、自动异常告警,以及根据提问人身份做行级权限控制。团队内部用它每天早上 9 点往 #metrics 频道推一份营收日报...
#Basedash#Slack
精选理由
Basedash 把 AI 数据分析师塞进 Slack,功能挺全:在频道里 @它就能查数据、回文字加图表,还支持定时推送日报和异常告警,甚至按提问人身份做行级权限控制。对数据团队来说,省了切工具查数据的麻烦。但这就是一个 Product Hunt 级别的产品发布,不是模型或平台更新,没有技术突破或行业争议。所以只拿 K 分,55 分,全量推送。
一句话点评
Basedash 把 AI 数据分析师塞进 Slack,@它就能查数据、回答案、带图表,还支持定时推送和异常告警。亮点是行级权限——谁问只能看谁的数据,这对团队协作很实用。但正文没披露支持哪些数据源、定价和延迟,如果是真的挺省钱,但先别太激动,等实测。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
04:30
1d ago
TechCrunch AI· rssEN04:30 · 06·12
Avataar 视频模型每秒 0.5 美分,专攻印度市场
Avataar AI 发布了一个蒸馏后的视频生成模型,价格低到每秒 0.005 美元,一分钟大约 0.3 美元,远低于主流视频模型。目标很明确:在印度做到便宜、快、且文化上贴地气。正文没披露模型规格、训练数据或最长时长,但价格数字本身已经说明它走的是低成本路线。
#Avataar AI
精选理由
价格数字有新闻价值,但正文信息缺口太多——没提模型规格、训练数据或最长时长。很难判断这是真突破还是廉价噱头。Avataar 对读者来说不是熟悉的名字。保留在'all'层级,作为价格信号观察,不单独推送。
一句话点评
Avataar 把视频生成价格打到每秒 0.005 美元,一分钟才 0.3 美元,比主流模型便宜一个数量级。走蒸馏路线,目标明确:在印度做到便宜、快、文化贴地。但正文没披露模型规格、训练数据或最长时长,低成本是否牺牲了画质或时长,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
03:40
1d ago
AI HOT 精选· aihot-apiZH03:40 · 06·12
小互开源公众号自动排版工具:一句话搞定排版、封面和发稿
小互(@xiaohu)开源了一个公众号排版技能组合,核心卖点是:在 Claude Code、Codex 或 OpenClaw 里给一个链接或文件路径,它就能自动排版、从 20 种主题色里选配色、生成封面图,然后一键发到公众号草稿箱。支持非 Markdown 文件,还有可视化预览。全程不用手动操作。正文没披露是否支持自定义 CSS 或图片库,这点先别太激...
#小互#Claude Code#Codex
精选理由
一个实用的开源工具,流程具体,但使用场景(公众号文章排版)对 AI 从业者来说比较小众。正文没披露是否支持自定义 CSS 或图片库。H 和 K 命中,R 未命中——归入 all 层级。
一句话点评
小互开源了一个公众号排版工具,在 Claude Code 里给个链接就能自动排版、选配色、生成封面并一键发到草稿箱,全程不用手动操作。支持非 Markdown 文件和可视化预览。但正文没披露是否支持自定义 CSS 或图片库,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
03:34
1d ago
Product Hunt · AI· rssEN03:34 · 06·12
Bob's CLI:完全本地跑的 AI 编程命令行工具,零 API 费用
Bob's CLI 是一个完全运行在你本地硬件上的 AI 编程命令行工具,不产生任何 API 费用,数据也不离开你的机器。它能自动检测本地 AI 模型,通过所谓的“行为 DNA”分析你的工作习惯,并提供自主代码审查、对话分支和远程执行(SovereignLink)功能。所有代码改动都需要你明确批准。免费起步。正文没有披露支持哪些模型、性能基准或具体的隐...
#Code#Bob's CLI#Bob's Workshop#Ollama
精选理由
一个主打零API费用和数据本地的AI编程CLI,在Product Hunt上发布。但正文很空:没列支持哪些模型、没跑分、没具体功能细节。HKR全不中——低价值的产品发布,面向所有人。
一句话点评
一个完全跑在本地的 AI 编程命令行工具,零 API 费用,数据不出机器。亮点是自动检测本地模型(比如 Ollama)和“行为 DNA”分析你的工作习惯来调整回答。支持自主代码审查、对话分支和远程执行。所有代码改动需你批准。免费起步。但正文没披露支持哪些模型、性能基准或隐私审计细节,实际效果和安全性存疑。如果是真的,对隐私敏感和想省 API 费的开发者挺省钱。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
02:54
1d ago
r/LocalLLaMA· rssEN02:54 · 06·12
Qwen 3.6 27B 能打赢 Gemini 2.5 Pro?有用户说编码和智能体任务上更强
Reddit 用户发帖问:目前最强的百亿参数以下模型 Qwen 3.6 27B,能不能打赢一年前的旗舰 Gemini 2.5 Pro 和 Sonnet 3.7?他个人测试发现,在深度网页搜索、编码和智能体任务(比如去某个网站点按钮、截图)上,27B 表现更好。帖子没披露具体跑分或样本量,纯属个人体验。如果打不赢,他问哪个最小参数模型能稳赢 Gemini...
#Code#Qwen#Gemini#Sonnet
精选理由
Reddit用户发帖说Qwen 3.6 27B在深度网页搜索、编码和智能体任务上比Gemini 2.5 Pro和Sonnet 3.7强。话题有热度,以小博大的角度能吸引人,但帖子没给跑分、样本量或测试方法,纯属个人体验。H和R成立,K不成立。
一句话点评
Reddit 用户说 Qwen 3.6 27B 在深度搜索、编码和智能体任务上比 Gemini 2.5 Pro 和 Sonnet 3.7 强。但这是个人测试,没披露跑分和样本量,得打折。如果真能打,意味着小模型在特定场景下可能替代旗舰,但验证太弱。正文没披露具体测试任务和对比方法。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
02:46
1d ago
AI HOT 精选· aihot-apiZH02:46 · 06·12
qiaomu-ai-prd:一个让AI自己看懂需求的Prompt
推文说人类和AI对PRD的理解不一样,所以专门写了个Prompt(叫qiaomu-ai-prd),让开发者先生成文档,再丢给AI写代码,声称能提升功能完整度。安装命令是`npx skills add joeseesun/qiaomu-ai-prd`,Prompt和仓库链接在评论区。正文没披露测试结果或支持哪些模型,效果得自己试。
#Code
精选理由
这是一条工具分享推文,提供了一个生成PRD的Prompt,但正文没有披露测试结果、支持哪些模型或效果对比——信息密度低。三条HKR轴都不满足,属于低价值内容,分到all层级。
一句话点评
一个专门给AI看的PRD生成Prompt,先写文档再让AI写代码。思路挺实用——人和AI对需求的理解确实不一样。但正文没披露测试结果、支持哪些模型,效果得自己试。安装命令一行搞定,门槛低,适合想优化AI编码质量的开发者试试。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R0
02:06
1d ago
AI HOT 精选· aihot-apiZH02:06 · 06·12
iOS 27 健康 App 大改:卡片布局、相机扫食物看营养评级、围绝经期追踪
苹果在 iOS 27 里把健康 App 的列表改成了卡片布局,加了导航栏,翻起来更直观。新功能是视觉智能营养识别:用相机(通过 Siri 模式)拍食物,能显示加工程度、蛋白质、含糖量和营养价值评级,但不给精确卡路里——这点先别太激动,想算热量还得自己估。需要 iPhone 15 Pro 及以上才能用。经期追踪新增围绝经期支持,能分析长期周期不规律的模式...
#Apple#iOS 27#Health App
精选理由
苹果健康 App 改版在消费者端算大新闻,但 AI 角度比较薄:视觉营养识别是已有相机能力的场景扩展,不是新模型或训练方法;围绝经期追踪是功能更新,不涉及 AI 算法突破。正文没披露识别准确率、延迟、是否端侧运行等关键信息,也没说明围绝经期模式分析用了什么模型或数据。整体更像产品功能迭代,不是 AI 技术进展,所以重要性偏低,适合全量推送但 AI 从业者不会特别关注。
一句话点评
苹果健康App改卡片布局,新增拍食物看营养评级(不标卡路里),需iPhone 15 Pro以上。围绝经期追踪靠分析周期异常模式。GymKit现在iPhone直连健身设备,不用手表。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R0
02:02
1d ago
r/LocalLLaMA· rssEN02:02 · 06·12
Qwen3.6-27B Q4_K_S 在总统生日测试上拿了满分,算术 95.5%,注意力 93%
一个开发者在 Reddit 上发了自己跑的量产模型精度对比测试,覆盖算术(1000 道大数加法)、美国总统生日(46 题)和注意力(100 道找重复词)三类任务。结果最亮眼的是 Qwen3.6-27B Q4_K_S,总统题全对,算术 95.5%,注意力 93%,接近完美。同系列的 35B-A3B MoE 变体总统题也满分,但注意力只有 71%,说明 M...
#Benchmarking#Gemma#Qwen#Unsloth
精选理由
社区用户自己跑的量化模型精度对比,有具体数字和模型间比较,对选量化版本有参考价值。但测试场景是人为构造的,非标准化,且来源是个人帖子而非机构发布,权威性不足。落在 60-71 分区间。
一句话点评
Qwen3.6-27B Q4_K_S在总统生日题上全对,算术95.5%,注意力93%,接近完美。Gemma 31B Q4_K_S三项都超83%,但2B和4B在算术和注意力上几乎挂科。测试覆盖1000道大数加法、46道总统生日、100道找重复词,温度0且关闭思考。正文没披露硬件和推理速度,这点先别太激动——如果是真的,Q4量化就能接近满血,挺省钱。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
01:48
1d ago
TechCrunch AI· rssEN01:48 · 06·12
Theker 融了 8500 万美元,做一种不挑活的工厂机器人
Theker 刚拿了 8500 万美元,要做一种能重新配置的工厂机器人。跟波士顿动力那种固定外形的人形机器人不同,Theker 的机器可以换模块来干不同产线活。文章没具体说怎么换、哪些模块能换,但思路是一台机器干多个岗位,降低部署成本。
#Theker#Boston Dynamics#Funding
精选理由
Theker 拿了8500万美元做可重构工厂机器人,跟波士顿动力的固定人形机器人思路不同。但文章信息量太少:没讲怎么换模块、哪些模块能换、成本能降多少。只有融资数字是实的。标题有钩子,但内容撑不住。
一句话点评
Theker 拿了 8500 万美元做可换模块的工厂机器人,一台机器干多个产线活,降低部署成本。思路像给机器人换“工具头”,但正文没披露怎么换、换哪些模块、换一次多久。如果是真的,比波士顿动力那种固定人形更灵活,但模块化通常意味着结构复杂、可靠性打折。8500 万够烧一阵,但离量产还远。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R0
01:37
1d ago
纽约时报中文网· rssZH01:37 · 06·12
人形机器人离不开中国零部件,但效率只有人的30%
中国主导了人形机器人供应链,宇树等公司量产机器人售价不到5000美元,美银分析师称几乎不可能不用中国零件造机器人。但当前机器人效率仅相当于人类工人的30%,复杂决策问题未解决,多数机器人仍流向实验室而非工厂。
#Unitree#UBTECH#Tesla#Funding
精选理由
纽约时报这篇讲的是中国在人形机器人供应链上的主导地位,有具体数字(宇树<5000美元、效率30%),但核心论点是产业结构,不是AI能力突破。对关注机器人落地的从业者有价值,但缺乏紧迫感。正文没披露复杂决策问题的具体瓶颈,也没说实验室到工厂的转化率,信息缺口明显。
一句话点评
中国靠电动车供应链把机器人成本打到5000美元以下,宇树等公司已量产,美银分析师说不用中国零件几乎造不出人形机器人。但效率只有人类工人的30%,复杂决策没解决,多数机器人还在实验室。投资热但落地冷,正文没披露具体部署数量。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R0
01:09
1d ago
r/LocalLLaMA· rssEN01:09 · 06·12
本地跑两天模型省了151美元,账算得挺清楚
一个开发者用本地模型跑了49次编码会话,两天烧了5000万token。按Claude Sonnet的API价格算,这些token要花151美元。输入token特别多,因为他把几个大项目代码直接喂给了模型。他算了一笔账:输入token每百万3美元,输出每百万15美元,结果输入占了147美元,输出只占4美元。他的意思是,很多人说本地跑模型不划算,但没真算过...
#Claude Sonnet
精选理由
一个开发者用本地模型跑了49次编码会话,两天烧了5000万token,按Claude Sonnet的API价格算省了151美元。他算得很细:输入token占大头,因为把几个大项目代码直接喂给了模型。数字具体、算账透明,对本地模型爱好者有参考价值。但这是个人经验,不是产品发布或研究突破,受众偏窄。
一句话点评
一个开发者用本地模型跑了49次编码会话,两天烧了5000万token,按Claude Sonnet API价格算省了151美元。输入token占了147美元,因为他把整个项目代码喂进去。这账算得挺实在,但得注意:他用的本地模型性能可能不如Sonnet,而且电费、硬件折旧没算。正文没披露具体模型和硬件配置,这点先别太激动。如果是高频编码场景,本地跑确实能省,但前提是你有块好显卡。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K1·R0
01:04
1d ago
持续报道 · 1d● P1TechCrunch AI· rssEN01:04 · 06·12
贝索斯支持的Prometheus融资120亿美元估值410亿
Prometheus 刚融了 120 亿美元,投后估值 410 亿。这家公司想做一个能自动干重型工程和药物设计的实体 AI,相当于给物理世界配个通用工程师。不过正文只说了融资金额和估值,没提技术路线、团队背景,也没说钱具体怎么花。估值很高,但信息太少,先别急着下判断。
#Robotics#Jeff Bezos#Prometheus
精选理由
120 亿融资、410 亿估值,贝佐斯站台,这种体量的实体 AI 融资很少见,值得放出来。但文章太薄,技术方案、团队、资金用途一概没写,K 拿不到,分数就停在 78。
一句话点评
贝索斯投的 Prometheus 拿了 120 亿美元,估值冲到 410 亿,要做“人工通用工程师”去干物理世界的活。正文没披露具体产品、客户或收入数据,先当个巨额赌注看。
锐评
这条消息最值得关注的是金额和方向。120 亿美元融资、410 亿估值,在 AI 赛道里也是顶格的数字,说明资本在押注一个比聊天机器人更“硬”的方向:让 AI 直接操作物理世界,也就是他们说的“人工通用工程师”。这跟现在多数公司做软件或内容生成完全不同,更像是要造能进工厂、工地干活的机器人或控制系统。 但信息缺口很大。正文只给了融资额和定位,没提技术路线、团队背景、有没有原型机或落地案例。没有这些,就没法判断这 120 亿是投给一个已经跑通的模型,还是一个刚画好的蓝图。贝索斯的背书能拉高信任度,但物理世界的 AI 比纯软件难得多,安全、成本、可靠性都是硬骨头。 我会先打个折:这更像是一张巨额支票开给了一个野心极大的方向,至于能不能兑现,得等他们拿出能动的、能干活的东西再说。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K0·R1
00:46
1d ago
AI HOT 精选· aihot-apiZH00:46 · 06·12
邵猛开源了一套“写规格→实现→验证”的 AI 编程工作流,三个 Skill 就能跑通
邵猛分享了一套 Spec 驱动开发(SDD)方法,核心是三个可复用的 Skill:写产品规格、写技术规格、验证改动是否匹配规格。规格分两层——PRODUCT.md 放用户故事和不变量,TECH.md 放架构和实现策略,都放在 specs// 目录下随 PR 提交。流程五步:先写产品规格,再写技术规格,然后让 Agent 按规格实现,接着做一致性校验,最...
#邵猛#Warp#warpdotdev/common-skills#Open source
精选理由
一篇实用的 Agent 编码工作流分享。K 轴有干货(三个 Skill + 五步流程 + 文件约定),但 H 和 R 偏弱——属于工具类内容,不是新闻。重要性落在 60-71 区间,适合放在“全部”层级供感兴趣的读者看,不适合推荐位。
一句话点评
邵猛把写规格、写技术文档、验证一致性做成三个可复用的 Skill,开源在 warpdotdev/common-skills,装一下就能用。流程五步:先写产品规格(PRODUCT.md),再写技术规格(TECH.md),Agent 按规格实现,然后做一致性校验,最后端到端验证。好处是规格随 PR 提交,闭环清晰。但正文没披露三个 Skill 怎么被调用、是否支持自定义模板,落地细节不够。如果是...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
00:42
1d ago
Hacker News 首页· rssEN00:42 · 06·12
去掉录音里的“嗯”“啊”比想象中难,有人写了个本地命令行工具
作者发现去掉语音里的“嗯”“啊”这类填充词其实挺麻烦,于是自己写了一个完全在本地运行的 CLI 工具。它先用 Whisper 做语音转文字,然后把填充词对应的音频段静音。全程离线,不传数据出去。正文没披露具体延迟和用了哪个版本的 Whisper,但点出了本地处理的隐私和准确度之间的取舍。
#Whisper
精选理由
一个完全离线的CLI工具,用Whisper检测并静音语音中的填充词。工程实现写得扎实,但没发布新模型或新能力,受众也偏窄。H和K成立,R不成立——适合all tier。
一句话点评
有人写了个本地 CLI 工具,用 Whisper 去掉录音里的“嗯”“啊”。难点不在识别,而在切完不产生爆音和背景噪声断层。作者用了三个音频后处理技巧:找 Whisper 漏掉的填充词、把粘在单词上的填充词拆开、切点对齐到波形零点避免咔嗒声。默认用 medium.en 模型,推荐 large-v3。全程离线,隐私好。正文没披露处理一段 10 分钟音频要多久,也没说内存占用。如果延迟能接受,对...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R0
00:24
1d ago
r/LocalLLaMA· rssEN00:24 · 06·12
16GB显存跑Qwen 3.6 35B MoE:选全进显存的Q3还是溢出3-4GB的Q4?
一位用户在16GB显存+32GB内存的Linux机器上跑Ollama+Aider做编程辅助,纠结Qwen 3.6 35B MoE该用IQ3_M(刚好塞进显存)还是IQ4_NL(约20GB,溢出3-4GB到系统内存)。他问Q4能不能明显减少代码语法错误或agent死循环,还是全显存的Q3速度更香。另外也在考虑换成Qwen 3.6 27B Dense。帖子...
#Code#Qwen#Ollama#Aider
精选理由
一篇本地模型量化求助帖,有具体硬件参数和量化对比,对本地部署爱好者有信息量。但受众极其狭窄,没有行业影响或传播潜力——就是社区问答水平。重要性落在低价值区间。
一句话点评
一个用户在16GB显存上纠结Qwen 3.6 35B MoE该用IQ3_M(刚好塞进显存)还是IQ4_NL(溢出3-4GB到内存),问Q4能否减少代码语法错误或agent死循环。帖子没给任何基准测试或推荐,纯属个人纠结。关键点:IQ3_M全显存速度更快但精度更低,IQ4_NL精度高但溢出内存会拖慢速度。如果是真的,选哪个取决于你更怕语法错误还是更怕延迟。缺实测数据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
00:11
1d ago
AI HOT 精选· aihot-apiZH00:11 · 06·12
OpenAI Codex 推出速率重置攒存功能
OpenAI 听到了用户吐槽:速率限制重置不能攒着用,想用的时候又没额度。现在 Codex 改了,没用掉的重置次数可以存起来以后再用。先从 Go、Plus、Pro 和 Business 用户开始,每人送一次免费重置。正文没披露后续要不要收费、能存多少次、有没有过期时间。
#OpenAI#Codex#Product update
精选理由
Codex 速率重置攒存是个实在的产品改进,但改动小,而且正文没披露三个关键信息:后续要不要收费、能存多少次、有没有过期时间。H 和 K 达标,R 偏弱——对不用 Codex 的人没影响。评分 62,面向所有用户,够用。
一句话点评
OpenAI 给 Codex 加了速率重置攒存功能,没用掉的次数可以存着以后用。先从 Go、Plus、Pro 和 Business 用户开始,每人送一次免费重置。正文没披露后续要不要收费、能存多少次、有没有过期时间。如果是真的挺省钱,但这点先别太激动——一次免费重置对重度用户只是杯水车薪,而且攒存上限和过期规则都没说,可能只是安抚性小更新。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
00:01
1d ago
r/LocalLLaMA· rssEN00:01 · 06·12
llama.cpp 调个线程数,推理速度直接翻倍
Reddit 用户实测发现,在 Intel 250K Plus(6 大核 + 12 小核)上跑 Gemma 4 26B,把 --threads 从 6 改成 16,推理速度从 49 tok/s 飙到 89 tok/s,提升 80%。以前大家都说只用大核(P-core),但 Arrow Lake 架构下这个经验不灵了。18 线程反而掉速,作者没找到原因。...
#Inference-opt#Benchmarking#llama.cpp#Intel
精选理由
一个很实用的本地推理调优技巧,数字扎实、步骤可复现,但受众窄——只有 Intel Arrow Lake 用户能抄作业。H 和 K 都命中,R 缺失,落在 60-71 区间,取低端 55。
一句话点评
旧经验失效了。Reddit 用户实测,Intel 250K Plus(6大核+12小核)跑 Gemma 4 26B,把 --threads 从6调到16,推理速度从49 tok/s飙到89 tok/s,提升80%。以前都说只用大核,但Arrow Lake架构下这招不灵了。18线程反而掉速,作者没找到原因。注意:只测了一颗CPU,其他平台未必适用。建议自己跑一遍benchmark,别盲信旧参数。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R0

更多

频道

后台