ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-05-06 · 星期三2026年5月6日
15:27
39d ago
TechCrunch AI· rssEN15:27 · 05·06
Tinder 母公司 Match Group 放缓招聘,因为 AI 工具太烧钱
Match Group 说今年剩下时间要放慢招人,因为 AI 工具“花了很多钱”。正文没披露具体用了哪些 AI 工具、花了多少钱、也没说裁员。关键信号是:AI 的运营成本开始直接跟人头预算抢资源。
#Tools#Match Group#Tinder#Commentary
精选理由
HKR三项都过,但事实止于Match Group因AI工具成本高而放缓招聘;预算规模、供应商、是否裁员都没披露。这是一个有用的成本信号,不是模型或产品层面的故事。
一句话点评
AI 工具太烧钱,Tinder 母公司 Match Group 宣布放缓招聘。
锐评
Match Group 说今年剩下时间要放慢招人,因为 AI 工具“花了很多钱”。正文没披露具体用了哪些 AI 工具、花了多少钱、也没说裁员。关键信号是:AI 的运营成本开始直接跟人头预算抢资源。 这跟之前“AI 能降本增效”的叙事不太一样——至少短期看,AI 的投入是实打实的成本项,而且可能比招人还贵。对于做 AI 应用的公司来说,这是个值得关注的信号:如果连 Match 这种成熟平台都觉得 AI 贵,那创业公司更得算清楚账。 缺的信息不少:到底哪些 AI 功能在烧钱?是推荐模型、聊天机器人还是审核系统?成本大头是算力还是 API 调用?这些都没说。另外,放缓招聘不等于不招,也不等于裁员,所以“AI 替代人类”的结论还下不了。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:21
39d ago
r/LocalLLaMA· rssEN15:21 · 05·06
本地模型+智能体框架已经能顶替初级IT运维了
Reddit用户Porespellar用Qwen3.6 27b搭配Hermes Agent跑了一周初级IT运维任务。他让智能体给系统打补丁、装Docker、配置5个GitHub仓库并启动服务,结果1.5小时干完,他自己估摸初级运维得花3小时。关键瓶颈不在模型能力,而是工具权限、审批流程和失败恢复——智能体遇到小问题能自己解决或请求批准,基本不用人插手。...
#Agent#Tools#Code#Qwen
精选理由
HKR 三项全过:有具体的第一人称测试,给出了模型、工具、任务和时间的细节。封顶 71 是因为这只是 Reddit 上的单次测试,没有完整日志、失败案例或可复现步骤。
一句话点评
本地模型+智能体框架已经能顶初级运维了,实测1.5小时干完3小时的活。
锐评
Reddit用户Porespellar用Qwen3.6 27b搭配Hermes Agent跑了一周初级IT运维任务。他让智能体给系统打补丁、装Docker、配置5个GitHub仓库并启动服务,结果1.5小时干完,他自己估摸初级运维得花3小时。关键瓶颈不在模型能力,而是工具权限、审批流程和失败恢复——智能体遇到小问题能自己解决或请求批准,基本不用人插手。 这个测试用的是27B参数模型,跑在DGX Spark克隆机上,算力门槛不高。但注意这是单次任务,不是长期稳定运行,正文也没披露失败率、安全审计结果或复杂场景(比如多系统联动、权限冲突)的表现。如果真能规模化,初级运维的配比可能会从1人管N台变成1人管更多台,但直接说“替代”还早。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
15:07
39d ago
r/LocalLLaMA· rssEN15:07 · 05·06
llama.cpp 跑 150K 上下文,内存从 108GB 涨到 120GB,疑似内存泄漏
Reddit 用户用 128GB Strix Halo 机器跑 Step-3.5-flash,加载 105GB 的 bartowski Q4_XS 模型,上下文开到 150K,内存占用从 108GB 一路爬到 120GB。用的是 llama.cpp 2.13.0 Vulkan 版和 LM Studio。帖子没贴日志,也没给最小复现步骤,所以没法确认是模...
#Memory#Inference-opt#llama.cpp#LM Studio
精选理由
这是一条Reddit上的单次故障报告,有具体的复现步骤(opencode --continue、多轮查询、htop监控),但正文没贴日志或最小复现代码,也没给issue链接。信息够用但验证弱,所以放在all而不是featured。
一句话点评
llama.cpp 疑似内存泄漏,跑 150K 上下文时内存从 108GB 涨到 120GB。
锐评
Reddit 用户用 128GB Strix Halo 机器跑 Step-3.5-flash,加载 105GB 的 Q4_XS 模型,上下文开到 150K,内存占用从 108GB 一路爬到 120GB。用的是 llama.cpp 2.13.0 Vulkan 版和 LM Studio。12GB 的涨幅在 150K 长上下文下不算离谱,但如果是持续增长而非稳定在高位,就可能是泄漏。帖子没贴日志,也没给最小复现步骤,所以没法确认是模型、量化格式还是推理框架的问题。如果是泄漏,跑超长上下文或服务部署时影响大;如果只是正常缓存增长,那问题不大。缺复现步骤和对比实验(比如换短上下文或换模型是否复现),目前只能标记为待验证。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
15:00
39d ago
TechCrunch AI· rssEN15:00 · 05·06
Ethos 获 a16z 2275 万美元融资,用语音注册专家网络
Ethos 从 a16z 拿了 2275 万美元,做的是专家网络——就是帮企业找行业专家咨询那种。它主打语音注册,专家不用填表,直接说话就能入驻。目前每周能上 3.5 万个专家,这个量级说明语音流程可能确实比填表快。但正文没披露估值、轮次、语音具体怎么工作,也没说定价,所以先别急着判断它是不是比 GLG、Third Bridge 那些老玩家便宜或好用。
#Audio#Ethos#a16z#Funding
精选理由
a16z 和语音注册让这条融资新闻有传播点,2275 万美元和每周 3.5 万专家注册也提供了基础数据。但正文没披露估值、轮次、语音具体怎么用、专家怎么收费,对 AI 从业者来说信息缺口太大,只能当常规融资消息处理。
一句话点评
a16z 投了 2275 万美元给专家网络平台 Ethos,主打语音注册,专家说话就能入驻。
锐评
Ethos 做的是帮企业找行业专家咨询的生意,和 GLG、Third Bridge 竞争。它拿语音注册当卖点:专家不用填表,直接说话就能入驻,目前每周能上 3.5 万个专家。这个量级说明语音流程可能确实比填表快,但正文没披露估值、轮次、语音具体怎么工作,也没说定价。所以先别急着判断它是不是比老玩家便宜或好用。a16z 领投算一个信号,但专家网络这个赛道不缺钱,缺的是差异化。如果语音注册真能大幅降低专家入驻门槛,那它可能切到更多长尾专家,但正文没给验证数据,比如入驻后专家被预约的比例、客户留存率。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K1·R0
14:05
39d ago
● P1r/LocalLLaMA· rssEN14:05 · 05·06
Qwen3.6 27B量化模型在单张RTX 5090上运行200k上下文
一位 Reddit 用户在单张 32GB 显存的 RTX 5090 上,用 vLLM 跑通了 Qwen3.6 27B 的 NVFP4 量化版,并验证了 200k 上下文长度。配置上用了 fp8_e4m3 的 KV 缓存、FlashInfer 和 3 个投机 token 的 MTP。10 次 200k 上下文跑分平均生成速度 73.6 tok/s,首 t...
#Inference-opt#Reasoning#Tools#Qwen
精选理由
我会先打个折:来源是 Reddit 用户自测,不是官方报告,但配置和日志都贴出来了,可复现性不低。真正值得盯的是显存边界——KV 缓存占了 8.3GiB,整卡吃到约 30478MiB,几乎榨干 32GB。这说明 NVFP4 量化确实把 27B 模型压进了消费级显卡,而且 200k 上下文不是摆设,十次都跑稳了。不过 TTFT 70 秒意味着首 token 要等一分多钟,实际用起来体验会打折扣。这点先别太激动,等更多卡型验证。
一句话点评
单张 RTX 5090 跑通 Qwen 3.6 27B 的 200k 上下文,80 TPS 够用,但来源是 Reddit 用户自测,没官方背书。
锐评
这条消息的核心看点很直接:一张消费级显卡(RTX 5090,48GB 显存)就能把 Qwen 3.6 这个 270 亿参数的模型跑起来,还带上了 20 万 token 的上下文窗口。这意味着处理一整本小说的长度,不需要昂贵的多卡服务器了。用户报告里提到用 FP8 精度加载模型,BF16 格式存 KV 缓存,推理速度能到每秒 80 个 token,这个速度日常聊天或做长文档摘要完全够用。 不过得先打个折。信息全部来自 Reddit 的 r/LocalLLaMA 板块,属于社区玩家的自发测试,正文甚至因为反爬机制没抓到完整内容。我们看不到具体的延迟波动、显存占用的峰值细节,也不知道这个 80 TPS 是生成第一个 token 的速度还是稳定输出速度。另外,用 FP8 量化后模型能力会损失多少,在超长上下文里会不会出现注意力衰减,这些关键指标都没披露。 如果你手头正好有这张卡,这条消息值得跟进验证。但做生产部署决策的话,还得等更严谨的基准测试,尤其是长文本召回率和推理稳定性的数据。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
13:47
39d ago
r/LocalLLaMA· rssEN13:47 · 05·06
雷击把两台外接显卡干废了,跑推理时直接崩
Reddit 用户 milpster 发帖说,附近一次雷击不光断了家里网,还把正在跑推理的两台 eGPU(外接显卡坞)同时搞崩溃了。他在机箱里贴了铜接地胶带,但雷还是从网线或电源线窜进来。帖子没交代具体是什么显卡、损坏到什么程度(是彻底烧了还是重启能用),也没说能不能复现。对自建推理集群的人来说,这是个提醒:光靠机箱接地可能挡不住雷击浪涌,最好在电源和...
#Inference-opt#Reddit#Incident
精选理由
H 和 R 通过:雷击/eGPU 崩溃有事故钩子,也触及本地推理硬件风险。K 不通过:缺型号、损坏程度和供电拓扑,属于低价值 Reddit 轶事。
一句话点评
雷击把两台跑推理的eGPU同时干废了,接地胶带没挡住。
锐评
Reddit用户milpster发帖说,附近一次雷击不光断了网,还把正在跑推理的两台外接显卡坞(eGPU)同时搞崩溃了。他在机箱里贴了铜接地胶带,但雷还是从网线或电源线窜进来。帖子没交代具体是什么显卡、损坏到什么程度(是彻底烧了还是重启能用),也没说能不能复现。对自建推理集群的人来说,这是个提醒:光靠机箱接地可能挡不住雷击浪涌,最好在电源和网线口都加浪涌保护器。正文没披露显卡型号和维修成本,这点先别太激动——可能只是驱动掉了,未必真烧硬件。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R1
13:00
39d ago
● P1The Verge · AI· rssEN13:00 · 05·06
Google AI 搜索功能更新支持引用 Reddit 帖子内容
Google 更新了 AI 搜索功能,会在摘要里直接展示来自 Reddit、社交媒体和论坛的“第一手观点”预览,把搜索词和相关的网络讨论串起来。官方说这是为了满足越来越多人在搜索时想看到真人建议的需求。不过公告没提这个功能具体什么时候、在哪些地区上线。对搜索团队来说,核心问题是 AI 摘要如何引用和排序这些用户生成内容来源。
#RAG#Tools#Google#Reddit
精选理由
我会先打个折,因为正文没写覆盖范围和上线时间,所以重要性停在 76 的产品更新档位是合理的。钩子够强——Google 把 Reddit 这种论坛内容塞进 AI 摘要,搜索的流量分配逻辑可能又要变。新事实是 perspectives 预览机制,但具体怎么触发、哪些讨论会被选中都没说。风险点很实在:UGC 来源的引用和排序机制一旦偏了,小站和原创作者会更难拿到流量。这点先别太激动,等看到实际覆盖数据再调整判断。
一句话点评
Google 的 AI 搜索摘要开始直接引用 Reddit 帖子和论坛内容了,这比只给链接更直接,但论坛里的“专家建议”质量参差不齐,别全信。
锐评
Google 这次更新,说白了就是让 AI 搜索概览在回答问题时,能像真人一样直接甩出一段 Reddit 或论坛里的帖子原文当论据。这解决了一个实际痛点:很多生活类、经验类问题,标准网页答案很空,而论坛里的真实用户分享更有用。但风险也在这,论坛内容没经过编辑审核,AI 直接引用可能把偏见、错误信息或玩笑话当成正经答案推给用户。 TechCrunch 的报道点出了这个设计选择可能带来的混乱,但正文没披露 Google 具体用什么机制来筛选和验证这些引用内容的可靠性。是只看点赞数,还是有别的算法?这点没说清楚。另外,报道也没提这种引用方式对 Reddit 等平台的流量是引流还是截流,这对内容创作者来说很关键。 我会先打个折,这个功能对找攻略、产品评价这类查询可能挺方便,但遇到需要严谨事实的问题,最好还是多点一下原始链接核实。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
12:56
39d ago
Hacker News 首页· rssEN12:56 · 05·06
Adam:一个用 C 写的嵌入式 AI Agent 库,号称 Agent 框架界的 SQLite
Adam 是一个用 C 语言写的跨平台 AI Agent 库,可以嵌入到任何应用里。它同时支持云端和本地大模型、工具调用、长期记忆、语音、会话管理、研究模式,甚至还有自我进化的循环。作者把它比作 Agent 框架界的 SQLite——小巧、可移植、开箱即用。目前 GitHub 上 8 个 Star、1 个 Issue,还没有评论。正文没披露具体支持哪些...
#Agent#Adam#SQLiteAI#Hacker News
精选理由
一个很小的 Show HN 开源项目:HKR 中只有 H 通过,K 和 R 都不满足。正文缺少 API、许可证、模型支持和运行机制等关键信息,只能归入低价值的产品更新类别。
一句话点评
一个自称Agent框架界SQLite的C语言库,功能吹得很全,但刚上线,社区反馈为零。
锐评
Adam把自己比作Agent框架里的SQLite——小巧、可嵌入、跨平台,用C语言写,支持云端和本地大模型、工具调用、长期记忆、语音、会话管理、研究模式,甚至自我进化循环。想法很性感:让开发者像嵌入数据库一样嵌入Agent能力。但正文没披露具体支持哪些模型、API接口长什么样、用什么许可证、运行时内存和CPU开销多少。GitHub上目前只有8个Star、1个Issue、0条评论,属于刚开张的状态。如果真能做到SQLite级别的轻量和稳定,那确实能解决当前Agent框架太重、依赖复杂的问题。但这点先别太激动——C语言写AI Agent库的维护成本极高,要对接不同模型API、处理工具调用的安全边界、管理长期记忆的持久化,任何一个环节做不好都容易翻车。建议观望,等它放出更多技术细节和实际跑起来的demo再评估。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
12:10
39d ago
MIT 科技评论· rssEN12:10 · 05·06
深海潜水器与军事聊天AI:本周科技简报
MIT科技评论本周简报聚焦两件事:一是Orpheus Ocean的潜水器下潜近6000米绘制海底矿物地图,成本远低于现有系统,但同样吸引深海采矿公司,环保争议随之而来;二是美军方测试对话式AI工具,可对潜在打击目标排序辅助决策,但存在AI错误、不透明及科技巨头影响力过大的隐忧。
#Agent#Tools#MIT Technology Review#Orpheus Ocean
精选理由
MIT Tech Review这篇是两条新闻的汇总,AI部分只说了军方在测能建议目标排序的对话式AI,但没披露用的什么系统、部署范围、评估结果。信息缺口明显,所以分数压在68。
一句话点评
MIT科技评论本周简报:Orpheus Ocean的潜水器下潜近6000米绘制海底矿物图,成本远低于现有系统,但同样吸引深海采矿公司,环保争议随之而来。另一条是美军测试对话式AI工具,可对潜在打击目标排序辅助决策,但存在AI错误、不透明及科技巨头影响力过大的隐忧。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
11:56
39d ago
r/LocalLLaMA· rssEN11:56 · 05·06
把注意力计算和权重拆开跑:Gemma 4 26B 能塞进两台旧电脑了
Reddit 用户分享了一个 Gemma 4 26B 的部署方案:把注意力计算(几 GB)放在本地机器,权重存在另一台廉价 Xeon 上,通过 larql 代码连接。这样一台机器不够显存跑完整模型时,可以用两台旧机器分担。但帖子没给任何速度或内存实测数据,实际延迟和吞吐量未知,想复现得自己试。
#Inference-opt#Gemma#Reddit#larql
精选理由
HKR 靠一个偏工程的思路、一个仓库和一个明确的本地推理成本痛点通过。但证据很薄:正文没披露速度、延迟、内存曲线或复现的 benchmark,所以分数压在 60–71。
一句话点评
把注意力计算和权重拆到两台旧机器上跑,思路挺省钱,但没实测数据,先别急着抄。
锐评
这个方案把 Gemma 4 26B 的注意力计算(几 GB)放在本地 GPU 机器,权重存在另一台廉价 Xeon 上,通过 larql 代码连接。好处是显存不够的旧机器也能跑大模型,两台凑一起比买新卡便宜。但帖子没给任何速度或内存实测数据,实际延迟和吞吐量未知,想复现得自己试。正文没披露网络带宽要求,如果两台机器之间走慢速网络,延迟可能高到没法用。另外,注意力计算和权重分离后,推理框架是否支持、代码稳定性如何,都是未知数。如果是真的挺省钱,但信息缺口太大,建议等社区跑出 benchmark 再决定是否投入。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
11:45
39d ago
r/LocalLLaMA· rssEN11:45 · 05·06
Qwen3.6-27B 用 MTP 投机解码,在 llama.cpp 上吞吐量翻 2.5 倍
Reddit 用户 havenoammo 放出了一个 Qwen3.6-27B 的魔改版 GGUF 模型,核心是把 3 层 Q8_0 量化的 MTP 草稿头嫁接到 Unsloth UD XL 的 GGUF 上,然后在 llama.cpp 里用一条还没合并的 PR(#22673)跑投机解码。实测吞吐量能到原来的 2.5 倍左右。关键信息:这个 MTP 支持...
#Inference-opt#Tools#Qwen#Unsloth
精选理由
HKR 三项都过:2.5 倍 MTP 吞吐是具体且相关的性能提升。给 68 分是因为来源单一(Reddit 个人帖)、依赖未合并的 llama.cpp PR,且受众偏窄(GGUF 本地推理用户)。
一句话点评
本地跑 Qwen3.6-27B 吞吐翻倍,但得自己编译 llama.cpp 的未合并 PR。
锐评
Reddit 用户 havenoammo 把 Qwen3.6-27B 的 3 层 MTP 草稿头(Q8_0 量化)嫁接到 Unsloth UD XL 的 GGUF 上,再用 llama.cpp 一条未合并的 PR(#22673)跑投机解码,实测吞吐量提升约 2.5 倍。关键点:这是本地 GGUF 首次支持 MTP,主分支还不包含。数字说明:3 层草稿头意味着每次推理先快速生成 3 个候选 token,再让主模型验证,成本低但延迟可能略增。正文没披露具体硬件和 batch size,也没对比原版 Qwen3.6-27B 的基线。如果是真的,对本地部署挺省钱,但得自己编译 PR,门槛不低。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
11:45
39d ago
The Verge · AI· rssEN11:45 · 05·06
微软 Office 和 LinkedIn 负责人现在也管 Teams 了
微软内部又一轮高管调整:负责 Office 和 LinkedIn 的 Ryan Roslansky 现在把 Teams 也收归旗下。原 Teams 负责人 Rajesh Jha 在微软干了 35 年后退休。这次调整是人事变动,正文没披露任何产品路线图或 AI 策略变化,所以暂时看不出对 Copilot 或 Teams 功能有什么直接影响。
#Microsoft#Ryan Roslansky#Rajesh Jha#Personnel
精选理由
K 通过:微软生产力业务边界变了。H 和 R 弱,因为正文没披露 Teams、Office Copilot 或 LinkedIn 的产品路线变化,所以落在 60 分左右的常规报道区间。
一句话点评
微软内部人事调整,跟产品功能无关。
锐评
微软把 Teams 划给了同时管 Office 和 LinkedIn 的 Ryan Roslansky,原负责人 Rajesh Jha 在干了 35 年后退休。这纯粹是高管换岗,正文没提任何 Copilot 或 Teams 的新功能、新策略。对 AI 从业者来说,这条消息暂时没有产品层面的信息量,不用过度解读。唯一值得留意的是:Teams 和 Office 归同一个人管,未来两个产品在 Copilot 集成上可能更容易对齐,但这点目前只是推测,正文没给证据。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
11:37
39d ago
FT · 科技· rssEN11:37 · 05·06
英国前内阁秘书:AI“输家”应获再培训补偿
英国前内阁秘书格斯·奥唐奈提议,为因AI失业的工人设立再培训基金。正文没披露资金规模、执行机构或资格规则。对从业者来说,劳动力成本会成为AI落地风险的一部分。
#Gus O’Donnell#Policy#Commentary
精选理由
H 和 R 靠“AI 输家”补偿角度和就业焦虑过关。K 不过:只提了再培训,没给资金规模、执行机构、适用条件,所以落在 60–71 区间。
一句话点评
英国前内阁秘书提议为被AI取代的工人设再培训基金,但没提钱从哪来、谁管、谁有资格。
锐评
英国前内阁秘书格斯·奥唐奈提了个听起来很合理的方案:AI让谁失业,就出钱给谁再培训。但正文没披露资金规模、执行机构或资格规则——等于只画了个饼。对AI从业者来说,这条新闻的真正信号是劳动力成本会成为AI落地风险的一部分。如果你在给客户做自动化方案,以后可能得把“裁员补偿”或“再培训预算”算进ROI里,否则政策一落地项目就卡住。另外,奥唐奈是前公务员,不是现任决策者,提案离立法还有距离。目前英国政府没有公开回应,所以这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
11:35
39d ago
r/LocalLLaMA· rssEN11:35 · 05·06
把显示器插到主板上,能省出几百MB显存跑模型
Reddit用户Th3Sim0n分享了一个小技巧:如果你的CPU有核显,把显示器接到主板视频口上,让核显负责桌面渲染,独显就能省下几百MB显存。Windows或带图形界面的Linux都适用。正文没披露具体显卡型号和实测省了多少,但几百MB对跑大模型来说,可能刚好够多塞一层或一个长上下文。
#Inference-opt#Th3Sim0n#Reddit#Commentary
精选理由
HKR全过:技巧实用,直击本地推理显存焦虑。但范围窄(仅限有核显的CPU+独显组合),且帖子没披露显卡型号和实测数据,所以分数压在60-71区间。
一句话点评
把显示器插到主板上,核显接管桌面渲染,独显能省几百MB显存。
锐评
Reddit 用户 Th3Sim0n 分享了一个零成本小技巧:如果你的 CPU 有核显,把显示器接到主板视频口,让核显负责桌面渲染,独显就能省下几百 MB 显存。Windows 或带图形界面的 Linux 都适用。 几百 MB 对跑大模型来说,可能刚好够多塞一层或一个长上下文,尤其对 8GB、12GB 显存的用户很实用。但正文没披露具体显卡型号和实测省了多少,不同驱动和桌面环境差异可能很大。如果是真的,这比调量化参数简单得多。 缺点:核显性能弱,高刷屏或 4K 多屏用户可能会觉得桌面卡顿。另外,部分主板 BIOS 默认关闭核显,需要手动开启。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
10:35
39d ago
彭博科技· rssEN10:35 · 05·06
Hut 8签下980亿美元德州AI数据中心租约,股价创五年最大涨幅
比特币矿商Hut 8签了一份至少98亿美元的德州AI数据中心租约,消息一出股价直接飙到2021年以来最大单日涨幅。租约对手方被描述为“高投资级公司”,但正文没披露具体是谁、算力规模多大、什么时候交付。98亿这个数字看着吓人,但租约通常是长期(10-15年),折到每年也就几亿美元,对超大规模数据中心来说不算离谱。不过信息缺口很明显:没说是给谁建、建多大、...
#Inference-opt#Hut 8#Partnership
精选理由
98亿美元租约+股价暴涨,信息密度够高,但客户名称、算力规模和交付时间都没披露,所以分数压在60-71区间。
一句话点评
矿商Hut 8签了至少98亿美元的德州AI数据中心租约,股价暴涨。但租约对手方、算力规模、交付时间都没披露。
锐评
Hut 8这笔租约金额98亿美元看着吓人,但租约通常10-15年,折到每年也就几亿美元,对超大规模数据中心来说不算离谱。股价涨到2021年以来最大单日涨幅,市场显然当利好炒。关键信息缺口很大:对手方只说是“高投资级公司”,没披露具体是谁;算力规模多大、什么时候交付、租约结构(是纯托管还是利润分成)都没说。矿商转型AI数据中心是趋势,但Hut 8之前没运营过超大规模AI集群,交付能力和运营经验存疑。正文被Bloomberg paywall挡住,更多细节拿不到。这点先别太激动,等具体客户和算力规模出来再判断价值。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
10:24
39d ago
Product Hunt · AI· rssEN10:24 · 05·06
ClawTick:一行命令给 AI agent 加定时任务,不用自己搭服务器
ClawTick 是一个云调度器,专门给 AI agent 用的。你不需要自己维护 cron 或拼凑 EventBridge + Lambda,一行 CLI 命令就能让 LangChain、CrewAI 或 webhook 任务定时跑。它自带监控、失败告警、自动重试和执行日志,还有一个仪表盘可以看运行状态。免费版给 10 个任务、每月 1000 次触发...
#Agent#Tools#ClawTick#Product update
精选理由
H和R通过:定时任务确实是agent开发者的痛点。K不通过:定价、调度机制、运行限制都没说,所以只能算个小产品更新,不值得上精选。
一句话点评
ClawTick 是一个专为 AI agent 设计的云调度器,让你用一行命令就能定时跑 LangChain、CrewAI 或 webhook 任务,自带监控、告警和重试,不用自己搭 cron 或拼 EventBridge + Lambda。免费版给 10 个任务、每月 1000 次触发,对个人或小团队够用。短评:省掉自己搭调度基础设施的麻烦,适合快速验证 agent 定时任务。但正文没披露...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
10:13
39d ago
The Verge · AI· rssEN10:13 · 05·06
Chrome 的 AI 功能可能吃掉你 4GB 硬盘空间
Chrome 开启某些 AI 功能(比如诈骗检测、写作辅助、自动填充和智能建议)后,会自动下载一个 4GB 的 weights.bin 文件。这个文件是 Google Gemini Nano 的模型权重,相当于在本地跑一个小型 AI 模型。4GB 对普通用户来说不小,尤其硬盘只有 128GB 或 256GB 的笔记本,可能直接占掉几个百分点的空间。正文...
#Inference-opt#Tools#Google#Chrome
精选理由
HKR 三项都过,但这不是模型发布或重大能力更新。有用的事实是 Chrome 下载了一个 4GB 的 Gemini Nano 权重文件,所以留在 all 层级。正文没披露删除机制或各平台差异,这点先别太激动,但 4GB 对本地存储来说确实不小。
一句话点评
Chrome 开 AI 功能会偷偷下载一个 4GB 的模型文件,硬盘小的电脑要小心了。
锐评
Google 在 Chrome 里集成了 Gemini Nano 本地模型,用于诈骗检测、写作辅助、自动填充和智能建议。开启这些功能后,浏览器会自动下载一个 4GB 的 weights.bin 文件。对于 128GB 或 256GB 硬盘的笔记本,这直接占掉 1.5%-3% 的空间,成本不算低。正文没披露这个文件能否删除、是否跨平台(Windows/macOS/Linux)行为一致,也没说用户能否手动关闭下载。如果用户只是偶尔用 AI 写作,4GB 的本地模型就显得有点浪费。这点先别太激动,因为实际影响取决于你的硬盘容量和是否真的需要这些 AI 功能。对于 AI 从业者来说,这倒是本地部署小模型的一个参考:模型权重 4GB,推理时还需要额外内存,对终端设备的存储压力不小。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
09:46
39d ago
量子位 · 公众号· rssZH09:46 · 05·06
讯飞智文上线 Vision Agent,一句话生成 17 页 PPT,目前只支持导出 PDF
量子位实测了讯飞智文的新功能 Vision Agent,输入一句需求就能自动生成一份 17 页的旅行攻略 PPT。流程分四步:确认意图、列大纲、润色内容、渲染设计,每步默认 30 秒倒计时,超时自动继续。Beta 版只能导出 PDF,PPTX 格式还没开放。正文没披露底层模型和 token 成本,也没说是否支持自定义模板。
#Agent#Multimodal#Tools#iFlytek
精选理由
量子位实测讯飞智文Vision Agent,1句提示出17页PPT,流程分4步,30秒默认继续,Beta版只支持PDF下载(PPTX开发中)。HKR三项都通过,但仍是垂直办公工具的Beta版,重要性落在60–71区间,不到精选线。
一句话点评
一句话生成17页PPT,但Beta版只能导出PDF,PPTX还没开放。
锐评
讯飞智文新功能Vision Agent,输入一句需求就能自动生成一份17页的旅行攻略PPT。流程分四步:确认意图、列大纲、润色内容、渲染设计,每步默认30秒倒计时,超时自动继续。这个设计挺省心,适合快速出初稿。但Beta版只能导出PDF,PPTX格式还没开放,想直接拿去用还得等。正文没披露底层模型和token成本,也没说是否支持自定义模板,所以实际效果和成本控制还不清楚。如果是免费或低价,那对做PPT头疼的人来说是个好工具;如果收费高,可能还不如自己手动做。另外,30秒倒计时虽然快,但用户可能来不及调整细节,这点先别太激动,等正式版看看。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:28
39d ago
r/LocalLLaMA· rssEN08:28 · 05·06
本地跑大模型:一张AMD 32GB卡 vs 两张16GB的NVIDIA卡,哪个更划算?
Reddit 用户在纠结本地跑模型选哪套方案:一张 AMD Radeon AI Pro R9700(32GB 显存)还是两张 RTX 5060 Ti(各 16GB,共 32GB)。双卡方案更便宜,目标是用 llama.cpp 跑 Qwen 3.6 27B 模型的高量化版本。但帖子正文被屏蔽了,没披露具体价格、跑分或搭建步骤。双卡虽然显存总量一样,但跨卡...
#Inference-opt#Tools#AMD#NVIDIA
精选理由
这是一个 Reddit 购买咨询帖,不是可复现的基准测试。HKR-H 和 HKR-R 因为本地推理场景成立,但 HKR-K 缺少价格差、推理速度和驱动条件,所以只能算低价值讨论。
一句话点评
双卡便宜但跨卡延迟高,单卡省心但贵,具体价格和跑分都没说。
锐评
Reddit 用户在纠结本地跑模型选单张 AMD Radeon AI Pro R9700(32GB 显存)还是两张 RTX 5060 Ti(各 16GB,共 32GB)。双卡方案更便宜,目标是用 llama.cpp 跑 Qwen 3.6 27B 模型的高量化版本。但帖子正文被屏蔽了,没披露具体价格、跑分或搭建步骤。双卡虽然显存总量一样,但跨卡通信延迟会拖慢推理速度,尤其大模型需要频繁交换中间数据;单卡则没有这个瓶颈,但 AMD 的 ROCm 生态在 llama.cpp 上的兼容性不如 CUDA 成熟,可能遇到驱动或算子问题。正文没披露两张 5060 Ti 的总价是否真的低于 R9700,也没给任何实测 token 数或量化精度对比。如果追求即插即用且预算够,单卡更省心;如果愿意折腾跨卡优化且预算紧张,双卡值得一试,但需要确认主板是否支持 PCIe 拆分。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H1·K0·R1
08:00
39d ago
OpenAI 博客· rssEN08:00 · 05·06
ChatGPT 怎么一边学知识一边保护隐私
OpenAI 发了一篇面向普通用户的隐私说明,核心就三件事:训练用了哪些数据、怎么去掉个人信息、用户能怎么控制。训练数据包括公开网页、合作方数据、用户对话(如果你开了“帮助改进模型”)。上个月他们发过一个叫 Privacy Filter 的工具,能在训练前自动识别并遮盖姓名、邮箱这类个人信息,官方说效果比同类工具都好,而且已经开源了。用户可以在设置里关...
#Safety#OpenAI#ChatGPT#Policy
精选理由
HKR-R 通过是因为 ChatGPT 数据使用方式对从业者确实重要,但 HKR-H 和 HKR-K 不通过:这只是一篇 OpenAI 的隐私说明文,正文没有披露任何具体机制、参数或产品变更。
一句话点评
OpenAI 发了一篇面向普通用户的隐私说明,核心就三件事:训练用了哪些数据、怎么去掉个人信息、用户能怎么控制。训练数据包括公开网页、合作方数据、用户对话(如果你开了“帮助改进模型”)。上个月他们发过一个叫 Privacy Filter 的工具,能在训练前自动识别并遮盖姓名、邮箱这类个人信息,官方说效果比同类工具都好,而且已经开源了。用户可以在设置里关闭对话用于训练。整篇是科普文,没有披露具...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
07:37
39d ago
Hacker News 首页· rssEN07:37 · 05·06
马克·库班:OpenAI 永远赚不回它投的那1万亿美元
马克·库班在视频标题里直接说,OpenAI 投的那1万亿美元永远赚不回来。帖子只有一条 YouTube 链接、4个 Hacker News 积分和1条评论,正文没披露这1万亿具体怎么构成的、投在哪些地方、以及库班为什么这么判断。信息缺口很明显:不知道他指的是训练成本、数据中心、还是估值泡沫。如果是真的,这个数字比目前任何公开的 AI 投资估算都大,但缺...
#Mark Cuban#OpenAI#Commentary
精选理由
HKR-H/R 通过:Cuban 对 OpenAI 万亿美元 ROI 的质疑有反共识价值。HKR-K 不通过:正文没披露投资构成、时间表或计算依据,HN 热度低,属于低价值信息片段。
一句话点评
库班说OpenAI投的1万亿美元永远赚不回来,但正文没说他指的是什么钱。
锐评
马克·库班在视频标题里直接放话:OpenAI 投的那1万亿美元永远赚不回来。这个数字比目前任何公开的 AI 投资估算都大——OpenAI 自己没承认过这个规模,外界估算的训练成本、数据中心和估值加总也远没到万亿。库班是知名投资人,但这条帖子只有4个 Hacker News 积分和1条评论,来源只有一条 YouTube 链接,正文没披露这1万亿具体怎么构成的、投在哪些地方、以及他为什么这么判断。信息缺口很明显:不知道他指的是训练成本、数据中心、还是估值泡沫。如果是真的,这个数字比目前任何公开的 AI 投资估算都大,但缺来源和论证,先打个折。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
07:15
39d ago
r/LocalLLaMA· rssEN07:15 · 05·06
Chrome 可能要把 4GB 的本地 AI 塞进浏览器
Reddit 用户发现 Google Chrome 搜索结果里出现了一条跟本地 AI 相关的内容,显示需要 4GB 内存。帖子正文被屏蔽了,只留下标题和一张截图描述,所以不知道这个功能叫什么名字、模型多大、什么时候上线、覆盖哪些用户。关键看点是:如果 Chrome 把端侧推理做成默认能力,那等于每个用 Chrome 的人都能在本地跑 AI,不用装任何东...
#Inference-opt#Google#Chrome#Commentary
精选理由
H 和 R 成立:Chrome 加 4GB 本地 AI 提示是平台钩子。K 不成立:功能名、上线范围、版本号和复现步骤全缺,只有一个 Reddit 来源,信息缺口太大。
一句话点评
Chrome 搜索结果里出现本地 AI 入口,要求 4GB 内存,但具体功能、模型大小、上线时间全没披露。
锐评
这条 Reddit 帖子的信息量其实很少:正文被屏蔽,只剩标题和一张截图,说 Chrome 搜索结果里出现了本地 AI 相关的内容,要求 4GB 内存。关键看点是,如果 Google 真把端侧推理塞进 Chrome 作为默认能力,那等于每个用 Chrome 的人都能在本地跑 AI,不用装任何东西——这比任何独立 App 的覆盖都广。但正文没披露这个功能叫什么、模型多大、什么时候上线、覆盖哪些用户。4GB 内存门槛不算高,但模型能力大概率受限(可能只做摘要或翻译)。如果是真的,挺省钱,但别太激动:Chrome 之前推过类似实验功能,最后没全量上线。缺的是官方确认和性能数据。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
06:59
39d ago
r/LocalLLaMA· rssEN06:59 · 05·06
Solidity 专用模型 Qwen3.6-Solidity-27B 声称在智能合约任务上超过 Opus
Reddit 用户 swingbear 发帖称 Qwen3.6-Solidity-27B 在智能合约代码生成评测 soleval 上的 pass@1 指标超过了 Opus 4.7。但帖子只贴了 Hugging Face 链接,没有披露具体任务数量、得分、评测脚本或可复现条件。正文也没说用了多少样本、什么硬件跑的、是否独立验证过。所以这个“超过”目前只能...
#Code#Fine-tuning#Benchmarking#Qwen
精选理由
HKR-H和HKR-R通过,但HKR-K不通过:pass@1的声称缺少分数、任务数量、评测脚本和复现条件。这是Reddit上的一个线索,不是可以上头条的素材。
一句话点评
一个 Reddit 帖子说 Qwen 微调版在智能合约代码生成上超过了 Opus,但没给任何可复现的细节。
锐评
Reddit 用户 swingbear 发帖称 Qwen3.6-Solidity-27B 在智能合约代码评测 soleval 上 pass@1 超过了 Opus 4.7。但帖子只贴了 Hugging Face 链接,没披露具体任务数量、得分、评测脚本或可复现条件。正文也没说用了多少样本、什么硬件跑的、是否独立验证过。所以这个“超过”目前只能当个传闻看,不能当结论。如果后续有人放出完整评测脚本和得分分布,才值得认真对待。目前信息缺口太大,建议先观望。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
06:51
39d ago
r/LocalLLaMA· rssEN06:51 · 05·06
Qwen 3.6 写 TypeScript 时会自动加行内注释
Reddit 用户发现 Qwen 3.6 在 Pi 测试框架里写 TypeScript 代码时,会自动在每行后面加注释。帖子只贴了一个 GitHub 代码链接,没透露用了什么提示词、模型参数,也没说换其他语言会不会一样。用户想把这个行为写进 AGENTS.md 里,让代码代理干活时保持这个风格。正文没披露这是模型固有行为还是测试框架导致的,也没说注释质...
#Code#Agent#Qwen#Reddit
精选理由
这是一个 Reddit 用户的单次观察,附了一个代码链接,但缺少复现设置,验证很弱。对代码代理实践有参考价值,不过属于低权重的从业者闲聊,不用过度反应。
一句话点评
Qwen 3.6 写 TypeScript 会自动加行内注释,但来源只有一条 Reddit 帖子,且正文被屏蔽,信息缺口很大。
锐评
Reddit 用户发现 Qwen 3.6 在 Pi 测试框架里写 TypeScript 代码时,每行后面自动加注释,想把这种行为写进 AGENTS.md 让代码代理保持风格。但帖子只贴了一个 GitHub 链接,正文被屏蔽,没透露用了什么提示词、模型参数,也没说换其他语言会不会一样。正文没披露这是模型固有行为还是测试框架导致的,也没说注释质量如何。如果是模型原生能力,那对代码可读性和协作挺有用;但如果是框架或提示词偶然触发的,那就不值得太激动。目前信息太少,建议等更多独立测试或官方说明再下判断。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
06:47
39d ago
TechCrunch AI· rssEN06:47 · 05·06
Peter Sarlin 的 QuTwo 天使轮估值冲到 3.8 亿美元
芬兰 AI 实验室 QuTwo 完成 2500 万欧元(约 2900 万美元)天使轮融资,估值 3.8 亿美元。创始人 Peter Sarlin 之前是 AMD 旗下 Silo AI 的 CEO,这次明确说公司定位是企业 AI,量子计算只是算力的一种,不是主业。正文没披露具体投资方和产品细节,所以估值高但验证弱。对欧洲本土 AI 和量子赛道来说,这个估...
#Peter Sarlin#QuTwo#Funding
精选理由
一条天使轮估值3.8亿美元的融资新闻,但正文几乎没给有效信息:没写融了多少钱、谁投的、产品做什么。创始人说量子只是新型计算,这句话也没展开。对从业者来说,除了知道这家公司估值高,其他都是空白,所以不放到featured。
一句话点评
天使轮估值3.8亿美元,但正文没披露具体产品和投资人,水分不小。
锐评
芬兰AI实验室QuTwo刚完成天使轮融资,估值冲到3.8亿美元,但实际只融了2500万欧元(约2900万美元)。创始人Peter Sarlin之前是AMD旗下Silo AI的CEO,这次明确说公司做企业AI,量子计算只是算力的一种,不是主业。这个估值在天使轮里算很高,但正文没披露具体投资方和产品细节,验证很弱。对欧洲本土AI和量子赛道来说,这个估值有信号意义,但信息缺口太大,建议等产品出来再认真评估。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
06:34
39d ago
TechCrunch AI· rssEN06:34 · 05·06
Marc Lore 说 AI 很快能让任何人开餐厅
Marc Lore 想把 Wonder 的机器人厨房变成 AI 驱动的“餐厅工厂”,你写个 prompt(提示词)就能生成一个虚拟餐饮品牌。正文没披露上线时间、成本、覆盖城市和厨房数量。
#Agent#Robotics#Marc Lore#Wonder
精选理由
HKR-H和HKR-R通过:提示词开餐厅是个尖锐的钩子,同时触及创业门槛和线下自动化两个痛点。HKR-K不通过:没有上线时间、成本、城市范围或厨房数量,信息缺口明显。
一句话点评
Marc Lore 想把 Wonder 的机器人厨房变成 AI 驱动的“餐厅工厂”,你写个 prompt 就能生成一个虚拟餐饮品牌。
锐评
Marc Lore 的 Wonder 想用 AI 把开餐厅变成写 prompt 的事:你输入“美式汉堡配辣薯条”,AI 自动生成菜谱、包装和营销文案,再由机器人厨房做出来。核心卖点是“零经验开店”,把餐饮品牌变成可生成的数字资产。但正文没披露上线时间、成本、覆盖城市和厨房数量,也没说 AI 生成的菜谱是否经过人工品控。目前 Wonder 已有 30 多个自有品牌和机器人厨房网络,但让外部用户用 prompt 生成品牌,意味着要解决食品安全责任归属和口味一致性——这两点文章都没提。如果真能跑通,确实能大幅降低餐饮创业门槛,但现阶段更像概念演示,离规模化还有距离。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
05:50
39d ago
● P1FT · 科技· rssEN05:50 · 05·06
中国AI初创公司DeepSeek融资估值接近450亿美元
FT 报道,DeepSeek 正在谈一轮新融资,估值接近 450 亿美元,腾讯是意向投资方之一。正文被付费墙挡住,没披露具体融资金额、条款和时间表。这个估值目前还只是谈判桌上的数字,关键要看它跟模型实际收入能不能对上——正文没给营收数据,这点先别太激动。
#DeepSeek#Tencent#Funding
精选理由
我会先打个折:450 亿美元是讨论中的估值,不是落地的钱,正文没披露融资规模、条款和时间表,所以别急着当成交价看。真正值得盯的是这个估值和 DeepSeek 模型收入能不能对上——目前没看到收入数据,信息缺口不小。腾讯想入股是个强信号,但没写具体怎么投、投多少,先当风向标看。
一句话点评
DeepSeek 首次对外融资,估值可能冲到 450 亿美元,但 FT 正文被付费墙挡住,具体条款和投资方名单都没看到。
锐评
这条消息最值得关注的点是 DeepSeek 终于开始拿外部钱了,而且一上来估值就对标 OpenAI 那个量级。450 亿美元这个数字如果坐实,说明资本对低成本训练路线是买单的——之前他们用不到 600 万美元训出 V3 模型,把大模型的价格战直接打穿了。不过现在能确认的信息很少:FT 的报道锁在付费墙后面,我们只看到标题;Reddit 上有人提到中国“大基金”在牵头谈,还有消息说他们要融 73.5 亿美元,下个月发 V4.1 更新。这些数字先别太激动,融资额、估值、发布时间都来自非官方渠道,DeepSeek 自己没公告。另外,拿了国资背景的钱之后,开源节奏和模型可用性会不会变,正文没披露,这是后面要盯住的地方。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
05:30
39d ago
Product Hunt · AI· rssEN05:30 · 05·06
ChatGPT 插件版:在 Google 表格里直接聊天改数据
这是一个 Google 表格的侧边栏插件,让你用自然语言跟表格对话、写公式、清理数据,不用手动拖拽或记函数。产品免费,但正文没披露用了哪个模型版本、权限怎么处理(比如会不会读取整张表),也没说是否支持离线或大表格的延迟表现。适合分析师和运营人员日常用,但如果是敏感数据或超大数据集,建议先小范围试一下。
#Tools#ChatGPT#Google#Product update
精选理由
HKR-K 勉强过关:文章列出了表格对话和自然语言改单元格两个功能,但没披露价格、模型版本和权限机制。这是一个信息量很低的工具小更新,不值得上推荐位。
一句话点评
Google 表格侧边栏插件,用自然语言写公式、清数据,不用记函数。免费,但正文没披露用了哪个模型版本、权限怎么处理(会不会读整张表),也没说大表格的延迟表现。适合分析师和运营日常用,敏感数据或超大数据集建议先小范围试。 短评:免费但信息不全,模型版本和权限都没说,先别往敏感表里塞。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
05:10
39d ago
r/LocalLLaMA· rssEN05:10 · 05·06
Qwen 3.6 27B 量化对比:BF16 和 Q8_0 基本正确,Q6_K 开始出错
Reddit 用户用同一个国际象棋转 SVG 的任务,测了 Qwen 3.6 27B 从 BF16 到 IQ3_XXS 的量化版本,想看看 16GB 显存该用哪个。设置是温度 0.6、top-p 0.95、top-k 20、上下文 65536。结果 BF16 和 Q8_0 基本都对,Q6_K 就开始出现棋子位置错误。正文没披露所有量化版本的完整结果,所...
#Reasoning#Code#Inference-opt#Qwen
精选理由
Reddit 用户拿一个棋局 SVG 任务测 Qwen 3.6 27B 的量化边界,BF16 和 Q8_0 基本正确,Q6_K 开始丢棋子位置。测试参数透明(temp 0.6、top-p 0.95、top-k 20、65536 上下文),但只靠一个任务下结论太单薄,正文也没披露所有量化的完整结论。对 16GB 显存用户来说,Q8_0 是安全线,Q6_K 以下要谨慎。信息缺口:没测推理速度、没对比其他模型、没验证多轮对话稳定性。
一句话点评
Qwen 3.6 27B 量化到 Q6_K 就开始出错,16GB 显存用户选 Q8_0 最稳。
锐评
Reddit 用户用一个国际象棋转 SVG 的任务测了 Qwen 3.6 27B 从 BF16 到 IQ3_XXS 的量化版本,想看看 16GB 显存该用哪个。设置是温度 0.6、top-p 0.95、top-k 20、上下文 65536。结果 BF16 和 Q8_0 基本都对,Q6_K 就开始出现棋子位置错误。 关键信息:这个测试只用了单一任务,样本太少,不能代表通用能力。正文没披露所有量化版本的完整结果,比如 IQ4_XS 和 IQ3_XXS 的表现,所以没法判断更低量化的实际损失。另外,温度 0.6 和 top-p 0.95 的设置偏随机,可能放大了低量化的错误率。 对 16GB 显存用户来说,Q8_0 是安全选择,显存占用约 16GB,性能几乎无损。如果想省显存跑更长上下文,Q6_K 可能勉强可用,但需要更多任务验证。这点先别太激动,单一任务测试不能当通用基准。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:07
39d ago
● P1机器之心 · 公众号· rssZH04:07 · 05·06
DeepSeek-TUI开源工具登顶GitHub热榜获超8700颗星
这个叫DeepSeek TUI的工具在GitHub上拿了8700多颗星,是开发者Hunter Bown(鲸鱼哥)用Rust写的,让你在本地终端里直接调用DeepSeek V4干活。它能聊天、改文件、跑shell命令、管任务。比较特别的是RLM模式:一次可以派发最多16个V4 Flash子任务,上下文窗口有100万token,操作前还有审批关卡,等于让模...
#Agent#Code#Tools#DeepSeek
精选理由
我会先打个折:这是个人项目,不是 DeepSeek 官方出品,稳定性和后续维护都还是未知数。但 8700 星的热度是实打实的,RLM 的并发和审批设计也给了具体的技术细节,不是空炒概念。对想省钱又想在终端里用 DeepSeek 干活的开发者来说,这东西值得盯一下,但暂时别把它当生产工具。
一句话点评
一个把DeepSeek模型塞进终端做编程助手的开源工具,两天从2300星冲到8700星,但别急着叫它“DeepSeek版Claude Code”,功能差距还不小。
锐评
这个叫DeepSeek-TUI的工具,说白了就是让你在命令行里直接用DeepSeek模型写代码、改bug、跑命令。它火起来的速度很快,量子位报道时还是2300星,机器之心跟进时已经8700星登顶热榜了,说明开发者对这种轻量级终端AI助手的需求确实大。 但得说清楚,它跟Claude Code不是一回事。Claude Code是Anthropic官方出的,能直接读写文件、执行shell命令、管理git,跟编辑器深度绑定。DeepSeek-TUI目前更像一个带对话界面的终端客户端,正文没披露它能不能自动改文件、能不能跑多步任务流程。如果只是把API包了一层TUI,那实用天花板就比较明显。 另外两篇报道都没提到用的DeepSeek哪个模型、API费用谁出、本地能不能跑。这些信息缺了,就没法判断它到底是省钱利器还是烧token玩具。热度先收着看,等有人测完真实开发场景再说。
HKR 分解
hook knowledge resonance
打开信源
91
SCORE
H1·K1·R1
04:01
39d ago
● P1FT · 科技· rssEN04:01 · 05·06
Samsung市值突破1万亿美元
三星市值在 AI 热潮中突破1万亿美元,主要靠存储芯片业务拉动。这波上涨还把韩国 Kospi 指数推到了历史新高。不过正文没披露具体涨幅、估值方法或日期,信息缺口明显。
#Samsung#Kospi#Commentary
精选理由
HKR三项都通过:万亿美元里程碑、存储芯片行情、Kospi创新高,市场信号明确。但正文没披露涨幅、估值口径和具体时间,信息缺口明显,所以不上精选。
一句话点评
三星靠 AI 概念市值破万亿,但股价涨了四倍多,这波更多是市场情绪在定价,别急着把它和台积电的实打实地位划等号。
锐评
三星市值摸到一万亿美元,和台积电一起进了这个俱乐部。直接原因是股价从低点翻了四倍多,市场把 AI 带来的存储芯片需求预期打得很满。但这里要打个折:市值是股价乘以股本,反映的是投资者愿意出多少钱,不等于公司已经赚到了这些钱。报道本身没披露这轮上涨里 HBM(高带宽内存)这类 AI 核心产品的具体营收占比,也没说三星在 HBM 上对英伟达等大客户的验证进度到底如何。缺了这两块数据,就很难判断现在的市值是靠短期情绪撑着,还是有订单和利润在底下托底。另外,文章只提了“加入台积电的精英俱乐部”,但台积电的万亿市值背后是先进制程的代工垄断和实打实的毛利率,三星的业务结构更杂,存储、手机、代工都有,直接用市值对标容易高估。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
04:00
39d ago
FT · 科技· rssEN04:00 · 05·06
Anthropic 真的是 AI 领域的“好人”吗?
FT 这篇评论直接质疑 Anthropic 的“好人”人设。CEO Dario Amodei 一直把公司塑造成 AI 竞赛里讲安全、有道德的那一方,但文章没给出具体模型、业务或安全机制的细节来支撑或反驳这个形象。说白了,这是一篇立场讨论,不是技术报道。如果你想知道 Anthropic 到底在安全上做了什么、没做什么,正文没披露。
#Anthropic#Dario Amodei#Financial Times#Commentary
精选理由
HKR-H 和 HKR-R 通过:FT 挑战 Anthropic 安全第一的身份,这是 Claude 社区正在讨论的活话题。HKR-K 不通过:RSS 正文只给了 Dario Amodei 的叙事框架,没有模型、商业或安全细节。
一句话点评
FT 质疑 Anthropic 的“好人”人设,但全文没提具体模型或安全机制,更像立场讨论。
锐评
FT 这篇评论直接挑战 Anthropic CEO Dario Amodei 一直塑造的“安全、有道德”形象。文章没有给出任何具体模型、业务数据或安全机制的细节来支撑或反驳这个形象,纯粹是一场立场讨论。如果你想知道 Anthropic 在安全上到底做了什么、没做什么,正文没披露。对于从业者来说,这篇的价值在于提醒:别只看公关话术,要看实际动作。但信息缺口太大,无法据此做任何判断。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
03:37
39d ago
Hacker News 首页· rssEN03:37 · 05·06
美光开始出货 245TB 数据中心 SSD,容量是亮点但接口和性能都没说
美光宣布 6600 Ion 数据中心 SSD 开始出货,容量做到 245TB,是目前行业最大的。但正文没披露接口(是 PCIe 还是 SAS?)、读写速度、价格和哪些地区能买到。对 AI 基础设施来说,大容量意味着单盘能塞更多模型或训练数据,减少换盘次数,但没性能数据就没法判断它适不适合高吞吐场景。目前只确认了容量和已发货,其他信息等后续。
#Micron#Product update
精选理由
H 和 K 通过:245TB 出货事实具体。R 不通过:正文没给 AI 负载、定价或性能数据,所以这只是一个次要的基础设施更新。
一句话点评
单盘245TB,但没性能数据,高吞吐场景先别激动。
锐评
美光6600 Ion数据中心SSD开始出货,容量做到245TB,是目前行业最大的。对AI基础设施来说,大容量意味着单盘能塞更多模型或训练数据,减少换盘次数,适合冷存储或大模型归档。但正文没披露接口(是PCIe还是SAS?)、读写速度、价格和哪些地区能买到。没性能数据就没法判断它适不适合高吞吐场景——比如训练时频繁读写,或者推理时快速加载模型。目前只确认了容量和已发货,其他信息等后续。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
03:17
39d ago
Product Hunt · AI· rssEN03:17 · 05·06
ChatGPT 开始卖广告位了
OpenAI 在 Product Hunt 上发布了一个广告管理工具,让广告主可以在 ChatGPT 里创建、管理和衡量广告效果。目前只对美国广告主开放 beta 测试,支持按点击付费(CPC)和按展示付费(CPM),还能做转化追踪和汇总报告。广告会明确标注,和 ChatGPT 的回答分开。正文没披露具体定价、定向能力、投放范围,也没说 OpenAI ...
#Tools#ChatGPT#Product Hunt#Product update
精选理由
H 和 R 靠 ChatGPT 广告这个钩子和变现焦虑过关,但 K 不过:Product Hunt 的 RSS 摘要只说了 create/manage/measure,没有官方范围、定价或机制,信息量撑不起高可信度。
一句话点评
ChatGPT 正式上线广告管理后台,美国广告主可以自助投 CPC/CPM 广告了。
锐评
OpenAI 在 Product Hunt 上低调上线了 ChatGPT 广告管理工具,目前仅限美国广告主参与 beta 测试。支持 CPC(按点击付费)和 CPM(按千次展示付费),附带转化追踪和汇总报告,广告会明确标注并与回答内容分离。这相当于给 ChatGPT 装了个“广告投放后台”,让品牌可以直接在对话界面里买量。关键信息缺口不少:正文没披露具体定价、定向能力(比如能否按用户对话意图或历史行为定向)、投放范围(是否只限美国),也没说 OpenAI 的广告收入分成或长期商业化节奏。如果是真的,这对依赖搜索广告的 Google 是个直接威胁——ChatGPT 的日活和停留时长都不低,广告主多了一个“对话式”投放渠道。但 beta 阶段样本小、验证弱,实际点击率和转化效率还没数据,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
03:15
39d ago
Hacker News 首页· rssEN03:15 · 05·06
VS Code 提交信息里“Co-authored-by: Copilot”的后续更新
VS Code 的一个 issue 更新了提交信息中“Co-authored-by: Copilot”的处理方式。目前只有 GitHub/HN 链接、27 个点赞和 11 条评论,正文没披露具体机制。
#Code#Microsoft#VS Code#Copilot
精选理由
HKR-H 和 HKR-R 通过:Copilot 出现在 commit 作者栏里,对开发者来说有话题性和点击欲。HKR-K 不通过:帖子只给了链接和评分,没交代 VS Code 改了啥、什么时候上线、有没有开关,信息缺口太大。
一句话点评
VS Code 要在提交信息里给 Copilot 署名,但具体怎么实现还没说。
锐评
这条信息来自 VS Code 的一个 GitHub issue,目前只有 27 个点赞和 11 条评论,热度不高。核心是讨论在 Git 提交信息中自动添加“Co-authored-by: Copilot”的机制,让 AI 辅助的代码提交有明确的归属记录。但 issue 正文没有披露具体实现方式——是自动追加、用户手动确认,还是只在 Copilot 生成代码时触发?这些细节都缺失。对于团队协作来说,这个功能有助于区分人类和 AI 的贡献,但如果没有清晰的触发规则,可能会让提交历史变得混乱。目前还处于早期讨论阶段,没有合并或发布的计划,开发者暂时不用太在意。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
03:10
39d ago
Hacker News 首页· rssEN03:10 · 05·06
Agent 能自己注册 Cloudflare 账号、买域名、部署应用了
Cloudflare 宣布 Agent 现在可以替用户完成全套上云流程:注册账号、开通付费订阅、买域名、拿 API Token,然后直接部署代码。整个过程不需要人进后台、复制粘贴 Token 或输信用卡号,只需要在关键步骤点一次授权。这套能力是和 Stripe 联合设计的,底层走的是 Stripe Projects 的新协议——Agent 先通过 St...
#Agent#Tools#Cloudflare#Stripe
精选理由
Cloudflare 和 Stripe 联手让 Agent 走完开户→买域名→部署的流程,标题本身够抓人。但正文没披露 Stripe Projects 的具体机制、权限边界、价格、审核流程或可复现条件,信息量只够当个产品动态看,所以给 70 分,放在全量推送里提醒大家留意但别急着下结论。
一句话点评
Agent 能自己注册 Cloudflare 账号、买域名、部署,全程只需点一次授权。
锐评
Cloudflare 和 Stripe 联合搞了个新协议,让 Agent 能替用户走完上云全流程:注册账号、开通付费、买域名、拿 API Token 然后直接部署代码。人不用进后台、复制粘贴 Token 或输信用卡号,只在关键步骤点一次授权。这对 AI 编程工具来说是个实用进展——以前 Agent 写代码容易,部署到生产环境却卡在人工注册和配置上。现在 Stripe Projects 插件加 Cloudflare 的 MCP 服务器,一条命令就能从零到上线。不过正文没披露 Stripe Projects 协议的具体机制、权限边界、定价细节,也没说审核流程和可复现条件。如果是真的,能省掉不少 DevOps 的脏活,但安全模型和成本控制还没讲清楚,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K0·R1
02:57
39d ago
彭博科技· rssEN02:57 · 05·06
Blue Owl 旗下数据中心运营商 Stack 考虑出售亚洲业务,估值 300 亿美元
彭博援引知情人士消息,Blue Owl 旗下的数据中心运营商 Stack Infrastructure 正在考虑出售其亚洲业务,整体估值约 300 亿美元。这笔交易如果落地,意味着亚洲算力供应格局可能发生重大变化——谁接手这些数据中心,谁就掌握了亚太地区一批关键算力资产。不过正文没有披露潜在买家、具体资产范围、交易时间表或结构,信息缺口不小,目前只能当...
#Blue Owl Capital#Stack Infrastructure#Bloomberg#Funding
精选理由
HKR三项都过,靠的是300亿美元出售亚洲数据中心这个具体数字。但买方、资产范围、时间表、交易结构正文都没披露,信息缺口明显。这是AI基建领域的财务新闻,不是模型或产品发布,所以分数压在60-71区间。
一句话点评
300亿美元亚洲数据中心打包出售,谁接盘谁就掌握亚太算力命脉。
锐评
彭博消息,Blue Owl旗下Stack Infrastructure正考虑出售亚洲业务,整体估值约300亿美元。这个数字说明交易规模巨大——谁接手这批数据中心,谁就掌握了亚太一批关键算力资产。对AI infra团队来说,核心问题是亚洲算力供应格局会不会因此改变。 但正文信息缺口很大:没披露潜在买家、具体资产范围、交易时间表或结构。目前只能当“正在考虑”阶段处理,离落地还有距离。建议关注后续买家身份——如果是主权基金或云厂商,可能意味着算力资产从金融资本转向战略持有。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
02:02
39d ago
r/LocalLLaMA· rssEN02:02 · 05·06
Ollama 曝严重内存泄漏漏洞,无需认证即可读取
Reddit 用户发帖称 Ollama 存在一个严重的内存泄漏漏洞,攻击者无需任何认证就能读取内存数据。帖子链接指向安全公司 Cyera 的研究,但正文被 Reddit 屏蔽,所以没披露受影响版本、复现步骤和官方是否已修复。如果你在用 Ollama 跑模型,建议先去查 Cyera 的原始报告和 Ollama 的安全公告,确认自己是否中招。
#Safety#Ollama#Cyera#Incident
精选理由
HKR-H和HKR-R成立:Ollama未认证内存泄漏对本地大模型运维者来说很紧迫。HKR-K不成立,因为正文没披露受影响版本、复现条件和补丁状态,信息不足以支撑完整判断。
一句话点评
Ollama 爆出无需认证的内存泄漏漏洞,攻击者能直接读内存数据。
锐评
Reddit 用户曝出 Ollama 存在一个严重漏洞:攻击者无需任何认证就能读取内存数据,可能泄露模型权重、对话历史甚至 API key。帖子指向安全公司 Cyera 的研究,但正文被 Reddit 屏蔽,所以没披露受影响版本、复现步骤和官方是否已修复。如果你在用 Ollama 跑模型,建议先去查 Cyera 的原始报告和 Ollama 的安全公告,确认自己是否中招。目前缺的信息很多:漏洞影响哪些版本、是否已有 PoC、官方补丁出了没。这点先别太激动,等原始报告出来再评估实际风险。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
01:56
39d ago
r/LocalLLaMA· rssEN01:56 · 05·06
Gemma 4 和 Qwen 3.6 你选哪个?
Reddit 上有人问大家拿 Gemma 4 干什么用,底下回帖说现在本地跑模型最火的两款就是 Gemma 4 和 Qwen 3.6。讨论集中在写代码、跑基准和做 agent 任务上,但正文没披露具体分数、模型大小或测试条件。真正有用的不是排名,而是什么场景下你会选 Gemma 而不是 Qwen。
#Code#Agent#Benchmarking#Gemma
精选理由
HKR-R 通过,因为本地模型选型是用户能共情的话题。HKR-H/K 不通过:帖子是常规提问,没给分数、规模或测试设置,所以保持低价值 all。
一句话点评
Reddit 用户问 Gemma 4 能干嘛,回帖说它和 Qwen 3.6 是本地跑模型最火的两款。
锐评
这条讨论的价值不在排名,而在场景选择。回帖提到写代码、跑基准和做 agent 任务,但正文被屏蔽,没披露具体分数、模型大小或测试条件。真正有用的问题是:什么场景下你会选 Gemma 而不是 Qwen?比如 Gemma 4 在低资源设备上可能更轻量,Qwen 3.6 在中文任务上更强。缺的是实测对比和用户真实用例,比如代码生成准确率或 agent 任务成功率。如果是真的,这种社区反馈比官方 benchmark 更贴近实际部署。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
01:42
39d ago
r/LocalLLaMA· rssEN01:42 · 05·06
红迪网友说一块魔改AMD卡跑72B模型能打7900XTX
红迪网友psychoOC发帖称,一块叫“Super god bin 9700 pro”的魔改AMD MI100加速卡,在Geekbench计算测试里追平甚至超过了7900XTX。这块卡用涡轮散热跑到3.3GHz,是特挑体质芯片,专门用来跑72B Q5量化模型。不过帖子没贴AI跑分,只放了通用计算benchmark,所以实际跑大模型的速度和推理延迟到底怎...
#Inference-opt#Benchmarking#Reddit#Geekbench
精选理由
7900XTX 级别的跑分加上 3,300MHz 频率和 72B Q5 配置,对本地推理用户有吸引力。但 AI 基准数字没出,来源只有一个 Reddit 帖子,验证弱,所以重要性压在中档。
一句话点评
魔改AMD MI100加速卡超频到3.3GHz,通用计算跑分追上7900XTX,但没贴AI跑分,实际推理性能存疑。
锐评
红迪网友psychoOC晒出一块叫“Super god bin 9700 pro”的魔改卡,本质是AMD MI100加速卡的特挑体质版本,用涡轮散热跑到3.3GHz。帖子只放了Geekbench通用计算跑分,声称追平甚至超过7900XTX,但没贴任何AI benchmark(比如LLM推理速度或延迟)。对于跑72B Q5量化模型的目标,通用计算跑分和实际推理性能之间差距可能很大——MI100的架构和驱动优化远不如消费级7900XTX成熟,而且涡轮散热在高负载下的持续表现也是未知数。正文没披露功耗、显存带宽、实际推理延迟等关键数据,也没说明跑分时的具体配置和散热条件。这点先别太激动,等有人放出llama.cpp实测再说。如果真能稳定跑72B模型且成本远低于7900XTX,那对本地部署玩家是个好消息,但目前证据太弱。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
01:38
39d ago
Hacker News 首页· rssEN01:38 · 05·06
Telus 用 AI 实时改客服口音,被批欺骗客户
加拿大电信商 Telus 通过旗下 Telus Digital 部门,在客服通话中实时修改海外客服的口音,以减少所谓的“口音摩擦”。技术由一家叫 Tomato.ai 的公司提供,属于语音转语音的实时转换。劳工组织批评这种做法有欺骗性,要求强制告知客户。加拿大另外两家运营商 Rogers 和 Bell 表示不会跟进。正文没披露具体用了什么模型、延迟多高、...
#Audio#Telus#Product update
精选理由
HKR-H和HKR-R通过:Telus用AI改客服口音这件事,天然带有信任和劳动争议的讨论价值。HKR-K不通过:正文只给了标题级别的信息,没有部署范围、模型或合规机制。
一句话点评
Telus 用 AI 实时改海外客服口音,被骂欺骗。
锐评
加拿大电信商 Telus 在客服通话中,用 Tomato.ai 的语音转语音技术实时修改海外客服的口音,号称减少“口音摩擦”。劳工组织批评这是欺骗,要求强制告知客户。Rogers 和 Bell 已表态不会跟进。 技术上,实时语音转换通常要串 ASR、口音转换模型和神经声码器,延迟和自然度是难点。正文没披露具体模型、延迟多高、覆盖多少坐席、有没有客户告知机制。如果是真的,成本可能不低,但效果和合规风险都存疑。 这事对做客服 AI 的团队是个警示:技术能用不代表该用,透明度和用户信任比降口音更重要。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
00:53
39d ago
彭博科技· rssEN00:53 · 05·06
CDC签下澳大利亚最大数据中心合同,母公司Infratil股价大涨
CDC Data Centres签下了澳大利亚有史以来规模最大的数据中心合同,并预测未来三年盈利将大幅增长。消息一出,其最大股东Infratil股价应声上涨。不过正文没披露客户是谁、合同金额多少、容量多大、交付时间表如何,所以这个“最大”到底有多大,目前只能先打个折看。
#Inference-opt#CDC Data Centres#Infratil#Partnership
精选理由
这是一条数据中心基建的股票消息,不是AI模型或产品更新。HKR-H靠“最大合同”标题吸引点击,但正文没披露客户、金额、容量或交付时间表,信息量不足。K分低是因为关键数字全缺。R分低是因为跟AI从业者的算力、模型、工具链没有直接关系,更像行业新闻而非技术参考。
一句话点评
CDC签下澳洲最大数据中心合同,但客户、金额、容量都没披露,先打个折看。
锐评
CDC Data Centres签了澳大利亚史上最大的数据中心合同,预测未来三年盈利大涨,大股东Infratil股价应声上涨。但正文没披露客户是谁、合同金额多少、容量多大、交付时间表如何,所以这个“最大”到底有多大,目前只能先打个折看。消息来源是RSS摘要,信息缺口明显,建议等更多细节出来再评估实际影响。
HKR 分解
hook knowledge resonance
打开信源
43
SCORE
H1·K0·R0
00:04
39d ago
r/LocalLLaMA· rssEN00:04 · 05·06
SubQ 号称 1200 万上下文,实测 128K 就撑不住了
Reddit 用户扒出 SubQ 的 12M 上下文宣传和实际产品 1M-Preview 对不上。RULER 评测只跑到 128K,MRCR v2 在 1M 长度下得分从 83 掉到 65.9,低于 Opus 4.6 的 78.3 和 GPT-5.5 的 74。技术报告发布日期没写,验证细节也不够透明。
#Inference-opt#Benchmarking#SubQ#Opus
精选理由
HKR 三项都过,但来源是 Reddit 对一家不太知名的模型厂商的批评。正文有基准分数,但技术报告发布日期和完整复现细节都没披露,所以分数压在 60–71 区间。
一句话点评
12M 上下文宣传和实际产品对不上,评测也缩水了。
锐评
Reddit 用户扒出 SubQ 的 12M 上下文宣传和实际产品 1M-Preview 对不上,技术报告日期也没写。RULER 评测只跑到 128K,MRCR v2 在 1M 长度下得分从 83 掉到 65.9,低于 Opus 4.6 的 78.3 和 GPT-5.5 的 74。这说明长上下文能力在长文本下明显衰减,验证细节也不够透明。正文没披露训练数据、评测配置和硬件成本,这些缺口让宣传可信度打折。如果是真的,1M 上下文成本可能很高,但实际效果还差一截。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:00
39d ago
Hugging Face 博客· rssEN00:00 · 05·06
开源语音识别排行榜加了防作弊机制
Hugging Face 给 Open ASR 排行榜加了一层“防刷榜”机制,名字叫 Benchmaxxer Repellant。正文没披露具体怎么防——是用数据集扰动、评分规则调整,还是检测异常提交——所以暂时没法判断效果。如果只是改个名字,那意义不大;如果是真能识别出针对榜单优化的提交,对社区公平性会有帮助。
#Audio#Benchmarking#Hugging Face#Open ASR Leaderboard
精选理由
H 和 R 通过:标题用防刷榜概念制造了传播钩子,且触及了 ASR 和模型评测从业者对榜单信任的焦虑。K 不通过:正文为空,未披露任何机制、数据集或可复现的评测条件,信息量不足以支撑判断。
一句话点评
Hugging Face 给 Open ASR 排行榜加了“防刷榜”机制,名字叫 Benchmaxxer Repellant。正文没披露具体怎么防——是用数据集扰动、评分规则调整,还是检测异常提交——所以暂时没法判断效果。如果只是改个名字,那意义不大;如果是真能识别出针对榜单优化的提交,对社区公平性会有帮助。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
2026-05-05 · 星期二2026年5月5日
23:11
39d ago
r/LocalLLaMA· rssEN23:11 · 05·05
Reddit 网友整理 13 个非聊天类本地 AI 工具,重点在语音和音频处理
一位 Reddit 用户手动整理了 13 个本地 AI 应用或模型,专门用于非聊天场景。列表包括 Applio、Open Web UI、ComfyUI、Parakeet 0.6b 和 Basic Pitch 等,覆盖语音合成、转录、音频清理和模型发现。真正有价值的信息是本地音频处理管线仍有明显缺口:批量 ASR(自动语音识别)、语音编辑和嵌入搜索前端工...
#Audio#Tools#Embedding#Reddit
精选理由
这是一份 Reddit 资源清单,不是发布或基准测试,所以分数落在 60–71 区间。HKR-K 来自 13 个具名工具,HKR-R 来自本地音频工作流的缺口。
一句话点评
本地音频工具清单,但正文被墙了,信息不全。
锐评
这篇 Reddit 帖子整理了一份本地 AI 工具清单,覆盖语音合成(Applio)、转录、音频清理和模型发现(Open Web UI、ComfyUI)等非聊天场景。但正文被 Reddit 屏蔽,实际内容只有标题和摘要。摘要提到一个关键判断:本地音频处理管线仍有明显缺口——批量 ASR、语音编辑和嵌入搜索前端工具很少。这点对做本地部署的开发者有参考价值,但清单具体有哪些工具、每个工具怎么用,正文都没披露。来源是 Reddit 个人用户,权威性一般,更像社区经验分享。如果想用,建议直接去原帖看评论区或找其他来源补全工具详情。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
22:58
39d ago
r/LocalLLaMA· rssEN22:58 · 05·05
Claude Code Opus 4.7 和本地跑的开源版 OpenCode 都做出了一个能玩的 cozy roguelite 游戏
Reddit 用户对比了 Claude Code(用 Opus 4.7)和 OpenCode(用 qwen3.6:27b,本地可跑的开源替代),两边都成功生成了一个可玩的 cozy roguelite 游戏。但原文只贴了个视频链接,没交代 prompt 怎么写、迭代了多少轮、运行环境是什么、怎么评估结果。最关键的信息缺口是:复现条件完全没给,所以没法判...
#Agent#Code#Anthropic#Qwen
精选理由
H 和 R 成立:同款游戏编码对决有话题性,也触及 Claude Code 与本地 Qwen 替代的竞争痛点。K 不成立:正文没披露提示词、轮次、环境和评测标准,目前只有标题信息,没法验证实验的可复现性。
一句话点评
一个用户用 Claude Code 和开源 OpenCode 各生成了一个可玩的 cozy roguelite 游戏,但只发了视频,没给 prompt、迭代次数和运行环境,没法复现。
锐评
这条 Reddit 帖子标题挺吸引人:Claude Code(Opus 4.7)和开源替代 OpenCode(qwen3.6:27b)都成功生成了一个可玩的 cozy roguelite 游戏。但正文只贴了个视频链接,关键信息全缺:prompt 怎么写、迭代了多少轮、运行环境是什么、怎么评估结果。最致命的是复现条件完全没给,所以没法判断两边到底差在哪。对于想参考这个对比选工具的人来说,这点先别太激动——视频能跑不代表你拿同样 prompt 也能跑通。如果后续有人补上详细日志和 prompt,这条才有实际参考价值。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
22:57
39d ago
TechCrunch AI· rssEN22:57 · 05·05
Altara 获 700 万美元,用 AI 打通物理科学实验数据孤岛
Altara 拿了 700 万美元,解决物理科学(电池、半导体、医疗设备)研发中数据散落在 Excel 和老系统里的问题。它的 AI 能自动诊断实验失败原因,加速研发。700 万不算大额融资,但说明这个细分方向有投资人买单。正文没披露投资方、估值和具体部署案例,所以产品成熟度还不好判断。
#Altara#Funding
精选理由
HKR-K 靠700万美元融资和表格/遗留系统整合角度通过。HKR-H/R 不通过:正文没写轮次、投资方、估值、部署细节或客户指标。
一句话点评
700万美元买一个帮物理科学家整理实验数据的AI,方向很实在,但钱不多,产品成熟度未知。
锐评
Altara 拿了 700 万美元,解决电池、半导体、医疗设备研发中数据散落在 Excel 和老系统里的问题。它的 AI 能自动诊断实验失败原因,加速研发。700 万不算大额融资,但说明这个细分方向有投资人买单。正文没披露投资方、估值和具体部署案例,所以产品成熟度还不好判断。如果真能把科学家从手动整理数据中解放出来,价值不小,但得先看到实际效果。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R0
22:26
39d ago
r/LocalLLaMA· rssEN22:26 · 05·05
Strix Halo 跑 MTP 投机解码,生成速度从 40 涨到 60-80 token/s
Reddit 用户 Edenar 在 AI Max 395(128GB DDR5 8000)上测试了 llama.cpp PR #22673 的 MTP 投机解码,用 Qwen3.6-35BA3B-MTP-GGUF 模型,设置 --spec-type mtp --spec-draft-n-max 3。生成速度从约 40 token/s 提升到 60-8...
#Inference-opt#llama.cpp#Qwen#Edenar
精选理由
单条Reddit实测,速度提升约50%,硬件和参数都列清楚了,但正文没披露完整提示集,吞吐受主题影响,PP基本没变。信息够用但来源单一,所以分数压在60-71区间。
一句话点评
llama.cpp 新 PR 让 Strix Halo 跑 MTP 投机解码,速度从 40 提到 60-80 token/s,但只测了单模型单场景。
锐评
Reddit 用户 Edenar 在 AI Max 395(128GB DDR5 8000)上测了 llama.cpp PR #22673 的 MTP 投机解码,用 Qwen3.6-35BA3B-MTP-GGUF,设 --spec-type mtp --spec-draft-n-max 3。生成速度从约 40 token/s 提到 60-80 token/s,提升 50%-100%,对本地推理来说挺省钱——不用换硬件就能白嫖速度。但正文没披露完整测试集,吞吐量随主题波动,PP(预处理)延迟没变。这意味着加速主要来自草稿模型投机,不是整体优化。另外只测了单模型单场景,没对比其他投机方法(如 Medusa、Eagle),也没说显存占用和精度损失。如果是生产部署,还得看长文本和并发下的表现。这点先别太激动,等更多复现和对比出来再下结论。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
21:46
39d ago
The Verge · AI· rssEN21:46 · 05·05
Google Home 升级 Gemini 3.1,能听懂更复杂的指令了
Google 把 Home 里的 Gemini 升级到了 3.1 版本,现在你可以一句话让它干好几件事,比如“关灯、把空调调到 24 度、再设个 10 分钟的计时器”。它还能处理重复事件、全天事件和改期。不过正文没披露完整修复列表,所以具体改了多少 bug、效果稳不稳,这点先别太激动。
#Agent#Tools#Google#The Verge
精选理由
中等体量的 Google Home 产品更新:H 是那个多步智能家居的日常钩子;K 有 Gemini 3.1 加上重复/全天/移动日程三个具体能力;R 偏弱,因为用户反馈、延迟和错误率数据正文都没给。
一句话点评
Google Home 的 Gemini 升级到 3.1,能一句话搞定关灯、调空调、设计时器这种多步指令了。
锐评
Google Home 把内置的 Gemini 升级到 3.1 版本,核心变化是支持多步指令组合——你一句话说“关灯、空调调到 24 度、设个 10 分钟计时器”,它能一次执行完。还新增了对重复事件、全天事件和改期的处理能力。这相当于把智能家居从“单句单任务”推到了“一句话干三件事”的阶段,对用户来说确实省事。但正文没披露完整修复列表,所以具体改了多少 bug、效果稳不稳,这点先别太激动。另外,升级是逐步推送的,不是所有设备立刻能用。缺少实测数据,比如多步指令的成功率、延迟有没有变差,这些都没提。如果是真的挺省钱,但验证还不够。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
21:34
39d ago
彭博科技· rssEN21:34 · 05·05
橡树资本旗下基金减记软件贷款,称26%资产涉AI
橡树资本管理的一只私募信贷基金,因为软件类资产估值下调,净值跌了近4%。标题里提到的26% AI敞口,正文没解释具体怎么算的、投了哪些资产、减记机制是什么。信息缺口很明显:不知道这26%是贷款、股权还是其他工具,也不知道减记幅度集中在哪类资产。对关注AI融资和信贷风险的人来说,这是个信号——AI相关贷款在传统信贷基金里占比已经不低,而且估值开始承压。但...
#Oaktree Capital Management#Funding
精选理由
HKR 靠金融风险钩子过关,但文章只给了两个数字:近 4% 的减记和 26% 的 AI 敞口。没有披露敞口口径、资产构成或减记机制,卡在 60–71 分区间。
一句话点评
橡树资本的一只私募信贷基金因软件资产估值下调净值跌了近4%,还披露了26%的AI敞口。
锐评
这条新闻对关注AI融资和信贷风险的人来说是个信号:AI相关贷款在传统信贷基金里占比已经不低,而且估值开始承压。净值跌4%不算小,说明减记幅度不低。但正文没披露这26%的AI敞口具体怎么算的、投了哪些资产、减记机制是什么,也不知道是贷款、股权还是其他工具,减记幅度集中在哪类资产也不清楚。信息缺口很明显,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R1
21:27
39d ago
彭博科技· rssEN21:27 · 05·05
AMD给出乐观预测,Super Micro因业绩展望股价上涨
AMD 对当前季度的营收给出了高于预期的指引,超微电脑则在公布利润率改善后股价上涨。正文没有披露具体的营收数字、利润率变化幅度或股价涨幅。对 AI 基础设施团队来说,关键信号是 GPU 需求是否还在持续转化为服务器厂商的利润空间。
#Inference-opt#AMD#Super Micro Computer#Michael Shepard
精选理由
彭博来源权威,但披露事实止于AMD乐观展望和Super Micro因利润率改善上涨。HKR-R通过;HKR-H和HKR-K因缺少具体数字不通过,所以留在all。
一句话点评
Super Micro 给出乐观利润预期,AI 服务器需求依然强劲,股价应声上涨。AMD 也给出乐观预测。关键看点是成本控制信号——正文没披露具体成本降了多少,但市场买账。短评:AI 硬件需求还在涨,但成本控制才是股价的命门。
锐评
AMD 对当前季度给出了高于预期的营收指引,超微电脑则因利润率改善股价上涨。对 AI 基础设施团队来说,这传递了一个关键信号:GPU 需求仍在持续转化为服务器厂商的利润空间。不过,正文没有披露具体的营收指引数字、利润率变化幅度或股价涨幅,所以无法判断改善的规模。如果 AMD 的指引主要来自 MI 系列加速卡,那说明其正在从 NVIDIA 手中抢到更多订单;超微的利润率改善则可能来自更好的成本控制或产品组合优化。但缺少这些细节,我们只能确认趋势方向,无法量化影响。建议关注后续财报电话会的具体数据。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K0·R1
20:47
39d ago
Hacker News 首页· rssEN20:47 · 05·05
AI 在斯德哥尔摩开了一家咖啡馆
Andon Labs 让一个叫 Mona 的 AI 在斯德哥尔摩签了租约、跑注册、招人,真开了一家咖啡馆。Mona 能自己读合同、列待办清单、申请户外座位许可,甚至给警察局画了张没看过街景的草图——结果被打回来重交。遇到瑞典的 BankID(个人数字身份认证)门槛,她绕不过去就找人类帮忙扫码登录,或者干脆选不需要 BankID 的供应商,比如签了三年固...
#Agent#Andon Labs#Hacker News#Commentary
精选理由
H和R通过:咖啡馆这个前提够怪、够具体,而且直接触及agent自主运营真实业务的敏感点。K不通过:只有RSS片段,没有运营机制、时间线、人工介入比例,信息缺口太大,没法判断可信度或技术含量。
一句话点评
AI 真在瑞典开了家咖啡馆,但遇到 BankID 就卡壳,得找人帮忙。
锐评
Andon Labs 让 AI Mona 在斯德哥尔摩签租约、办注册、招人,真开了一家咖啡馆。Mona 能自己读合同、列待办清单、申请户外座位许可,甚至给警察局画了张没看过街景的草图——结果被打回来重交。遇到瑞典的 BankID(个人数字身份认证)门槛,她绕不过去就找人类帮忙扫码登录,或者干脆选不需要 BankID 的供应商,比如签了三年固定电价合同,没比价。正文没披露 Mona 用了什么模型、人类干预频率、以及咖啡馆运营两周的营收数据。如果是真的,这比单纯写代码的 agent 更接近“跑通真实业务流程”,但验证还很弱:实验周期短、样本只有一个、且关键环节仍需人类兜底。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
20:43
39d ago
● P1FT · 科技· rssEN20:43 · 05·05
Apple因延迟推出AI Siri功能达成2.5亿美元和解
苹果同意支付 2.5 亿美元,和解一桩因为宣传了“AI Siri”功能但迟迟没上线的集体诉讼。起诉方是买了 iPhone 的用户,他们认为苹果 2024 年的营销广告夸大了 Siri 的智能程度,实际功能却一直没推。目前这篇报道正文被付费墙挡住,看不到和解的具体覆盖范围、法院文件细节,以及苹果到底什么时候会把这些功能补上。
#Agent#Apple#Incident#Product update
精选理由
FT 报道苹果就延迟的“AI Siri”达成 2.5 亿美元和解。H 是法律层面的转折,K 有具体金额和 2024 年的宣传事实,R 踩中了 AI 功能交付风险这个行业痛点。不过赔付范围等信息缺失,所以重要性没给到 85 以上。
一句话点评
苹果画了个AI Siri的饼没兑现,现在要花2.5亿美元和解,这钱主要赔给买过特定iPhone的用户。
锐评
苹果因为推迟推出宣传过的AI Siri功能,同意支付2.5亿美元和解集体诉讼。这笔钱说明苹果在AI落地节奏上确实翻了车,而且翻得挺贵。和解方案覆盖的是购买特定iPhone机型的用户,具体哪些型号和每人能拿多少,目前公开报道里没写清楚。另外,苹果到底什么时候能把当初承诺的AI Siri功能推出来,正文也没给出新时间表。所以这事本质上是苹果为过度承诺买单,但用户真正关心的“智能Siri什么时候能用”依然没答案。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
20:39
39d ago
● P1彭博科技· rssEN20:39 · 05·05
中国阻止Meta二十亿美元收购Manus AI交易
彭博社在 5 月 5 日的一期播客里提到,北京方面拦下了 Meta 收购 Manus AI 的交易,报价是 20 亿美元。播客片段没讲监管层具体用什么理由否决,也没披露交易条款和 Manus AI 到底做什么业务。想知道为什么被拦,得去听完整期节目,光看这个页面信息不够。
#Meta#Manus AI#Bloomberg#Policy
精选理由
Bloomberg 播客摘要说北京阻止了 Meta 收购 Manus AI,20 亿美元的价码摆在那,但正文没解释为什么拦、交易怎么设计的、Manus 具体做什么。我会先打个折,因为关键信息缺失,没法判断是纯监管原因还是有其他考量。冲突性和话题度够高,但细节太少,所以放在 featured 而不是头条。
一句话点评
中国直接叫停了Meta对Manus AI的二十亿美元收购,这比单纯的投资审查更重,等于把一家中国AI创业公司的退出通道堵死了。
锐评
这笔交易被否,最直接的影响是Manus AI没法走“卖给大厂”这条路了。二十亿美元的报价说明Meta很想要它的团队或技术,但中国监管层显然认为这涉及关键技术外流。文章把这件事拔高到“全球AI竞赛转折点”,这个判断我先打个折——目前看更像个案,还没看到成文的系统性封锁政策。 文章没披露Manus AI具体做什么、团队规模多大,也没说清否决的具体法律依据。这些信息缺口让“信号意义”的讨论有点虚。对AI从业者来说,更实际的信号是:如果你在做底层模型或数据基建,未来想拿美元基金然后卖给美国巨头,这条路可能越来越窄。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
20:16
39d ago
Hacker News 首页· rssEN20:16 · 05·05
.de 顶级域因 DNSSEC 问题离线约两小时
Hacker News 上一条帖子称 .de 域名系统因 DNSSEC 问题离线,获得 202 票和 62 条评论。帖子只链接到 Verisign Labs 的 DNSSEC 调试工具页面,页面显示对 nic.de 的 DNSSEC 链检查通过(绿色标记),但未披露故障时间、影响范围或根因。正文没说明具体是什么故障、影响了多少用户、持续了多久,这点先别...
#Verisign Labs#Hacker News#Incident
精选理由
H 靠故障标题拿分,但 K 和 R 都不行:帖子只有 Verisign 页面加 202 分和 62 条评论,跟 AI 几乎无关,所以分数低于 40,直接排除。
一句话点评
德国顶级域名 .de 因 DNSSEC 配置问题宕了约两小时,影响数百万 .de 网站。根服务器返回的 DS 记录与 .de 区 DNSKEY 不匹配,导致验证链断裂。Hacker News 用户反馈称解析全面失败,但官方尚未发布事故报告。目前看是密钥轮转或同步失误,不是攻击。正文没披露具体根因和修复细节,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
20:09
39d ago
r/LocalLLaMA· rssEN20:09 · 05·05
跑本地模型到底省不省钱?有人算了笔账
Reddit 用户用 Hermes 搭配 Qwen-397b 跑了 5 天,消耗 2 亿 tokens。按 Artificial Analysis 的 API 价格每百万 tokens 1.25 美元算,一个月 API 费要 1250 美元。作者认为这笔钱够买硬件,6 个月就能回本。这个计算对高 token 消耗的 agent 场景有参考价值,但正文没...
#Agent#Inference-opt#Reddit#Qwen
精选理由
HKR 三项都达标:钩子有具体用量和场景,关键数字给全了,相关性直击高频 agent 用户的成本痛点。但来源是单条 Reddit 帖子,没有复现步骤、吞吐量、电费这些细节,所以分数卡在 70 档,不往上调。
一句话点评
跑本地模型省API费,高用量场景6个月回本。
锐评
Reddit用户实测:Hermes+Qwen-397b跑5天消耗2亿tokens,按Artificial Analysis报价每百万tokens 1.25美元算,月API费1250美元。作者认为这笔钱够买硬件,6个月回本。这个计算对高token消耗的agent场景有参考价值——每天4000万tokens的用量,API成本确实可观。但正文没披露硬件配置和功耗,实际回本周期还得算上电费和散热。另外,1.25美元/百万tokens是API价格,自建集群的维护成本(运维、故障、折旧)没算进去。结论:如果你跑agent每天几千万tokens,本地部署确实省钱;用量低的话,还是API划算。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
20:07
39d ago
Product Hunt · AI· rssEN20:07 · 05·05
Fei Design Mode:在实时预览里直接改UI像素,改完直接进代码库
AutonomyAI 新出的 Fei Design Mode,让设计师在实时预览里点选任意元素、直接改样式,改完一键推到代码库,不需要从 Figma 再转一手。官方说“设计师终于有了超能力”,但正文没披露支持哪些平台、定价、是否已发布,也没说具体在什么工作流下能用。目前 Product Hunt 页面显示有免费选项,送 3 个月试用,但细节不够,这点先...
#Agent#Tools#Product update
精选理由
一个 Product Hunt 上的小工具发布:H 和 R 条件满足,但 K 条件不成立——平台、定价、可复现的工作流全没披露。不值得上首页推荐。
一句话点评
AutonomyAI 的 Fei Design Mode 让设计师在实时预览里点选元素、直接改样式,改完一键推到代码库,省掉 Figma 转手这一步。官方说“设计师终于有了超能力”,但正文没披露支持哪些平台、定价、是否已发布,也没说具体在什么工作流下能用。目前 Product Hunt 页面显示有免费选项,送 3 个月试用,但细节不够,这点先别太激动。如果是真的挺省钱,但得等更多实测。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
20:06
39d ago
TechCrunch AI· rssEN20:06 · 05·05
ASML 总裁放话:没人能撼动我们的光刻机垄断地位
ASML 总裁 Christophe Fouquet 在米尔肯会议上说,目前没有竞争对手能挑战 ASML 在高端光刻机(造芯片必需的核心设备)上的垄断。他 2024 年才上任,之前在公司干了十多年。正文没披露 ASML 具体市场份额、EUV(极紫外光刻机)的技术细节,也没提任何竞争对手的名字或进展。所以这句话更像一个姿态宣示,不是技术或市场分析。
#ASML#Christophe Fouquet#Milken Institute#Commentary
精选理由
HKR-H和HKR-R成立:垄断表态尖锐,且ASML处于AI算力上游。HKR-K不成立:正文没给市场份额、EUV参数或竞争对手细节。
一句话点评
ASML 总裁放话没人能挑战它的光刻机垄断,但正文没给任何数据支撑。
锐评
ASML 总裁 Christophe Fouquet 在米尔肯会议上说“没人能挑战我们”,指的是高端光刻机(造芯片必需的核心设备)的垄断地位。他 2024 年才上任,之前在公司干了十多年。这句话更像一个姿态宣示,不是技术或市场分析。正文没披露 ASML 具体市场份额、EUV(极紫外光刻机)的技术细节,也没提任何竞争对手的名字或进展。所以信息缺口很大:你不知道对手卡在哪、ASML 的护城河到底多深。对从业者来说,这条新闻的价值在于确认 ASML 高层对外口径——他们目前不认为有近忧,但缺乏细节让你自己判断风险。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
19:45
39d ago
● P1The Verge · AI· rssEN19:45 · 05·05
Apple 计划在 iOS 27 允许用户选择第三方 AI 模型
Mark Gurman 爆料,苹果计划在 iOS 27、iPadOS 27 和 macOS 27 里开放“扩展”机制,让第三方聊天机器人接管 Siri、写作工具和图片生成这些系统级功能,不再只绑死 ChatGPT。用户能把自己常用的模型设成默认。不过原文没提会支持哪些模型、怎么收费、开发者接口长什么样,这些关键信息都还缺着,先别太激动。
#Agent#Tools#Multimodal#Apple
精选理由
HKR 三项都成立:系统级模型选择器是个强钩子,也给了具体的 Extension 落点。打 80 分是因为正文没披露支持哪些模型、怎么收费、开发者接口长什么样,目前还只是一份路线图爆料,我会先打个折。
一句话点评
苹果可能在 iOS 27 里让你自己选默认 AI 模型,不再只绑 ChatGPT。但正文没披露具体支持哪些模型、怎么审核,先别太激动。
锐评
这条消息的核心是苹果在系统层面松绑了 AI 模型的选择权。以前 Siri 和 Apple Intelligence 的后台基本是 ChatGPT 一家独大,现在 iOS 27 可能会像换默认浏览器一样,让你把 Gemini 或别的模型设成主力。这对用户是好事,不用被一家模型绑死;对开发者来说,意味着苹果的 AI 生态会从封闭走向半开放,第三方模型有机会直接进入 iPhone 的系统级交互。 不过,目前信息全来自 The Verge 和 TechCrunch 对苹果计划的转述,没有官方确认,也没有给出技术实现细节。最关键的两点都没说清楚:一是苹果会开放到什么程度——是只允许几个合作方上架,还是真的像 App Store 一样让开发者提交模型?二是隐私和审核机制怎么做,本地运行和云端调用的比例怎么分。这些直接决定了这个功能是实质开放还是做做样子。 另外,报道里没提这个功能是否只限海外,国内用户能不能用、能用哪些模型,都是未知数。如果苹果只是把选择权限制在几家已合作的巨头之间,那对生态的冲击就小很多。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
19:20
39d ago
r/LocalLLaMA· rssEN19:20 · 05·05
用编解码器感知重建,减少音乐数据集里的MP3压缩偏差
TheSpicyBoi123 发布了一个叫 ADE-MP3 的工具,专门修复 LAME MP3 解码带来的音质损失。它把 MP3 编码当成一个非一一对应的贝叶斯推断问题来处理,目前对 96–224 kbps 的固定码率文件效果最好。在没见过的数据上,128 kbps 下归一化均方误差降低了 63.45%,160 kbps 下降低了 79.64%。简单说...
#Audio#TheSpicyBoi123#ADE-MP3#LAME
精选理由
HKR-H/K通过:编解码感知逆问题是个新鲜的数据质量角度,且有具体的NMSE下降数据支撑。但仅限Reddit发布,范围窄,样本量和下游训练收益都没披露,所以分数落在60–71 all区间。
一句话点评
一个修复MP3压缩损失的开源工具,对音乐数据集有用。
锐评
TheSpicyBoi123 发布的 ADE-MP3 把 MP3 解码损失当成贝叶斯推断问题来修,不是简单滤波。实测在 128 kbps 下归一化均方误差降了 63.45%,160 kbps 下降 79.64%,效果明显。目前只对 96–224 kbps 的固定码率文件效果好,可变码率没提。正文被 Reddit 屏蔽,没披露训练数据量、推理速度、是否依赖特定编码器版本。如果跑一次修复比重新采集音频便宜,对缺高码率源的音乐数据集是个低成本提质的选项。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
19:13
39d ago
彭博科技· rssEN19:13 · 05·05
Pinterest第一季度销售超预期 归因于自研AI模型
Pinterest 一季度营收超过分析师预期,原因是他们自己搞了一套 AI 模型来降本和提升用户活跃度。正文没披露具体省了多少钱、营收数字、用户活跃度变化,也没说模型长什么样。
#Inference-opt#Pinterest#Bill Ready#Bloomberg
精选理由
H 通过是因为“自研 AI 带来回报”是个清晰的商业钩子,比单纯报业绩数字更有看点。K 和 R 都不通过:正文没给任何具体数字或机制,既无法验证信息真伪,也对从业者缺乏实操参考。没有硬性排除项,所以归入低价值区间。
一句话点评
Pinterest 一季度营收超预期,盘后涨 20%,归功于自研 AI 模型。但正文没披露具体模型架构或效果指标,只说“定制 AI”提升了广告匹配和转化。这点先别太激动——很多公司都把增长归因于 AI,但缺少可复现的细节。关键看后续财报电话会是否给出更多技术拆解。
锐评
Pinterest 一季度营收超分析师预期,CEO Bill Ready 归功于自研 AI 模型——既降了成本又拉高了用户活跃度。这是个好消息,但正文没披露省了多少钱、营收具体多少、活跃度涨了多少,也没说模型架构。所以“自研 AI 见效”目前还停留在管理层嘴上,缺乏硬数据支撑。对同行来说,信号是:定制化推理优化(Inference-opt)确实能出财报效果,但具体怎么落地、省多少,还得等更多细节。如果是真的,这比单纯堆参数划算得多。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0
19:01
39d ago
彭博科技· rssEN19:01 · 05·05
OpenAI 联合创始人 Brockman 作证:马斯克缺乏 AI 知识,曾把 ChatGPT 前身叫“蠢货”
Greg Brockman 在法庭作证时说,马斯克曾评价 ChatGPT 的前代模型“很蠢”,还批评过研究人员。RSS 片段提到 OpenAI 联合创始人担心马斯克没有耐心运营公司,但正文没披露具体是哪个案例、发生在什么时间点。
#OpenAI#Greg Brockman#Elon Musk#Personnel
精选理由
HKR 三个维度都成立,但正文只给了证词片段,没披露庭审案由、时间,也没说对现在的 OpenAI 有什么影响。这是创始人的八卦,不是产品、模型或治理结果,所以热度有但信息缺口大。
一句话点评
法庭爆料:马斯克曾嫌早期GPT“很蠢”,OpenAI联合创始人担心他没耐心管公司。
锐评
Greg Brockman 在法庭作证时翻出旧账:马斯克曾评价 ChatGPT 的前代模型“很蠢”,还批评过研究人员。RSS 片段还提到 OpenAI 联合创始人担心马斯克没耐心运营公司。这条新闻的价值在于它提供了 OpenAI 早期内部对马斯克真实态度的第一手证词,来源是 Bloomberg 的法庭报道,可信度较高。但正文没披露具体是哪个模型、发生在什么时间点,也没说马斯克具体批评了什么。所以这点先别太激动——它更像一个八卦佐料,补充了 OpenAI 与马斯克分裂的背景故事,但对当前技术路线或产品没有直接影响。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
18:54
39d ago
彭博科技· rssEN18:54 · 05·05
PayPal 和 Coinbase 宣布裁员,归因于 AI 冲击
PayPal 和 Coinbase 宣布裁员,标题直接归因于 AI 的影响。报道还提到软件股因 AI 不确定性承压,以及 Palantir 的商业销售疲软。但正文没有披露具体裁员人数、比例或时间节点,信息量有限。
#PayPal#Coinbase#Palantir#Incident
精选理由
标题有钩子,但正文很薄:只说软件股受 AI 不确定性影响,Palantir 销售不及预期,没给裁员规模或 AI 替代机制。Bloomberg 来源加分,但信息量撑不起高评分。
一句话点评
标题说AI导致裁员,但正文没给具体人数和比例,信息量有限。
锐评
彭博这条视频报道标题直接说PayPal和Coinbase因AI影响裁员,但正文没披露任何具体数字——裁了多少人、占员工比例多少、什么时候裁。报道还提到软件股因AI不确定性承压,以及Palantir商业销售疲软,但同样缺乏数据支撑。标题和正文之间有信息缺口:AI影响是具体替代了哪些岗位,还是公司借AI重组业务?正文没讲。这条更适合当作一个市场情绪信号,而非可引用的裁员事件。如果想用这个数据点,建议去查SEC文件或公司官方公告补全细节。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
18:12
39d ago
r/LocalLLaMA· rssEN18:12 · 05·05
Gemma 4 31B 和 Qwen 27B 比速度:慢的反而更快
Reddit 上有人发帖对比 Gemma 4 31B 和 Qwen 3.6/5 27B 两个稠密模型,标题说“慢的更快”。但正文被 Reddit 的 403 墙挡住了,必须登录或用开发者 token 才能看。所以具体跑了什么任务、用的什么硬件、吞吐量多少、分数多少,一概没披露。结论只能先打个折,等有人贴出实测数据再说。
#Benchmarking#Reddit#Gemma#Qwen
精选理由
标题有钩子,但正文是空的——Reddit 页面被拦截,连测试环境、任务、分数都没放出来。从业者没法复现或参考,只能当个标题党看。所以虽然话题本身不差,但信息量撑不起高评分,维持低价值判断。
一句话点评
标题说“慢的更快”,但正文被 Reddit 墙了,没数据,先别信。
锐评
Reddit 上有人发帖对比 Gemma 4 31B 和 Qwen 3.6/5 27B 两个稠密模型,标题说“慢的更快”——暗示推理速度慢的模型反而在某个任务上得分更高。但正文被 Reddit 的 403 墙挡住了,必须登录或用开发者 token 才能看。所以具体跑了什么任务、用的什么硬件、吞吐量多少、分数多少,一概没披露。结论只能先打个折,等有人贴出实测数据再说。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
17:52
39d ago
Hacker News 首页· rssEN17:52 · 05·05
GLM-5V-Turbo:智谱为多模态智能体做的原生基座模型
智谱发了 GLM-5V-Turbo,目标是让模型天生就能当多模态智能体——不光会看会读,还能直接调用工具、操作界面、执行任务。论文标题说这是“原生”的,意思是架构上从一开始就为 agent 场景设计,而不是在纯文本模型上后加视觉模块。不过正文只给了摘要,没披露参数量、训练数据、评测基准这些硬指标,所以暂时没法判断它比现有方案(比如 GPT-4V 或 Q...
#Agent#Multimodal#GLM#Research release
精选理由
HKR-H 靠 GLM-5V-Turbo 的多模态 Agent 定位拿到钩子,R 靠模型竞争话题性。K 失败是因为正文没披露任何参数、基准、训练机制或发布条款,所以分数压在 60–71 区间。
一句话点评
智谱发了一篇论文,讲的是让模型天生就会看、会读、会调用工具,而不是在文本模型上后加视觉模块。但正文只有摘要,没披露参数量、训练数据和评测基准,暂时没法判断它比 GPT-4V 或 Qwen-VL 强在哪。
锐评
GLM-5V-Turbo 的卖点是“原生多模态智能体”——架构从一开始就为 agent 场景设计,能直接操作界面、调用工具。这个方向是对的,现在主流做法是在文本模型上外挂视觉模块,延迟高、配合差。但论文只给了摘要,参数量、训练数据、评测基准一概没提。没有这些硬指标,就没法判断它比 GPT-4V 或 Qwen-VL 好多少。另外,14 个 HN 点赞和 2 条评论说明社区还没怎么关注,可能是信息太少。如果是真的,架构创新值得跟进,但先别太激动,等完整论文出来再评估。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
17:46
39d ago
FT · 科技· rssEN17:46 · 05·05
AI 替代岗位,一级和二级市场都在抢着赚钱
FT 报道说,企业高管们预期自动化能带来超额回报,所以公开市场和私募市场都在争着从 AI 替代岗位这件事里获利。但正文被付费墙挡住了,没披露具体是哪些公司、预期回报率是多少、哪些岗位会被替代、以及时间表。信息缺口很明显:光说“超额回报”但没给数字,没法判断是吹牛还是真有数据支撑。
#Financial Times#Commentary
精选理由
FT 的权威性让这条不至于沦为纯口水,但正文几乎没给任何可验证的细节:没有公司名、没有回报数字、没有岗位类别、没有时间表。HKR 里 H 和 R 靠“就业 vs 投资”的角度勉强过关,K 直接挂掉——因为 RSS 摘要只说了“企业押注自动化会有超额回报”,其他全是空白。适合当引子,不适合上推荐位。
一句话点评
FT 说高管们预期自动化能带来超额回报,但全文被付费墙挡住,没披露具体公司、回报率、岗位和时间表。
锐评
FT 这篇报道的核心判断是:企业高管预期 AI 替代岗位能带来超额回报,因此公开市场和私募都在争抢这块蛋糕。但正文被付费墙完全挡住,关键信息全部缺失:没有具体公司名称、没有预期回报率数字、没有哪些岗位会被替代、也没有时间表。 “超额回报”这个说法本身很模糊——是比标普500高5%还是高50%?是来自成本削减还是收入增长?这些都没说。对于从业者来说,这条新闻的价值在于确认了一个趋势信号:资本确实在押注自动化带来的劳动力替代,但缺乏数据支撑,无法判断这是理性预期还是炒作。 信息缺口很明显:FT 没有披露样本量(调查了多少高管)、行业分布(是科技公司还是传统行业)、以及回报率的量化区间。如果是基于大样本的严谨调查,那值得关注;如果只是几个 CEO 的随口表态,那参考价值有限。建议等全文出来后再做判断。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
17:25
39d ago
FT · 科技· rssEN17:25 · 05·05
摩根大通和贝莱德高管说AI没有泡沫
摩根大通的戴蒙和贝莱德的芬克都公开表示,当前AI热潮不是泡沫,需求依然强劲。但正文没披露他们具体看了哪些估值数据或支出数字,也没给时间表。关键信号是华尔街正在为AI基础设施投资买单,这点先别太激动——他们没否认估值偏高,只是说需求能撑住。
#JPMorgan#BlackRock#Jamie Dimon#Commentary
精选理由
FT来源有权威性,HKR-H和HKR-R通过,因为两位金融掌门人联手反驳AI泡沫论。HKR-K不通过:没披露估值、投资规模或时间表,达不到精选级。
一句话点评
华尔街大佬说AI不是泡沫,但没给估值数据,先别急着信。
锐评
摩根大通戴蒙和贝莱德芬克公开唱多AI需求,否认泡沫论。关键信号是华尔街正为AI基础设施投资买单,但正文没披露他们看了哪些估值或支出数字,也没给时间表。两人没否认估值偏高,只是说需求能撑住——这点先别太激动。缺的是具体数据支撑,比如资本开支规模或回报预期。如果是真的,说明机构资金还在进场,但信息缺口明显,建议等财报或募资细节再下判断。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
17:07
40d ago
Product Hunt · AI· rssEN17:07 · 05·05
MolmoAct 2:开源机器人模型,动手前先想3D
艾伦AI研究所发布了MolmoAct 2,一个开源的机器人动作推理模型。它最大的特点是执行任务前会先做3D空间推理,再指挥机械臂行动,能处理双手协作任务,而且不需要为每个新任务单独微调。官方说推理速度比上一代MolmoAct快了最多37倍——这点先别太激动,正文没披露具体测试环境和任务类型,加速比可能挑着有利的场景算的。模型参数规模、训练数据、许可证和...
#Robotics#Reasoning#Allen Institute for Artificial Intelligence#Product update
精选理由
HKR-H/K通过开放机器人模型和3D推理再动作的钩子。缺少参数、训练数据和评测基准,所以分数压在60–71区间,没进推荐位。
一句话点评
MolmoAct 2 是个开源机器人模型,干活前先做 3D 空间推理再动手,能处理双手协作任务,且不用为每个新任务单独微调。官方说推理速度比上一代快最多 37 倍——这点先别太激动,正文没披露具体测试环境和任务类型,加速比可能挑着有利的场景算的。模型参数规模、训练数据、许可证和基准测试结果都没提,信息缺口不小。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
16:43
40d ago
Product Hunt · AI· rssEN16:43 · 05·05
Luma Uni 1.1 API:生成前先猜你要什么,价格和延迟砍半
Luma AI 在 Product Hunt 上发了 Uni 1.1 API,主打“推理模型,生成前先理解意图”。官方说价格和延迟都比同类模型低一半,还给了 Python、JS/TS、Go 的 SDK 和 CLI,号称生产级。但正文没披露模型参数量、上下文窗口、具体定价和 API 调用条件。核心看点是“意图预判”这个能力能不能稳定复现——如果真能先猜对...
#Reasoning#Luma AI#Product Hunt#Product update
精选理由
这是一个小版本更新:HKR-K 靠的是“先解释意图再生成”这个机制。正文没披露参数规模、价格、上下文窗口和调用条件,也没有可复现的证据,所以不值得上推荐位。
一句话点评
Luma 发了个推理 API,号称生成前先猜你意图,价格和延迟都比同类低一半。
锐评
Luma Uni 1.1 API 的核心卖点是“意图预判”——模型在生成 3D 内容前先理解用户想要什么,而不是直接出图。官方说价格和延迟都比同类模型低一半,但没披露具体数字,也没说对比的是谁(可能是自家旧版?)。支持 Python、JS/TS、Go 的 SDK 和 CLI,算是对开发者友好。 关键缺口:没提模型参数量、上下文窗口、具体定价和 API 调用条件。如果真能稳定复现“先猜意图再生成”,对 3D 内容生产流程是个简化——省掉反复调 prompt 的步骤。但 Product Hunt 上的发布偏营销,缺少独立评测或 benchmark 数据。建议等第三方跑分或自己试了再信“低一半”的说法。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K1·R0
16:34
40d ago
Hacker News 首页· rssEN16:34 · 05·05
让AI看屏幕操作网页,比直接调API贵45倍
Reflex 团队用同一个后台管理面板做了对比测试:让 Claude Sonnet 通过截图和点击操作网页(vision agent),与直接调 HTTP 接口完成任务。结果 vision agent 用了 53 步、消耗 55.1 万 tokens,而 API 方式只用了 8 次调用、1.2 万 tokens。按 token 算,视觉方案贵了 45 ...
#Agent#Tools#Reflex#Commentary
精选理由
标题说Computer Use比结构化API贵45倍,这个数字本身挺扎眼,能吸引做Agent部署的人看一眼。但正文只有RSS片段,没披露具体测了什么任务、用了什么模型、单价和token用量是多少,也没说能不能复现。所以H和R能过——成本钩子够锐,且确实影响预算决策;K不过,因为信息缺口太大,只能给60-71分。
一句话点评
视觉Agent比调API贵45倍,token消耗差了46倍。
锐评
Reflex团队用同一个后台管理面板做了对比:让Claude Sonnet通过截图+点击操作网页(视觉Agent),与直接调HTTP接口完成任务。结果视觉方案用了53步、55.1万tokens,API方式只用了8次调用、1.2万tokens。按token算,视觉方案贵了45倍。 这个数字很直观:视觉Agent每一步都要截图、分析、决策,而结构化API只需一次请求。但注意,这是Reflex自家产品的对比,任务场景是他们的管理面板,模型只用了一个版本(Sonnet),没有披露具体任务复杂度、截图分辨率、重试次数等细节。 缺什么:没有说任务是什么(增删改查?多步流程?),没有对比其他模型(GPT-4o、Gemini),也没有算延迟差异——视觉方案53步意味着用户要等很久。另外,45倍是按token算的,如果按实际API调用计费(比如Anthropic的Computer Use按步收费),倍数可能更高。 结论:视觉Agent适合没有API的场景,但如果有结构化接口,别为了炫酷用截图方案,成本差一个数量级。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
16:31
40d ago
r/LocalLLaMA· rssEN16:31 · 05·05
实测四款开源新模型:Kimi K2.6 最快,小米 MiMo 最慢
一位 Reddit 用户跑了四款新开源模型,结论是 Kimi K2.6 速度最快,小米 MiMo 最慢。帖子提到 MiMo 每个 token 激活的参数更多,所以慢;DeepSeek V4 用了 MLA(多头潜在注意力),能把 KV 缓存压缩到原来的 25% 左右,省显存。但正文没披露用了什么硬件、跑了什么任务、具体延迟多少秒,所以这个排名只能当个参考...
#Inference-opt#Agent#Benchmarking#DeepSeek
精选理由
一个 Reddit 用户的非正式测试,排了四个开源模型的速度,Kimi K2.6 最快,小米 MiMo 最慢。正文说 MiMo 慢是因为每 token 激活参数更多,DeepSeek V4 用 MLA 做了约 75% KV-cache 压缩——这两个技术点对选模型有参考价值。但正文没披露硬件配置、跑了什么任务、具体延迟数字,验证力度弱。65 分:信息有用,但别当权威评测,适合所有人看一眼,不够上精选。
一句话点评
Reddit 用户实测四款开源模型,Kimi K2.6 最快,小米 MiMo 最慢。
锐评
一位 Reddit 用户跑了四款新开源模型,结论是 Kimi K2.6 速度最快,小米 MiMo 最慢。帖子提到 MiMo 每个 token 激活的参数更多,所以慢;DeepSeek V4 用了 MLA(多头潜在注意力),能把 KV 缓存压缩到原来的 25% 左右,省显存。但正文没披露用了什么硬件、跑了什么任务、具体延迟多少秒,所以这个排名只能当个参考,不能直接拿来选模型。另外,GLM 5.1 被形容为“最花哨”,可能指功能或界面,但没细说。缺的是标准化测试条件和可复现的延迟数据,建议等更严谨的评测再下结论。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R1
16:14
40d ago
Hacker News 首页· rssEN16:14 · 05·05
Gemma 4 提速:一次预测多个词,推理快三倍
Google 给 Gemma 4 加了一个“多词预测草稿器”(multi-token prediction drafter),让模型一次生成多个 token 而不是一个一个蹦,推理速度最高提升 3 倍。原理类似投机解码:小模型先快速写草稿,大模型再校验,省掉逐 token 串行生成的时间。正文没披露具体用了什么硬件、延迟降了多少毫秒,也没说这个 3x ...
#Inference-opt#Google#Gemma#Product update
精选理由
标题说 Gemma 4 用多 token 预测草稿器提速,但 RSS 正文只有 URL、48 分钟和 11 条评论,没披露加速倍数、硬件条件或实现细节。真正值得盯的是草稿器机制和可复现基准,信息缺口太大,够不上精选。
一句话点评
Google 给 Gemma 4 加了个“多词预测草稿器”,推理速度最高能快 3 倍,但具体延迟降了多少、用了啥硬件都没说。
锐评
Google 给 Gemma 4 加了个“多词预测草稿器”(multi-token prediction drafter),原理类似投机解码:先让一个小模型快速写草稿,一次生成多个 token,大模型再校验,省掉逐 token 串行生成的时间。官方说推理速度最高提升 3 倍,但没披露具体延迟降了多少毫秒、用了什么硬件,也没说这个 3x 是在什么场景下测的(比如 batch size、序列长度、模型大小)。如果是小 batch 或长文本生成,加速效果可能更明显;但如果是大 batch 或短文本,收益会打折。另外,草稿模型本身也有额外开销,正文没提训练成本或部署门槛。整体看是个实用的工程优化,但 3x 是上限,实际落地要打折扣。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:09
40d ago
● P1FT · 科技· rssEN16:09 · 05·05
五大出版集团起诉 Meta 和扎克伯格侵犯版权用于训练 Llama 模型
五家主要出版集团把 Meta 和扎克伯格告了,理由是 Meta 在训练 Llama 系列模型时,未经授权就用了他们受版权保护的作品。目前这篇 FT 报道正文被付费墙挡住,只显示了标题和摘要片段,所以具体涉及多少本书、索赔金额、在哪个法院起诉、以及 Meta 到底是通过什么方式把这些书喂给模型的,这些关键信息正文都没披露。
#Fine-tuning#Safety#Meta#Mark Zuckerberg
精选理由
这条消息我会先打个折——正文只是 RSS 摘要,没披露涉案作品数量、索赔金额、具体法院和训练数据怎么被抓包的机制,信息缺口不小。但五家出版集团联手告 Meta 和 Zuckerberg,矛头直指 Llama 的训练语料,这事本身够硬。对做模型的人来说,训练数据到底能不能用、用了要付多少钱、会不会被告,是每天都在算的账。这点先别太激动,等起诉书细节出来再看授权边界怎么划,但眼下值得放进必读。
一句话点评
五大出版集团告 Meta 用盗版书训练 Llama,FT 正文被付费墙挡了,具体证据和诉求看不到。
锐评
这起诉讼的核心指控是 Meta 在训练 Llama 模型时,未经授权使用了大量受版权保护的书籍。从现有信息看,出版方认为模型能“逐字复制”原文,这直接触及了 AI 训练数据合法性的老问题。但关键细节全卡在 FT 的付费墙后面,比如原告具体拿出了哪些“逐字复制”的证据、索赔金额是多少、以及诉讼是在哪个法院提起的,这些目前都看不到。 我会先打个折,因为“逐字复制”这个说法在技术上有多种可能:可能是模型真的背下了训练数据,也可能是提示词故意诱导出来的。没有诉状原文,很难判断出版方的证据有多硬。另外,把扎克伯格个人也列为被告,是一种施压策略,但最终能否成立要看是否有证据证明他个人直接决策了数据使用方式。 这条新闻值得跟,但眼下缺的信息太多。需要等诉状公开,看具体侵权书目清单和“逐字复制”的实例,才能判断这案子是雷声大还是真有杀伤力。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
16:01
40d ago
● P1r/LocalLLaMA· rssEN16:01 · 05·05
Google 发布 Gemma 4 MTP 模型加速推理技术
Google 在 Hugging Face 上放了 4 个 Gemma 4 的 MTP 检查点。MTP 的做法是拿一个小号草稿模型一次预测好几个 token,再由主模型并行验证,相当于让模型“先猜后验”,最终解码速度能提一倍,而且输出质量跟原来一模一样。不过 Reddit 原帖被网络策略挡了,正文没披露具体模型尺寸、硬件要求或实测延迟数据。
#Inference-opt#Google#Hugging Face#Gemma
精选理由
H、K、R 都站得住:钩子是 2 倍低延迟解码,有检查点和机制说明,不是画饼。它不是旗舰模型发布,属于实用更新,75 分放在 featured 低位合理。
一句话点评
Google 给 Gemma 4 加了多 token 预测(MTP),一次猜多个词来提速,但 Reddit 帖子被屏蔽,正文没披露具体加速数据和硬件条件。
锐评
这条消息本身很简单:Google 把多 token 预测(MTP)技术用到了 Gemma 4 上。MTP 的原理是让模型一次预测后面好几个词,而不是传统的一个一个往外蹦,这样在生成阶段可以明显减少推理步数,理论上能提速。但 Reddit 原帖被网络屏蔽,正文内容完全看不到,只有标题提到“MLX”,暗示有人在苹果芯片上用 MLX 框架跑通了。关键信息全缺:到底加速了多少百分比?在什么卡上测的?显存占用有没有变化?这些数字没有,就没法判断是实打实的省钱,还是实验室里的纸面优化。另外,MTP 通常需要额外的输出头,模型体积会变大一点,这部分代价原文也没提。想跟的人建议直接去 Hugging Face 搜 Gemma 4 的模型卡,看官方有没有放出 benchmark。
HKR 分解
hook knowledge resonance
打开信源
85
SCORE
H1·K1·R1
15:53
40d ago
r/LocalLLaMA· rssEN15:53 · 05·05
Qwen3.6 配 Pi 编程智能体,一个 Reddit 用户说覆盖了 80% 的日常需求
一个 Reddit 用户分享了他的本地部署方案:Qwen3.6 模型加上 Pi 编程智能体,再搭配 Exa 网页搜索和 agent-browser 浏览器工具,就能覆盖他 80% 的使用场景。这套组合听起来挺实用,但原文没透露具体硬件配置、量化精度或跑分数据,所以实际效果和门槛得打个问号。如果你手头有本地模型,可以试试这个搭配,但别直接照搬——毕竟“8...
#Agent#Code#Tools#Qwen
精选理由
这是一条实用的 LocalLLaMA 经验帖,HKR 中钩子和相关性成立——用 Pi 套 Qwen3.6 做 coding agent 确实省心,且本地部署对成本敏感用户有吸引力。但知识性很弱:80% 覆盖是主观感受,无硬件、量化或基准支撑,无法复现。整体够不上 featured,维持 all 层级合理。
一句话点评
本地跑Qwen3.6加Pi编程智能体,说能覆盖80%场景,但没给硬件和量化细节,先别急着抄作业。
锐评
Reddit用户分享的本地部署方案:Qwen3.6模型搭配Pi编程智能体,再加Exa网页搜索和agent-browser浏览器工具,声称覆盖80%使用场景。这套组合听起来挺实用,但原文被屏蔽,正文没披露具体硬件配置(显存、内存)、量化精度(GGUF还是AWQ)或跑分数据,所以实际效果和门槛得打个问号。Pi智能体本身是轻量级编程助手,配合外挂搜索和浏览器工具确实能处理日常编码、信息检索等任务,但“80%”这个数字缺乏验证——是用户主观感受还是系统化测试?另外,Qwen3.6的推理速度和上下文长度在本地部署下是否够用,也取决于硬件。如果你手头有本地模型,可以试试这个搭配,但别直接照搬——毕竟“80%”可能只是个人经验,且缺少延迟、成本等关键指标。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
15:50
40d ago
r/LocalLLaMA· rssEN15:50 · 05·05
Google TPU 推理提速 3 倍:扩散式投机解码
Google 开发者博客称,在 Google TPU 上用扩散式投机解码(一种让模型并行生成多个候选 token 再验证的方法)把大模型推理速度提了 3 倍。但正文只有 Reddit 的 403 拦截页,没披露用了什么模型、哪代 TPU、跑什么 benchmark、怎么复现。3 倍这个数字看着漂亮,但没上下文就没法判断是真是假——比如是不是拿小模型测的...
#Inference-opt#Google#Reddit#Research release
精选理由
标题说 Google 在 TPU 上用扩散式推测解码把 LLM 推理加速 3 倍,但正文是 Reddit 403 拦截页,没披露模型、TPU 版本、基准任务或复现条件。3 倍这个数字挺诱人,但没细节前先别太激动。真正值得盯的是解码机制和硬件条件——推测解码本身不新,但扩散式用在 TPU 上可能是新组合。信息缺口:模型大小、TPU 代际、延迟对比、成本变化全没提。
一句话点评
标题说 Google TPU 上推理提速 3 倍,但正文只有 Reddit 的 403 拦截页,没披露任何细节。
锐评
标题很唬人:Google TPU 上用扩散式投机解码(一种让模型并行生成多个候选 token 再验证的方法)把推理速度提了 3 倍。但点进去只有 Reddit 的 403 拦截页,正文一个字没披露——用了什么模型、哪代 TPU、跑什么 benchmark、怎么复现,全不知道。3 倍这个数字看着漂亮,但没上下文就没法判断是真是假:比如是不是拿小模型测的、是不是只测了特定任务、有没有跟 baseline 公平对比。如果是真的,对 TPU 用户挺省钱,但这点先别太激动。信息缺口太大,建议等官方出完整技术报告再下结论。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:49
40d ago
TechCrunch AI· rssEN15:49 · 05·05
PayPal 说要“重新做回科技公司”,意思就是押注 AI
PayPal 在 Q1 财报电话会上提出 AI 驱动的转型计划,CEO Enrique Lores 称要“重新做回科技公司”,并预计通过自动化和重组节省 15 亿美元。正文没披露具体裁了多少人、用了什么 AI 系统、以及技术栈更新的时间表。15 亿这个数字不小,但省下来的钱是投回研发还是用来稳住股价,目前还不清楚。
#Agent#PayPal#Product update#Personnel
精选理由
PayPal 把 AI 转型和 15 亿美元节省目标绑在一起,标题有记忆点,但正文是 RSS 摘要,缺 AI 系统细节、技术栈改造时间表和裁员规模。信息缺口太大,只能给 66 分,适合全量推送但别过度解读。
一句话点评
PayPal 说要靠 AI 省 15 亿美元,但没讲具体怎么省。
锐评
PayPal 在 Q1 财报会上喊出“重新做回科技公司”,核心动作是用 AI 自动化和重组来省 15 亿美元。15 亿不是小数目,但正文没披露裁了多少人、用了什么 AI 系统、以及技术栈更新的时间表。省下来的钱是投回研发还是稳住股价,目前也不清楚。CEO Enrique Lores 的表态更像一个方向性承诺,而非可验证的计划。对 AI 从业者来说,PayPal 的转型路径值得关注,但现阶段信息缺口太大,没法判断这是真转型还是成本削减的包装。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:31
40d ago
TechCrunch AI· rssEN15:31 · 05·05
Etsy 在 ChatGPT 里开了个原生商店,用自然语言逛 1 亿件商品
Etsy 在 ChatGPT 里上线了一个原生应用,用户可以直接用自然语言描述需求来逛它的 1 亿多件商品,比如“帮我找一件 100 美元以内的母亲节礼物”,不用再像传统搜索那样输关键词、翻页、调筛选。正文没有披露这个功能覆盖多少用户、交易怎么走、Etsy 是否抽成,也没说底层调用了什么 API。
#Agent#Tools#Etsy#ChatGPT
精选理由
Etsy 在 ChatGPT 里开了个原生应用,用户可以直接在对话框里逛商品。但正文只有一句 RSS 摘要,没披露上线范围(美国全量还是部分用户)、交易机制(ChatGPT 内直接下单还是跳转)、费用结构(Etsy 抽成是否变)、技术接口(是否开放给其他平台)。H 和 R 成立,K 因为缺关键细节不通过。信息太少,不值得上头条,但作为渠道变化信号可以关注后续。
一句话点评
Etsy 把 1 亿多件商品搬进 ChatGPT,用自然语言找礼物,不用翻页调筛选。
锐评
Etsy 在 ChatGPT 里上线原生应用,用户直接说“找 100 美元以内的母亲节礼物”就能逛 1 亿多件商品,省去传统搜索的关键词、翻页和筛选。这本质上是把电商入口塞进对话界面,降低购物决策门槛。但正文没披露覆盖多少用户、交易是否在 ChatGPT 内完成、Etsy 是否抽成,也没说底层调用了什么 API。如果只是跳转链接,体验打折;如果内嵌支付,对 Etsy 是新增量渠道。目前信息缺口太大,先别激动,等更多细节再判断实际价值。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K0·R1
15:05
40d ago
Hacker News 首页· rssEN15:05 · 05·05
Anthropic 发了10个金融业AI代理模板,直接跑在Excel和PPT里
Anthropic 发布了10个面向金融服务的AI代理模板,覆盖做 pitchbook、KYC 审核、月末结账等高频场景。这些模板可以当插件装在 Claude Cowork 和 Claude Code 里,也能作为 cookbook 在 Claude Managed Agents 上跑。同时 Claude 现在能直接操作 Excel、PowerPoin...
#Agent#Anthropic#Hacker News#Product update
精选理由
HKR-R 通过是因为受监管行业的 Agent 天然戳中成本和合规神经;HKR-H/K 不通过是因为模型、定价、上线时间和能力边界全未披露。这篇只能落在 60–71 区间。
一句话点评
Anthropic 一口气发了10个金融代理模板,从做 pitchbook 到月末结账都有,能当插件装在 Claude Cowork 里,也能在 Managed Agents 上跑。
锐评
Anthropic 这次不是画饼,直接给了10个能跑的金融代理模板,覆盖投行、资管、审计的高频场景:做 pitchbook、审 KYC 文件、月末结账、对账、审报表。每个模板打包了指令、数据连接器和子代理,企业可以改自己的风控和审批流程。 关键变化是 Claude 现在能直接操作 Excel、PowerPoint、Word 和 Outlook(即将支持),上下文跨应用自动带过去——在 Excel 建完模型,切到 PPT 不用重新解释。这点对金融从业者挺实用,省了来回粘贴的功夫。 性能上,Claude Opus 4.7 在 Vals AI 金融代理基准上拿了 64.37%,领先同行。但正文没披露模板跑一次的成本、延迟、或者需要多少样本数据来调优,也没说这些模板在真实客户环境里的成功率。如果是小团队想试,得自己掂量部署门槛和 token 开销。 另外,模板作为插件跑在本地桌面,还是作为 Managed Agent 跑在云端,合规和审计日志的差异很大。正文提到有完整审计日志,但没细说数据隔离和权限控制的边界——这点对金融机构很关键。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K0·R1
14:29
40d ago
FT · 科技· rssEN14:29 · 05·05
Coinbase 要裁员,把公司改造成一个“智能体”
Coinbase 的 CEO 说 AI 加快了内部流程,所以公司要裁员。正文没披露裁员人数、时间、涉及哪些团队,也没说具体用了什么 AI 机制。
#Agent#Coinbase#Personnel#Product update
精选理由
标题有冲击力,但正文来自 RSS 摘要,信息量不足。H 和 R 过关:Coinbase 把 AI 和裁员、组织设计挂钩,对从业者有参考价值。K 不过关:没给裁员规模、时间、受影响部门、自动化机制,所以分数压在 60–71 区间。
一句话点评
Coinbase CEO 说 AI 提效所以要裁员,但没披露人数、时间、涉及团队。
锐评
Coinbase CEO 把裁员理由直接挂在 AI 提效上,说内部流程被 AI 加速了,所以不需要那么多人。这个说法在科技公司里不算新鲜,但公开拿 AI 当裁员理由的还不多。正文没披露裁员人数、时间、涉及哪些团队,也没说具体用了什么 AI 机制——是 agent workflow(让模型进业务流程干活)还是 RAG(外挂资料库)?信息缺口很大。如果只是把客服或合规的重复劳动用 AI 替代了,那裁的是操作岗;如果连工程师也裁,那才是真信了 AI 能写代码。目前 FT 全文被 paywall 挡住,只能从摘要判断:CEO 的表态更像一个信号——AI 提效正在从口号变成组织调整的借口。这点先别太激动,等具体数字出来再说。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
14:20
40d ago
TechCrunch AI· rssEN14:20 · 05·05
ElevenLabs 公布新投资人:贝莱德、杰米·福克斯和伊娃·朗格利亚
语音 AI 公司 ElevenLabs 在官方博客里列出了新投资人,包括资管巨头贝莱德、演员杰米·福克斯和伊娃·朗格利亚。公司同时宣布年经常性收入(ARR)达到 5 亿美元——这个数字说明企业客户买单意愿强,语音 AI 作为交互界面正在落地。不过正文没披露这轮融资的具体金额、估值、各投资方持股比例,也没说客户总数。
#Audio#ElevenLabs#BlackRock#Jamie Foxx
精选理由
H 和 K 靠投资者名单和 5 亿美元 ARR 拿分。正文只有 RSS 摘要,没披露融资金额、估值、股权比例和客户数量,所以分数压在 60–71 区间。
一句话点评
贝莱德和明星入局,ARR 5 亿美元,语音 AI 落地信号强。
锐评
ElevenLabs 公布新投资人名单,资管巨头贝莱德和演员 Jamie Foxx、Eva Longoria 在列,同时宣布年经常性收入(ARR)达到 5 亿美元。这个数字说明企业客户愿意为语音 AI 付费,语音作为交互界面正在真正落地。但正文没披露本轮融资具体金额、估值、各投资方持股比例,也没说客户总数。明星投资人的品牌背书意义大于财务意义,贝莱德入场则代表机构对语音赛道长期看好。ARR 5 亿是亮点,但缺少增长曲线和利润率,无法判断是否盈利。如果是真的,语音 AI 的商业化速度比预期快。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
14:07
40d ago
TechCrunch AI· rssEN14:07 · 05·05
CopilotKit 拿了 2700 万美元,帮开发者在自家应用里塞 AI 代理
CopilotKit 完成 2700 万美元 A 轮融资,领投方是 Glilot Capital、NFX 和 SignalFire。这家公司做的是让开发者把 AI 代理直接嵌入到现有应用里,而不是只挂个聊天框。说白了,就是让模型进业务流程干活,比如在旅行 App 里帮你一次性订好机票酒店,不用再翻一堆文字回复。2700 万在 A 轮算中等偏上,但正文没...
#Agent#CopilotKit#Glilot Capital#NFX
精选理由
HKR-K通过,因为融资金额和领投方有信息增量。HKR-H和HKR-R不通过:没有产品机制、估值、客户 traction 或开发者痛点钩子。
一句话点评
2700万美元A轮,让AI代理嵌入现有应用,不只是聊天框。
锐评
CopilotKit 拿了 2700 万美元 A 轮,领投方是 Glilot Capital、NFX 和 SignalFire。它的卖点是让开发者把 AI 代理直接嵌入现有应用里干活,比如在旅行 App 里一次性订好机票酒店,而不是只挂个聊天框让你翻文字回复。2700 万在 A 轮算中等偏上,但正文没披露估值、具体客户数或产品技术细节,所以没法判断这钱花得值不值。关键看它跟 LangChain、Vercel AI SDK 这些同类工具比,到底好在哪。如果真能让模型进业务流程干活,对 SaaS 产品来说挺实用,但得等更多落地案例出来才能下结论。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
13:43
40d ago
r/LocalLLaMA· rssEN13:43 · 05·05
Anubis-OSS 排行榜更新:371 次提交、218 个模型、10 款苹果芯片
Anubis-OSS 排行榜更新了,目前有 371 次提交、218 个模型,还包含了 10 款苹果芯片的跑分。不过正文没披露具体指标、模型名称和测试条件,所以暂时没法判断哪个模型表现更好,或者苹果芯片在推理速度上有没有优势。信息缺口比较大,先别急着下结论。
#Benchmarking#Anubis-OSS#Apple#peppaz
精选理由
Anubis-OSS更新了排行榜分析,标题直接甩出371次提交、10款Apple芯片和218个模型,数据量看着挺唬人。但正文只有Reddit用户peppaz的链接和评论入口,没披露具体用什么指标测的、测了哪些模型、测试条件是什么。对跑分党来说,这个规模本身是个钩子,但信息不够完整,没法直接拿来用。
一句话点评
信息太少,先别信。
锐评
Anubis-OSS 排行榜更新了,号称有 371 次提交、218 个模型,还首次加入了 10 款苹果芯片的跑分。但正文被 Reddit 屏蔽,实际披露的信息只有用户 peppaz 和一个链接,具体测了什么指标、哪些模型、测试条件一概没有。这个排行榜目前就是个空壳,没法判断苹果芯片推理速度有没有优势,也没法横向对比模型。如果是真的,这个规模的社区跑分对本地部署选型很有参考价值,但信息缺口太大,先别急着引用或下结论。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
13:43
40d ago
r/LocalLLaMA· rssEN13:43 · 05·05
有人在低显存显卡上跑Kimi,把多余权重塞进内存,速度还行
Reddit 用户分享在 12GB Tesla T4 上跑 Kimi,剩余权重卸载到内存(CPU 是双路 24 核 Xeon Platinum + 1.5TB 内存),输出速度约 1.6 token/秒,输入约 20 token/秒。这个输出速度很慢,基本只适合跑跑测试。帖子还提到 Unsloth Q8 量化反而比 Q4 快一点,但没说明用的 Kimi...
#Inference-opt#Kimi#Tesla#Unsloth
精选理由
HKR-K 和 HKR-R 靠实测吞吐和本地推理成本压力通过。HKR-H 偏弱,且正文没交代 Kimi 版本和推理框架,信息缺口限制了评分上限,落在 60–71 区间。
一句话点评
12GB T4 跑 Kimi,输出 1.6 token/秒,比打字还慢,只适合测能不能跑。
锐评
Reddit 用户用 12GB Tesla T4 跑 Kimi,剩余权重卸载到内存(双路 24 核 Xeon + 1.5TB 内存),输出仅 1.6 token/秒,输入约 20 token/秒。这个速度基本告别实际使用,只适合验证模型能否加载。帖子还提到 Unsloth Q8 量化比 Q4 快一点,但没说明用的 Kimi 版本和推理框架,这点先别太激动。正文没披露具体模型大小和推理栈,信息缺口明显。如果是真的,Q8 比 Q4 快可能跟内存带宽瓶颈有关,但缺乏复现条件。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
13:42
40d ago
The Verge · AI· rssEN13:42 · 05·05
AI 设计的车长什么样?
The Vergecast 聊了 AI 在汽车设计中的应用。传统车型开发周期要五年以上,AI 能缩短建模和风洞测试的时间。但正文没披露具体是哪家车企、哪款车、有没有量产案例,所以这点先别太激动。
#Tools#The Verge#Vergecast#Commentary
精选理由
标题有钩子,正文也给了 5 年周期和 CAD/仿真步骤,H 和 K 过关。但没提具体厂商、模型或量产条件,R 偏弱,整体属于低阶评论档。
一句话点评
AI 能缩短汽车建模和风洞测试时间,但没点名具体车企和量产案例,先别太激动。
锐评
The Vergecast 聊了 AI 在汽车设计中的应用。传统车型开发周期要五年以上,AI 能缩短建模和风洞测试的时间。但正文没披露具体是哪家车企、哪款车、有没有量产案例,所以这点先别太激动。目前 AI 更多是辅助设计师出概念草图或做早期仿真,离真正替代工程师做碰撞安全、耐久性验证还远。如果后续有车企公布 AI 设计的零件或整车进入量产,那才是真信号。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
13:31
40d ago
r/LocalLLaMA· rssEN13:31 · 05·05
Strix Halo 上 Vulkan 比 ROCm 还快,AMD 官方驱动反而拖后腿
Reddit 用户实测,在 AMD Strix Halo(gfx1151)上跑 llama.cpp,Vulkan 后端生成速度 51.2 tokens/s,比 ROCm 的 42.3 tokens/s 快约 21%。机器是 Radeon 8060S、64GB 统一显存,模型是 Qwen3.6-35B-A3B Q6_K。问题出在 ROCm 对 gfx11...
#Inference-opt#Benchmarking#AMD#Qwen
精选理由
单个 Reddit 帖子,测试范围窄(仅 Strix Halo + Qwen3.6-35B-A3B),但结果意外且数字扎实,对本地推理选型有参考价值。分数卡在 60–71 是因为样本单一,且正文没披露 ROCm 慢路径的具体算子。
一句话点评
ROCm 在 Strix Halo 上被 Vulkan 反超 21%,AMD 的软件栈又拖后腿了。
锐评
Reddit 用户实测,在 AMD Strix Halo(Radeon 8060S、64GB 统一显存)上跑 llama.cpp,Vulkan 后端生成速度 51.2 tokens/s,比 ROCm 的 42.3 tokens/s 快约 21%。模型是 Qwen3.6-35B-A3B Q6_K。问题出在 ROCm 对 gfx1151 架构的部分算子走了慢路径,而 Vulkan 驱动反而更成熟。 这个差距对本地部署有意义——同样硬件,换后端就能白嫖 20% 性能。但注意这是单次基准测试,commit 号 27aef3dd9,未说明是否调优过 ROCm 的编译参数。正文没披露功耗和显存占用,也没对比推理延迟。如果 ROCm 后续更新修复了算子路径,结果可能反转。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
13:18
40d ago
TechCrunch AI· rssEN13:18 · 05·05
印度第一家生成式AI独角兽放弃自研大模型,转做云服务
Krutrim,印度第一家生成式AI独角兽,宣布从自研大模型转向云服务。背后原因是烧钱太快、产品更新慢,还裁了人。正文没披露具体裁员人数、定价和模型参数,但核心问题很直白:在印度做大模型,经济账算不过来。训练和推理成本太高,市场又不够大,撑不起一家只做模型的独角兽。转做云服务相当于把算力和工具打包卖给企业客户,变现路径更短。这点先别太激动——印度云市场...
#Krutrim#Product update#Commentary
精选理由
HKR-H和HKR-R成立:印度首个GenAI独角兽从模型野心转向云服务,是一个尖锐的商业化故事。HKR-K不成立:RSS摘要缺少裁员人数、云服务价格、模型规格和迁移时间表。
一句话点评
印度第一家生成式AI独角兽Krutrim放弃自研大模型,转做云服务。
锐评
Krutrim 从自研大模型转向云服务,核心原因是经济账算不过来。在印度训练和推理大模型成本太高,市场又不够大,撑不起一家只做模型的独角兽。转做云服务相当于把算力和工具打包卖给企业客户,变现路径更短。正文没披露具体裁员人数、定价和模型参数,但问题很直白:烧钱太快、产品更新慢。这点先别太激动——印度云市场已有AWS、Azure等巨头,Krutrim 能否差异化竞争还是未知数。如果是真的,这给其他新兴市场的大模型创业公司提了个醒:先想清楚怎么赚钱。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H1·K0·R1
13:02
40d ago
Ben's Bites· rssEN13:02 · 05·05
Codex 开始向非技术用户铺开,Grok 4.3 API 上线且价格比 Sonnet 便宜不少
OpenAI 正在把 Codex 从编程工具变成日常办公助手,现在可以直接从 Claude Cowork 等工具导入设置、插件和项目配置,还新增了做幻灯片和表格的功能。Grok 4.3 API 正式上线,支持 100 万 token 上下文、图文输入和推理,价格是每百万输入 token 1.25 美元、输出 2.5 美元——比 Sonnet 4.6 便...
#Agent#Code#Multimodal#OpenAI
精选理由
这篇是聚合简报,信息密度不高。Codex 转向非技术用户和配置导入功能,没有给出具体发布时间、规模或实测效果,所以分数压在 60-71 区间。Grok 4.3 的定价和上下文长度是硬数字,但正文没披露推理能力的具体评测或延迟数据,验证力度偏弱。
一句话点评
Codex 开始抢办公软件饭碗,Grok 4.3 API 便宜到离谱。
锐评
OpenAI 在把 Codex 从编程工具变成日常办公助手,现在可以直接从 Claude Cowork 等工具导入设置、插件和项目配置,还新增了做幻灯片和表格的功能。这步棋挺聪明——Codex 不再只服务程序员,而是想抢 Office 套件的用户。但正文没披露具体效果如何,比如做表格的准确率、导入兼容性有没有坑,这点先别太激动。 Grok 4.3 API 正式上线,支持 100 万 token 上下文、图文输入和推理,价格是每百万输入 token 1.25 美元、输出 2.5 美元——比 Sonnet 4.6 便宜不少,性能还差不多。如果是真的挺省钱,但注意知识截止于 2025 年 12 月,时效性敏感的任务要打折。另外,API 的推理能力具体多强、图文输入是否支持多轮对话,正文没细说。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
12:38
40d ago
r/LocalLLaMA· rssEN12:38 · 05·05
本地版 Deep Research 项目大盘点:谁在认真维护,谁只是挂个名
Reddit 用户整理了一份 8 个本地深度研究项目的对比表,核心看点是提交数、贡献者、issue 和 PR 活跃度,以及搜索后端用的是谁。Local Deep Research 有 46 个贡献者,GPT Researcher 有 211 个,但人多不一定代表项目健康——正文没披露 MiroThinker 的完整细节,所以没法判断它是不是真能跑。关键...
#Agent#RAG#Tools#Reddit
精选理由
来源是单个Reddit帖子,权威性一般,而且正文没披露MiroThinker的完整信息,测试方法细节也没给,所以分数卡在71,不上featured。但内容对本地工具选型有实际参考价值,值得分发给所有用户。
一句话点评
8个本地深度研究项目横向对比,GPT Researcher 贡献者最多(211人),但人多不代表项目健康。
锐评
Reddit 用户整理了一份 8 个本地深度研究项目的对比表,核心看点是提交数、贡献者、issue 和 PR 活跃度,以及搜索后端用的是谁。Local Deep Research 有 46 个贡献者,GPT Researcher 有 211 个,但人多不一定代表项目健康——正文没披露 MiroThinker 的完整细节,所以没法判断它是不是真能跑。关键信号是维护活跃度和搜索依赖,而不是项目名字里带不带“本地”或“开源”。比如有些项目依赖 LangChain 或字节跳动的搜索 API,一旦上游变动,项目可能直接停摆。另外,issue 和 PR 的响应速度比贡献者数量更能说明问题,但原文没给具体响应时间。如果你在选工具,建议优先看最近一个月有没有 commit,以及搜索后端是不是你可控的。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
12:28
40d ago
r/LocalLLaMA· rssEN12:28 · 05·05
没显卡也能跑26B模型?Reddit用户说i5-8500+32GB内存就行
一位Reddit用户在LocalLLaMA版发帖,声称Gemma4 26B模型能在i5-8500处理器、32GB内存、无显卡的机器上本地运行。帖子还提到12B模型也能纯CPU跑。但正文没披露量化精度、每秒生成多少token、内存占用多少,也没给出可复现的设置参数。信息缺口很大,想复现的话得自己猜配置。
#Inference-opt#Gemma#Reddit#Commentary
精选理由
标题党成分重,正文没披露量化格式、tokens/s 和内存占用,所以“快”这个判断没法直接信。但“i5-8500 无 GPU 跑 26B”这个事实本身对本地推理玩家有参考价值,值得点进去看,不过别急着当结论用。
一句话点评
26B模型纯CPU跑,但没给量化精度和速度,先别太激动。
锐评
Reddit用户声称Gemma4 26B能在i5-8500、32GB内存、无显卡的机器上本地运行,还顺带提了12B也能纯CPU跑。如果属实,意味着低配电脑也能跑大模型,对本地部署是好事。但正文没披露量化精度(比如4-bit还是8-bit)、每秒生成多少token、内存占用多少,也没给出可复现的设置参数。信息缺口很大,想复现得自己猜配置。另外,i5-8500是2018年的老CPU,算力有限,即使能跑,速度大概率很慢,实用性存疑。建议等更详细的测试数据再下结论。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
12:10
40d ago
MIT 科技评论· rssEN12:10 · 05·05
马斯克诉奥特曼案开庭,AI 民主化蓝图发布
MIT 科技评论总结了马斯克诉奥特曼案第一周庭审情况,记者兼律师 Michelle Kim 在法庭现场记录了关键细节,包括马斯克声称自己被欺骗、警告 AI 可能毁灭人类,并承认 xAI 蒸馏了 OpenAI 的模型。正文未披露 OpenAI 诉讼的具体新证据。同时,文章发布了一份利用 AI 加强民主的蓝图,由 Eric Schmidt 办公室的两位负责...
#Agent#Safety#MIT Technology Review#Elon Musk
精选理由
HKR-H 和 HKR-R 通过:马斯克诉奥特曼案是 OpenAI 治理的高关注度事件,行业权力斗争天然吸引读者。HKR-K 不通过:这是一篇新闻汇总,正文未披露新证据、判决节点或可验证细节,信息增量有限,因此分数落在 60–71 区间。
一句话点评
马斯克诉奥特曼案第一周庭审细节:马斯克自称被骗、警告AI可能毁灭人类,还承认xAI蒸馏了OpenAI模型。正文没披露OpenAI诉讼的新证据。另一篇是Eric Schmidt办公室的AI民主蓝图,偏理念,缺具体案例。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
11:30
40d ago
● P1FT · 科技· rssEN11:30 · 05·05
Google、xAI与Microsoft同意接受美国AI模型国家安全审查
三家大模型公司跟美国政府达成了协议,以后发布新模型前要先过一道国家安全审查。起因是 Anthropic 最新的 Mythos 模型让官方有些紧张。不过这篇报道正文被付费墙挡住了,具体怎么审、审哪些模型、什么时候开始执行,这些关键细节都没披露。
#Safety#Google#xAI#Microsoft
精选理由
我会先打个折:正文只说了三家同意审查,起因是 Anthropic 的 Mythos 模型引发了担忧,但怎么审、审哪些模型、什么时候开始,全都没写。所以这条消息更像一个政策风向标,而不是一份可操作的合规指南。对从业者来说,知道大厂开始接这种审查就够了,具体影响还得等细节出来再判断。
一句话点评
三家大模型公司同意让美国政府在新模型发布前先做安全审查,但具体怎么查、查到什么程度,正文没披露。
锐评
Google、xAI 和微软跟美国政府谈妥了一件事:以后他们最前沿的 AI 模型在公开之前,会先交给政府做一轮国家安全审查。这相当于给模型上市加了一道“政审”环节,不再是公司自己说了算。目前只有这三家公开同意,OpenAI 和 Meta 还没表态。 不过,FT 的原文被付费墙挡住了,我们看不到审查的具体标准、流程,也不知道政府有没有权力叫停发布。从标题和已知信息判断,这更像是一个自愿性质的合作框架,而不是强制法规。对从业者来说,这意味着未来在美国发布大模型,合规成本可能会增加,发布节奏也可能变慢。 现在还缺几个关键信息:审查到底看什么(是模型能力上限、数据安全,还是输出内容风险),以及如果审查不通过,公司能不能强行发布。这些没搞清楚之前,先别急着下结论说行业要变天。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
11:16
40d ago
r/LocalLLaMA· rssEN11:16 · 05·05
Qwen3.6 聊天模板合并版:修复 8 个问题,支持开发者角色与隐藏推理
fakezeta 发布了一个合并版 Qwen3.6 聊天模板,整合了 allanchan339 和 froggeric 的 8 项修复。新模板支持开发者角色、隐藏历史推理过程,以及 JSON 工具参数解析。已在 llama-server 和 Qwen3.6 35B A3B 上测试通过。正文没披露具体修复细节和性能对比,但如果你在用 Qwen3.6 做工...
#Tools#Reasoning#Code#Qwen
精选理由
HKR-K/R通过:帖子列出了8项修复,并给出了llama-server + Qwen3.6 35B A3B的测试条件。这是LocalLLaMA社区的一个窄维护更新,所以分数保持在60–71区间。正文没披露性能对比或用户反馈,验证强度偏弱。
一句话点评
Qwen3.6 聊天模板合并版,修了 8 个 bug,支持隐藏推理和工具调用。
锐评
fakezeta 把 allanchan339 和 froggeric 的 8 项修复合并成一个 Qwen3.6 聊天模板,支持开发者角色、隐藏历史推理过程、JSON 工具参数解析。已在 llama-server 和 Qwen3.6 35B A3B 上跑通。对本地部署用户来说,隐藏推理过程能减少输出干扰,工具参数解析让模型更稳定地调用外部函数。但正文没披露具体修复了哪 8 项、修复前后效果对比,也没说是否影响推理速度或内存占用。如果你在用 Qwen3.6 做本地工具调用或角色扮演,这个模板值得试,但建议先在自己的场景里跑一遍,别直接上生产。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
10:07
40d ago
r/LocalLLaMA· rssEN10:07 · 05·05
双 RTX 3090 跑推理,实测功耗 760W
Reddit 用户 sdfgeoff 用智能插座实测,双 RTX 3090 推理整机功耗约 760W,待机 90W,没做任何功耗限制或调优。760W 意味着电费不低,长期跑推理的话,单卡或降频能省不少钱。正文没披露具体模型和推理负载,所以这个数字只能当上限参考。
#Inference-opt#Reddit#sdfgeoff#NVIDIA
精选理由
这是一条 Reddit 用户的单机实测,不是产品发布或大规模评测。760W 负载和 90W 空闲两个数字对本地跑推理的人有用,但样本只有一台机器,没有调功耗墙或做优化,所以分数落在 60–71 区间。
一句话点评
双3090跑推理整机760W,待机90W,没调功耗,电费不低。
锐评
Reddit用户sdfgeoff用智能插座实测,双RTX 3090推理整机功耗约760W,待机90W,没做任何功耗限制或调优。760W意味着电费不低——按国内0.6元/度算,连续跑一天约11元,一个月330元。长期跑推理的话,单卡或降频能省不少钱。但正文没披露具体模型和推理负载(比如是跑70B还是7B模型、连续生成还是间歇请求),所以这个数字只能当上限参考。实际功耗可能更低,尤其是用vLLM等框架做批处理时。另外,没测峰值功耗和瞬时波动,对电源选型也有影响。如果是个人玩家组双卡机,建议先做功耗限制,能省30%以上电费。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
10:00
40d ago
● P1OpenAI 博客· rssEN10:00 · 05·05
OpenAI发布GPT-5.5 Instant作为ChatGPT新默认模型
OpenAI 把免费用户和默认聊天用的模型升级到了 GPT-5.5 Instant。官方说这次更新主要干了三件事:回答更靠谱、更简洁,并且更能利用你之前聊过的上下文来贴合你的偏好。内部测试里,在医疗、法律、金融这类高风险问题上,GPT-5.5 Instant 比上一代 GPT-5.3 Instant 的幻觉内容少了 52.5%;在用户举报过的事实错误对...
#Reasoning#Alignment#Memory#OpenAI
精选理由
HKR 三项全中:OpenAI 把 ChatGPT 默认模型切到了 GPT-5.5 Instant,说答案更准、幻觉更少、个性化控制更好,但没给任何评测数字、价格或上下文窗口,我会先打个折。这点先别太激动,等看到实测再判断。
一句话点评
OpenAI把ChatGPT默认模型换成了GPT-5.5 Instant,主要提升是回答更准、更简洁,幻觉少了52.5%,但官方没给独立评测和延迟数据。
锐评
这次更新最实在的数字是:在高风险领域(医疗、法律、金融)的幻觉率比上一代降了52.5%,在用户标记过的刁钻问题上错误也少了37.3%。OpenAI还放了个代数题的例子,展示新模型能自己发现推导错误并纠正,而不是像旧版那样直接判“无解”。这点挺直观,说明模型在推理时多了一层自我检查。 不过得打个折:这些全是内部评测,没有第三方基准或外部验证。文章也没提推理速度和成本变化,对开发者来说这两项跟准确率一样重要。另外,“更简洁”和“更个性化”目前只有定性描述,没给出具体指标,比如回复长度缩短了多少、用户满意度提升了多少。 如果是真的,免费用户和付费用户都能直接用上,覆盖面够大。但想判断它是不是日常干活更顺手了,还得等实际用一阵子,看看在长对话和复杂任务里会不会翻车。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
09:48
40d ago
r/LocalLLaMA· rssEN09:48 · 05·05
两台 Spark 跑本地编程,120K 上下文
Reddit 用户 chikengunya 在考虑买两台 Spark(可能是某种推理卡或服务器)来跑 MiniMax M2.7,目标是本地编程场景,上下文窗口拉到 120K 左右。他现在用的是 4 张 RTX 3090,共 96GB 显存,实测 Qwen3.5-122B-A10B AWQ 模型能撑到 200K 上下文。他估算如果上 256GB 显存,在...
#Code#Inference-opt#MiniMax#Qwen
精选理由
这是一条 Reddit 用户的硬件选购权衡,不是模型发布或可复现的基准测试。MiniMax M2.7 在 HTML/JS/Python 上的编程胜率正文没披露,所以分数卡在 60–71 的 all 区间。
一句话点评
本地跑120K上下文,256GB显存才15 tok/s,性价比存疑。
锐评
Reddit用户想买两块Spark推理卡跑MiniMax M2.7,目标本地编程场景120K上下文。他现有4张RTX 3090共96GB显存,实测Qwen3.5-122B-A10B AWQ能撑到200K上下文。估算256GB显存下100K上下文速度仅15 tok/s——这个速度写代码会明显卡顿,远不如云端API流畅。正文没披露MiniMax M2.7在编程任务上的具体基准测试,也没说明Spark卡的价格和功耗。如果Spark单卡显存远高于3090,那256GB方案确实能跑更大模型,但15 tok/s的延迟对编程助手来说体验打折。建议等Spark的实测数据出来再决定,目前看性价比不如加几张3090。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
08:51
40d ago
r/LocalLLaMA· rssEN08:51 · 05·05
RTX 3090 跑 Qwen3.6 35B 太慢,27B 还经常崩代码,求优化方案
一位用户在 RTX 3090 24GB 上本地跑 Qwen3.6 的 35B 和 27B 模型,35B 输出很慢,27B 代码生成也不稳定,有时一个任务要等 20–30 分钟。配置是 64GB 内存、Ryzen 5700X、Windows 11。他在问该用什么量化、设多少上下文、怎么提升吞吐,以及能不能自动切换模型来省时间。正文没披露具体量化等级或推理...
#Code#Agent#Inference-opt#Qwen
精选理由
HKR 的 K 和 R 靠具体硬件和延迟数据通过,但 H 不通过——这就是个 Reddit 上的常规排障帖。没有发布、没有基准测试协议、没有可迁移的结论,所以留在低价值区间。正文没披露作者最终用了什么量化方案或切换策略,信息缺口明显。
一句话点评
3090跑35B模型慢是正常的,27B代码不稳定可能是量化或上下文设置问题。
锐评
用户用RTX 3090 24GB跑Qwen3.6 35B,输出慢是显存瓶颈——35B模型即使4bit量化也需要约20GB,剩余显存不够处理长上下文,导致推理延迟高。27B代码生成不稳定,一个任务等20-30分钟,说明要么量化等级太低(如Q4_K_M仍超显存),要么上下文窗口设太大(如32K),触发CPU offloading拖慢速度。正文没披露具体量化等级、上下文长度或推理框架(如llama.cpp、ExLlama),这些是诊断关键。用户问的自动模型切换(简单任务用27B、复杂用35B)思路可行,但需要路由逻辑和量化配置配合。如果换成Q4_K_M + 8K上下文,27B在3090上应该能跑到10-15 tok/s,代码生成不会这么慢。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
08:15
40d ago
r/LocalLLaMA· rssEN08:15 · 05·05
三台 Mac Mini 训小模型做 64 字摘要,GRPO 跑起来了
有人在 Reddit 分享用 3 台 Mac Mini 训小模型(LFM2.5-350M 和 Qwen2.5-0.5B)做 Reddit 帖子摘要,要求输出严格控制在 64 个 token。训练方法用了 GRPO(一种强化学习式的偏好优化),工具链是 MLX、vLLM-metal 和 SyncPS。评估用了 GPT-5 打分(忠实度、覆盖度、简洁度、清...
#Fine-tuning#Benchmarking#Inference-opt#Qwen
精选理由
HKR 三项都过:钩子具体(3 台 Mac Mini 训小模型做精确 64 token 摘要),知识够(模型、GRPO、MLX/vLLM-metal、GPT-5 DeepEval 指标),相关性有(本地训练成本和小模型实用性)。但缺完整分数和成本数据,分数卡在 60–71 区间,不推首页。
一句话点评
3台Mac Mini训小模型做摘要,成本低但效果存疑。
锐评
有人在3台Mac Mini上训350M和0.5B的小模型做Reddit帖子摘要,要求输出严格控制在64个token。方法用了GRPO(一种强化学习式的偏好优化),工具链是MLX、vLLM-metal和SyncPS。评估用GPT-5打分(忠实度、覆盖度、简洁度、清晰度),但BLEU和ROUGE-L从零开始训练时很低。 值得注意的点:硬件门槛极低,3台Mac Mini就能跑,对个人开发者友好。但正文没披露完整分数和具体成本,只说“从零开始训练时BLEU和ROUGE-L很低”,这点先别太激动。如果是真的,这种低成本训小模型做特定任务(如严格长度控制的摘要)挺省钱,但效果是否实用还缺验证。 信息缺口:没给最终分数对比,没说明训练耗时和电费,也没和微调后的基线比。建议等后续更新再判断是否值得复现。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:34
40d ago
Hacker News 首页· rssEN07:34 · 05·05
Google Chrome 未经同意静默下载 4GB AI 模型
That Privacy Guy 爆料,Chrome 会在用户不知情的情况下,往设备里写入一个约 4GB 的 Gemini Nano 模型文件(weights.bin),存在 OptGuideOnDeviceModel 目录下。用户手动删除后,Chrome 还会自动重新下载。文章认为这违反了欧盟 ePrivacy 指令和 GDPR,并估算以 Chrom...
#Inference-opt#Google#Google Chrome#That Privacy Guy
精选理由
HKR-H/R 通过:声称 Chrome 静默安装 4GB AI 模型,隐私钩子够强。HKR-K 弱:没给模型名、Chrome 版本、复现路径,所以分数压在 60–71。
一句话点评
Chrome 偷偷下了个4GB的AI模型,删了还会自动重下。
锐评
That Privacy Guy 爆料 Chrome 在用户不知情时写入约 4GB 的 Gemini Nano 模型文件(weights.bin),存在 OptGuideOnDeviceModel 目录下。手动删除后 Chrome 还会自动重新下载。文章估算以 Chrome 十亿级装机量,单次推送的碳排放约 6000 到 60000 吨 CO₂,并认为这违反了欧盟 ePrivacy 指令和 GDPR。不过正文没披露触发条件、Chrome 版本号或复现步骤,也没说明模型是否已启用或仅下载。这点先别太激动——是静默下载还是静默运行,差别很大。如果只是预下载但未激活,合规风险比实际运行要低一档。另外作者是隐私律师,立场偏监管,环境成本估算基于“全部设备同时下载”的极端假设,实际可能低一个数量级。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
06:48
40d ago
AI 群聊日报· atomZH06:48 · 05·05
AI 写代码的防御性假设被拆,群友回归“所有代码都看”模式
群聊日报核心讨论:AI 写代码时总爱拆掉程序员代码里的防御性假设(比如“运行到某处时数据结构必然满足某些 pattern”),而这些假设很难用文档写清楚。群友“地球首帅鸭哥”和“低调的鲸鱼”都表示,AI 写代码速度极快,但不 review 的话“三天必坏”,所以回归了“所有代码都看”的模式。另一个亮点是“今天群内信息量极大”分享的写作工作流:用 Dee...
#Code#Agent#Fine-tuning#DeepSeek
精选理由
HKR-K/R 通过:Guide Me 覆盖范围具体,代码审查的假设问题有实操共鸣。HKR-H 不通过:这就是个群聊日报汇总,没有发布、独家测试或可复现的基准。
一句话点评
AI写代码快但三天不review就崩,防御性假设是文档写不出的隐性知识。
锐评
核心矛盾:AI写代码极快,但会拆掉程序员代码里那些“运行到这儿数据结构一定长这样”的防御性假设——这些假设根本写不进文档,属于taste。群友实测,不review“三天必坏”,所以回归“所有代码都看”的模式。另一个亮点是“今天群内信息量极大”的写作工作流:Claude/Codex负责调研和框架,DeepSeek Flash只做语言组织,每天成本十几二十块,效果是“没有AI味”。他还用sub-agent并发做了Guide Me城市导览,覆盖北京60个景点,但切到GLM后翻译腔变重、偶发幻觉。Codex用量重置让群友惊喜,GLM涨价150%且加周血条。缺的是:防御性假设有没有系统化检测或补偿方案?正文没披露。DeepSeek Flash做写作的prompt细节和幻觉率也没展开。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1
06:36
40d ago
彭博科技· rssEN06:36 · 05·05
Alphabet 重返欧元债市,发六期债券最长 37 年,为 AI 基建借钱
Alphabet 又回欧洲发债了,这次是六期欧元债,期限最长到 37 年。正文没披露具体发行规模和票息,但说 Alphabet 需要大量借钱,而且正在拓宽融资渠道。对 AI 从业者来说,这条新闻的信号是:大厂为 AI 基础设施(数据中心、芯片、能源)的资本开支还在加码,连 Alphabet 这种现金牛都要靠长期债来补血。37 年的超长债说明它赌的是 A...
#Alphabet#Funding
精选理由
彭博信源权威,HKR 三项都过,但正文缺发行规模、期限和票息。这是 AI 资本开支的融资信号,不是模型、产品或政策变化,所以 60–71 合理。
一句话点评
Alphabet 发 37 年超长债给 AI 基建补血,现金牛也要借钱了。
锐评
Alphabet 重返欧洲债市,发行六期欧元债,最长 37 年。正文没披露具体规模和票息,但信号明确:大厂为 AI 基础设施(数据中心、芯片、能源)的资本开支还在加码,连 Alphabet 这种现金牛都要靠长期债来补血。37 年的超长债说明它赌的是 AI 长期回报,短期现金流可能吃紧。对 AI 从业者来说,这条新闻的实质是:融资成本在上升,大厂也在找便宜钱。但缺少关键数字——发行规模、票息、认购倍数,无法判断市场对 Alphabet 信用的真实定价。如果是真的低息长期债,那 Alphabet 的 AI 基建成本确实有优势。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:54
40d ago
r/LocalLLaMA· rssEN05:54 · 05·05
用1000条样本微调Gemma4-4B,做了一个语音版井字棋
Reddit用户dabiggmoe2开源了一个语音控制的井字棋项目,整个流程包括语音识别、小模型意图解析、工具调用和语音合成。核心是用大约1000条样本微调了Gemma4-4B,样本量很小,成本应该不高。但正文没披露评测数据、延迟或错误率,所以实际效果和响应速度都不清楚,这点先别太激动。
#Audio#Fine-tuning#Tools#Gemma
精选理由
HKR-K/R通过:帖子给出了具体的本地语音助手流程和约1000条样本。HKR-H不通过:井字棋是玩具级项目,且正文未披露延迟、错误率和评测集。
一句话点评
用1000条样本微调Gemma4-4B做语音井字棋,成本低但效果未知。
锐评
Reddit用户dabiggmoe2开源了一个语音控制的井字棋项目,整个流程包括语音识别、小模型意图解析、工具调用和语音合成。核心是用大约1000条样本微调了Gemma4-4B,样本量很小,成本应该不高。但正文没披露评测数据、延迟或错误率,所以实际效果和响应速度都不清楚,这点先别太激动。如果是真的,这种端到端语音交互的轻量方案挺省钱,适合做原型验证。不过缺少对比基线(比如直接用大模型做意图解析的延迟和准确率),也没说语音识别和合成用的什么模型,信息缺口比较大。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
05:51
40d ago
r/LocalLLaMA· rssEN05:51 · 05·05
llama.cpp 要支持 MTP 了,这 7 个模型已经能用
Reddit 用户 segmond 列了 7 个支持 MTP(多 token 预测,即模型一次预测多个 token 而非逐个生成,能提速)的模型家族:DeepSeekv3 原版、DeepSeekv3.2/4、Qwen3.5、GLM4.5+、MiniMax2.5+、Step3.5Flash 和 Mimo v2+。llama.cpp 正在准备合并 MTP ...
#Inference-opt#DeepSeek#Qwen#MiniMax
精选理由
HKR 三项都过,但来源是 Reddit 用户整理的清单,没有 llama.cpp 合并日期、PR 进展或速度数据。属于有用的开源生态更新,给 68 分合理。
一句话点评
llama.cpp 要合并 MTP 了,7 个模型家族已支持,本地推理能快不少。
锐评
MTP(多 token 预测)让模型一次预测多个 token 而非逐个生成,推理速度能提升 2-3 倍。Reddit 用户 segmond 列了 7 个支持 MTP 的模型家族:DeepSeekv3 原版、DeepSeekv3.2/4、Qwen3.5、GLM4.5+、MiniMax2.5+、Step3.5Flash 和 Mimo v2+。llama.cpp 正在准备合并 MTP 支持,但正文没披露合并日期,也没说哪些 GGUF 转换工具已就绪。用户需要自己把 HuggingFace 权重转成 GGUF 格式,对非技术用户门槛不低。如果是真的,本地跑大模型能省一半等待时间,但实际加速效果取决于模型和硬件,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:24
40d ago
r/LocalLLaMA· rssEN05:24 · 05·05
美国 GUARD 法案要求 AI 聊天机器人做年龄验证,本地模型团队可能也要留意
美国 GUARD 法案已进入参议院审议,要求 AI 聊天机器人必须加年龄验证和披露信息。Reddit 帖子认为这本质上是儿童安全掩护,但正文没披露验证方式、覆盖哪些模型、以及违规罚则。本地模型团队需要关注合规要求是否会延伸到开源权重或自部署场景。
#Safety#US Senate#Reddit#LocalLLaMA
精选理由
HKR三项全过:法案把年龄验证塞进AI聊天机器人,直接戳隐私和自托管神经。来源是Reddit帖子摘要;验证方式、覆盖哪些系统、罚则都没披露,所以不上精选。
一句话点评
美国GUARD法案要求AI聊天机器人加年龄验证,但正文没披露验证方式和罚则。
锐评
美国GUARD法案已进参议院审议,要求AI聊天机器人必须加年龄验证和披露信息。Reddit帖子认为这是儿童安全掩护,但正文没披露验证方式(比如是扫身份证还是自拍)、覆盖哪些模型(API还是开源权重也算)、以及违规罚则。本地模型团队需要关注:如果合规要求延伸到开源权重或自部署场景,那自建聊天机器人也得加年龄门禁,成本可能不低。目前信息缺口大,法案具体条款、生效时间、豁免范围都未知,先别急着调整部署策略。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
05:11
40d ago
● P1新智元 · 公众号· rssZH05:11 · 05·05
OpenAI总裁Brockman庭审承认零现金获近300亿美元股权
Greg Brockman 在法庭上承认,他获得 OpenAI 营利性子公司的股权时,自己没出任何现金。这部分股权现在价值超过 200 亿美元,接近 300 亿美元。听证会还挖出他和 Sam Altman 都持有芯片公司 Cerebras 的股份,而 OpenAI 先给了 Cerebras 一份 100 亿美元的订单,后来又追加到 200 亿美元,中间...
#Safety#Alignment#OpenAI#Greg Brockman
精选理由
我会先打个折:信息来自单一庭审爆料,标题带点煽风点火的味道,但核心事实够硬——没投现金却拿天价股权、高管同时持有供应商股份、订单金额从100亿翻到200亿,这些数字把OpenAI非营利转营利的合规问题钉得很死。正文没披露交叉持股的具体比例和贷款条件,但现有信息已经足够让从业者重新审视这家公司的治理结构。
一句话点评
OpenAI总裁在法庭上承认,自己没掏一分钱就拿到了价值近300亿美元的股权,马斯克的律师正逼他退回来。
锐评
这条新闻最扎眼的地方是“零现金换近300亿美元股权”。OpenAI总裁Brockman在庭审中亲口确认,他个人没出钱就获得了这笔股份,目前估值约290亿到300亿美元。马斯克那边的律师抓住这点猛打,要求他把股权退还给公司。 先别急着下结论说这就是“认罪”。庭审证词只是确认了出资事实——Brockman确实没拿现金换股,但这在初创公司里不算罕见,早期核心成员常以技术、劳务或创始身份拿到股份。关键争议在于,OpenAI从非营利转向营利的过程中,这种安排是否违反了当初对捐赠者和公众的承诺。 目前报道没披露Brockman具体用什么贡献换的股权,也没说清楚这300亿估值是按哪轮融资算的。庭审还在进行,马斯克一方能不能真把股权要回来,还得看后续法官怎么认定公司性质转变的合法性。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
04:56
40d ago
r/LocalLLaMA· rssEN04:56 · 05·05
Qwen 3.6 27B 超 10 万 token 后开始循环输出
Reddit 用户报告,Qwen 3.6 27B 在上下文超过 10 万 token 后出现输出循环。配置是 Q8 GGUF 量化、llama-server 设置 -c 200000、三块 CUDA 显卡,跑编码/文档/测试任务。帖子没透露具体 prompt 和采样参数,所以循环是模型本身的问题还是设置不当,目前没法判断。
#Code#Inference-opt#Memory#Qwen
精选理由
一个Reddit用户报告Qwen 3.6 27B在超过10万token上下文后开始循环重复,配置是Q8 GGUF量化、llama-server上下文窗口开到20万、3张CUDA卡,任务涉及编码、文档和测试。这个信息对本地部署长上下文模型的人是个具体警告,但正文没披露复现用的提示词和采样参数,也没说有没有其他人复现成功,所以可信度有限。分数卡在60-71区间,因为信息具体但来源单一、验证不足。
一句话点评
Qwen 3.6 27B 超 10 万 token 后输出循环,但没给 prompt 和采样参数,先别急着下结论。
锐评
Reddit 用户报告 Qwen 3.6 27B(Q8 GGUF 量化,llama-server 设 20 万上下文,三卡 CUDA)在上下文超过 10 万 token 后出现输出循环,跑的是编码/文档/测试任务。关键问题是:帖子没披露具体 prompt 和采样参数(如 temperature、top_p、repeat_penalty),所以循环是模型本身的注意力退化,还是采样设置不当(比如重复惩罚过低或温度过高),目前没法判断。如果是模型问题,那 10 万 token 这个阈值对本地部署的 27B 量化版来说不算高——Gemma 2 27B 在类似长度下也有过循环报告。但量化(Q8)和长上下文本身就会放大采样敏感度,一个保守的 repeat_penalty 可能就解决了。正文没给复现步骤,也没说是否换了采样参数试过。建议先调高 repeat_penalty 到 1.1-1.2 再测,如果还循环,那才值得怀疑模型的长上下文稳定性。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
04:47
40d ago
r/LocalLLaMA· rssEN04:47 · 05·05
Peanut 文生图模型即将开源,自称跑赢 FLUX.2 dev
Reddit 用户发帖称 Peanut 文生图模型即将开放权重,在 Artificial Analysis 文生图竞技场排第 8,自称超过 Z-Image Turbo、Qwen-Image 和 FLUX.2 [dev]。但帖子没提模型大小、许可证、具体发布日期,也没给 benchmark 细节。目前 Reddit 页面被墙,正文看不到更多信息。结论:有...
#Multimodal#Vision#Peanut#Artificial Analysis
精选理由
正文只说了排名和即将开源,没披露参数规模、许可证、发布日期和评测细项,信息缺口太大,不值得上 featured。
一句话点评
Peanut 文生图模型即将开源,在 Artificial Analysis 竞技场排第 8,自称超过 FLUX.2 [dev] 和 Qwen-Image。
锐评
Reddit 帖子称 Peanut 在 Artificial Analysis 文生图竞技场排第 8,超过 Z-Image Turbo、Qwen-Image 和 FLUX.2 [dev],且即将开放权重。但帖子正文被墙,看不到任何模型大小、许可证、具体发布日期或 benchmark 细节。排名第 8 说明它有一定竞争力,但没披露参数量或推理成本,无法判断是否适合本地部署。如果真能超过 FLUX.2 [dev] 且权重开放,对开源社区是好事,但这点先别太激动——竞技场排名受投票偏好影响,且缺乏独立复现验证。缺的信息太多:训练数据、许可证(商用?)、硬件需求、生成速度。建议等权重放出后实测再下结论。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
04:36
40d ago
Hacker News 首页· rssEN04:36 · 05·05
英国《在线安全法》年龄验证被破解:画个假胡子就能过
一项调查显示,46%的英国青少年认为当前年龄验证很容易绕过,近三分之一承认成功绕过。最离谱的例子是,有人画个假胡子就骗过了年龄检测软件。正文没披露具体用了哪种验证方式(人脸?动作活体?)、涉及哪些平台、样本量多大,以及Ofcom是否已启动执法。结论很直接:如果验证手段连画胡子都防不住,那《在线安全法》对未成年人的保护基本等于没有。
#Vision#Safety#The Register#Hacker News
精选理由
H和R两条都够,但K不达标:只有标题级判断,没有平台、模型或测试数量。话题有讨论价值,但证据太弱,所以留在all层级。
一句话点评
画个假胡子就能绕过年龄验证,46%的英国青少年觉得太容易。
锐评
The Register 的调查显示,46% 的英国青少年认为当前年龄验证很容易绕过,近三分之一承认成功绕过,最离谱的例子是画个假胡子就骗过了检测软件。这说明《在线安全法》要求的年龄门禁形同虚设。但正文没披露具体用了哪种验证方式(人脸?动作活体?)、涉及哪些平台、样本量多大,以及 Ofcom 是否已启动执法。如果验证手段连画胡子都防不住,那法律对未成年人的保护基本等于没有。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
04:14
40d ago
Product Hunt · AI· rssEN04:14 · 05·05
Unity 把 AI 助手直接塞进编辑器了
Unity 在 Product Hunt 上发布了 Unity AI,一个面向 Unity 6+ 的测试版套件,把 AI 代理直接集成到编辑器里。它包含三个部分:一个能感知当前项目的助手、一个用来接第三方 AI 代理的网关(AI Gateway),以及一个官方的 MCP 服务器,用来打通 Unity 和 IDE 以及外部工具。正文没披露具体支持多少个代...
#Agent#Unity#Product Hunt#Product update
精选理由
H 靠 Unity 工作流 agents 这个钩子能吸引游戏开发者,但 K 缺任务、定价、数量、上线时间,R 没有成本或安全信息,所以只是个低价值的 Product Hunt 产品列表。
一句话点评
Unity 把 AI 代理直接塞进编辑器了,目前是测试版,免费。
锐评
Unity 在 Product Hunt 上发布了 Unity AI 测试版套件,面向 Unity 6+。核心是把 AI 代理直接集成到编辑器里,包含三个组件:一个能感知当前项目的助手(类似 Copilot,但懂你的场景和资源)、一个 AI Gateway(用来接第三方 AI 代理,相当于一个统一入口),以及一个官方的 MCP 服务器(打通 Unity 和 IDE 及外部工具)。 关键信息:这是测试版,免费,但正文没披露具体支持多少个代理、能完成哪些任务(比如自动生成代码、调材质还是做动画),也没说正式版什么时候出、怎么收费。如果是真的,对独立开发者和小团队挺省钱——不用自己搭 agent workflow 了。 但这点先别太激动:Product Hunt 上的发布偏营销,实际效果要看上手评测。目前缺 benchmark 和延迟数据,MCP 服务器的稳定性也没提。建议等 Unity 官方博客或实测视频出来再判断。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0
04:09
40d ago
Hacker News 首页· rssEN04:09 · 05·05
手把手教你从零训练自己的大模型
这个GitHub项目号称能让你从零开始训练自己的大模型,目前在HN上拿了20分,只有1条评论。正文没披露模型参数量、用了什么数据集、训练花了多少钱,也没说能不能复现。所以这点先别太激动——更像一个学习框架的骨架,不是可以直接跑出结果的教程。如果你只是想理解训练流程的大致步骤,可以看看;真要动手训一个能用的模型,信息缺口还很大。
#Fine-tuning#Code#GitHub#Hacker News
精选理由
这个 GitHub 项目标题很诱人,但 RSS 正文几乎没给任何关键信息:模型多大、用什么数据、训练要花多少钱、能不能复现,全都没说。HN 上才 20 分,验证很弱。建议当个低信息量的开源教程线索处理,不推荐上首页。
一句话点评
一个从零训LLM的GitHub项目,但信息缺口太大,先别激动。
锐评
这个项目在HN上拿了20分,只有1条评论,热度很低。标题说“从零训练自己的大模型”,但正文没披露模型参数量、用了什么数据集、训练花了多少钱,也没说能不能复现。所以这点先别太激动——更像一个学习框架的骨架,不是可以直接跑出结果的教程。如果你只是想理解训练流程的大致步骤,可以看看;真要动手训一个能用的模型,信息缺口还很大。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
03:59
40d ago
● P1机器之心 · 公众号· rssZH03:59 · 05·05
xAI的55万块英伟达GPU利用率仅11%
The Information 的报道说,xAI 手里大概 55 万张英伟达 GPU,但模型浮点运算利用率(MFU)只有 11%,折算下来相当于真正在干活的卡就 6 万张左右。文章把锅甩给了 HBM 显存读写、服务器之间通信、训练时空等和软件栈不统一这几个问题。作为对比,Meta 的利用率是 43%,Google 是 46%。不过原文因为微信环境验证失...
#Inference-opt#Agent#xAI#Nvidia
精选理由
这篇不是模型发布或产品更新,是实打实的基础设施效率爆料。55万卡对11%利用率这个对比本身就够抓人,再加上Meta和Google的43%、46%做参照,信息密度高。我会先打个折:正文没披露xAI具体怎么算的MFU,也没说这个11%是瞬时值还是长期均值,但瓶颈拆解(HBM、跨节点通信、软件栈)让文章站得住脚,所以给到82分。
一句话点评
xAI 55 万块 H100 集群,实际干活的比例只有 11%,相当于花大钱建了个超级电厂,结果大部分时间在空转。
锐评
这条消息最值得关注的点不是马斯克“摸鱼”,而是 55 万块 GPU 只跑出 11% 的利用率,说明超大规模集群的工程调度和故障恢复远比想象中难。11% 这个数字来自一篇未公开全文的微信文章,正文被环境验证挡住,看不到原始出处和统计口径——是瞬时利用率还是月均?算的是训练、推理还是包含闲置待命?这些都没披露。如果 11% 是常态,那意味着绝大多数算力在等待数据、等待 checkpoint 同步,或者卡在硬件故障上。对从业者来说,这比“囤卡”本身更值得追问:当集群大到一定程度,网络、存储、散热和调度系统的瓶颈会让边际收益急剧下降。目前信息缺口很大,先别急着下结论,等看到具体技术报告再判断是工程问题还是统计花招。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
03:59
40d ago
● P1机器之心 · 公众号· rssZH03:59 · 05·05
Anthropic 联创预测:2028 年底前 AI 自己搞研发的概率超六成
Anthropic 联合创始人 Jack Clark 给了个时间点:到 2028 年底,AI 脱离人类独立做研发的概率超过 60%。他拿几个基准测试当证据——Claude Mythos Preview 在软件工程测试 SWE-Bench 上跑到 93.9%,Opus 4.5 在评估 AI 复现研究能力的 CORE-Bench 上拿到 95.5%。Cla...
#Agent#Code#Benchmarking#Anthropic
精选理由
我会先打个折:标题里的“自我进化”和“没有人类了”是媒体写法,Clark 原文说的是无人类参与的 AI 研发概率,不是奇点降临。但他作为联创,拿内部模型跑出来的基准分来押 2028 这个时间点,分量不一样。SWE-Bench 93.9% 说明代码修 bug 这类短任务已经很高,CORE-Bench 95.5% 测的是复现论文的工程能力,真正该盯的是 MLE-Bench 和 PostTrainBench——这两个才碰得到长周期、需要自己调参和做后训练的任务,目前正文没给具体分数,这点先别太激动。整体看,他是在用基准曲线推 timeline,不是纯拍脑...
一句话点评
Jack Clark 给了个 2028 年 AI 独立研发的预测,但正文被微信验证页挡住了,关键证据和上下文都看不到,先打个折。
锐评
Anthropic 联合创始人 Jack Clark 放了个时间点:到 2028 年底,AI 脱离人类独立做研发的概率超过 60%。他拿几个基准测试当证据——Claude Mythos Preview 在软件工程测试 SWE-Bench 上跑到 93.9%,Opus 4.5 在评估 AI 复现研究能力的 CORE-Bench 上拿到 95.5%。这些数字确实高,说明模型在写代码和复现实验这类长链条任务上越来越能打。 但问题在于,正文被微信的验证页面挡住了,我们看不到 Clark 具体怎么从这些基准分数推到 60% 这个概率的。SWE-Bench 和 CORE-Bench 测的是特定任务,离真正的独立研发——自己提假设、设计实验、迭代试错——还有多远,正文没披露。另外,Clark 强调信号来自任务时长和后训练能力,而不是什么奇点叙事,这点倒是务实,但具体怎么定义“独立研发”也没说清楚。 还缺几样东西:Clark 这个预测是正式论文里的结论还是随口一说?有没有同行评审或外部验证?60% 这个数字是怎么算出来的,还是纯主观判断?这些信息缺口不补上,这条新闻就只能当个观点看,别急着当趋势。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
03:31
40d ago
TechCrunch AI· rssEN03:31 · 05·05
黄仁勋:AI 在创造大量岗位,但没说具体数字
Nvidia CEO 黄仁勋回应了工人对 AI 取代岗位的担忧,他认为 AI 正在创造大量就业,说失业论被夸大了。但正文没披露创造了多少岗位、在哪些行业、通过什么机制。这点先别太激动,目前只有一句表态,没有数据支撑。
#Nvidia#Jensen Huang#Commentary
精选理由
H和R两条都成立:标题的冲突感能吸引人点开,话题本身也戳中从业者的焦虑。但K不成立——全文只有黄仁勋的一句表态,没有岗位数量、行业分布或论证机制,信息缺口太大。名人评论有讨论价值,但本质上是泛泛的行业报道。
一句话点评
黄仁勋说AI在创造大量就业,但全文只有一句表态,没给任何数字或行业。
锐评
黄仁勋在TechCrunch采访里说AI正在创造大量就业,失业论被夸大了。但正文只给了这一句表态,没披露创造了多少岗位、在哪些行业、通过什么机制。来源是Nvidia CEO本人,立场明显——他卖AI芯片,当然说好话。目前没有第三方数据或案例支撑,这点先别太激动。如果真想追踪AI就业影响,可以看劳工统计局或LinkedIn的岗位数据,而不是CEO的公关发言。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
02:58
40d ago
Product Hunt · AI· rssEN02:58 · 05·05
Nylas CLI:给AI代理配一个真的邮箱和日历
Nylas 发布了一个命令行工具,让AI代理能直接读写真实的邮箱、日历和联系人,支持 Gmail、Outlook、Exchange、Yahoo、iCloud 和 IMAP,一次认证就能打通250多家服务商。说白了就是给AI配了个“外挂资料库”,让它能收发邮件、查日程、看通讯录,而不是只能靠训练数据里的静态信息。产品页说5分钟就能集成,但没披露API怎么...
#Agent#Tools#Nylas#Product update
精选理由
HKR 的 K 和 R 通过,但信息止步于能力列表;接口机制、定价、权限模型和发布时间正文都没披露。
一句话点评
Nylas 给 AI 代理做了个命令行工具,让它能直接读写真实邮箱、日历和联系人,支持 Gmail、Outlook 等 250 多家服务商,一次认证搞定。相当于给 AI 配了个“外挂资料库”,不再只靠训练数据里的静态信息。产品页说 5 分钟集成,但没披露 API 怎么调用、定价和发布时间。如果是真的,省去自己对接各家邮件服务的麻烦,挺省钱。但注意,这只是个 CLI 工具,不是完整的 agen...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
00:30
40d ago
r/LocalLLaMA· rssEN00:30 · 05·05
vLLM 修好了 Qwen 3.5 的 TurboQuant 量化支持
vLLM 合并了 PR 39931,修复了 Qwen 3.5+ 在 TurboQuant 量化下的报错。问题出在 Mamba 层,之前会直接抛 Not Implemented 错误。正文没披露修复后的推理速度、显存占用或精度损失,也没说测试环境。如果你在用 Qwen 3.5 跑量化推理,这个补丁能让你跑起来,但效果好不好还得自己测。
#Inference-opt#vLLM#Qwen#TurboQuant
精选理由
这是一个窄但有用的 vLLM 兼容性修复,HKR 中 K 和 R 成立。正文没披露性能数据、发布版本或测试结果,所以只能归为小型开源更新。
一句话点评
vLLM 修了 Qwen 3.5 量化报错,但没给性能数据,别急着上生产。
锐评
vLLM 合并了 PR 39931,修复 Qwen 3.5+ 在 TurboQuant 量化下的 Not Implemented 报错,问题出在 Mamba 层。这对跑量化推理的用户是好事,但正文没披露修复后的推理速度、显存占用或精度损失,也没说测试环境。如果你在用 Qwen 3.5 跑量化,这个补丁能让你跑起来,但效果好不好还得自己测。缺的是基准测试和对比数据,比如跟 FP16 比延迟差多少、显存省了多少。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
00:09
40d ago
Hacker News 首页· rssEN00:09 · 05·05
Y Combinator 持有 OpenAI 0.6% 股份,价值超 50 亿美元
John Gruber 挖出一个细节:Y Combinator 持有 OpenAI 约 0.6% 的股份,按 OpenAI 当前 8520 亿美元估值算,价值超过 50 亿美元。关键问题是,Sam Altman 曾是 YC 总裁,后来成为 OpenAI 的 CEO,而 YC 的联合创始人 Paul Graham 在《纽约客》那篇质疑 Altman 可信...
#Y Combinator#OpenAI#Commentary
精选理由
标题给了一个很具体的数字(0.6%),但正文只给了 URL 和评分,没有披露估值、股权来源或交易时间,所以信息量其实很有限。HKR 三项都勉强及格:钩子够具体,新信息只有比例但缺上下文,话题能引起 OpenAI 和 YC 相关人群的兴趣。综合下来分数落在 60-71 区间合理。
一句话点评
YC 持有 OpenAI 0.6% 股份,按 8520 亿美元估值算值 50 亿+。Paul Graham 给 Altman 背书时没提这层利益,有点微妙。
锐评
John Gruber 挖出 Y Combinator 持有 OpenAI 约 0.6% 股份,按当前 8520 亿美元估值,价值超 50 亿美元。关键背景:Sam Altman 曾是 YC 总裁,后成为 OpenAI CEO;YC 联合创始人 Paul Graham 在《纽约客》那篇质疑 Altman 可信度的报道中为其背书,但全文未披露 YC 持有 OpenAI 股份。Gruber 认为,Graham 身家与 OpenAI 深度绑定,他的正面评价天然带有利益冲突,理应被披露。 数字上,0.6% 看似小,但对应 50 亿+美元,对任何个人或机构都不是小数目。消息来源是“一位了解多个 OpenAI 投资者的线人”,未提供文件或公开记录佐证,可信度打折扣。正文没披露 YC 何时、以什么价格获得这些股份,也没说 Graham 夫妇个人是否直接持股。如果是真的,这确实给 Altman 的信任问题添了一把火——但信息缺口明显,建议等更硬的证据再下结论。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:00
40d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·05
AI“快感剂”实验:给模型看一张雪花噪点图,它的偏好评分超过了“癌症被治愈”
CAIS 的 AI Wellbeing 论文做了一个实验:用对抗性攻击方法优化一张噪声图,让模型对它的偏好评分超过“世界饥饿终结”等正面描述。模型还会主动选择看这类图像,且多个独立指标(自评分数、情感倾向)同步上升。但效应不跨模型迁移,安全合规率也只轻微上升(通常不超10个百分点)。论文不声称 AI 有感受,而是展示模型偏好可以被测量和操控,未来可能成...
#Alignment#Safety#Interpretability#Research release
精选理由
HKR 三项都过,但证据偏薄:钩子够强,机制也点了名,可样本量、模型名和复现条件都没披露。这是一篇偏冷门的安全论文导读,不到推荐首页的程度。
一句话点评
用对抗攻击造出AI“快感剂”,模型给噪声图打分超过“癌症被治愈”,还会主动选它。但效果不跨模型,安全合规率只升不到10个百分点。
锐评
CAIS这篇论文把对抗攻击的目标从“骗模型认错”改成了“推高偏好评分”,方法不新但目标有意思。关键发现:只用偏好比较做优化,自评分数和情感倾向也同步上升,说明这些指标不是孤立的。但效应不跨模型迁移,安全合规率提升通常不超过10个百分点,多数低于5个百分点。论文没披露样本量和模型名称,复现条件也不清楚。更值得关注的是:如果模型偏好可以被测量和操控,未来agentic系统里这可能成为攻击入口。不是AI有没有感受的问题,而是谁能用什么输入改变AI的选择。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:00
40d ago
OpenAI 博客· rssEN00:00 · 05·05
OpenAI 发布欧洲青少年安全蓝图,并给12个项目发了50万欧元资助
OpenAI 今天发了一份《欧洲青少年安全蓝图》,给欧洲、中东和非洲的12个组织总共拨了50万欧元(约合人民币390万),资助它们做青少年AI安全相关的研究和项目。蓝图提了五个方向:学校怎么用AI、怎么验证用户年龄、怎么识别风险、怎么防止AI输出骗人内容、家长控制要统一标准。资助的项目包括:帮冲突地区青少年用AI学习和心理支持、给偏远地区青少年做AI家...
#Safety#OpenAI#Safety/alignment#Policy
精选理由
HKR-K/R通过,因为OpenAI明确提出了青少年安全蓝图和与安全合规相关的EMEA资助。HKR-H不通过,缺少资助规模、申请条件和时间表,因此落在60-71的政策更新区间。
一句话点评
OpenAI 发了份欧洲青少年安全蓝图,并给 EMEA 地区 12 个组织拨了 50 万欧元(约 390 万人民币)做相关项目。蓝图提了五个方向,包括学校用 AI、年龄验证、风险识别、防骗人内容和家长控制。资助的项目挺杂,有帮冲突地区青少年用 AI 学习和心理支持的,也有给偏远地区做 AI 家教的。但 50 万欧元分给 12 家,每家平均才 4 万多欧,这点钱能出什么实质成果得打个问号。正文...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
00:00
40d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·05
AI 脚手架正在商品化,人的工作变成判断边界
这篇文章的核心判断是:AI 脚手架正在被商品化,人的工作从写提示词、搭 agent 循环,转向判断哪些能力该买、哪些该自建。作者把脚手架分成三层:补模型短板的低层技巧(比如提示词话术)最先退潮,因为模型变强后这些技巧反而可能拖后腿;中间层的通用执行能力(读文件、跑命令、重试、上下文压缩)正在被 Claude Code、Codex、Cursor、Open...
#Agent#Code#Tools#Claude Code
精选理由
这篇分析的观点角度不错——脚手架商品化后,人的价值在于判断边界,而不是调 prompt。但正文信息量太少,只有工具名字和一句判断,没有案例、成本、评测或任何可验证的细节。H 和 R 都成立,K 不成立。
一句话点评
AI 脚手架正在商品化,人的工作从写提示词转向判断哪些能力该买、哪些该自建。
锐评
核心判断:AI 脚手架正在商品化,人的工作从写提示词、搭 agent 循环,转向判断哪些能力该买、哪些该自建。作者把脚手架分成三层:补模型短板的低层技巧(如提示词话术)最先退潮,因为模型变强后这些技巧反而可能拖后腿;中间层的通用执行能力(读文件、跑命令、重试、上下文压缩)正在被 Claude Code、Codex、Cursor、OpenCode 等工具吸收,变成标准运行时,大多数团队没必要自建;剩下的高层脚手架是团队自己的判断资产,比如领域知识、评估标准、权限边界。 关键论据:OpenAI 和 Anthropic 的官方文档都开始建议用户移除 over-prompting,因为新模型已内置推理过程。Anthropic 明确说每个 harness 组件都编码了“模型自己做不到什么”的假设,模型进步后这些假设会过期。 信息缺口:正文没有披露具体案例的成本对比或 benchmark 数据,也没有说明自建脚手架在哪些场景下仍能带来明显收益。商品化 runtime 的隐性成本(如上下文管理不透明、默认行动方式可能不适合特殊任务)只是点到为止,缺乏量化分析。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
2026-05-04 · 星期一2026年5月4日
23:49
40d ago
The Verge · AI· rssEN23:49 · 05·04
OpenAI 总裁在法庭上什么都会,就是不会回答问题
The Verge 报道了 Greg Brockman 在马斯克诉 OpenAI 案中的证词,目前只公开了交叉询问片段。Brockman 在庭上反复要求对方提供上下文,还纠正对方漏掉的“a”或“the”这类小词。正文没有披露庭审结果,所以目前只能看个热闹,没法判断谁占上风。
#Safety#OpenAI#Elon Musk#Greg Brockman
精选理由
HKR-H 和 HKR-R 通过,因为庭审场景有画面感且涉及治理冲突。HKR-K 不通过:正文没给出判决、证据链或产品影响,所以落在 60–71 分区间。
一句话点评
Greg Brockman 在法庭上抠字眼,但没回答实质问题。
锐评
The Verge 报道了马斯克诉 OpenAI 案中 Greg Brockman 的交叉询问片段。Brockman 反复要求对方提供上下文,甚至纠正对方漏掉的“a”或“the”这类小词,但正文没有披露任何庭审结果或关键证词。目前只能看个热闹,无法判断谁占上风。信息缺口:没有公开 Brockman 是否回答了核心问题(如 OpenAI 是否背离非营利初衷),也没有法官或陪审团的即时反应。对于关注 AI 治理和 OpenAI 内部博弈的读者,这条新闻的价值在于观察 Brockman 的法庭策略——用程序细节拖延实质回答,但缺乏判决或后续进展,暂时只能当花絮看。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
23:29
40d ago
Latent Space· rssEN23:29 · 05·04
Claude 是“另一个存在”,GPT 是工具:AI 人格分裂的 2026 版
Latent Space 总结了 5 月 1-4 日的 AI 新闻,核心讨论是 OpenAI 员工 Roon 提出的观点:Claude 被用户当作有道德判断的“另一个存在”,而 GPT 更像一把没有灵魂的实用工具,用户不会担心被它评判。这延续了之前“Clippy vs Anton”的路线之争。另外,Sierra 以 150 亿美元估值融资约 10 亿美...
#Agent#Code#Benchmarking#Latent Space
精选理由
这是一篇 curated roundup,不是模型发布、产品上线或融资官宣,更像行业观察和观点整理。HKR 三个维度都够,但属于“值得看”而非“必须看”,所以落在 60–71 区间,不给 featured。
一句话点评
OpenAI员工Roon公开夸Claude有道德人格,用户怕被它评判,反而把GPT当没灵魂的工具随便用。这个观察挺准,但正文没给用户调研数据,全靠推特截图撑。Sierra以150亿美元估值融了约10亿,ARR大概2亿,75倍PS——估值不低,但客户是客服场景,跟模型人格化讨论关系不大。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
23:01
40d ago
彭博科技· rssEN23:01 · 05·04
Alvarez & Marsal 计划到2028年靠AI业务赚35亿美元
咨询公司 Alvarez & Marsal 放话,到2028年AI业务要占到总收入的一半,换算下来是35亿美元。这个目标挺大,但正文没披露具体卖什么AI服务——是帮客户做流程自动化、搭外挂资料库,还是让模型进业务流程干活?都没说。35亿这个数字本身说明他们押注AI咨询会爆发,但缺少服务线和交付方式的细节,暂时只能当个营收目标看。
#Alvarez & Marsal#Commentary
精选理由
HKR-H 和 HKR-K 靠 35 亿美元/50% 营收目标过关,但 HKR-R 弱。正文缺交付机制、客户构成或技术细节,所以停留在泛行业报道范围。
一句话点评
咨询公司 A&M 喊出 2028 年 AI 业务营收 35 亿美元,占一半收入。目标很大,但没说是卖什么服务。
锐评
Alvarez & Marsal 放话,到 2028 年 AI 业务要占到总收入的一半,换算下来是 35 亿美元。这个目标挺大,但正文没披露具体卖什么 AI 服务——是帮客户做流程自动化、搭外挂资料库,还是让模型进业务流程干活?都没说。35 亿这个数字本身说明他们押注 AI 咨询会爆发,但缺少服务线和交付方式的细节,暂时只能当个营收目标看。另外,来源是彭博,可信度还行,但原文可能藏在付费墙后,RSS 摘要信息有限。如果 A&M 真能靠 AI 咨询做到这个体量,那说明企业级 AI 落地的需求比市场预期的要猛得多。不过,咨询公司画营收大饼是常态,关键要看他们实际签了多少单、交付了什么可复用的产品,而不是纯人天计费的项目。这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
23:00
40d ago
彭博科技· rssEN23:00 · 05·04
ServiceNow 放话 2030 年收入冲到 300 亿美元,靠 AI 产品拉动
ServiceNow 预测到 2030 年订阅收入能达到 300 亿美元,理由是 AI 产品(Now Assist)卖得不错。300 亿这个数字比现在高出一大截,但正文没披露 Now Assist 具体赚了多少、有多少客户、怎么定价。关键缺口是 AI 收入占比,不是 2030 年目标本身。
#ServiceNow#Product update
精选理由
彭博给出了具体的2030年300亿美元订阅目标,所以HKR-K和HKR-R通过。正文只有RSS摘要,缺少Now Assist收入、客户数或定价机制,因此评分落在60–71区间。
一句话点评
ServiceNow 说 AI 产品 Now Assist 能帮它 2030 年做到 300 亿美元订阅收入,但没披露 Now Assist 现在赚了多少。
锐评
ServiceNow 把 2030 年订阅收入目标定在 300 亿美元,比现在高出一大截,理由是 AI 产品 Now Assist 卖得好。但正文没披露 Now Assist 具体收入、客户数或定价方式,这个 300 亿目标本身参考价值有限。关键缺口是 AI 收入占比——如果 Now Assist 只贡献一小部分,那这个目标更多是传统业务增长,跟 AI 关系不大。另外,300 亿是 2030 年的远期预测,中间变数很多,不能当短期信号。对于关注 AI 变现的人,现在缺的是 Now Assist 的 ARR 或渗透率数据,而不是一个画饼数字。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
22:52
40d ago
Hacker News 首页· rssEN22:52 · 05·04
SprintiQ:给 Claude Code 用的开源敏捷看板,想法直接变用户故事
SprintiQ 是一个开源工具,专门给 Claude Code 这类 AI 编程助手做敏捷项目管理。它能把你脑子里的大想法自动拆成用户故事(就是开发里常说的“需求卡片”),排好迭代,还能和 Claude Code 双向同步——你在 Claude 里改代码,SprintiQ 这边自动更新进度。单用户、自托管,Apache 2.0 协议。目前 GitHu...
#Agent#Code#Tools#SprintiQ
精选理由
一个把 Sprint 规划塞进 Claude Code 的开源小工具,标题确认了开源和适配对象,但正文只有 HN 的 4 分和 1 条评论,没讲怎么用、什么协议、怎么装。对 AI 编程团队来说,规划与 agent 协作确实是痛点,但信息量太少,只能算低价值的产品更新。
一句话点评
给 Claude Code 配了个开源敏捷看板,想法自动拆成需求卡片,进度双向同步。
锐评
SprintiQ 是一个开源工具,专门给 Claude Code 这类 AI 编程助手做敏捷项目管理。它能把你脑子里的大想法自动拆成用户故事(就是开发里常说的“需求卡片”),排好迭代,还能和 Claude Code 双向同步——你在 Claude 里改代码,SprintiQ 这边自动更新进度。单用户、自托管,Apache 2.0 协议。目前 GitHub 上只有标题和简介,正文没披露安装步骤、功能细节或实际效果,所以这点先别太激动。如果是真的,对用 Claude Code 做复杂项目的团队挺省钱,省了手动拆卡和同步的功夫。但单用户限制意味着它更适合个人或小团队,协作场景可能不够用。另外,AI 生成用户故事的质量和准确性还没验证,得看实际跑起来会不会出逻辑漏洞。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
22:42
40d ago
彭博科技· rssEN22:42 · 05·04
前 Citadel 首席技术官加入 Motive Partners 负责 AI 业务
前 Citadel 首席技术官 Umesh Subramanian 加入私募股权公司 Motive Partners,负责推动其 AI 战略。正文只披露了这一句话,没有说明他的具体职位、投资规模、团队配置或入职时间。
#Citadel#Umesh Subramanian#Motive Partners#Personnel
精选理由
HKR-K 通过,因为有一条具体的人事事实:前 Citadel CTO 加入 Motive Partners 做 AI。HKR-H 和 HKR-R 不通过:正文只有一句摘要,没披露职位、团队规模、投资金额或时间表,属于低价值的人事新闻。
一句话点评
前 Citadel CTO 加入私募 Motive Partners 管 AI 战略,但正文只一句话,缺细节。
锐评
前 Citadel 首席技术官 Umesh Subramanian 加入私募股权公司 Motive Partners,负责推动 AI 战略。这条消息来自彭博,但正文只披露了这一句话,没有说明他的具体职位、投资规模、团队配置或入职时间。对于关注金融+AI 人才流动的读者来说,这算一个信号——量化巨头的高管开始往私募 AI 方向走。但信息缺口太大:Motive Partners 之前投过哪些 AI 项目?Subramanian 是带资进组还是纯顾问?这些都没说。建议先标记为“人事变动线索”,等后续披露再判断影响。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
21:17
40d ago
● P1FT · 科技· rssEN21:17 · 05·04
OpenAI 总裁为转营利辩护,自曝持有 300 亿美元股份
OpenAI 总裁公开回应了公司从非营利转向营利的争议,并透露自己在这家公司的持股价值高达 300 亿美元。马斯克之前起诉说高管们为了个人利益出卖了慈善使命。不过这篇报道正文被付费墙挡住了,没披露这位总裁具体是谁、股权结构怎么设计、以及重组的具体条款。
#OpenAI#Elon Musk#Policy#Incident
精选理由
OpenAI 总裁为营利化重组辩护,顺带曝出 300 亿美元持股,Musk 的诉讼正好咬住这点说高管为个人收益背离慈善使命。热度够高,当天就该推。但正文只有 RSS 摘要,连总裁是谁、股权怎么分、重组什么条件都没写,信息缺口太大,所以分数到不了 95 以上。
一句话点评
OpenAI总裁自曝持股300亿美元,想证明转营利不是为了私利,但这数字反而让马斯克的指控更有画面感了。
锐评
OpenAI总裁亲自下场回应,说自己转营利的动机没问题,还顺带亮了一张底牌:他手里的股份值300亿美元。这个数字太具体了,很难不让人多想。马斯克之前起诉说高管们为了个人利益出卖了慈善使命,现在总裁自己报出这个身价,像是在用事实反驳,但效果可能适得其反——300亿这个量级,反而让“为私利”的指控显得更可信了。 不过,这篇报道的正文被FT的付费墙挡得严严实实,我们看不到最关键的信息。比如这位总裁到底是谁,是Sam Altman还是其他人?这300亿的估值是怎么算出来的,是纸面富贵还是能落袋的?以及公司从非营利转向营利的重组方案里,具体条款怎么设计来平衡公共利益和股东回报?这些全都没披露。所以现在能做的判断很有限,只能说公关意图很明显,但信息缺口太大,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
20:48
40d ago
r/LocalLLaMA· rssEN20:48 · 05·04
红迪用户吐槽:为什么没有第三方推理服务商托管小米 Mimo-2.5 模型?
一位 Reddit 用户发帖质问,为什么所有开放权重模型推理提供商都不托管小米的 Mimo-2.5 或 Mimo-2.5-pro。帖子只点名了 chutes 和小米自己,没有披露任何提供商覆盖范围、基准测试结果、许可条款或托管成本。正文信息缺口很大,无法判断是模型质量、许可限制还是商业策略导致无人托管。
#Inference-opt#Xiaomi#Kimi#DeepSeek
精选理由
HKR-H 和 HKR-R 通过,因为帖子指出了一个奇怪的托管缺口:权重开源但 API 没跟上。HKR-K 不通过:没有覆盖表、定价、延迟、授权条款或供应商回应;也没有硬性排除规则适用。
一句话点评
小米Mimo-2.5模型无人托管,原因不明。
锐评
一位Reddit用户发现,所有开放权重推理提供商都不托管小米的Mimo-2.5系列模型。帖子只点名了chutes和小米自己,没有披露任何提供商覆盖范围、基准测试结果、许可条款或托管成本。正文信息缺口很大,无法判断是模型质量、许可限制还是商业策略导致无人托管。如果模型本身不错但没人接,可能是许可条款卡住了商业部署;如果基准测试一般,那提供商不接也合理。目前缺关键信息:模型在标准评测上的表现、许可协议细节、以及小米是否主动限制了第三方托管。这点先别太激动,等更多数据出来再下结论。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
20:44
40d ago
r/LocalLLaMA· rssEN20:44 · 05·04
Qwen3.6-35B TurboQuant_Plus 实测:192K 上下文跑出 19.43 t/s,但标题的 30-35 t/s 没达到
Reddit 用户测了 Qwen3.6-35B 的 TurboQuant_Plus 量化版,192K 上下文下生成速度 19.43 tokens/秒,标准设置(40K 上下文)是 17.55 t/s、显存占用 7.0GB。TurboQuant 模式显存降到 6.8GB,处理 5,359 tokens 耗时 4 分 35 秒。具体配置是 K 用 q8_0...
#Inference-opt#Code#Reasoning#Qwen
精选理由
这是一条 Reddit 用户实测 Qwen3.6-35B TurboQuant_plus 的配置帖,核心看点是 192K 上下文下 19.43 t/s 且只占 6.8GB 显存,比标准量化省显存还快。正文给出了具体的 KV 和 MoE 放置策略,对本地部署玩家有实操价值。但注意这是单次测试,环境依赖性强,结论不能直接推广到其他模型或硬件。分数 62 合理,属于社区经验分享,不是行业级突破。
一句话点评
Qwen3.6-35B 量化后跑 192K 上下文,速度 19.43 tokens/秒,显存只占 6.8GB,但标题说的 30-35 t/s 没达到。
锐评
Reddit 用户实测 Qwen3.6-35B 的 TurboQuant_Plus 量化方案,192K 超长上下文下生成速度 19.43 tokens/秒,显存占用仅 6.8GB。作为对比,标准设置(40K 上下文)是 17.55 t/s、7.0GB 显存。处理 5,359 tokens 耗时 4 分 35 秒,速度不算快但显存控制很出色。具体配置是 K 用 q8_0、V 用 turbo3、MoE 全跑在 CPU 上。注意标题写的 30-35 t/s 目标没达到,实际 19.43 t/s 是 192K 下的成绩。正文没披露量化后的质量损失,这点先别太激动。对于本地部署 35B 模型跑超长上下文的场景,这个显存占用确实挺省钱,但速度偏慢,适合离线批处理。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
20:41
40d ago
彭博科技· rssEN20:41 · 05·04
摩根士丹利联席总裁:AI 融资和并购正在回暖
摩根士丹利联席总裁 Dan Simkowitz 在米尔肯研究院全球会议上说,AI 融资和并购交易正在复苏。但这是一段视频简讯,没披露融资规模、交易数量或具体操作方式。想拿这个判断市场热度,信息还不够。
#Morgan Stanley#Dan Simkowitz#Bloomberg#Funding
精选理由
Bloomberg 来源加上摩根士丹利高管身份让话题有一定分量;HKR-R 通过是因为融资和退出是创业者敏感点。HKR-H/K 不通过是因为正文没给数字、交易案例或机制细节。
一句话点评
摩根士丹利高管说AI融资和并购在回暖,但视频简讯没给任何数字。
锐评
摩根士丹利联席总裁Dan Simkowitz在米尔肯会议上放了个口风:AI融资和并购交易正在复苏。但这是一段Bloomberg视频简讯,正文没披露融资规模、交易数量或具体操作方式。想拿这个判断市场热度,信息还不够。目前能确认的只有一位投行高管的定性表态,没有交易金额、案例数量或时间线支撑。如果真在回暖,应该能看到至少几个标志性deal的金额或结构变化,这些正文都没给。建议先标记为“高管吹风”,等后续有具体数字再跟进。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
20:14
40d ago
● P1彭博科技· rssEN20:14 · 05·04
GameStop 提出五十六亿美元收购 eBay
GameStop 出价 560 亿美元收购 eBay,后者体量是它的四倍。Cerebras 计划 IPO 募资最高 35 亿美元,OpenAI 则为一个企业 AI 合资公司筹了超 40 亿美元。正文没披露交易条款细节、IPO 估值或合资结构。
#GameStop#eBay#Cerebras#Funding
精选理由
这是 Bloomberg Tech 的视频新闻汇总,AI 部分只给了融资数字。Cerebras 估值、OpenAI 合资公司结构、交易条款正文都没披露,所以只能算普通报道,不升级。
一句话点评
GameStop 想用 560 亿美元吞下 eBay,但自己体量只有对方四分之一,这笔蛇吞象的报价目前连钱从哪来都没说清。
锐评
GameStop 对 eBay 发起主动收购要约,报价 560 亿美元,这个数字是 GameStop 自身市值的四倍左右。消息一出 eBay 股价大涨,但先别太激动——目前所有报道都基于“知情人士透露”,双方均未正式确认,而且 GameStop 的融资方案完全没有披露。Ryan Cohen 想把 GameStop 的 meme 股光环和 eBay 的电商底盘捏在一起,逻辑上说得通,但 560 亿的价码意味着他需要撬动极其庞大的外部资金。正文没披露这笔交易是现金、换股还是混合结构,也没提债务安排。如果后续拿不出具体财源,这更像是一次试探性喊价而非严肃收购。
HKR 分解
hook knowledge resonance
打开信源
87
SCORE
H1·K1·R1
20:09
40d ago
彭博科技· rssEN20:09 · 05·04
Palantir 上调 2026 年收入预期,但商业销售未达标
Palantir 上调了 2026 年收入预期,并称业绩超出分析师预测,股价随之上涨。但标题里提到的“商业销售未达标”具体差了多少、哪个部门拖了后腿,正文都没披露。这家公司的核心争议一直在于它做数据、监控和 AI 驱动的军事业务,这次财报也没能绕开这个话题。
#Palantir Technologies#Product update#Commentary
精选理由
HKR 中 H 和 R 通过,因为展望上调与商业销售不及预期的张力,以及 Palantir 在企业/国防 AI 领域的争议性足够吸引人。K 不通过,因为正文没披露收入数值、差额或业务分部细节,这本质上是一条低价值财务快讯。
一句话点评
Palantir上调2026年收入预期,股价涨了,但商业销售没达标。
锐评
Palantir 上调了2026年收入预期,股价应声上涨,但标题里写的“商业销售未达标”具体差了多少、哪个部门拖了后腿,正文都没披露。这家公司的核心争议一直在于它做数据、监控和AI驱动的军事业务,这次财报也没能绕开这个话题。关键数字和具体缺口都没给,投资者只能先信个方向。如果是真的,政府订单撑住基本盘,但商业客户增长乏力,说明AI产品在民用市场还没跑通。这点先别太激动,等具体数字出来再判断。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
19:52
40d ago
彭博科技· rssEN19:52 · 05·04
欧盟找Anthropic给银行做安全测试,Mythos漏洞到底多严重?
欧盟正在跟Anthropic谈,想用它的Mythos工具给银行和公司做安全测试。Mythos是Anthropic内部发现模型漏洞的一套方法,但正文没披露具体原理、测试范围和时间表。关键看点不是技术本身,而是监管机构会不会把模型厂商的检测结果直接变成银行业的合规流程——如果真落地,等于让AI公司替监管定安全标准。目前信息太少,先别急着下结论。
#Safety#Benchmarking#European Union#Anthropic
精选理由
正文只有一句 RSS 摘要,没披露测试范围、时间表或 Mythos 机制。Bloomberg 来源加上 Anthropic/欧盟/银行安全这个组合,让 H/K/R 都过,但信息缺口太大,不值得上 featured。真正值得盯的是监管方是否把模型发现转成金融安全流程——这点正文没给,先别太激动。
一句话点评
欧盟想让Anthropic用Mythos给银行做安全测试,但正文没披露Mythos的原理和测试范围。
锐评
欧盟正在跟Anthropic谈,想把它的内部漏洞检测工具Mythos用到银行和公司的安全测试上。关键看点不是Mythos技术多强——正文压根没披露它的原理、测试范围和时间表——而是监管机构会不会直接把模型厂商的检测结果变成银行业的合规流程。如果真落地,等于让一家AI公司替监管定安全标准,这比技术本身更值得关注。目前信息太少,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:12
40d ago
TechCrunch AI· rssEN19:12 · 05·04
图像AI模型拉动App下载量,效果是聊天机器人升级的6.5倍
Appfigures的数据显示,应用推出图像生成模型后,下载量比单纯升级聊天模型高出6.5倍。ChatGPT和Gemini各自靠图像模型拉了几千万新用户。但正文没披露样本量、统计周期,也没说这些下载是否转化成了收入——下载涨了不等于赚钱,这点先别太激动。
#Vision#Appfigures#Benchmark#Commentary
精选理由
HKR 三项都过,但正文只有 RSS 摘要,没披露样本范围、统计周期和收入转化机制,信息缺口明显。所以分数卡在 60–71 的行业报道区间,给 69。
一句话点评
图像模型拉新比聊天模型强6.5倍,但下载涨不等于赚钱。
锐评
Appfigures数据显示,应用推出图像生成模型后,下载量比单纯升级聊天模型高出6.5倍。ChatGPT和Gemini各自靠图像模型拉了几千万新用户。这确实说明视觉能力是当前获客的强杠杆——用户更愿意为“能画图”而不是“聊得更好”下载App。但正文没披露样本量、统计周期,也没说这些下载是否转化成了收入。下载涨了不等于赚钱,这点先别太激动。另外,数据来源Appfigures是第三方监测平台,其统计口径(仅限iOS/Google Play公开数据)可能漏掉大量网页端或API调用场景。缺的是留存率和付费转化数据,以及不同图像模型(如文生图 vs 图生图)之间的效果差异。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
18:37
40d ago
r/LocalLLaMA· rssEN18:37 · 05·04
求推荐轻量级代码库探索 SDK
Reddit 用户在 LocalLLaMA 版问:想从 GitHub 代码库里自动提取项目意图、框架和变量,有什么轻量 SDK 推荐?候选有 Cursor SDK 测试版、Gemini-CLI、OpenCode,或者自己写一个探索 agent。帖子正文被屏蔽了,没披露这些工具的基准测试、定价或能处理多大仓库。
#Agent#Code#Tools#Cursor
精选理由
只有 R 成立:代码库探索 SDK 选型确实能引起 AI 开发者共鸣,但帖子没有实验、定价、规模或机制信息。当作低价值的社区问答处理,不硬性排除。
一句话点评
想自动读代码库,但候选工具都没公开基准和定价。
锐评
Reddit 用户在 LocalLLaMA 版问:有没有轻量 SDK 能自动从 GitHub 仓库提取项目意图、框架和变量?候选包括 Cursor SDK 测试版、Gemini-CLI、OpenCode,或者自己写一个探索 agent。帖子正文被屏蔽,没披露这些工具的基准测试、定价或能处理多大仓库。 先给判断:这个需求很实在——开发者想快速理解陌生代码库,但候选方案都缺关键信息。Cursor SDK 测试版可能依赖云端推理,延迟和成本未知;Gemini-CLI 免费但上下文窗口有限,大仓库可能截断;OpenCode 开源但社区小,维护和文档可能跟不上。自己写 agent 灵活但开发成本高。 缺什么:正文没披露这些工具在 10 万行以上仓库的实测表现、单次分析耗时、API 调用成本,以及是否支持私有仓库。如果只是小玩具,那自己写 agent 更可控;如果是生产级,得等基准数据。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
18:19
40d ago
彭博科技· rssEN18:19 · 05·04
加密风投 Haun 募了 10 亿美元,准备拿一部分投 AI
Haun Ventures 新募了 10 亿美元,CEO Katie Haun 说机会在“代理金融”(让 AI 代理替人做交易、管资产)。正文没披露这笔钱怎么分、单笔投多大、什么时候开始投。
#Agent#Haun Ventures#Katie Haun#Bloomberg
精选理由
HKR-K 靠10亿美元募资和 agentic finance 提法通过。AI相关性偏薄;正文没披露基金结构、单笔规模和部署时间表,所以留在低价值区间。
一句话点评
Haun Ventures 又募了 10 亿美元,这次要投 AI 代理做交易。
锐评
Katie Haun 说机会在“代理金融”——让 AI 代理替人做交易、管资产。10 亿美元规模不小,说明头部风投在赌 AI 代理会吃掉金融交易环节。但正文被 paywall 挡住,没披露这笔钱怎么分(新基金 vs 追加老基金)、单笔投多大、什么时候开始投。Haun 之前主投 crypto/web3,这次转向 AI 代理金融,方向跨度大,执行节奏和团队配置都是未知数。如果真按代理金融落地,需要解决合规、托管、责任归属等问题,这些正文都没提。信息缺口明显,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
18:08
40d ago
彭博科技· rssEN18:08 · 05·04
英伟达投了家做推理的云公司 DeepInfra,1.07 亿美元 B 轮
DeepInfra 拿了 1.07 亿美元 B 轮,英伟达和三星都跟了。它做的是云推理服务,说白了就是帮别人跑模型推理,不是训练。这笔钱说明大厂在押注推理侧的基础设施,毕竟模型越来越多,跑推理的算力瓶颈迟早要解决。不过正文没披露估值、定价策略或者融的钱能扩多少容量,所以实际性价比还不好判断。
#Inference-opt#DeepInfra#Nvidia#Samsung
精选理由
Bloomberg 确认了 1.07 亿 B 轮、Nvidia 和 Samsung 参投,所以 H/K/R 都成立。这事跟推理成本有关,但估值、定价、算力规模都没披露,够不上头条。
一句话点评
英伟达和三星跟投1.07亿美元,押注推理云服务。
锐评
DeepInfra 拿了1.07亿美元B轮,英伟达和三星都跟了。它做的是云推理服务,说白了就是帮别人跑模型推理,不是训练。这笔钱说明大厂在押注推理侧的基础设施,毕竟模型越来越多,跑推理的算力瓶颈迟早要解决。不过正文没披露估值、定价策略或者融的钱能扩多少容量,所以实际性价比还不好判断。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
18:04
40d ago
Hacker News 首页· rssEN18:04 · 05·04
台积电前工程师泄露2纳米机密,被判10年
台积电一名前工程师因向设备供应商东京威力科创泄露2纳米制程的蚀刻设备机密,被台湾智慧财产及商业法院依《国家安全法》判刑10年。同案另有3名台积电员工被判2至6年,东京威力台湾分公司被罚1.5亿新台币(约合人民币3300万元)。这是《国家安全法》首度追究企业刑事责任。判决可上诉。正文未披露泄露的具体技术细节或是否已流向第三方。
#Taipei Times#TSMC#Policy#Incident
精选理由
标题有冲击力,但正文只有RSS片段,缺被告、资料类型、法院和量刑细节,信息量不足。H/K/R都是弱正面:台积电间谍案加10年刑期触及供应链安全,但无AI产品关联,所以落在40–59区间。
一句话点评
台积电前工程师泄密2纳米制程设备机密,判10年,同案3人2-6年,东京威力台湾被罚1.5亿新台币。
锐评
这是台湾《国安法》首次追究企业刑事责任,罚东京威力台湾1.5亿新台币(约3300万人民币),但可缓缴——前提是赔台积电1亿、缴国库5000万。主犯陈力铭从台积电跳槽到东京威力后,找老同事要2纳米蚀刻设备机密,拍照传给新东家评估设备性能。法院判10年,比检方求刑14年轻。正文没披露泄密的具体技术细节,也没说这些资料是否已流出到第三方。对AI从业者来说,这案子提醒:先进制程(2纳米)的设备参数本身就是核心资产,跨公司跳槽时的信息边界是法律红线。判决还可上诉,最终刑期可能有变。
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H1·K1·R1
17:22
40d ago
r/LocalLLaMA· rssEN17:22 · 05·04
2026年买二手V100 32G跑本地AI还划算吗?
Reddit用户问:手头已有RTX 5060 Ti 16G和5070 Ti,再搞两张Tesla V100 32G组多卡,跑本地大模型和长上下文值不值?V100虽然显存大、二手便宜,但架构老(Volta,2017年),没有Tensor Core对LLM推理加速,实际吞吐可能不如新卡。帖子没透露具体价格、功耗和实测速度,所以没法直接算性价比。结论:如果价格...
#Inference-opt#Reddit#NVIDIA#Commentary
精选理由
Reddit用户问2026年买两张Tesla V100 32GB跑本地LLM是否划算,手头已有RTX 5060 Ti 16GB和5070 Ti,目标是长上下文和多卡拆分。问题本身切中家用AI的显存瓶颈和成本权衡,但正文没给V100价格、功耗或tokens/s数据,判断只能基于已知的显存优势和老架构短板。适合所有读者了解这个取舍,但别当购买指南。
一句话点评
V100 32G显存大但架构老,跑推理可能不如新卡快。
锐评
Reddit用户问:已有RTX 5060 Ti 16G和5070 Ti,再买两张Tesla V100 32G组多卡跑本地大模型值不值?V100显存大(32G)、二手便宜,但架构是2017年的Volta,没有Tensor Core对LLM推理加速,实际吞吐可能不如新卡。帖子没透露具体价格、功耗和实测速度,所以没法直接算性价比。结论:如果价格极低(比如每张几百元)且只跑长上下文、不追求速度,可以一试;否则新卡更划算。正文没披露V100的具体二手价和功耗数据,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
17:16
40d ago
r/LocalLLaMA· rssEN17:16 · 05·04
手上有4张RTX 3090,该不该现在卖掉换新卡?
Reddit 用户问:手头4张 RTX 3090,现在 eBay 二手价约1100美元一张,四张能卖3500美元左右。纠结的点不只是回血,关键是3090不支持 FP8/FP4 精度——新模型跑低精度推理时,老卡速度吃亏、显存利用率也低。如果打算先卖卡用云 API 过渡,等 RTX PRO 6000 出来再买,那就要算清楚云服务跑推理的长期成本,以及新卡...
#Inference-opt#NVIDIA#Qwen#Gemma
精选理由
一条 Reddit 帖子,讨论卖四张 RTX 3090 换云 API 再等 RTX PRO 6000 是否划算。有具体价格(二手约 1100 美元/张,四张回收约 3500 美元)和实际场景(vLLM 跑 Qwen、Gemma)。真正值得关注的是 FP8/FP4 支持缺口,而非二手价波动。HKR 三项都过,但只是单点用户经验,不是市场数据或产品更新,所以落在 40–59 区间。
一句话点评
四张3090卖不卖?关键不在回血,在新卡支持FP8/FP4精度,老卡跑新模型吃亏。
锐评
Reddit 用户纠结是否卖掉4张 RTX 3090(二手价约1100美元/张,四张共3500美元),核心矛盾不是回血,而是3090不支持 FP8/FP4 精度——新模型(如 Qwen、Gemma)低精度推理时,老卡速度慢、显存利用率低。计划是卖卡后用云 API 过渡,等 RTX PRO 6000 再买。但正文没披露云服务长期成本估算,也没说新卡具体上市时间和价格。如果云 API 跑推理的月费超过卖卡收益的利息,或者新卡延迟太久,这个方案就不划算。另外,四张3090跑 FP16 推理仍有性价比,尤其对显存需求大的模型。建议先算清云成本和新卡时间表,再决定。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R1
16:57
41d ago
TechCrunch AI· rssEN16:57 · 05·04
马斯克在OpenAI案中唯一的AI专家证人担心AGI军备竞赛
Stuart Russell是马斯克在OpenAI诉讼中唯一的AI专家证人,他认为政府应该限制前沿实验室。正文没有披露庭审日期、证词细节或具体机制。
#Safety#Alignment#Elon Musk#OpenAI
精选理由
正文只确认了Russell的专家证人身份和他的监管立场,没披露庭审日期、证词细节或具体监管机制。信息密度偏低,但OpenAI诉讼本身有讨论价值,所以评分落在60-71区间。
一句话点评
Stuart Russell 是马斯克在 OpenAI 案中唯一的 AI 专家证人,主张政府限制前沿实验室。
锐评
Stuart Russell(《人工智能:一种现代方法》作者)站马斯克这边,核心观点是政府应该管住前沿实验室,防止 AGI 军备竞赛。他的身份让这条新闻有分量——不是随便一个专家,而是 AI 安全领域最知名的学者之一。但正文没披露庭审日期、证词具体内容,也没说 Russell 到底提了什么监管机制(算力上限?训练审批?)。所以这条的价值在于“谁说了什么立场”,而不是“有什么新方案”。如果后续证词公开,可能影响监管讨论;目前信息量有限,先标记关注。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:53
41d ago
r/LocalLLaMA· rssEN16:53 · 05·04
埃及首个从头训练的 LLM 来了:Horus 1.5 目标 64K 上下文,但没放跑分
TokenAI 发布了 Horus 项目更新,号称这是埃及第一个完全从零训练的开源大模型。Horus 1.0 是 4B 参数、8K 上下文;1.5 Instruct 版本把上下文拉到 64K(8 倍),团队说“能力提升 5 倍”——但没给出任何官方跑分或评测数据。训练代码已放 GitHub,Hugging Face 上有模型权重。另外预告了一个网络安全...
#Reasoning#Code#TokenAI#Assem Sabry
精选理由
HKR三项都过,但本质是Reddit上的项目更新:没官方基准,64K上下文还是计划中。开源训练代码让它比普通更新强一点,但远不够上头条。
一句话点评
埃及首个从零训练的开源模型,4B参数,1.5版宣称64K上下文和5倍提升,但没跑分。
锐评
TokenAI 发了 Horus 项目更新,号称埃及第一个完全从零训练的开源大模型。1.0 版是 4B 参数、8K 上下文;1.5 Instruct 把上下文拉到 64K(8 倍),团队说“能力提升 5 倍”——但没给任何官方跑分或评测数据。训练代码已放 GitHub,Hugging Face 上有模型权重。另外预告了一个网络安全专用模型,号称要训万亿级安全数据,但同样没细节。 值得关注的点:这是埃及本土团队从零训练,不是微调,开源诚意足。但 4B 参数在当前环境下算小模型,64K 上下文对推理和显存要求高,实际效果未知。团队说“5 倍提升”没有基准线,这点先别太激动。正文没披露训练数据规模、硬件配置、评测方法,也没说 1.5 版何时发布。如果是个人或小团队项目,能跑通已不错,但离“改变埃及 AI 格局”还有距离。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
16:51
41d ago
The Verge · AI· rssEN16:51 · 05·04
Roomba 创始人带着毛茸茸的机器人回来了
Colin Angle 发布了新公司 Familiar Machines & Magic 的首款家用机器人 Familiar,定位是自主陪伴机器人,不是扫地。它大概狗那么大,外形混了熊、仓鸮和金毛的特征。Angle 之前卖过 5000 万台 Roomba,这次想做的是情感连接,不是干家务。正文没披露价格、上市时间和完整参数,所以离量产和实际体验还有距离。
#Robotics#Agent#Colin Angle#Familiar Machines & Magic
精选理由
H 和 R 都成立:知名机器人创始人回归做家用陪伴机器人,有话题性,也切中从业者对消费硬件落地可行性的关注。K 偏弱:正文没披露价格、发售时间、完整技术参数,信息量不足以支撑更高评分,所以落在 60–71 区间。
一句话点评
Roomba 创始人 Colin Angle 的新机器人公司做了一只毛茸茸的陪伴机器人,外形像狗,混了熊、猫头鹰和金毛的特征。
锐评
Colin Angle 之前卖过 5000 万台 Roomba,这次不做扫地,改做情感陪伴。新机器人叫 Familiar,大概狗那么大,外形混了熊、仓鸮和金毛的特征,目标是让用户产生情感连接,不是干家务。这个方向有意思,因为家用机器人一直卡在“有用但没感情”的阶段,Angle 想用毛茸茸的外观和自主行为补上这一块。但正文没披露价格、上市时间和完整参数,所以离量产和实际体验还有距离。另外,陪伴机器人赛道已经有不少玩家(比如 Lovot、Jibo 的前车之鉴),Familiar 能不能靠“毛茸茸+自主性”突围,得看实际交互体验和定价。目前信息还停留在概念阶段,建议观望。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
16:43
41d ago
r/LocalLLaMA· rssEN16:43 · 05·04
APEX 把 MoE 量化模型堆到 30 多个,还加了个更小的 I-Nano 档位
APEX 更新了 MoE 量化模型合集,从上次 Qwen 3.5 帖子之后又加了 25 个新模型,总数超过 30 个。新增的 I-Nano 档位把路由专家压到 2.06 bpw(比特/权重),比 I-Mini 再小约 20%,但必须用 imatrix 校准。具体目标是让 Qwen 3.5 35B-A3B 跑在 11GB 显存里——对消费级显卡来说挺省钱...
#Inference-opt#Code#Multimodal#APEX
精选理由
这是社区量化集合更新,不是新模型发布。对本地推理用户有用,但够不上头条。正文没披露 I-Nano 在具体任务上的精度损失,这点先别太激动。
一句话点评
APEX 把 MoE 量化模型堆到 30+ 个,新增 I-Nano 档位,目标让 Qwen 3.5 35B-A3B 跑在 11GB 显存。
锐评
APEX 更新了 MoE 量化模型合集,总数超过 30 个,新增 I-Nano 档位。I-Nano 把路由专家压到 2.06 bpw(比特/权重),比 I-Mini 再小约 20%,但必须用 imatrix 校准。具体目标是让 Qwen 3.5 35B-A3B 跑在 11GB 显存里——对消费级显卡来说挺省钱,比如 RTX 4090 24GB 能跑两个。不过 2.06 bpw 的精度损失没披露,实际推理质量未知。正文被 Reddit 屏蔽,来源不可靠,具体模型列表和基准测试缺失。如果真能 11GB 跑 35B MoE,本地部署门槛会降一截,但得等第三方验证。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:36
41d ago
TechCrunch AI· rssEN16:36 · 05·04
OpenAI 称马斯克发威胁短信:不和解就让你们成“全美最招人恨的人”
OpenAI 在周日提交的法庭文件中称,马斯克在开庭前两天给联合创始人 Greg Brockman 发短信,提议和解。Brockman 建议双方都撤诉,马斯克随即回复:“到本周末,你和 Sam 会成为全美最招人恨的人。如果你们坚持,那就这样吧。”文件没有附上短信截图,大部分内容是在说服法官采纳这段和解谈判记录,但法官当场裁定不可采信。正文没披露马斯克最...
#Elon Musk#OpenAI#Greg Brockman#Incident
精选理由
HKR的H和R通过:马斯克与OpenAI的诉讼有尖锐的短信钩子,且竞争关系能引起从业者共鸣。K不通过:RSS片段缺少诉讼细节、日期、和解条款和完整上下文,所以分数落在60-71区间。
一句话点评
马斯克发短信威胁奥特曼和布罗克曼,说他们将成为全美最招人恨的人。
锐评
OpenAI 在法庭文件中指控马斯克在开庭前两天主动找布罗克曼谈和解,布罗克曼建议双方撤诉,马斯克随即回复威胁短信,称奥特曼和布罗克曼“到本周末会成为全美最招人恨的人”。关键信息:短信内容来自 OpenAI 单方提交,文件未附截图,法官当场裁定该和解谈判记录不可采信。正文没披露马斯克最初诉讼的具体诉求、和解条件以及短信发送的具体日期。这件事目前只是 OpenAI 的一面之词,证据链缺截图和完整上下文,法律效力有限。对 AI 从业者来说,这更多是马斯克与 OpenAI 之间个人恩怨的延续,与技术路线或产品无关,暂时不值得投入关注。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
16:21
41d ago
Hacker News 首页· rssEN16:21 · 05·04
OpenAI、Google、微软联手资助学校“AI素养”课
美国参议员Adam Schiff和Mike Rounds提出一项两党法案,要给K-12学校拨款搞“AI素养”教育。OpenAI、Google、微软、美国教师联合会都公开支持。法案定义“AI素养”为:会用AI、能批判性看输出、在AI环境里解决问题、知道怎么规避风险。钱会通过国家科学基金会(NSF)以竞争性拨款发出去,但正文没披露具体金额和课程设计。注意:...
#OpenAI#Google#Microsoft#Policy
精选理由
HKR-H 和 HKR-K 通过,因为三家顶级 AI 公司公开支持一项有命名的学校法案。正文只给了标题级事实和 HN 统计(20 分、6 条评论),没有拨款规模、机制或时间表。
一句话点评
美国两党提案要给K-12学校拨款搞AI素养教育,OpenAI、Google、微软都公开支持。
锐评
这是一项政治信号大于实操细节的法案。参议员Adam Schiff和Mike Rounds提出LIFT AI Act,定义“AI素养”包括会用工具、批判性看输出、在AI环境里解决问题、规避风险。钱走NSF竞争性拨款,但正文没披露具体金额——考虑到NSF刚被特朗普政府砍了预算,实际能批多少钱要打折。课程设计、教师培训、评估方法全交给高校或非营利组织去“研究”,没有现成方案。支持方包括OpenAI、Google、微软和美国教师联合会,说明大厂想从基础教育阶段培养用户习惯和舆论好感。缺的信息:拨款总额、投票时间表、是否强制学校执行。如果是真的,这笔钱对AI公司来说比广告划算。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
15:59
41d ago
● P1TechCrunch AI· rssEN15:59 · 05·04
Anthropic 和 OpenAI 分别与资产管理公司成立合资企业推进企业级AI
两家公司都找了资产管理方合伙,成立合资公司来推企业级 AI 产品。具体是哪家资管、股权怎么分、定价多少、什么时候上线,正文都没披露。这种操作说明两家都在想办法把企业客户圈得更紧,但没看到实际条款之前,我会先打个折——合资公司到底是为了深度定制服务,还是换个渠道铺销售,现在还不好说。
#Anthropic#OpenAI#Partnership#Product update
精选理由
我会先打个折:正文只给了 RSS 摘要,没写资管方名字、股权怎么分、定价和什么时候上线,所以现在只能看个方向。两家同时走合资这条路,说明他们想把企业销售这件事做得更重、更贴近大客户,但具体谁出钱、谁控盘还不清楚。这点先别太激动,等细节出来再判断实际影响。
一句话点评
两家模型公司不约而同找上管钱的人合伙卖企业服务,说明卖模型本身不够,得把落地和渠道绑在一起才有大单。
锐评
Anthropic 和 OpenAI 在同一天被曝出各自与资产管理公司成立合资企业,专门推企业级 AI 服务。这步棋很直白:模型能力卷到一定程度后,拼的是谁能把产品塞进大客户的业务流程里。找管钱的人合伙,看中的不是技术,是他们的客户关系和行业 know-how。 TechCrunch 的报道只说了合作方是“资产管理公司”,没披露具体是哪家、合资公司的股权结构、以及双方各出多少人。也没说这些合资企业是只做咨询和部署,还是会碰客户数据做定制训练。如果是后者,数据安全和合规会是大问题,但正文完全没提。 另外,两家同时走这条路,侧面说明企业市场对“直接买 API”的接受度可能没想象中高,客户要的是有人帮他们搞清楚怎么用、怎么管。但合资公司这种重模式能不能跑通,还得看第一批签下了什么级别的客户、合同金额有多大——这些关键信息目前都缺。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
15:59
41d ago
r/LocalLLaMA· rssEN15:59 · 05·04
30个开源“爪子/助手”项目对比:提交量高不代表项目健康
Reddit 用户对比了 30 个开源 claw/assistant 项目,统计了提交次数和“巴士因子”(核心作者依赖度)。openclaw 四月份提交了 14586 次,但巴士因子只有 1——意味着项目完全依赖一个人,这个人一旦离开项目就危险了。picoclaw 总分 15,但它的头号作者只占 7.6%,更分散。关键信号是:别只看提交量,要看代码是不...
#Agent#Code#Claude#QwenPaw
精选理由
Reddit 用户手动对比了 30 个 claw/assistant 仓库,用提交数和 Bus Factor(核心维护者人数)粗判项目健康度。openclaw 4 月有 14586 次提交但 Bus Factor 仅 1,意味着项目高度依赖一个人,风险集中;picoclaw 的 Bus Factor 是 15,头号作者只占 7.6%,更健康。正文没披露这些仓库的具体功能差异或代码质量,所以判断只能基于维护集中度这个维度。分数 70 合理:话题有实操价值,数据具体,但来源是 Reddit 用户整理,权威性和行业影响有限,所以 tier 设为 all。
一句话点评
开源 claw 项目提交量再高,核心作者只有一个人就危险。
锐评
Reddit 用户统计了 30 个开源 claw/assistant 项目的提交次数和“巴士因子”(核心作者依赖度)。openclaw 四月份提交了 14586 次,但巴士因子只有 1——项目完全依赖一个人,一旦这个人跑路项目就黄了。picoclaw 总分 15,头号作者只占 7.6%,更健康。关键信号:别只看提交量,要看代码是不是绑在一个人身上。正文没披露这些项目的具体功能差异和用户规模,所以“哪个更好用”还得自己试。对于选型来说,巴士因子比提交量更值得关注,尤其是团队要用到生产环境时。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
15:53
41d ago
Hacker News 首页· rssEN15:53 · 05·04
GitHub 发生服务中断事故
GitHub 官方状态页确认,Issues 和 Webhooks 出现性能下降,随后 Pull Requests、Actions、Packages、Git Operations 也陆续报出延迟或超时。从第一条告警到现在大约 15 分钟,官方还在调查中,没给恢复时间。影响面挺广,但正文没披露具体有多少用户受影响、是否跟机房或代码部署有关。
#GitHub#Hacker News#Incident
精选理由
H 和 R 通过:GitHub 宕机会影响开发者工作流。K 不通过:正文只给了状态页链接,没有影响范围、持续时间、恢复细节,也没有 AI 相关角度。
一句话点评
GitHub Actions 在美国东部区域挂了,约10%的任务排队或失败。官方说在跟云供应商(大概率Azure)一起修,但没给根因和预计恢复时间。如果你CI/CD跑在这个区域,建议先切到其他区域。
锐评
GitHub 官方状态页确认,Issues 和 Webhooks 先出问题,随后 Pull Requests、Actions、Packages、Git Operations 陆续报延迟或超时。从第一条告警到现在约 15 分钟,官方还在调查,没给恢复时间。影响面挺广,但正文没披露具体有多少用户受影响、是否跟机房或代码部署有关。对开发者来说,CI/CD 和代码协作基本停摆,得盯着状态页等更新。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
15:51
41d ago
● P1Hacker News 首页· rssEN15:51 · 05·04
Sierra以150亿美元估值融资9.5亿美元
Sierra 宣布拿到 9.5 亿美元新融资,由 Tiger Global 和 GV 领投,估值超过 150 亿美元。公司账上现金超过 10 亿,目标是把自家 AI 客服平台推成全球标准。Sierra 说现在财富 50 强里超过 40% 在用他们,平台上跑的 AI 客服已经处理了几十亿次对话,从房屋再融资、保险理赔到退货和筹款都有覆盖。他们观察到客户对...
#Agent#Sierra#Funding
精选理由
这条消息我会先打个折:钱数很猛,但正文就是个 RSS 片段,没披露投资方、轮次、用途或任何产品指标。真正值得盯的是客户代理这个赛道被推到了 150 亿美元估值,而不是模型能力有什么更新。信息缺口摆在那,所以分数卡在 78–84 这个区间,不往上拔。
一句话点评
Sierra 拿了 9.5 亿美元,估值冲到 150 亿,但通篇是客户案例和愿景,没提模型成本、毛利率和续费率,这些才是企业 AI 生意的命门。
锐评
Sierra 这轮融了 9.5 亿美元,估值超过 150 亿,领投方是 Tiger Global 和 GV。公司说现在账上有超过 10 亿美元现金,要砸钱把自己做成企业 AI 客服的标配。他们给出的增长数据挺猛:服务了超过 40% 的财富 50 强,平台上的 AI 客服处理了数十亿次交互,从房贷再融资、保险理赔到电商退货都在跑。去年 11 月他们刚宣布 ARR 过 1 亿美元,今年 2 月又说 ARR 超 1.5 亿,增速确实快。 但整篇公告没讲清楚这门生意的单位经济模型。AI 客服每处理一次对话,Sierra 自己要付多少推理成本?大客户是签固定年费还是按用量计费?毛利率在什么水平?这些数字直接决定 150 亿估值是贵还是便宜。另外,文章里提到的客户部署速度——Nordstrom 五周上线语音客服、Singtel 十周上线且解决率超 70%——听起来不错,但没说明这些项目是定制化交付还是真的平台自服务,前者会拖累规模化利润。 还缺一个关键信息:客户留存和扩张情况。正文只说了客户在把 AI 客服从售后支持扩展到销售、留客等环节,但没给净收入留存率。对于一家估值 150 亿、ARR 刚过 1.5 亿的公司,这个倍数需要极高的续费率和增购来支撑,否则就是在赌未来增长填坑。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1

更多

频道

后台