ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-06-08

124 items · updated 3m ago
RSS live
2026-06-08 · 星期一2026年6月8日
23:58
4d ago
r/LocalLLaMA· rssEN23:58 · 06·08
llama.cpp 的流水线并行可能白占显存
有用户在 Reddit 上实测了 llama.cpp 的三种 Vulkan 编译版本,发现开 4 个 sched 副本时生成速度约 17.24 token/s,只开 1 个副本反而 17.26 token/s,几乎没差。但 GPU1 的计算缓冲区占用从约 1022 MB 降到了约 243 MB——显存省了四分之三,速度没掉。测试用的是 Qwen3.6-...
#Inference-opt#llama.cpp#Qwen#Commentary
精选理由
来源是Reddit上一个用户对llama.cpp Vulkan版本的单一实验,样本量小,但数据具体(速度、显存占用),结论反常识且可复现。正文没披露测试用的Qwen模型具体尺寸和上下文长度,这点先别太激动。评分卡在60-71是因为证据链窄,但信息对本地推理用户有直接参考意义。
一句话点评
llama.cpp 的 Vulkan 流水线并行开 4 个调度副本,生成速度 17.24 token/s,只开 1 个反而 17.26 token/s,几乎没差。但 GPU1 显存占用从 1022 MB 降到 243 MB,省了四分之三。测试模型是 Qwen3.6-27B,来源是 Reddit 用户实测,非官方基准。正文被屏蔽,没披露具体硬件、驱动版本和更长序列下的表现。省显存不降速这点挺实...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
23:50
4d ago
● P1FT · 科技· rssEN23:50 · 06·08
Apollo 和 Blackstone 为 Anthropic 提供 350 亿美元芯片融资
两家资管巨头 Apollo 和 Blackstone 联手给 Anthropic 筹了 350 亿美元,专门用来买芯片。这笔钱会支撑 Claude 后续的算力扩张。不过正文被付费墙挡住了,具体融资结构、是债务还是租赁、芯片由谁采购、交付时间表这些关键细节都没披露。350 亿这个数字很大,但先别急着对标英伟达的订单——没看到条款之前,不好判断实际杠杆有多高。
#Apollo#Blackstone#Anthropic#Funding
精选理由
350 亿美元买芯片,数字很大,但正文被付费墙挡了,融资结构、是债还是租赁、芯片谁采购、什么时候交付,这些关键信息都没披露。我会先打个折——没看到条款之前,不好判断实际杠杆有多高,也不急着对标英伟达的订单。所以重要性给到 88,放在 p1 里,但不到 95 以上那档。
一句话点评
350亿美元不是直接给Anthropic的现金,而是用来买芯片再租给它的融资安排,别当成估值。
锐评
Apollo和Blackstone联手搞了一笔350亿美元的芯片融资,对象是Anthropic。这笔钱不是股权投资,也不是直接打款,而是两家资管巨头出钱买芯片,再通过某种租赁或融资结构给Anthropic用。对Anthropic来说,好处是不用一次性砸几百亿买硬件,能把现金留给研发和运营;对Apollo和Blackstone来说,赌的是AI算力需求会持续涨,芯片本身是硬资产,风险相对可控。 不过目前FT的原文被付费墙挡着,Bloomberg和AIhot的转载也没披露具体条款——比如租期多长、利率多少、Anthropic拿什么做担保、芯片采购的是哪家厂商的货。350亿这个数字看着大,但如果是分多年执行、分批交付,实际每年的资金占用会小很多。另外,这种结构在航空、数据中心领域很常见,搬到AI芯片上不算新鲜,只是规模确实夸张。 还缺的关键信息:Anthropic到底需要多少算力来支撑后续模型训练和推理,这笔融资能覆盖它多长时间的算力缺口,以及如果未来芯片换代过快,资产贬值风险由谁承担。这些没搞清楚之前,先别急着说“AI军备竞赛又升级了”。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
22:59
4d ago
r/LocalLLaMA· rssEN22:59 · 06·08
OpenCode 的子代理到底有没有用?
Reddit 用户 PairOfRussels 实测发现,OpenCode 的主代理经常不调用 implementor 和 tester 这两个子代理,大约一半的预期调用都没执行。帖子没交代具体配置、模型、任务集和可复现条件,所以这个比例到底是因为设置问题还是框架本身缺陷,目前没法判断。如果你也在用 OpenCode 做多代理编程,建议先自己跑几轮看看...
#Agent#Code#Tools#opencode
精选理由
HKR-H 和 HKR-R 成立,但 HKR-K 缺少配置细节。这只是一条 LocalLLaMA 子版块的个人实测,不是发布或基准测试,所以落在 40–59 低价值区间。
一句话点评
OpenCode 的多代理编程框架被用户实测发现主代理经常不调用 implementor 和 tester 子代理,约一半预期调用没执行。帖子没交代具体配置、模型和任务集,所以这个比例是设置问题还是框架缺陷,目前没法判断。如果你也在用,建议先自己跑几轮验证。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
22:46
4d ago
● P1FT · 科技· rssEN22:46 · 06·08
法官裁定特朗普10万美元H-1B签证费属非法税收并叫停执行
一名法官裁定,特朗普提出的 10 万美元 H-1B 签证申请费属于未经授权的税收,并下令暂停执行。原文没有披露具体法院、案件名称或实施时间表,目前只能看到 FT 网站的 403 安全验证页面,正文内容无法获取。
#Donald Trump#Policy
精选理由
HKR 三项都成立:10 万美元 H-1B 签证费和法院叫停是具体、可验证的事实,跟 AI 行业招人直接相关。正文没披露具体法院、案件名或实施时间表,也缺少对行业影响的量化分析或上诉细节,所以分数留在 72–77 的 featured 区间是合理的。
一句话点评
联邦法官叫停了特朗普对H-1B签证收10万美元费用的政策,裁定这属于非法税收。阿拉斯加573名国际教师里341人靠这个签证,这判决直接救了当地学校的急。
锐评
这条新闻的核心是:法官认为总统绕开国会,用行政令对H-1B签证收10万美元,本质上是在变相加税,违宪了。报道里引用的数字很具体——阿拉斯加573名国际教师中,有341人持H-1B签证,说明这个政策一旦落地,当地公立教育系统会先扛不住。参议员Murkowski也出来表态,称判决是“及时雨”。 不过,这篇报道只聚焦了阿拉斯加的教育行业,正文没披露全美范围内受影响的企业和机构数量,也没提这10万美元的定价是怎么算出来的。另外,判决是初审结果,政府是否上诉、后续会不会换个名目再推类似费用,目前都还是未知数。所以,这更像是一个阶段性胜利,而不是终点。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
22:41
4d ago
● P1TechCrunch AI· rssEN22:41 · 06·08
Sam Altman旗下眼球识别公司Tools for Humanity宣布裁员
Tools for Humanity 是 Sam Altman 搞的身份验证公司,靠扫眼球来证明你是真人。现在被曝因为赚不到钱要裁员。报道没写裁多少人、营收规模和时间点,所以具体有多惨还不清楚。
#Tools for Humanity#Sam Altman#OpenAI#Personnel
精选理由
OpenAI 的 IPO 是基础模型公司进公开市场的标志性事件,而 Tools for Humanity 裁员又给 Altman 的商业版图加了点紧张感。报道没写裁多少人、营收多少、IPO 时间表,信息有缺口,但主事件的分量还是撑得起 95 分这个区间。
一句话点评
一边是 OpenAI 秘密申请上市,一边是奥特曼的眼球扫描公司裁员,这个估值 25 亿美元的项目被营收困境卡住了脖子。
锐评
这条新闻最值得看的是时间点:OpenAI 刚秘密提交 IPO 申请,奥特曼另一个项目 Tools for Humanity 就被曝裁员。两家公司没有直接股权关系,但都挂在他名下,对比太强烈了。 Tools for Humanity 做的是用虹膜扫描验证真人身份,再发自家加密货币 Worldcoin。听起来像科幻设定,实际落地一直磕磕绊绊。文章提到公司估值 25 亿美元,但“营收陷入困境”,具体亏多少、裁多少人,正文没给数字,只说“开始缩减规模”。这点信息缺口挺大,没法判断是轻度优化还是大砍业务线。 监管那边更麻烦。肯尼亚直接叫停了运营,韩国罚了 83 万美元,原因是隐私违规。之前他们在部分地区用价值 50 美元的 Worldcoin 换老百姓的虹膜数据,这种操作在隐私敏感地区很难不炸锅。如果核心的“扫眼球换币”模式在多个市场被堵,裁员就不是意外,而是迟早的事。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
22:39
4d ago
TechCrunch AI· rssEN22:39 · 06·08
苹果花2.5亿美元和解虚假广告案后,WWDC的AI演示看起来可信多了
苹果在2026年WWDC上展示了AI驱动的Siri、改进的搜索和图片生成功能,但整场更像在补作业而非发布新东西。TechCrunch指出,这些演示之所以显得更真实,是因为苹果刚花2.5亿美元和解了一起虚假广告诉讼——去年宣传的AI功能大部分没兑现。正文没披露和解条款细节,也没说Siri具体用了什么模型或延迟多高,但至少这次演示是真人拿着手机现场操作,而...
#Multimodal#Apple#TechCrunch#Commentary
精选理由
HKR-H和HKR-R靠苹果WWDC演示可信度+2.5亿美元和解金这条钩子撑得很强;HKR-K只靠一个数字,没有新能力、定价、机制或和解条款,所以留在all层级。
一句话点评
苹果WWDC的AI演示看着靠谱了,因为刚花2.5亿美元和解虚假广告诉讼——去年吹的功能没兑现。这次Siri、搜索、图片生成都是真人拿手机现场操作,但正文没披露Siri用的模型、延迟多高,也没说和解条款细节。补作业感强,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
22:10
4d ago
Hacker News 首页· rssEN22:10 · 06·08
Command Center:一个让 AI 写代码更靠谱的本地编辑器
Command Center 是一个主打代码质量的 AI 编程环境,核心卖点是帮你把 AI 生成的代码改到能上线。它支持同时跑 3 个功能开发、一次 review 2000 行 diff,还内置了重构、走查、提交、推送和创建 PR 这些步骤。说白了就是:AI 写代码很快,但 review 和改 bug 很慢,它想解决这个落差。工具跑在本地,代码不上传,...
#Agent#Code#Tools#Command Center
精选理由
HKR-K 和 HKR-R 通过:文章给出了具体的编程 agent 限制,并针对开发者的质量痛点。HKR-H 偏弱,且没有基准测试、采用数据或一手测试,因此落在 60–71 的小产品更新区间。
一句话点评
Command Center 是一个本地运行的 AI 编程环境,主打“把 AI 写的代码改到能上线”。它支持同时跑 3 个功能开发、一次 review 2000 行 diff,内置重构、走查、提交、推送和创建 PR 步骤。说白了就是:AI 写代码快,但 review 和改 bug 慢,它想解决这个落差。工具跑在本地,代码不上传,还送 Gemini 额度到 8 月 12 日。短评:如果团队卡在...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
21:45
4d ago
Product Hunt · AI· rssEN21:45 · 06·08
AgentOS:一个本地优先的 AI 代理控制台,帮你像管公司一样管一堆代理
AgentOS 是一个本地优先的 AI 代理控制层,用来协调多个代理、任务、工作区、审批和运行时监控。它基于 OpenClaw 做代理编排,重点放在人的操作层:结构、可见性、控制和日常执行。目标用户是独立开发者、一人公司。开源免费。正文没披露是否支持多模型、具体定价或企业级权限。
#AgentOS#OpenClaw#Kazim Akgül#Open source
精选理由
开源、本地优先的 AI 代理控制层,给独立开发者管多个代理和任务流。功能描述具体(编排、审批、监控),但正文没提是否支持多模型、具体定价或企业级权限,信息缺口明显。H 和 K 达标,R 因为受众窄且信息不全,落在 60-71 分档。
一句话点评
AgentOS 是一个本地优先的 AI 代理控制台,帮你管理多个代理、任务、工作区和审批,相当于给代理们搭了个“公司运营层”。它基于 OpenClaw 做编排,开源免费,目标用户是独立开发者和一人公司。亮点是本地优先,数据隐私好,但正文没披露是否支持多模型、具体定价或企业级权限,所以生产环境慎用。短评:一人公司管代理,本地优先挺省心,但多模型和权限细节没提,先别急着上生产。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
21:45
4d ago
r/LocalLLaMA· rssEN21:45 · 06·08
DGX Spark 上跑代码模型,实测 50 tok/s
Reddit 用户用 DGX Spark 跑 unsloth/Qwen3.6-35B-A3B-GGUF,配合 llama.cpp,实测速度约 50 tok/s。这个速度对本地推理来说算不错,但帖子没透露具体硬件设置,也没做代码能力对比,所以实际编码表现未知。
#Code#Inference-opt#Qwen#Unsloth
精选理由
HKR的K和R过关:它给出了一个一手的速度数据(50 tok/s),而且切中本地编程模型选型这个痛点。但帖子没透露硬件细节、没做基线对比、也没有可复现的基准测试,所以整体趣味性只能算中等偏低。
一句话点评
DGX Spark 跑 Qwen3.6-35B-A3B 量化版,实测 50 tok/s,本地编码够用。但帖子没透露具体硬件设置,也没做代码能力对比,实际编码表现未知。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
21:15
4d ago
TechCrunch AI· rssEN21:15 · 06·08
苹果WWDC先修bug再推AI,Siri升级但没抢C位
苹果在WWDC上先花大量篇幅修复用户吐槽已久的问题——比如Liquid Glass设计翻车、搜索不好用、文件分享老失败、健康App忽视女性用户——然后才端出AI版Siri。顺序很说明问题:苹果觉得地基没打好之前,用户不会放心把AI交给你。Siri有了独立App,但正文没披露用了什么模型、什么时候上线、哪些设备能跑。
#Agent#Apple#Product update
精选理由
苹果WWDC和AI Siri有平台级关注度,所以HKR-H和R通过。HKR-K不通过,因为正文缺模型细节、上线时间和设备条件,只能算all层级。
一句话点评
苹果WWDC先修了一堆用户吐槽的老问题(Liquid Glass翻车、搜索难用、文件分享失败),最后才端出AI版Siri。顺序很说明问题:地基没打好,用户不放心把AI交给你。Siri有了独立App,但正文没披露用了什么模型、什么时候上线、哪些设备能跑。这点先别太激动,苹果AI步子明显比对手慢。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
21:00
4d ago
持续报道 · 3d● P1彭博科技· rssEN21:00 · 06·08
SpaceX完成750亿美元IPO上市,成全球最大IPO
彭博报道称,SpaceX 如果 IPO,投资人必须把马斯克旗下多家公司之间共享资金、人才和基础设施的复杂关系算进估值。正文没披露 IPO 规模、估值或时间表,核心风险是这些公司业务高度缠绕,一家出事可能拖累整个网络。
#SpaceX#Elon Musk#Bloomberg#Funding
精选理由
HKR 三项都过,靠的是 IPO 加 AI 网络这个角度、资源共享机制和治理张力。重要性卡在 60–71 区间,因为正文没披露 IPO 规模、估值或 xAI 的新能力。
一句话点评
SpaceX IPO 认购已超 100 亿美元,但买它等于被迫押注马斯克整个 AI 版图,这点先别太激动。
锐评
SpaceX 这次 IPO 的认购额已经超过 100 亿美元,周三就截止下单,需求确实猛。但 Bloomberg 和 FT 的报道都点出一个关键问题:你买的不是一家单纯的火箭公司,而是被迫对马斯克名下互相纠缠的 AI 资产下注。xAI、特斯拉的自动驾驶、Optimus 机器人,这些业务和 SpaceX 在数据、算力、甚至资金上都有千丝万缕的联系。FT 给出的估值是 1.78 万亿美元,这个数字本身就包含了大量还没落地的“登月项目”预期。 正文没披露这 100 亿订单里机构和个人投资者的比例,也没说清楚 SpaceX 和 xAI 之间具体的财务防火墙到底有多厚。如果这些 AI 项目烧钱过快或商业化不及预期,SpaceX 的股价很难独善其身。对 AI 从业者来说,这更像是一次对“马斯克生态”的捆绑式押注,而不是对可回收火箭业务的单独定价。
HKR 分解
hook knowledge resonance
打开信源
95
SCORE
H1·K1·R1
20:32
4d ago
AI HOT 精选· aihot-apiZH20:32 · 06·08
Viggle API 上线:一秒让任意角色动起来,起价1分钱
Viggle 推出了 API,一次调用就能给任意角色添加任意动作,几秒出结果。起价0.01美元/秒(约7分钱人民币),注册送100次免费额度。可以接入 Claude、Codex 或其他智能体。正文没披露动作生成的精度或延迟上限,但价格确实低,适合做动态角色生成的小工具或游戏原型。
#Agent#Multimodal#Tools#Viggle
精选理由
这是 Viggle 自家的产品发布,没有第三方测试、没有规模数据、也没有生态影响,所以落在 60–71 的小更新区间。价格确实低,但正文没披露动作生成的精度或延迟上限,这点先别太激动。
一句话点评
Viggle API 上线,一次调用给任意角色加任意动作,几秒出结果。起价0.01美元/秒(约7分钱),注册送100次免费额度,可接入Claude、Codex等智能体。价格确实低,适合做动态角色生成的小工具或游戏原型。但正文没披露动作生成的精度或延迟上限,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
20:23
4d ago
● P1彭博科技· rssEN20:23 · 06·08
苹果因监管障碍推迟在欧盟推出 Siri AI 功能
苹果说目前没法在欧盟地区的 iPhone、Apple Watch 或 iPad 上推出 Siri AI 功能。公司把原因归结为欧盟监管机构“拒绝沟通”,但正文没披露具体是哪些法规卡住了、双方谈了什么、以及有没有预计的解决时间。
#Agent#Apple#Product update#Policy
精选理由
这条消息有冲突、有事实、有共鸣,HKR 三项全中。苹果点名欧盟监管“拒绝沟通”,但正文没写具体是哪条法规卡了、双方到底谈没谈、以及有没有解禁时间表,信息缺口很明显。我会先打个折:没有技术细节和合规路径,只能算一条有话题性的产品/政策动态,放在 75 分的中等权重位置刚好,别因为苹果牌子就往上拔。
一句话点评
苹果把 Siri AI 在欧盟跳票的锅甩给了监管,但正文被付费墙挡了,具体卡在哪条法规上没看到。
锐评
苹果说因为欧盟监管机构“拒绝沟通”,他们决定推迟在欧盟上线 Siri 的 AI 新功能。这条消息目前只有标题和一段反爬提示,文章正文被 Bloomberg 的付费墙拦住了,看不到具体细节。从标题推断,苹果应该是申请了某项豁免被拒,但被拒的理由、涉及的具体法规(比如 DMA 数字市场法案里的互操作性要求)都没披露。对从业者来说,这事的信号是:大模型落地到系统级助手时,隐私和数据使用的合规成本可能比技术本身更难搞。但没看到原文之前,没法判断是苹果在施压还是监管真的卡死了。我会先打个折,等有全文再补判断。
HKR 分解
hook knowledge resonance
打开信源
85
SCORE
H1·K1·R1
20:07
4d ago
彭博科技· rssEN20:07 · 06·08
Siri 联合创始人对苹果 AI 更新评价:不错的第一步
Siri 联合创始人 Dag Kittlaus 在 Bloomberg 采访中评价苹果 WWDC 发布的 AI 更新是“不错的第一步”。正文没披露任何具体功能参数、上线时间、模型细节或定价,所以这个评价基本只能当个态度看,没法判断苹果 AI 到底做到什么程度。
#Dag Kittlaus#Apple#Bloomberg#Product update
精选理由
HKR-R通过,因为苹果/Siri追赶的话题能引发从业者讨论。HKR-H和HKR-K不通过:除了采访里一句评价,这条没给出任何参数、机制或测试条件。
一句话点评
Siri 联合创始人说苹果 AI 更新是“不错的第一步”,但正文被 paywall 挡住,没披露任何功能参数、上线时间或定价。这个评价基本只能当个态度看,没法判断苹果 AI 到底做到什么程度。短评:联合创始人说好话,但正文被墙,信息量约等于零。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
20:04
4d ago
r/LocalLLaMA· rssEN20:04 · 06·08
GLM-5.1 和 Kimi K2.6 最便宜的本地跑法
有人在 Reddit 上问怎么用最少的钱本地跑 GLM-5.1 和 Kimi K2.6,目标速度 15-20 token/秒。候选方案包括一张 RTX 5090、512GB 内存的机器、Mac Ultra、两台 256GB 的 Mac、四台 Ryzen AI Pro 系统,以及八张 V100 32GB 显卡。正文没披露具体哪个方案最便宜,也没给实测数据...
#Inference-opt#GLM#Kimi#Reddit
精选理由
H 和 R 通过:低成本本地跑 GLM-5.1/Kimi K2.6 的硬件方案是真实痛点。K 不通过:帖子只问了问题、列了配置,没给价格、实测速度或结论,信息缺口大,且来源是单条 Reddit 帖子,只能归为 all 层级。
一句话点评
Reddit 用户问怎么最省钱本地跑 GLM-5.1 和 Kimi K2.6,目标 15-20 token/秒。候选方案从 RTX 5090 到八张 V100 32GB 都有,但正文被屏蔽了,没披露具体价格和实测。想抄作业的还得等实测对比。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
20:01
4d ago
Product Hunt · AI· rssEN20:01 · 06·08
Uiverse Design:给AI生成网站去“AI味”的开源设计系统库
Uiverse Design 本周在 Product Hunt 上线,定位是“AI优先”的设计系统库。它打包了完整的字体、间距、颜色和组件规范,每个规范都附带一个 DESIGN.md 文件,让 AI 代理(也就是写代码的模型)能照着规则生成界面。目标很直接:干掉 vibe coding 出来的那种千篇一律的紫色渐变和 emoji 风格。库本身免费,高级...
#Uiverse.io#Product Hunt#Open source
精选理由
Uiverse Design 在 Product Hunt 上线,主打“AI优先”的设计系统库,给每个规范配了 DESIGN.md 文件,让写代码的模型照着生成界面,想干掉 vibe coding 常见的紫色渐变和 emoji 风格。库免费,但正文没披露高级版定价或用户量。本质上是把现有设计系统打包成 AI 可读格式,没有新机制或数据,对从业者来说信号价值低,归为全量推送。
一句话点评
Uiverse Design 想解决 vibe coding 产出的 UI 千篇一律的问题——紫色渐变加 emoji。它打包了字体、间距、颜色等设计规范,每个规范附带一个 DESIGN.md 文件,让 AI 代理照着生成界面。库本身免费,但正文没披露包含多少套设计系统,也没说是否支持 Figma 导出。如果规范够多且能直接喂给 Cursor 这类工具,确实能省掉手动调样式的功夫。但效果取决于...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R0
19:52
4d ago
r/LocalLLaMA· rssEN19:52 · 06·08
Qwen3.6-35B-A3B工具调用实测:ByteShape vs Unsloth GGUF、KV缓存量化与长上下文表现
作者用llama.cpp和tool-eval-bench跑了144次Qwen3.6-35B-A3B的工具调用测试,对比了8种GGUF量化版本、3种KV缓存模式、2种上下文压力设置。结果:ByteShape和Unsloth的GGUF版本没有明显赢家;q8_0的KV缓存几乎不损失性能(成本很低),q4_0则明显变差;上下文压力到50%时,所有场景的工具调用...
#Tools#Benchmarking#Inference-opt#Qwen
精选理由
144 次测试、KV 缓存量化结论、50% 上下文压力下的工具调用表现,信息量够。但来源单一(Reddit),且只针对本地推理场景,所以放在 all 层级,不上 featured。
一句话点评
Qwen3.6-35B-A3B的工具调用实测:8种量化版本、3种KV缓存模式、2种上下文压力,共144次测试。结论:ByteShape和Unsloth的GGUF版本没明显赢家;q8_0的KV缓存几乎不损失性能(成本极低),q4_0明显变差;上下文压力到50%时所有场景工具调用都下降。正文没披露具体分数和测试集细节,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
19:48
4d ago
彭博科技· rssEN19:48 · 06·08
LinkedIn经济学家:劳动力市场没动力了,但别急着怪AI
LinkedIn美洲经济主管Kory Kantenga说,当前劳动力市场缺乏增长动力,现在把锅甩给AI还为时过早。Bloomberg的片段还提到,企业正在缩减入门级岗位,应届毕业生面临压力。正文没披露具体裁员数据或AI替代岗位的统计,所以这点先别太激动——到底是AI抢了饭碗,还是经济周期本身在降温,目前还说不清。
#LinkedIn#Kory Kantenga#Bloomberg#Commentary
精选理由
HKR-R通过,因为劳动力市场压力和入门级岗位触及职业风险神经。HKR-H偏弱,HKR-K缺少LinkedIn数据或量化的AI影响,所以这条仍是低信号评论。
一句话点评
LinkedIn经济学家说劳动力市场没动力了,但别急着怪AI。企业缩减入门岗,应届生压力大,可正文没给具体裁员或AI替代的数据。到底是AI抢饭碗还是经济周期降温,目前说不清。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K0·R1
19:22
4d ago
r/LocalLLaMA· rssEN19:22 · 06·08
BitNet 和三值 LLM 凉了吗?目前最大模型只有 2B,社区在等答案
Reddit 用户 3ntrope 发帖问 BitNet 和三值 LLM 是不是没下文了。目前公开的最大三值模型只有 2B 参数,没有跑过标准 benchmark,训练细节和实验室决策都没披露。正文没解释为什么没继续做大,也没说性能到底够不够用。
#Inference-opt#BitNet#Reddit#Commentary
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过:Reddit 帖子只提供了一个无来源的“2B”说法,没有实验或行业更新。这篇内容停留在低价值的 all 层级,不适合上 featured。
一句话点评
Reddit 上有人问 BitNet 和三值 LLM 是不是凉了。目前公开最大的三值模型只有 2B 参数,没跑过标准 benchmark,训练细节和实验室决策都没披露。正文没解释为什么没继续做大,也没说性能到底够不够用。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R1
19:14
4d ago
● P1Hacker News 首页· rssEN19:14 · 06·08
苹果公开新AI架构采用谷歌Gemini模型
苹果在 MacRumors 的报道里提到了一套新 AI 架构,明确说它是围绕 Google Gemini 模型搭的。正文没披露具体架构机制、用的是哪个版本的 Gemini,也没说什么时候上线。目前只有标题和 Hacker News 上的讨论链接,51 个赞、6 条评论,信息量很少,这点先别太激动。
#Apple#Google Gemini#Product update
精选理由
HKR-H 和 HKR-R 都成立:苹果用 Gemini 搭架构,是平台竞争里一个高反差信号。HKR-K 不成立,因为正文没给任何机制、版本或上线时间,信息量太少,所以只放在 featured 这一档。
一句话点评
苹果把自家AI架构押注在谷歌Gemini上,等于承认自研模型暂时跑不过,但用别人的模型怎么保证隐私是最大疑问。
锐评
苹果在WWDC 2026上公开的新AI架构,核心是把谷歌Gemini模型当成推理引擎,苹果自己在上层做界面、任务调度和隐私过滤。这基本等于苹果承认自研大模型还没到能挑大梁的程度,先拿Gemini顶上去。对用户来说,Siri和系统级AI功能终于可能变聪明了,但代价是核心推理跑在谷歌的模型上。 目前MacRumors的报道只给了架构方向,没披露具体哪些功能走本地、哪些上云端、延迟多少、成本怎么摊。苹果强调的隐私保护到底是在设备端做脱敏再发给Gemini,还是用了别的技术,正文也没说清楚。这点先别太激动,等后续技术文档出来再看苹果怎么解决“用别人模型还要保证数据不外泄”这个老问题。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K0·R1
18:50
4d ago
AI HOT 精选· aihot-apiZH18:50 · 06·08
Claude 给 Connector 开发者上了个监控仪表盘
Claude 为已上架 Connector 的开发者推出了一个公测版监控仪表盘,能看活跃用户数、工具调用次数、目录排名、错误率、延迟、健康分,以及 Claude、Claude Code 和 Cowork 三个产品层面的使用数据。说白了就是让你知道自己的插件在用户手里跑得怎么样、哪里出错了、排名高不高。正文没披露仪表盘的具体刷新频率和是否收费。
#Tools#Claude#Anthropic#Product update
精选理由
正文没披露仪表盘刷新频率和是否收费,信息缺口明显。五个指标确实能帮开发者定位问题,但整体属于小范围工具更新,没有模型能力变化,所以分数压在 60–71 区间。
一句话点评
Claude给Connector开发者上了个公测版监控仪表盘,能看活跃用户、调用次数、错误率、延迟和健康分,还按Claude、Claude Code、Cowork三个产品拆了数据。说白了就是插件跑得怎么样、哪里崩了、排名高不高,一目了然。正文没披露刷新频率和是否收费,这点先别太激动。对做Connector的团队来说,终于不用靠用户骂才知道出错了,算是个基础但必要的基建补课。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
18:50
4d ago
Product Hunt · AI· rssEN18:50 · 06·08
OLO Robotics:浏览器里控制机器人,不用装 Linux 也不用配环境
OLO Robotics 是一个网页平台,开发者直接在浏览器里就能编程和控制机器人,不用装 Linux、不用配 ROS2 环境。它内置了 ROS2 接口、机器人可视化、仿真模拟和一个 AI 写代码助手,支持 JavaScript 和 Python SDK。团队号称从想法到跑通机器人只要 30 分钟,而不是两周。目前开放注册,有免费选项。正文没披露支持哪...
#OLO Robotics#Simon I'Anson
精选理由
浏览器编程机器人这个角度比较新,正文也列了具体功能。但读者群偏 AI 应用,不是机器人方向。正文没披露支持哪些机器人硬件,这是个关键信息缺口。
一句话点评
OLO Robotics 把机器人编程搬到了浏览器里,不用装 Linux 和 ROS2,号称 30 分钟就能让机器人跑起来,而不是两周。内置了 AI 写代码助手和仿真模拟,支持 JS 和 Python。对搞机器人开发的人来说,省掉环境配置这一步确实挺省时间。但正文没披露支持哪些具体机器人型号,也没说免费版有什么限制,实际兼容性和性能还得观望。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K1·R0
18:45
4d ago
● P1TechCrunch AI· rssEN18:45 · 06·08
苹果为快捷指令应用增加AI驱动的工作流创建功能
苹果在快捷指令 App 里塞进了一个 AI 功能,你直接用大白话告诉它想干什么,它就能自动生成对应的自动化流程。目前只放出了一小段 RSS 摘要,正文没披露具体上线时间、哪个系统版本会支持、收不收费,也没说背后用的是本地模型还是云端模型。这点先别太激动,等苹果自己把细节补上再说。
#Agent#Tools#Apple#Product update
精选理由
我会先打个折:正文只放了一段 RSS 摘要,没写上线时间、系统版本、收费模式,也没说背后是本地模型还是云端模型。能确认的是苹果让快捷指令听懂人话并自动生成自动化流程,这对从业者来说是个系统级 agent 的实锤信号。但细节全缺,先别太激动,等苹果自己把机制和限制补上再判断实际分量。
一句话点评
苹果把AI塞进快捷指令,让用户用自然语言描述就能自动生成工作流,像给手机写需求文档。但正文没披露具体实现细节和准确率。
锐评
苹果在快捷指令里加AI,本质是让自动化门槛降到“说人话就能建流程”。你不用再拖拽几百个动作模块,直接告诉手机“把最近三张照片拼成一张图发到群里”,它试着帮你搭好。这思路跟 vibe coding 有点像——用自然语言驱动机器干活,但区别在于快捷指令面向的是普通用户的日常任务,不是程序员写代码。 目前信息都来自标题和摘要,TechCrunch 的正文是空的,Verge 也只是类比概念。实际体验怎么样、复杂指令能执行到什么程度、出错时怎么纠偏,这些全没披露。我会先打个折:苹果的演示向来流畅,但自然语言转工作流很容易在边界条件上翻车,比如权限请求、多步骤依赖、应用间跳转失败。 还缺三块关键信息:一是支持的应用范围和动作类型有没有缩水;二是本地执行还是依赖云端,这直接关系到隐私和延迟;三是用户能不能手动微调 AI 生成的结果,还是只能全盘接受或重来。这些没公布之前,把它当成一个方向性信号就好,别急着当生产力工具。
HKR 分解
hook knowledge resonance
打开信源
87
SCORE
H1·K1·R1
18:38
4d ago
TechCrunch AI· rssEN18:38 · 06·08
苹果 Image Playground 终于不拉胯了
TechCrunch 报道,苹果在 WWDC 2026 上宣布大幅翻新 Image Playground,这个内置在 iPhone 里的 AI 生图工具之前画质远不如竞品,基本没人用。苹果高管演示了用自然语言描述就能生成风景或多人合影,并强调通过私有云计算,照片不会被存储或分享。但正文没披露用了什么模型、定价多少、什么时候上线,也没说具体改了什么功能—...
#Vision#Apple#TechCrunch#Product update
精选理由
H 和 R 通过:苹果生图从难用到能用的反转有话题性,且踩中 AI 军备竞赛的敏感点。K 不通过:模型、定价、上线时间、实测效果全没披露,只能算一条低信息密度的产品更新,不值得高优先级推送。
一句话点评
苹果在WWDC上宣布大幅翻新Image Playground,之前画质太差基本没人用。现在能用自然语言描述生成风景或多人合影,且通过私有云计算保证照片不被存储或分享。但正文没披露用了什么模型、定价多少、什么时候上线,也没说具体改了什么功能。这点先别太激动,苹果的AI生图一向保守,追上Midjourney或DALL·E的可能性不大,更多是补短板让iPhone用户不用再跳第三方App。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
18:34
4d ago
r/LocalLLaMA· rssEN18:34 · 06·08
LocalLLaMA 帖子分级:S 级是模型发布和实测数据
Reddit 用户 nomorebuttsplz 给 LocalLLaMA 社区的帖子做了个 S 到 F 的分级。S 级包括 GGUF/MLX 格式的模型发布、本地模型的跑分数据、MTP 这类重大优化,以及带 prefill/decode 速度、引擎、量化方式和上下文长度的硬件实测帖。正文被 Reddit 屏蔽了,看不到完整分级标准和具体帖子链接。
#Benchmarking#Inference-opt#Agent#LocalLLaMA
精选理由
这是个 Reddit 社区内部的帖子分级,不是模型发布、产品更新或研究结果,所以重要性不会太高。但分级标准写得实在,对本地跑模型的人来说有参考价值,所以落在 60-71 这个区间。正文被屏蔽了,看不到完整分级和具体帖子链接,这点比较可惜。
一句话点评
Reddit 用户给 LocalLLaMA 帖子做了个 S 到 F 的分级。S 级包括 GGUF/MLX 格式模型发布、本地跑分、MTP 优化,以及带 prefill/decode 速度、引擎、量化方式和上下文长度的硬件实测。正文被屏蔽,看不到完整标准和具体链接。这个分级对社区挺有参考价值,但来源单一,且缺少验证,建议先当个参考,别直接当权威指南。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
18:33
4d ago
TechCrunch AI· rssEN18:33 · 06·08
苹果给 Siri 单独做了个 App
在 WWDC 2026 上,苹果宣布 Siri 终于有了自己的独立 App,这是 Siri 历史上最大的一次改版。这个 App 主要功能是存放你和 Siri 的历史对话记录,类似 ChatGPT 或 Claude 的聊天历史页面——你可以翻看之前的对话,点开某一条还能看到摘要,不用从头读完整篇。新对话也从这里发起。界面也改成多模态了:可以打字、传文件、...
#Apple#Siri#Product update
精选理由
HKR 中 H 和 R 通过,因为苹果改 Siri 的 App 形态是当下从业者关心的实锤动作;但 K 不通过:正文只说了有独立 App,没给时间、平台、能力细节,属于小更新级别。
一句话点评
Siri终于有了独立App,可以翻历史对话、打字传文件,像ChatGPT的聊天记录页。但正文没披露底层模型是否换新、延迟和隐私怎么处理——如果只是给旧Siri套个UI,体验提升有限。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
18:23
4d ago
TechCrunch AI· rssEN18:23 · 06·08
苹果用摄像头+Siri帮你算AA账单
苹果在WWDC 2026上展示了一个新功能:用iPhone摄像头对着账单,Siri识别出每个人点了什么,然后通过Apple Cash自动分账。不用再手动算谁多喝了几杯。正文没披露上线时间、支持地区或是否收手续费。
#Vision#Tools#Apple#Sebastien Marineau-Mes
精选理由
H和K靠这个具体分账流程过关,但R很弱。这是个窄的消费功能,不是Siri或开发者平台的大更新,所以分数压在60–71区间。正文没披露上线时间、支持地区、是否收手续费,信息缺口明显。
一句话点评
苹果在WWDC上演示了用摄像头拍账单、Siri识别菜品后自动通过Apple Cash分账。省去手动算账的麻烦,但正文没提上线时间、支持地区或是否收费。实用场景明确,落地细节全缺,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R0
18:22
4d ago
Hacker News 首页· rssEN18:22 · 06·08
Hacker News 上有人问:AI 普及后,你给自己造了什么工具?
Hacker News 上一条帖子问大家“AI 普及后你给自己造了什么工具”,目前有 42 个点赞和 52 条评论。正文没列出所有工具,但评论区已经有人晒了:一个叫 llm-consortium 的工具让多个模型并行跑,循环直到置信度达标再合成答案,甚至仲裁者也能由模型联盟担任;还有人做了加密相册、棋谱分析、自由职业管理、UI 代码自检、菜谱省钱、In...
#Tools#Hacker News#Commentary
精选理由
H 和 R 都成立:标题钩子强,话题能引发同行比较欲。但 K 太弱:正文没给工具列表、实现细节或可复用的经验,只能当个 HN 讨论入口,不值得上推荐位。
一句话点评
HN 上有人问“AI 普及后你给自己造了什么工具”,目前 42 赞 52 条评论。评论区晒出的工具包括:llm-consortium——让多个模型并行跑,循环直到置信度达标再合成答案,甚至仲裁者也能由模型联盟担任;加密相册、棋谱分析、自由职业管理、UI 代码自检、菜谱省钱等。亮点是“模型联盟”思路,用多模型并行+自仲裁提升可靠性,但正文没披露具体成本或延迟数据,实际部署开销可能不低。短评:造...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
18:09
4d ago
AI HOT 精选· aihot-apiZH18:09 · 06·08
样本效率黑洞:AI能力越强,背后吃进去的数据越多
这篇文章用“黑洞”比喻AI对数据的吞噬能力——模型看起来能力很强,但支撑这些能力的核心是海量数据,而不是算法效率的提升。作者指出,过去几年AI进步主要靠加数据、加算力,尤其是RL(强化学习)本质上是在用算力生成合成数据,再拿这些数据训练模型。每个技能都需要成百上千个专家人工标注、写评分标准、解释推理过程,数据行业已经年收入几十亿美元。一个对比:人类一辈...
#Benchmarking#Commentary
精选理由
HKR-H和HKR-R通过,但HKR-K不通过:文章没有提供任何数据、具体案例或可验证的论断,触发了硬排除规则6,因此被标记为excluded。
一句话点评
这篇观点文章用“黑洞”比喻AI对数据的吞噬,核心判断是:过去几年AI进步主要靠加数据、加算力,而不是算法效率提升。作者指出RL本质是用算力生成合成数据,每个技能都需要成百上千专家人工标注、写评分标准、解释推理过程,数据行业已年收入几十亿美元。一个对比:人类学一个技能练几次,GRPO让模型每个任务生成几百到上千次rollout。但正文没披露具体模型规模、数据集大小或实验条件,全是比喻和推论。短...
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H1·K0·R1
17:34
4d ago
● P1The Verge · AI· rssEN17:34 · 06·08
Apple 发布新一代 Apple Intelligence 与升级 Siri AI
苹果在 WWDC 上公布了 Siri AI,说是“全新版本”,比旧版更会聊天、能力更强。语音可以自己调语速、表现力和口音。Siri AI 会做成系统级,能看懂屏幕内容,也能直接操作你的应用。软件工程高级副总裁 Craig Federighi 做了介绍,但正文没披露具体上线时间和支持哪些设备。
#Agent#Tools#Apple#Craig Federighi
精选理由
苹果在 WWDC 上把 Siri 重新包装成 Siri AI,核心变化是让它能看懂你屏幕上的内容,并且直接跨应用帮你操作,不再是以前那个只回答问题的助手。Craig Federighi 出来站台,但正文没给出具体上线日期,也没说哪些设备能跑。我会先打个折:功能听着挺实用,但没时间表就是画饼,所以重要性停在 86 分,没往上走。
一句话点评
Apple 把 AI 功能塞进系统底层,Siri 终于能跨 App 干活了,但别急着喊颠覆,正文全是官方通稿,没给任何实测数据。
锐评
Apple 这次更新的核心是把 AI 能力直接做进操作系统,让 Siri 可以跨 App 执行任务,比如从邮件里提取信息直接填进日历。这比之前只能问答的 Siri 进了一步,相当于让助手真能帮你操作手机了。但整篇新闻稿只讲了功能愿景,没提任何延迟、准确率或用户测试数据。对从业者来说,最关键的几个问题全没答案:跨 App 操作靠的是屏幕识别还是 API 调用?本地模型跑在什么芯片上,内存占用多少?隐私保护的具体技术方案是什么?这些信息缺口让判断只能先打个折——方向对,但落地效果还得等实机上手再看。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
17:27
4d ago
r/LocalLLaMA· rssEN17:27 · 06·08
LocalLLaMA 用户喊话:别买 SpaceX、OpenAI、Anthropic 的 IPO
Reddit 用户 siegevjorn 在 LocalLLaMA 社区发帖,呼吁大家不要参与 SpaceX、OpenAI 和 Anthropic 的 IPO。他给出的理由是:RTX Pro 6000 显卡价格从 7000 美元涨到了 11000 美元,存储价格一年翻了三倍。帖子没有披露任何 IPO 时间表或财务来源,信息缺口很大,建议先当情绪贴看。
#SpaceX#OpenAI#Anthropic#Commentary
精选理由
H、K、R 三个信号都有,但这是一条 Reddit 帖子:正文没披露任何 IPO 时间表或财务来源,显卡涨价的说法也没给验证。建议先当社区情绪看,不是融资或产品新闻。
一句话点评
Reddit 用户抱怨显卡和存储涨价,呼吁抵制 SpaceX、OpenAI、Anthropic 的 IPO。但帖子没给出任何 IPO 时间表或财务来源,更像情绪发泄。RTX Pro 6000 从 7000 涨到 11000 美元,存储一年翻三倍,这些数字确实扎心,但跟 IPO 的关联性没论证。先当社区牢骚看,别当真。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K1·R1
17:14
4d ago
持续报道 · 4dHacker News 首页· rssEN17:14 · 06·08
苹果 WWDC 2026 直播页面已上线
苹果 WWDC 2026 的直播页面已经可以访问,但正文只给了链接、98 个点赞和 107 条评论,完全没有透露议程、AI 相关发布、时间表或具体产品。如果你想蹲点看发布会,这个页面就是入口,但具体会讲什么——比如 Apple Intelligence 的更新、新系统特性——目前一点信息都没有。
#Apple#Product update
精选理由
这是一条苹果WWDC直播链接,正文没有披露任何议程、AI发布或产品细节。对AI雷达读者来说只是一个活动入口,信息量不足以支撑评分,因此低于40分。
一句话点评
苹果 WWDC 2026 直播页面已上线,但正文只有导航栏,没透露任何新品或 AI 功能细节。目前已知有 3 家媒体在跟进,重要性评分 42(中等偏上)。想看 Siri 升级、新 Mac 或 Apple Intelligence 进展的,得等发布会当天。页面信息量为零,别被标题骗进去。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R0
17:12
4d ago
AI HOT 精选· aihot-apiZH17:12 · 06·08
Claude Code 上线一周年:验证与自动模式回顾
Claude Code 发布一周年,团队回顾了验证最佳实践、自动模式、例程和循环。第一个演示只收到两个 Slack 表情回应,说明早期关注度不高。正文没披露具体用户数或采用率,但视频链接里有更多细节。
#Agent#Code#Tools#Claude Code
精选理由
只有 R 成立:Claude Code 用户确实在意自动模式和验证流程。H 和 K 不成立,因为正文只给了两个 Slack 表情回应,没有披露机制、定价或可复现的最佳实践。
一句话点评
Claude Code 满一周年,团队自曝首个演示只收到两个 Slack 表情回应,说明早期冷启动确实难。回顾重点在验证最佳实践、自动模式和循环,但正文没披露用户数或采用率,具体效果得看视频。对做 coding agent 的团队来说,验证和自动模式的设计思路值得参考,但别当成功学案例。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
17:07
4d ago
Hacker News 首页· rssEN17:07 · 06·08
马萨诸塞州通过隐私法案,禁止出售精确位置数据
马萨诸塞州通过了一项新隐私法案,核心是禁止买卖精确位置数据——也就是手机或设备能定位到你具体在哪个街区的那些数据。法案正文没披露生效日期、罚多少钱、覆盖哪些公司,所以实际约束力还不清楚。这条新闻在 Hacker News 上拿了 31 个点赞和 2 条评论,热度不算高,但方向值得留意:美国各州正在加速补位置数据的监管空白。
#Massachusetts#TechCrunch#Hacker News#Policy
精选理由
这是隐私政策新闻,不是 AI 产品或模型事件。HKR-H 和 HKR-K 勉强达标,但帖子只给出了法案方向,没有生效日期、罚款或适用范围,实际约束力不清楚。
一句话点评
马萨诸塞州通过新法案,禁止买卖精确位置数据——就是手机能定位到你具体在哪个街区的数据。法案正文没披露生效日期、罚多少钱、覆盖哪些公司,所以实际约束力还不清楚。Hacker News 上 31 个点赞、2 条评论,热度不高,但方向值得留意:美国各州正在加速补位置数据的监管空白。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K1·R0
16:52
4d ago
Hacker News 首页· rssEN16:52 · 06·08
Gitdot:一个用 Rust 写的 GitHub 替代品,开源、反 AI
Gitdot 是一个开源的 GitHub 替代品,用 Rust 写,主打键盘驱动的命令行风格界面,目标首屏渲染时间 100 毫秒。目前支持注册、组织、公开/私有仓库,以及从 GitHub 导入仓库(只读镜像或完整迁移)。但还不支持 issues、pull requests 和 CI,这些功能计划在 7 月 15 日的 v0.2 版本中开始加入。项目明确...
#Code#Tools#Gitdot#GitHub
精选理由
核心事实是一个代码托管替代品,不是AI产品或模型更新。缺少issues、PR和CI,目前功能有限,只能算低价值可浏览的全量推送。
一句话点评
Gitdot 是个用 Rust 写的开源 GitHub 替代品,主打键盘驱动的命令行界面,目标首屏渲染 100 毫秒。目前能注册、建组织、搞公开/私有仓库,还能从 GitHub 导入仓库(只读镜像或完整迁移)。但 issues、pull requests 和 CI 都还没做,计划 7 月 15 日的 v0.2 才开始加。项目明确反 AI,这点先别太激动——核心协作功能缺失,离替代 GitHu...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R1
16:50
4d ago
r/LocalLLaMA· rssEN16:50 · 06·08
NanoQuant:把大模型压到1比特,4B模型只剩1.15GB
有人放出了NanoQuant的PyTorch实现,目标是把稠密Transformer模型压到每权重1比特甚至更低。实测用Google Colab上的Nvidia L4跑了Qwen3-4B,3.5小时拿到一个1.15GB的模型——4B参数压到1GB出头,存储成本确实低。不过正文没披露量化后的推理速度或精度损失,这点先别太激动,1比特量化通常伴随明显质量下...
#Fine-tuning#Inference-opt#Code#NanoQuant
精选理由
HKR三项全过:给出了具体模型、大小和运行时间。没放到featured是因为它只是一个Reddit实现,没有披露困惑度、推理速度或基准对比。
一句话点评
有人把 NanoQuant 的 PyTorch 实现放出来了,目标是把大模型压到每权重 1 比特甚至更低。实测用 Google Colab 的 Nvidia L4 跑了 Qwen3-4B,3.5 小时拿到一个 1.15GB 的模型——4B 参数压到 1GB 出头,存储成本确实低。但正文没披露量化后的推理速度或精度损失,这点先别太激动,1 比特量化通常伴随明显质量下降。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
16:40
4d ago
r/LocalLLaMA· rssEN16:40 · 06·08
DeepSeek v4 Flash 在 Hopper 上跑到近 200 tok/s,一个月能处理 10 亿 token
Reddit 用户 Reddactor 用 Canada-Quant 的权重和 vLLM MTP 补丁,在 Hopper 上把 DeepSeek v4 Flash 跑到了 193 tok/s。开了 4 个 vLLM 并发线程后,声称能达到约 400 tok/s,一个月大概能处理 10 亿 token。这个速度对本地部署来说相当可观,但正文没披露具体硬件...
#Inference-opt#Agent#DeepSeek#Canada-Quant
精选理由
HKR 三项都达标:性能数字够具体,配置细节有新鲜度,且切中自部署场景的性价比需求。但来源是单条 Reddit 帖子,受众偏推理优化方向,所以分数压在 71,不上精选。
一句话点评
Reddit 用户 Reddactor 用 Canada-Quant 的量化权重和 vLLM 的 MTP 补丁,在 Hopper 上把 DeepSeek v4 Flash 跑到了 193 tok/s。开了 4 个并发线程后声称能到约 400 tok/s,一个月能处理 10 亿 token。这个速度对本地部署相当可观,但正文被屏蔽,没披露具体硬件配置(几张 H100?)、量化精度(4-bit ...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
16:21
4d ago
r/LocalLLaMA· rssEN16:21 · 06·08
他把一个本地大模型塞进了Unity游戏,没网也能跟NPC聊天通关
开发者 MorphLand 在 Unity 游戏《Simulation Simulator》里直接打包了一个本地 LLM,玩家靠自然对话推进剧情,有 5 种结局。全程不需要联网、不用云服务、不调 API。代价是语音合成和自动翻译被砍掉了——因为本地跑这些每轮对话要多等 10-20 秒,体验上扛不住。正文没披露具体用了什么模型、多大参数量,也没说打包后游...
#Agent#Memory#MorphLand#Unity
精选理由
HKR 三项都达标,因为这是一个有具体数字和取舍细节的本地 LLM 游戏实验,不是空谈。但影响面还窄,来源是 Reddit 自述,所以分数卡在 68,不上推荐位。
一句话点评
开发者把本地 LLM 塞进 Unity 游戏,玩家纯靠对话推进剧情,有 5 种结局。代价是砍掉了语音合成和自动翻译——本地跑这些每轮要多等 10-20 秒,体验扛不住。正文没披露具体模型和参数量,也没说打包后游戏多大。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:36
4d ago
r/LocalLLaMA· rssEN15:36 · 06·08
Nex N2 推理时爱用短词,像在说“几个字就够了”
有用户在本地跑 Nex N2 Pro,说它其实是 Qwen 3.5 397B 的微调版。推理过程里频繁出现“need”“maybe”这类短词,看起来像在走捷径。正文没披露具体评测数据,所以不清楚这种“短词推理”对准确率影响多大,但至少说明模型在尝试用更少的 token 做推理——如果真能保持效果,推理成本会降不少。
#Reasoning#Nex N2 Pro#Qwen#FullOf_Bad_Ideas
精选理由
HKR-H和HKR-R成立,因为模型特有的“少词推理”怪癖在LocalLLaMA用户群里很有话题性。HKR-K不成立:没有提示词、样本量或基线对比,这条信息只能算低价值讨论。
一句话点评
有用户发现 Nex N2 Pro 推理时频繁用“need”“maybe”等短词,怀疑是 Qwen 3.5 397B 的微调版。这种“短词推理”可能是在用更少 token 走捷径,如果效果不掉,推理成本能降不少。但正文没披露评测数据,不清楚对准确率影响多大,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
15:27
4d ago
● P1Hacker News 首页· rssEN15:27 · 06·08
小米MiMo-v2.5-Pro-UltraSpeed模型达到每秒1000tokens输出
小米和 TileRT 合作,把一个 1 万亿参数的大模型在 8 张普通 GPU 上跑到了每秒生成 1000 多个 token。他们用了两招:一是只对 MoE 专家模块做 FP4 量化,把模型体积和显存带宽压力打下来,同时保住推理质量;二是用了一种叫 DFlash 的投机解码方法,一次能猜对更长的 token 串,减少反复验证的等待时间。目前这个速度只在...
#Inference-opt#Xiaomi#MiMo#Product update
精选理由
小米把一个1万亿参数的MoE模型塞进8张普通GPU,靠FP4量化只压缩专家模块,再配上能一次猜对更长token串的DFlash投机解码,把生成速度拉到每秒1000多个token。这个速度如果是真的挺省钱,但正文没交代测试用的什么卡、上下文多长、精度损失多少,我会先打个折。
一句话点评
小米用8张普通GPU把1万亿参数模型跑到每秒1000+ tokens,但试用要申请、只开两周,先别太激动。
锐评
这条消息的核心看点不是“快”,而是“用普通硬件跑出了定制芯片的速度”。小米MiMo团队和TileRT系统团队合作,在一台标准的8卡GPU服务器上,让一个1万亿参数的MoE模型(混合专家模型)跑到每秒超过1000个token的输出。对比他们自己的定价,速度大约是标准版的10倍,但API价格只涨了3倍,这点挺实在。 他们主要用了两招:一是只对模型里占大头的“专家”模块做FP4低精度量化,其他部分保持原样,这样既压缩了体积又没怎么伤到模型能力;二是搞了个叫DFlash的投机解码方法,让模型一次能猜对更长的后续文本,减少了等待验证的次数。从放出的跑分图看,量化后的模型能力跟原版基本持平。 不过,正文没披露这个速度是在什么输入输出长度、什么并发数下测出来的,也没提首个token的延迟是多少。这些指标会直接影响“每秒1000 tokens”在实际业务里的含金量。另外,试用期只有两周,还得申请,能拿到多少资源、稳定性如何,都是未知数。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
15:21
4d ago
AI HOT 精选· aihot-apiZH15:21 · 06·08
OpenRouter 推出 Advisor:让小模型遇到难题时去问高级模型
OpenRouter 发布了一个叫 Advisor 的服务端工具,核心逻辑是:小模型卡住或陷入死循环时,可以临时去咨询一个更聪明的“顾问”模型,从而帮你把任务从贵的大模型迁移到更便宜的模型上。正文没披露支持哪些模型、差价多少,也没给出实测迁移成功率。
#Tools#Inference-opt#OpenRouter#Product update
精选理由
机制有意思,但正文没披露支持哪些模型、差价多少,也没给实测迁移成功率,信息缺口明显。算一个有趣的小产品更新,所以放在 70 分,不上精选。
一句话点评
OpenRouter 出了个叫 Advisor 的服务端工具,小模型卡住或死循环时,能临时去问一个更聪明的“顾问”模型。核心卖点是帮你把任务从贵的大模型迁移到便宜的模型上。但正文没披露支持哪些模型、差价多少,也没给实测迁移成功率。想法不错,但效果和成本节省都还是未知数。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:59
4d ago
r/LocalLLaMA· rssEN14:59 · 06·08
律师想本地跑 NotebookLM 翻车:GTX 1080 跑 Qwen 9B 只有 2.2 tok/s,模型还拒绝摘原文
一位律师在 Reddit 上吐槽,想用本地 RAG(外挂资料库)处理案件卷宗,配置是 i7-6700K + GTX 1080 8GB + 16GB 内存,试了 LM Studio 加 Big RAG。Qwen3.5 9B 模型一次只能输出约 2900 tokens,速度只有 2.2 tok/s——相当于读完一段话要等几十秒。更致命的是,两个测试模型都拒...
#RAG#Safety#Inference-opt#LM Studio
精选理由
这是一条 Reddit 上的个人求助帖,不是评测或产品发布。它提供了真实的硬件配置和速度数据(2.2 tok/s 很慢),也点出了法律场景下模型拒答的问题,但没有任何解决方案、基准测试或产品更新。信息量有限,胜在真实,适合作为社区讨论的引子,不适合作为行业趋势判断。
一句话点评
一位律师用i7-6700K+GTX 1080跑本地RAG处理卷宗,Qwen3.5 9B输出仅2.9 tok/s,读完一段话要等几十秒,而且模型拒绝摘录原文,只给泛泛的法律解释。这配置跑9B模型太勉强,8GB显存是瓶颈,速度慢到没法用。更坑的是安全对齐导致模型不敢输出原文,本地部署也白搭。正文没披露他用的具体RAG配置和分块策略,但核心问题很明确:硬件不够、模型太保守。想复现NotebookL...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
14:53
4d ago
彭博科技· rssEN14:53 · 06·08
Cipher 发垃圾债为亚马逊相关数据中心融资 8.1 亿美元
Cipher Digital 通过发行垃圾债(高风险高收益债券)筹集了 8.1 亿美元,用于建设一个与亚马逊绑定的数据中心项目。这笔融资成本较高,说明 AI 基础设施投资正在转向风险更高的债务工具。正文未披露该数据中心的具体规模、地点或亚马逊的长期租约细节。
#Cipher Digital#Amazon#Funding
精选理由
Bloomberg 这条消息给了一个具体数字:8.1 亿美元垃圾债,绑定了亚马逊的数据中心项目。AI 的关联停在基建融资层面,GPU 规模、模型训练用途、AWS 产品影响都没披露,所以对从业者的实操价值有限。
一句话点评
Cipher Digital 靠卖垃圾债(高风险高收益债券)筹了 8.1 亿美元,给亚马逊建数据中心。融资成本高,说明 AI 基建投资开始走风险更大的路子。正文没披露数据中心规模、地点和亚马逊租约细节,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R0
14:00
4d ago
Hacker News 首页· rssEN14:00 · 06·08
SoulsOnly.ttf:一款专为人类设计、AI 难以识别的字体,还配了专用键盘固件
这个项目发布了一套字体和配套的键盘固件,核心思路是让文字对人类可读,但对 AI 视觉识别系统(比如 OCR 或截图解析)不友好。字体本身做了变形,让机器难以直接提取字符;键盘固件则让你打字时能正常输入这些特殊字形。项目目前只有 11 个 Star、1 个 PR,正文没披露具体的抗识别测试结果或模型绕过率,所以效果到底多好还不清楚。思路挺有意思,但离实用...
#Safety#SoulsOnly.ttf#Hacker News#Open source
精选理由
HKR-H 和 HKR-R 靠反AI字体钩子和内容控制神经通过,但 HKR-K 不通过:没披露机制、模型测试或可复现证据。HN 热度低,所以留在 all 层。
一句话点评
一套字体+键盘固件,让文字对人类可读、对AI视觉系统(OCR/截图解析)难读。字体做了变形,打字时固件帮你正常输入。目前只有11个Star、1个PR,正文没披露抗识别测试结果或模型绕过率,效果多好不清楚。思路有意思,但离实用还远。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
14:00
4d ago
● P1OpenAI 博客· rssEN14:00 · 06·08
OpenAI 向 SEC 秘密提交 IPO 申请草案,上市时间未定
OpenAI 在 6 月 8 号确认,他们已经向美国证监会(SEC)秘密提交了一份 S-1 上市草案。公司自己说,反正文件大概率会泄露,不如主动公开。不过他们还没定上市时间,甚至可能拖很久,因为有些事在私有公司状态下更好办。提交这份文件只是给自己多留一个选择,如果时机合适,可以更快启动 IPO。至于打算融多少钱、公司估值多少,正文都没提。
#OpenAI#SEC#Funding
精选理由
HKR 三项全中:OpenAI 秘密交 S-1 是头部 AI 公司走向公开市场的实质性一步。我会先打个折,因为没披露融资金额和上市时间,所以没给到 95-100 那档。
一句话点评
OpenAI 秘密交表准备上市,但 S-1 草案不公开,估值、营收、亏损这些关键数字现在全看不到。
锐评
OpenAI 向 SEC 秘密提交了 S-1 草案,正式启动上市流程。秘密提交意味着这份文件暂时不会公开,外界看不到任何财务数据——营收多少、亏了多少、估值目标是什么,一概不知。这更像是一个信号:OpenAI 在资本层面开始追赶 Anthropic 等对手,不再只靠私募融资撑着。 目前所有报道都来自 Bloomberg 等媒体引用知情人士,OpenAI 官方没有确认任何细节。上市时间、交易所、承销行这些信息都没披露。Sam Altman 之前提过 2028 年前 AI 会承担大部分研究工作,但这次交表和那个时间线有没有关系,正文没说。 对从业者来说,这件事短期没什么可操作的。真正值得盯的是 S-1 公开那天——到时候才能看到 OpenAI 真实的收入结构、客户集中度、研发烧钱速度,以及它怎么向公开市场解释自己的商业模式。在那之前,所有关于“AI 巨头上市潮”的叙事都先打个折。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
14:00
4d ago
● P1The Verge · AI· rssEN14:00 · 06·08
微软AI负责人称超级智能近在咫尺但不会取代人类工作
微软 AI CEO Mustafa Suleyman 在采访里透露,去年 10 月跟 OpenAI 更新合同后,微软已经可以独立搞超级智能了,同时继续买 OpenAI 的模型授权。他正在搭训练集群、招人,Build 大会上一口气发了七个覆盖不同模态的新模型。Suleyman 解释,OpenAI 这几年从纯研究往全栈走——做消费产品、自建数据中心、搞芯片...
#Multimodal#Microsoft#Mustafa Suleyman#OpenAI
精选理由
这篇采访的爆点在于 Mustafa Suleyman 同时抛出了两个容易传播的判断:超级智能不远了,以及它不会抢工作。对从业者来说,更实在的信息是合同更新后微软获得了独立研发超级智能的权限,并在 Build 上铺了七个多模态模型,说明微软在模型层不再只靠 OpenAI 输血。不过正文没给出超级智能的具体定义和时间线,也没解释“不抢工作”的依据,更像是一次定调式发声,实际产品落地细节偏少。我会先打个折,把它当成信号而非硬发布来看。
一句话点评
微软AI负责人说超级智能快来了,但不会抢你饭碗。这话听着像老板画饼,正文没给任何技术细节或时间表,先打个折。
锐评
微软AI负责人穆斯塔法·苏莱曼放话说超级智能“近在咫尺”,但强调不会取代人类工作。这话出自一家正全力把AI塞进Office和云服务的大厂高管之口,天然带有立场色彩——他需要安抚用户和监管,同时给投资人一个未来预期。 关键问题是正文没披露任何支撑材料:没定义什么叫“超级智能”,没给时间范围,也没解释“不取代工作”是基于技术限制还是企业策略。Verge这篇报道本身只有标题和摘要,缺少采访原文或具体论述,所以这个判断目前只能当表态看,不能当技术路线图。 如果他说的是真的,那意味着微软内部看到了某种阶段性突破,但没拿出来;如果只是公关话术,那就是在超级智能真正到来前,先管理好公众情绪。缺的是可验证的证据、独立研究者的看法,以及微软自家产品路线图怎么跟这个判断对齐。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
13:52
4d ago
r/LocalLLaMA· rssEN13:52 · 06·08
llama-launcher:给 llama-server 加了个图形界面,点一点就能调参数
SolaryKryptic 发了一个叫 llama-launcher 的小工具,本质上是给 llama-server 套了个图形界面,不用敲命令行就能改启动参数。作者只给了 GitHub 链接,没写版本号,也没说支持哪些参数。正文被 Reddit 墙了,看不到更多细节。如果你平时用 llama-server 觉得记参数麻烦,这个能省点事,但具体好不好用...
#Tools#SolaryKryptic#llama.cpp#Product update
精选理由
一个小型开源工具发布:HKR-K 和 HKR-R 通过,但帖子没写版本号、支持哪些参数或演示效果,价值偏低。
一句话点评
llama-launcher 给 llama-server 套了个图形界面,不用记命令行参数了。作者只给了 GitHub 链接,没写版本号,也没说支持哪些参数,正文还被 Reddit 墙了,细节基本为零。如果你平时嫌敲命令麻烦,这个能省点事,但好不好用、稳不稳定,得自己去 GitHub 看代码才知道。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
13:51
4d ago
r/LocalLLaMA· rssEN13:51 · 06·08
llama.cpp 新 PR:让 Gemma 和 Qwen 看懂视频
开发者 ngxson 给 llama.cpp 提了个 PR,给 mtmd 模型加了视频输入支持。简单说,以后你可以直接拿视频喂给 Gemma 或 Qwen 这类多模态模型,不用先抽帧转文字。正文没披露这个 PR 有没有被合并、支持哪些视频格式、以及跑视频推理要多高的显存或延迟。如果合进去了,本地跑视频理解的门槛会降一截,但目前先别太激动,等合并状态和性...
#Multimodal#Vision#ggml-org#llama.cpp
精选理由
这是一个 llama.cpp 的多模态 PR,不是已发布的版本。缺少合并状态、模型限制和性能数据,所以落在 60–71 的小更新区间。
一句话点评
llama.cpp 的 mtmd 模型现在能直接吃视频了,不用先抽帧。但 PR 还没合并,格式、显存、延迟一概没提。本地跑视频理解的门槛可能降,但先别激动,等合并和实测。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:44
5d ago
AI HOT 精选· aihot-apiZH13:44 · 06·08
Kimi Code 更新了,但正文没写改了什么
标题说 Kimi Code 有焕新升级,还附了视频教程,但点进去页面提示环境异常,需要验证才能访问。正文完全空白,没披露任何功能变化、版本号、发布日期或使用条件。目前能确认的只有标题本身,具体更新内容未知。
#Code#Kimi#Product update
精选理由
HKR 三项全挂:标题只有模糊的“焕新升级”,正文完全空白,没有功能、版本或访问细节。0/3 的 HKR 加上营销式零数据内容,重要性上限被压在 40 以下。
一句话点评
标题说 Kimi Code 升级还带视频教程,但正文被微信验证墙挡住,一个字都没披露。目前能确认的只有标题本身,具体更新了什么、版本号、发布日期全未知。建议等官方补发可访问的公告再判断,别急着点验证。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
13:35
5d ago
r/LocalLLaMA· rssEN13:35 · 06·08
Gemma 4 聊天模板新增“保留思考过程”开关
Reddit 用户发现 Gemma 4 的聊天模板里多了个 preserve thinking 选项,打开后模型会输出自己的推理过程。正文没披露具体参数、切换机制或影响哪些版本,所以暂时不清楚这个开关是让模型在回答前先吐思考链,还是把思考过程混进最终回复。如果是前者,对调试和可解释性有帮助;如果是后者,可能影响输出格式。信息缺口比较大,建议等官方文档或实测。
#Reasoning#Google#Gemma#Hugging Face
精选理由
这是一个面向 LocalLLaMA 小圈子的更新:HKR-K 靠可验证的模板变化通过。正文没给参数、开关机制或版本范围,所以 HKR-H/R 偏弱,分数落在 60-71 区间。
一句话点评
Gemma 4 聊天模板新增了一个 preserve thinking 开关,打开后模型会输出自己的推理过程。目前信息缺口很大:正文被 Reddit 屏蔽,没披露具体参数、切换机制或影响哪些版本。不清楚是让模型在回答前先吐思考链,还是把思考过程混进最终回复。如果是前者,对调试和可解释性有帮助;如果是后者,可能影响输出格式。建议等官方文档或实测。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
13:35
5d ago
Hacker News 首页· rssEN13:35 · 06·08
Intuned:用自然语言描述需求,自动生成可维护的浏览器自动化代码
Intuned 是一个浏览器自动化平台,核心卖点是“你描述需求,AI 帮你写 Playwright 代码,网站变了还能自动修”。项目跑在隔离机器上,运行时自动记录参数、结果、追踪和日志,方便 AI 辅助排查。支持 TypeScript 和 Python,覆盖爬虫、RPA(模拟人工操作网页)、AI 自动化(可混用 Anthropic Computer U...
#Agent#Code#Tools#Intuned
精选理由
HKR 的 K 和 R 都过了:帖子给出了具体的自动化实现细节,也触及了浏览器代理上线的可靠性难题。作为早期创业公司的产品发布,没有定价、客户规模或基准测试,所以评分停留在正常产品更新区间的上沿。
一句话点评
Intuned 把浏览器自动化做成了“你描述需求,AI 写 Playwright 代码,网站变了还能自动修”。支持 TypeScript/Python,自带反检测、验证码、登录处理,还能混用 Claude/OpenAI 的 Computer Use 做 AI 自动化。亮点是运行时自动记录参数、日志和追踪,方便 AI 排查。但正文没披露 AI 生成代码的成功率、修复的准确率,以及隔离机器的启动...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
13:16
5d ago
r/LocalLLaMA· rssEN13:16 · 06·08
用本地 Ollama 批量总结 4300 篇 arXiv 论文,推送到 Cloudflare 数据库
作者用本地 Ollama 跑了 4300 篇 arXiv 论文:gemma4:e4b 模型生成六字段 JSON 摘要,nomic-embed-text 模型把每篇转成 768 维向量存到 Cloudflare Vectorize,最后通过 REST API 批量写入 Cloudflare D1 数据库。整个流程全在本地跑,不依赖外部 API,适合低成本...
#RAG#Embedding#Tools#Ollama
精选理由
HKR 三项都过:4300 篇论文的本地批量管线本身就有点击价值,模型、向量维度、存储方案都公开了。但这是一篇 Reddit 上的个人操作记录,没有对比基准或可复现的评测结果,所以不到 featured 级别。
一句话点评
一个本地跑通的全流程:用 Ollama 上的 gemma4:e4b 给 4300 篇 arXiv 论文生成结构化摘要,再用 nomic-embed-text 转成向量存 Cloudflare。成本低,不依赖外部 API,适合小团队搭论文检索。但正文被 Reddit 屏蔽,没披露生成质量、耗时和向量检索的召回率,这些才是落地关键。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
13:12
5d ago
Product Hunt · AI· rssEN13:12 · 06·08
OrchestraML:用大白话描述需求,就能自动训练并部署机器学习模型,中间每一步都要你点头
OrchestraML 让你用自然语言描述任务,后台 8 个智能体自动处理数据清洗、特征工程,再用 FLAML AutoML 做模型训练。整个过程设了 6 个检查点,每步都等你手动确认才往下走。最终输出一个可下载的 pkl 模型文件加 predict.py 脚本,或者直接生成一个 REST API。免费版每天能跑 2 条流水线。正文没披露支持哪些模型类...
#OrchestraML#FLAML#Google Gemini 2.0
精选理由
OrchestraML 是一个用自然语言驱动的 AutoML 流水线工具,机制具体且有免费额度——K 轴得分。但 H 轴缺乏悬念,R 轴受众窄(数据科学家,不是泛 AI 从业者)。没有硬性排除条件,但重要性偏低,归为'all'。
一句话点评
用自然语言描述任务,8个智能体自动做数据清洗、特征工程,再用FLAML AutoML训练模型,最终输出可下载的pkl文件或REST API。设了6个检查点,每步都要你手动确认才往下走,适合对流程有严格把控需求的团队。免费版每天2条流水线,但正文没披露支持哪些模型类、训练数据量上限,以及8个智能体具体怎么分工协作。如果只是快速验证想法,这个工具比从头写代码省事,但别指望它处理复杂业务逻辑。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
13:11
5d ago
AI HOT 精选· aihot-apiZH13:11 · 06·08
小互开源视频翻译工具:一句话搞定下载、转写、翻译、烧字幕
小互开源了 xiaohu-video-translate,说一句“把链接翻译成中文字幕视频”就能自动下载、用本地 Whisper 转写、AI 翻译润色、烧字幕、出文稿。转写跑在本地,不花 API 费。支持 YouTube、Bilibili、抖音链接和本地文件,英语、日语、韩语、法语、西班牙语等都能转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超...
#Audio#Tools#Code#Xiaohu
精选理由
这是个个人开源小工具,功能完整但没看到用户量、基准测试或社区反馈,属于实用但还没验证的 utility,放在 60–71 档合理。
一句话点评
小互开源了一个视频翻译工具,说一句指令就能自动下载、本地Whisper转写、AI翻译并烧录中文字幕。转写跑在本地,不花API费,这点挺省钱。支持YouTube、B站、抖音链接和本地文件,英日韩法西都能转中文。字幕精确到词级时间戳,按语义断句,每行不超12字,双语模式中文大英文小。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex等AI编程工具。已开源,附安装指南。...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
12:31
5d ago
持续报道 · 1dr/LocalLLaMA· rssEN12:31 · 06·08
llama.cpp 合并了一个 KV 缓存优化,Gemma-4 推理更快了
ggerganov 给 llama.cpp 提的 PR #24277 已经合并,从 b9551 版本开始可用。改动核心是避免 KV 缓存单元的内存拷贝——简单说就是减少推理过程中重复搬数据的开销,对 Gemma-4 的 MTP(多 token 预测)场景有明显加速。不过正文没披露具体加速倍数、测试硬件或 workload 条件,所以实际收益有多大还不确...
#Inference-opt#ggml-org#ggerganov#llama.cpp
精选理由
这是一个小的 llama.cpp 推理优化:HKR-K 有明确的机制和构建版本,HKR-R 影响本地推理性能,但正文没披露 Gemma-4 MTP 的 benchmark 数据,HKR-H 偏弱。
一句话点评
llama.cpp 作者 ggerganov 刚合入了一个 PR,核心改动是避免 KV 缓存单元的内存拷贝——说白了就是推理时少搬几次数据,对 Gemma-4 的多 token 预测(MTP)场景有加速。从 b9551 版本开始可用。但正文没披露具体加速倍数、测试硬件或 workload 条件,所以实际收益有多大还不确定。这点先别太激动,等有人跑个 benchmark 再说。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
12:17
5d ago
r/LocalLLaMA· rssEN12:17 · 06·08
PDF 转 JSON 最稳的办法:PyMuPDF 提取文本 + LLM 结构化输出
Reddit 用户分享了一套 PDF 转 JSON 的流程:先用 PyMuPDF 和 pymupdf4llm 把 5-20 页的 PDF 转成纯文本,再丢给大模型让它输出固定格式的 JSON。超过 15 页的文档要花 5-7 分钟,速度不算快。遇到日期字段有多个候选值时,模型会出错——正文没披露具体怎么处理这种歧义。这套方案胜在简单,但延迟高、对复杂版...
#Tools#Code#PyMuPDF#pymupdf4llm
精选理由
这是一条 Reddit 求助帖,不是新方法或行业事件,所以 H 不通过。但它给出了具体的技术栈(PyMuPDF + pymupdf4llm)、性能数据(15 页以上 5-7 分钟)和已知缺陷(日期字段歧义),对做文档抽取的从业者有参考价值,K 和 R 都成立。
一句话点评
Reddit 用户分享了一套 PDF 转 JSON 的流程:先用 PyMuPDF 把 5-20 页的 PDF 转成纯文本,再丢给大模型让它输出固定格式的 JSON。超过 15 页的文档要花 5-7 分钟,速度不算快。遇到日期字段有多个候选值时,模型会出错——正文没披露具体怎么处理这种歧义。这套方案胜在简单,但延迟高、对复杂版式文档的鲁棒性存疑。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
12:00
5d ago
AI HOT 精选· aihot-apiZH12:00 · 06·08
OpenRouter 说它的 Agent SDK 能帮 AI 智能体满足欧盟 AI 法案的“人类监督”要求
OpenRouter 发了一篇博客,核心意思是:欧盟 AI 法案、美国科罗拉多州 AI 法案和 NIST 的 AI 风险管理框架,都要求 AI 做影响人的决策时(比如贷款、雇佣、医疗),必须有人类能监督、干预甚至推翻。OpenRouter 说它的 Agent SDK 里已经内置了“人在回路中”的工具,可以直接用来满足这些合规要求。文章给出了 5 个实现...
#Agent#Safety#Tools#OpenRouter
精选理由
硬排除:这是一篇供应商合规宣传稿。核心卖点是 OpenRouter 的 Agent SDK 能满足欧盟 AI 法案等要求,但正文没披露任何可验证的机制或测试条件。HKR-R 通过(合规和 liability 成本确实是 agent 部署的敏感点),HKR-H 和 HKR-K 不通过,分数上限 40。
一句话点评
OpenRouter 说它的 Agent SDK 内置了“人在回路中”工具,可以直接满足欧盟 AI 法案、科罗拉多州 AI 法案和 NIST 框架里关于人类监督的要求。文章列了 5 种实现模式,比如给高风险操作加审批门、超时自动升级。但正文没披露这些工具的具体实现细节或验证条件,更像产品宣传。如果你已经在用 OpenRouter 的 SDK,可以看看;否则先别太激动,合规落地还得看审计日志怎...
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H0·K0·R1
11:46
5d ago
AI HOT 精选· aihot-apiZH11:46 · 06·08
巴基斯坦版反诈助手:用 4B 小模型识别可疑短信和截图
Pakistan Notice Helper 是一个轻量安全工具,帮用户判断短信、链接或截图是否可疑,支持英文和乌尔都语。最终选了 Qwen3.5 4B Q8 模型(量化版 4B 参数),在 10 个测试用例里全部通过了高风险诈骗和截图场景。之前试过 27B 模型(质量好但成本高)和 MiniCPM-V 4.6 Q8(慢且不稳定),最后选了 4B 这个...
#Vision#Safety#Pakistan Notice Helper#Qwen
精选理由
HKR-H/K 通过:本地化诈骗检测和小模型测试有具体信息,10 个用例也公开了。但规模、指标和可复现性都比较单薄,所以分数压在 60–71 区间。
一句话点评
巴基斯坦团队用 Qwen3.5 4B 量化版做了个防诈骗工具,10 个测试全过,成本比 27B 低很多。但测试集只有 10 条,泛化能力未知,且受限于黑客松的 32B 上限规则,选 4B 未必是最优解。短评:10 条测试全过,但样本太少,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
11:08
5d ago
r/LocalLLaMA· rssEN11:08 · 06·08
Meddies PII:一个开源的临床文本去标识模型,支持多语言
Meddies 团队发布了一个开源的临床文本去标识模型 Meddies PII,以及配套的合成数据集。去标识就是把病历里的姓名、身份证号等个人信息抹掉,方便做研究。这个数据集用动态提示生成,覆盖了7类变量:语言、文档类型、标签、长度、格式、边界案例和标识符类型。正文没披露具体评测分数,所以效果到底多好还不清楚。模型和数据集都开源了,可以自己试。
#Safety#Tools#Meddies#Open source
精选理由
HKR-K 和 HKR-R 通过:7变量动态提示机制具体,临床去标识是真实隐私工作流。实体权重有限且未披露评测分数,属于正常开源工具区间。
一句话点评
Meddies 开源了一个去标识模型,专门抹掉病历里的姓名、身份证号。亮点是合成数据集覆盖7类变量(语言、文档类型、标签等),理论上泛化性更好。但正文没披露评测分数,效果未知。模型和数据集都开源了,可以自己跑跑看。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
09:54
5d ago
AI HOT 精选· aihot-apiZH09:54 · 06·08
用 Agent 把 Qwen3-VL 塞进安卓手机跑推理
正文没披露模型尺寸、推理框架、跑在什么设备上,也没给任何性能数据(延迟、内存、帧率)。标题说打通了端侧推理,但信息缺口太大,没法判断实际效果。
#Agent#Vision#Inference-opt#Qwen
精选理由
标题说打通了 Qwen3-VL 安卓端侧推理,但正文没给模型尺寸、推理框架、设备型号和任何性能数据,信息缺口太大,没法判断实际效果。HKR-H 和 HKR-R 通过,但 HKR-K 不通过,因为缺少可复现的配置和性能细节。这是一个有趣的端侧推理教程线索,不是值得头条的信号。
一句话点评
标题说打通了Qwen3-VL在Android上的端侧推理,但正文被反爬墙截了,没披露模型尺寸、推理框架、跑在什么设备上,也没给任何性能数据(延迟、内存、帧率)。信息缺口太大,没法判断实际效果,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
09:30
5d ago
AI HOT 精选· aihot-apiZH09:30 · 06·08
生数科技与华策集团合作建AIGC影视中心,Vidu视频生成落地影视制作
生数科技(Vidu视频生成模型开发商)与华策集团(国内头部影视公司)宣布战略合作,共建AIGC影视创制中心。合作覆盖四个方向:用Vidu生成视频素材、辅助剧本创作、做影视预演(拍前预览)、以及后期视效制作。正文没披露具体投入金额、合作排他性、以及是否已有落地项目。对行业来说,这是视频生成模型第一次直接进影视工业流程,但合作刚签,实际产出和效率提升还没数...
#Multimodal#Vision#Shengshu Technology#Huace Group
精选理由
HKR-K 是实的:四个工作流方向都点名了,Vidu 直接进影视工业流程是第一次。HKR-R 来自制作岗位和成本压力,但没片单、没成本数据,所以验证弱。HKR-H 弱,合作刚签,没demo、没投入金额、没排他性,也没说已有项目在跑,吸引力有限。综合下来放在 all 层合适。
一句话点评
生数科技(Vidu)和头部影视公司华策共建AIGC创制中心,四个方向:视频素材生成、剧本辅助、拍前预览、后期视效。这是视频生成模型首次直接嵌入影视工业流程,但合作刚签,正文没披露投入金额、排他性、以及是否有落地项目。实际产出和效率提升还没数,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
09:10
5d ago
r/LocalLLaMA· rssEN09:10 · 06·08
vllm-doctor:一个给 vLLM 推理服务器做体检的命令行工具
vllm-doctor 是一个 CLI 工具,能读取 vLLM 的 /metrics 或 Prometheus 指标,然后跑一组规则检查队列压力、首 token 延迟(TTFT)和后续 token 延迟(TPOT)、KV 缓存压力。结果会输出人类可读的文字或 JSON,附带置信度、可能原因和建议。相当于给推理服务器做个快速体检,不用自己盯着 Grafa...
#Inference-opt#Tools#vLLM#Prometheus
精选理由
一个小型开源运维工具,机制具体但覆盖面窄:HKR-K靠vLLM指标检查通过,HKR-R靠推理调试痛点通过,HKR-H偏弱,且正文没披露任何采用数据或基准测试结果。
一句话点评
vllm-doctor 是个 CLI 工具,能自动读 vLLM 的 /metrics 或 Prometheus 指标,然后跑规则检查队列压力、首 token 延迟(TTFT)和后续 token 延迟(TPOT)、KV 缓存压力,最后输出人类可读的文字或 JSON,附带置信度、可能原因和建议。相当于给推理服务器做个快速体检,不用自己盯着 Grafana 看。 短评:省掉手动盯 Grafana...
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H0·K1·R1
08:34
5d ago
r/LocalLLaMA· rssEN08:34 · 06·08
Macaron-V1-Preview-749B 发布:7490 亿参数模型,但几乎没公开任何细节
Reddit 上有人贴了一个 Hugging Face 链接,叫 mindlab-research/Macaron-V1-Preview-749B。标题里的 749B 意味着模型有 7490 亿参数,比 GPT-4 传闻的 1.76 万亿小一半,但比 Llama 3.1 405B 大了快一倍。不过正文完全没披露架构(MoE 还是 Dense?)、许可证...
#mindlab-research#Hugging Face#Macaron#Research release
精选理由
HKR 的 H 和 R 都成立,因为 749B 参数是硬核钩子,且直接触及开源用户对硬件门槛的焦虑。但 K 不成立,因为整个条目只有标题级证据——没有架构、许可证、权重获取方式或任何评测,属于低价值模型发布线索。
一句话点评
一个 749B 参数的模型预览,比 Llama 3.1 405B 大近一倍,但比 GPT-4 传闻的 1.76T 小一半。目前只有 Hugging Face 页面,正文被 Reddit 屏蔽,没披露架构(MoE 还是 Dense?)、许可证、评测或下载方式。信息缺口太大,先别激动。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
08:33
5d ago
AI HOT 精选· aihot-apiZH08:33 · 06·08
邵猛开源“品牌转设计稿”技能,但提醒:复刻网站容易造出新的AI垃圾
邵猛在GitHub(shaom/brand-to-design-md-skill)开源了一个技能,让AI Agent学习设计品味后复刻网站。但他自己泼了冷水:这种复刻看多了,反而从“反AI垃圾设计”变成了新的“AI垃圾”——只抄到皮毛,没学到设计精髓。正文没披露具体复刻效果或失败案例,但提醒想抄作业的人,别光顾着省事。
#Agent#Tools#Shao Meng#GitHub
精选理由
HKR三项都过,但这是个人开源帖,没披露复刻效果、测试条件或成功率,属于小工具加评论,落在60–71分档。
一句话点评
邵猛开源了一个让AI Agent学设计品味后复刻网站的skill,但他自己泼冷水:这种复刻看多了,从“反AI垃圾设计”变成了新“AI垃圾”——只抄到皮毛,没学到精髓。正文没披露具体复刻效果或失败案例,但提醒想抄作业的人,别光顾着省事。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:00
5d ago
AI HOT 精选· aihot-apiZH08:00 · 06·08
CoreWeave 怎么看现在的算力市场
CoreWeave 分析了当前算力市场的增长动力和瓶颈,但正文没披露具体需求数字、供给上限、定价变化或时间窗口,所以这篇更像一个方向判断,不是数据报告。
#Inference-opt#CoreWeave#Commentary
精选理由
HKR-R 通过,因为算力供给触及成本焦虑;但 HKR-H 平淡,HKR-K 缺少数字或机制。Bloomberg 有可信度,但这仍是一篇信息量薄弱的市场观点。
一句话点评
CoreWeave 对算力市场的看法:推理需求在涨,但训练还没见顶。正文没给具体数字,更像方向判断。短评:方向对,但没数据支撑,当行业风向标看可以,别当投资依据。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
07:53
5d ago
Hacker News 首页· rssEN07:53 · 06·08
GitHub 部分服务挂了
GitHub 官方状态页确认 Issues 和 Pull Requests 两个核心功能出现性能下降或可用性问题,目前仍在调查原因,未给出恢复时间。从时间线看,问题已持续约一小时,影响范围明确但不算全面瘫痪。正文没披露根因和受影响用户规模,这点先别太激动。
#GitHub#Hacker News#Incident
精选理由
HKR-H 和 HKR-R 通过:GitHub 宕机直接影响开发者日常,Hacker News 热度也说明关注度高。HKR-K 不通过:正文没披露根因、影响用户规模、恢复时间,且这不是 AI 产品或模型事件,信息完整度不足。
一句话点评
GitHub Issues 和 PR 两个核心功能挂了,官方状态页确认性能下降,已持续约一小时,还在查原因,没给恢复时间。正文没披露根因和受影响用户规模,这点先别太激动。短评:Issues 和 PR 挂了,GitHub 还在查,没给恢复时间,别急着恐慌。
HKR 分解
hook knowledge resonance
打开信源
44
SCORE
H1·K0·R1
07:46
5d ago
AI HOT 精选· aihot-apiZH07:46 · 06·08
PixVerse 创作者计划 2.0:每周最高 850 美元现金奖励
PixVerse 推出了面向 AI 视频创作者的合作伙伴计划 2.0,核心是鼓励真实创作,比如发测试、教程、短片或公开推广新想法。奖励方面:合格帖子每周最多拿 15 万积分(具体价值未披露);每周现金奖池 2500 美元,单个创作者一周最高能拿 850 美元——对个人来说算不错,但奖池总额不算高。另外对大项目、教程和电影节投稿有额外支持,还能获得更多曝...
#Multimodal#PixVerse#Product update
精选理由
HKR三项都过,但事实描述的是PixVerse的创作者补贴计划,不是模型、能力或生态发布。所以落在40-59的低价值区间。
一句话点评
PixVerse 把创作者激励计划升级到 2.0,核心是鼓励发测试、教程、短片这类真实内容。每周现金奖池 2500 美元,个人最高拿 850 美元——对个人创作者算不错,但总盘子不大。积分每周最多 15 万,但没披露具体价值,这点先别太激动。另外对大项目、教程和电影节投稿有额外支持,曝光和合作机会也提了,但正文没披露申请门槛和审核标准。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K1·R1
07:33
5d ago
r/LocalLLaMA· rssEN07:33 · 06·08
Gemma 4 12B QAT 在工具调用上翻车了
一位 Reddit 用户实测发现,Gemma 4 12B QAT 版本的工具调用不稳定,启动日志里 <|tool_response|> 和 </s> 这些 token 被覆盖了。同样跑在 RTX 4080 SUPER、32768 上下文下,之前标准 Q5_K_L 版本能稳定生成 2300 行代码和 10000 行故事文本。QAT 版本反而退步了,正文没...
#Agent#Tools#Code#Gemma
精选理由
一条 Reddit 实测帖,说 Gemma 4 12B QAT 版本工具调用不稳定,启动日志里 <|tool_response|> 和 </s> 这些 token 被覆盖了。同样跑在 RTX 4080 SUPER、32768 上下文下,之前标准 Q5_K_L 版本能稳定生成 2300 行代码和 10000 行故事文本,QAT 反而退步。有具体配置和对比数据,但只有单用户反馈,没有官方回应或跑分,所以分数压在 60–71 区间。
一句话点评
Gemma 4 12B QAT 版本工具调用翻车了,实测不如标准版。用户用 RTX 4080 SUPER 跑 32K 上下文,标准 Q5_K_L 能稳定生成 2300 行代码和 10000 行故事,QAT 版反而连 <|tool_response|> 这些 token 都覆盖了,工具调用不稳定。QAT 本意是量化加速,但这里牺牲了可靠性。注意这是单用户反馈,正文被 Reddit 屏蔽,无法验...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
07:05
5d ago
Hacker News 首页· rssEN07:05 · 06·08
AI产业讨论成本管理和token价格上升问题
TechCrunch 发了一篇标题叫《Token 末日要来了?》的文章,但正文内容没公开,只给了链接。Hacker News 上有 19 个点赞和 34 条讨论,说明这个话题在圈内有点热度。不过文章到底讲了什么——是算力成本暴涨、模型输出太贵,还是别的——目前完全不知道。信息缺口很大,先别急着下结论。
#TechCrunch#Hacker News#Commentary
精选理由
标题有悬念,但正文完全缺失,只有 Hacker News 上的少量互动,无法判断文章是否触及真实行业问题。信息缺口太大,硬性排除,分数上限被卡在 40 以下。
一句话点评
短评:Token 消耗失控,行业开始慌了。但正文没给具体数字,先别急着信。 点评:Tokenpocalypse(Token 末日)这个词说明行业终于意识到:模型推理成本不是线性增长,而是指数爆炸。三个信源都在讨论同一个焦虑——当用户量上来、上下文越塞越长,每轮对话的 Token 开销可能让公司直接亏本。TechCrunch 的报道标题说“账单到期了”,但 RSS 正文为空,没披露任何实际案...
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H1·K0·R0
05:21
5d ago
Hacker News 首页· rssEN05:21 · 06·08
给AI写个说明文档,它写代码会更好吗?
这篇帖子标题问的是“agents.md”文件(给AI助手看的项目说明文档)能不能帮编程AI干活更靠谱。但正文只丢了个X链接和一个arXiv论文链接,没交代实验怎么做的、结果怎么样。目前Hacker News上3个点赞、0条评论,说明还没人验证过。想抄作业的话得自己去翻论文。
#Agent#Code#Benchmarking#arXiv
精选理由
HKR-H和HKR-R都成立,因为AGENTS.md这个提问对用编程Agent的人来说很实际,也戳中了维护文档的痛点。HKR-K不成立:正文没披露实验设置、样本量和结果,只有链接,所以分数卡在60-71的all档。
一句话点评
短评:标题问 agents.md 能否帮编程 AI 干活,正文只扔了两个链接,没实验没结论,目前 HN 上 3 赞 0 评论,基本没人验证。 点评:标题是个好问题——agents.md 相当于给 AI 助手看的项目说明书,理论上能让编程 agent 更快理解代码库结构。但正文只贴了个 X 链接和一篇 arXiv 论文,没交代实验怎么做的、效果提升了多少、在哪些任务上测的。目前 Hacker...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
05:00
5d ago
FT · 科技· rssEN05:00 · 06·08
英国AI创企PhysicsX估值24亿美元,淡马锡领投
PhysicsX完成3亿美元融资,估值达到24亿美元,领投方是新加坡淡马锡。正文没披露营收、客户数量或产品指标,所以这个估值更多反映资本对AI+物理仿真赛道的押注,而不是公司当下的商业化验证。
#PhysicsX#Temasek#Funding
精选理由
HKR-H和HKR-K通过,因为3亿美元融资和24亿美元估值是硬信息,且FT是可靠来源。HKR-R弱,因为交易条款、营收和产品指标都没披露,所以这条留在all里。
一句话点评
英国AI物理仿真公司PhysicsX拿了淡马锡领投的3亿美元,估值冲到24亿。但正文被FT墙了,没披露营收、客户数或产品指标,所以这个估值更多是资本赌赛道,不是商业化验证。短评:估值24亿但没披露任何收入或客户数,纯赌AI+物理仿真赛道,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
03:24
5d ago
Hacker News 首页· rssEN03:24 · 06·08
圣地亚哥州立大学在学生宿舍装了1300个AI摄像头,没告诉学生
圣地亚哥州立大学(SDSU)花了130万美元,在校园里装了1300多个AI摄像头,其中330多个直接对着学生宿舍,光最大的一栋新生楼就装了79个。学生是从校报的公共记录请求里才知道这件事的,学校从来没通知过。这些摄像头用的是Avigilon品牌,厂家宣传了一堆AI功能,但正文没披露具体识别能力、部署时间或供应商信息。
#Vision#SDSU#Policy#Incident
精选理由
H/K/R三项都达标,但这是一起地方校园监控事件,不是模型、平台或监管更新。正文给了摄像头数量,但供应商、算法能力和部署时间都缺失。
一句话点评
SDSU 花130万美元在宿舍装了1300多个AI摄像头,最大一栋新生楼就79个,学生是从校报才知道的。学校没通知,也没说这些摄像头具体能识别什么、什么时候装的。隐私争议很大,但技术细节全缺,没法判断实际风险。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
03:06
5d ago
r/LocalLLaMA· rssEN03:06 · 06·08
有人在个人测试里用 Gemma4 31B FP8 跑出了接近 Sonnet 4.6 Medium 的水平
一位 Reddit 用户发帖说,他在自己的测试框架里用 Gemma4 31B FP8 模型跑出了跟 Sonnet 4.6 Medium 差不多的成绩。测试覆盖了五种任务:Cypher 图查询、实体抽取、工具调用、Python 代码编写和多向量检索摘要。注意这只是个人测试,不是标准基准,样本量和验证方式都不清楚,所以这个结论先别太当真。
#Agent#Code#RAG#Gemma
精选理由
HKR 三项都过:本地模型 vs Claude 的对比有钩子,31B FP8 和 5 种任务类型都披露了。但来源是个人 Reddit 帖子,权威性低,也没有原始分数表,所以不上 featured,维持当前评分。
一句话点评
一位Reddit用户在自己的测试框架里用Gemma4 31B FP8跑出了跟Sonnet 4.6 Medium差不多的成绩,覆盖了Cypher图查询、实体抽取、工具调用、Python代码和多向量检索摘要五种任务。但这是个人测试,不是标准基准,样本量和验证方式都不清楚,结论先别太当真。正文没披露具体分数、测试集大小和对比条件,所以这个“差不多”到底差多少、稳不稳定,都得打个问号。如果后续有第三...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
03:03
5d ago
彭博科技· rssEN03:03 · 06·08
黄仁勋说科技股跌了就是买入机会,AI才刚开始
英伟达CEO黄仁勋认为上周开始的全球科技股抛售反而是买入机会,理由是AI基础设施建设才刚起步。正文没披露他认为合理的估值水平、目标价或买入时机,所以这点先别太激动——他作为CEO当然看多自家赛道,但缺少具体数字支撑判断。
#Nvidia#Jensen Huang#Bloomberg#Commentary
精选理由
HKR-H和HKR-R通过:黄仁勋逆势喊买入会引发AI基建周期讨论。HKR-K不通过:正文没有给出估值、订单或资本开支数字,所以分数落在60–71区间。
一句话点评
黄仁勋说上周科技股抛售是买入机会,理由是AI基建才刚开始。正文没披露他认为合理的估值水平或目标价,所以这点先别太激动——CEO当然看多自家赛道,但缺少具体数字支撑判断。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
02:56
5d ago
彭博科技· rssEN02:56 · 06·08
摩根大通从野村挖来AI战略负责人
摩根大通正在从野村证券挖角其国际AI战略主管,具体姓名、入职时间、汇报关系和团队规模都还没披露。这条消息来自知情人士,正文被彭博的付费墙挡住了,所以没有更多细节。对华尔街来说,大行之间互挖AI战略人才说明金融业在抢着搭AI这班车,但具体这位主管要带多少人、做什么方向,目前只能等后续报道。
#JPMorgan Chase#Nomura Holdings#Personnel
精选理由
价值不高但不算噪音:HKR-R落在金融AI人才竞争上,HKR-H和HKR-K不成立因为缺姓名、入职时间和团队规模。
一句话点评
摩根大通从野村挖来国际AI战略主管,具体是谁、带多少人、向谁汇报都没披露。华尔街大行互挖AI人才不新鲜,但正文被彭博付费墙挡住,信息量约等于一条猎头动态。关键缺口:这位主管之前做了什么、JPM要押哪个方向——全没写。短评:大行抢AI人,但这条除了“挖了个人”啥也没说。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K0·R1
02:17
5d ago
r/LocalLLaMA· rssEN02:17 · 06·08
本地 TTS 哪家强?Reddit 用户实测推荐 moss-nano 和 Kokoro
一位 Reddit 用户在 LocalLLaMA 板块发帖,实测了几款本地 TTS 方案,结论是目前最适合边缘设备的是 moss-nano 和 Kokoro。帖子正文被屏蔽了,所以没有披露延迟、内存占用、声音克隆质量或手机端部署的具体数据。如果你在找能离线跑的语音合成,这两个名字可以先记下,但具体表现还得自己试。
#Audio#Agent#ElevenLabs#moss-nano
精选理由
HKR-K/R 通过:帖子给出了本地TTS选型结论,切中了自建部署在成本和隐私上的痛点。但它是Reddit讨论帖,正文被屏蔽,没有延迟、显存或声音克隆的具体指标,所以分数落在60–71区间。
一句话点评
Reddit 用户实测后推荐 moss-nano 和 Kokoro 作为本地 TTS 首选,适合边缘设备离线运行。但帖子正文被屏蔽,延迟、内存占用、声音克隆质量等关键数据缺失,无法判断实际效果。如果你在找能离线跑的语音合成,这两个名字可以先记下,但具体表现还得自己试。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
02:07
5d ago
机器之心 · 公众号· rssZH02:07 · 06·08
一个老哥用AI视觉+激光炮打蚊子,Reddit 5.7K赞
一位DIY爱好者用单反拍蚊子照片训练视觉模型,再连上一个电动云台和激光器,造了一台自动打蚊子的机器。激光发射前会先检查有没有人或者易燃物,避免误伤。Reddit帖子几小时内拿了5700多个赞和400多条评论。正文没披露识别准确率和激光功率,所以实际效果和安全性还不好判断。
#Vision#Robotics#Safety#Steven Cheng
精选理由
HKR-H和HKR-R都很强,HKR-K有具体的原型机制和Reddit数据支撑。但它只是一个个人硬件项目,不是模型、平台或主流产品发布,所以68分适合tier all。
一句话点评
一个DIY玩家用单反拍蚊子照片训练视觉模型,连上电动云台和激光器,造了台自动打蚊机。发射前会先检查人和易燃物,避免误伤。Reddit帖子几小时拿了5700多赞和400多条评论。正文没披露识别准确率和激光功率,实际效果和安全性还不好判断。如果是真的,挺省钱,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
02:05
5d ago
Hacker News 首页· rssEN02:05 · 06·08
德州电网警告:数据中心和矿场电压测试不合格
路透社报道,德州电网运营商警告,部分数据中心和加密货币矿场未能通过电压测试,可能威胁电网稳定。正文没披露具体测试标准、涉及多少站点,也没说整改截止日期。目前信息有限,但这类测试通常模拟大负荷波动,如果连基本电压都稳不住,说明这些设施的电力接入设计或设备质量有问题。德州电网本来就脆弱,极端天气下容易出事故,现在又多了这些大用户,风险确实在上升。
#Reuters#Hacker News#Incident
精选理由
H和R通过,因为电网电压故障直接关联数据中心供电约束。K不通过:正文缺少站点数量、测试标准和整改时间,所以留在all。
一句话点评
德州电网运营商警告,部分数据中心和加密货币矿场没通过电压测试,可能威胁电网稳定。正文没披露具体测试标准、涉及多少站点,也没说整改截止日期。目前信息有限,但这类测试通常模拟大负荷波动,如果连基本电压都稳不住,说明这些设施的电力接入设计或设备质量有问题。德州电网本来就脆弱,极端天气下容易出事故,现在又多了这些大用户,风险确实在上升。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
01:30
5d ago
● P1AI HOT 精选· aihot-apiZH01:30 · 06·08
OpenAI宣布第三阶段计划到2028年实现AI主导研究
Sam Altman 和 Jakub Pachocki 在 6 月 8 日发文,把 OpenAI 的路线图摊开了讲。公司内部判断,到 2028 年 3 月,AI 系统可能承担他们研究工作里“相当大一部分”,所以第一个目标是造一个能自动做 AI 研究的系统,帮研究员更快地测试想法、找错和迭代。第二个目标是加速经济增长,同时把收益分出去。第三个目标最直接:...
#Agent#Reasoning#Alignment#OpenAI
精选理由
Sam Altman 和 Jakub Pachocki 这次没画大饼,而是给了个带时间点的内部判断:到 2028 年 3 月,AI 可能接手 OpenAI 研究工作的相当一部分。我会先打个折,这种预测本身就有自我实现的成分,但把它写进公开路线图,说明内部对研究自动化的信心已经很高了。文章把目标拆成三个:造自动做研究的系统、加速经济并把收益分出去、以及最直接的安全对齐。信息量够,时间点具体,对从业者来说既是信号也是压力,值得马上写。
一句话点评
OpenAI 说 2028 年 3 月前要让 AI 接手自家一大部分研究工作,但没给出具体衡量标准,这个时间表先打个折看。
锐评
Sam Altman 和 Jakub Pachocki 联名发了篇博客,把 OpenAI 的路线图摊开了讲。核心判断就一个:他们相信未来几年内,AI 做 AI 研究本身会成为决定技术进步快慢的关键因素。为此,OpenAI 给自己定了个内部目标——到 2028 年 3 月,自家研究里要有“显著一部分”由 AI 系统配合人类研究员完成。这个说法很模糊,正文没披露“显著一部分”到底是 30% 还是 80%,也没说用什么指标衡量,所以这个时间节点的可信度要打折扣。 文章把 OpenAI 的发展划成三个阶段:第一阶段纯做研究,第二阶段变成产品公司,现在进入第三阶段,要让 AI 变得像电一样普及、便宜、安全,让每个人都能用上。他们还提了一嘴应该有个国际组织来协调前沿 AI 发展,必要时甚至可以集体踩刹车,但没给出任何具体机制或时间表。 整篇博客更像一份愿景声明,而不是可验证的路线图。缺的东西很明确:没有实现路径的中间里程碑,没有成本估算,也没有说明如何验证“AI 主导研究”是否真的达成了。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
01:15
5d ago
彭博科技· rssEN01:15 · 06·08
韩国AI芯片热冲击国债市场,股市波动率全球前列
彭博报道,韩国AI投资热潮正在给政府债券市场带来压力。正文被墙,具体收益率、期限和资金流向数据未披露。已知信息是韩国股市波动率排在全球前列。
#Bloomberg#South Korea#Commentary
精选理由
HKR-H靠AI与债券的罕见关联性通过,但HKR-K缺少收益率、期限或资金流向证据,HKR-R离AI从业者的日常决策太远。低价值的宏观周边内容。
一句话点评
韩国AI投资热把政府债市压得喘不过气,股市波动率已排全球前列。正文被墙,没披露具体收益率和资金流向,缺关键数据支撑。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
00:28
5d ago
Hacker News 首页· rssEN00:28 · 06·08
用 Python 手写一个感知机:你能造出的最小大脑
一篇面向初学者的感知机教程,从零开始用 Python 实现,附带交互式演示。文章用“约翰·杜决定是否接受工作 offer”的类比解释权重、偏置、决策边界、epoch 和学习率,并演示了为什么偏置在输入值远离零时必不可少(否则决策边界永远卡在 0)。正文没有披露训练数据规模、收敛所需 epoch 数或学习率的具体取值,也没有给出可复现的实验条件。
#Code#Commentary
精选理由
一篇面向初学者的感知机教程,用“约翰·杜决定是否接受工作 offer”的类比解释权重、偏置、决策边界等概念,并演示了偏置在输入值远离零时的必要性。正文没有披露训练数据规模、收敛所需 epoch 数或学习率的具体取值,也没有给出可复现的实验条件。对从业者来说信息量太少,没有实操价值或行业洞察,不值得推荐。
一句话点评
一篇从零手写感知机的入门教程,用“约翰·杜决定是否接受工作 offer”的类比解释权重、偏置、决策边界。交互式演示让读者直观看到训练过程。但正文没披露训练数据规模、收敛所需 epoch 数或学习率的具体取值,无法复现实验。适合初学者理解概念,但离工程实践还有距离。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
00:19
5d ago
r/LocalLLaMA· rssEN00:19 · 06·08
把 Galaxy Z Fold6 当本地推理节点用,还做了 SHA-256 模型校验
有人在 Galaxy Z Fold6 上跑了 Pocket Node,用 llama.cpp 的 Vulkan/OpenCL 后端加载 SmolLM3 Q4_0 1.1B GGUF 模型。亮点是首次加载时会做 SHA-256 校验,跟本地 registry 比对,校验不通过就阻止推理。这相当于给手机端推理加了一道防篡改检查,适合对模型完整性有要求的场景...
#Inference-opt#Tools#Samsung#llama.cpp
精选理由
这是一个 Reddit 上的单次实验,亮点是手机端推理加了 SHA-256 防篡改校验,适合对模型完整性有要求的场景。但正文没披露吞吐量、功耗、发热或稳定性数据,验证力度弱。作为本地推理的趣味搭建值得一看,但别急着当生产方案。
一句话点评
有人在 Galaxy Z Fold6 上跑了个叫 Pocket Node 的本地推理节点,加载 1.1B 参数的 SmolLM3 小模型,速度不会快,但亮点是首次加载时做 SHA-256 校验,跟本地 registry 比对,不通过就阻止推理。相当于给手机端推理加了一道防篡改检查,适合对模型完整性有要求的场景。正文没披露具体推理速度或功耗,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
00:11
5d ago
r/LocalLLaMA· rssEN00:11 · 06·08
Gemma4 QAT 量化版实测:速度翻倍,但编程能力没测
Reddit 用户报告 Gemma 31B QAT 量化版在 32K token 维基百科摘要任务上达到 50 t/s,比量化前的 21 t/s 快了一倍多。速度提升主要靠 MTP(多 token 预测)和量化。但作者没测编程能力——因为他平时写代码用的是 Qwen3.6 27B。所以这只是一个速度测试,编程场景的表现未知。
#Inference-opt#Code#Gemma#Qwen
精选理由
HKR-K 和 HKR-R 通过:帖子给出了具体的本地推理速度对比,并涉及量化取舍。来源是单个 Reddit 帖子,硬件、可复现细节和编程结果未披露,所以分数落在 60–71。
一句话点评
Gemma 31B QAT 量化版在 32K token 维基摘要任务上跑到 50 t/s,比量化前 21 t/s 快了一倍多。速度提升主要靠 MTP(多 token 预测)和量化。但作者没测编程——他平时写代码用 Qwen3.6 27B,所以这只是一个速度测试,编程场景表现未知。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
00:03
5d ago
FT · 科技· rssEN00:03 · 06·08
韩国靠AI芯片、造船和军火赚了一波
FT说韩国正从AI竞赛和全球冲突中受益,但正文被墙了,没披露具体公司、营收增长、订单量或时间范围。
#Financial Times#South Korea#Commentary
精选理由
FT这篇宏观角度确实有话题性,标题把AI竞赛和战争红利打包,容易吸引点击。但正文被墙,实际信息量很少——没有具体公司名、没有营收增长数字、没有订单量或时间范围,连“哪些芯片公司受益”都没说。所以H和R可以给过,K不行。对从业者来说,知道韩国在吃AI和军工红利就够了,但没法拿来做判断或决策。
一句话点评
FT说韩国靠AI竞赛和全球冲突赚钱,但正文被墙了,没披露具体公司、营收增长或订单量。标题提到芯片、船舶和军火,推测是三星、现代重工和韩华这类企业受益。数字和验证细节全缺,只能当方向性信号看,别当投资依据。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
00:00
5d ago
● P1AI HOT 精选· aihot-apiZH00:00 · 06·08
苹果发了第三代基础模型,一共五款,从手机端到云端都有
苹果在 2026 年 6 月 8 日公布了第三代 Apple Foundation Models(AFM),这次是和 Google 合作定制的。五款模型里,两款跑在设备上:AFM 3 Core 是 30 亿参数的密集模型,质量比上一代好;AFM 3 Core Advanced 是 200 亿参数的稀疏模型,但每次只激活 10 到 40 亿参数,靠的是把...
#Inference-opt#Tools#Apple#Google
精选理由
苹果这次一口气发了五款模型,分设备端和服务器端两条线,还拉上 Google 做定制,信息量够硬。30 亿参数的密集模型和 200 亿参数但每次只激活一小部分的稀疏模型,思路很明确:在手机上跑得动,在云端也能控成本。正文没给具体跑分和定价,所以我会先打个折,但官方发布本身就有分量,尤其对做端侧推理和隐私计算的人。
一句话点评
苹果把200亿参数的大模型塞进手机,靠的是按需从闪存加载专家模块,每次只激活1-40亿参数。但别急着喊革命,正文没给延迟和耗电数据。
锐评
苹果这次发布的第三代AFM,最值得看的是端侧模型AFM 3 Core Advanced。它用了一种叫“指令跟随剪枝”的技术,把200亿参数的稀疏模型存在闪存里,根据你的指令只唤醒需要的部分,每次激活1到40亿参数。这思路很聪明,绕开了手机内存小的硬伤,让更复杂的模型能在本地跑。 但文章没提关键指标:模型在手机上实际响应有多快?耗电增加多少?这些直接决定体验。另外,苹果强调和Google合作定制,连最强的云端模型AFM 3 Cloud Pro都跑在Google Cloud的NVIDIA GPU上,还保证隐私。这解决了算力问题,但也意味着苹果在云端推理上深度依赖外部硬件,长期成本和供应稳定性是个未知数。 整体看,架构创新是实打实的,但落地效果还得等实机测试。尤其是那个按指令加载专家的机制,在不同任务上稳定性如何,文章完全没展开。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
00:00
5d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 06·08
Vision Banana:一个模型靠画图打赢三个视觉专家
Google DeepMind 的 Vision Banana 把分割、深度估计、表面法线这些视觉任务全变成了“按指令画图”。同一个模型,只改提示词不改架构,在 Cityscapes 分割上 mIoU 69.9 超过 SAM 3 的 65.2,深度估计 δ1 0.929 超过 Depth Anything 3 的 0.918,法线估计误差 15.55 ...
#Vision#Multimodal#Google DeepMind#Vision Banana
精选理由
Google DeepMind 的 Vision Banana 把分割、深度估计、表面法线这些视觉任务全变成了“按指令画图”。同一个模型,只改提示词不改架构,在 Cityscapes 分割上 mIoU 69.9 超过 SAM 3 的 65.2,深度估计 δ1 0.929 超过 Depth Anything 3 的 0.918,法线估计误差 15.55——数字上确实压过了专用模型。但正文没披露模型大小、训练数据量、推理速度或成本,也没给代码或权重,所以目前只能当一篇有意思的研究看,离能用还有距离。HKR 里 H 和 K 都成立:标题有钩子,机制有新鲜...
一句话点评
Google DeepMind 把分割、深度估计等视觉任务全变成了“按指令画图”,一个模型一套权重,改提示词就能切换任务。在 Cityscapes 分割上 mIoU 69.9 超过 SAM 3 的 65.2,深度估计 δ1 0.929 超过 Depth Anything 3 的 0.918。关键是用极少视觉数据做指令微调,没让模型忘记画图。但论文没披露模型大小、训练数据量和完整基准分数,这点...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
00:00
5d ago
OpenAI 博客· rssEN00:00 · 06·08
OpenAI 启动经济研究交换计划,资助外部团队用其数据做 AI 经济影响研究
OpenAI 宣布成立 Economic Research Exchange,一个资助外部学者研究 AI 对就业、生产力和经济影响的平台。入选团队可以用 OpenAI 的工具和数据做研究,但必须遵守隐私保护和数据治理规则。申请截止 2026 年 7 月 5 日,7 月 31 日前通知结果。正文没披露资助金额、项目数量或具体合作时长,所以目前还不清楚这个...
#OpenAI#Research release
精选理由
HKR-K/R 通过:OpenAI 的经济学研究项目有相关性,也戳中了从业者的职业焦虑。正文只给了项目名称和申请条件,资助金额、截止日期和团队规模都没说,所以归入常规更新档位。
一句话点评
OpenAI 搞了个 Economic Research Exchange,资助外部学者用它的工具和数据研究 AI 对就业、生产力的影响。申请截止 7 月 5 日,7 月 31 日前通知结果。正文没披露资助金额、项目数量或合作时长,所以目前还不清楚这个盘子有多大、能出多少独立结论。短评:OpenAI 出钱让学者用自家数据做经济研究,但钱和项目数都没说,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1

更多

频道

后台