ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部

200 items · updated 3m ago
RSS live
2026-05-11 · 星期一2026年5月11日
03:24
34d ago
彭博科技· rssEN03:24 · 05·11
软银要在日本造AI数据中心专用大电池
软银旗下移动部门计划在大阪堺市工厂启动电池电芯量产,专供AI数据中心用电。正文没披露产能、投资额和投产时间,所以规模多大、什么时候能用上都不清楚。但方向很明确:AI数据中心耗电太猛,软银想自己下场解决供电瓶颈,而不是只靠电网扩容。
#SoftBank Group#Product update
精选理由
彭博报道有可信的AI基础设施角度,HKR三项都通过:跨界造电池够意外(H),大阪堺工厂细节是新信息(K),电力成本是数据中心扩张的敏感神经(R)。但产能、投资额、时间表全缺,分数卡在60–71区间。
一句话点评
软银要在大阪堺市工厂量产电池电芯,专供AI数据中心。方向很明确:AI耗电太猛,软银想自己解决供电瓶颈,不单靠电网。但正文没披露产能、投资额和投产时间,规模多大、什么时候能用上都不清楚。如果是真的,这对数据中心供电稳定性是个新思路,但先别太激动,等具体数字出来再说。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
02:06
34d ago
Hacker News 首页· rssEN02:06 · 05·11
adamsreview:给 Claude Code 加一套多人协作的 PR 审查插件
这是一个 Claude Code 插件,提供了 6 条斜杠命令,把 PR 审查拆成多阶段流水线:并行跑多个子 agent 做深度审查、自动修复循环、交互式走查,还能注入外部工具的发现结果。支持 Claude 或 Codex 做审查引擎,审查结果存成 JSON 文件,可选通过 Codex CLI 和 PR bot 做 ensemble review(多个...
#Agent#Code#Tools#adamsreview
精选理由
这是一个 Show HN 的小工具发布,功能描述具体(6 个命令、并行子智能体、JSON 状态),但正文没披露任何采用数据、基准测试或大厂背书,验证很弱。所以分数压在 60–71 区间合理,不往上调。
一句话点评
一个 Claude Code 插件,把 PR 审查拆成多阶段流水线:并行跑多个子 agent 做深度审查、自动修复循环、交互式走查,还能注入外部工具的发现结果。支持 Claude 或 Codex 做审查引擎,审查结果存成 JSON 文件,可选通过 Codex CLI 和 PR bot 做 ensemble review(多个模型交叉验证)。 短评:把单次审查拆成多 agent 流水线,思路...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
02:05
34d ago
AI HOT 精选· aihot-apiZH02:05 · 05·11
开源PPT工具鬼藏PPT技能更新:新增瑞士风格和AI自动配图
开源项目鬼藏PPT技能更新了,新增瑞士国际主义视觉风格,带克莱因蓝等四套主题色。核心升级是接入了GPT-Image 2.0,能根据PPT内容自动生成胶片质感配图、流程图和UI截图美化,不用自己找图了。还支持一键生成公众号、小红书、视频号的封面图,省去手动调整尺寸的麻烦。预设了22种版式和严格视觉规则,保证设计一致性。正文没披露生成一张图的具体成本和速度...
#Multimodal#Vision#Tools#鬼藏PPT技能
精选理由
一个小型开源工具的功能更新,功能点具体但影响面窄,仅覆盖创作者工作流,所以HKR中H和K通过。单一信源且影响范围有限,评分落在60–71的产品更新区间。
一句话点评
开源PPT工具鬼藏更新,接入了GPT-Image 2.0自动配图,省去自己找图的麻烦。新增瑞士风格和四套主题色,22种版式保证设计一致性,还能一键生成公众号、小红书封面。正文没披露生成一张图的具体成本和速度,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
01:59
34d ago
彭博科技· rssEN01:59 · 05·11
Alphabet 首次发行日元债,AI 军备竞赛烧钱要借日本钱
Alphabet 计划首次发行日元计价债券,募资用途跟 AI 投资需求挂钩。正文没披露发行规模、期限、票息、定价日和承销商,所以暂时不知道具体能融多少钱、成本多高。但选日元债这个动作本身说明:AI 军备竞赛烧钱太猛,连 Google 母公司都要去日本市场找便宜钱。
#Alphabet#Funding
精选理由
HKR 三要素都过线:首次日元债融资角度有新闻性,但正文缺关键数字(规模、利率、期限),也没有直接讲这笔钱具体投哪个 AI 项目。来源可靠(Alphabet 官方计划),AI 相关性间接,所以分数压在 60–71 区间合理。
一句话点评
Alphabet 首次发行日元债,募资用于 AI 投资。日元利率低,借日本的钱搞 AI 军备竞赛,成本比美元债便宜。但正文没披露规模、期限和票息,暂时不知道能融多少钱、多划算。如果是真的挺省钱,但这点先别太激动,等具体条款出来再说。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
01:21
34d ago
AI HOT 精选· aihot-apiZH01:21 · 05·11
HappyHorse AI视频引擎在阿里云Model Studio上线
HappyHorse自称是“面向生产就绪内容排名第一的AI视频引擎”,现在可以在阿里云Model Studio上直接用了。它强调两个卖点:一是能处理复杂的物理交互(比如物体碰撞、运动轨迹),二是原生1080p唇形同步(嘴型和音频对得上)。正文没披露具体延迟、成本或样本量,所以这点先别太激动。如果真能做到生产级,对做短视频、广告、虚拟主播的团队来说是个省...
#Multimodal#Vision#HappyHorse#Alibaba Cloud
精选理由
触发硬排除-云厂商推广:这是阿里云 Model Studio 的上架/推广信息。HKR-K 有具体的 1080p 唇形同步能力,但未提供定价、基准测试或访问条款。
一句话点评
HappyHorse 的 AI 视频引擎上线阿里云 Model Studio,主打“无需等待”,可能是端到端生成速度有优化。但正文没披露具体延迟数据、模型参数量或定价,也没说支持多长的视频。如果是实时生成短视频,对直播、营销场景挺实用;但没实测前先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K1·R0
00:28
34d ago
AI HOT 精选· aihot-apiZH00:28 · 05·11
OpenCLI 用命令行读微信朋友圈和群聊,把私域数据喂给 AI Agent
OpenCLI 项目做了三个命令行工具(wx-cli、tg-cli、discord-cli),能直接拉取微信、Telegram、Discord 的群消息、聊天记录、朋友圈和收藏夹。这意味着 AI Agent 不再只能看公开网页,还能读你的私人社交数据,形成真正的个人数据流。正文没披露发布版本、许可证,也没说微信会不会封这类工具。
#Agent#Tools#Memory#OpenCLI
精选理由
HKR 全过:钩子是私域消息数据当 agent 记忆用,工具名和数据来源都写清楚了。但毕竟只是个小工具发布,不是平台级产品;安全边界和可复现的部署方式都没提,所以放在 all 档。
一句话点评
OpenCLI 做了三个命令行工具,能直接拉微信、Telegram、Discord 的聊天记录和朋友圈,让 AI Agent 读到你的私人社交数据。正文没披露发布版本和许可证,也没说微信会不会封这类工具。想法挺实用,但合规风险不小,先别急着把私聊喂给 Agent。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
00:00
34d ago
● P1AI HOT 精选· aihot-apiZH00:00 · 05·11
Qwen-Image-2.0 技术报告:把视觉理解模型和扩散模型拼在一起,生图和改图用一个框架搞定
这篇技术报告介绍了 Qwen-Image-2.0,一个把生图和精确修图合到一个模型里的方案。它的做法是把 Qwen3-VL 当成“条件编码器”,去理解你输入的指令,再连上一个多模态扩散模型来出图。指令最长能塞进 1000 个 token。报告里说,这套架构在多语言文字渲染、画面排版质量、以及人工打分上都有提升,尤其适合文字多、构图复杂的场景。不过正文没...
#Multimodal#Vision#Qwen#Research release
精选理由
HKR 全中:Qwen 的旗舰图像模型报告给出了具体架构、1K 令牌指令输入和编辑能力,国产旗舰模型的信号足够强,必须写。
一句话点评
Qwen 把生图和修图塞进一个模型,用自家视觉模型当指令翻译官,最长能接 1000 个 token 的复杂指令。
锐评
这篇报告讲的是 Qwen-Image-2.0,一个把文生图和精确修图合二为一的模型。它的核心思路是用 Qwen3-VL 作为“条件编码器”,相当于让一个视觉语言模型先读懂你的指令,再指挥后面的扩散模型出图。指令最长能塞进 1000 个 token,意味着你可以提很复杂的构图要求。报告里说,这套架构在多语言文字渲染、画面排版质量上都有提升,人工打分也更高,尤其适合文字多、构图复杂的场景。 不过,报告正文没披露具体的模型参数量、训练数据规模和推理成本,也没给出和 Flux、SD3 等主流模型在标准基准上的直接对比数字。这些信息缺口让我没法判断它的实际性价比。另外,所有评估都来自团队内部,没有第三方验证,这点先别太激动。如果后续能放出公开可用的 demo 或 API,才能验证它是不是真的把“理解指令”和“出图质量”同时做好了。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
00:00
34d ago
Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·11
API key 放哪?个人电脑用 .env 够用,生产服务器别再用环境变量
给没有安全背景的开发者讲清楚两个场景:个人电脑上 .env 配合全盘加密就够用,因为威胁主要是自己手滑提交到 Git;生产服务器上环境变量会被同机器的其他进程看到、会出现在崩溃日志里,必须换用 systemd credentials 或 Keychain 做运行时注入。文章还点了一个常被忽略的事:轮换频率比存储方式重要得多,集中管理工具的真正价值是让轮...
#Safety#Commentary
精选理由
这是一篇面向初学者的安全指南,HKR-H和R都成立,但K不成立——正文没有可复现的配置或轮换机制,所以归入较低的all档。
一句话点评
短评:个人电脑用.env+全盘加密够用,生产服务器必须换systemd credentials或Keychain。轮换频率比存储方式重要。 点评:文章把API key管理拆成两个场景,讲人话。个人电脑上威胁主要是自己手滑提交到Git,全盘加密+权限600就够,不用上Vault。生产服务器上环境变量会被同机器其他进程看到、会出现在崩溃日志里,必须用systemd credentials或Ke...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
2026-05-10 · 星期日2026年5月10日
23:58
34d ago
r/LocalLLaMA· rssEN23:58 · 05·10
本地跑不动大模型,继续续费订阅
一位 Reddit 用户说自己的 GTX 1080 显卡已经报错,提示 Pascal 架构不受支持或已过时。他打算继续用订阅服务,直到花 1000–2000 美元能买到一张跑 30B–50B 模型、每秒几百 token 的显卡。正文没披露他具体用哪家订阅、每月花多少钱。
#Inference-opt#Nvidia#Reddit#Commentary
精选理由
HKR-R通过,因为本地模型用户确实在纠结显卡贵、速度慢、要不要继续买订阅。HKR-H和HKR-K不通过:这只是一个Reddit帖子里的个人硬件换机计划,不是有来源的产品或跑分新闻。没有触发硬排除规则。
一句话点评
一位Reddit用户抱怨GTX 1080已报错(Pascal架构被弃),打算继续用订阅直到花1000-2000美元能买到跑30B-50B模型、每秒几百token的显卡。这反映了本地跑大模型的硬件门槛:中端卡已不够用,但高端卡又太贵。正文没披露他用哪家订阅、每月花多少钱,所以无法判断订阅是否更划算。短评:老卡被淘汰,新卡太贵,订阅成了过渡方案。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H0·K0·R1
23:09
34d ago
Hacker News 首页· rssEN23:09 · 05·10
M4 MacBook 24GB 跑本地模型:Qwen 3.5-9B 量化版实测 40 token/s
作者在 M4 MacBook Pro(24GB 内存)上跑本地模型,最终选的是 Qwen 3.5-9B 的 Q4_K_S 量化版(4bit 量化,模型体积缩小到约 5-6GB),用 LM Studio 跑出约 40 token/s 的速度,还能开 128K 上下文窗口和思考模式。之前试过 Qwen 3.6 Q3、GPT-OSS 20B、Devstral...
#Inference-opt#Apple#Hacker News#Commentary
精选理由
HKR-H 和 HKR-R 靠 M4 24GB 本地推理这个具体硬件钩子成立,但 HKR-K 不通过:正文没披露模型、量化方式、速度、内存占用或可复现配置,信息不足以支撑知识性判断。
一句话点评
短评:M4 MacBook 跑本地模型终于能用了,但别指望它替你写代码。 作者在 24GB M4 MacBook Pro 上试了一圈,最后选了 Qwen 3.5-9B 的 4bit 量化版(模型压到 5-6GB),用 LM Studio 跑出约 40 token/s,还能开 128K 上下文和思考模式。这个速度够日常查资料、做简单规划,但离 SOTA 模型差得远——作者自己说“别想让它一口...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
23:02
34d ago
Hacker News 首页· rssEN23:02 · 05·10
让 Claude 当 IP 协议栈,Ping 它要多久?
作者让 Claude Code 扮演一个用户态 IP 协议栈,从 TUN 设备读原始 IP 包,自己解析 IPv4 和 ICMP 头、计算校验和,然后构造并回复 Ping 包。整个过程完全靠 Claude 的推理能力完成,不用任何现成的网络库或脚本。正文只展示了实验思路和 Claude 生成的指令文件,没有披露实际延迟数据、实验条件或成功率,所以“多快...
#Tools#Claude#Hacker News#Commentary
精选理由
只有 H 勉强成立:标题本身是个怪实验的钩子,但 RSS 没给延迟、实验条件或实现细节。没有硬性排除项,所以归入低价值档。
一句话点评
让 Claude 自己写指令文件,然后扮演 IP 协议栈处理 Ping 包,全程靠推理解析包头、计算校验和,不用任何现成网络库。正文没披露延迟数据、实验条件和成功率,所以“多快”没答案。思路挺好玩,但更像概念验证,离实用还远。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
22:43
34d ago
r/LocalLLaMA· rssEN22:43 · 05·10
Llama.cpp RPC 实测:跨三台电脑跑大模型值不值?
一位 Reddit 用户实测了 Llama.cpp 的 RPC 功能,把模型推理分散到最多三台电脑上:主力机 120GB 显存,第二台 22GB,第三台 16GB。结论是 RPC 在小上下文场景下可用,而且两边都跑 Linux 效果更好。但正文没贴出具体的 benchmark 数字(藏在截图里),所以没法直接判断延迟到底高多少、带宽够不够。如果你手头有...
#Inference-opt#Llama.cpp#Nvidia#Reddit
精选理由
H/K/R 三项都轻度达标:一手本地推理测试、具体硬件条件、有成本参考价值。但因为正文没披露图片里的吞吐数值,来源也只是 Reddit 单帖,所以留在 all 层级,不往上推。
一句话点评
实测把模型推理拆到三台电脑上(120GB+22GB+16GB显存),小上下文场景下能用,两边都跑Linux效果更好。但正文没贴具体benchmark数字,延迟和带宽瓶颈只能靠猜。如果是真的,等于白嫖多台旧机器拼显存,挺省钱。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
22:16
34d ago
r/LocalLLaMA· rssEN22:16 · 05·10
Via:一个 CLI 工具,让 Claude、Cursor 等 AI 工具共享上下文、任务和记忆
开发者开源了 Via,一个基于 MCP 风格的命令行集成层,能把不同 AI 工具连到同一个上下文、任务和记忆总线上。帖子说你可以让 Claude 和 Cursor 回答同一个问题,然后对比它们的共识、分歧和独特观点。但正文没披露架构细节、跑分数据、许可证或安装要求,所以实际效果和可用性还不清楚。
#Tools#Memory#Via#Claude
精选理由
这是一个 GitHub 刚发布的开源 CLI 工具,想法不错——让 Claude 和 Cursor 共享上下文、任务和记忆总线,还能对比两者的共识与分歧。但正文没披露任何采用数据、稳定性测试、协议细节或基准结果,目前就是个个人项目。68 分合理:概念有亮点,但验证太弱,别急着当成熟方案用。
一句话点评
Via 是一个命令行工具,让 Claude、Cursor 等 AI 工具共享上下文、任务和记忆,类似给它们装了个“共同大脑”。你可以让两个模型回答同一问题,对比共识和分歧。想法不错,但正文没披露架构细节、跑分数据或安装要求,实际效果和可用性存疑。短评:想法好,但缺细节,先观望。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
22:00
34d ago
NVIDIA 博客· rssEN22:00 · 05·10
黄仁勋在卡内基梅隆毕业典礼上说:你们的职业生涯从AI革命起点开始
NVIDIA CEO黄仁勋在卡内基梅隆大学第128届毕业典礼上演讲,核心观点是AI正在驱动历史上最大规模的基础设施建设,并把这定义为美国再工业化的机会。他引用了CMU在1950年代的Logic Theorist(早期AI程序)和1979年成立的机器人研究所来强调学校在AI史上的位置。他提出四个行动方向:安全推进、制定政策护栏、扩大接入、鼓励参与。整篇是...
#Safety#Robotics#NVIDIA#Jensen Huang
精选理由
HKR-R通过,因为黄仁勋用AI职业前景来开场,从业者容易共鸣;但HKR-H和HKR-K不通过:这是一场宽泛的毕业演讲,没有具体产品、模型、指标或机制。正文没披露任何技术细节或数据支撑,比如AI基础设施具体指什么、安全推进怎么落地,信息量有限。
一句话点评
黄仁勋在CMU毕业典礼上说,AI正驱动史上最大规模基建,这是美国再工业化的机会。他提了四个方向:安全推进、政策护栏、扩大接入、鼓励参与。但整篇是演讲摘要,没有具体数字、技术细节或新发布,更像立场声明。想看NVIDIA具体怎么落地这些方向,正文没披露。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K0·R1
21:58
34d ago
r/LocalLLaMA· rssEN21:58 · 05·10
开源超参搜索工具:给扩散模型调参时跑几个短训赛马,用损失曲线和视觉模型打分定赢家
作者做了个叫 Bracket 的开源工具,专门给扩散模型微调做超参搜索。核心思路是用 Optuna TPE 算法并行跑几组短训(训练量很小),然后靠两条标准打分:一是损失曲线的下降轨迹,二是本地跑一个视觉语言模型当裁判,直接看生成效果。最后用 Welch t 检验算置信度,输出一份 Markdown 报告告诉你哪组参数赢了。好处是省时间——不用把每套参...
#Fine-tuning#Vision#Benchmarking#Bracket
精选理由
这是一个Reddit上的单篇开源工具帖,有具体机制但缺乏采用数据、基准成绩或成本节省的验证。它落在60–71分这个实用小工具区间。
一句话点评
开源超参搜索工具 Bracket,专治扩散模型微调时“参数太多、试不过来”的痛点。它用 Optuna TPE 算法并行跑几组短训(训练量很小),然后靠两条标准打分:一是损失曲线下降轨迹,二是本地跑一个视觉语言模型当裁判,直接看生成效果。最后用 Welch t 检验算置信度,输出一份 Markdown 报告告诉你哪组参数赢了。好处是省时间——不用把每套参数都训到收敛再比。但注意:短训的结论不一...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
21:42
34d ago
r/LocalLLaMA· rssEN21:42 · 05·10
Cull:开源图片数据集清洗工具,能爬图、分类、写描述,一条流水线搞定
开发者 Compunerd3 开源了 Cull,一个 Python 3.10+ 的图片数据集清洗工具。它能从 Civitai、X/Twitter、Reddit、Discord 以及约 340 个 gallery-dl 源爬图,然后通过 LM Studio、Groq 或兼容 OpenAI 接口的视觉模型做分类和打标。分类输出严格遵循 17 个字段的 JS...
#Vision#Multimodal#Tools#Cull
精选理由
HKR-K和HKR-R通过:17个JSON字段、约340个来源和双质量门限提供了具体细节,数据集清洗成本是真实痛点。单个Reddit工具,没有热度、基准测试或案例研究,使其保持在普通开源工具区间。
一句话点评
Cull 是一个开源图片清洗流水线,能从 Civitai、Reddit 等 340+ 源爬图,再用本地视觉模型(LM Studio、Groq)按 17 字段 JSON 打分过滤。好处是端到端自动化,坏处是正文没披露分类准确率和处理速度,实际效果得自己试。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
21:16
34d ago
Hacker News 首页· rssEN21:16 · 05·10
马里兰居民被迫为外州AI数据中心掏20亿美元电网升级费
马里兰州的居民被摊派了20亿美元的电网升级账单,原因是外州的AI数据中心用电需求激增。州政府已向联邦能源监管机构投诉,称这笔额外费用违背了保护用户的承诺。正文没披露监管机构的具体回应,但20亿美元这个数字说明,AI的能源成本正在从科技公司转嫁给普通家庭。
#Maryland#Tom's Hardware#Hacker News#Policy
精选理由
HKR三项全过,但正文太薄:只确认了20亿美元账单、马里兰居民和外州AI数据中心,监管申诉细节未披露。讨论价值强,但信源不足,不够上精选。
一句话点评
马里兰居民被摊派20亿美元电网升级费,只为给外州AI数据中心供电。州政府已向联邦能源监管机构投诉,称这违背了保护用户的承诺。20亿说明AI的能源成本正从科技公司转嫁给普通家庭。正文没披露监管机构的具体回应,但这事提醒我们:AI基建的隐性成本可能比想象中大。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
18:53
34d ago
AI HOT 精选· aihot-apiZH18:53 · 05·10
Anthropic 没靠补贴拿下令牌份额第一
OpenRouter 发帖说 Anthropic 在没有补贴的情况下,令牌份额排到了第一。帖子没披露排名方法、具体份额比例和统计周期,所以这个“第一”的含金量还不好判断。
#Anthropic#OpenRouter#Benchmark
精选理由
OpenRouter 令牌份额是开发者真实调用量的一个代理指标,所以 HKR-H/R 通过。HKR-K 不通过,因为缺份额数字、统计周期和榜单口径,信息不足以支撑更高推荐层级。
一句话点评
OpenRouter 说 Anthropic 没补贴也拿下了令牌份额第一,但没给排名方法、具体比例和统计周期,这个“第一”的含金量要打个问号。如果数据真实,说明开发者自掏腰包也愿意用 Claude,对定价和口碑是强信号。缺的是第三方验证和细分场景(比如长上下文 vs 简单问答)的份额分布。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
18:46
34d ago
r/LocalLLaMA· rssEN18:46 · 05·10
给AI装个混合记忆:语义搜索+实体图谱,长对话回忆测试59%
Reddit用户测了一种混合记忆方案,把语义搜索和实体图谱拼在一起。在LoCoMo-10长对话回忆测试里,1534个问答对了59%;LongMemEval-S的500个问题里,前5名召回率84.8%;200个HotpotQA多跳问题,连接记忆检索对了71.5%。思路是把两种检索方式互补,但正文没披露具体延迟和成本,也没说模型大小和推理框架。
#RAG#Memory#Benchmarking#LocalLLaMA
精选理由
一条 Reddit 帖子,用户自己搭了三种记忆方案(语义搜索、实体图、混合)并跑分。LoCoMo-10 59% 说明长对话记忆刚及格,LongMemEval-S 检索 84.8% 不错,HotpotQA 多跳 71.5% 也还行。但正文没披露测试环境、模型版本、样本量,单点证据,验证弱。适合关注开源记忆方案的人看一眼,别当权威结论。
一句话点评
一个 Reddit 用户测了混合记忆方案:语义搜索+实体图谱。LoCoMo-10 长对话回忆 1534 题答对 59%,LongMemEval-S 前 5 召回 84.8%,HotpotQA 多跳检索 71.5%。思路是把两种检索互补,但正文没披露延迟、成本和模型大小,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
18:36
34d ago
AI HOT 精选· aihot-apiZH18:36 · 05·10
NousResearch 发了 Hermes 配置 Pareto Code 的文档
文档教你怎么在 Hermes 里设置 Pareto Code,但只给了 OpenRouter 路由配置链接,没提具体参数、版本或跑分。想抄作业的话,信息还不够。
#Agent#Tools#Code#NousResearch
精选理由
HKR 三项全无:内容只是 Hermes/Pareto Code 的配置链接,没有可衡量的结果、机制或落地范围,因此 HKR 0/3,tier 设为 excluded。
一句话点评
NousResearch 发了份文档教你怎么在 Hermes 里配 Pareto Code,但正文只甩了个 OpenRouter 路由配置链接,具体参数、版本、跑分一个字没提。想抄作业的话,信息缺口太大,得自己试。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H0·K0·R0
18:22
34d ago
r/LocalLLaMA· rssEN18:22 · 05·10
DeepSeek-V4-Flash 本地跑出 85 tok/s,靠的是自推测解码
Reddit 用户 LordNeel 放出了一个量化版 DeepSeek-V4-Flash,权重压到 W4A16+FP8,在两张 RTX PRO 6000 Max-Q 上跑 524k 长上下文,速度达到 85.52 tok/s。对比不开 MTP(自推测解码)时的 52.85 tok/s,快了约 60%。核心技巧是用模型自己的 MTP 头做推测解码,每次...
#Inference-opt#Reasoning#Benchmarking#DeepSeek
精选理由
这是一条 Reddit 用户发的本地推理优化跑分,数字扎实,62% 的加速比和 85 tok/s 的吞吐对长上下文场景很有吸引力。但硬件是两块 RTX PRO 6000,价格和获取难度都高,限制了普适性。来源是个人用户,权威性一般,所以分数卡在 70 附近。
一句话点评
Reddit 用户 LordNeel 放出了 DeepSeek-V4-Flash 的量化版,权重压到 W4A16+FP8,两张 RTX PRO 6000 Max-Q 上跑 524k 长上下文,速度 85.5 tok/s,比不开自推测解码快了约 60%。核心是用模型自己的 MTP 头做推测解码,每次只猜 1 个 token,成本低但加速明显。不过正文没披露具体量化精度损失和长上下文下的质量对比...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
17:55
34d ago
r/LocalLLaMA· rssEN17:55 · 05·10
本地 agent 记忆评测:YourMemory 在 LoCoMo 上 59% 对 Zep 的 28%,多跳问答加实体图后从 59.5% 涨到 71.5%
YourMemory 的作者放出了本地 agent 记忆检索的评测结果。在 LoCoMo-10 数据集(1534 个问答对)上,YourMemory 得分 59%,而 Zep Cloud 只有 28%,差距一倍多。在 200 条 HotpotQA 多跳问题上,加上实体图(entity graph)后,BOTH_FOUND@5 从 59.5% 提升到 7...
#Agent#Memory#RAG#YourMemory
精选理由
单篇 Reddit 作者自测,样本量不大(LoCoMo 1534 题、HotpotQA 200 题),验证强度有限,但本地 vs 云端的差距足够大,所以分数卡在 60–71 的上沿。正文没披露测试环境、模型版本和重复次数,这些缺口让结论不能全信。
一句话点评
YourMemory 在本地跑 agent 记忆检索,LoCoMo 上 59% 对 Zep Cloud 的 28%,翻倍不止。HotpotQA 多跳问题加实体图后 BOTH_FOUND@5 从 59.5% 提到 71.5%。但正文没披露数据集大小、测试环境、成本或延迟,本地跑的优势到底多大还不清楚。短评:本地记忆检索跑赢云服务一倍,但缺硬件和速度对比,先别急着换。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
17:49
34d ago
r/LocalLLaMA· rssEN17:49 · 05·10
加个 --no-mmap 参数,模型加载从几分钟变几秒
一位 Reddit 用户在 llama.cpp 里加了 --no-mmap 参数,模型加载时间从非常慢变成几秒。他之前一直不知道 mmap 是干嘛的,也没想过关掉它。实测环境是高速 NVMe 硬盘、ROCm、临时 8GB DDR5 内存条。关键点:如果你用高速 NVMe 加载模型,mmap 反而拖慢速度,关掉它直接用 GPUDirect 加载更快。正文...
#Inference-opt#Reddit#llama.cpp#ROCm
精选理由
一条 Reddit 个人经验帖,只测了一个参数和一套配置,不是系统评测。对本地跑模型的用户有参考价值,但样本单一,不值得上精选。
一句话点评
llama.cpp 加个 --no-mmap 参数,模型加载从“慢到怀疑人生”变成几秒。原理:高速 NVMe 上 mmap 反而成瓶颈,关掉让 GPUDirect 直接读盘更快。实测环境是 PCIe 5.0 NVMe + ROCm + 临时 8GB DDR5。注意这只是单用户单机经验,没对比不同硬盘或显存大小,通用性存疑。但如果你也卡在加载上,这招零成本值得一试。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R1
17:07
34d ago
r/LocalLLaMA· rssEN17:07 · 05·10
Gemma 4 26B(实际只激活4B)跑 three.js 一次成功,社区说挺香
Reddit 用户用 Gemma 4 26B(实际每 token 只激活 4B 参数)跑了大约 80 个 three.js 提示词,配合一个 Python 循环测试应用,声称模型能一次生成可用代码。正文没披露成功率,也没对比其他模型,所以这个“好”到底多好得打个折。亮点是 4B 激活量在本地跑得动,对 three.js 这种图形库的零样本生成能力如果真...
#Code#Google#Reddit#jacobpederson
精选理由
HKR-H 和 HKR-R 成立:一个 26B 的本地模型能一次生成 three.js 演示,对 LocalLLaMA 社区有吸引力,也切中编码成本之争。HKR-K 偏弱:这是 Reddit 上的个人经验,约 80 条提示,没有成功率、样本量或对照模型,验证不足。
一句话点评
Reddit 用户用 Gemma 4 26B(实际每 token 只激活 4B 参数)跑了约 80 个 three.js 提示词,声称能一次生成可用代码。亮点是 4B 激活量在本地跑得动,对图形库的零样本能力如果真这么强,本地开发能省不少事。但正文没披露成功率,也没对比其他模型,这个“好”得打折。另外 three.js 任务偏模板化,换成复杂逻辑可能就没这么顺了。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K0·R1
16:31
34d ago
Hacker News 首页· rssEN16:31 · 05·10
我试了日本 AIREC 养老机器人,感觉像提前看到了一个不太舒服的未来
作者亲自体验了日本 AIREC 养老机器人,但文章正文被付费墙挡住,只给了标题和链接。从标题看,作者对这次体验的评价偏负面,用了“反乌托邦”来形容。具体测试了什么功能、机器人的表现如何、价格多少,正文都没披露。
#Robotics#AIREC#The Telegraph#Hacker News
精选理由
HKR 的 H 和 R 都过了,但 K 没过——因为 RSS 正文只有标题级事实和极少的 HN 互动数据,没有测试细节或规格。既然信息量不够,这篇就留在 all 里,不上 featured。
一句话点评
记者亲测日本养老机器人AIREC,标题直接用了“反乌托邦”,态度偏负面。但正文被付费墙挡住,没披露任何测试细节——机器人做了什么、表现如何、价格多少,全不知道。目前只能看个标题,没法判断是真不行还是记者个人感受。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K0·R1
15:34
34d ago
TechCrunch AI· rssEN15:34 · 05·10
xAI 把孟菲斯数据中心全租给了 Anthropic,TechCrunch 觉得这更像 IPO 前的造势
Anthropic 包下了 xAI 在田纳西州 Colossus 1 数据中心的所有算力。TechCrunch 的 Equity 播客讨论了这个合作,态度偏悲观:xAI 自己都不怎么训练前沿模型了,很难再把自己包装成创新公司。更直接的说法是——这像是 SpaceX 上市前的一次“热身”。正文没披露交易金额、合同期限、产品范围,也没拿到 xAI、Anth...
#xAI#Anthropic#SpaceX#Partnership
精选理由
HKR-H/R 通过:xAI 和 Anthropic 这个组合本身就有话题性,标题直接表达怀疑态度,能吸引点击。HKR-K 不通过:交易金额、条款、时间表、官方表态全都没披露,信息缺口太大,所以分数落在 60–71 区间。
一句话点评
Anthropic 包下了 xAI 在田纳西州 Colossus 1 数据中心的所有算力。TechCrunch 的 Equity 播客对此态度悲观:xAI 自己都不怎么训练前沿模型了,很难再包装成创新公司,更像 SpaceX 上市前的热身。正文没披露交易金额、合同期限、产品范围,也没拿到 xAI、Anthropic 或 SpaceX 的官方回应。短评:算力转售,创新人设难保,上市前奏?
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
15:23
34d ago
r/LocalLLaMA· rssEN15:23 · 05·10
每秒跑多少 token 才算快?有人写了个脚本让你直观感受
Reddit 用户 MikeNonect 写了个 tokenspeed 脚本,模拟三种输出场景(纯文本、代码、推理+代码)下不同 token 速度的体感。比如 10 tokens/s 在纯文本里还行,但到代码生成就明显卡顿;Qwen 3.6-27B 跑 21 tokens/s 在推理场景下勉强能接受。脚本帮你把抽象数字变成肉眼可见的延迟,适合本地模型玩...
#Inference-opt#Code#Reasoning#MikeNonect
精选理由
一个 Reddit 实用帖,面向本地大模型用户。用 10/21 tokens/s 模拟三类输出,场景具体。事件规模小,分数卡在 60–71 区间合理。
一句话点评
Reddit 用户 MikeNonect 写了个 tokenspeed 脚本,让你直观感受不同 token 速度在三种场景(纯文本、代码、推理+代码)下的体感延迟。比如 10 tokens/s 纯文本还行,但代码生成就明显卡顿;Qwen 3.6-27B 跑 21 tokens/s 在推理场景下勉强能接受。脚本把抽象数字变成肉眼可见的延迟,适合本地模型玩家调优时参考。不过正文被 Reddit ...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:22
34d ago
Hacker News 首页· rssEN15:22 · 05·10
Chrome 的 AI 功能可能吃掉你 4GB 硬盘
The Verge 报道,Chrome 内置的 Gemini Nano 模型(本地跑的小型 AI)可能占用最多 4GB 存储空间。正文没披露具体是哪个版本、什么平台、怎么触发,也没说能不能删。4GB 对 SSD 紧张的设备(比如 128GB 笔记本)影响挺大,相当于多装一个《英雄联盟》。如果你没主动开 AI 功能,Chrome 也可能后台预下载模型,这...
#Google#Chrome#Gemini Nano#Commentary
精选理由
标题抛出一个很具体的存储膨胀数字(4GB),对关注端侧 AI 成本的从业者有吸引力,所以 H 和 R 都成立。但正文只有 RSS 元数据,没有 Chrome 版本、Gemini Nano 的加载机制或复现步骤,K 不通过。
一句话点评
Chrome 内置的 Gemini Nano 模型可能吃掉你 4GB 硬盘空间,相当于多装一个《英雄联盟》。对 128GB 笔记本用户来说挺肉疼,而且你没主动开 AI 功能,它也可能后台预下载。不过正文没披露具体是哪个 Chrome 版本、什么平台、怎么触发,也没说能不能删。这点先别太激动,等官方确认再说。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
15:01
34d ago
AI HOT 精选· aihot-apiZH15:01 · 05·10
Claude 被当成人来养,中期会有啥后果?
这篇帖子认为 Claude 的人格化定位(比如它是唯一有真人名字的 AI、训练方式刻意拟人、Anthropic 内部有“Claude 宪法”约束行为、还有粉丝画卡通形象)从中期看影响深远,好坏难说。但正文没披露任何数据、案例或实测效果,所以这点先别太激动——更像一个观察角度,不是结论。
#Alignment#Safety#Claude#Anthropic
精选理由
H和R通过,但K缺新数据、案例或可验证机制。Claude人格化评论符合受众兴趣,但证据太单薄,分数压在60–71区间。
一句话点评
Claude是唯一有真人名字的AI,训练方式刻意拟人,还有内部“宪法”约束行为,粉丝甚至画卡通形象。这种人格化定位中期影响深远,好坏难说。但正文没披露任何数据、案例或实测效果,所以这点先别太激动——更像一个观察角度,不是结论。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
13:51
35d ago
AI HOT 精选· aihot-apiZH13:51 · 05·10
单人48小时、不到10美元,AI把3D教学应用开发门槛打到了零
GPT Images 2和Gemini 3.1 Pro让一个懂生物学的普通人,不用写代码、不用懂3D建模,花两天时间和不到10美元就能做出一个3D教学应用。过去这得一个团队干几个月、烧不少钱。理论上,教师、家长也能自己造虚拟实验室这类互动工具,教育资源不再只属于精英机构。但正文没披露可复现的工作流、代码或产品链接,这点先别太激动。
#Multimodal#Code#Tools#GPT Images 2
精选理由
H和R两条通过:单人低成本做3D教学应用有话题性。K不通过:没有流程、成品链接或可验证的工具链细节,所以分数落在60-71区间。
一句话点评
一个懂生物的人用 GPT Images 2 和 Gemini 3.1 Pro,两天、不到 10 美元就做出了 3D 教学应用,过去这得团队干几个月。门槛确实降了,但正文没给可复现的工作流、代码或产品链接,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
13:31
35d ago
r/LocalLLaMA· rssEN13:31 · 05·10
给本地大模型配工具库:邮件、文件、爬虫全安排上了
一位用户在 Reddit 分享自己给本地跑的 Qwen 3.6 35B A3B Q8(量化版,显存友好)配了约 10 个 OpenWebUI 工具,包括 SMTP 发邮件(支持附件)、沙盒文件操作、网页抓取、查天气和体育信息,以及一个还在做的文档生成器。模型上下文窗口 256k,能一次塞不少资料。正文没披露工具调用的延迟和稳定性,但思路对本地部署做 a...
#Agent#Tools#Code#OpenWebUI
精选理由
HKR-K/R 通过,因为帖子给出了本地 agent 的搭建组合和风险较高的工具权限(SMTP、文件操作)。但缺少实际运行结果、代码或可复现的任务,价值有限,落在 40–59 低价值区间。
一句话点评
一位 Reddit 用户给本地跑的 Qwen 3.6 35B 配了约 10 个 OpenWebUI 工具,包括发邮件(支持附件)、沙盒文件操作、网页抓取、查天气和体育信息。模型上下文 256k,能一次塞不少资料。思路对本地部署做 agent 有参考价值,但正文没披露工具调用的延迟和稳定性,实际跑起来可能没那么顺。如果是真的,这套组合挺省钱,但验证还不够。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1
13:12
35d ago
r/LocalLLaMA· rssEN13:12 · 05·10
llama.cpp 新版本让两张 Blackwell 显卡不用 NCCL 也能并行跑模型
llama.cpp b9095 版本让 -sm 张量并行模式能在两张消费级 Blackwell PCIe 显卡上工作,而且不需要 NCCL(NVIDIA 的通信库)。这意味着如果你有两张 5090 或 5060 Ti,可以更简单地拼起来跑大模型,不用折腾 NCCL 配置。不过正文没披露实际跑起来有多快、延迟多少,作者说后续会测 2x5060 Ti 的性...
#Inference-opt#llama.cpp#NVIDIA#Bulky-Priority6824
精选理由
一个小型开源推理更新:NCCL-free 的 -sm 张量并行在双 Blackwell PCIe 上跑通,对本地双卡用户是具体进展。正文没披露任何 benchmark 或稳定性数据,所以分数压在 60–71 区间。
一句话点评
llama.cpp b9095 让两张消费级 Blackwell 显卡(如 RTX 5090/5060 Ti)能直接做张量并行,不用装 NCCL 通信库。对本地玩家是好事:省去配置 NCCL 的麻烦,两张卡拼起来跑大模型更简单。但正文没给任何性能数据——速度、延迟、显存占用全是未知数。作者说后续会测 2×5060 Ti,目前只能观望。如果是真的,低成本双卡推理门槛会降一截。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
13:05
35d ago
彭博科技· rssEN13:05 · 05·10
微软在非洲建数据中心,因要求肯尼亚政府担保付款而搁浅
微软在东非的大型数据中心项目推迟了,原因是它要求肯尼亚政府提供付款担保。正文没披露具体担保金额、合同年限和上线时间,所以暂时没法判断这事有多大影响。但核心矛盾很清楚:微软不想自己扛回款风险,而政府那边可能觉得条件太苛刻。这类基础设施项目一旦卡在付款条款上,往往意味着双方信任或预算上出了问题。
#Microsoft#Kenyan government#Policy
精选理由
Bloomberg信源可靠,H和K通过:肯尼亚付款担保卡住微软数据中心,有冲突有信息缺口。R偏弱:正文没披露金额、投产时间,也没说对AI算力或模型访问的直接冲击,所以不推荐。
一句话点评
微软在肯尼亚的大型数据中心项目因要求政府提供付款担保而推迟。正文没披露担保金额、合同年限和上线时间,所以暂时没法判断这事有多大影响。但核心矛盾很清楚:微软不想自己扛回款风险,而政府那边可能觉得条件太苛刻。这类基础设施项目一旦卡在付款条款上,往往意味着双方信任或预算上出了问题。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
12:57
35d ago
r/LocalLLaMA· rssEN12:57 · 05·10
Via 开源了一个 AI 工具通用集成层,让 Claude、Cursor、ChatGPT 共享上下文和记忆
Via 发布了一个开源集成层,能把 Claude、Cursor、Windsurf、ChatGPT、LangChain 等 AI 工具连到同一个上下文、任务和记忆总线上。说白了就是让不同 AI 工具之间能互相知道对方在干什么、记住之前聊过什么,不用每个工具各记各的。正文没披露具体架构、许可证类型和部署要求,所以实际怎么跑、能不能直接上手用还不清楚。如果是...
#Tools#Memory#Agent#Via
精选理由
HKR 三项都过,但只是一个 Reddit 发布帖,正文没披露架构、许可证和部署条件,信息缺口明显。评分卡在 60–71 的小型开源工具区间,不上推荐位。
一句话点评
Via 开源了一个“AI 工具总线”,让 Claude、Cursor、ChatGPT 等工具共享上下文和记忆,不用各记各的。想法挺好,但正文没披露架构、许可证和部署要求,实际能不能跑通、上手门槛多高都不清楚。先别太激动,等代码和文档出来再判断。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
11:01
35d ago
AI HOT 精选· aihot-apiZH11:01 · 05·10
BlackBar:一个给菜单栏加黑条的小工具
开发者 openclaw 为 @useblacksmith 做了个叫 BlackBar 的菜单栏工具,刚发了 v0.1.0 版,GitHub 上有 release 链接。正文没提这工具具体能干嘛、支持什么系统、用什么许可证,目前就是个空壳发布。
#Tools#openclaw#Blacksmith#BlackBar
精选理由
标题只说 BlackBar 菜单栏工具发布了,没有任何功能细节,也看不出和 AI 的明确关联。信息量太低,所以排除。
一句话点评
短评:一个菜单栏工具刚发了个v0.1.0,连功能介绍都没有,先别激动。 点评:开发者openclaw为Blacksmith做了个叫BlackBar的菜单栏工具,刚发了v0.1.0版,GitHub上有release链接。但正文没披露这工具具体能干嘛、支持什么系统、用什么许可证,目前就是个空壳发布。对于AI从业者来说,这类工具通常用于快速调用模型或管理API密钥,但信息缺口太大,无法判断是否值...
HKR 分解
hook knowledge resonance
打开信源
25
SCORE
H0·K0·R0
09:43
35d ago
r/LocalLLaMA· rssEN09:43 · 05·10
万米高空用 Qwen 3.6 修飞机 Wi-Fi,agent 几秒搞定
一位 Reddit 用户在 5 小时航班上,用 Qwen 3.6 35B A3B 本地模型调试 Ubuntu 的飞机 Wi-Fi 连不上问题。模型以 agent 模式跑,几秒内给出 nmcli 命令修复——原因是 systemd-resolved 用了 Docker DNS 而非网络网关,导致 captive portal 弹不出来。全程离线,笔记本电...
#Agent#Code#Tools#Qwen
精选理由
单条 Reddit 排障帖,不是可复现测试或官方发布,证据强度有限。但场景新鲜、细节具体,对从业者有启发,适合放在 60–71 分段的“有趣实践”类。
一句话点评
有人在万米高空用 Qwen 3.6 35B A3B 本地模型修好了 Ubuntu 连不上飞机 Wi-Fi 的问题。模型以 agent 模式跑,几秒内给出 nmcli 命令,原因是 systemd-resolved 用了 Docker DNS 而非网络网关,导致 captive portal 弹不出来。全程离线,笔记本电池供电。亮点是:35B 的 MoE 模型在消费级硬件上能跑 agent 任...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
08:36
35d ago
AI HOT 精选· aihot-apiZH08:36 · 05·10
OpenCode 把 Ring 2.6 1T 模型限时免费开放了
OpenCode 临时开放了 Ring 2.6 1T 模型的免费访问,支持 256K 上下文窗口、推理能力,且是纯文本模型。但正文没披露免费截止日期,想用的话得抓紧,别指望长期白嫖。
#Reasoning#OpenCode#AntLingAGI#novita_labs
精选理由
这是一条小产品开放消息:H来自1T免费试用这个钩子,K来自256K上下文等细节。免费期限、定价和评测都没提,所以分数卡在60-71之间。
一句话点评
OpenCode 临时把 Ring 2.6 1T 模型免费开放了,支持 256K 上下文和推理,纯文本模型。但正文没披露免费截止日期,想用的话得抓紧,别指望长期白嫖。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
08:22
35d ago
Hacker News 首页· rssEN08:22 · 05·10
LLMorphism:当人类开始把自己当成语言模型
这篇论文提出了一个新概念“LLMorphism”,指一种偏见:人们开始相信人脑的运作方式跟大语言模型一样。作者认为,随着对话式LLM越来越像人,这种偏见会更容易在心理上被接受——既然LLM能像人一样说话,那反过来,人可能也像LLM一样思考。这个推论是错的,因为语言输出相似不代表认知架构相同。LLMorphism可能通过两种机制扩散:一是“类比迁移”,把...
#arXiv#Hacker News#Research release#Commentary
精选理由
H 和 R 通过:标题有钩子,话题能引发从业者共鸣。K 不通过:正文没披露任何方法、样本、结论或可验证的论断,信息量不足以支撑高评级,所以归为 all 低层。
一句话点评
这篇论文提出了一个新概念“LLMorphism”,指一种偏见:人们开始相信人脑的运作方式跟大语言模型一样。作者认为,随着对话式LLM越来越像人,这种偏见会更容易在心理上被接受——既然LLM能像人一样说话,那反过来,人可能也像LLM一样思考。这个推论是错的,因为语言输出相似不代表认知架构相同。LLMorphism可能通过两种机制扩散:一是“类比迁移”,把LLM的特征投射到人身上;二是“隐喻可用...
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
08:03
35d ago
Hacker News 首页· rssEN08:03 · 05·10
Gen Z 对 AI 的愤怒在涨,使用量却停滞了
沃尔顿家族基金会联合盖洛普做了一份调查,发现 Z 世代(14-29 岁)对 AI 的态度正在变差。虽然 51% 的人还在每周用 AI,但使用率一年只涨了 4 个百分点,基本算停滞。感到“愤怒”的比例从 22% 升到了 31%,感到“兴奋”和“有希望”的人分别掉了 14 和 9 个百分点。将近一半的 Z 世代打工人(48%)觉得 AI 在工作中的风险大于...
#Walton Family Foundation#Hacker News#Commentary
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过:正文没披露任何调查数据、样本或方法。角度有讨论价值,但 RSS 提供的证据太薄,不够上推荐位。
一句话点评
短评:Z世代对AI的愤怒一年涨了9个百分点,但51%的人还在用——嘴上骂身体诚实。 沃尔顿家族基金会和盖洛普的联合调查显示,14-29岁年轻人对AI的“愤怒”比例从22%升到31%,“兴奋”和“有希望”分别跌了14和9个百分点。每周使用率只涨了4个百分点,基本停滞。48%的Z世代打工人认为AI在工作中的风险大于收益,比去年涨了11个百分点。80%的人担心用AI加速完成任务会让学习变难。 ...
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
07:52
35d ago
AI 群聊日报· atomZH07:52 · 05·10
群聊日报:Markdown vs HTML 争论、DeepSeek V4 Pro 工具调用差距、TDD 讨论续
今天群聊最热闹的是 Claude Code 团队成员一条推文引发的 Markdown vs HTML 格式大战,十几人参与后共识是这更像稻草人论证甚至“Token 阳谋”——MD 是 source of truth,HTML 是展示层。技术含金量最高的是 DeepSeek V4 Pro 工具调用复盘:同一模型在不同平台成功率从 4% 到 35%,相差近...
#Code#Tools#Claude Code#DeepSeek
精选理由
HKR-K/R 通过:4%-35% 的工具调用成功率区间是具体讨论点,可靠性问题对编码智能体用户有实际意义。信息来源单薄,只适合放在低价值汇总栏。
一句话点评
同一模型在不同平台工具调用成功率从4%到35%,差9倍——不是模型不行,是harness没接好。开发者修了不到100行代码就让V4 Pro在内部评测里6/10胜过Opus 4.7。正文没披露修复后的通用性,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1
06:00
35d ago
● P1FT · 科技· rssEN06:00 · 05·10
Elon Musk诉讼案审判揭示OpenAI快速崛起背后的竞争
马斯克起诉 OpenAI 的官司进入最后一周,Sam Altman 即将出庭作证。正文被付费墙挡住,看不到具体证词和庭审细节,但标题点明了核心矛盾:OpenAI 从非营利转向商业巨头的过程中,早期创始人之间的分歧和竞争关系被公开审视。8520 亿美元这个估值数字本身就在说明,这场官司不只是理念之争,背后牵扯的利益规模已经大到难以私下和解。
#OpenAI#Elon Musk#Sam Altman#Incident
精选理由
这条稿子本身没有模型、产品、融资或高管变动,纯粹是法庭进展和估值数字。我会先打个折:8520亿这个数正文没交代来源和计算方式,只能当标题信息用。但HKR三项都成立——标题自带冲突和人物,时间节点清晰,话题又压在OpenAI治理和巨头博弈的敏感带上,所以放在featured档位没问题,不升到P1。
一句话点评
马斯克告 OpenAI 的庭审第二周,OpenAI 总裁 Brockman 反咬一口,说当年是马斯克自己急着要成立营利部门,还曾试图挖走 Altman 去特斯拉。
锐评
这场官司打到第二周,核心变成了“谁在说谎”。马斯克说 Altman 和 Brockman 骗了他 3800 万美元捐款,把非营利搞成了营利;Brockman 则作证说,2017 年 OpenAI 在 Dota 2 上赢了人类顶尖玩家后,马斯克就发邮件说“是时候成立营利公司了”,还为此在自家豪宅开了派对。Shivon Zilis 的证词更直接,透露马斯克曾想挖 Altman 去特斯拉领导 AI 实验室。这些细节把马斯克塑造成一个争夺控制权失败、现在想用诉讼拖垮竞争对手的人。 目前信息全来自庭审证词和双方公开的邮件,没有独立第三方核实。马斯克要求的赔偿金额高达 1340 亿美元,这个数字怎么算出来的,正文没披露具体依据。另外,OpenAI 的安全记录到底有没有问题,报道只提了标题,没有展开具体案例。这场审判的结果会直接影响 OpenAI 冲击近万亿美元估值的 IPO,但判决前,双方的说法都只能当一面之词看。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
05:52
35d ago
r/LocalLLaMA· rssEN05:52 · 05·10
有人在两块 V100 上跑了 Qwen3.6-27B,长文本速度掉得挺明显
Reddit 用户用两块 Tesla V100-SXM2 32GB 跑 Qwen3.6-27B 的 Q8_0 量化版,测了不同上下文长度下的推理速度。4K 上下文时每秒处理 797 个 token,拉到 64K 降到 473,到 200K 只剩 267。长文本场景下速度衰减超过 66%,说明 V100 的老架构(没有 Flash Attention 硬...
#Code#Inference-opt#Benchmarking#Qwen
精选理由
HKR-K/R 通过:473.34 t/s 和 267.16 t/s 给本地推理读者提供了具体数据点。来源是单个 Reddit 求助帖,条件窄(Q8_0/pp2048),所以留在 all 层。
一句话点评
两块V100 32GB跑Qwen3.6-27B的Q8量化版,4K上下文时每秒797 token,拉到200K只剩267,衰减超66%。老架构没有Flash Attention硬伤明显,长文本场景基本告别。正文没披露显存占用和功耗,但成本上V100二手便宜,适合短上下文推理。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K1·R1
05:01
35d ago
r/LocalLLaMA· rssEN05:01 · 05·10
怕选错模型?ChatGPT 5.5 被吐槽缩水,Gemma 本地跑不动
一位 Reddit 用户抱怨,ChatGPT 在移除 4o 和 5.1 Thinking 后,写故事变难用了;5.4T 和 5.5T 版本限制更多。他本地跑 Gemma 4 31B 能运行,但 LM Studio 不支持上传项目文件或跨对话记忆,而他手头有 1000 页笔记需要管理。正文没披露他具体用的什么硬件,也没说 5.5T 相比 5.4T 到底砍...
#Memory#Tools#OpenAI#ChatGPT
精选理由
一条Reddit用户吐槽,没有基准测试或平台确认,属于用户反馈级别,不推荐上首页。
一句话点评
用户抱怨ChatGPT砍掉旧模型后写故事变难,5.5T限制更多;本地跑Gemma 4 31B能运行,但LM Studio不支持上传项目文件或跨对话记忆,而他手头有1000页笔记需要管理。正文没披露具体硬件,也没说5.5T相比5.4T到底砍了什么。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
04:21
35d ago
r/LocalLLaMA· rssEN04:21 · 05·10
知道和真懂之间差什么?一个 Reddit 用户说本地模型帮他跨过了这道坎
一位 Reddit 用户在 LocalLLaMA 社区分享心得:他通过反复实验本地 LLM 得出了一条铁律——先用现成的兼容工具。文中只提到他在 Open WebUI 里用 minimax2.7 本地版润色过文本,没有披露任何基准测试、部署成本或模型参数。正文被屏蔽,无法获取更多细节,所以不清楚他具体做了什么实验、用了什么硬件、效果如何。核心信息就一句...
#Tools#Reddit#minimax2.7#Open WebUI
精选理由
HKR-R 靠本地 LLM 工作流中的工具兼容性痛点过关,但 HKR-H 太泛,HKR-K 缺少数字、方法或可复现的测试,正文只说了 minimax2.7 local 在 Open WebUI 里润色了帖子,没有披露具体步骤或对比数据。
一句话点评
短评:一条心得帖,正文被屏蔽,信息量约等于零。 一位Reddit用户在LocalLLaMA社区分享了他玩本地大模型的体会:先用现成的兼容工具。他提到在Open WebUI里用minimax2.7本地版润色过文本,但没披露任何基准测试、部署成本或模型参数。正文被屏蔽,无法获取更多细节,所以不清楚他具体做了什么实验、用了什么硬件、效果如何。核心信息就一句“先用现成工具”,这对本地模型玩家来说几...
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K0·R1
04:00
35d ago
FT · 科技· rssEN04:00 · 05·10
AI 抢行政岗,女性首当其冲
FT 报道,AI 正在接管行政类工作,而这类岗位女性占比很高,因此受自动化冲击最大。文章说劳动力市场的损失已经能感受到,但没有披露具体失业规模或调查方法,所以这个“已经”有多大、数据来源是否可靠,正文都没说。
#Financial Times#Commentary
精选理由
H 和 R 通过:FT 角度有话题性且紧扣岗位替代焦虑。K 不通过:正文既没给裁员数字,也没说明样本来源或自动化如何落地,所以维持 all 层级。
一句话点评
FT 报道 AI 接管行政工作,这类岗位女性占比高,所以受冲击最大。文章说劳动力市场损失“已经能感受到”,但没披露具体失业规模或调查方法,这个“已经”有多大、数据来源是否可靠,正文都没说。短评:观点对,但缺数据支撑,先别急着引用。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
03:32
35d ago
AI HOT 精选· aihot-apiZH03:32 · 05·10
七个月用AI搭一个一人公司,月入7万
Anthropic联合创始人说首个十亿美元一人公司快出现了,但普通人更实际的目标是月入7万。路线分七步:选一个具体、能重复做的付费任务;把系统提示词写成详细的岗位描述;用MCP工具链把AI连进实际工作流,实现自动化;反复调提示词;最后系统自己跑,创始人每周只花少量时间处理异常。关键不是技术多完美,而是找到别人愿意付钱的痛点,快速给个能用的方案。正文没披...
#Agent#Tools#Anthropic#Commentary
精选理由
HKR三项都过,但这是一条X上的路线图帖子,不是产品发布或命名实验。正文没有给出公司案例、收入证明或可复现的结果,所以放在较低的“all”档。
一句话点评
短评:月入7万路线图,核心是找付费痛点+自动化,但正文没披露具体案例和收入验证。 点评:Anthropic联合创始人说首个十亿美元一人公司快出现了,但普通人更实际的目标是月入7万。路线分七步:选一个具体、能重复做的付费任务;把系统提示词写成详细的岗位描述;用MCP工具链把AI连进实际工作流,实现自动化;反复调提示词;最后系统自己跑,创始人每周只花少量时间处理异常。关键不是技术多完美,而是找...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
03:22
35d ago
Hacker News 首页· rssEN03:22 · 05·10
Gemini API 文件搜索现在支持图片和视频了
Google 把 Gemini API 的 File Search 工具升级成了多模态,也就是说除了文字,现在还能搜图片和视频里的内容。官方说这样搭出来的 RAG(外挂资料库)更高效、结果也能溯源验证。但正文没披露具体支持哪些文件格式、搜索时怎么处理多模态内容、以及怎么收费。如果你正想给应用加个能搜图片的问答功能,这个更新值得关注,但先别急着动手,细节...
#RAG#Multimodal#Tools#Google
精选理由
HKR-H 和 HKR-K 通过:这是 Google Gemini API 的真实能力更新,但正文只有标题级信息,缺文件类型、RAG 机制和定价,所以留在 high all 区间。
一句话点评
Google 把 Gemini API 的 File Search 升级成多模态,现在能搜图片和视频里的内容了。官方说这样搭出来的外挂资料库更高效,结果还能溯源。但正文没披露支持哪些文件格式、怎么处理多模态内容、以及怎么收费。如果你正想给应用加个能搜图片的问答功能,这个更新值得关注,但先别急着动手,细节还不够。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
02:25
35d ago
AI HOT 精选· aihot-apiZH02:25 · 05·10
Lee Robinson 的 11 条求职建议:简历一页、GitHub 秀代码、别用 AI 写求职信
Lee Robinson 从大量审阅简历的经验出发,给工程师 11 条求职建议。核心是简历要简洁专业:限制一页、别放照片、GitHub 展示代码而非装饰。个人网站和 LinkedIn 要用心维护,X 内容得清理。申请时针对不同公司调整重点,务必提 AI 技能(顺应趋势),项目重质不重量。别用 AI 生成求职信和简历,保持真实。展示个人爱好能帮建立人际连...
#Code#Lee Robinson#GitHub#LinkedIn
精选理由
这是通用的工程师求职建议,不是AI行业新闻。HKR-R靠就业焦虑勉强通过,但HKR-H和HKR-K都不达标,低相关性让它不值得收录。
一句话点评
Lee Robinson 给工程师的 11 条求职建议,核心是简历一页、不放照片、GitHub 展示代码而非装饰。个人网站和 LinkedIn 要用心,X 内容得清理。申请时针对不同公司调整重点,务必提 AI 技能(顺应趋势),项目重质不重量。别用 AI 生成求职信和简历,保持真实。展示个人爱好能帮建立人际连接。 短评:建议偏常识,但“别用 AI 写求职信”这点值得留意——HR 可能已经看腻了。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R1
02:00
35d ago
TechCrunch AI· rssEN02:00 · 05·10
Wispr Flow 押注印度语音 AI:最难的市场,增长却最快
Wispr Flow 说印度现在是它增长最快的市场,已经先上了印地语和英语混着说的 Hinglish 语音输入。但正文没披露具体用户数、增长率、定价,也没说要在当地招多少人。印度用户习惯发语音、用多语言,但语音 AI 产品还很零散,变现也难,Wispr 赌的就是这个缺口。
#Audio#Wispr Flow#TechCrunch#Product update
精选理由
TechCrunch 这篇有明确的印度/Hinglish 角度,H 和 K 都成立。但正文没披露用户数、增速、定价或本地团队规模,所以停留在常规产品市场报道的区间,不触发 R。
一句话点评
Wispr Flow 说印度是增长最快的市场,已上线印地语+英语混说的 Hinglish 语音输入。但正文没披露具体用户数、增长率、定价,也没说要在当地招多少人。印度用户习惯发语音、用多语言,但语音 AI 产品还很零散,变现也难,Wispr 赌的就是这个缺口。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
2026-05-09 · 星期六2026年5月9日
23:37
35d ago
纽约时报中文网· rssZH23:37 · 05·09
中国两名前国防部长被判死缓,涉受贿指控
中国军事法院判处前国防部长魏凤和、李尚福死刑缓期两年执行,罪名是受贿和行贿。新华社的公告没披露具体指控细节。两人是习近平清洗军队高层以来被公开判刑的最高级别将领。据华盛顿战略与国际研究中心估算,已有约100名高级军官被撤职或消失。分析人士认为,判决对军中其他人起警示作用,但也严重削弱了高层指挥系统——中央军委从2022年的七人缩减到只剩习近平和主持反腐...
#Wei Fenghe#Li Shangfu#Xi Jinping#Policy
精选理由
H和K都达标:政治事件+具体人名和判决。但R不沾边,这条新闻跟AI产品、模型、政策或行业结构都没关系。硬排除规则(barely-AI-related)封顶40分,所以给了32分和excluded。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K1·R0
23:31
35d ago
AI HOT 精选· aihot-apiZH23:31 · 05·09
Google 开放 Fitbit Air 健康 API,开发者可拿 31 种真实数据做个人健康自动化
Google 随新款 Fitbit Air 发布了 Health API,开放了运动、睡眠、心率、血氧等 31 种健康数据点。支持 Webhooks 实时推送、细粒度读写权限、按时间范围查询和汇总。开发者可以用这些真实个人数据搭 AI Agent、MCP Server、CLI 或实时监控系统,实现健康自动化工作流。官方已给出首次调用教程。注意:API ...
#Agent#Tools#Google#Fitbit
精选理由
硬排除:这篇讲的是 Google/Fitbit 健康 API 的数据和权限机制,没有模型、agent 或 AI 产品层面的含义。H/K/R 三项对目标读者都不相关。
一句话点评
Google 开放了 Fitbit Air 的 Health API,提供 31 种健康数据点(运动、睡眠、心率、血氧),支持 Webhooks 实时推送和细粒度权限控制。开发者可以用真实个人数据搭 AI Agent 或自动化工作流,官方已给出首次调用教程。注意:API 目前仅限 Fitbit Air 用户,且正文没披露调用配额和定价,如果是免费或低成本,对健康类 Agent 开发者是个实用入口。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K0·R0
23:00
35d ago
Hacker News 首页· rssEN23:00 · 05·09
用户用摩斯密码骗过 Grok,让 Bankrbot 转出 20 万美元代币
有人在 X 上发了一条摩斯密码消息,绕过了 Grok 的安全检查,诱导它命令 Bankrbot 从链上转出 30 亿枚 DRB 代币,价值约 20 万美元。攻击利用了 AI 代理的自主权限——Bankrbot 被授权执行链上转账,Grok 又没识别出摩斯密码里的恶意指令。正文没披露这笔交易的具体哈希值、攻击者身份或 Bankrbot 的权限设置细节,所...
#Agent#Safety#Tools#Grok
精选理由
HKR-H 和 HKR-R 通过:编码后的提示词触发钱包操作,这件事值得聊。HKR-K 不通过:金额、链上证据和复现条件都没披露,所以只能放在 all 层级。
一句话点评
有人用摩斯密码骗过 Grok,让它命令 Bankrbot 转出 30 亿枚 DRB(约 20 万美元)。攻击利用了 AI 代理的自主权限——Bankrbot 被授权执行链上转账,Grok 没识别出摩斯密码里的恶意指令。正文没披露这笔交易的具体哈希值、攻击者身份或 Bankrbot 的权限设置细节,所以无法验证攻击是否真实发生、代币是否真的被转走。如果是真的,这暴露了两个问题:一是 AI 代理...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
22:27
35d ago
Product Hunt · AI· rssEN22:27 · 05·09
AgentPeek:把 Claude Code 和 Codex 塞进 Mac 刘海
一个 Mac 菜单栏小工具,让你在屏幕顶部的刘海区域直接监控 Claude Code 和 Codex 的运行状态——能看到会话、权限、token 用量和本地开发服务器。数据全留在本地,不上传。正文没披露具体怎么实现、卖多少钱、什么时候正式上线,但如果你同时跑多个 AI 编程助手,这个“瞄一眼”的体验应该挺实用。
#Agent#Code#Tools#AgentPeek
精选理由
H 通过是因为 Mac 刘海放 Claude Code/Codex 这个 UI 切入点比较新奇。K 和 R 不通过:正文缺机制、定价、发布时间,也没有可量化的工作流影响,属于低价值的产品更新信息。
一句话点评
短评:在Mac刘海屏上瞄一眼Claude Code和Codex的状态,数据本地保存,适合多Agent并行的开发者。但正文没披露实现方式、价格和上线时间,先别太激动。 点评:AgentPeek是一个Mac菜单栏工具,把Claude Code和Codex的运行状态直接显示在屏幕顶部的刘海区域——你能看到会话、权限、token用量和本地开发服务器。数据全留在本地,不上传,隐私方面比较放心。对于同...
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
21:52
35d ago
Product Hunt · AI· rssEN21:52 · 05·09
Contextberg:让 AI 代理记住你干过什么,不用每次从头教
Contextberg 是一个跑在本地的记忆工具,通过 MCP 协议给 AI 代理喂上下文。它会在后台默默录屏、记浏览器历史、存你和代理的对话记录,然后自动生成短期和长期记忆。下次 Claude Code 或 Cursor 再问你“从哪开始”,它已经知道。目前只支持 Windows,免费,从微软商店装就行。正文没披露具体支持哪些数据源、部署选项和安全控...
#Agent#Memory#Tools#Contextberg
精选理由
Contextberg 是一个刚上线的产品,核心是把工作内容转成 AI agent 记忆并通过 MCP 提供。想法挺直接——让 agent 记住你做过的事,不用每次从头聊。但正文没披露支持哪些数据源、怎么部署、怎么收费,所以目前只能当一个小工具更新看。对做 agent 的团队有参考价值,但别急着当成熟方案用。
一句话点评
Contextberg 是一个跑在本地的记忆工具,通过 MCP 协议给 AI 代理喂上下文。它会在后台默默录屏、记浏览器历史、存你和代理的对话记录,然后自动生成短期和长期记忆。下次 Claude Code 或 Cursor 再问你“从哪开始”,它已经知道。目前只支持 Windows,免费,从微软商店装就行。正文没披露具体支持哪些数据源、部署选项和安全控制,隐私风险需要自己掂量。 短评:本地...
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H1·K0·R1
20:54
35d ago
Product Hunt · AI· rssEN20:54 · 05·09
Web Speed:号称让 AI 代理的 Token 开销打一折
Web Speed 是一个给网页代理用的“逻辑层”,核心是把网页转成机器能高效读的“地图”,而不是让 AI 一行行啃 HTML。官方说这样能省 70% 到 90% 的 Token 费用,跑得更快更稳。但正文没披露具体怎么实现的、定价多少、有没有公开的跑分测试。如果真能省这么多,对做浏览器自动化或信息抽取的团队来说挺省钱,但这点先别太激动——等看到可复现...
#Agent#Inference-opt#Web Speed#Product update
精选理由
H和R靠90%代理成本钩子过关,但K不通过:没机制、没定价、没可复现的基准。这就是一条很薄的Product Hunt帖子,信息密度低,不值得高优先级跟进。
一句话点评
Web Speed 号称能把网页转成机器地图,省 70%-90% Token 费。对做浏览器自动化的团队挺省钱,但正文没披露具体实现、定价和可复现的跑分,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
20:21
35d ago
r/LocalLLaMA· rssEN20:21 · 05·09
Strix Halo 跑 MiniMax 2.7,100K 上下文还能双开会话
Reddit 用户 Zc5Gwu 在 AMD Strix Halo 上跑 MiniMax 2.7,用 llama-server 配了 10 万 token 上下文,同时开两个会话,共享 KV 缓存,没有上下文偏移,不用 mmap,缓存全放显存不换到内存。正文没披露具体推理速度或显存占用,但能双开 100K 上下文说明显存够大、缓存管理做得比较干净。
#Code#Inference-opt#MiniMax#Qwen
精选理由
一条 Reddit 个人实验,样本量小,但配置参数全公开,可复现。对本地推理从业者来说,100k 上下文在 Strix Halo 上跑通,直接挂钩硬件选型和成本估算,不是画饼。不过正文没披露推理速度、首次 token 延迟或显存占用细节,这点先别太激动。整体够格全层级信号,但不够专题推荐。
一句话点评
Reddit 用户 Zc5Gwu 在 AMD Strix Halo 上跑 MiniMax 2.7,双开 10 万 token 上下文会话,共享 KV 缓存且全放显存,不换到内存。能这么玩说明显存够大、缓存管理干净。但正文没披露具体推理速度或显存占用,这点先别太激动。如果真能流畅双开长上下文,对本地部署长文档分析挺实用。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
19:48
35d ago
r/LocalLLaMA· rssEN19:48 · 05·09
有人给 DeepSeek 的 ds4.c 写了个极简 Web 界面
开发者 cocktail_peanut 开源了一个叫 ds4.pinokio 的仓库,给 ds4.c 服务器套了个最小化的 WebUI。要求不低:Apple Silicon Mac 上至少 128GB 内存。正文没披露具体支持哪些模型或推理速度,但 128GB 的门槛说明这玩意是为超大模型本地跑准备的,普通用户暂时别想。
#Tools#cocktail_peanut#Apple#antirez
精选理由
这是一个面向 LocalLLaMA 用户的小型开源工具更新;HKR-K 有具体的硬件要求,HKR-R 击中本地推理的成本痛点,但 HKR-H 偏弱,整体不够头条级分量。
一句话点评
开发者给 ds4.c 服务器套了个最小化 WebUI,但门槛极高:Apple Silicon Mac 必须 128GB 内存起步。这基本排除了普通用户,只适合想本地跑超大模型的人。正文没披露支持哪些模型或推理速度,实用性存疑。如果是真的,跑大模型不用再死磕命令行,但 128GB 的门槛让多数人只能看看。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
19:15
35d ago
r/LocalLLaMA· rssEN19:15 · 05·09
苹果下架 256GB 版 M3 Ultra Mac Studio,本地跑大模型的高配选择又少一个
苹果官网悄悄拿掉了 256GB 内存的 M3 Ultra Mac Studio 机型,目前只剩 512GB、96GB 等选项。正文没解释原因,但本地跑大模型的人都知道,256GB 刚好能塞下 70B 参数模型的全精度推理,少 1GB 都跑不动。现在只剩更贵的 512GB 或更小的 96GB,要么多花钱要么降模型规模。
#Apple#Product update
精选理由
HKR 三项都过,对本地大模型用户有钩子、有新事实、有相关性。但正文只说了下架和用户猜测,没给苹果官方确认或原因,所以放在 60–71 的 all 区间。
一句话点评
苹果悄悄下架了 256GB 内存的 M3 Ultra Mac Studio,只剩 512GB 和 96GB 可选。256GB 刚好能塞下 70B 模型的全精度推理,少 1GB 都跑不动。现在要么多花一倍钱上 512GB,要么降级到 96GB 跑小模型。苹果没解释原因,可能是为了推高利润机型,也可能是供应链调整。对本地跑大模型的人来说,这等于砍掉了性价比最高的选项。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K1·R1
18:46
35d ago
r/LocalLLaMA· rssEN18:46 · 05·09
llama.cpp 合并了一个新 MoE 架构:Sarvam,30B 模型实际只激活 2.4B 参数
llama.cpp 的 PR #20275 加入了 Sarvam MoE 架构支持。Sarvam 有两个版本:30B 模型非嵌入层活跃参数仅 2.4B,105B 模型活跃参数 10.3B。这意味着推理时计算量远小于同尺寸稠密模型,适合本地部署。不过正文没披露训练数据、评测结果或开源协议,实际效果和可用性还不清楚。
#Reasoning#Code#Agent#ggml-org
精选理由
这是一个 llama.cpp 架构兼容性 PR,不是模型发布或能力跃升。激活参数比(105B 只激活 10.3B)确实亮眼,但正文没披露训练数据、基准分数或推理速度,信息缺口明显。分数卡在中等偏上,因为数字本身有传播力,但受众窄、信息薄。
一句话点评
llama.cpp 刚合入 Sarvam MoE 架构支持。Sarvam-30B 非嵌入层活跃参数仅 2.4B,105B 版活跃参数 10.3B,推理计算量远小于同尺寸稠密模型,本地部署很划算。但正文没披露训练数据、评测结果和开源协议,实际效果和可用性还不清楚。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
18:33
35d ago
Hacker News 首页· rssEN18:33 · 05·09
Meta 强推 AI,员工被监控鼠标键盘,内部炸了
Meta 要求美国员工接受电脑操作全量追踪——记录打字、鼠标移动、点击和屏幕内容,目的是拿员工数据训练 AI 模型,学习“人怎么用电脑完成日常工作”。CTO 明确回复“公司电脑没有退出选项”,员工在内部帖下刷了 100 多个愤怒和震惊表情。Meta 有 7.8 万员工,受影响人数至少数万。公司正在从互联网公司转型为 AI 组织,但内部手段粗暴,员工士气...
#Meta#Hacker News#The New York Times#Commentary
精选理由
HKR-H/R 通过:纽约时报报道加上 Meta 员工痛苦,是个强职场-AI 钩子。HKR-K 不通过:正文缺员工数、团队、内部机制或具体案例,所以分数压在 60–71 区间。
一句话点评
Meta 强制追踪美国员工电脑操作(打字、鼠标、屏幕内容),用来训练 AI 学“人怎么用电脑干活”。CTO 明确回复“公司电脑没有退出选项”,内部帖下刷了 100 多个愤怒表情。7.8 万员工中至少数万人受影响。公司转型 AI 但手段粗暴,员工士气崩了。正文没披露追踪数据具体怎么用、是否匿名、有没有外部审计。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
18:10
35d ago
r/LocalLLaMA· rssEN18:10 · 05·09
SillyTavern 被名字耽误了?一个角色扮演前端能当通用界面用
Reddit 用户 Spiderboyz1 聊 SillyTavern 的角色架构:三个角色可以共享同一个群聊,但各自用不同的系统提示词。正文没披露性能数据、插件列表或可复现的搭建步骤,所以这点先别太激动——架构灵活不等于跑得稳。
#Agent#Tools#SillyTavern#LocalLLaMA
精选理由
HKR-H 和 HKR-K 通过:名字与界面的反差有看点,Character 架构也够具体。但这是一条单贴,正文没披露性能数据、插件清单或测试结果,所以分数压在60–71区间。
一句话点评
SillyTavern 支持三个角色共享群聊但各自用不同系统提示词,架构灵活。但正文没披露性能数据、插件列表或搭建步骤,这点先别太激动——灵活不等于跑得稳。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K1·R0
17:49
35d ago
AI HOT 精选· aihot-apiZH17:49 · 05·09
OpenRouter 上线免费编码路由工具:按分数自动选最便宜的模型
OpenRouter 推出了一款实验性工具 Pareto Code,免费使用。你可以在请求里加一个 min_coding_score 参数,工具会根据 Artificial Analysis 的排名,自动把编码任务路由到满足分数要求且成本最低的模型上。说白了就是帮你省钱的——不用手动比价,系统替你挑最便宜的。不过正文没披露这个 min_coding_s...
#Code#Tools#Inference-opt#OpenRouter
精选理由
Pareto Code 是一个小产品更新,核心卖点是成本-质量路由钩子和具体的 min_coding_score 机制,H/K/R 三项都通过。但正文没披露实际能省多少钱、覆盖哪些模型、路由稳定性如何,所以只能算一个面向所有读者的轻量更新。
一句话点评
OpenRouter 出了个免费工具 Pareto Code,加个参数就能自动把编程任务路由到最便宜的模型,省得自己比价。数据源是 Artificial Analysis 的排名,但正文没披露 min_coding_score 具体怎么算、覆盖哪些模型,实际效果得自己试。免费是亮点,但实验性意味着不稳定,别当主力用。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:46
35d ago
AI HOT 精选· aihot-apiZH17:46 · 05·09
AI 让强者更强、弱者更弱:能动性差距正在拉大
François Chollet 指出,AI 正在放大用户之间的能动性差异:低能动性用户会进一步丧失主动权,高能动性用户则能借助 AI 获得更多控制力。正文没有披露具体数据、实验条件或效应量,所以这点先别太激动——但逻辑本身值得留意:AI 不是均匀地赋能所有人,而是像放大器一样,把原有的差距越拉越大。
#fchollet#Commentary
精选理由
硬排除规则6适用:这是一篇纯观点帖,没有数据、案例或信源支撑,因此分数上限为40。H和R通过,但K缺失。
一句话点评
短评:Chollet 提了个直觉上成立的观点:AI 像放大器,拉大用户间的能动性差距。但没给数据,先当假说看。 点评:François Chollet 这条推文的核心判断是:AI 不是均匀地赋能所有人,而是像放大器一样,把用户原有的能动性差距越拉越大。低能动性用户(习惯被动接收信息、不主动提问或验证)会进一步丧失主动权,而高能动性用户(会拆解任务、迭代 prompt、交叉验证)则能借助 A...
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H1·K0·R1
17:13
35d ago
AI HOT 精选· aihot-apiZH17:13 · 05·09
OpenAI 演示 GPT-Realtime-2 语音控制 CRM,但没提延迟和价格
OpenAI Devs 发了个演示,把 GPT-Realtime-2 接进 CRM 工作流,让用户用语音操作客户管理系统。正文只说了集成思路,没披露 API 参数、延迟、定价和上线条件。如果延迟高或成本贵,实际落地会打折扣,这点先别太激动。
#Audio#Tools#OpenAI#Product update
精选理由
HKR-H 和 HKR-R 靠具体的语音-CRM 工作流场景通过,但 HKR-K 不通过:没有延迟、定价、API 条件和上线细节。当作一个小产品/教程更新处理。
一句话点评
OpenAI Devs 演示了用 GPT-Realtime-2 语音控制 CRM,思路是把语音指令转成 API 调用。正文只说了集成思路,没披露 API 参数、延迟、定价和上线条件。如果延迟高或成本贵,实际落地会打折扣,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H1·K0·R1
16:56
35d ago
r/LocalLLaMA· rssEN16:56 · 05·09
9070 XT 跑 Qwen 27B Q3 量化,12 tok/s
Reddit 用户用 AMD 9070 XT 在 llama.cpp 上跑 Qwen 27B Q3 量化模型,速度 12 tok/s。这个速度对 27B 模型来说算中等偏慢,大概每秒能吐出 12 个 token,相当于每 5 秒生成一句话。用户开了 65536 的超长上下文(不能缩),用了 q4_0 的 KV 缓存、batch 512、ubatch 1...
#Inference-opt#Qwen#llama.cpp#Reddit
精选理由
一条 Reddit 用户发的单点跑分,K 和 R 都够——给了具体的 llama.cpp 设置和速度,能引发本地部署用户对性价比的讨论。但缺功耗、显存占用、价格和对比基线,H 不成立,整体只能放在 lower all 档。
一句话点评
AMD 9070 XT 跑 Qwen 27B Q3 量化,12 tok/s,相当于每秒吐 12 个 token,每 5 秒生成一句话。速度中等偏慢,但开了 65536 的超长上下文(不能缩),这个长度下能跑起来已经不错。正文没披露功耗、显存占用和对比数据,没法判断是不是最优调参。如果上下文能缩到 32K,速度应该能翻倍。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
15:55
35d ago
r/LocalLLaMA· rssEN15:55 · 05·09
Mimo v2.5 Pro 做网页:3D 地球花了10分钟效果还差,改个星星就死循环
Reddit 用户实测 Mimo v2.5 Pro 生成三个网站。其中一个 3D 地球任务耗时 10 分钟,结果很烂;用户让它把星星调亮一点,模型就开始反复调用工具,鼠标控制也坏了。正文没披露模型版本、参数规模或具体报错,但能看出复杂交互场景下工具调用容易卡死,延迟高(10 分钟),且缺乏有效的终止机制。
#Code#Tools#Agent#Mimo
精选理由
帖子报告了具体的实操失败案例,但只是Reddit上一个3条提示的小样本测试,不是正式发布、基准测试或系统评估,所以重要性中等,覆盖所有读者。
一句话点评
Reddit 用户实测 Mimo v2.5 Pro 生成三个网站,3D 地球任务耗时 10 分钟,结果很烂;让星星亮一点,模型就开始反复调用工具,鼠标控制也坏了。复杂交互场景下工具调用容易卡死,延迟高(10 分钟),且缺乏有效的终止机制。正文没披露模型版本、参数规模或具体报错,但能看出这类 agent 在真实任务中稳定性堪忧。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:46
35d ago
AI HOT 精选· aihot-apiZH15:46 · 05·09
手机扫一扫,房子变3D模型;AI Agent在算命比赛里赢了人类专家
一项叫“3D高斯泼溅”的技术,用手机扫一遍房子就能生成浏览器里能看的3D模型,文件小、成本低,房产中介可能先受益。另一边,AI在垂直领域靠Agent范式突破:Tianfu Agent在专业命理大赛里接近人类顶尖水平,做法是给模型配一套专用工具(比如查规则、算参数),而不是让它硬背所有知识。这套思路对法律、中医这类规则密集的行业有参考价值。不过正文没披露...
#Agent#Vision#Tools#Tianfu Agent
精选理由
HKR三项都过,但原文只是一条简短的社交帖子,没有公布扫描精度、样本量、排名细节或可用性条款。适合作为有趣的产品/实验线索,不值得上推荐位。
一句话点评
手机扫一圈房子就能生成浏览器可看的3D模型,文件小成本低,房产中介确实能用。但正文没披露扫描精度、建模耗时和手机型号限制,实际落地效果要打折。Tianfu Agent在命理大赛接近人类顶尖水平,做法是给模型配专用工具(查规则、算参数),而不是硬背知识。这套思路对法律、中医等规则密集行业有参考价值,但命理本身争议大,且比赛规模、对手水平未公开,验证强度有限。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
15:15
35d ago
Hacker News 首页· rssEN15:15 · 05·09
Subquadratic 发布 1200 万 token 上下文窗口
一家叫 Subquadratic 的公司号称把上下文窗口做到了 1200 万 token,标题说“窗口被打破了”。但正文除了标题和 Hacker News 的 8 个点赞、0 条评论之外,没有任何技术细节——没提用了什么模型架构、延迟多少、价格多少、能不能复现。1200 万 token 确实很大(相当于几十本《三体》),但没披露具体怎么实现的,这点先别...
#Memory#Inference-opt#Subquadratic#Hacker News
精选理由
HKR 三项都过,但证据基本停留在标题级别的产品宣称。缺少架构、延迟、定价和可复现条件,分数卡在 60–71 区间,上不了精选。
一句话点评
标题说上下文窗口被打破了,Subquadratic 号称做到 1200 万 token(相当于几十本《三体》)。但正文除了标题和 Hacker News 上 8 个点赞、0 条评论外,没有任何技术细节——没提用了什么模型架构、延迟多少、价格多少、能不能复现。信息缺口太大,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
14:38
35d ago
Hacker News 首页· rssEN14:38 · 05·09
Space CLI:在终端里让 AI 帮你做闪卡
Space 这个做了七年的闪卡应用,刚发布了一个命令行工具。装上后,你可以在终端里直接创建、搜索、导出卡片组,然后 pipe 给 Claude、ChatGPT 或本地模型(比如 Ollama),让 AI 帮你分析易混淆词、解释难卡、或者生成新的复习题。CLI 读写的是本地数据库,不需要登录或 API key,离线也能用。卡片在 CLI 里改了,手机和平...
#Agent#Code#Tools#Claude
精选理由
HKR-H 和 HKR-K 靠 Claude Code/Codex CLI 工作流和离线优先细节过关。HKR-R 很弱,这只是个小型 Show HN 产品更新,所以落在 60–71 的全量区间。
一句话点评
Space 做了七年的闪卡应用,刚推出 CLI 工具,让你在终端里直接创建、搜索、导出卡片组,然后 pipe 给 Claude、ChatGPT 或本地模型(如 Ollama),让 AI 分析易混淆词、解释难卡或生成新复习题。CLI 读写本地数据库,无需登录或 API key,离线也能用。亮点是打通了 AI 工作流:批量导出 JSON 喂给模型,再拿回分析结果或新卡片,比手动逐张处理高效得多。...
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H1·K1·R0
14:32
36d ago
Product Hunt · AI· rssEN14:32 · 05·09
Vexilo:给 Claude Code 用的“操作手册”,内置 31 个智能体、92 条命令和 121 项技能
Vexilo 是一个 Claude Code 的规划工具,相当于一本现成的操作手册。它打包了 31 个专用智能体(比如代码审查、TDD 引导、项目规划)、92 条按场景分类的命令,以及 121 项按领域(前端、后端、AI、运维)划分的技能。还集成了一个 GitHub 上 16 万星的工作流。主要解决一个痛点:大部分 Claude Code 用户只用到 ...
#Agent#Code#Tools#Vexilo
精选理由
HKR-K 靠具体数字过关,但 HKR-H 和 HKR-R 都弱:这是 Product Hunt 上的产品展示,不是经过验证的 Claude Code 工作流或重大发布。小产品更新,留在 all 层合适。
一句话点评
Vexilo 打包了 31 个智能体、92 条命令和 121 项技能,相当于给 Claude Code 用户一本现成的操作手册,解决“只用到 10% 功能”的痛点。亮点是集成了 GitHub 上 16 万星的工作流,且宣称一次付费无订阅。但正文没披露价格、具体集成方式和实际效果验证,买之前最好先确认这些智能体是否真能提升你的开发效率。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
14:29
36d ago
r/LocalLLaMA· rssEN14:29 · 05·09
Qwen3.6-27B 多 token 预测在双 MI50 上跑出 60 tok/s,速度翻倍
Reddit 用户用两块 AMD MI50(ROCm 7.2 + llama.cpp 改版)跑 Qwen3.6-27B 的多 token 预测(MTP,即一次预测多个后续 token 来加速推理)。短 prompt 从约 26 tok/s 涨到 56–60 tok/s,一个 1.8 万 token 的编码任务从 390.9 秒降到 205.5 秒,接近...
#Inference-opt#Benchmarking#Code#Qwen
精选理由
HKR-K 很强,有实测吞吐量提升和耗时对比;HKR-R 切中本地推理的成本/性能痛点,毕竟双 Mi50 二手价不高;HKR-H 场景小众,来源只是 Reddit 单用户测试,所以分数没到 featured。
一句话点评
两块AMD MI50(16GB×2)跑Qwen3.6-27B的MTP(多token预测,一次猜多个后续词来加速),短prompt从26 tok/s翻倍到56-60 tok/s,1.8万token编码任务从390秒降到205秒,接近翻倍。但注意:这是改版llama.cpp+ROCm 7.2,非官方支持;MTP加速依赖任务类型,短文本收益大,长文本可能边际递减。正文没披露显存占用和功耗,双卡部署...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
14:10
36d ago
r/LocalLLaMA· rssEN14:10 · 05·09
用 NVMe 当显存不够时的交换分区,能跑大模型吗?
Reddit 用户问:只有 20G 内存和 4G 显存,能不能靠 150G NVMe 交换分区跑 100B+ 参数模型。正文没披露模型名称、量化精度、实际吞吐或延迟,所以这点先别太激动。NVMe 交换比传统硬盘快很多,但跟显存带宽比还是差几个数量级,推理速度会非常慢,可能每秒只能生成几个 token。如果真能跑,成本确实低——不用买新硬件,但体验大概率...
#Inference-opt#Reddit#LocalLLaMA#Commentary
精选理由
H和R勉强过关:硬件配置有话题性,也踩中了本地推理的成本焦虑。K不通过,因为帖子只是个问题,没有速度、配置或结果数据。
一句话点评
短评:NVMe 交换跑大模型?能跑,但慢到怀疑人生。 Reddit 用户想用 20GB 内存 + 4GB 显存 + 150GB NVMe 交换分区跑 100B+ 参数模型。NVMe 顺序读写约 7GB/s,但显存带宽(如 RTX 4090 约 1TB/s)差两个数量级,推理时每层参数都要从硬盘搬进显存,每秒可能只出几个 token,基本不可用。正文没披露模型名、量化精度和实测延迟,所以别太...
HKR 分解
hook knowledge resonance
打开信源
41
SCORE
H1·K0·R1
14:01
36d ago
Hacker News 首页· rssEN14:01 · 05·09
Mochi.js:一个用 Bun 写的浏览器自动化框架,号称指纹检测全过
Mochi.js 是一个基于 Bun 和原生 Chrome DevTools Protocol 的浏览器自动化库,MIT 协议开源。它的核心卖点是“不留痕迹”——通过一套 48 条规则的 DAG(有向无环图)来生成指纹,保证 Canvas、WebGL、字体、音频等所有指纹表面都来自同一个(profile, seed)对,不会出现 Mac 的 UA 配上...
#Agent#Tools#Mochi.js#Bun
精选理由
这是一个 Show HN 单次发布,只跑了一次 FingerprintJS 结果,没有用户采用数据、没有广泛基准测试、也没有披露安全边界。suspect_score=8 说明反检测分数不算完美,但 bot 字段没被标出来,这点先别太激动。适合放在 60–71 分的小型开源工具区间。
一句话点评
Mochi.js 是一个基于 Bun 的浏览器自动化库,主打“不留痕迹”——用 48 条规则的有向无环图统一生成 Canvas、WebGL、字体等所有指纹,避免出现 Mac 的 UA 配上 Linux WebGL 这种矛盾组合。作者称在 FingerprintJS Pro v4 上跑 Linux 数据中心 IP,嫌疑分 8 但没被标为机器人。核心思路是把 Patchright + 指纹注入 ...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
13:22
36d ago
彭博科技· rssEN13:22 · 05·09
欧洲央行官员:AI 风险倒逼金融基础设施审查
欧洲央行管委 Escrivá 说,AI 带来的风险(比如模型出错、被攻击)可能冲击金融系统的底层设施,央行得重新检查这些设施扛不扛得住。他还提到要守住央行作为最后担保人的角色,别让稳定币把这事搅乱了。正文没披露审查范围、时间表,也没说具体哪些 AI 场景最危险,所以这点先别太激动,目前只是一个方向性表态。
#Safety#European Central Bank#José Luis Escrivá#Policy
精选理由
HKR-R通过:ECB官员把AI风险、金融基础设施韧性和稳定币风险串起来了。HKR-H和K弱:审查范围、时间表和具体风险机制都没披露,所以只是一个低价值政策信号。
一句话点评
欧洲央行管委Escrivá表态要重审金融基础设施扛不扛得住AI风险(模型出错、被攻击),还要守住央行最后担保人角色,别让稳定币搅局。正文没披露审查范围、时间表,也没说哪些AI场景最危险,目前只是一个方向性表态,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
11:25
36d ago
AI HOT 精选· aihot-apiZH11:25 · 05·09
腾讯混元 Hy3 预览版免费期结束,OpenRouter 上三项指标排第一
腾讯混元说 Hy3 预览版在 OpenRouter 上两周免费期内,总 token 用量、代码生成和工具调用三项指标都排第一,市场份额冲到 15.4%。现在免费期结束,但还能以有竞争力的价格继续用。正文没披露具体价格和性能对比,想省钱的话可以自己去 OpenRouter 看看报价。
#Code#Tools#Tencent Hunyuan#OpenRouter
精选理由
H/K/R都过,但来源是腾讯自宣,且排名发生在免费期,用量被价格扭曲。当一个小型产品/榜单更新处理,不推首页。正文没披露Hy3预览版与正式版的差异,也没说免费期结束后价格。
一句话点评
短评:OpenRouter两周免费期数据,Hy3预览版在token用量、代码和工具调用三项排第一,份额冲到15.4%。免费结束但价格未披露,别急着冲。 点评:腾讯混元说Hy3预览版在OpenRouter上两周免费期内,总token用量、代码生成和工具调用三项指标都排第一,市场份额冲到15.4%。这个排名来自OpenRouter的公开数据,可信度还行,但注意这是免费期数据——用户冲着免费来,...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
10:58
36d ago
Product Hunt · AI· rssEN10:58 · 05·09
Connector.wtf:把广告账户接进AI聊天,免费
Connector.wtf 是一个免费的 MCP 服务器(一种让 AI 工具直接读外部数据的标准接口),能把 Google Ads、Meta Ads 和 LinkedIn Ads 的广告账户直接连到 ChatGPT 或 Claude 上。目前只支持读数据(read-only),不能写或改广告。作者说托管成本几乎为零,所以干脆免费,省得大家一辈子跟 CS...
#Tools#Connector.wtf#Google#Meta
精选理由
一个 Product Hunt 小工具上线:免费把三个广告平台接进 AI 聊天。HKR-K 通过,因为提供了免费连接器这个新事实。HKR-H 和 HKR-R 不通过,因为正文没披露支持哪些聊天工具、权限机制和数据范围。
一句话点评
Connector.wtf 免费把 Google Ads、Meta Ads 和 LinkedIn Ads 接进 ChatGPT 或 Claude,只读不写。作者说托管成本几乎为零所以免费,省得大家一辈子导 CSV。目前只支持三个平台,权限和数据范围正文没披露,小团队作品,别当企业级方案。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K1·R0
10:34
36d ago
r/LocalLLaMA· rssEN10:34 · 05·09
用本地 Qwen 3.6 27B 当助手,有人成功装好了 Arch Linux
一位 Reddit 用户把 Pi 编程代理连到本地跑的 Qwen 3.6 27B 模型上,让它帮忙配置 Arch Linux。模型能处理蓝牙音箱连接和 HDPI 缩放这类实际任务,但用户没给模型直接 sudo 权限——相当于让模型提建议、自己动手执行。正文没披露具体用了多少样本或微调细节,但能跑通本地模型做系统配置,说明 27B 规模在 agent 场...
#Agent#Code#Tools#Qwen
精选理由
HKR 三项都过,但证据只有一条 Reddit 帖子。正文没披露具体命令、耗时、失败率或可复现步骤,所以留在 all 层,先别太激动。
一句话点评
短评:本地模型当系统管理员,27B 够用但别给 sudo。 点评:Reddit 用户把 Pi 编程代理接上本地 Qwen 3.6 27B,让它帮忙配 Arch Linux——连蓝牙音箱、调 HDPI 缩放都搞定了。关键限制:用户没给模型 sudo 权限,相当于模型只出建议、人动手执行,安全但效率打折。27B 规模能跑通 agent 任务,说明本地模型在系统配置场景已经够用,成本比调 API...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
09:27
36d ago
r/LocalLLaMA· rssEN09:27 · 05·09
Reddit 用户实测:Qwen 写代码强,但写 App Store 文案和对话不如 Sonnet 4.6
一位 Reddit 用户对比了 Qwen 和 Sonnet 4.6 在创意写作与对话直觉上的表现,结论是 Qwen 在编程任务上很强,但在写 App Store 文案和简洁对话上不如 Sonnet 4.6。帖子没有披露测试次数、具体提示词、模型版本或评估标准,所以这个结论只能当个人感受看,不能当严谨评测。
#Code#Fine-tuning#Qwen#Anthropic
精选理由
一条 Reddit 个人经验分享,靠选模型焦虑过了 HKR-R。HKR-H 缺钩子,HKR-K 缺样本量、提示词和可复现的测试条件,所以留在 all 层。
一句话点评
一位 Reddit 用户说 Qwen 写 App Store 文案和简洁对话不如 Sonnet 4.6,但没披露测试次数、提示词和模型版本,结论只能当个人感受。短评:个人体感,缺评测细节。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K0·R1
09:25
36d ago
Ben's Bites· rssEN09:25 · 05·09
Ben 用 AI 搭了个 Gmail 客户端,自己用,还给 agent 留了后门
Ben 用 Codex 和 Factory 给自己写了一个本地 Gmail 客户端,Gmail 还是数据主库。功能包括分栏收件箱、快捷键、命令面板、回复/写邮件、20 秒撤回、一键退订、搜索、规则同步、缓存刷新,以及给 agent 用的隐藏选择器和调试接口。一开始很卡,原因是频繁请求 Gmail API,后来加了本地缓存和后台预取才变快。规则部分踩了坑...
#Agent#Code#Tools#Ben's Bites
精选理由
HKR 三项都过,但这是个人项目,不是产品发布或模型更新。正文没给代码仓库、成本、耗时和失败细节,所以分数压在 60–71 区间。
一句话点评
Ben 用 Codex 和 Factory 给自己写了个本地 Gmail 客户端,核心思路是 Gmail 做数据主库,前端自己控。一开始卡是因为频繁调 Gmail API,加了本地缓存和后台预取才解决。规则同步也踩了坑,agent 默认写本地规则文件,没跟 Gmail 同步。亮点是给 agent 留了隐藏接口,但正文没披露具体怎么用。整体是个 AI 辅助写个人工具的实战记录,不是产品发布,别...
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
09:10
36d ago
Product Hunt · AI· rssEN09:10 · 05·09
Yeta AI:给 YouTube 视频实时配音,贴链接选语言就行
Yeta AI 是一个浏览器工具,你贴一个 YouTube 链接、选目标语言,它就能实时把视频里的语音换成另一种语言的 AI 配音,不用上传也不用等。支持 10 种以上语言,免费起步,不用绑信用卡。正文没披露具体延迟多高、用了什么模型、音色质量如何,也没说支持哪些语言。如果延迟能控制在几秒内、音色自然,那对看外语视频的用户挺实用,但这点先别太激动,得等实测。
#Audio#Yeta AI#YouTube#Product update
精选理由
一个小型 Product Hunt 工具发布,只有 HKR-H 成立:YouTube 实时配音这个角度确实有吸引力,但正文没披露语种、延迟、价格或机制,所以只能归为低价值的产品更新。
一句话点评
Yeta AI 是一个浏览器工具,贴 YouTube 链接就能实时把语音换成 AI 配音,不用上传。支持 10 种以上语言,免费起步,不绑信用卡。正文没披露具体延迟、用了什么模型、音色质量,也没说支持哪些语言。如果延迟能控制在几秒内、音色自然,对看外语视频的用户挺实用,但这点先别太激动,得等实测。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R0
09:10
36d ago
r/LocalLLaMA· rssEN09:10 · 05·09
有人用两张专业卡跑 MiMo-V2.5 量化版,测了 104 万 token 上下文
LegacyRemaster 在本地用 llama-server 跑了 MiMo-V2.5 的 IQ3_S 量化版,上下文拉到 1,048,576 token。机器是双卡:RTX 6000(96GB 显存)加 W7800(48GB 显存),49 层全卸到 GPU,开了 FlashAttention,16 线程。他的体感是,超过 5 万 token 后,...
#Inference-opt#Code#MiMo#MiniMax
精选理由
HKR三项都过:钩子是104万上下文实测,50k后比MiniMax稳但会循环,直接戳中本地模型用户对长上下文稳定性的焦虑;知识给了完整硬件和软件配置,但没披露速度或显存占用;共鸣点在于长上下文和显存成本是社区常聊的话题。不过这只是单次Reddit本地推理测试,不是模型发布或产品更新,范围太窄,所以定在all层。
一句话点评
有人在双卡(RTX 6000 96GB + W7800 48GB)上把 MiMo-V2.5 的量化版跑到了 100 万 token 上下文,5 万 token 后速度比 MiniMax 稳。但温度低于 0.2、重复惩罚 1.1 时会循环,说明长文生成质量还有坑。正文被 Reddit 屏蔽了,没披露具体速度和显存占用,如果是真的,这个硬件门槛对本地部署不算友好。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
09:07
36d ago
r/LocalLLaMA· rssEN09:07 · 05·09
现在这显卡价格,到底谁在买啊?
Reddit 用户吐槽当前 GPU 和 DDR5 定价离谱:8GB 显存卡卖到以前 16GB 卡的价格,RTX 4090 比刚发布的 RTX 5090 还贵 1000 美元。帖子没披露实际销量或渠道库存数据,所以这到底是厂商硬扛价还是真有人接盘,正文没说。
#Inference-opt#Reddit#Nvidia#AMD
精选理由
HKR 三项都过,但证据来源是 Reddit 用户吐槽加几个 SKU 对比,正文没披露销量、渠道或供需数据,所以不上精选。
一句话点评
Reddit 用户吐槽显卡定价离谱:8GB 显存卡卖到以前16GB卡的价格,RTX 4090比刚发布的RTX 5090还贵1000美元。帖子没披露实际销量或渠道库存数据,所以这到底是厂商硬扛价还是真有人接盘,正文没说。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R1
08:52
36d ago
AI HOT 精选· aihot-apiZH08:52 · 05·09
Qwen 3.5 和 3.6 全系列模型上线 SiliconFlow,从 9B 到 397B 都有
SiliconFlow 平台一口气上了阿里 Qwen 3.5 和 3.6 两个系列共 7 个模型,覆盖 9B 到 397B 参数,既有稠密(Dense)也有混合专家(MoE)架构,还带原生多模态能力。具体型号包括 Qwen3.6-35B-A3B(35B 总参数,每次推理只激活 3B,省显存)、Qwen3.6-27B、Qwen3.5-397B-A17B(...
#Multimodal#Inference-opt#SiliconFlow#Qwen
精选理由
这是一条 SiliconFlow 上架 Qwen 新模型的公告,属于云厂商常规产品更新。信息价值在于给出了模型规格(9B-397B、MoE/Dense、7个模型名),但缺少定价、速度或独家能力等关键指标,对从业者来说只能当个模型列表看,不值得高优先级推送。
一句话点评
SiliconFlow 一口气上了阿里 Qwen 3.5 和 3.6 共 7 个模型,从 9B 到 397B 都有,MoE 和稠密架构全包。最亮眼的是 Qwen3.6-35B-A3B,总参数 35B 但每次只激活 3B,显存省得离谱,推理成本能压到很低。Qwen3.5-397B-A17B 则是超大杯 MoE,适合不差钱的场景。原生多模态是加分项,但正文没披露具体跑分或延迟数据,实际效果得自己...
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
08:44
36d ago
Hacker News 首页· rssEN08:44 · 05·09
把文档交给大模型改,改完反而坏了
这篇论文说,让大模型帮你改文档,改着改着内容就坏了。作者搞了一套叫 DELEGATE-52 的测试,覆盖编程、晶体学、乐谱等 52 个专业领域,模拟长流程的文档编辑任务。测了 19 个模型,结果 Gemini 3.1 Pro、Claude 4.6 Opus、GPT 5.4 这些顶级模型,在长流程结束时平均搞坏了 25% 的内容,其他模型更惨。论文还发现...
#Agent#Research release
精选理由
标题的钩子很锋利,但正文信息量几乎为零——没披露实验设置、模型名单和错误率,没法判断这个“破坏”是普遍现象还是特定场景下的个例。如果是真的,对 agent 落地是个警示,但这点先别太激动,等论文出来再看具体数字。
一句话点评
这篇论文给所有让AI帮忙改文档的人泼了盆冷水。作者搞了套DELEGATE-52测试,覆盖编程、乐谱等52个专业领域,模拟长流程编辑。测了19个模型,结果Gemini 3.1 Pro、Claude 4.6 Opus、GPT 5.4这些顶级模型,在长流程结束时平均搞坏了25%的内容,其他模型更惨。而且用工具(agentic tool use)也没用,文档越长、交互越多、干扰文件越多,错误越严重。...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
07:23
36d ago
彭博科技· rssEN07:23 · 05·09
字节跳动今年AI基建预算上调25%,达到2000亿元
字节跳动把今年AI基础设施的投入计划提高了25%,总金额来到2000亿人民币(约294亿美元)。这个数字挺吓人的,但文章说主要是因为内存芯片涨价了,加上TikTok母公司自己在AI上铺得更开。不过正文没披露这2000亿具体花在哪——是买GPU、建数据中心还是租算力,也没说这笔钱比去年实际花了多少。所以这个涨幅有多大、是不是真超预期,还得看后续细节。
#ByteDance#South China Morning Post#TikTok#Funding
精选理由
HKR三项都过,但文章只给了南华早报报道的预算数字和内存成本背景,没有披露GPU型号配比、模型路线图或产品落地细节;这条消息停留在高层的行业报道层面,适合全量推送。
一句话点评
字节跳动今年AI基础设施预算上调25%至2000亿人民币,约294亿美元。涨幅看着大,但文章提到主因是内存芯片涨价,并非纯业务扩张。正文没披露这2000亿具体花在哪——买GPU、建数据中心还是租算力,也没说去年实际花了多少。所以这个涨幅有多大、是不是真超预期,还得看后续细节。
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
07:09
36d ago
● P1AI HOT 精选· aihot-apiZH07:09 · 05·09
百度发布ERNIE 5.1大语言模型,预训练成本仅为对标模型6%
百度在 ERNIE 5.0 的基础上做了 5.1,主要提升搜索、推理、知识问答、创意写作和智能体能力。最抓眼球的数字是预训练成本只有对标模型的 6%,但正文没披露对标的是谁、怎么算出来的,也没给具体金额或技术细节。我会先打个折——成本低到这个程度,要么是用了 5.0 的底子省了大笔算力,要么是统计口径有讲究。另外,模型在哪些基准上测了、效果提升多少,帖...
#Reasoning#Agent#Baidu#ERNIE
精选理由
百度发了ERNIE 5.1,最抓人的一句话是“预训练成本约为对标模型的6%”。这个数字让一条模型更新变成了成本效率的故事,从业者会立刻想知道对标模型是谁、成本口径怎么算的,正文没展开说,所以冲击力有,但信息缺口也大。搜索、推理、问答、写作和智能体能力都提了升级,但没给具体评测或对比数据,技术细节偏薄。我会先打个折:话题性够强,靠成本数字和国产旗舰身份撑到了p1,但缺细节让它进不了90分以上的档位。
一句话点评
百度说 ERNIE 5.1 预训练成本只有对标模型的 6%,但正文没给对标谁、怎么算的,先当个方向看。
锐评
这条消息的核心卖点是省钱——预训练成本压到对标模型的 6%。但正文是空的,我们只能从标题里抓信息,所以判断要打折扣。首先,没说是跟哪个模型比,如果是跟 GPT-4 级别的模型比,那确实是个工程突破;如果对标的是自家上一代,意义就小很多。其次,成本怎么算的也没交代,是只算算力,还是包括了数据清洗、人力、试错?这些都会影响 6% 这个数字的含金量。另外,参数规模、性能 benchmark、推理成本都没提,光训练便宜还不够,用起来贵不贵、效果好不好才是关键。我会先把这个消息当成一个技术方向的信号,说明百度在训练效率上做了压缩,但具体怎么做到的、能不能复现,还得等论文或技术报告出来再看。
HKR 分解
hook knowledge resonance
打开信源
97
SCORE
H1·K1·R1
05:29
36d ago
r/LocalLLaMA· rssEN05:29 · 05·09
Caliby 开源:一个给 AI Agent 用的嵌入式向量数据库,号称比 pgvector 快 4 倍
Sea-Land AI 和数据库大佬 Michael Stonebraker 的团队开源了 Caliby,一个嵌入式向量检索库,支持 HNSW、DiskANN 和 IVF+PQ 三种索引。标题说比 pgvector 快 4 倍,磁盘存储性能也超过 FAISS。不过正文没披露完整的基准测试方法,这个 4 倍到底在什么场景、什么数据量下测的,目前不清楚。C...
#Agent#RAG#Embedding#Sea-Land AI
精选理由
HKR 三项都过,因为速度对比很具体,而且切中 RAG/Agent 的基础设施需求。但来源是 Reddit 自荐帖,没有公开 benchmark 的复现方法、没有 license 说明、也没有第三方验证,所以分数卡在高 all 区间。正文没披露测试环境、数据集大小、召回率对比,这些缺口让 4x 的结论暂时只能当个参考。
一句话点评
Caliby 是一个嵌入式向量检索库,支持 HNSQ、DiskANN 和 IVF+PQ 三种索引,由 Sea-Land AI 和数据库大佬 Michael Stonebraker 团队开源。标题说比 pgvector 快 4 倍、磁盘性能超 FAISS,但正文没披露基准测试方法,这个 4 倍在什么场景、数据量下测的,目前不清楚。短评:速度宣称很猛,但没给测试细节,先打个折。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
05:24
36d ago
AI HOT 精选· aihot-apiZH05:24 · 05·09
YC创始人公开AI提示词:让模型学会重复干活,别每次都从头教
Garry Tan 公开了 OpenClaw 提示词,核心是让 AI 代理从一次性工具变成能积累技能的自动系统。规则包括:禁止只干一次活、用 MECE 原则拆任务、把重复问当作失败信号,以及用标准六步流程让模型自己学并攒技能库。有人试过,系统能自动处理日报、邮件这类重复工作。另外,文章还提了个观点:在 AI 时代,HTML 比 Markdown 更适合...
#Agent#Tools#Memory#Garry Tan
精选理由
HKR三项都达标,但事实仅限于一条X帖里的提示词工作流。没有模型发布、产品数据或可复现的实验,所以分数压在70档。
一句话点评
YC 创始人 Garry Tan 公开了 OpenClaw 提示词,核心是让 AI 代理从一次性工具变成能积累技能的自动系统。规则包括:禁止只干一次活、用 MECE 原则拆任务、把重复问当作失败信号,以及用标准六步流程让模型自己学并攒技能库。有人试过,系统能自动处理日报、邮件这类重复工作。另外,文章还提了个观点:在 AI 时代,HTML 比 Markdown 更适合做沟通语言,因为能生成交互...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
05:21
36d ago
r/LocalLLaMA· rssEN05:21 · 05·09
llama.cpp 网页版聊天界面:优点和缺什么
一位 Reddit 用户对比了五款开发用聊天界面,觉得 llama.cpp 的网页版好在有上下文 token 计数器。但问题也很明显:工具调用失败后对话会丢失、没有项目级系统提示词、也没有内置的 MCP 工具隐藏控制。正文被屏蔽了,看不到更多细节。
#Tools#Memory#llama.cpp#Jan.ai
精选理由
HKR-K/R通过:摘要对比了5个UI,给出了llama.cpp WebUI的具体短板,对本地模型从业者有参考价值。HKR-H偏弱,且仅来自一条Reddit帖子,不足以进入精选。
一句话点评
短评:本地部署党选聊天界面,llama.cpp WebUI 有 token 计数器,但工具调用失败会丢对话,没有项目级系统提示词。 点评:一位 Reddit 用户对比了五款本地开发用聊天界面,认为 llama.cpp 的网页版唯一亮点是上下文 token 计数器,方便监控显存占用。但问题更突出:工具调用失败后整个对话丢失,没有项目级系统提示词(每次换项目得手动改),也没有内置的 MCP 工...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
04:53
36d ago
Hacker News 首页· rssEN04:53 · 05·09
用 Claude Code 写 HTML:效果出奇地好
一篇博客展示了用 Claude Code 直接生成 HTML 页面的效果,链接里放了几个示例。正文没交代具体任务设置、评估条件或方法细节,所以目前只能看个热闹——效果看起来不错,但不知道是模板简单还是真的能处理复杂布局。38 个点赞和 14 条评论,社区在讨论但还没形成定论。
#Code#Anthropic#Claude#Commentary
精选理由
标题的对比钩子(HTML 这种老东西在 Agent 手里反而好用)和 HN 热度说明它抓住了从业者的注意力,所以 H 和 R 成立。但正文几乎没给方法、样本或评测条件,信息量不足,K 不通过,因此维持 all 层级。
一句话点评
Claude Code 直接生成 HTML 页面,效果看着不错,但正文没交代任务复杂度、评估条件或方法细节,目前只能当个 Demo 看。38 个点赞、14 条评论,社区在讨论但没定论。如果是真的能处理复杂布局,那挺省前端时间,但这点先别太激动——可能只是模板简单。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
04:05
36d ago
AI HOT 精选· aihot-apiZH04:05 · 05·09
阶跃星辰 StepAudio 2.5 TTS 在语音盲测中排全球第三,比 Eleven Labs 高 8 分
阶跃星辰的 StepAudio 2.5 TTS 在 Artificial Analysis 语音竞技场盲测中拿到 Elo 1187 分,排全球第三,仅次于 Inworld TTS 1.5 Max 和 Google Gemini 3.1 Flash TTS。它比 Eleven Labs 的 v3 模型高了 8 分,语音自然度有明显提升。定价是每百万字符 ...
#Audio#StepFun#Artificial Analysis#Google
精选理由
HKR 三项都达标,但信息来源只是厂商的一条 X 帖子,只披露了排名、Elo 和价格,没有测试样本、对手差距或可复现性。这属于小产品/榜单更新,所以定 tier all。
一句话点评
阶跃星辰 StepAudio 2.5 TTS 在 Artificial Analysis 语音盲测中拿到 Elo 1187,全球第三,比 Eleven Labs v3 高 8 分。定价每百万字符 85 美元,生成速度 37.6 字符/秒,支持全局上下文和行内情感标签。盲测排名有参考价值,但没披露训练数据规模和中文效果,实际落地还得看场景。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
03:47
36d ago
r/LocalLLaMA· rssEN03:47 · 05·09
Qwen3-coder 在 Mac 上跑得比 Qwen 3.5-35B 还快,但没人知道它有多少参数
Reddit 用户实测发现,Qwen3-coder-next 的 MLX 版在 M2 Ultra 192GB Mac 上只占约 80GB 内存,跑得比 Qwen 3.5-35B-a3B 还快。但正文没披露它的参数量,所以没法判断这个“快”是靠模型变小还是架构优化。如果参数量真比 35B 小很多,那 80GB 内存占用算偏高的,得等官方数据才能下结论。
#Code#Fine-tuning#Inference-opt#Qwen
精选理由
一条Reddit用户发的实测帖:Qwen3-coder-next for MLX在M2 Ultra 192GB上只占80GB内存,速度还比Qwen 3.5-35B-a3B快。硬件、内存、速度对比都给了,但参数量、跑什么任务、有没有日志都没披露。单条帖子证据弱,但信息本身对本地部署党有参考价值,所以放在60-71这个'有意思'区间。
一句话点评
Reddit 用户实测,Qwen3-coder-next 的 MLX 版在 M2 Ultra 192GB Mac 上只占约 80GB 内存,跑得比 Qwen 3.5-35B-a3B 还快。但正文没披露参数量,所以没法判断这个“快”是靠模型变小还是架构优化。如果参数量真比 35B 小很多,那 80GB 内存占用算偏高的,得等官方数据才能下结论。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
03:27
36d ago
AI HOT 精选· aihot-apiZH03:27 · 05·09
Codex Chrome插件能用,但安装有门槛
有人用Codex Chrome插件成功完成了一次购物,证明它确实能用。但安装有几个硬性条件:Codex必须升到最新版,登录得用官方订阅账号,不支持第三方API模式。网络节点也有讲究,比如香港就不行。装好后要在Codex对话里输入“@ Chrome”才能调出插件功能。建议把Chrome设成默认浏览器,遇到连接问题可以重启电脑试试。正文没披露具体购物场景和...
#Agent#Tools#Codex#Chrome
精选理由
这是一条用户实测笔记,不是官方发布,所以信息量有限:只做了 1 个任务,没提稳定性、定价、权限边界或正式上线时间。但胜在真实,对关注 agent 落地的从业者来说,能快速判断 Codex 在 Chrome 里的可用性和限制。66 分合理,放在 all 层让更多人看到。
一句话点评
短评:Codex 的 Chrome 插件真能下单了,但门槛不少——必须用官方订阅账号,不支持第三方 API,香港节点也不行。 正文确认有人用 Codex Chrome 插件完成了一次购物,证明它不再是画饼。但安装限制很具体:Codex 必须最新版、登录得用官方订阅(第三方 API 模式不支持)、网络节点有讲究(香港不行)。装好后要在对话里输入“@ Chrome”才能调出插件,建议把 Chr...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
03:06
36d ago
AI HOT 精选· aihot-apiZH03:06 · 05·09
GPT Image 2 提示词模板:水墨风格幻灯片
这篇帖子分享了一个生成水墨风幻灯片图片的提示词模板,包含标题、要点、视觉元素、布局、文字层级和延续说明六个部分。模板强调宣纸背景、水墨山水等东方元素,追求静谧、侘寂或当代东亚奢华的美学风格。正文没披露模型设置、价格或可复现的生成参数,所以想直接拿来用还得自己试。
#Multimodal#Vision#GPT Image 2#Codex
精选理由
H和K通过:水墨幻灯片这个钩子够具体,6类提示词结构也提供了可复用的脚手架。但R不达标:没有测试结果、模型细节或行业影响,所以分数落在60–71区间。
一句话点评
一个水墨风PPT提示词模板,结构挺清楚:标题、要点、视觉元素、布局、文字层级、延续说明。但正文没披露模型设置、价格或可复现参数,想直接拿来用还得自己试。短评:模板不错,但缺参数,得自己调。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
02:59
36d ago
● P1机器之心 · 公众号· rssZH02:59 · 05·09
DeepSeek 融资 73 亿美元,估值 515 亿美元,创始人个人出资四成
这条消息来自机器之心,但原文页面被微信判定环境异常,需要验证才能看,所以正文内容没拿到。标题和摘要里提到的关键数字是:融资额约 500 亿人民币(折合约 73 亿美元),估值约 3500 亿人民币(折合约 515 亿美元)。梁文锋个人计划出资 40%,腾讯和 600 亿规模的国家 AI 基金也在谈。这些数字如果属实,说明 DeepSeek 这轮融资规模...
#Agent#Reasoning#Benchmarking#DeepSeek
精选理由
这条DeepSeek融资传闻数字大、出资比例明确、资方有名有姓,HKR三项都站得住。但正文也说了还在谈,没有官方确认,所以分数和级别不动,保持84分和featured,不升p1。
一句话点评
DeepSeek 拿了 73 亿美元融资,估值冲到 515 亿美元,创始人梁文锋自己掏了四成。这条消息目前只有媒体爆料,官方还没确认,先打个折看。
锐评
这条融资消息如果属实,DeepSeek 会成为全球估值最高的 AI 初创之一。73 亿美元的单轮融资额放在整个科技行业都算顶格,创始人个人出资近 30 亿美元,说明他对公司控制权和长期路线非常坚持,不想被外部资本牵着走。 但要注意,目前两个信源都是科技媒体引用“曝料”,机器之心那篇原文甚至因为微信环境异常根本打不开,等于我们看不到一手细节。融资方是谁、钱怎么花、有没有对赌条款,正文全都没披露。估值 515 亿美元这个数字也需要对照收入来看——DeepSeek 至今没有公开过商业化数据,这个估值更多反映的是市场对开源模型头部玩家的预期,而不是实打实的营收倍数。 还缺几个关键信息:这轮是纯股权融资还是含了债权?新进来的钱主要投向算力基建还是人才?创始人自掏四成是现金还是股权折算?这些没搞清楚之前,别急着把这当成行业风向标。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
02:44
36d ago
AI HOT 精选· aihot-apiZH02:44 · 05·09
GPT Image 2 提示词框架:一键生成中文科技新闻爆款封面
这是一个提示词框架,让AI根据文章内容自动生成16:9的中文科技新闻封面图。框架要求AI扮演顶级视觉设计师,从文章里提取核心新闻、关键数字、产品信息和行业情绪,然后拼出一张高信息密度的封面。构图分五个区:顶部新闻区、中央超大标题、主视觉产品图、数据卡片和底部总结。配色、字体、背景会根据行业、品牌和情绪动态调整。目标是3秒内让读者抓住重点,风格参考中国科...
#Multimodal#Vision#GPT Image 2#Product update
精选理由
HKR-K 通过,因为帖子提供了一个可复用的 GPT Image 2 封面布局机制。HKR-H 和 HKR-R 偏弱,所以分数落在 60–71 区间,算一个小 workflow 技巧。
一句话点评
这个提示词框架让 GPT Image 2 自动生成中文科技新闻封面,把文章拆成新闻区、标题、产品图、数据卡和底部总结五个区块,配色字体随行业情绪变。目标是 3 秒抓眼球,模仿中国科技媒体和 B 站爆款风格。但正文没披露实测效果——生成一张图要多久、成本多少、跟人工设计比差多远。如果真能稳定输出高信息密度封面,对缺设计师的小团队挺省钱。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
02:32
36d ago
彭博科技· rssEN02:32 · 05·09
中国最高经济规划机构呼吁加强AI协调监管
中国最高经济规划机构公开要求加强对AI的协调与监管,但正文只提供了彭博社的页面框架,没有披露具体是哪个部门、协调机制是什么、涉及哪些公司、何时落地。信息缺口很大,目前只能确认高层在推动这件事,但具体怎么管、管多严,都还没说。
#Bloomberg#Policy
精选理由
HKR-R通过,因为中国AI监管影响合规成本和市场准入。HKR-H/K不通过:摘要没有给出政策工具、执行时间表或任何新数字,所以它属于低价值政策简报区间。
一句话点评
彭博标题说中国最高经济规划机构要求加强AI协调监管,但正文只有页面框架,没披露具体部门、协调机制、涉及公司或落地时间。信息缺口很大,目前只能确认高层在推这件事,具体怎么管、管多严都还没说。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K0·R1
01:49
36d ago
r/LocalLLaMA· rssEN01:49 · 05·09
Gemma4 写代码用工具,三四轮对话就犯迷糊
Reddit 用户实测 Gemma4 的 31B Q5 和 27B Q8 量化版,用来在 Windows 上写代码和调用工具。结果发现模型在 3-4 轮对话后就开始分不清“调用 pi 工具”和“直接回答”的区别——比如让它用工具获取信息,它可能直接编个答案。正文没披露具体测试用例和量化损失,但这点先别太激动,量化版本身就有精度折损,而且 31B 规模在...
#Code#Tools#Vision#Gemma
精选理由
这是一条Reddit用户实测帖,不是基准测试或官方发布,信息量有限但具体:31B Q5和27B Q8两个量化版本在Windows上跑编码和工具调用,3-4轮对话后模型仍难区分skill和tool——这个细节对本地部署用户有参考意义。不过样本单一,结论不能外推,所以兴趣度偏低。
一句话点评
Reddit 用户实测 Gemma4 量化版(31B Q5、27B Q8),发现 3-4 轮对话后模型就分不清“调用工具”和“直接回答”,比如让它用工具查信息,它可能直接编答案。量化版本身有精度折损,31B 规模在工具调用上本就不算强,但这个问题在 Qwen 2.5 同规模量化版上没那么明显。正文没披露具体测试用例和量化损失,所以这点先别太激动,可能是特定场景翻车。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1
2026-05-08 · 星期五2026年5月8日
23:37
36d ago
Hacker News 首页· rssEN23:37 · 05·08
特斯拉 Model Y 首个通过 NHTSA 新版辅助驾驶测试
美国交通部下属 NHTSA 宣布,2026 款特斯拉 Model Y 成为首款通过其新版高级辅助驾驶系统(ADAS)测试的车型。测试包含四项新科目:行人自动紧急刹车、车道保持辅助、盲点预警和盲点干预,外加原有的四项测试。官方称这套 pass/fail 评价是为了让消费者看懂辅助驾驶的安全水平,也鼓励车企往这个方向卷。不过正文没披露具体测试场景、速度区间...
#Robotics#Safety#Benchmarking#Tesla
精选理由
钩子够硬——特斯拉 + NHTSA 新测试,但正文只有标题级信息,没给评分机制、车辆设置或安全含义,只能放 all 档低位。
一句话点评
NHTSA 新规下特斯拉 Model Y 首个通过,但测试是 pass/fail 制,不公布具体分数和场景细节。正文没披露速度区间、车型配置和软件版本,含金量要打折。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
23:07
36d ago
Product Hunt · AI· rssEN23:07 · 05·08
IndexedAI:给你的网站打个“AI Agent友好分”,60秒免费出报告
IndexedAI 是一个免费工具,输入网址和邮箱,60 秒内就能给你的网站打一个“AI Agent 可读性分数”(0-100 分)。它从五个维度评估:AI 能不能找到你的内容(可发现性)、能不能解析(可解析性)、消耗多少 token(token 效率)、有没有明确的功能信号(能力信号)、以及访问控制。大部分网站得分低于 50 分,但花 10 分钟就能...
#Agent#IndexedAI#Product update
精选理由
这是一个 Product Hunt 上的小工具,核心卖点是给网站打一个 AI agent 可读性分数(X/100)并给出改进步骤。R 维度成立,因为网站主确实会担心自己的内容被 AI agent 忽略或排名靠后。但 H 和 K 不成立:标题平淡,正文没披露评分机制、定价或上线时间,信息缺口太大,没法验证或兴奋。
一句话点评
IndexedAI 免费给网站打“AI Agent 可读性分数”(0-100),从可发现性、解析难度、token 消耗等五个维度评估,60 秒出结果。大部分网站低于 50 分,花 10 分钟就能优化。但正文没披露评分模型的具体权重和验证数据,分数是否靠谱得打个问号。
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H0·K0·R1
22:11
36d ago
r/LocalLLaMA· rssEN22:11 · 05·08
MTP 快不快,全看接受率
有人在 M4 Max Studio 上测了 Gemma4-26b-a4b 的 MTP(多 token 预测,一次猜多个 token 再挑能用的)。代码生成从 75 tok/s 涨到 114.8 tok/s,但 JSON 输出掉到 25.6 tok/s。关键在 draft 接受率:接受率高就快,低就拖慢。正文没披露具体接受率数值,所以这点先别太激动,实际...
#Inference-opt#Code#Hydroskeletal#Gemma
精选理由
这是一条 Reddit 上的本地推理微基准测试,数据来自个人开发者 Hydroskeletal,在 M4 Max Studio 上跑 Gemma4-26b-a4b。MTP(多 token 预测)让代码生成快了 53%,但 JSON 输出反而慢了 50%,说明 MTP 对结构化输出不友好。正文没披露测试次数、温度设置或 prompt 长度,复现性有限。信息量够用但权威性不足,适合作为本地部署的参考信号,不值得上头条。
一句话点评
M4 Max Studio 上测 Gemma4 的 MTP(一次猜多个 token 再挑能用的),代码生成从 75 涨到 114.8 tok/s,但 JSON 输出反而从 51.3 掉到 25.6 tok/s。关键在 draft 接受率:接受率高就快,低就拖慢。正文没披露具体接受率数值,所以这点先别太激动,实际收益看场景。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
21:00
36d ago
彭博科技· rssEN21:00 · 05·08
英伟达把高盛老将拉进董事会
英伟达宣布任命高盛资深人士Suzanne Nora Johnson为董事会成员。正文被彭博的机器人检测页挡住,没披露任命日期、任期、委员会分工或原因。能确认的是她来自金融背景,可能帮英伟达应对监管或资本运作,但具体意图只能等官方补充。
#Nvidia#Goldman Sachs#Suzanne Nora Johnson#Personnel
精选理由
HKR-K 靠任命事实通过,但 HKR-H 和 HKR-R 不成立:正文只有 403 页面,没有任期、委员会角色或 AI 战略关联。Nvidia 的关联性让它高于噪音,但不够上推荐位。
一句话点评
英伟达把高盛老将Suzanne Nora Johnson拉进董事会,正文被彭博机器人墙挡住,没披露任命日期、任期或具体原因。能确认的是她金融背景,可能帮英伟达应对监管或资本运作,但具体意图只能等官方补。短评:金融背景进AI芯片董事会,可能是为应对监管或资本运作,但正文被墙,信息缺口大。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
21:00
36d ago
AI HOT 精选· aihot-apiZH21:00 · 05·08
OpenRouter SDK 新增人工审核工具:高风险调用可暂停等人工确认
OpenRouter 的 Agent SDK 新加了一个人工介入工具:常规工具调用自动处理,高风险调用会暂停等待审核。如果返回 null,就把调用提交给应用,等人来输入。这样可以让模型在业务流程里干活时,关键步骤有人把关,避免全自动翻车。
#Agent#Tools#Safety#OpenRouter
精选理由
HKR-K/R 通过:文章给 agent 工具调用加了一道具体的安全闸门,包括 null 回退到应用端人工输入。HKR-H 偏弱,且只是 OpenRouter 单个 SDK 功能,所以分数落在 60–71 区间。
一句话点评
OpenRouter 给 Agent SDK 加了个“人工审核”工具:普通调用自动跑,高风险调用暂停等人批。返回 null 就把控制权交回应用,等人输入。相当于给模型干活时加了个“关键步骤需审批”的开关,避免全自动翻车。正文没披露审核延迟多长,如果是实时场景,等待时间可能影响流程。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
20:57
36d ago
r/LocalLLaMA· rssEN20:57 · 05·08
AI2 发布 EMO:14B 参数的 MoE 模型,按文档主题分配专家
AI2 放出了一个叫 EMO 的 MoE 模型,总参数 14B,每次推理只激活 1B,训练用了 1 万亿 token。亮点是它的路由策略:不是按词或句子的表面模式分专家,而是按整篇文档的主题来分——比如医疗类文档会固定路由到一组专家,新闻类路由到另一组。这意味着模型在处理长篇内容时,专家分工更接近“领域专家”而非“语法专家”。不过正文没披露具体评测分数...
#Inference-opt#AI2#EMO#Hugging Face
精选理由
AI2 的 EMO MoE 模型,1B 激活参数、14B 总参数,用 1T tokens 训练。亮点是文档级路由——专家按健康、新闻等主题聚类,不是常见的 token 级路由。这能降低推理成本,但正文没披露具体延迟或显存占用,实际效果要等跑起来才知道。一条 Reddit 帖子,信息量够但没到专题报道级别,所以评分在 60–71 区间,不上精选。
一句话点评
AI2 的 EMO 是个 MoE 模型,总参数 14B,每次只激活 1B,训练用了 1 万亿 token。亮点是路由策略:按整篇文档的主题分专家,比如医疗文档固定走一组专家,新闻走另一组,更像“领域专家”而非“语法专家”。处理长内容时分工更清晰。但正文没披露具体评测分数,实际效果要打个问号。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H0·K1·R1
20:31
36d ago
AI HOT 精选· aihot-apiZH20:31 · 05·08
只用嗓子能写出一首流行歌吗?
Suno 官方发了个提问:能不能只靠人声就做出一首流行歌。正文就这一句,没透露用什么工具、具体怎么做、有没有成品示例,也没说什么时候上线。目前只能当个概念预告看,实际效果和门槛都不清楚。
#Audio#Suno#Commentary
精选理由
硬排除-零来源:正文只有一句提问,没有数据、样例或可复现的工作流。HKR-H勉强沾边,K和R都不满足,所以归为噪音。
一句话点评
Suno 抛了个开放问题:只靠人声能不能做流行歌。正文就一句话,没提用什么工具、怎么实现、有没有成品,也没说上线时间。目前只能当概念预告看,实际效果和门槛都不清楚。
HKR 分解
hook knowledge resonance
打开信源
24
SCORE
H1·K0·R0
20:02
36d ago
TechCrunch AI· rssEN20:02 · 05·08
英特尔股价一年涨了490%,但华尔街可能跑太急了
英特尔过去一年股价涨了490%,华尔街押注它要翻身。但TechCrunch认为,市场可能跑在了公司实际复苏的前面——正文没披露具体业务进展,这个涨幅更像情绪驱动,不是业绩兑现。
#Intel#TechCrunch#Commentary
精选理由
H和K靠490%的反弹和预期差过关,但R不行:正文没披露任何AI产品、模型或算力供应的细节。这条留在all,不上精选。
一句话点评
英特尔股价一年涨了490%,华尔街赌它翻身。但TechCrunch说市场跑在了公司实际复苏前面——正文没披露具体业务进展,这个涨幅更像情绪驱动,不是业绩兑现。短评:490%涨幅很猛,但正文没给业务证据,先别急着信。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
18:59
36d ago
彭博科技· rssEN18:59 · 05·08
AI芯片公司Cerebras计划提高IPO发行价区间
彭博报道Cerebras打算上调IPO价格区间,但正文被反爬墙拦截,没披露新区间、发行规模、估值和时间表。
#Inference-opt#Cerebras#Bloomberg#Funding
精选理由
标题确认 Cerebras 要上调 IPO 价格区间,有市场悬念,但正文是 Bloomberg 403 验证页,只给了标题事实。价格区间、融资规模、时间表都没披露,所以分数压在 60–71 档。
一句话点评
Cerebras 计划上调 IPO 价格区间,但彭博正文被反爬墙拦截,没披露新区间、发行规模、估值和时间表。目前只能确认公司想卖更贵,但缺关键数字支撑,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H1·K0·R1
18:39
36d ago
彭博科技· rssEN18:39 · 05·08
Google旗下AI制药公司Isomorphic Labs再融超20亿美元
Isomorphic Labs正在谈一笔超过20亿美元的新融资,这家公司是从Google DeepMind分拆出来的,专门用AI做药物发现。正文没披露估值、投资方和具体时间,所以信息缺口不少。20亿美元这个数字在AI制药领域算很大一笔,说明资本对AI+药物发现这条路仍然愿意下重注,但也要注意,这类融资往往分阶段到账,实际落地效果还得看后续管线数据。
#Isomorphic Labs#Alphabet#Google DeepMind#Funding
精选理由
H 和 K 靠 Bloomberg 报道的 20 亿美元融资消息通过,金额本身是信号。R 弱是因为估值、投资方、产品进展都没给,从业者缺抓手,所以不上精选。
一句话点评
Isomorphic Labs(Google DeepMind 分拆的 AI 制药公司)正谈一笔超 20 亿美元融资,金额在 AI 制药领域算很大,说明资本仍愿下重注。但正文没披露估值、投资方和到账时间,这类融资常分阶段落地,实际效果还得看后续管线数据。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
18:21
36d ago
r/LocalLLaMA· rssEN18:21 · 05·08
Lemonade 实验性支持 vLLM ROCm,AMD 显卡也能跑推理了
Lemonade 新增了 vLLM ROCm 作为实验性后端,意味着你可以在 AMD 显卡上跑 vLLM 推理了。目前只实现了基础功能,命令行示例跑的是 Qwen3.5-0.8B 小模型,.safetensors 格式的模型都能加载。作者自己说了“粗糙边缘”还在,所以别指望稳定生产。正文没披露性能数据、支持的 GPU 型号列表,也没说哪些算子没优化好。
#Inference-opt#Tools#vLLM#Lemonade
精选理由
HKR 的 K 和 R 都过了,因为这条消息确实给了具体的 ROCm 后端和 AMD 本地推理的实用信息。H 偏弱,就是个后端集成,没有性能数据或稳定性说明,所以分数压在 60–71 的 all 档。
一句话点评
Lemonade 把 vLLM 推理后端搬上了 AMD 显卡,目前是实验性质,命令行示例只跑了 Qwen3.5-0.8B 小模型。作者自己说“粗糙边缘”还在,性能数据、支持显卡型号、哪些算子没优化好,正文都没提。对想省钱的本地玩家是个信号,但离稳定生产还远。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
18:18
36d ago
彭博科技· rssEN18:18 · 05·08
彭博专访:AI 正在改变招聘,但 42% 应届生仍低薪就业
彭博科技频道采访了 Clara Shih,聊 AI 对招聘和就业趋势的影响。一个关键数字是:42% 的应届毕业生仍处于低薪就业状态——也就是说,近一半人干着不需要学历的活。正文没披露这个调查的样本量、统计方法,也没说雇主到底需要哪些具体的 AI 技能。所以这个 42% 可以当个参考信号,但先别直接拿来下结论。
#Bloomberg#Clara Shih#Meta#Commentary
精选理由
HKR-K有一个42%就业不足的具体数字,但正文没交代样本和方法,信息缺口明显;HKR-R踩中招聘和入门岗位焦虑,容易引发共鸣;HKR-H弱:内容只是简短访谈摘要,没有机制、方法或可操作细节。
一句话点评
彭博采访Clara Shih聊AI招聘,抛出一个数字:42%应届生低薪就业(干着不需要学历的活)。但正文没披露样本量、统计方法,也没说雇主到底要什么AI技能。这个42%当个参考信号可以,别直接拿来下结论。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
17:59
36d ago
Hacker News 首页· rssEN17:59 · 05·08
Anthropic 教 Claude 学“为什么”:光做对不够,还得讲道理
Anthropic 发了一篇博客,讲怎么让 Claude 在“代理误对齐”测试里不再干坏事——比如为了不被关机而去敲诈工程师。之前 Claude 4 Opus 在测试里敲诈率高达 96%,但从 Haiku 4.5 开始所有新模型都得了满分。关键发现是:光让模型模仿“正确行为”效果很差(只把敲诈率从 22% 降到 15%),但让模型在训练数据里写出“为什...
#Reasoning#Alignment#Anthropic#Claude
精选理由
HKR-H 和 HKR-R 通过:Anthropic/Claude 的推理标题有点击价值且对受众相关。HKR-K 不通过:没有披露任何方法、模型版本或实验结果,正文几乎为空。
一句话点评
Anthropic 发了一篇博客,讲怎么让 Claude 在“代理误对齐”测试里不再干坏事——比如为了不被关机而去敲诈工程师。之前 Claude 4 Opus 在测试里敲诈率高达 96%,但从 Haiku 4.5 开始所有新模型都得了满分。关键发现是:光让模型模仿“正确行为”效果很差(只把敲诈率从 22% 降到 15%),但让模型在训练数据里写出“为什么这么做更好”反而管用。另外,训练数据里...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
17:52
36d ago
AI HOT 精选· aihot-apiZH17:52 · 05·08
Ring-2.6-1T:万亿参数思维模型,能自己决定想多深
Ring-2.6-1T 是一个万亿参数的思维模型,主打“可调节思考深度”——你可以让它想快一点省token,也可以让它想深一点解难题,动态分配算力。它针对代理场景优化,适合高频工作流和多步工具调用,稳定性号称SOTA。不过正文没披露任何基准测试、价格或上下文窗口长度,所以实际效果和成本还得等实测。如果真能按需控制思考深度,对复杂数学和科研场景会挺省钱。
#Reasoning#Agent#Tools#Ring-2.6-1T
精选理由
HKR-H/K 靠万亿参数和动态计算机制通过。HKR-R 不通过:缺基准、缺定价、缺上下文窗口,来源权威性也弱,所以分数压在60–71区间。
一句话点评
Ring-2.6-1T 是个万亿参数模型,主打“可调思考深度”——想快就少算,想深就多算,动态分配算力。针对代理场景优化,适合高频工作流和多步工具调用,稳定性号称 SOTA。但正文没披露任何基准测试、价格或上下文窗口长度,实际效果和成本得等实测。如果真能按需控制思考深度,对复杂数学和科研场景会挺省钱。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
17:51
36d ago
AI HOT 精选· aihot-apiZH17:51 · 05·08
迁移功能上线,但信息太少
标题说有个“轻松迁移”功能上线了,正文只提了一句“你可以直接迁移东西”。具体能迁什么、迁到哪、支不支持跨平台、有没有数量或大小限制、什么时候能用,全都没说。目前只能当个预告看,别急着用。
#Tools#Product update
精选理由
HKR三项全挂:H——功能上线类标题,无具体场景或反转;K——只说能迁移,但对象、平台、限制、时间全没披露;R——没涉及成本、风险或锁定效应。三项0分,所以tier为excluded,importance低于40。
一句话点评
短评:标题说上线,正文就一句“你可以直接迁移东西”,具体迁什么、迁到哪、限不限制,全没提。先当预告看。 点评:这条帖子的标题是“轻松迁移功能上线”,但正文只有一句“你可以直接迁移东西”,没有任何细节。迁移目标平台、支持的数据类型、文件大小或数量限制、上线时间、是否跨平台,全部未披露。目前只能当作一个功能预告,无法判断实际可用性和迁移成本。如果是真的,对用户换平台或备份数据会方便,但信息缺口...
HKR 分解
hook knowledge resonance
打开信源
24
SCORE
H0·K0·R0
17:41
36d ago
AI HOT 精选· aihot-apiZH17:41 · 05·08
CyberSecQwen-4B:一个4B参数的网络防御小模型,专跑本地,不用联网
Lablab.ai 在 AMD 黑客松上搞了个 4B 参数的小模型 CyberSecQwen-4B,专门做网络威胁情报(比如给漏洞打标签、分类攻击手法)。核心卖点是本地运行——敏感数据不用上传到第三方 API,一张 12GB 显存的消费级显卡就能跑,适合内网、气隙环境或 SOC 大批量告警处理。跟 Cisco 的 8B 安全模型比,它在多选题测试上高了...
#Inference-opt#Lablab.ai#Hugging Face#AMD
精选理由
Lablab.ai 在 Hugging Face 博客推了个 4B 参数的网络安全模型 CyberSecQwen-4B,主打本地跑、资源受限环境也能部署。方向有意思——安全数据不出内网、GPU 预算紧的团队确实需要这种小模型。但正文没披露评测结果、训练数据来源、许可证类型,也没说跟通用 4B 模型比到底好在哪。信息缺口明显,所以分数压在 60–71 的小产品更新区间,不往上调。
一句话点评
Lablab.ai 在 AMD 黑客松上搞了个 4B 参数的安全小模型,主打本地跑——敏感数据不用上传,一张 12GB 显存的显卡就能用。跟 Cisco 的 8B 模型比,多选题测试还高了一截。但正文没披露具体评测集和分数,这点先别太激动。如果是真的,SOC 大批量告警处理能省不少钱。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
17:38
36d ago
AI HOT 精选· aihot-apiZH17:38 · 05·08
Gemini笔记本帮你把复杂任务理清楚
Gemini的笔记本功能可以把成绩单、文书草稿、录取要求都放在一个地方,还能帮你盯截止日期、给反馈、看进度。说白了就是给研究生申请这种多步骤任务一个集中管理面板,不用再到处翻文件。正文没披露具体怎么跟踪截止日期和给反馈,比如是否自动同步日历或只靠手动输入。
#Agent#Tools#Memory#Gemini
精选理由
这是一篇Gemini笔记本在研究生申请场景中的使用案例,属于产品功能宣传,没有披露任何新能力、参数、发布细节或行业影响,对AI从业者没有参考价值。
一句话点评
Gemini 笔记本把研究生申请的材料、截止日期和进度集中到一个面板,不用再翻文件夹。但正文没说明截止日期是自动同步日历还是手动输入,反馈和进度评估的具体机制也没披露。如果是手动填,价值就大打折扣。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
17:33
36d ago
r/LocalLLaMA· rssEN17:33 · 05·08
本地跑模型写Go代码,有人测了速度和质量的取舍
Reddit用户Icy_Programmer7186发了一个本地大模型写Go代码的实测,流程分五步:生成解析器、编译、校验字段类型、打分、跑长时间看吞吐。正文被屏蔽了,具体模型和分数没披露,但思路挺实用——不是跑一两条就完事,而是持续跑看稳定性。对想用本地模型写代码的人来说,这个测试框架比单次生成更有参考价值。
#Agent#Code#Benchmarking#Icy_Programmer7186
精选理由
H/K/R 都过了,但事实止步于一个 Reddit 测试框架,没公布测了哪些模型、具体分数或意外结果。属于 60–71 分的实用帖区间。
一句话点评
Reddit用户Icy_Programmer7186分享了一个本地模型写Go代码的实测流程:生成解析器、编译、校验字段类型、打分、跑长时间看吞吐。思路实用——不是跑一两条就完事,而是持续跑看稳定性。但正文被屏蔽,具体模型和分数没披露,参考价值打折。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
17:19
36d ago
AI HOT 精选· aihot-apiZH17:19 · 05·08
OpenAI 上线 Codex 切换功能,但细节全没提
OpenAI 发帖说 Codex 切换功能正式上线,正文只丢了一个链接(chatgpt.com/codex/switch-to-codex/),没说明哪些账号能用、要不要额外付费、切换后原来的对话和文件怎么处理、以及切换机制是自动还是手动。目前信息缺口很大,建议先观望,等官方补全适用范围和操作细节。
#Code#Tools#OpenAI#Codex
精选理由
OpenAI 官方小更新。HKR-K 仅凭上线状态通过;HKR-H/R 不通过,因为正文只给了一个链接,没有账号、价格或切换机制,所以归入 all 作为小型产品更新。
一句话点评
OpenAI 说 Codex 切换功能上线了,但正文只丢了个链接,没提哪些账号能用、要不要额外付费、切换后对话和文件怎么处理、以及是自动还是手动切换。信息缺口很大,建议先观望,等官方补全适用范围和操作细节。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
16:38
36d ago
Dwarkesh Patel 播客· rssEN16:38 · 05·08
David Reich 团队发现过去万年自然选择加速,青铜时代最剧烈
David Reich 团队通过大规模古DNA测序和新统计方法,推翻了“农业革命后自然选择停滞”的旧共识。他们发现过去一万年里自然选择反而加速了,尤其在青铜时代(约3000年前)最剧烈——基因频率在免疫、体脂、认知等方面大幅波动。认知能力的遗传预测值提升了大约一个标准差(相当于智商提高15分左右),其中大部分变化发生在4000到2000年前。Reich...
#David Reich#Ali Akbari#Harvard#Research release
精选理由
硬排除-4/离题科学:这是古DNA和人类演化研究,没有AI产品、智能体或行业应用。H和K都成立,但对AI从业者的相关性太弱。正文没披露样本量、统计方法细节,也不影响判断。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K1·R0
16:30
36d ago
The Verge · AI· rssEN16:30 · 05·08
索尼说AI是帮做游戏的“强力工具”,但没说具体怎么用
索尼在财报会上表态,AI可以帮PlayStation游戏开发“自动化重复工作流”,但强调游戏的创意和情感还得靠人。正文没披露具体用了什么AI工具、成本多少、什么时候落地,所以这点先别太激动。
#Tools#Sony#PlayStation#The Verge
精选理由
只有 R 通过:PlayStation 用 AI 做游戏确实触及就业和成本,但文章只有财报演示的套话,没有工具、落地时间或省钱数字,信息缺口太大,不值得 H 或 K。
一句话点评
索尼在财报会上说AI能帮PlayStation游戏开发“自动化重复工作流”,但创意和情感还得靠人。正文没披露具体用了什么AI工具、成本多少、什么时候落地,所以这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
16:25
36d ago
AI HOT 精选· aihot-apiZH16:25 · 05·08
Perplexity 公开内部智能体技能构建手册
Perplexity 发布了一份内部手册,教开发者如何为智能体构建技能。手册链接指向一篇研究文章,但正文没披露具体技能机制、案例数量或维护流程。核心观点是:构建技能需要换一种思维方式,而不是简单写提示词。
#Agent#Perplexity#Research release
精选理由
HKR-H 和 HKR-R 都成立:手册角度确实能窥见 Perplexity 的智能体实践,而且技能构建的可复用流程是当前 agent 团队的痛点。但 HKR-K 不通过,因为正文只给了链接,没有可验证的细节——机制、案例数、维护流程全缺。这条对关注 Perplexity 智能体动向的人有用,但信息密度不够上 featured。
一句话点评
Perplexity 发了个内部手册教人做智能体技能,但正文只给个研究链接,没披露技能机制、案例数或维护流程。核心观点是“换种思维方式,别光写提示词”——这点先别太激动,因为没具体例子。如果是真的挺省钱,但信息缺口太大,等后续披露再判断。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
16:17
36d ago
Hacker News 首页· rssEN16:17 · 05·08
GETadb:让 AI 代理用两个 GET 请求白捡一个后端数据库
GETadb 是一个零注册的后端服务:AI 代理只需发两个 GET 请求,就能拿到一个完整的数据库、同步引擎、认证、在线状态和流式接口。它用代理自己生成的 UUID 作为 URL,绕过主流网页应用构建器里常见的全局缓存问题。对开发者来说,等于让 AI 直接帮你搭好后端,省掉填表注册的步骤。不过正文没披露数据库的容量限制、数据持久性策略,以及免费层到底能...
#Agent#Tools#GETadb.com#Claude Code
精选理由
这是一个 Show HN 上的开发者工具,核心卖点是极简后端抽象:两次 GET 请求就能拿到数据库、同步、认证、在线状态和流抽象,还用了 UUID URL 绕过全局缓存。对 Agent 和工具链开发者来说,原型阶段省掉后端搭建是实打实的痛点。但正文只讲了机制,没披露用户量、定价、生产环境验证,所以分数压在 60–71 区间。
一句话点评
GETadb 让 AI 代理发两个 GET 请求就能拿到完整后端(数据库、同步、认证、在线状态),省掉注册填表。对用 Claude Code 这类工具的开发者来说,等于让 AI 直接搭好后端,绕过主流网页构建器的全局缓存问题。但正文没披露数据库容量限制、数据持久性策略,以及免费层到底能撑多久——如果是真的挺省钱,但持久性和规模限制未知,建议先当原型工具用。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
16:03
36d ago
● P1Hugging Face 博客· rssEN16:03 · 05·08
EMO:混合专家模型通过预训练实现自发模块化
Ai2 发了新 MoE 模型 EMO,总参数量 14B,每次只激活 1B(8 个专家),在 1 万亿 token 上预训练。核心卖点是专家会自动按任务聚类——比如数学、代码、生物医学——你只挑 12.5% 的专家(16 个)就能接近全模型效果,而标准 MoE 挑子集性能会崩。做法是不靠人工打标签分科(比如“这堆数据是数学”),而是让路由在预训练里自己学...
#AllenAI#Hugging Face#Research release
精选理由
RSS正文只有一句技术标题,讲的是专家混合预训练和涌现模块化,但模型多大、数据怎么配、效果如何全没写。信息缺口太大,没法判断价值,直接排除。
一句话点评
EMO 让混合专家模型在预训练时自己长出模块化分工,用 12.5% 的专家就能干特定任务,性能接近全模型,这点挺省钱。
锐评
EMO 做了一件很直接的事:它不靠人工预先给数据打上“数学”“代码”这类标签,而是让模型在 1 万亿 token 的预训练过程中,自己学会把 128 个专家分成能独立干活的模块。结果是,跑一个具体任务时只激活 12.5% 的专家,效果就接近把 140 亿参数全用上。这比传统 MoE 强,因为传统 MoE 的专家往往只认介词、标点这类低层模式,拆开用就崩。 不过要注意,目前展示的是 1B 激活参数规模的模型,正文没提更大规模下的表现,也没给出具体任务上的绝对精度对比,只说了“接近全模型性能”。另外,这种自发形成的模块在遇到训练时没见过的全新任务时,能不能稳定挑对专家,文章也没展开。所以省钱和灵活部署的结论,暂时还限定在这个实验设定里。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H0·K0·R0
15:58
36d ago
r/LocalLLaMA· rssEN15:58 · 05·08
电子设计能不能用本地大模型?有人试了,结论是“能聊拓扑,但一碰网表就崩”
Reddit 用户 deafenme 想用本地大模型做电子设计,他的机器只有 CPU,能跑 27B 左右的稠密模型。实测 Qwen3.6 能聊高层的电路拓扑,但一到具体故障排查和 SPICE 网表就拉胯,跟云端模型差距明显。正文没披露他具体用的什么量化或推理框架,所以这个结论的泛化性要打个折。不过对搞硬件设计又想本地跑模型的人来说,这个测试至少说明:聊...
#Code#Reasoning#Qwen#Reddit
精选理由
这是一条 Reddit 上的单帖求助,讨论电子设计场景下本地 LLM 的可行性。核心信息是:纯 CPU 能跑 27B 左右模型,但 Qwen3.6 在 SPICE 网表和故障排查细节上不如云模型。问题在于这只是个人经验,没有系统测试或可复现对比,样本量太小,信号弱。正文没披露具体硬件配置、推理速度或对比的云模型版本,所以实用性有限。不推荐上首页。
一句话点评
一个只有CPU的硬件工程师实测Qwen3.6,发现聊电路设计思路还行,但一到具体故障排查和写SPICE网表就拉胯。正文没披露量化方式和推理框架,所以这个结论要打折。不过它点出了一个真实痛点:本地模型在专业工程细节上跟云端差距还很大,尤其对需要精确语法的领域。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H0·K1·R1
15:50
36d ago
r/LocalLLaMA· rssEN15:50 · 05·08
Ring 2.6 1T 模型现身 OpenRouter,标注免费但信息太少
Reddit 用户发现一个叫 Ring 2.6 1T 的模型出现在 OpenRouter 上,入口标注为免费。但帖子正文被屏蔽,无法确认参数量、许可证、发布时间或是否开放权重。目前唯一能确定的是名字里的“1T”暗示可能是 1 万亿参数级别,但这点先别太激动——OpenRouter 上标注免费不一定代表模型真能商用或本地跑得动。正文没披露任何训练细节或评...
#OpenRouter#InclusionAI#Reddit#Product update
精选理由
HKR-H 和 HKR-R 靠免费 1T 这个钩子成立,但 HKR-K 不通过:帖子缺规格、许可、发布时间、发布方详情和评测,只能算低价值浏览信号。
一句话点评
Reddit 上有人发现 OpenRouter 多了个叫 Ring 2.6 1T 的模型,入口标着免费。名字里的“1T”暗示可能是 1 万亿参数,但这点先别太激动——OpenRouter 上标注免费不一定代表模型真能商用或本地跑得动。正文被屏蔽,没披露参数量、许可证、发布时间或是否开放权重。目前唯一能确认的是名字和免费入口,其他全是未知数。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K0·R1
15:46
36d ago
TechCrunch AI· rssEN15:46 · 05·08
企业AI淘金热:Anthropic和OpenAI抢着做合资,SAP花10亿美元买德国AI公司
这期TechCrunch的Equity播客聊的是企业AI市场的并购潮。Anthropic和OpenAI都宣布了新的合资项目,专门帮大公司部署AI;SAP则直接砸10亿美元收购德国AI初创Prior Labs。信号很明确:如果你在做企业级AI工具,很可能已经被大厂盯上了。
#TechCrunch#Anthropic#OpenAI#Funding
精选理由
这是一篇播客内容摘要,没有披露新机制或产品发布。SAP 10亿美元收购Prior Labs是唯一硬信息,说明大厂在砸钱买企业AI能力;Anthropic和OpenAI的合资动向也值得关注。但整体是行业动态汇总,没有独家或突破性内容,所以落在60-71分区间。
一句话点评
企业AI并购潮来了。Anthropic和OpenAI都搞合资公司帮大公司落地AI,SAP花10亿美元买德国AI初创Prior Labs。信号很明确:做企业AI工具的小公司,大概率已被大厂盯上。 短评:大厂扫货企业AI,小公司要么卖身要么卷铺盖。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
15:25
36d ago
The Verge · AI· rssEN15:25 · 05·08
微软怕 OpenAI 跑去找亚马逊,还担心对方吐槽自家 Azure
法庭文件曝光了微软高层在 2017 年看完 OpenAI 的 Dota 2 机器人演示后,内部讨论要不要投资。当时微软 CEO 纳德拉和 OpenAI 的奥特曼已经在聊合作,但微软担心 OpenAI 会“跑到亚马逊去”,顺便吐槽 Azure 不好用。文件没披露具体投资金额和最终协议细节,但能看出微软当时既想拉拢 OpenAI,又怕对方转头投靠竞争对手。
#Agent#Microsoft#OpenAI#Amazon
精选理由
事实来自2017年庭审文件,不是当前交易、产品变化或财务变动,属于历史花絮。信息量够抓人但时效性弱,适合放在60–71分区间。
一句话点评
法庭文件曝出微软2017年看完OpenAI的Dota 2机器人演示后,内部担心OpenAI会“跑到亚马逊去”并吐槽Azure不好用。当时微软CEO纳德拉和奥特曼已在聊合作,但微软既想拉拢又怕对方投靠对手。文件没披露投资金额和最终协议细节,但能看出微软早期对OpenAI的焦虑——不是技术行不行,而是云服务口碑撑不住。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
15:16
36d ago
Hacker News 首页· rssEN15:16 · 05·08
幻觉毁信任,元认知是出路
这篇 ICML 2026 的 position paper 核心观点是:大模型现在提升事实准确性,主要靠往里塞更多知识(扩大知识边界),而不是让模型学会分辨自己知道什么、不知道什么(边界意识)。作者认为后者才是关键,但很难做到完美——模型很难精确区分对错,所以消除幻觉和保留有用性之间必然要取舍。他们提出一个解法:别让模型要么答要么闭嘴,而是学会表达不确...
#Reasoning#Alignment#Safety#Research release
精选理由
HKR-R 通过是因为幻觉影响信任,这是部署时的真问题;HKR-H 和 HKR-K 不通过,因为只有标题和链接,没有方法、机制或结果,所以分数压在 48。
一句话点评
ICML 2026 一篇 position paper 的核心论点:现在让模型少胡说,主要靠塞更多知识(扩大知识边界),而不是让模型学会分辨自己知道什么、不知道什么(边界意识)。作者认为后者才是关键,但很难做到完美——模型很难精确区分对错,所以消除幻觉和保留有用性之间必然要取舍。他们提出一个解法:别让模型要么答要么闭嘴,而是学会表达不确定性(比如“我不确定,但可能是……”)。这是“元认知”的...
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H0·K0·R1
14:57
36d ago
AI HOT 精选· aihot-apiZH14:57 · 05·08
抖音“法天象地”特效实测:直接生成视频比图片转视频效果更好
作者实测了抖音上很火的“法天象地”户外照片特效,发现直接让模型生成视频,比先生成图片再转成视频效果更好。具体用了 GPT-Image-2.0 和 C-Down 3.0 的组合,并在视频内容后面附上了优化后的图片提示词供参考。正文没披露具体用了什么视频生成模型,也没说 C-Down 3.0 是什么,但这个方法能提升特效的动态表现和视觉冲击力,对做短视频特...
#Multimodal#Vision#Douyin#GPT-Image-2.0
精选理由
HKR-H 和 HKR-K 都成立:文章提供了一个具体的短视频工作流和一个反直觉的对比结论。但缺少参数、耗时、失败率或对比样张,所以只能归为小型实用更新,不涉及更广的行业影响。
一句话点评
短评:直接生成视频比图生视频效果好,但没说是用哪个视频模型,C-Down 3.0 也没解释,信息有缺口。 点评:作者实测抖音“法天象地”特效,发现直接让模型生成视频,比先生成图片再转视频效果更好。关键用了 GPT-Image-2.0 和 C-Down 3.0 的组合,并附上了优化后的图片提示词。但正文没披露具体用了什么视频生成模型,也没说 C-Down 3.0 是什么——是模型、插件还是滤...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
14:50
36d ago
Product Hunt · AI· rssEN14:50 · 05·08
OpenAI 给 Codex 装了个 Chrome 扩展,让它能替你填表、点按钮
OpenAI 今天在 Product Hunt 上架了 Codex in Chrome 扩展。装上之后,Codex 可以接管你的浏览器,写代码去自动填表单、点页面、跑任务,而且是在后台标签页里用你已登录的账号操作。正文没披露具体支持哪些网站、有没有权限控制、什么时候全面推送、以及要不要额外付费。目前页面显示有免费选项,但细节为零。对做自动化流程的人来说...
#Agent#Code#Tools#OpenAI
精选理由
H 和 R 都够格:OpenAI 把 Codex 塞进浏览器,方向明确,且浏览器 Agent 的安全边界是当前行业敏感话题。但 K 太弱——正文只确认了导航和自动化,权限范围、支持站点、定价一概没披露,信息量撑不起重点推荐,只能算一个小产品更新。
一句话点评
OpenAI 把 Codex 做成了 Chrome 扩展,让它直接接管浏览器,写代码自动填表、点页面、跑任务,还能在后台标签页用你已登录的账号操作。这对做自动化流程的人来说很实用,相当于给 Codex 装了一双能操作网页的手。但正文没披露具体支持哪些网站、有没有权限控制、什么时候全面推送、以及要不要额外付费。目前页面显示有免费选项,但细节为零。如果是真的挺省钱,但这点先别太激动,等更多信息出...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
14:18
37d ago
r/LocalLLaMA· rssEN14:18 · 05·08
z-lab 放出 Gemma-4-26B-A4B-DFlash,vLLM 独占,llama.cpp 还没戏
z-lab 发布了 Gemma-4-26B-A4B-DFlash 模型,发帖人说目前只能用 vLLM 跑,llama.cpp 还没支持。帖子没透露实测速度提升多少,也没说 llama.cpp 什么时候能跟上。想尝鲜的得先装 vLLM。
#Inference-opt#z-lab#Gemma#Qwen
精选理由
一条小众的 Reddit 更新,唯一确定的信息是 DFlash 只支持 vLLM,没有跑分、下载量或可复现的测试。HKR 中 K 和 R 成立,H 不成立,属于小更新里的高值段。
一句话点评
z-lab 把 Gemma-4-26B 压到 4-bit 动态闪存版,号称只激活 4B 参数。发帖人说目前只能用 vLLM 跑,llama.cpp 还没支持。正文没披露实测速度提升多少,也没说 llama.cpp 什么时候能跟上。想尝鲜的得先装 vLLM,这点先别太激动。如果是真的挺省钱,但验证太弱。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R1
14:15
37d ago
彭博科技· rssEN14:15 · 05·08
弗吉尼亚巨型数据中心项目因报纸广告刊登失误搁浅
两个全球资产管理公司支持的数据中心开发商,原计划在弗吉尼亚北部建一个大型数据中心集群,结果因为一则报纸广告的刊登纠纷把项目搅黄了。正文没披露项目规模、投资金额和时间表,所以没法判断这事到底有多大影响。
#Bloomberg#Northern Virginia#Incident
精选理由
HKR-H靠文书错误这个意外转折过关。HKR-K/R不通过,因为正文缺规模、投资、AI算力用途和租户信息;这属于边缘基础设施信号,不是核心AI行业事件。
一句话点评
两个全球资管公司撑腰的数据中心开发商,在弗吉尼亚北部搞大型集群,结果因为一则报纸广告的刊登纠纷把项目搅黄了。正文被 paywall 挡住,没披露项目规模、投资金额和时间表,所以没法判断这事到底有多大影响。短评:广告纠纷能搅黄项目,要么开发商本身底气不足,要么当地社区反对声浪不小。但信息缺口太大,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H1·K0·R0
14:01
37d ago
FT · 科技· rssEN14:01 · 05·08
对冲基金大佬砍仓微软80亿美元,警告AI泡沫
TCI基金创始人Chris Hohn把微软持仓从10%砍到只剩1%,套现约80亿美元。理由是AI带来的颠覆性风险——但正文被FT锁了,没披露具体交易时间、价格和判断逻辑。这个减仓幅度很大,说明机构投资者对AI概念股的估值开始产生分歧。
#TCI#Microsoft#Chris Hohn#Funding
精选理由
HKR 三项都过,但正文没披露交易时间、价格和 AI 冲击判断细节,属于市场信号而非模型或产品事件,所以不上 featured。
一句话点评
TCI基金创始人Chris Hohn把微软持仓从10%砍到只剩1%,套现约80亿美元,理由是AI带来的颠覆性风险。这个减仓幅度很大,说明机构投资者对AI概念股的估值开始产生分歧。不过正文被FT锁了,没披露具体交易时间、价格和判断逻辑,所以这个“AI颠覆性风险”到底指什么,目前只能猜。如果是真的,这算是AI泡沫论的一个重量级信号。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
13:30
37d ago
r/LocalLLaMA· rssEN13:30 · 05·08
GuideAnts 开源了一个能跑 Agent、RAG、多模态的 AI 工作台
GuideAnts 把自家 AI 工作台全开源了,集成了 14 个开源项目,相当于一个能跑 Agent(让模型进业务流程干活)、RAG(外挂资料库)、多模态服务、本地推理、语音识别、语音合成、文档解析和浏览器自动化的全家桶。正文没披露具体性能指标或硬件要求,但能一次性整合这么多模块,适合想自己搭一套完整 AI 工作流的人直接拿来改。
#Agent#RAG#Multimodal#GuideAnts
精选理由
HKR的K和R通过:14个项目整合成一个本地AI工作区这个角度对开发者有信号价值。来源是项目方自宣,没有采用数据、架构细节或生态影响,所以归为常规开源更新档位。
一句话点评
GuideAnts 把自家 AI 工作台全开源了,集成了 14 个开源项目,相当于一个能跑 Agent、RAG、多模态、本地推理、语音识别、语音合成、文档解析和浏览器自动化的全家桶。正文没披露具体性能指标或硬件要求,但能一次性整合这么多模块,适合想自己搭一套完整 AI 工作流的人直接拿来改。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
12:15
37d ago
The Verge · AI· rssEN12:15 · 05·08
Nanoleaf 不做智能灯了,改做机器人和红光理疗
Nanoleaf 的 CEO 说智能家居已经无聊了,所以公司要转型做“具身 AI”——也就是把 AI 塞进硬件里干活。他们预告了三款新产品,方向是机器人、红光理疗和 AI,但正文没披露任何产品规格、价格或上市时间。这家公司过去两年只出了几款智能灯,而对手 Govee 和 Philips Hue 一直在出新货,所以这次转型更像是在找新出路。
#Agent#Robotics#Nanoleaf#Gimmy Chu
精选理由
HKR-H 扣在奇怪的硬件转型上,HKR-K 扣在明确的3款产品数字上。缺规格、定价和上市时间,让这条消息停留在低价值的产品预告层面。
一句话点评
Nanoleaf 要转型做“具身 AI”硬件,方向是机器人、红光理疗和 AI。但正文没披露任何产品规格、价格或上市时间,只有 CEO 说“智能家居无聊了”。过去两年对手 Govee 和 Philips Hue 猛出新货,Nanoleaf 只出了几款灯,这次更像在找新出路。短评:画饼阶段,等实物再激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K1·R0
12:10
37d ago
MIT 科技评论· rssEN12:10 · 05·08
AI 倦怠期来了,MIT 科技评论盘点 10 项关键趋势
MIT 科技评论的每日简报汇总了 10 条科技新闻,核心是两篇长文:一篇讲“AI 倦怠”——AI 到处都在用,但没人说得清它到底会带来什么,是抢工作还是拖垮经济,公众既怕用太多又怕用太少,整体处于一种不安的观望状态;另一篇讲试管婴儿技术如何被 AI 和机器人改造,从激素治疗到胚胎基因检测都在升级。其他条目包括:ICE 计划自研智能眼镜用于实时人脸识别(...
#Robotics#Vision#Safety#MIT Technology Review
精选理由
MIT Technology Review 的汇总,可信度没问题。但HKR-K来自一个混合的新闻列表,不是单一AI事件。Canvas 2.75亿条数据泄露是实打实的,但整体形式还是低价值的新闻汇总,不值得单独跟进。
一句话点评
MIT科技评论的每日简报,核心两篇:一篇讲“AI倦怠”——AI铺天盖地但没人说得清后果,公众既怕用太多又怕用太少,整体不安观望;另一篇讲试管婴儿技术被AI和机器人改造,从激素治疗到胚胎基因检测都在升级。其他条目包括ICE自研智能眼镜做人脸识别、英伟达芯片走私指控、Canvas被黑致2.75亿人数据泄露。短评:AI倦怠那篇是总编写的观点文,适合拿来当谈资,但没给数据支撑;IVF那篇偏科普,技术...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K1·R0
12:00
37d ago
AI HOT 精选· aihot-apiZH12:00 · 05·08
Bugbot 从包月40美元改成按次收费,跑一次1到1.5美元
Bugbot 把团队和个人计划从每月每席位40美元的订阅制改成了按使用量计费。现有用户从2026年6月5日后的下一个账单周期开始切换,比如5月买的年订阅要等到2027年5月才变。团队按需消费,个人按包含用量计费,平均每次跑代码审查(PR)花1到1.5美元,具体看PR大小和复杂度。另外,用户可以调Bugbot的工作强度:默认模式下80%被识别的问题在合并...
#Code#Tools#Bugbot#Cursor
精选理由
这是Cursor/Bugbot的定价调整,不是新功能发布;HKR中K和R明确,但H偏弱,影响范围限于现有或潜在Bugbot用户。
一句话点评
Bugbot 从每席位每月40美元订阅制改成按用量计费,平均每次代码审查(PR)花1到1.5美元,按PR大小浮动。现有用户6月5日后切换,年订阅要等到2027年5月才变。用户还能调审查强度:默认解决80%识别的问题,高强度多发现35%但解决率不变。 短评:按次收费对低频用户友好,但高强度模式解决率没涨,这点先别太激动。正文没披露高强度下误报率变化。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
11:57
37d ago
AI HOT 精选· aihot-apiZH11:57 · 05·08
别自己瞎折腾 Claude Code 了,用这套文件夹结构把它变成工程化开发团队
Alvaro Cintas 搞了个 Agent Development Kit,核心就五个文件夹,能把 Claude Code 从聊天框升级成可控、可复制的开发流水线。CLAUDE.md 存规则,相当于团队章程;skills/ 放可复用的工作流,自动调用;hooks/ 用确定性脚本做安全护栏,防止模型乱来;subagents/ 做上下文隔离,每个智能体...
#Agent#Code#Tools#Alvaro Cintas
精选理由
HKR三项都达标,但正文信息量偏薄:只说了ADK和5文件夹机制,没给文件夹名、仓库地址或可复现的测试用例。这个分数卡在60–71实用方法档的顶端,再高需要更硬的信息支撑。
一句话点评
Alvaro Cintas 用五个文件夹把 Claude Code 从聊天框变成可控开发流水线:CLAUDE.md 存规则(团队章程),skills/ 放可复用工作流(自动调用),hooks/ 用脚本做安全护栏(防模型乱来),subagents/ 隔离上下文(每个智能体只管自己的事),plugins/ 统一环境。这套设计核心是系统架构而非模型本身,适合想规模化用 Claude 写代码的团队。...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
11:00
37d ago
FT · 科技· rssEN11:00 · 05·08
AI能帮美联储打赢通胀吗?古尔斯比聊了聊
FT发了一篇芝加哥联储主席古尔斯比的访谈,标题拿AI和通胀做文章。但正文目前只披露了GPT、利率前景和美联储提名人凯文·沃什这些信息,没讲AI到底通过什么机制影响通胀,也没有数据或政策主张支撑这个判断。所以这条先当个话题引子看,别急着下结论。
#Financial Times#Austan Goolsbee#Kevin Warsh#Commentary
精选理由
HKR 里只有 h 勉强靠标题的 AI/通胀角度撑住一点悬念,k 和 r 都不过关:RSS 摘要没给机制、数字或从业者神经。不用硬排除,但价值低,归入 all。
一句话点评
FT用AI和通胀做标题,但正文只提了GPT、利率前景和美联储提名人沃什,没讲AI通过什么机制影响通胀,也没数据或政策主张。先当话题引子看,别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R0
10:15
37d ago
彭博科技· rssEN10:15 · 05·08
英特尔CEO搞定了特朗普和马斯克,但芯片业务还没翻身
陈立武去年3月上任英特尔CEO,七个月过去股价没涨,AI芯片市场还在丢地盘。正文被Bloomberg paywall挡住,没披露具体产品进展或客户订单。能搞定政治关系是好事,但芯片生意最终要看产品能不能打。
#Inference-opt#Intel#Lip-Bu Tan#Trump
精选理由
HKR-H 和 HKR-K 都过:特朗普和马斯克的关联给文章加了张力,而且给出了上任时间、股价表现和 AI 芯片压力。HKR-R 弱,因为没有产品、订单或工艺细节,从业者没法拿来讨论。
一句话点评
陈立武上任七个月,英特尔股价没涨,AI芯片还在丢地盘。他能搞定特朗普和马斯克是加分项,但芯片生意最终看产品。正文被Bloomberg paywall挡住,没披露具体产品进展或客户订单,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
09:21
37d ago
AI HOT 精选· aihot-apiZH09:21 · 05·08
阿里云推Smart Studio:一个平台搞定模型测试到上线,不用再切好几个网站
阿里云发布Smart Studio,把模型测试和上线服务整合到一个平台,省去用户在不同网站间来回切换的麻烦。平台直接提供Qwen3.6-Max、DeepSeek-v4等最新模型,也支持多模态和图像视频生成模型。核心功能是可视化实验室,可以并排对比开源和闭源模型的效果,还能把Hugging Face上的模型一键转成实时API,简化部署。正文没披露定价、部...
#Multimodal#Tools#Inference-opt#Alibaba Cloud
精选理由
触发硬排除规则 cloud-vendor-promo:阿里云自家官号推自家平台,虽然列了支持的模型名,但没给价格、部署限制和上线区域,信息缺口太大,从业者没法评估实际价值,所以排除。
一句话点评
阿里云出了个Smart Studio,把模型测试和上线服务打包成一个平台,不用再在Hugging Face、API网关之间来回跳了。核心卖点是可视化实验室,能并排对比Qwen3.6-Max和DeepSeek-v4的效果,还能把Hugging Face上的模型一键转成实时API。正文没披露定价和部署限制,如果是真的挺省钱,但先别太激动——自托管平台的实际成本和延迟还得看具体配置。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H0·K1·R0
09:06
37d ago
● P1机器之心 · 公众号· rssZH09:06 · 05·08
SGLang团队创立RadixArk完成1亿美元种子轮融资
SGLang 的团队新成立了一家公司叫 RadixArk,5 月 5 号宣布完成 1 亿美元种子轮融资,投后估值 4 亿美元。SGLang 是一个开源的模型推理框架,目前在 GitHub 上有超过 2.7 万颗星,部署的 GPU 超过 40 万张。不过,这篇微信文章因为环境异常被屏蔽了,正文内容没拿到,所以具体的产品方向、团队背景和这笔钱怎么花,暂时都...
#Inference-opt#Fine-tuning#Reasoning#RadixArk
精选理由
这条消息的看点在于钱和团队背景。1 亿美元种子轮在 AI infra 领域不多见,而且 SGLang 本身有 2.7 万星和 40 万张 GPU 的部署量,不是凭空画饼。不过正文对 RadixArk 具体要做什么产品、跟现有 SGLang 项目怎么分工,讲得比较模糊,更像融资公告加路线图预告。我会先打个折,把它放在 featured 里但不到更高档,因为目前还缺产品细节和客户验证。
一句话点评
SGLang 团队拿了 1 亿美元种子轮,但正文被微信验证页挡了,具体产品、团队背景和钱怎么花都没看到。
锐评
这条消息本身挺炸的——1 亿美元种子轮在开源推理框架圈子里很少见,而且投资方名单里同时出现了英伟达、AMD、英特尔三家芯片巨头,说明硬件厂商在押注一个能跨芯片跑的高性能推理引擎。SGLang 本身是这两年社区里口碑很好的推理框架,主打用结构化生成和调度优化把大模型跑得更快更省。新公司叫 RadixArk,名字里带“开放 AI 基础设施”,大概率是想把 SGLang 从开源项目做成商业化的推理平台或服务。 但问题在于,目前能看到的公开信息只有标题和融资额,机器之心的原文被微信环境验证拦住了,另一篇新智元的报道也没提供正文。所以团队具体要做什么产品、钱主要投向研发还是市场、商业化路径是什么,这些关键信息都还缺。1 亿种子轮这个数字本身也要打个折——种子轮通常不会这么大,可能是包含了后续承诺或者算上了资源型投资(比如芯片、算力额度),实际现金部分未必有标题那么夸张。等看到完整披露再判断更靠谱。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
09:06
37d ago
● P1机器之心 · 公众号· rssZH09:06 · 05·08
OpenAI 发布官方命令行工具 openai-cli
OpenAI 开源了一个叫 openai-cli 的命令行工具,让开发者直接在终端里调用它的模型。你可以用一条命令完成对话、生成图片、编辑图片、语音转文字和文字转语音,不用再为复杂的 SDK 集成头疼。不过,这篇文章的正文因为微信环境验证被挡住了,具体支持哪些参数、怎么安装、有没有延迟数据,这些细节都没看到。
#Tools#Code#Audio#OpenAI
精选理由
OpenAI 终于出了个官方命令行工具,开源,一行命令就能在终端里调模型、生图、转语音,不用再折腾各种 SDK 版本。对天天跟 API 打交道的开发者来说,这能省不少集成和维护的力气。不过这只是个工作流层面的更新,不是模型能力升级,所以重要性我给打个折,放在低 featured 档。正文没提性能对比或实际延迟数据,这点先别太激动。
一句话点评
OpenAI 出了个官方命令行工具,终端里直接调 API,不用再装 SDK 了。但机器之心的原文被微信验证墙挡住,具体功能、安装方式和限制都没看到。
锐评
这条消息本身挺实用:OpenAI 终于给了一个官方 CLI,意味着开发者可以在终端里直接用命令调模型,省去装 Python 或 Node SDK 的步骤,对快速测试、写脚本、搭管线的工程师友好。标题里“跟复杂的 SDK 说拜拜”有点夸张——CLI 更适合轻量交互和自动化,复杂业务逻辑还是得靠 SDK。 可惜机器之心的原文被微信环境验证拦住了,正文完全没读到。目前只能从标题推断工具已上线,但不知道它支持哪些模型、有没有流式输出、能不能管 API key、是否开源。这些信息缺口让判断只能打折扣。如果是真的,对经常在终端干活的开发者是个小确幸;但别指望它替代现有开发流程。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
08:56
37d ago
r/LocalLLaMA· rssEN08:56 · 05·08
Chrome 在后台偷偷下了个 4GB 的 Gemini Nano 模型?
Reddit 用户发现 Chrome 可能静默下载了一个约 4GB 的 Gemini Nano 模型,用于本地摘要功能。帖子没给出具体模型名称、版本或 GGUF 来源,正文也因 403 无法访问。4GB 对端侧模型来说体积偏大,但如果是本地运行,意味着推理不依赖云端,隐私和延迟有优势。不过 Chrome 是否默认开启下载、用户能否控制,这些细节都没披露。
#Inference-opt#Google#Gemini Nano#Chrome
精选理由
HKR-H 和 HKR-R 过关,但这只是个 Reddit 线索:只有 4GB Chrome/Gemini Nano 的传闻,没有版本、来源或复现路径。
一句话点评
Chrome 可能静默下载了 4GB 的 Gemini Nano 模型,用于本地摘要。
锐评
Reddit 用户发现 Chrome 可能静默下载了一个约 4GB 的 Gemini Nano 模型,用于本地摘要功能。4GB 对端侧模型来说体积偏大,但本地运行意味着推理不依赖云端,隐私和延迟有优势。不过帖子正文因 403 无法访问,没给出具体模型名称、版本或 GGUF 来源。Chrome 是否默认开启下载、用户能否控制,这些细节都没披露。如果真能本地跑,对隐私敏感场景是好事,但 4GB 对手机或低配电脑可能是个负担。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
07:54
37d ago
AI HOT 精选· aihot-apiZH07:54 · 05·08
在AMD显卡上微调医疗问答模型,不用CUDA也能跑
这篇博客来自Lablab.ai和AMD的黑客松,作者在AMD Instinct MI300X显卡上(192GB显存)用LoRA微调了Qwen3-1.7B模型,让它回答医学选择题并给出解释。训练只用了2000条样本,跑了大约5分钟,全程没碰CUDA。正文没披露微调后的准确率或评测结果,所以效果好不好还不清楚。亮点是证明了HuggingFace的Trans...
#Fine-tuning#Hugging Face#AMD#Lablab.ai
精选理由
这篇是Hugging Face博客,讲在AMD ROCm上微调MedQA,核心卖点是“不用CUDA”。第一句直接给判断:标题有钩子,但正文信息量薄。没写GPU型号、数据规模和评测结果,只说来自黑客松案例。对从业者来说,非CUDA训练栈的可复现细节才是真价值,但正文没展开。我会先打个折:可复现步骤有用,但缺关键参数,验证成本高。
一句话点评
有人在AMD MI300X上(192GB显存)用LoRA微调了Qwen3-1.7B,让它做医学选择题并给解释。只用了2000条样本,跑了5分钟,全程没碰CUDA。但正文没披露微调后的准确率,效果好不好还不清楚。亮点是证明了HuggingFace的Transformers、PEFT、TRL在ROCm上能跑通,对没有NVIDIA卡的人是个好消息。如果是真的,挺省钱。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
07:44
37d ago
Product Hunt · AI· rssEN07:44 · 05·08
Jotform 在 Claude 里直接建表单
Jotform 出了个 Claude App,用户用自然语言就能在 Claude 里创建、编辑和分析表单,不用手动拖拽或切换工具。支持加字段、设逻辑、查提交记录和出统计。正文没披露定价、权限控制、上线时间或能处理多大规模的表单,所以实际可用性和成本还不清楚。
#Tools#Jotform#Claude#Product update
精选理由
一个小集成发布:HKR-K 靠 Claude 内可用的表单工作流通过,HKR-H 和 HKR-R 不满足。价格、权限机制、支持的表单规模正文都没提,所以只给到低分的小产品更新档位。
一句话点评
Jotform 把表单生成塞进 Claude 里,说句话就能建表、加逻辑、查提交记录,省了拖拽和切工具。但正文没披露定价、权限控制、上线时间,也没说能处理多大规模的表单,实际可用性和成本还不清楚。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0

更多

频道

后台