ax@ax-radar:~/curated $ grep -l 'curated=true' sources/
41 srcsignal 72%cycle 04:32

AX 严选 · 2026-05-22

36 · updated 3m ago
按日期浏览清除筛选
2026年6月
138235332422532610788299441029112912151371415161718192021222324252627282930
2026-05-22 · 星期五2026年5月22日
23:59
21d ago
● P1AI HOT 精选· aihot-apiZH23:59 · 05·22
Gemini 月活破 9 亿,新增两个能替你干活的代理功能
Google 说 Gemini 应用月活用户超过 9 亿了。这次更新把 Gemini 从问答工具往主动干活的个人代理方向推了一步。新模型叫 Gemini 3.5 Flash,还换了套叫“Neural Expressive”的设计语言,另外 Gemini Omni 模型能把提示词直接生成视频。重点在两项代理功能:Daily Brief 会给你出个性化每日...
#Agent#Multimodal#Google#Gemini
精选理由
Google 这次更新核心就两件事:一是 Gemini 应用月活冲到 9 亿,盘子确实大;二是推出了 Daily Brief 和 Gemini Spark 两个代理功能,后者可以在用户授权下 24 小时跑任务。我会先打个折,正文没披露代理功能的具体完成率和延迟数据,实际干活靠不靠谱还不知道。但 9 亿这个量级加上“常驻后台的个人代理”定位,对做 agent 产品的团队来说是个明确的信号——大厂开始用自家分发渠道推代理了,竞争门槛在抬高。
一句话点评
Gemini 月活破 9 亿,但 Google 没说是怎么算的。新推的 Daily Brief 和 Spark 代理功能听起来像能替你干活,实际能接管多少任务、会不会翻车,正文没给细节,先别太激动。
锐评
Google 这次把 Gemini 从问答工具往主动干活的个人代理方向推了一步。月活 9 亿这个数字挺大,但正文没披露统计口径,是打开过就算,还是真在用的,不知道。新模型叫 Gemini 3.5 Flash,还换了套设计语言,另外 Omni 模型能把提示词直接生成视频,这点如果效果稳定,对内容创作挺省事。 重点在两项代理功能:Daily Brief 给你出个性化每日简报,Gemini Spark 号称能 7x24 小时替你管理任务。听着像能帮你订票、回消息、整理日程,但授权范围、出错率、隐私怎么处理,正文全没提。这种主动代理一旦翻车,代价比问答答错大得多。 还缺的是实际体验数据和限制条件。比如 Spark 能接管哪些 App,跨平台支持怎么样,延迟高不高。这些不说清楚,9 亿用户更像是个宣传数字,产品到底能不能用,还得等上手。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
22:10
21d ago
AI HOT 精选· aihot-apiZH22:10 · 05·22
ViggleAI 说动捕和角色动画变简单了,但没给细节
ViggleAI 发帖称动作捕捉和角色动画制作变得更容易,但正文只说了“持续构建,更多功能即将推出”。没有披露具体能力、技术参数、定价或发布日期,信息量很少,无法判断实际效果。
#Vision#Multimodal#ViggleAI#Product update
精选理由
硬排除规则5适用:这是一条产品预告,没有具体功能、规格、发布日期或可验证的机制。HKR-H、HKR-K、HKR-R均不满足。
一句话点评
ViggleAI 发了条帖子,说动捕和角色动画变简单了,但正文就一句“持续构建,更多功能即将推出”。没提具体能力、技术参数、定价或发布日期,信息量约等于零。短评:画饼帖,等真东西出来再说。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
20:16
21d ago
AI HOT 精选· aihot-apiZH20:16 · 05·22
Codex 差异视图新增经典 +/- 标记选项
OpenAI 给 Codex 功能加了个外观设置:差异视图现在可以切换成传统的 +/- 标记,而不是只有彩色条。默认还是彩色条,需要你手动去开。就是个界面小调整,不影响功能。
#Code#Tools#OpenAI#Product update
精选理由
这是 OpenAI 开发者工具里一个很小的 UI 设置更新:HKR-K 靠具体机制(新增标记选项)通过,HKR-H 和 HKR-R 都很弱。属于小产品更新的低端,不值得推荐。
一句话点评
OpenAI 给 Codex 的差异视图加了个外观选项,可以切回传统的 +/- 标记,默认还是彩色条。就是个界面小调整,不影响功能,别激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
19:57
21d ago
● P1AI HOT 精选· aihot-apiZH19:57 · 05·22
Anthropic 的 Project Glasswing 一个月内发现超万个高危软件漏洞
Anthropic 说,他们和大约 50 家合作伙伴用 Claude Mythos Preview 模型,在全球最关键的基础软件里找到了超过一万个高危或严重级别的漏洞。现在瓶颈已经不是找漏洞的速度,而是验证、通报和打补丁的速度。在开源软件扫描这块,模型自己估算发现了 6,202 个高危或严重漏洞,其中 1,752 个已经过独立安全公司或 Anthrop...
#Code#Agent#Benchmarking#Anthropic
精选理由
Anthropic 这次放出的不是模型跑分,而是 Claude 在真实关键系统里挖漏洞的战报。约 50 家合作伙伴用 Claude Mythos Preview 扫出超过一万个高危或严重漏洞,独立验证准确率 90.6%,说明模型在安全自动化这条线上已经从“能看”走到“能干活”了。我会先打个折:正文没披露漏洞类型分布、误报率和修复成本,也没说这 90.6% 是在什么条件下测的,所以准确率数字先别太激动。但不管怎么说,一万多个高危漏洞这个量级,加上 Mozilla、Cloudflare 这类合作方背书,对做安全自动化和关键基础设施防护的团队来说,是一个...
一句话点评
Anthropic 用新模型一个月扫出上万个高危漏洞,但具体细节要等补丁铺开才能说,现在看到的数字先打个折。
锐评
Anthropic 公布了 Project Glasswing 的首月数据:约 50 家合作方用 Claude Mythos Preview 模型,在各自的核心软件里总共发现了超过一万个高危或严重漏洞。Cloudflare 一家就找到 2000 个 bug,其中 400 个是高危或严重级别,而且误报率比人类测试员还低。Mozilla 测 Firefox 150 时挖出 271 个漏洞,是上一版用 Claude Opus 4.6 时的十倍多。这些数字说明 AI 找漏洞的速度已经远超人类,现在瓶颈变成了怎么快速验证、通报和打补丁。 在开源软件扫描上,Anthropic 自己用 Mythos Preview 扫了 1000 多个项目,模型自己估计有 6202 个高危或严重漏洞。其中 1752 个已经过外部安全公司复核,90.6% 是真漏洞,62.4% 确认是高危或严重级别。按这个比例推算,光开源项目就能筛出近 3900 个高危漏洞。wolfSSL 那个例子挺直观——模型直接构造了一个能伪造证书的攻击,影响数十亿设备。 不过要冷静看。Anthropic 自己说了,因为行业惯例是漏洞发现后 90 天才公开细节,现在披露的都是滞后指标。正文没给出漏洞的具体类型分布,也没说这些漏洞里有多少是模型独立发现、多少需要人工引导。英国 AISI 和 XBOW 的外部评测都夸模型能力强,但评测基准的覆盖面和真实攻防场景的差距有多大,文章没展开。另外,微软和甲骨文都说补丁量在猛增,但没提这些补丁对应的漏洞修复成本有多高。等补丁大规模部署后 Anthropic 承诺会放出更多细节,那时候才能判断这波 AI 挖漏洞到底改变了什么。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
19:34
21d ago
AI HOT 精选· aihot-apiZH19:34 · 05·22
ChatGPT语音模式现在能帮你填表了
拍一张表单照片,用嘴说你要填什么,ChatGPT就能把填好的版本吐出来。正文没提支持哪些格式、哪些语言、要不要额外付费、以及什么时候上线。
#Multimodal#Vision#Audio#ChatGPT
精选理由
HKR中H和K通过,因为语音+图像的表单填写是一个具体可用的新交互流程,用户能直观理解价值。R偏弱,这只是OpenAI的一个小产品更新,没有披露支持的文件格式、语言范围、定价或上线时间,信息缺口明显,所以分数落在60-71区间。
一句话点评
拍张表单照片,用嘴说填什么,ChatGPT 就能吐出填好的版本。这功能把语音和视觉串起来了,省了打字和手写。但正文没提支持哪些格式、哪些语言、要不要额外付费、以及什么时候上线。如果是免费且支持中文,日常填表确实方便;要是只限英文 PDF 或 Plus 用户独享,那实用性就大打折扣。等具体上线范围和定价出来再判断值不值得激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
18:00
21d ago
AI HOT 精选· aihot-apiZH18:00 · 05·22
Google I/O 2026对话环节回顾
这篇博客回顾了Google I/O 2026的对话环节,主题涵盖AI、量子计算、机器人和创造力。但正文没有披露具体演讲者、产品发布或技术细节,信息量有限。
#Robotics#Google#Commentary
精选理由
这是一篇Google I/O 2026对话环节的回顾,正文只提到讨论了AI、量子计算、机器人和创造力,没有披露嘉宾名单、产品发布或任何技术参数。HKR三项全挂:没有悬念或发布钩子(h),信息量太少连关键事实都不够(k),对从业者来说没有可用的产品、成本或竞争信息(r)。按0/3规则直接排除。
一句话点评
Google I/O 2026 对话环节回顾,但正文没提任何具体演讲者、产品发布或技术细节,信息量约等于零。标题看着大,实际是篇活动总结,对从业者没参考价值。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
17:25
21d ago
AI HOT 精选· aihot-apiZH17:25 · 05·22
Warp 终端现在能直接调 OpenRouter 的模型了
Warp 这个终端工具接入了 OpenRouter,工程师演示了怎么连 DeepSeek。正文只给了文档链接,没提价格和具体上线时间。
#Agent#Tools#OpenRouter#Warp
精选理由
这是一个小型的开发者工具集成。正文只给了文档链接,没有披露定价、模型覆盖范围或 Warp 具体能力变化,所以分数维持在 60–71 区间。
一句话点评
Warp终端现在能直接调OpenRouter的模型了,包括DeepSeek。对开发者来说,等于少装一个插件,在命令行里就能切换模型。但正文只给了文档链接,没提价格、延迟和具体上线时间,实际体验和成本未知。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
17:03
21d ago
AI HOT 精选· aihot-apiZH17:03 · 05·22
Perplexity 开源了供应链安全扫描器 Bumblebee
Perplexity 今天开源了一个叫 Bumblebee 的工具,专门扫描 macOS 和 Linux 开发者机器上的高风险软件包、扩展和 AI 工具配置。它是只读的,不会改你系统。亮点是连上他们的 Computer 平台后,一旦有新的供应链风险出现,可以自动触发更深的扫描。目前只支持 macOS 和 Linux,Windows 用户暂时用不了。代码...
#Tools#Perplexity#Open source#Product update
精选理由
HKR 三项都过:Perplexity 出安全工具出乎意料,扫描范围具体(包、扩展、AI 配置),供应链安全焦虑真实。但原文只是一条简短社交更新,没披露规则集、误报率、集成方式或采用数据,所以分数压在 60–71 区间。
一句话点评
Perplexity 开源了 Bumblebee,一个只读扫描器,专查 macOS/Linux 开发者机器上的高危包、扩展和 AI 工具配置。亮点是连上他们的 Computer 平台后,新风险出现能自动触发深度扫描。目前只支持 macOS 和 Linux,Windows 用户暂时用不了。 短评:开源供应链扫描工具,只读不写系统,连平台能自动触发深度扫描。但只支持 macOS/Linux,W...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:41
21d ago
AI HOT 精选· aihot-apiZH16:41 · 05·22
Luma Agents 上线 Seedance 2.0,一键生成电影级画面
Luma Agents 推出了 Seedance 2.0,主打人像、风景、科幻、奇幻四种风格,声称能一键生成电影级画面。正文没披露模型参数、分辨率、生成速度或价格,所以实际效果和可用性还不清楚。如果你对 AI 视频生成感兴趣,可以点链接试试,但先别太激动。
#Agent#Multimodal#Vision#Luma Labs
精选理由
H/K 通过,因为 Seedance 2.0 集成和场景覆盖算新事实;但正文没提价格、分辨率、生成时长和基准对比,属于常规小版本更新,从业者参考价值有限。
一句话点评
Luma Agents 上线了 Seedance 2.0,主打四种风格一键生成电影级画面。但正文没披露分辨率、生成速度或价格,实际效果和可用性未知。如果你对 AI 视频生成感兴趣可以试试,但先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
16:17
21d ago
AI HOT 精选· aihot-apiZH16:17 · 05·22
Suno AI 做的《波多黎各》成夏日神曲,被美国早间节目 GMA 推荐
Suno 官方发帖说,今年夏天一首叫《波多黎各》的歌是用他们的 AI 工具做的,还上了美国早间节目 GMA 的推荐。帖子没透露播放量、创作者是谁、以及具体怎么生成的。
#Audio#Suno#GMA#Product update
精选理由
硬排除——纯营销:Suno 自己发帖说《Puerto Rico》用了它的工具、上了 GMA,但播放量、创作者、制作流程一概没披露,也没有第三方验证。
一句话点评
Suno 官方说《波多黎各》是AI做的,还上了GMA早间节目。但没提播放量、创作者和生成细节,更像品牌宣传。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H1·K0·R0
16:10
21d ago
AI HOT 精选· aihot-apiZH16:10 · 05·22
GitHub 连续第三年拿下 Gartner 企业级 AI 编程代理领导者象限
Gartner 把 GitHub 放在企业级 AI 编程代理的领导者象限,这是第三年。正文没披露具体的评估标准、竞争对手位置,也没说 Copilot 的企业采用数据。所以这个排名更多是品牌背书,不能直接当采购决策依据。
#Agent#Code#GitHub#Gartner
精选理由
触发硬排除规则5:这是一篇厂商获奖公告,核心事实是 GitHub 被 Gartner 认可,但正文没披露评估方法、竞品排名或 Copilot 采用数据。HKR 三项均不满足,因此排除。
一句话点评
GitHub Copilot 连续第三年被 Gartner 评为企业级 AI 编程代理领导者。但正文没披露评估标准、竞品位置和企业采用数据,这个排名更像品牌背书,不能直接当采购依据。短评:Gartner 连续三年把 GitHub 放领导者象限,但没给评分细节,当品牌新闻看就好。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K0·R0
14:36
21d ago
● P1AI HOT 精选· aihot-apiZH14:36 · 05·22
BitCPM-CANN开源发布,华为昇腾NPU原生训练1.58比特大模型
ModelBest、清华和OpenBMB搞了个BitCPM-CANN,从0.5B到8B都有,全程用华为昇腾910B NPU训练,没走英伟达路线。1.58比特三元量化意味着每个权重只取三种值,内存比BF16省了约6倍,能塞进手机、电脑和车载设备里跑。基准测试成绩保住了全精度模型的95-97%,这点挺实在。我会先打个折:正文没披露具体推理延迟和功耗数据,也...
#Inference-opt#Benchmarking#ModelBest#Tsinghua University
精选理由
HKR三项都站得住:昇腾910B全栈训练1.58比特开源模型这个角度够新,数据也扎实。没给P1是因为目前只有发布事实,缺少独立复现或实际落地效果的佐证,所以先放在featured。
一句话点评
面壁智能在华为昇腾 NPU 上原生训练并开源了 1.58-bit 大模型,显存省了约 6 倍,能力保留率 90% 以上,但正文没给具体评测基准和延迟数据。
锐评
这条消息最值得看的是“全栈国产算力跑通了极低比特训练”。BitCPM-CANN 从量化算子到训练框架全在昇腾 910B 上完成,意味着以后在华为卡上做 1.58-bit 模型有了公共基础设施,不用每家从头搭一遍。四个尺寸(0.5B 到 8B)都开源了,官方说推理显存比 BF16 省约 6 倍,能力保留率在 90% 到 97.2% 之间,8B 模型能塞进旗舰手机跑。 但先别太激动。文章没交代这个“能力保留率”是在哪些基准上测的,也没提推理延迟和吞吐。极低比特模型最怕的是生成质量在长文本或复杂任务上掉得厉害,光看一个百分比不够。另外,训练成本、与同尺寸全精度模型在真实业务场景下的对比也都没给。如果后续能补上这些,才能判断它是不是真能当端侧主力模型用。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
12:00
22d ago
AI HOT 精选· aihot-apiZH12:00 · 05·22
Cursor 被 Gartner 评为 2026 年企业级 AI 编码代理魔力象限领导者
Gartner 把 Cursor 放到了 2026 年企业级 AI 编码代理魔力象限的领导者象限,而且它在“愿景完整性”这个维度上得分最高。超过 70% 的财富 500 强公司已经在用 Cursor 来部署和管理编码代理(就是让 AI 帮忙写代码、修 Bug 的自动化工具)。Cursor 接下来打算自己训练更强的模型(已经和 SpaceXAI 合作了)...
#Agent#Code#Tools#Cursor
精选理由
Cursor 自己发稿说被 Gartner 评为 2026 年企业级 AI 编码代理领导者,还提到超过 70% 的财富 500 强在用。这个渗透率数字挺实在,说明企业市场确实在批量上编码代理。但来源是 Cursor 自家的分析师奖项通稿,权威性打点折扣,而且领导者标签本身不意外——更像市场验证而非技术突破。对关注企业级开发工具采购和编码代理竞争格局的从业者来说,这条值得扫一眼,但不用太激动。
一句话点评
Gartner 把 Cursor 评为企业级 AI 编码代理的领导者,愿景完整性得分最高。超过 70% 的财富 500 强在用,这个渗透率挺高。但 Gartner 报告本身是付费内容,正文没披露具体评估细节,比如对比了哪些竞品、评分标准是什么。Cursor 说自己要自研模型,还找了 SpaceXAI 合作,这点先别太激动——合作细节和模型进展都没说。短评:Gartner 背书+大客户覆盖率是...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
11:17
22d ago
● P1AI HOT 精选· aihot-apiZH11:17 · 05·22
阿里千问 App、PC 及网页端上线 Qwen3.7-Max,免费可用
千问 App 更新到 6.9.7 版就能在对话框里切到 Qwen3.7-Max,PC 和网页端也一样,目前免费。官方说这个模型主打“让模型进业务流程干活”,能写代码、自动跑办公流程,还能扛住长任务——他们自己测了一次 35 小时、调用工具超过 1000 次的内核优化实验,全程没断思路。不过这些数据来自官方测试,实际体验会不会打折还得自己试。另外,API...
#Agent#Code#Tools#Alibaba
精选理由
阿里把 Qwen3.7-Max 铺到千问全线产品,门槛降到免费,还特意强调 35 小时连续工具调用没崩,摆明了在打 agent 可靠性和零成本体验这两张牌。我会先打个折:正文没给基准测试、上下文窗口和 API 定价,所以实际能力上限和商用成本还看不清。但就凭多端同步上线和这个压测结果,对正在选模型做工具链集成的人来说,是个值得立刻上手试的信号。
一句话点评
千问 App 更新后能免费用 Qwen3.7-Max,官方说它能跑 35 小时不断思路,但这是自家测试,实际稳不稳还得自己上手试。
锐评
阿里把最新的 Qwen3.7-Max 直接塞进了千问 App、PC 和网页端,更新到 6.9.7 版就能免费用。这个模型的核心卖点是“让模型进业务流程干活”,也就是所谓的智能体能力。官方给了一个很具体的数字:在一次内核优化实验里,它自主跑了 35 个小时,调用了超过 1000 次工具,全程没断思路。这个数字如果真实,说明它在处理长链条、多步骤任务时的稳定性确实不错,至少比动不动就忘掉上下文的模型强。 但这里有个关键信息缺口:这个 35 小时的测试是官方自己跑的,任务场景、失败重试次数、人工干预比例都没披露。所以这个数字更像一个上限参考,实际用起来,比如让它自动处理几十封邮件或写一个复杂项目,效果可能会打折。另外,文章提到它能跨框架部署,在 Claude Code 等工具里也能用,这对开发者是个好消息,不用被绑在单一工具上。 目前 API 还没上线,只能通过官方客户端体验。想评估它到底能不能扛住真实业务,最好等 API 开放后,用自己的任务跑一遍,重点关注它在第 20 步、第 50 步时的逻辑连贯性和错误恢复能力。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
10:57
22d ago
AI HOT 精选· aihot-apiZH10:57 · 05·22
PixVerse App 上线图像生成,手机端也能文生图
PixVerse 在自家 App 里加了图像生成功能,输入提示词或传参考图就能在手机上出图。5月24日到31日每人免费3次,之后要花钱。转发关注还能抽300积分,限72小时。功能本身不新鲜,但说明视频生成工具开始往多模态走。
#Multimodal#Vision#PixVerse#Product update
精选理由
PixVerse App 新增图像生成功能,支持文生图和参考图生图,5月24-31日每人免费3次。属于小版本更新,有具体使用细节,所以 K 通过、归入 all。H 和 R 不通过,因为没提生成质量、定价、分发规模或竞争对比。
一句话点评
PixVerse 在自家 App 里塞了个文生图/图生图功能,手机端直接出图。5月24-31日每人免费3次,之后收费。功能本身不新鲜,但说明视频生成工具开始往多模态走,先抢个入口。短评:视频工具加个图生图,功能不新但补模态,免费3次算尝鲜,后续收费看留存。
HKR 分解
hook knowledge resonance
打开信源
60
SCORE
H0·K1·R0
08:10
22d ago
AI HOT 精选· aihot-apiZH08:10 · 05·22
18年老粉与微软GitHub决裂:平台天天崩,代码还被偷,我走了
GitHub 18年老用户、Ghostty终端作者Mitchell Hashimoto公开宣布弃用GitHub,原因是平台频繁宕机,每天把他锁在外面好几个小时,没法正经写代码。他打包所有项目资产走人。这只是一个缩影:GitHub最近被黑客攻破3800多个内部仓库,源代码被挂网叫卖5万美元,起因是一名工程师装了带毒的VS Code插件,凭证被偷。更早前还...
#Code#GitHub#Microsoft#Mitchell Hashimoto
精选理由
H/K/R三项都成立,但这是开发者平台可靠性和安全事件,不是AI模型、智能体、Copilot或AI产品更新。AI RADAR匹配度弱,所以分数压在40以下。
一句话点评
GitHub 18年老用户、Ghostty作者Mitchell Hashimoto因平台频繁宕机(每天被锁几小时)公开弃用,并打包项目走人。更严重的是,黑客攻破3800+内部仓库,源代码被挂网叫卖5万美元,起因是一名工程师装了带毒VS Code插件。微软收购后GitHub并入CoreAI团队、取消CEO职位,管理层动荡。正文未披露GitHub后续修复计划及用户迁移数据。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H1·K1·R1
07:34
22d ago
AI HOT 精选· aihot-apiZH07:34 · 05·22
X平台发帖体验太差,开发者用ChatGPT做了个插件救场
一条推文吐槽X平台的产品经理不行,发文章体验很烂。有开发者直接用ChatGPT(通过codex/goal)写了个Markdown转换插件,拖拽文件就能生成X文章格式,开源且提供了谷歌插件版本。正文没披露插件具体安装量或用户反馈,但至少说明原生体验确实有痛点,逼得用户自己动手。
#Code#Tools#X#ChatGPT
精选理由
痛点具体、产物明确、能引起同类开发者共鸣,HKR三项都过。但这是个轻量工具,正文没披露下载量、GitHub星数或实际使用反馈,信息缺口明显,所以分数压在60–71区间。
一句话点评
短评:X发文章体验差到逼用户自己写插件,ChatGPT顺手就搓了一个。 点评:X平台发文章体验烂到用户自己动手写插件,这本身就是个产品事故。开发者用ChatGPT(通过codex/goal)搞了个Markdown转X文章格式的插件,拖拽文件就能用,开源还上了谷歌插件商店。这事说明两点:一是原生编辑器确实拉胯,二是现在用AI搓工具的门槛低到离谱,一个人半天就能补上大厂产品缺口。不过正文没披露...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
06:00
22d ago
AI HOT 精选· aihot-apiZH06:00 · 05·22
DeepSeek V4 Flash 冲上周榜第一
OpenRouter 发帖说 DeepSeek V4 Flash 登顶周排行榜,但没说是哪个榜、评测指标是什么、对比了哪些模型、样本量多大。目前只能确认排名结果,其他细节一概缺失,建议等官方或第三方详细报告再下结论。
#Benchmarking#DeepSeek#OpenRouter#Benchmark
精选理由
HKR-H 和 HKR-R 通过,但 HKR-K 不通过:正文只说了登顶周榜,没有方法论、指标或可复现的对比,信息不足以支撑判断。
一句话点评
OpenRouter 发帖说 DeepSeek V4 Flash 登顶周榜,但没说是哪个榜、评测指标、样本量、对比了哪些模型。目前只能确认排名结果,其他细节一概缺失,建议等官方或第三方详细报告再下结论。短评:榜名、指标、样本量全没提,先别急着信。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
04:30
22d ago
● P1AI HOT 精选· aihot-apiZH04:30 · 05·22
DeepSeek推进七百亿元融资,承诺坚持开源而非商业化
DeepSeek 正在敲定一笔约 700 亿元人民币的首轮外部融资,投前估值约 450 亿美元。腾讯、IDG 资本和砺思资本接近参投,梁文锋个人也可能注资约 200 亿元。他在投资者会议上明确表示,公司会继续做开源模型,目标是通用人工智能,而不是急着商业化。如果这笔钱到位,将创下中国科技初创公司首轮融资的最高纪录。不过文章也提到,具体金额和最终参投方仍...
#DeepSeek#Liang Wenfeng#Tencent#Funding
精选理由
HKR 三项都踩中了。700 亿融资规模本身就够炸,加上梁文锋个人可能跟投 200 亿,这种资金体量在开源模型公司里不常见,所以 H 给了。K 这边,450 亿美元估值、腾讯和 IDG 接近入局,以及梁文锋明确说坚持开源不急着商业化,都是能帮人判断行业水温的关键事实。R 更直接,这笔钱怎么花、开源路线能不能扛住商业化压力,会直接影响国内 AI 创业的资本逻辑和开源生态。分数没给到 95 以上,是因为交易还在推进,最终条款和交割都没披露,先打个折。
一句话点评
700亿融资、450亿美元估值,梁文锋自己还要再掏200亿,但承诺继续开源不急着变现——这个组合挺少见,先别太激动,钱到账再说。
锐评
DeepSeek这轮融资如果落地,700亿元人民币的规模会是中国科技初创公司首轮融资的最高纪录。投资前估值约450亿美元,腾讯、IDG和砺思资本接近确定参投,国家队也在里面。梁文锋个人可能注资约200亿,同时明确表示继续开发开源模型,目标是通用人工智能而不是短期变现。 这些数字很大,但正文没披露资金的具体用途——是买算力、养团队还是做生态?也没说开源会开到什么程度,是只放权重还是连训练方法、数据配比都公开。另外,报道来源是彭博社援引知情人士,最终参与者和金额都可能变,现在下结论还早。 如果梁文锋真的用个人资金跟投200亿,那他对控制权和长期路线的坚持会比口头承诺更有说服力。但反过来,这么大一笔钱进来,投资方对回报的耐心能有多久,正文完全没提。
HKR 分解
hook knowledge resonance
打开信源
99
SCORE
H1·K1·R1
04:25
22d ago
AI HOT 精选· aihot-apiZH04:25 · 05·22
Antigravity付费版Gemini周配额再翻三倍
Antigravity把付费用户的Gemini每周调用额度又提了三倍,而且已经重置了。之前翻倍过,这次再翻,对高频用户来说能省不少钱,不用频繁买包了。正文没披露具体数字,但连续翻倍说明用量增长快,或者他们在压成本。
#Google#Antigravity#Gemini#Product update
精选理由
HKR三项都过,但事实只是Antigravity付费用户的Gemini配额增加。没有新模型、新能力或定价细节,属于小产品更新,分数卡在66。
一句话点评
Antigravity 把付费用户的 Gemini 每周调用额度又提了三倍,而且已经重置了。之前翻倍过,这次再翻,对高频用户来说能省不少钱,不用频繁买包了。正文没披露具体数字,但连续翻倍说明用量增长快,或者他们在压成本。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1

更多

频道

后台