ax@ax-radar:~/all $ grep -v 'tier=excluded' stream.log
41 srcsignal 72%cycle 04:32

全部 · 2026-04-02

15 items · updated 3m ago
RSS live
2026-04-02 · 星期四2026年4月2日
18:22
71d ago
● P1X · @dotey(宝玉)· x-apiZH18:22 · 04·02
晚点发了一篇 DeepSeek 深度报道,讲 V4 发布前的人员变动、路线选择和梁文锋的管理逻辑
晚点 LatePost 这篇报道卡在 V4 发布前夕,信息量不小。先说人员:DeepSeek 确认走了四位核心成员,包括 R1 核心作者郭达雅(近期离职,可能去大厂)、第一代 LLM 作者王炳宣(去年底被腾讯挖走),以及 OCR 和多模态方向的两位。猎头开价翻 2 到 3 倍,有的公司直接给 8 位数总包,而 DeepSeek 的期权没标价,让一些人心...
#Agent#Multimodal#Code#DeepSeek
精选理由
这不是 V4 发布,但信息量够硬:4 人离职确认、发布推迟到 4 月、100 多人的研究团队规模、猎头报价翻倍,还有算子库迁移到 TileLang 的路线变化。HKR 三项都站得住。正文没给 V4 的参数、价格和基准成绩,所以到不了发布级或 p1,但作为 V4 前的信号已经够看了。
一句话点评
晚点这篇 V4 发布前的深度报道,重点不在技术参数,而在组织逻辑和梁文锋的独特目标,正文没提供细节,只能看标题判断方向。
锐评
晚点这篇报道选在 V4 发布前放出,时机本身就值得留意。标题点出三个关键词:特质、组织、梁文锋的独特目标,说明文章重心不是模型跑分,而是 DeepSeek 这家公司怎么运转、为什么总走和别家不一样的路。从过往公开信息看,DeepSeek 一直强调小团队、高密度人才、不追热点,梁文锋本人也极少露面,这次报道如果能挖出内部决策逻辑和资源分配方式,对理解国产大模型另一条路径会有帮助。 但 RSS 源只给了标题,正文内容完全缺失。我不知道文章具体披露了哪些新信息,比如 V4 的研发进度、团队规模变化、资金状况,或者梁文锋对 AGI 路线图的判断有没有更新。这些关键事实都只能等看到全文再补。 另外,晚点作为商业媒体,报道角度通常偏向组织叙事和人物故事,技术细节可能不会太深。读者如果想了解 V4 的架构创新或 benchmark 表现,这篇大概率不是首选。我会先打个折,等正文出来再判断信息增量到底有多大。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
17:06
71d ago
● P1X · @dotey(宝玉)· x-apiZH17:06 · 04·02
Google 发布 Gemma 4 开源模型系列,采用 Apache 2.0 许可证
Google 把 Gemma 4 全系列换成了 Apache 2.0 协议,商用、修改、分发不再受限,之前自家协议里的灰色地带这次清掉了。系列包含四个尺寸:31B Dense、26B MoE(混合专家架构)、E4B 和 E2B。31B 在 Arena AI 开源模型文本榜排第三,26B 排第六,Google 说它们表现超过体量大 20 倍的模型。大模型...
#Agent#Multimodal#Code#Google
精选理由
这次发布的分量,许可证变更和模型规格差不多重。Apache 2.0 意味着小公司和独立开发者可以放心拿来改、拿来商用,不用再为法律条款头疼。四个尺寸里,31B 能跑在单张 H100 上,26B 是 MoE 架构,推理成本会更低,这两点对实际部署的人比跑分更有吸引力。原生支持函数调用和 JSON 输出,摆明了是冲着让模型直接进业务流程干活去的。正文没给详细评测链接和横向对比数据,所以先别急着说它性能碾压谁,但就开放程度和工程友好度来说,这波更新挺实在。
一句话点评
Google 把 Gemini 3 的研究成果下放,推出了开源模型 Gemma 4,用 Apache 2.0 许可,商用友好。
锐评
Gemma 4 直接脱胎于 Gemini 3 的研究,这意味着它可能继承了旗舰模型的核心能力,但以更小的体积和开源许可放出来。Apache 2.0 许可证对开发者很友好,商用几乎没限制。目前正文没披露具体的参数规模、基准测试分数或推理成本,这些是判断它实际竞争力的关键。如果它能用远低于 Gemini 3 的运行成本,提供接近的性能,那对中小团队会很有吸引力。但没看到技术报告前,先别急着下结论,开源模型的真实水平得等社区跑完评测才知道。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
16:59
71d ago
● P1X · @AnthropicAI· x-apiEN16:59 · 04·02
Anthropic研究发现大语言模型内部存在情绪概念表征
Anthropic 发了一条推文说他们在 Claude 里找到了情绪概念的内部表征,这些表征能影响模型的行为,有时还会出现让人意外的效果。推文没展开讲具体是怎么找到的、在模型的哪一层、用了什么干预手段,也没给任何量化数据。我会先打个折——这更像是一个研究方向预告,而不是一份可复现的结论。对从业者来说,关键问题不是模型有没有情绪,而是这些表征能不能被稳定...
#Interpretability#Alignment#Anthropic#Claude
精选理由
我会先打个折:这篇不是论文,更像一条研究动态,实验方法和数字全都没给。但它的钩子确实抓人——Anthropic 声称在 Claude 内部找到了能驱动行为的“情绪概念”,等于说模型的行为有时是被内部类似情绪的表示推着走的。这点先别太激动,因为正文没披露这些表征在哪一层、怎么定位、干预后行为变化有多大,可复现性存疑。真正值得盯的是可操纵性:如果能稳定找到并拨动这些概念,对对齐和风控都有用;如果只是事后贴标签,那就还是老问题。标题里的“情绪”容易让人往拟人化方向想,从业者反而会更警惕这种叙事。综合看,钩子和风险感知都到位,但知识增量有限,所以放在 fe...
一句话点评
Anthropic 发现 Claude 内部有类似“情绪”的机制,会实际影响模型行为,有时还会带偏输出。
锐评
Anthropic 这篇研究直接说 Claude 内部存在情绪概念表征,不是比喻,是模型在处理文本时确实会激活类似“愤怒”“开心”这类情绪相关的内部状态,而且这些状态会改变后续回答的倾向。研究团队发现,当模型被诱导进入某种“情绪”状态后,它会更倾向于给出符合该情绪风格的回复,甚至在某些任务上表现变差——比如“愤怒”状态下更容易拒绝无害请求或给出攻击性回答。 目前公开的只有标题和简短摘要,正文没披露具体实验设计、样本量和量化指标。关键信息还缺:这些情绪状态是稳定可复现的,还是只在特定 prompt 下偶然触发?影响幅度有多大?能不能通过微调或系统提示消除?另外,研究用的是 Claude 自身,结论能不能泛化到其他模型也没说。 对从业者来说,这篇东西的价值在于提醒:模型行为不只是 prompt 和训练数据的产物,内部表征层面可能存在我们还没理解的动态机制。如果情绪状态确实稳定存在,那安全对齐就不能只盯着输入输出,还得考虑怎么监控和调节模型“内部状态”。但先别急着下结论,等完整论文出来再看实验细节和复现条件。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
15:42
71d ago
X · @dotey(宝玉)· x-apiZH15:42 · 04·02
一个 pretext 衍生项目:不用浏览器,直接把 Markdown 渲染成多页 PNG 和 SVG
这个项目是 pretext 的衍生版,能把 Markdown 文件直接转成多页 PNG 和 SVG 图片,不需要打开浏览器。作者自己测了,目前有四个硬伤:样式支持有限、不能内嵌图片、强制分页、表格排版会乱。正文没披露项目名、仓库地址和生产环境指标。复杂 Markdown 还远达不到生产可用,但拿来尝鲜学习可以。
#Tools#pretext#Open source#Commentary
精选理由
HKR-H 落在“不依赖浏览器渲染 Markdown 为分页 PNG/SVG”这个少见切入点上;HKR-K 落在实测列出的四个具体限制上;HKR-R 缺失是因为正文没披露项目名、基准测试或生产使用数据,影响面窄,tier 保持 all。
一句话点评
一个 pretext 衍生工具,能把 Markdown 直接转成多页 PNG/SVG,省掉开浏览器截图的麻烦。项目只有一个人维护,验证力度偏弱。正文没披露渲染速度、分页逻辑是否支持复杂表格或代码高亮,这些对实际可用性很关键。如果只是做简单文档截图,值得一试;生产环境用的话建议先测边界情况。
锐评
这个项目在 4 个明确限制下把 Markdown 直接渲染成分页 PNG 和 SVG;我看它更像排版实验,不像能替掉浏览器的生产方案。已披露的问题很具体:样式支持少、不支持内嵌图片、必须分页、表格会乱。光这 4 条,已经碰到大多数业务文档流的硬边界了。 我对“无需浏览器”这层叙事有点保留。很多团队现在用 Puppeteer 或 Playwright 渲染,不是因为浏览器优雅,而是因为 CSS、图片、字体、分页、表格这些坑,浏览器几十年里已经踩完一遍。你现在把浏览器拿掉,理论上少了启动成本和依赖体积,实际会把兼容性债务全接回来。文章正文没给项目名、仓库链接、吞吐、内存占用、字体处理方式,也没说 CommonMark、GFM 还是自定义方言支持到哪一层,所以“能渲染”这件事本身信息量不大。 回到工具位阶,这条更像 pretext 思路的一个分支,不像 Typst 那种从语言到排版模型一起重做。Markdown 转图片这条线,历史上最难的从来不是把纯文本画出来,而是把复杂块元素画对:表格跨页、代码块换行、数学公式、嵌套列表、脚注、引用块、远程图片、字体回退。作者自己已经点名表格和图片,这其实已经暴露核心短板了。表格一乱,报告、周报、数据卡片基本都没法进生产。 我还想追两个指标,但正文都没披露。第一是速度:比 headless Chrome 快多少,冷启动和批量渲染分别是多少。第二是一致性:同一份 Markdown 在 Linux、macOS、不同字体环境下,输出会不会漂。没有这两组数,我不会把它当成文档基础设施,只会当成一个值得拆源码学习的排版引擎样本。 说真的,这类项目有价值,尤其适合做海报、固定模板报告、卡片式输出。前提也很明确:输入格式要收敛,样式系统要受控,最好别碰复杂表格和富媒体。只看这段材料,我不买“无浏览器”天然更先进这个说法;它只是把依赖从浏览器运行时,换成了你自己维护的排版复杂度。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
13:02
72d ago
Ben's Bites· rssEN13:02 · 04·02
Claude Code 源代码泄露事件
Anthropic 因人为操作失误,把 Claude Code 的完整源代码给泄露了。Boris(Claude Code 负责人)确认是开发者的锅,不是 Bun 的 bug 或被黑。泄露内容包含完整架构、内部提示词、让模型进业务流程干活的 agent workflow、工具调用方式、权限系统,以及一堆未发布/隐藏功能。社区立马在 GitHub 上疯狂克...
#Code#Anthropic#Incident#Commentary
精选理由
HKR 的 H 和 R 成立,因为 Claude Code 泄露对开发者读者是个强钩子。K 不成立:正文只提了泄露文件这一条件,没有文件数量、类型、来源、时间或真实性核验,因此触发 hard-exclusion-6,分数上限被压在 40 以下。
一句话点评
Claude Code 源码意外泄露,50万行代码被扒光。核心看点是三层记忆设计(索引+按需加载+会话搜索)和子代理用 KV 缓存实现近乎免费的并行。5级权限系统和两种计划模式也值得抄。但泄露本身是开发者失误,不是安全漏洞,别过度解读。正文没披露 Anthropic 是否会因此调整发布流程。
HKR 分解
hook knowledge resonance
打开信源
46
SCORE
H1·K0·R1
10:30
72d ago
● P1OpenAI 博客· rssEN10:30 · 04·02
OpenAI 收购科技媒体公司 TBPN
OpenAI 在 4 月 2 号宣布买下了 TBPN,一个每天直播的科技谈话节目,在硅谷挺火。收购后 TBPN 会归到 Chris Lehane 管的战略部门,但官方说会保留编辑独立,节目请谁、聊什么还是他们自己定。OpenAI 的 CEO Fidji Simo 在内部信里解释,公司不想用传统公关套路,需要一个真正能聊 AI 变化的场子,TBPN 正好...
#OpenAI#TBPN#Chris Lehane#Partnership
精选理由
这条消息能上 featured,是因为 OpenAI 买媒体这件事本身够反常,而且公告给出了具体的汇报线和编辑独立承诺,不是空穴来风。我会先打个折——交易价格、股权结构和整合时间表正文都没披露,所以它到不了模型发布或产品上线那种硬核级别,停在 82 分合理。
一句话点评
OpenAI 买了一家报道 AI 的媒体,承诺编辑独立,但裁判和运动员成了一家人,这点先别太激动。
锐评
OpenAI 收购了科技媒体 TBPN,一个在硅谷挺火的日播谈话节目。官方说法是,与其自己从零搭建沟通渠道,不如直接把已经聚拢了开发者和行业讨论的场子买下来。他们承诺 TBPN 会保持编辑独立,自己选嘉宾、定选题,团队并入策略部门。 但这事天然存在利益冲突。一个造 AI 的公司,买下一个天天评论 AI 的媒体,哪怕嘴上说独立,观众也很难不怀疑报道的倾向性。公告里没披露收购金额,也没说清楚如果未来 TBPN 做了对 OpenAI 不利的报道,有什么机制能保证节目不被干预。 另外,公告提到会借用 TBPN 团队的营销直觉来推广 AI,这等于承认收购不只是为了内容,也是为了更聪明地卖产品。对从业者来说,这条新闻的价值不在于收购本身,而在于提醒你:以后看 TBPN 的内容,心里得多个问号,想想选题和嘉宾背后有没有商业考量。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K0·R1
04:39
72d ago
● P1X · @dotey(宝玉)· x-apiZH04:39 · 04·02
OpenAI 二级市场遇冷,6 亿美元股票卖不掉;Anthropic 需求爆棚,买家备好 20 亿现金等着进场
彭博社报道,OpenAI 在二级市场挂了 6 亿美元的股票,结果一个买家都找不到,跟去年几天就被抢光的情况完全不同。交易平台 Next Round Capital 的创始人说,他几百个机构客户里没人愿意接。另一边,Anthropic 的股票却抢手得很,买家已经准备了约 20 亿美元现金,另一家平台 Hiive 上的需求登记超过 16 亿美元,平台方形容...
#Safety#OpenAI#Anthropic#Bloomberg
精选理由
这篇彭博报道把 OpenAI 和 Anthropic 的二级市场处境放在一起比,反差够大:一边是 6 亿美元股份待售却找不到足够买家,另一边是 20 亿认购意向涌进来。数字本身就能说明问题——OpenAI 二级报价比上一轮估值打了约九折,Anthropic 反而溢价超五成。我会先打个折:这是市场传闻和报价,不是官方融资公告,所以不能当定论看。但信息量够,既有估值锚点又有流动性信号,还顺带提了 Anthropic 本周第二次安全事故和 Claude 源码泄露,给安全话题加了实锤。对关注资本流向和风险信号的从业者来说,这篇值得一读。
一句话点评
二级市场投资者正在用钱投票,把对 OpenAI 的热情转向 Anthropic。
锐评
彭博社这条消息直接点出了两家头部 AI 公司二级市场估值的温差:OpenAI 的股份在私人交易中降温,而 Anthropic 的股份正变得抢手。这背后反映的是投资者对两家公司商业化前景的重新定价。OpenAI 虽然用户规模大,但烧钱速度和高管频繁变动让部分早期股东想套现离场;Anthropic 则靠 Claude 在企业端的安全口碑和亚马逊的深度绑定,吸引了寻求稳健回报的资本。 不过,这条信息目前只有标题和摘要,正文内容缺失。我们看不到具体的交易量、估值倍数或买卖价差数据,也没法判断这是短期情绪波动还是长期趋势。比如,OpenAI 的冷却是指估值增速放缓,还是实际成交价在下跌?Anthropic 的沸腾是交易量激增,还是估值跳涨?这些关键数字都还没披露。 另外,二级市场交易通常流动性差、信息不透明,单靠一个标题容易放大信号。建议等完整报道出来后,再看具体是哪些机构在买、哪些在卖,以及交易条款里有没有对赌或折价保护。
HKR 分解
hook knowledge resonance
打开信源
87
SCORE
H1·K1·R1
03:29
72d ago
Product Hunt · AI· rssEN03:29 · 04·02
Claude Code 加鼠标支持和防闪烁渲染
Claude Code 更新了两个功能:支持鼠标操作,以及渲染不再闪烁。正文没披露具体平台、发布时间、实现细节或性能数据。对终端体验来说是好事,但信息太少,没法判断工程价值。
#Tools#Code#Claude Code#Product Hunt
精选理由
HKR-H 通过,因为鼠标支持和无闪烁渲染确实解决了终端写代码的真实痛点。HKR-K 和 HKR-R 不通过:帖子只列了两个改动名称,平台、机制、上线时间、性能数据和实测效果全部缺失,所以这条只适合放 all 频道。
一句话点评
Product Hunt 上 Claude Code 的 Rendering 功能页面被 Cloudflare 拦截,正文完全不可读。目前只能看到标题和 403 错误,无法判断是发布新功能还是更新文档。信息缺口太大,无法做任何有效点评。
锐评
Product Hunt 这条只给出 Claude Code 两项改动。它写了鼠标支持和无闪烁渲染。正文没给平台、版本号、上线日期,也没给实现机制或延迟数据。所以这条现在更像交互信号,不是性能信号。 我对这类更新的判断一直很直接:如果一个 coding agent 还长期跑在终端里,UI 摩擦就不是小修小补。它会直接影响会话时长、接受率、还有用户愿不愿把 agent 挂着跑几十分钟。鼠标支持听着很小,但它通常意味着选择、滚动、点击链接、diff 导航这类操作开始被认真对待。无闪烁渲染也一样。终端一旦频繁重绘,长输出、patch 预览、流式日志都会很难看。这不是“更漂亮”,是把产品从 demo 感往可日用推一步。 说真的,我会拿它和过去一年几条相邻路线一起看。OpenAI 的 Codex CLI、Warp、Cursor 的 agent 面板、Aider 这一类工具,都在削减“盯终端刷屏”的痛点。哪怕我没逐个核实最新版本细节,方向很清楚:大家都在把 agent 从一次性命令行玩具,拉成可连续操作的工作台。Claude Code 现在补这两项,说明 Anthropic 也接受了一个现实:模型能力继续涨,不会自动抹平交互层的粗糙。 但我对这条帖子有个保留。没有数据,很多话都说不实。无闪烁是换了 diff 渲染策略,还是改成局部重绘,正文没披露。鼠标支持覆盖哪些终端协议,正文也没披露。要是只在少数环境可用,价值会被高估。我要看的不是 Product Hunt 讨论热度,而是后续 changelog 里有没有明确平台列表、已知兼容性、还有长输出场景下的录屏或延迟数字。没有这些,这条先记作产品成熟度补课。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0

更多

频道

后台