ax@ax-radar:~/daily/2026-05-30 $ cat newsletter/daily/2026-05-30.md
41 srcsignal 72%cycle 04:32
AX 的 AI 日报 · 2026-05-30算账日

今天 AI 圈在算账:成本、计费和一张 750 亿的空头支票

今天 AI 圈最有意思的不在某个模型又刷榜了,是几张账本同时翻动:软银说要往法国砸 750 亿欧元建数据中心,但细节全无;GitHub Copilot 把计费从订阅改成按 token 算,开发者直接炸了;美国企业开始给 AI 用量设上限,因为成本涨太快。先来看软银这一笔——数字很大,但我会先打个折。

软银 750 亿欧元砸法国,数字很大,细节全无

这条我会先打个折。软银被曝计划在法国投 750 亿欧元建 AI 数据中心,消息来自《论坛报》和《金融时报》,软银自己还没官宣。作为对比,法国之前公布的"法国 2030"计划里给整个 AI 的预算大约是 25 亿欧元——750 亿是这个数的 30 倍。

但缺的东西太多了:建多少座、选址在哪、分几期投入、软银是独资还是拉当地伙伴一起干,全都没说。这种"天价投资"的新闻在 AI 圈不是第一次出现,之前软银也说过要在美国投 1000 亿美元,后来实际落地的规模打了不小的折扣。

据《金融时报》报道,这笔钱主要投向 AI 数据中心,也就是给大模型训练和推理提供算力的基础设施。

有意思的是,Bloomberg 的报道里也提到了同一件事,但正文被付费墙挡了,只能看到标题。两条源都指向同一个数字,但都没有实锤。这种"媒体爆料、公司沉默"的节奏,在孙正义身上见过太多次了——他喜欢先把数字抛出来造势,后面再慢慢谈条件。

我的判断:750 亿这个数先当上限看,实际落地能有一半就算不错。但即使打对折,也是欧洲 AI 基建史上最大的一笔。值得盯的是法国政府会给出什么条件——税收优惠、土地、能源配额,这些才是让数字落地的关键。

GitHub Copilot 改按 token 收费,开发者炸了

这事挺有意思的——GitHub Copilot 把计费方式从订阅制改成了按 token 算钱,开发者社区直接炸了。token 就是模型处理文本的最小单位,用多少收多少,听起来公平,但问题在于:单价没公布、生效时间没公布、免费额度还在不在也没说

TechCrunch 的标题直接用了"开玩笑吧"(What a joke),评论区里开发者最担心的是:写代码时每补一行都可能肉疼。以前一个月交 10 美元随便用,现在每次自动补全都是一次计费,重度用户一天可能触发几百次补全,成本会涨到哪完全没底。

但换个角度看,如果单价定得合理,轻度用户可能反而省钱。GitHub 母公司 Microsoft 不是傻子,他们手里有大量用户行为数据,肯定算过账——订阅制下重度用户在补贴轻度用户,改成按量计费核心是是把补贴取消,让多用的人多付。

现在缺的就是那个单价。如果定在每百万 token 几美元的水平,大部分个人开发者可能感觉不到变化;如果定在几十美元,那就是逼着人去找替代品。GitHub 还没回应,但这件事说明一个趋势:AI 编程工具的免费午餐正在结束,从"能上就上"变成"得算账了"。

美国企业开始给 AI 用量设上限,之前是能上就上,现在得算账

华尔街日报报道,美国公司发现 AI 用多了成本扛不住,开始限制用量、搞分层审批来控制开支。缺少具体涨了多少、哪些公司、限制比例,但方向很清楚:之前是能上 AI 就上,现在得算账了。

这跟 GitHub Copilot 改计费是同一件事的两面。企业端,API 调用费、模型推理成本、人员培训投入加起来,一年下来不是小数目。华尔街日报提到,有些公司开始按部门分配 AI 使用额度,超了要单独审批——这跟当年云服务刚普及时的情况一模一样,先是随便用,然后账单来了,然后财务开始卡预算。

有个自组服务器的案例可以当参照:有人花 6406 美元搭了一台本地大模型服务器,核心配置是 4 张 AMD MI100 显卡,主要跑 Qwen3.6 27B 模型,每天处理约 2040 万个输入 token132 万个输出 token。他拿 OpenRouter 的 API 价格算了一笔账:第一年本地总成本(含电费)是 2992 美元,而调用同等量 API 要花 3700 多美元,省了 700 多。

当然,这个案例有前提——你得有技术能力自己搭、自己维护,而且正文被 Reddit 屏蔽了,看不到具体配置和折旧算法。但方向是对的:当 API 成本涨到一定程度,自建就变成可选项。企业端的"AI 配给制"可能只是开始,后面会有更多公司算这笔账。

Google 发了两个新图像模型,但定价和速度都没说

Google AI Developers 发推说 Nano Banana Pro(对应 gemini-3-pro-image)和 Nano Banana 2(对应 gemini-3.1-flash-image)已经正式发布,可以直接通过 Gemini API 调用。推文里贴了一些社区示例展示效果,看着不错。

但缺了最关键的东西:定价、单次生成耗时、调用频率上限。想上生产环境,这三样缺一不可。Pro 版和 Flash 版的定位差异也没说清楚——Pro 是质量更高但更慢更贵,还是只是分辨率不同?

Google 最近在图像生成上追得很快,但商业化节奏还是老问题:技术先放出来,商业模型后面再补。对开发者来说,这会让现在只能先玩玩,真要接进产品还得等。

NVIDIA 要发 ARM 笔记本芯片,从卖显卡变成卖整机方案

NVIDIA、微软和 Arm 同时发了个台北音乐中心的坐标,暗示 6 月 1 日有发布会,主角很可能是与联发科合作的 ARM 笔记本芯片 N1X。这颗芯片把 CPU、Blackwell 架构的 GPU 和 AI 单元全塞进去了,目标是让轻薄本跑出接近 RTX 4070 的图形性能。

如果真能做到,NVIDIA 就不只是卖显卡了,而是直接跟 Intel、AMD 和高通抢笔记本芯片市场。但悬念很大:功耗和散热怎么解决?Blackwell 架构的 GPU 塞进轻薄本,发热量不是开玩笑的。目前只有预告坐标,没跑分、没功耗数据、没量产时间。

这一手的逻辑很清楚:AI PC 是下一个战场,NVIDIA 不想只当显卡供应商,想定义整机核心方案。6 月 1 日的发布会值得盯,但别指望马上能买到——从发布到量产,通常还有半年到一年。

今日小信号

  • 特斯拉 FSD V14.3.3 横穿加拿大 6051 公里零接管:听着吓人,但这是民间爱好者的一次性路测,不是官方认证。FSD 仍是 L2 级辅助驾驶,法规上要求人随时准备接管,别当无人驾驶看。
  • Simon Willison 把 Python 网页应用搬进浏览器:用 Pyodide 加 Service Worker,让 Python 的 ASGI 应用完全在浏览器里跑,不再需要后端服务器。Datasette 都能完整运行,这个方向有意思——以后前端和后端的边界会更模糊。
  • NVIDIA 出了个推理部署模拟器 DynoSim:号称能跑到实时速度的 1500 倍,一次筛几千种配置。但缺少硬件环境和实测延迟,这个数字先打个折看。
  • AI 生成虚假黑人形象在社交媒体卖 Shein 倒货:9 美元皮带扣转手 40 美元,骗的是支持少数族裔手工品牌的善意。The Verge 的记者挖得很细,值得一看。
  • OpenAI 送开源维护者半年 Pro,价值 1200 美元:申请不卡 GitHub Star 数,有项目链接就行。如果你在维护开源项目,可以去领。
  • Steve Yegge 发文判传统技术面试死刑:前 Amazon Bar Raiser、Google 招聘委员会成员,结论是面试评分跟实际工作表现几乎没关系。但替代方案没给,这点先别太激动。

更多

频道

后台