Jensen Huang's Token Economics Falters! Microsoft and Amazon Jump Ship

多家科技巨头因 AI 使用成本失控而调整策略。亚马逊员工为冲榜疯狂刷 Token，导致账单激增；微软则取消大部分 Claude 授权，要求迁移至自家产品。这反映出企业从担忧 AI 使用不足转向警惕过度使用带来的高昂费用，开始重新评估 AI 投入产出比。

Token 经济学，可能并不经济。

（除了 AAAAA 显卡黄总）

最近，Axios 爆出一个挺逆天的事儿：一家企业，一个月就烧掉了 5 亿美元的 Claude 账单，合人民币 34 亿元。

原因嘛，就是老板给员工开通了 Anthropic 的企业授权之后，忘了设置用量上限，然后 token 就一直烧烧烧……

烧了一个月，34 个小目标就这么水灵灵地出去了。

咱先不说烧得值不值，如果按 Anthropic 目前约 470 亿美元的年化收入（ARR）计算，相当于这一家公司，一个月就贡献了 Anthropic 接近八分之一的月收入。

换句话说，Anthropic 每赚 8 块钱，其中就有 1 块来自这家公司。

更夸张的是，这家公司至今没有公开身份。

但 Axios 在报道里提到，能够 “无痛” 吞下 5 亿美元 AI 账单的企业，全球其实也没多少家。

很快，X 上开始出现各种猜测，其中被点名最多的是亚马逊。

巧的是，就在几乎同一时间，《金融时报》披露，亚马逊已经取消内部 AI 使用排行榜，因为员工开始为了冲榜而疯狂刷 Token，甚至执行大量没有实际价值的任务。

这一前一后两条新闻放在一起看，味道就有点不一样了。

过去两年，企业最担心的是员工不用 AI。而现在，越来越多企业开始担心另一件事：

AI 是不是用得太多了。

美国大厂，开始算账了

这种变化，最近正在越来越频繁地出现。

微软就是一个典型例子。

最近，微软宣布将在 6 月 30 日之前取消Experiences + Devices 部门（负责 Windows、Microsoft 365、Outlook、Teams、Surface）的大部分 Claude Code 授权，工程师们被要求迁移到自家的 GitHub Copilot CLI。

而 Claude Code 进入微软内部，距离现在不过 6 个月。

微软给出的理由很符合硅谷传统——

Claude Code 已经完成了帮助团队学习和探索的阶段，是时候回到 “Eat Your Own Dog Food”，使用自己的产品了。

但无论如何，Token 账单都是绕不开的话题。

类似的变化，也出现在DeepSeek身上。

今年 4 月发布 V4 时，DeepSeek 在技术报告里提到，V4 已经成为公司内部员工日常使用的 Agentic Coding 模型，体验优于 Claude Sonnet 4.5，交付质量接近 Opus 4.6。

虽然官方没有明确提及成本因素，但对于拥有自研模型的公司来说，用自己的模型完成同样的工作，显然是一个更经济的选择。

如果说微软和 DeepSeek 还算委婉客气，那么 Uber 则说得更加直接。

Uber CTO Praveen Neppalli Naga 今年早些时候透露，公司工程师仅用 4 个月就烧完了全年 Claude Code 预算。

随后，Uber 首席运营官 Andrew Macdonald 公开表示：AI Token 消耗与最终发布的有价值产品之间，似乎并不存在明显的线性关系。

换句话说，花掉更多 Token，并不一定意味着创造出更多价值。

类似的反思，也开始出现在更多公司内部。

此前，多邻国曾计划将 AI 使用情况纳入员工绩效考核。但在员工质疑 “是否必须为了使用 AI 而使用 AI” 之后，公司最终撤回了这一决定。

“感觉我们不是在为实际结果负责，而是在试图强推一些并不总是适合的东西。”

今年 4 月的一档播客中，多邻国 CEO 路易斯·冯·安如此总结。

Meta的变化则更具代表性。

在被曝出内部建立 Claude 使用排行榜、单月消耗数十亿 Token 后，Meta 也逐渐开始收紧相关激励，从鼓励 “多用、多刷”，转向更关注实际产出。

与此同时，国内也出现了类似声音。

米哈游郑银河曾分享过一次经历：某个 Agent 项目上线后，一晚上烧掉了 200 万元 Token 费用。

这笔学费不算便宜。但它也让越来越多企业意识到一个问题：Token 本身并不是价值，完成任务、交付产品、创造收入，才是价值。

可以说，企业依然相信 AI，只是相比去年，它们开始不再单纯追求消耗更多 Token，而是开始认真计算每一个 Token 背后的 ROI。

AI 第一次变成了财务问题

毫无疑问，在经历了大半年的 “黄氏 Token 经济学” 之后，美国大厂开始认真反思：

这些 Token，到底花得值不值？

今年 3 月，黄仁勋在《All-In Podcast》中曾为这套逻辑公开背书。

如果一个年薪 50 万美元的工程师每年消耗的 token 不到 25 万美元，他会深感担忧。

在当时，这句话被很多企业奉为圭臬。

毕竟，如果 AI 真的能提升工程师效率，那么多烧一些 Token，本质上是在购买生产力。

用的越多，省得越多就是这么来的。

但问题在于：当一张张真实账单开始寄到企业手里时，事情开始变得没那么简单。

无论是 Amazon 取消排行榜，微软收缩 Claude Code 授权，还是 Uber 发现工程师 4 个月烧光全年预算。

老板们最终还是选择了用脚投票。

最近，关于这件事的讨论也开始在 Hacker News 上发酵。

有人认为，这是一个重要转折点。

过去那种把 Token 消耗量等同于 AI 采用率、甚至等同于生产力的狂热阶段，正在结束。

也有人把矛头直接指向了过去半年流行的 “Tokenmaxxing” 文化。

（注：Token 是大语言模型处理文本的基本单位，也是计费单位。Tokenmaxxing 指的是企业和员工疯狂追求 token 消耗量，把 “烧了多少 token” 当成 AI 采用率和生产力的衡量指标。）

在他们看来，问题并不在于 AI，而在于企业把 “烧更多 Token” 误当成了目标本身。

如果使用更高效的模型、合理控制 Agent 工作流，或者让人类参与关键决策，成本本可以低得多。

当然，也有人开玩笑说：

这场运动最大的赢家，从头到尾可能只有黄仁勋。

不过，另一种观点同样值得关注。

不少开发者认为，这并不是 AI 热潮退去的信号。

恰恰相反。

这意味着企业终于开始从 “先用再说”，进入 “精细运营” 的阶段。

未来大家关注的重点，可能不再是谁烧掉更多 Token，而是谁能用更少的 Token 完成更多任务。

比如：更高效的 Agent 工作流；廉价模型处理简单任务；昂贵模型只负责关键决策；更严格的预算和权限管理。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。