Jensen Huang's Token Economics Falters! Microsoft and Amazon Jump Ship

华尔街见闻
2026.06.01 11:14

多家科技巨头因 AI 使用成本失控而调整策略。亚马逊员工为冲榜疯狂刷 Token,导致账单激增;微软则取消大部分 Claude 授权,要求迁移至自家产品。这反映出企业从担忧 AI 使用不足转向警惕过度使用带来的高昂费用,开始重新评估 AI 投入产出比。

Token 经济学,可能并不经济。

(除了 AAAAA 显卡黄总)

最近,Axios 爆出一个挺逆天的事儿:一家企业,一个月就烧掉了 5 亿美元的 Claude 账单,合人民币 34 亿元。

原因嘛,就是老板给员工开通了 Anthropic 的企业授权之后,忘了设置用量上限,然后 token 就一直烧烧烧……

烧了一个月,34 个小目标就这么水灵灵地出去了。

咱先不说烧得值不值,如果按 Anthropic 目前约 470 亿美元的年化收入(ARR)计算,相当于这一家公司,一个月就贡献了 Anthropic 接近八分之一的月收入

换句话说,Anthropic 每赚 8 块钱,其中就有 1 块来自这家公司。

更夸张的是,这家公司至今没有公开身份。

但 Axios 在报道里提到,能够 “无痛” 吞下 5 亿美元 AI 账单的企业,全球其实也没多少家。

很快,X 上开始出现各种猜测,其中被点名最多的是亚马逊。

巧的是,就在几乎同一时间,《金融时报》披露,亚马逊已经取消内部 AI 使用排行榜,因为员工开始为了冲榜而疯狂刷 Token,甚至执行大量没有实际价值的任务。

这一前一后两条新闻放在一起看,味道就有点不一样了。

过去两年,企业最担心的是员工不用 AI。而现在,越来越多企业开始担心另一件事:

AI 是不是用得太多了。

美国大厂,开始算账了

这种变化,最近正在越来越频繁地出现。

微软就是一个典型例子。

最近,微软宣布将在 6 月 30 日之前取消Experiences + Devices 部门(负责 Windows、Microsoft 365、Outlook、Teams、Surface)的大部分 Claude Code 授权,工程师们被要求迁移到自家的 GitHub Copilot CLI。

而 Claude Code 进入微软内部,距离现在不过 6 个月。

微软给出的理由很符合硅谷传统——

Claude Code 已经完成了帮助团队学习和探索的阶段,是时候回到 “Eat Your Own Dog Food”,使用自己的产品了。

但无论如何,Token 账单都是绕不开的话题。

类似的变化,也出现在DeepSeek身上。

今年 4 月发布 V4 时,DeepSeek 在技术报告里提到,V4 已经成为公司内部员工日常使用的 Agentic Coding 模型,体验优于 Claude Sonnet 4.5,交付质量接近 Opus 4.6。

虽然官方没有明确提及成本因素,但对于拥有自研模型的公司来说,用自己的模型完成同样的工作,显然是一个更经济的选择。

如果说微软和 DeepSeek 还算委婉客气,那么 Uber 则说得更加直接。

Uber CTO Praveen Neppalli Naga 今年早些时候透露,公司工程师仅用 4 个月就烧完了全年 Claude Code 预算。

随后,Uber 首席运营官 Andrew Macdonald 公开表示:AI Token 消耗与最终发布的有价值产品之间,似乎并不存在明显的线性关系。

换句话说,花掉更多 Token,并不一定意味着创造出更多价值。

类似的反思,也开始出现在更多公司内部。

此前,多邻国曾计划将 AI 使用情况纳入员工绩效考核。但在员工质疑 “是否必须为了使用 AI 而使用 AI” 之后,公司最终撤回了这一决定。

“感觉我们不是在为实际结果负责,而是在试图强推一些并不总是适合的东西。”

今年 4 月的一档播客中,多邻国 CEO 路易斯·冯·安如此总结。

Meta的变化则更具代表性。

在被曝出内部建立 Claude 使用排行榜、单月消耗数十亿 Token 后,Meta 也逐渐开始收紧相关激励,从鼓励 “多用、多刷”,转向更关注实际产出。

与此同时,国内也出现了类似声音。

米哈游郑银河曾分享过一次经历:某个 Agent 项目上线后,一晚上烧掉了 200 万元 Token 费用。

这笔学费不算便宜。但它也让越来越多企业意识到一个问题:Token 本身并不是价值,完成任务、交付产品、创造收入,才是价值。

可以说,企业依然相信 AI,只是相比去年,它们开始不再单纯追求消耗更多 Token,而是开始认真计算每一个 Token 背后的 ROI。

AI 第一次变成了财务问题

毫无疑问,在经历了大半年的 “黄氏 Token 经济学” 之后,美国大厂开始认真反思:

这些 Token,到底花得值不值?

今年 3 月,黄仁勋在《All-In Podcast》中曾为这套逻辑公开背书。

如果一个年薪 50 万美元的工程师每年消耗的 token 不到 25 万美元,他会深感担忧。

在当时,这句话被很多企业奉为圭臬。

毕竟,如果 AI 真的能提升工程师效率,那么多烧一些 Token,本质上是在购买生产力。

用的越多,省得越多就是这么来的。

但问题在于:当一张张真实账单开始寄到企业手里时,事情开始变得没那么简单。

无论是 Amazon 取消排行榜,微软收缩 Claude Code 授权,还是 Uber 发现工程师 4 个月烧光全年预算。

老板们最终还是选择了用脚投票。

最近,关于这件事的讨论也开始在 Hacker News 上发酵。

有人认为,这是一个重要转折点。

过去那种把 Token 消耗量等同于 AI 采用率、甚至等同于生产力的狂热阶段,正在结束。

也有人把矛头直接指向了过去半年流行的 “Tokenmaxxing” 文化。

(注:Token 是大语言模型处理文本的基本单位,也是计费单位。Tokenmaxxing 指的是企业和员工疯狂追求 token 消耗量,把 “烧了多少 token” 当成 AI 采用率和生产力的衡量指标。)

在他们看来,问题并不在于 AI,而在于企业把 “烧更多 Token” 误当成了目标本身。

如果使用更高效的模型、合理控制 Agent 工作流,或者让人类参与关键决策,成本本可以低得多。

当然,也有人开玩笑说:

这场运动最大的赢家,从头到尾可能只有黄仁勋。

不过,另一种观点同样值得关注。

不少开发者认为,这并不是 AI 热潮退去的信号。

恰恰相反。

这意味着企业终于开始从 “先用再说”,进入 “精细运营” 的阶段。

未来大家关注的重点,可能不再是谁烧掉更多 Token,而是谁能用更少的 Token 完成更多任务。

比如:更高效的 Agent 工作流;廉价模型处理简单任务;昂贵模型只负责关键决策;更严格的预算和权限管理。

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。