
Is Token Burning Losing Steam? This May Be the Most Important Chart in the Entire Market
硅谷 Token 支出指数在 5 月前大幅攀升,但近期出现回落,该指数衡量全市场每百万 LLM Token 的支付价格。宏观策略师 Andreas Steno Larsen 警告,如果 Token 定价持续走弱,本轮周期中从内存到更广泛的硬件及数据中心交易可能宣告结束。Token 支出的边际变化,通过 GPU 算力、DRAM 内存及数据中心需求的传导链条,直接影响英伟达、存储芯片厂商及云服务商的资本开支预期。
Token 支出增长显现疲态,市场对于 AI 的核心焦点正从 “技术是否可行” 迅速向 “成本是否可承受” 转移。
6 月 9 日,宏观策略师 Andreas Steno Larsen 在社交媒体上表示,Silicon Data LLM Token 支出指数走势是当前全市场最应关注的一张图表。
该指数自去年 12 月以来翻了一番以上,并在 2026 年 5 月前大幅攀升,但近期出现回落。Andreas Steno Larsen 警告,如果 Token 定价持续走弱,本轮周期中从内存到更广泛的硬件及数据中心交易可能宣告结束。
与此同时,科技巨头正在紧急遏制内部失控的 AI 算力消耗。
华尔街见闻此前提及,亚马逊与微软正削减内部 AI 工具或叫停追踪使用量的项目,以打击员工为提升内部排名而无效消耗算力的 “Tokenmaxxing”(词元极大化)行为。在服务端,GitHub Copilot 于 6 月 1 日将计费模式从按请求收费切换为按 Token 计费,导致部分用户月度账单飙升十余倍,引发市场对 AI 补贴模式可持续性的广泛质疑。
这一系列信号正在重塑投资者对 AI 基础设施交易的风险判断。Token 支出的边际变化,通过 GPU 算力、DRAM 内存及数据中心需求的传导链条,直接影响英伟达、存储芯片厂商及云服务商的资本开支预期。
指标见顶:硬件交易逻辑面临考验
Silicon Data LLM Token 支出指数是一个以支出为权重的指标,衡量全市场每百万 LLM Token 的支付价格,被视为市场对 AI 边际支付意愿的替代指标。由于 OpenAI,Anthropic 和谷歌等主要供应商多按 Token 消耗量向客户计费,Token 支出将 AI 使用量与 GPU,DRAM 和数据中心的需求直接绑定。
该指数近期的停滞,引发了资本市场对硬件周期的担忧。Silicon Data 的评论指出,近期的回落可能预示着向高端闭源模型迁移的速度正在放缓。如果 Token 支出持续疲软,为增量 GPU,DRAM 和数据中心采购提供资金的边际收入将会减弱,这将改变那些围绕 Token 驱动增长而制定资本支出计划的公司的风险状况。
虽然单次下滑并不构成绝对趋势,但作为硬件周期的领先指标,该数据表明企业对高成本前沿模型的依赖可能面临系统性下降。
账单危机:科技巨头叫停 “无效消耗”
企业 AI 热潮正在遭遇第一次真正意义上的账单危机。
据 Axios 援引一位 AI 顾问的消息,其旗下一家企业客户近期在单个月内就花费了 5 亿美元用于 Claude,原因仅仅是未对员工使用量设置上限。
在企业内部,将 AI 使用量作为考核标准的做法也遭到了反噬。据报道,亚马逊旗下开发者平台 Kiro 曾设有一个名为"Kirorank"的内部排行榜。Meta 内部也出现了类似试图拉高 Token 消耗量以占据排名优势的情况。
亚马逊高级副总裁 Dave Treadwell 承认,员工为了刷榜而让 AI 执行无意义任务,推高了公司的运营成本。他明确指示员工 “不要为了用 AI 而用 AI”,该测试版仪表盘随后被下线。亚马逊目前已转向以 “归一化部署” 指标替代 Token 消耗量,追踪 AI 生成代码的实际价值。
定价反弹:补贴时代走向终结
在供应端,AI 行业长期以补贴换增长的商业模式正濒临极限。
6 月 1 日,GitHub Copilot 正式转为按 Token 用量计费。有用户在 Reddit 社区表示,其月度费用预计将从不到 45 美元暴涨至超过 847 美元。
GitHub 首席产品官 Mario Rodriguez 此前表示,随着智能体 AI 兴起,旧有定价模式已不可持续。Gartner 分析师 Arun Chandrasekaran 在接受 Business Insider 采访时指出,随着高级推理模型推高算力消耗,更多企业将转向按用量计费。
投资人 Tommy Shaughnessy 警告了这种补贴模式的系统风险。他指出,目前 AI 大厂的利润率深度为负,一旦企业直面按量计费的真实价格,实际消耗速度将远超预期,例如 Uber 在 2026 年将全年 AI 预算在四个月内耗尽。如果投资者对回报预期失去信心,支撑 GPU 采购和模型训练的资本流动将面临逆转。
成本重构:廉价模型或成市场主导
面对高昂的推理成本,市场正寻找低成本的替代方案。
高盛 One-Delta 部门负责人 Rich Privorotsky 认为,随着 DeepSeek 下调 75% 的定价,以及小米 MiMo 接近 99% 的降价幅度,基础设施瓶颈的缓解正触发价格战。
华尔街见闻此前提及,Coinbase 首席执行官 Brian Armstrong 预测,80% 的 AI 工作负载将在 12 至 18 个月内迁移至成本低 99% 的模型,只有 20% 需要极致智能的任务会留在前沿模型上。他指出,能源与算力将成为真正的瓶颈。
Hugging Face 首席执行官 Clement Delangue 援引斯坦福大学数据证实了这一趋势:本地模型在真实世界查询中的准确率已跃升至 71.3%,且成本极低。Micro1 首席执行官 Ali Ansari 将此视为从过度使用转向理性使用的 “健康摆荡”。
对于 AI 的真实投资回报,华尔街目前存在严重分歧。据高盛的 Jim Schneider 研判,到 2030 年,代理式 AI 将推动 Token 消耗量增长 24 倍,云服务商毛利率将在短期内转正。摩根大通的经济研究也显示,Python 包在 PyPI 上的跳升式增长证明了真实生产力的提升。
然而,空头阵营态度同样坚决。高盛半导体分析师 Jim Covello 在报告中指出,当前产业链繁荣是以牺牲上游消耗为代价的,几乎所有价值都流向了半导体公司,这种状况不可持续。
Boosted.ai 首席执行官 Josh Pantony 则强调,企业对数据开放的顾虑削弱了 AI 代理的效能。在成本、回报与安全的多重考量下,下一笔 AI 账单能产生多少真实价值,将是市场对这场科技投资的最终判决。
