Meta aims to transform AI capital expenditures into a "computing power balance sheet"! From the AI arms race to entering cloud computing, Meta wants to fully capitalize on the dividends of the AI inference era

智通财经
2026.07.01 14:09

Meta 正制定前所未有的云计算基础设施业务计划,旨在将内部 AI 算力资产转化为可外部出租的平台。通过向客户出售富余的 AI 算力和独家大模型资源访问权限,Meta 试图与 AWS、Azure 等巨头竞争,并将巨额资本开支转化为具备营收弹性的 “AI 算力资产负债表”。此举意在抓住 AI 推理时代红利,应对日益增长的云端算力需求。

智通财经 APP 获悉,Facebook 与 Instagram 母公司 Meta Platforms Inc.(META.US) 正在制定一项该公司前所未有的云计算基础设施业务宏图计划,该业务将出售对 Meta 大规模部署的 AI 算力基础设施和独家 AI 大模型资源的访问权限,从而与亚马逊云服务 (即亚马逊 AWS)、微软 Azure 云平台和谷歌云平台 (Google Cloud) 等云计算行业领导者们形成新的竞争维度。

根据媒体援引的知情人士透露消息最新报道,Meta 一直在快速锁定昂贵的人工智能数据中心建设进程以及 AI GPU/数据中心 CPU 等庞大的底层 AI 算力基础设施资源,以支撑自身的人工智能雄心壮志;与此同时,该公司正在组建一项重要的新业务,通过向外部客户出售富余 AI 算力资源来创造 AI 相关营收。知情人士因相关细节尚未公开而要求匿名。

Meta 进军云计算的核心逻辑,本质上是在全球 AI 算力资源需求持续井喷式扩张之际,聚焦于把此前被市场屡次质疑的巨额 AI 资本开支,改造成一项具备外部营收弹性的 “AI 算力资产负债表”。Meta 正在建设云业务以出售富余 AI 算力,与此同时,近期谷歌限制 Meta 使用 Gemini 模型的报道也在反向证明,AI 算力需求如此之强,连超大科技公司内部都面临云端 AI 算力不足,Google Cloud 一季度营收虽达 200 亿美元,但算力约束仍限制更高增长并推高积压订单。

这也意味着 Meta 的策略不是简单 “跨界做云”,而是力争率先为 AI 超级智能开发、广告推荐、视频生成、AI 助手和模型训练/云端大规模 AI 推理囤积 GPU/ASIC/TPU 资源、网络基础设施、HBM/DRAM/NAND 存储组件、电力与数据中心容量;一旦阶段性过剩,就把这部分容量封装成模型 API 或原始算力租赁,对标 AWS Bedrock 或者 CoreWeave 式新云领军者,从而为 “过度 AI 算力基础设施建设” 提供下行保护,也为投资者提供 AI 资本开支回收路径。

更深层来看,Meta 是在押注 AI 工作负载从训练中心转向推理中心后的长期算力资源稀缺。麦肯锡预计,到 2030 年全球数据中心为满足算力需求需要约 6.7 万亿美元投资,其中 AI 推理端处理负载相关数据中心资本开支约 5.2 万亿美元;国际能源署预计全球数据中心用电到 2030 年将翻倍至约 945 太瓦时,其中 AI 驱动的加速服务器用电年增速约 30%;华尔街金融巨头高盛也预计美国数据中心电力需求将从 2025 年的 31 吉瓦升至 2027 年的 66 吉瓦。

因此 Meta 这一步棋最终聚焦的是 AI 时代最稀缺的 “可用推理产能”:GPU/ASIC/TPU AI 算力资源集群、低延迟网络、模型托管、token 计费乃至超大规模数据中心的高效率调度能力。

华尔街对于 Meta 估值锚可能从 “广告平台 + 元宇宙支出折价” 切换到 “广告现金牛 +AI 模型入口 + 算力基础设施期权”;但成败关键不在于能否买到芯片,而在于能否补齐企业销售、AI 开发者生态、天量级别云端 AI 算力租赁服务可靠性、云平台软件栈和单位 token 经济性

从 AI 超级智能军备赛到挑战 AWS、Azure 与谷歌云,Meta 力争把 “富余算力” 变成云业务飞轮

据了解,Meta 主导的一项重要潜在计划包括出售对托管在 Meta 现有 AI 算力基础设施上的多种 AI 模型的访问权限;知情人士称,这种做法类似于亚马逊云服务的 Bedrock 产品。Meta 将运营支撑这些模型的数据中心组件以及 AI 芯片等细分算力资源,还包括其自身的最新开发的 Muse Spark 模型,并向开发者收取访问费用。

知情人士称,该公司还在考虑出售 “原始” 的云计算原生算力容量的访问权限,类似于 CoreWeave Inc.等所谓新云业务领军者们。知情人士称,这些新业务线的开发是 Meta Compute 的一部分;Meta Compute 是一项内部计划,旨在建设和管理公司的 AI 算力基础设施部署工作。Meta Compute 由 Meta 基础设施负责人 Santosh Janardhan、Meta 超级智能实验室 AI 部门内部领导者 Daniel Gross 以及 Meta 总裁 Dina Powell McCormick 领导。

Meta 发言人拒绝置评。该公司的计划仍在制定中,相关战略也可能发生变化。Meta 股价周三美股盘初交易中一度上涨近 10%,随后回吐部分涨幅。CoreWeave 股价盘初则暴跌超 10%。

Meta 已将发展 AI“超级智能” 列为最高优先事项之一,并已承诺投入数千亿美元建设数据中心以及其他重要 AI 算力基础设施,例如其认为实现这一目标所必需的昂贵 AI 芯片以及一系列 AI 算力相关硬件体系。这项投资已经让投资者对 Meta 如何从这些千亿美元级别的巨额支出中获得回报感到焦虑,其中的巨额支出包括与 CoreWeave、Alphabet Inc.旗下谷歌和云计算巨头甲骨文 (Oracle Corp.) 等云计算领军者们达成的重大算力交易。

云计算业务确实提供了一种收回部分 AI 算力基础设施投资的重要方式。亚马逊云服务、Azure 和谷歌云已花费数十年建设超级云计算平台,通过互联网平台生态出租算力、企业端巨大存储容量以及某些大型软件访问权限——这些业务如今每个季度创造数百亿美元营收规模。

随着 AI 需求激增,这些服务商也已扩张至出租训练和运行 AI 模型所需的专用 AI 芯片以及广泛 AI 算力基础设施资源与容量。这是一项复杂业务,不仅需要庞大的数据中心集群,还需要软件平台、企业销售团队和客户支持运营共同组建起来的庞大云计算生态。

埃隆·马斯克的 SpaceX 在 2 月收购其 AI 初创公司 xAI 后,最近成为这一云端算力资源租赁领域的关键玩家;该公司今年早些时候向 AI 应用领军者 Anthropic PBC 出租了其位于孟菲斯的大型 AI 数据中心底层算力资源的云端访问权限,并与谷歌达成了一项云端 AI 算力租赁交易。根据 Bloomberg Intelligence 的一项预测数据,这一战略可能帮助 xAI 到 2028 年创造超过 500 亿美元营收规模,并到 2030 年创造至少 1000 亿美元营收。

尽管存在复杂性,Meta 首席执行官马克·扎克伯格已向投资者们表示,他愿意出售富余算力基础设施,甚至愿意推出所谓大模型 API 服务,让客户们为 AI 使用量付费——这类业务通常以 “token 规模” 来进行计量,也就是客户查询所使用和生成的天量数据量。

扎克伯格在 5 月与股东的电话会议上表示:“这绝对在考虑范围内。几乎每周都有不同的外部公司来找我们,既要求我们搭建专业的 API 服务体系,也询问我们是否有他们可以从我们这里购买的算力,并愿意支付高于我们购入成本的溢价。”

扎克伯格当时表示:“我们还没有这样做,因为我们认为自己有用途可以使用这些算力。但显然,如果我们到了某个阶段,认为自己建设过度,那么这就是我们拥有的一个选项,这也在一定程度上让我们对投资建设这些基础设施更有信心。

在快速演进的 AI 算力基础设施军备竞赛中,扎克伯格曾多次暗示,他认为行业正受到 AI 算力容量约束,Meta 应尽可能多地积累算力,然后再决定其用途。

Meta 把 AI 云变成 “算力回收飞轮” 的背后:Agent Runtime 爆发,半导体缺口与云端 AI 推理算力需求共振上行

Meta 筹建 AI 云业务的核心逻辑,是力争把 “超级智能” 军备赛形成的巨额 ASIC/TPU/GPU、数据中心 CPU、数据中心电力链条和光互连网络、存储组件类昂贵算力资产,从单纯内部成本中心转化为可外部出租的 AI 算力基础设施平台。

对资本市场而言,这等于给 Meta 数千亿美元级 AI 资本开支装上 “残值回收机制”:自用时服务广告推荐、视频生成、AI 助手和超级智能训练;闲置时变成 API、模型托管、推理集群或 GPU 租赁庞大营收类别,从而缓解市场对 AI 资本开支回报率的焦虑。

AI 半导体交易主题的愈发杠杆化与仓位拥挤与苹果等消费电子领军者们涨价压力升级,伴随着费城半导体指数一度单日大跌 7.9%,且一个月内多次出现超过 5% 的剧烈波动,凸显出与半导体相关联的 AI 算力产业链已进入高波动、杠杆与看涨仓位极度拥挤、高预期兑现压力阶段,这也是为何近日不断有机构投资者开始重点强调 “AI 半导体交易热潮已经见底”、“AI 泡沫逐渐破裂” 这类过于悲观的熊市叙事。

然而,华尔街知名投资机构野村周三发布最新研报,反驳 “半导体见顶论”。野村反驳 “半导体见顶论” 的关键,不是简单说 AI 芯片还会涨,而是指出 AI 云基础设施需求正在从单点 GPU 短缺扩散为系统性零部件错配。按照野村研究框架,2026 年和 2027 年 AI 服务器营收预计分别增长 78% 和 76%,全球数据中心项目从 240 个增至 280 个,其中吉瓦级项目约 50 个,2027 年新增算力部署预计达 32GW,2028 年也已有 23GW 可见度;但真正瓶颈正在从 GPU 产能、台积电 CoWoS 先进封装向晶圆级基板、AI PCB、覆铜板 (CCL)、电子布、MLCC、玻璃基板/ABF 基板、IC 载板、高端电容、电源管理芯片和数据中心光学类高速光互连元件外溢。

据悉,麦肯锡的中长期测算也支持野村上述强调这一方向:即到 2030 年,仅为满足 AI 相关需求,全球算力价值链就需要向数据中心投入约 5.2 万亿美元,对应约 156GW 的 AI 相关数据中心容量需求。 这意味着半导体交易的主线不是 “见顶”,而是 “短缺部位轮动”:从 GPU 到 HBM,从先进封装到基板材料,再到电力、液冷、网络与云调度软件,盈利上修和涨价预期仍可能是 AI 算力相关核心硬件链条最强催化剂。

近日风靡全球的 “Agent Runtime” 理论则进一步解释了为什么云端 AI 推理需求可能接近无止境。传统模型托管是 “输入—推理—输出” 的无状态服务,而智能体 AI 是循环式工作流:规划、调用模型、调用工具、观察、重试、纠错,直到任务完成。最新的市场用例可谓非常关键:单次调用成功率即便有 95%,连续调用 15 次后的任务成功率也只有约 46.3%,这意味着企业真正购买的不是便宜 token,而是可编排、可观测、可追踪、可控成本、可审计结果的运行期系统。Nebius 所强调的从超过 200MW 运行算力迈向年底 800MW 至 1GW、并锁定 3GW 以上预留容量,反映的正是云基础设施从 “卖 GPU 小时” 转向 “卖结果确定性” 的升级。国际能源署也预计全球数据中心用电到 2030 年将翻倍至约 945TWh,这说明 Agent Runtime 不是单纯软件架构变化,而是会反向牵引 GPU 集群、电力容量、网络交换、存储检索、模型路由和可观测性平台的全栈投资。

Meta 进军云计算背后可谓是 Agent Runtime 飞轮大爆发,半导体缺口与云端 AI 推理算力需求共振上行。需求端由智能体任务循环放大 token 与推理消耗,供给端由先进封装和小零部件瓶颈限制 AI 服务器交付,商业端则由 Meta、CoreWeave、Nebius、AWS、Azure 和谷歌云争夺 “可用 AI 算力” 的货币化入口。AI 云计算不再只是传统云厂商的 IaaS CPU 与调度软件扩容叙事,而是进入 “算力资产证券化 + 推理经济学 + 半导体涨价链” 的复合周期;最受益的资产通常不是单一 GPU 叙事,而是同时具备供给瓶颈、定价权和现金流可见性的环节。