算力争夺战升级:OpenAI 绕开英伟达、携手博通打造专属推理芯片,成本降低约 50%

Wallstreetcn
2026.06.24 13:14

剑指算力霸权!OpenAI 携博通推首款自研 AI 推理芯片,创 9 个月极速流片纪录。新片专攻大模型降本增效,拟 2026 年吉瓦级量产。OpenAI 藉此实现基础设施 “全栈掌控”,前沿巨头造芯潮正重塑全球算力竞争格局。

OpenAI 与博通(Broadcom,纳斯达克:AVGO)联合推出首款专属 AI 推理芯片 Jalapeño,标志着全球顶级 AI 实验室争夺算力控制权的竞赛进入新阶段。这款芯片从设计到流片仅历时九个月,可能创下高性能先进半导体领域最快 ASIC 开发纪录,其能效表现大幅领先现有最先进水平。

两家公司 6 月 24 日联合宣布,Jalapeño 专为大型语言模型(LLM)推理任务设计。早期测试数据显示,该芯片每瓦性能"大幅优于当前最先进水平",在同等算力输出下可显著降低运营成本,直接回应外界对 AI 推理开销居高不下的核心关切。工程样片已在实验室以生产目标频率和功耗运行包括 GPT-5.3-Codex-Spark 在内的机器学习任务。

Jalapeño 将于 2026 年底开始在数据中心合作伙伴处以吉瓦(gigawatt)级规模部署,合作方包括微软。博通首席执行官 Hock Tan 表示,两家公司已制定多代芯片路线图,下一代产品预计 2028 年推出,此后每年迭代一次。发布会上,博通总裁兼首席执行官 Hock Tan 与半导体解决方案总裁 Charlie Kawwas,将首批芯片交付给 OpenAI 首席执行官 Sam Altman 与总裁 Greg Brockman。

领导 OpenAI 硬件项目的 Richard Ho 表示,Jalapeño 代表着 OpenAI"对基础设施所有层级施加控制"这一系列战略举措的起点——从产品到模型,如今延伸至芯片。Hock Tan 同时预判,随着时间推移,每一家前沿模型创造者都将打造其专属 AI 加速器。

九个月流片:或创高性能半导体最快开发纪录

Jalapeño 从初始设计到制造流片仅历时九个月,OpenAI 与博通均表示,这可能是高性能先进半导体领域迄今最快的 ASIC 开发周期。

这一速度源于多方协同:OpenAI 工程团队的软硬件深度协同开发、博通的芯片实现专业能力,以及 OpenAI 自身模型被用于加速芯片设计与优化流程。换言之,服务于用户的 AI 模型,已被反向用于支撑未来模型运行的基础设施研发——这一闭环意味着,若 AI 能够帮助工程师更快设计出更优芯片,整个行业的算力成本将随之下降。

除博通负责芯片实现和网络技术外,Celestica 参与了电路板、机架、系统集成及可扩展生产系统的开发,共同推动该平台走向大规模量产。

专为 LLM 推理优化:兼顾吞吐量与低延迟

与从早期 AI 工作负载改造而来的通用加速器不同,Jalapeño 是针对现代 LLM 推理进行的全新设计,直接围绕 ChatGPT、Codex、API 及未来智能体产品的日常运行模式构建,同时亦适配行业内当前及未来各类 LLM 的需求。

在架构层面,该芯片通过减少数据移动量来提升性能,并围绕顶级 AI 模型最关键的计算、内存与网络资源使用模式进行专项优化,使实际利用率更贴近理论峰值性能。博通的 Tomahawk 网络芯片技术为其大规模量产部署提供支持。

OpenAI 的设计目标,是在单一架构中同时实现当今领先 AI 加速器的算力与吞吐量,以及接近最快专用推理系统的低延迟表现。Richard Ho 表示,尽管 Jalapeño 当前聚焦推理,但"这是一款非常通用的设备","能够应对未来的 LLM 创新"。就外部开放性而言,OpenAI 表示将对是否允许其他模型厂商使用该芯片保持灵活态度。

多代路线图:2028 年迭代,逐年推进

Hock Tan 确认,两家公司已制定未来芯片路线图,下一代产品预计 2028 年推出,此后每年迭代一次。Jalapeño 目前聚焦推理工作负载,但 OpenAI 可能在未来代际产品中考虑纳入其他工作负载类型。

从部署规模看,Jalapeño 将与 OpenAI 设计的加速器、博通的芯片实现与网络互联技术,以及 Celestica 的系统集成能力共同构成多代计算平台,首批部署目标定于 2026 年底完成。

Greg Brockman 将 Jalapeño 定位为"长期全栈基础设施战略"的组成部分,目标是使算力更加充裕,令 AI"更快、更可靠、更实惠,能够被更多人和企业所用,并被用于解决更重要的问题"。

全栈掌控:自研芯片重塑算力竞争格局

对 OpenAI 而言,自研芯片是其将基础设施控制权从产品与模型层延伸至芯片层的关键一步。Richard Ho 表示,Jalapeño 代表这一系列举措的起点,意在"对所有基础设施层级施加控制"。

在资金层面,OpenAI 今年早些时候完成了 1220 亿美元融资,部分用于支持芯片、数据中心和人才方面的高额投入。据报道,该公司此前还与 Nvidia 和 AMD 等供应商签订融资协议,但相关安排因被批评具有"循环性质"而引发外界争议。

Hock Tan 对行业趋势的判断则更为直接:"归根结底,每一家前沿模型创造者——目前在中国以外为数不多——但随着时间推移,每一家都将创造其最优、定制化的 AI 加速器和网络。"这一判断预示,随着更多大型 AI 实验室走上自研芯片之路,通用 GPU 供应商的市场格局或将面临更深层的结构性重塑。