
CPO Mass Production Ignites AI Compute Infrastructure Revolution: Are Silicon Photonics and Interconnects the Biggest Winners?
天风证券指出,CPO 技术已正式进入量产阶段,英伟达全球首款 CPO 以太网交换机已全面量产并集成至 Vera Rubin 平台,博通则从 51.2T Bailly 向 102.4T Davisson 持续迭代。两大巨头均选择台积电 COUPE 硅光 3D 堆叠方案,该技术可将系统能耗降至 2 pJ/bit 以下,较传统可插拔方案提升能效最高 5 倍。
AI 数据中心对带宽和能效的需求持续攀升,驱动光互连技术走到了一个关键节点。
天风证券于 4 月 16 日发布的行业深度报告《CPO 通信器件深度剖析》指出,CPO(共封装光学)交换机已正式进入量产阶段,英伟达与博通双双落地商业产品,台积电 COUPE 硅光平台成为底层核心架构。
为什么 CPO 如此重要?简单来说,传统光模块是"插在交换机外面的",信号要绕一大圈;CPO 则是把光引擎直接封装进交换机芯片旁边,信号路径从几十厘米缩到几毫米。天风证券报告援引英伟达数据显示,这一改变将插入损耗从 22dB 大幅降低至约 4dB,信号完整性提升 63 倍,系统光功率效率最高提升 5 倍,网络韧性提升 10 倍。
英伟达双平台落地,Spectrum-X 首款 CPO 以太网交换机全面量产
天风证券报告显示,英伟达在 GTC 2025 上首次发布 Quantum-X Photonics 与 Spectrum-X Photonics 两条 CPO 产品线。
Spectrum-X 方面,其 CPO 交换芯片已进入全面量产阶段。作为全球首款全面集成的 512 lane 200G-capable CPO 以太网交换机系统,已集成至 Vera Rubin 平台中的 Spectrum-6 SPX 网络机架,采用 102.4 Tb/s 交换芯片。
能效是这一方案的核心卖点。报告援引数据称,传统 1.6Tbps 可插拔光模块功耗约 30W,其中超过一半消耗于 DSP。英伟达 CPO 方案通过将硅光器件直接集成至交换机封装内部并取消 DSP 结构,在系统层面实现了最高可达5 倍的光功率效率提升,以及10 倍的网络韧性提升;同时减少激光器数量约 4 倍,降低运营成本与网络中断风险。
Quantum-X方面,液冷交换机系统 Q3450 搭载四颗 Quantum-X ASIC,总计 144 个 MPO 物理端口,整机全双工带宽达115.2Tbps,单颗 ASIC 吞吐能力 28.8Tbps。每颗 ASIC 集成 18 个光引擎,每个光引擎可提供 1.6Tbps 带宽。


博通:从 Bailly 到 Davisson,能效提升超 3.5 倍
博通则是最早实现支持 CPO 系统的厂商之一,在英伟达加入之前,也是唯一一个发布了配备 CPO 生产系统的厂商。
其 Tomahawk 5 – Bailly(TH5-Bailly)为业内首个量产 CPO 解决方案,整机带宽 51.2Tbps,集成 8 个光引擎,每个光引擎带宽 6.4Tbps,对应 64 条 100Gbps 通道。
代际升级方面,博通推出 Tomahawk 6 – Davisson(TH6-Davisson)102.4Tbps CPO 交换平台,单调制器速率达 200Gbps,较 Bailly 翻倍。报告称,该平台相比传统可插拔光模块方案,光互连功耗降低约 70%,系统能效提升超过 3.5 倍。
值得关注的是,博通早期曾多次迭代采用 SPIL 开发的扇出晶圆级封装(FOWLP)方案,但由于寄生电容较大,单通道速率难以扩展至 100Gbps 以上。为此,博通转向基于台积电 COUPE 技术的封装架构,以进一步降低信号调理需求并最大限度减少迹道损耗和反射。

台积电 COUPE 硅光:双巨头共同押注的技术底座
为什么英伟达和博通都选择了同一家供应商的同一套方案?
报告指出,COUPE(紧凑型通用光引擎)是台积电基于 SoIC 3D 混合键合技术构建的硅光平台,核心在于通过晶圆级垂直堆叠,将电子集成电路(EIC)直接键合至光子集成电路(PIC)之上。
可以做一个简单类比:传统方案中,PIC 和 EIC 之间的电信号连接就像隔着一条走廊喊话,能量损耗大、速度慢;而 COUPE 的 3D 键合相当于两块芯片直接贴合对话,路径极短、损耗极低。
报告援引台积电数据显示,与其他键合方法相比,SoIC 混合键合使 PIC-EIC 接口组合密度提升至少 16 倍,寄生电容降低约85%,在相同功耗条件下可实现约40% 的能耗下降或最高 170% 的速度提升;3 dB 带宽仿真数据显示可超过 100 GHz。
从系统能效角度,传统铜互连系统功耗通常超过 30 pJ/bit,传统可插拔光模块亦在 10 pJ/bit 以上;而基于 COUPE 完全集成的光学引擎,单位能耗可降至2 pJ/bit 以下,同时延迟降低超过 95%。

报告还指出,在量产落地阶段,随着 CPO 封装向大尺寸与多光引擎整合演进,具备系统级先进封装能力的 OSAT 厂商可能参与后段整合。天风证券称,"日月光已展示可在>75mm × 75mm 封装中整合多个光学引擎与 ASIC,实现<5 pJ/bit 功耗并提升带宽,因此,COUPE 路径下的 CPO 封装落地存在由日月光等厂商承接的可能。"

高密度互连器件:FAU 需求翻倍,MPO/MPC 突破空间极限
CPO 带来的不只是芯片层面的变化,还有一个容易被忽视的难题:上千根光纤怎么走线。
CPO 交换机内部有超过 1000 根光纤需要走线和管理,光纤耦合与高密度互连器件的重要性因此大幅提升。以英伟达 X800-Q3450 为例,天风证券报告指出,超过 1000 根光纤从光引擎中引出,"造成了重大的组织挑战"。这直接带动了一批光学阵列器件的需求。
天风证券报告指出,光纤阵列单元(FAU)被广泛用于辅助 CPO 中至关重要的光纤耦合过程,以低插入损耗将来自硅透镜的光耦合到光纤中。据电子发烧友网引用数据,在 CPO 应用场景中,单台 CPO 交换机所需 FAU 数量可达传统方案的 3 至 5 倍。博通已在其 Bailly CPO 交换平台中集成康宁(Corning)提供的精密光纤阵列(FAU)。
在连接器层面,报告介绍了两类关键产品:
MPO 连接器:可同时完成多芯光纤的并行传输,大幅提升布线密度。SENKO 的 MPO EZ-Way 连接器采用更低矮的外形设计,与传统 MPO 连接器相比,可在光模块接口上安装的 MPO 连接器数量增加一倍。
MPC 连接器:专为 CPO 和高速数据中心应用设计的光纤到芯片直连方案,通过微镜阵列将光直接耦合到芯片,连接器高度可降至 0.6mm,将插入损耗降至最低。
此外,报告还提到,OIF 正通过制定 3.2T CPO 模块实施协议,推进多平面互连中的光接口一致性与外部激光源的模块化,以期构建开放的 CPO 生态系统。

外部激光源:可换模块解决可靠性痛点
传统数据中心光学系统中,激光器反复经历热循环,是导致故障和网络中断的主要原因之一。CPO 的解决方案是把激光器"请出来",集中放置在独立温控环境中。
天风证券报告介绍,英伟达 Quantum-X Photonics 配备 18 个外部激光源(ELS),每个 ELS 模块包含 8 个独立激光发射器,整机共 144 个。每个激光器支持 4×200Gbps 通道,单 MPO 连接器总带宽 800Gbps。
关键优势在于:激光器集中部署后,与传统设计相比"数据中心内激光器总数减少了四倍",且每个 ELS 模块支持现场更换,"不影响周边交换机基础设施"。天风证券报告援引英伟达数据称,这使网络韧性提升 10 倍。

BOM 成本拆解:7 万美元一台,光引擎与混纤盒是最大成本项
一台 CPO 交换机到底值多少钱?天风证券报告给出了详细拆算。
以英伟达 X800-Q3450 为例:
-
光引擎:每个单元完整组装(含光纤连接单元)成本约 1000 美元,仅光引擎总物料成本即达35,000 至 40,000 美元(针对 3.2T 光引擎版本);
-
混纤盒:用于组织超过 1000 根光纤,处理数千根光纤的 X800-Q3450,混纤盒采购成本将超过3000 美元;
-
BOM 总成本:含 2000 米光纤及其他杂项组件,合计约70,640 美元;
-
终端售价估算:假设毛利率 60%,售价约 176,600 美元,加上三年服务与保修分配的 28,256 美元,含服务总售价约 204,856 美元;
-
总功耗:3,548 瓦。
报告提示,上述成本估算基于当前生产规模,随着产量扩大可能有所改善。

