CPO Mass Production Ignites AI Compute Infrastructure Revolution: Are Silicon Photonics and Interconnects the Biggest Winners?

天风证券指出，CPO 技术已正式进入量产阶段，英伟达全球首款 CPO 以太网交换机已全面量产并集成至 Vera Rubin 平台，博通则从 51.2T Bailly 向 102.4T Davisson 持续迭代。两大巨头均选择台积电 COUPE 硅光 3D 堆叠方案，该技术可将系统能耗降至 2 pJ/bit 以下，较传统可插拔方案提升能效最高 5 倍。

AI 数据中心对带宽和能效的需求持续攀升，驱动光互连技术走到了一个关键节点。

天风证券于 4 月 16 日发布的行业深度报告《CPO 通信器件深度剖析》指出，CPO（共封装光学）交换机已正式进入量产阶段，英伟达与博通双双落地商业产品，台积电 COUPE 硅光平台成为底层核心架构。

为什么 CPO 如此重要？简单来说，传统光模块是"插在交换机外面的"，信号要绕一大圈；CPO 则是把光引擎直接封装进交换机芯片旁边，信号路径从几十厘米缩到几毫米。天风证券报告援引英伟达数据显示，这一改变将插入损耗从 22dB 大幅降低至约 4dB，信号完整性提升 63 倍，系统光功率效率最高提升 5 倍，网络韧性提升 10 倍。

英伟达双平台落地，Spectrum-X 首款 CPO 以太网交换机全面量产

天风证券报告显示，英伟达在 GTC 2025 上首次发布 Quantum-X Photonics 与 Spectrum-X Photonics 两条 CPO 产品线。

Spectrum-X 方面，其 CPO 交换芯片已进入全面量产阶段。作为全球首款全面集成的 512 lane 200G-capable CPO 以太网交换机系统，已集成至 Vera Rubin 平台中的 Spectrum-6 SPX 网络机架，采用 102.4 Tb/s 交换芯片。

能效是这一方案的核心卖点。报告援引数据称，传统 1.6Tbps 可插拔光模块功耗约 30W，其中超过一半消耗于 DSP。英伟达 CPO 方案通过将硅光器件直接集成至交换机封装内部并取消 DSP 结构，在系统层面实现了最高可达5 倍的光功率效率提升，以及10 倍的网络韧性提升；同时减少激光器数量约 4 倍，降低运营成本与网络中断风险。

Quantum-X方面，液冷交换机系统 Q3450 搭载四颗 Quantum-X ASIC，总计 144 个 MPO 物理端口，整机全双工带宽达115.2Tbps，单颗 ASIC 吞吐能力 28.8Tbps。每颗 ASIC 集成 18 个光引擎，每个光引擎可提供 1.6Tbps 带宽。

博通：从 Bailly 到 Davisson，能效提升超 3.5 倍

博通则是最早实现支持 CPO 系统的厂商之一，在英伟达加入之前，也是唯一一个发布了配备 CPO 生产系统的厂商。

其 Tomahawk 5 – Bailly（TH5-Bailly）为业内首个量产 CPO 解决方案，整机带宽 51.2Tbps，集成 8 个光引擎，每个光引擎带宽 6.4Tbps，对应 64 条 100Gbps 通道。

代际升级方面，博通推出 Tomahawk 6 – Davisson（TH6-Davisson）102.4Tbps CPO 交换平台，单调制器速率达 200Gbps，较 Bailly 翻倍。报告称，该平台相比传统可插拔光模块方案，光互连功耗降低约 70%，系统能效提升超过 3.5 倍。

值得关注的是，博通早期曾多次迭代采用 SPIL 开发的扇出晶圆级封装（FOWLP）方案，但由于寄生电容较大，单通道速率难以扩展至 100Gbps 以上。为此，博通转向基于台积电 COUPE 技术的封装架构，以进一步降低信号调理需求并最大限度减少迹道损耗和反射。

台积电 COUPE 硅光：双巨头共同押注的技术底座

为什么英伟达和博通都选择了同一家供应商的同一套方案？

报告指出，COUPE（紧凑型通用光引擎）是台积电基于 SoIC 3D 混合键合技术构建的硅光平台，核心在于通过晶圆级垂直堆叠，将电子集成电路（EIC）直接键合至光子集成电路（PIC）之上。

可以做一个简单类比：传统方案中，PIC 和 EIC 之间的电信号连接就像隔着一条走廊喊话，能量损耗大、速度慢；而 COUPE 的 3D 键合相当于两块芯片直接贴合对话，路径极短、损耗极低。

报告援引台积电数据显示，与其他键合方法相比，SoIC 混合键合使 PIC-EIC 接口组合密度提升至少 16 倍，寄生电容降低约85%，在相同功耗条件下可实现约40% 的能耗下降或最高 170% 的速度提升；3 dB 带宽仿真数据显示可超过 100 GHz。

从系统能效角度，传统铜互连系统功耗通常超过 30 pJ/bit，传统可插拔光模块亦在 10 pJ/bit 以上；而基于 COUPE 完全集成的光学引擎，单位能耗可降至2 pJ/bit 以下，同时延迟降低超过 95%。

报告还指出，在量产落地阶段，随着 CPO 封装向大尺寸与多光引擎整合演进，具备系统级先进封装能力的 OSAT 厂商可能参与后段整合。天风证券称，"日月光已展示可在>75mm × 75mm 封装中整合多个光学引擎与 ASIC，实现<5 pJ/bit 功耗并提升带宽，因此，COUPE 路径下的 CPO 封装落地存在由日月光等厂商承接的可能。"

高密度互连器件：FAU 需求翻倍，MPO/MPC 突破空间极限

CPO 带来的不只是芯片层面的变化，还有一个容易被忽视的难题：上千根光纤怎么走线。

CPO 交换机内部有超过 1000 根光纤需要走线和管理，光纤耦合与高密度互连器件的重要性因此大幅提升。以英伟达 X800-Q3450 为例，天风证券报告指出，超过 1000 根光纤从光引擎中引出，"造成了重大的组织挑战"。这直接带动了一批光学阵列器件的需求。

天风证券报告指出，光纤阵列单元（FAU）被广泛用于辅助 CPO 中至关重要的光纤耦合过程，以低插入损耗将来自硅透镜的光耦合到光纤中。据电子发烧友网引用数据，在 CPO 应用场景中，单台 CPO 交换机所需 FAU 数量可达传统方案的 3 至 5 倍。博通已在其 Bailly CPO 交换平台中集成康宁（Corning）提供的精密光纤阵列（FAU）。

在连接器层面，报告介绍了两类关键产品：

MPO 连接器：可同时完成多芯光纤的并行传输，大幅提升布线密度。SENKO 的 MPO EZ-Way 连接器采用更低矮的外形设计，与传统 MPO 连接器相比，可在光模块接口上安装的 MPO 连接器数量增加一倍。

MPC 连接器：专为 CPO 和高速数据中心应用设计的光纤到芯片直连方案，通过微镜阵列将光直接耦合到芯片，连接器高度可降至 0.6mm，将插入损耗降至最低。

此外，报告还提到，OIF 正通过制定 3.2T CPO 模块实施协议，推进多平面互连中的光接口一致性与外部激光源的模块化，以期构建开放的 CPO 生态系统。

外部激光源：可换模块解决可靠性痛点

传统数据中心光学系统中，激光器反复经历热循环，是导致故障和网络中断的主要原因之一。CPO 的解决方案是把激光器"请出来"，集中放置在独立温控环境中。

天风证券报告介绍，英伟达 Quantum-X Photonics 配备 18 个外部激光源（ELS），每个 ELS 模块包含 8 个独立激光发射器，整机共 144 个。每个激光器支持 4×200Gbps 通道，单 MPO 连接器总带宽 800Gbps。

关键优势在于：激光器集中部署后，与传统设计相比"数据中心内激光器总数减少了四倍"，且每个 ELS 模块支持现场更换，"不影响周边交换机基础设施"。天风证券报告援引英伟达数据称，这使网络韧性提升 10 倍。

BOM 成本拆解：7 万美元一台，光引擎与混纤盒是最大成本项

一台 CPO 交换机到底值多少钱？天风证券报告给出了详细拆算。

以英伟达 X800-Q3450 为例：

光引擎：每个单元完整组装（含光纤连接单元）成本约 1000 美元，仅光引擎总物料成本即达35,000 至 40,000 美元（针对 3.2T 光引擎版本）；
混纤盒：用于组织超过 1000 根光纤，处理数千根光纤的 X800-Q3450，混纤盒采购成本将超过3000 美元；
BOM 总成本：含 2000 米光纤及其他杂项组件，合计约70,640 美元；
终端售价估算：假设毛利率 60%，售价约 176,600 美元，加上三年服务与保修分配的 28,256 美元，含服务总售价约 204,856 美元；
总功耗：3,548 瓦。

报告提示，上述成本估算基于当前生产规模，随着产量扩大可能有所改善。