资讯
`
2026/3/17 09:15

CPO现状:从质疑到战略应用还有多远?

0
0

C114讯 3月17日消息(水易)近日,Lightwave刊登由CIR的Lawrence Gasman撰写的《CPO与AI数据中心:从质疑到战略应用》一文,系统梳理了CPO的应用现状。

以下为编译内容:

CPO已成为人工智能数据中心领域最受热议的技术之一。供应商和标准组织正积极将CPO定位为解决AI所面临的带宽、延迟和功耗危机的终极方案。然而,许多用户仍处于困惑之中:他们不确定自己是否真的需要CPO;这项技术是否已经足够成熟;以及部署CPO是否会带来更多运维风险,而非性能收益。CIR最近完成了一项研究,探讨在当前技术前景与用户怀疑并存的背景下,CPO的发展潜力。

在OFC、ECOC,以及在GTC大会上,CPO的演示令人印象深刻。但如果你走进当今大多数数据中心,除少数超大规模设施外,几乎看不到CPO的实际部署。如果你与数据中心管理者交谈,会发现他们普遍谨慎和怀疑的态度,或许整个行业正在悄然为一场可能需要十年才能全面展开的技术转型做准备。

然而,CPO不仅是一个技术故事,更关乎用户心理、风险容忍度、数据中心文化,以及基础设施采购方与其供应商之间关系的深刻变化。

CPO为何重回聚光灯下?

CPO并非新技术。将光子器件与电子器件紧密封装在一起的概念可追溯至多年前,例如IBM在超级计算机互连方面的早期工作,以及Flyover互连概念。真正改变的是AI作为现代数据中心核心工作负载的崛起。在AI热潮之前,CPO被定位为一种广泛适用的创新,可用于传感器、电信、高性能计算和数据中心互连。这种“广撒网”式的定位虽曾引发早期热情,却未能持续激发市场需求。

而AI驱动的需求则更为聚焦。CPO如今被明确视为解决AI数据中心中具体且真实问题的方案:随着行业向112G和224G SerDes演进,以及交换ASIC逼近51.2T乃至更高,电互连正变得损耗过大、功耗过高。在此背景下,CPO的价值主张变得清晰易懂:通过缩短电路径并将光接口移近ASIC,CPO有望实现更高的能效、更高的带宽密度,并为未来超高端口数交换机(从51.2T迈向204.8T)铺平道路。下表总结了业界共识,即CPO最能彰显其优势的应用场景。

来源;CIR

这听起来似乎好得难以置信,但事实或许的确如此。潜在CPO用户的不信任,源于CPO初期比可插拔方案更复杂,且传统数据中心设备的前面板设计比CPO方案更简单、更易于维护。几十年前的网络管理者恐怕难以相信,“可插拔性”竟会如此轻易地被舍弃。不过,若指出可插拔性的消失也可能减少现场故障,或许能重建一些信心。此外,尽管各方都在谈论资本开支(CAPEX)节省,但早期CPO交换机的成本可能高于传统可插拔交换机。

潜在CPO用户:超大规模企业的视角

在数据中心运营商中,对CPO的态度呈现出“着迷”与“不信任”的两极分化。运营商承认CPO在技术上颇具吸引力,但也担心它可能演变为运维噩梦。CIR的研究表明,即使在传统数据中心市场(即非超大规模),对CPO的认知仍然有限。在超大规模环境之外,普通数据中心管理者可能对CPO知之甚少。就连成熟的可插拔光模块供应商也大多如此。

从工程角度来看,当长期目标是扩展到102.4T ASIC时,CPO似乎最为重要。届时,功耗将成为瓶颈,且可能需要“极端”端口密度。这使得CPO本质上成为一项超大规模技术。事实上,微软、Meta、谷歌和亚马逊等公司已在内部开展CPO试验。这并非为试验而试验,他们在寻找任何能在未来帮助他们摆脱更高功耗预算的方法。超大规模企业将CPO视为更广泛架构变革的一部分:Photonic fabrics、更高密度机架,以及将人工智能集群和机架扩展到铜缆所能支持的范围之外的可能性。

从这个意义上说,超大规模企业并不将CPO视为孤立的技术升级,而是下一代AI基础设施的关键使能要素。此外,与企业级数据中心、中小型云服务商及边缘数据中心不同,超大规模企业已习惯于非传统的供应链。它们愿意接受供应商锁定,只要性能提升足够显著。它们拥有议价能力、能够围绕供应商短板进行自主设计的工程团队,甚至常常能要求定制化解决方案。对它们而言,问题不是“我们是否应该部署CPO?”,而是“我们能多快将其工程化?”

企业和托管运营商:给我看可靠性

CIR指出,目前在超大规模环境之外,几乎没有证据表明当前有CPO部署,尽管行业媒体偶尔提及小型用户。即便存在少量小规模部署,也尚未形成足够可见或有影响力的案例。企业、托管运营商及其他中小型运营商的文化与超大规模企业截然不同。

它们并不构建大型专有平台,也很少有工程人员来运行复杂的光集成项目。它们对CPO的态度由另一套优先事项塑造:互操作性、多供应商供应链和现场可维护性。超大规模厂商可能会早早入场,而市场其他部分则等待"验证"、标准化接口和成熟的生态系统。实际上,超大规模企业可能充当行业的“试验场”,而企业和其他小型运营商将成为最终的规模化市场。

“过渡技术”心理:LPO与NPO成为舒适区

与此同时,塑造用户态度的最重要趋势之一是“过渡性”解决方案的兴起。CIR强调,持谨慎态度的潜在CPO用户不会直接从可插拔方案跳到CPO。相反,他们会采用中间架构,如近NPO和LPO。这些技术在不过度牺牲模块化的前提下,提供了降低功耗和改善信号完整性的部分优势。

运营商之所以逐步推进,是因为他们对早期CPO的制造良率、维修/维护模式缺乏信任。NPO和LPO允许他们在不彻底重写运维手册的情况下,尝试更短的电走线、降低DSP开销,并采用新兴的电接口标准。

LPO对关注功耗和延迟的运营商极具吸引力,通过移除DSP,LPO承诺降低功耗和延迟,这对人工智能很有价值。但它也引入了限制:更短的传输距离、更严格的主机要求以及更紧张的信号预算。NPO则在不完全共封装的前提下提供邻近优势,降低了热管理和制造复杂性的风险。

这些过渡技术之所以重要,是因为它们将决定CPO的部署节奏。CPO或许是“终极目标”,但对企业运营商而言,CPO被视为“下一个十年的技术”。许多人认为,即使CPO为终极方案,中间步骤也可以在不承担完全共封装风险的情况下提供益处。

热管理现实与可插拔性的回归

CPO部署中最常被提及的技术障碍是热管理。温度不稳定会导致波长漂移、加速老化和性能退化。将光器件靠近ASIC这一行为本身就带来了与热相关的风险。光器件,尤其是激光器和光子集成电路(PIC)对温度有严格要求。CIR的CPO报告指出,热管理是当前阻碍CPO部署的最大因素之一。

然而,CPO激光器最有趣之处并非其自带的热挑战,而是它可能通过“后门”重新引入可插拔性。目前,OIF推动的外置光源(ELSFP)代表了完全CPO集成与传统模块化光学之间的折中方案。逻辑很简单:激光器会失效、会退化,最好放置在较冷的区域。外部激光源允许在无需干扰交换机ASIC封装的情况下进行更换,从某种意义上说,这是可插拔性的回归。

从用户心理角度看,ELSFP之所以吸引人,是因为它缓解了CPO讨论中挥之不去的“维护焦虑”。然而,外置激光器方案也带来新风险,例如插入损耗,以及单个激光器故障可能影响多个通道的可用性。ELSFP和外部激光架构很可能在推动CPO普及过程中发挥关键作用。

供应商影响力:博通与英伟达塑造观念

用户对CPO的态度也受到其倡导者可信度的影响。值得注意的是,博通和英伟达已成为推动CPO叙事的最具影响力的供应商。博通早期通过其Bailly平台确立了交换ASIC集成的参考点。而英伟达则通过将CPO集成到Spectrum-X和Quantum-X平台并在公开场合展示,将CPO带入主流AI对话。

英伟达的做法尤其值得关注,因为它反映出对运营商关切的深刻理解。其架构包含可拆卸的光学子组件,暗示了一种部分模块化模型。实际上,英伟达似乎在设计CPO系统时就考虑了可制造性和可更换性,承认若完全共封装而无可维护性,将难以被市场接受。

供应商战略之所以重要,是因为用户在确信存在"安全供应商路径"之前,通常不会采用新的基础设施技术。在网络领域,信任往往是品牌驱动的,如果用户相信供应商能通过工程支持和长期产品稳定性来吸收风险,他们就更愿意承担风险。因此,博通和英伟达不仅是供应商,更是CPO的“信心引擎”。

供应链焦虑:“这会不会又是一个锁定陷阱?”

话虽如此,CPO改变了采购模式,这让运营商感到不安。

使用可插拔模块时,运营商可从多家供应商采购,并将其视为可互换的商品。CPO威胁到了这一模式。如果光模块被集成到交换机封装中,运营商将依赖交换机厂商的封装生态系统和更换策略。客户可能无法购买通用的模块,而是需要从单一供应商或合作伙伴那里采购集成的CPO系统。

另一个问题是,CPO可能导致光器件故障时需要更换整块板卡、线路卡,甚至整个交换机组件。这绝非数据中心管理者愿意听到的事实。CPO违背了运维团队的直觉,许多人会将其解读为“伪装成创新的供应商锁定”。

正因如此,OIF和Advanced Photonics Coalition等组织推动的互操作性工作至关重要。用户不仅关注性能,更关注生态系统成熟度和多供应商可信度。

“三步走”推动CPO规模部署

随着运营商在设备测试、供应链、线缆管理和散热等方面建立信心,CPO市场规模将逐步增长。与所有此类技术一样,若CPO成功,其增长将是非线性的。

来源:CIR

第一阶段:从怀疑到接受(2026–2028年)CPO在这一阶段不是主流网络技术,AI网络架构的持续扩展将迫使业界更认真地评估CPO。限制因素将是激光器、封装良率、散热设计和测试等未解决问题。

第二阶段:从接受到依赖(2029–2032年)随着AI集群向100T级扩展,CPO将成为迄今为止唯一可行的技术。用户态度可能从“我们正在评估”转变为“没有它就无法扩展”。

第三阶段:从依赖到优化(2032–2035年)一旦CPO成为主流,讨论焦点将转向“哪家厂商的CPO架构更好”。这将是非超大规模运营商开始大规模部署CPO的时期。

当前,业界对CPO市场的预测对某些人来说可能过于乐观。怀疑者会想起那些早已销声匿迹的网络技术,比如FDDI。CIR认为,一个关键变量是AI本身的演变。如果小型语言模型兴起,对高速互连的需求可能下降,CPO或将沦为小众技术。如果AI工作负载变得分布式或对带宽需求降低,CPO的紧迫性也会减弱。

另一个变数是机架内铜缆的持续演进。英伟达在NVLink中继续使用铜缆,印证了行业长期以来的模式:只有当铜缆失效时,光纤才会被采用。CIR指出,光纤全面接管机架并非必然。光纤将渗透机架,但没人能确定其速度和深度。

结语:CPO一场文化变革

CPO的成功不仅取决于带宽密度和每比特功耗等指标,更取决于运营商是否信任它。目前,用户既感兴趣又持怀疑态度。超大规模企业正向前推进,因为其中一些企业怀疑,即使CPO会颠覆定义了光网络数十年的服务模式,它也将是扩展人工智能网络架构的唯一长期战略。

在未来十年,运营商的态度将从“这看起来风险很大”转变为“这就是现代AI网络的运作方式”。当这一转变发生时,CPO将不再被讨论为一种光通信技术,而会被视为基础设施的必然归宿。

原文链接:https://www.lightwaveonline.com/home/article/55362126/co-packaged-optics-and-the-ai-data-center-from-skepticism-to-strategic-adoption

版权说明:C114刊载的内容,凡注明来源为“C114通信网”或“C114原创”皆属C114版权所有,未经允许禁止转载、摘编,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。编译类文章仅出于传递更多信息之目的,不代表证实其描述或赞同其观点;翻译质量问题请指正

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销