C114讯 5月16日消息(水易)从“鹅厂网事”微信公众号获悉,腾讯网络团队在近期启动了自研CPO交换机在现网的规模化部署。
随着生成式AI、超高清视频等技术的爆发式增长,传统数据中心正面临带宽密度、能耗效率和传输时延的“三重瓶颈”。同时AI系统架构也处于持续的变革之中,从单机8卡到超节点,Cable Tray、中板线卡、正交插卡等方案相继被提出,传统互连方案面临铜介质传输距离受限、系统能效低下以及链路可靠性低等诸多难题。
光电合封CPO(Co-Packaged Optics)是将传统外部的光电转换器件变为硅光引擎与逻辑芯片集成在同一基板(Substrate)上,凭借高度集成的光电协同设计,CPO具有支持更高速率、降低功耗、提升可靠性、提升传输距离与集群规模等优势。
早在2022年,腾讯网络团队便启动CPO交换机的研发进程,当年即推出并点亮业界首款25.6T CPO数据中心交换机——Gemini,标志着该技术从实验室走向产业化的重要里程碑。
腾讯Gemini CPO交换机
据介绍,Gemini交换机集成12.8T光引擎(OE),提供16个800G光接口,另外12.8T交换容量通过面板上的32个QSFP112可插拔接口提供。与同样具备25.6T交换容量、128个可插拔接口的4U高度传统交换机相比,Gemini的体积仅为传统交换机的一半,同时功耗降低了26%、传输延迟也降低了20%。
CPO虽具备显著的性能优势,但其现网应用仍面临诸多技术挑战。为此,腾讯网络团队通过系统级架构优化突破性能瓶颈,依托实验室环境完成严苛的性能测试,充分验证了CPO技术在现网部署的可行性。基于前期充分的验证积累,于近期启动了CPO技术的现网规模化部署。
腾讯网络团队介绍,在部署上线过程中,CPO交换机带来诸多优势:CPO交换机凭借光口直出的设计,显著提升了网络建设的效率;CPO低功耗和高密度特性可以在同一机架中部署更多的交换设备,同时有效降低租金电费支出,基于上线后的功耗预估,采用CPO交换机后的电费可节省30%以上。
当然,CPO交换机引入也为网络运营带来了新的考验。CPO OE需要ELS部件提供光源,一旦该部件发生故障,将导致多个光端口同时失效,进而可能引发大范围的网络故障。为了应对这一挑战,网络管理系统新增了采集ELS运行信息的功能,当ELS部件的运行状态信息上传至网络管理系统后,系统会将该数据与CPO直出光端口的收发光情况进行实时交叉验证,从而在ELS部件性能异常或直出光端口异常时提前发出告警,确保网络服务质量。
腾讯网络团队表示,通过在真实运营环境中部署CPO交换机,不仅积累了第一手的建设运维经验,还系统性地采集并分析多维度的运营数据。这一实践不仅可以评估CPO技术在复杂网络场景中的可行性与性能表现,更为后续在更多业务场景中的规模化应用奠定了坚实基础。
原文阅读: