移动平台
`
2025/9/12 08:19
阿里云王鹏:可插拔光模块是短期最优解,NPO相比CPO可能落地更快
0
0

C114讯 9月12日消息(九九)在昨日上午举行的“2025中国国际光电高峰论坛—超万卡智算集群新型光技术发展论坛”上,阿里云计算有限公司光网络架构师王鹏发表题为《超大规模智算集群光互联演进技术及思考》的主旨演讲。

随着大模型崛起,算力狂飙,超大规模集群涌现。王鹏指出,超大规模智算集群特征是算力密度极高、通信密集型负载、训练任务周期长、系统复杂度爆表、能耗与成本敏感、高带宽与低延迟互联。

超大智算集群的光互联需要在带宽密度、能效、时延、成本以及可靠性之间寻找平衡,“可插拔光模块是短期最优解,中长期NPO/CPO会成为部署关键,终极方案可能是光电芯片融合。”王鹏说。

王鹏认为,CPO相比可插拔光模块会带来产业链的关键环节转移,传统光模块制造商需要在CPO产业链中找到新的定位。系统组装/生产厂商需要承担更多CPO散热、光学耦合以及性能和可靠性测试等工作,此外,封装工艺复杂性、互操作生态、系统可靠性、可量产程度、现场维护性等均需要更多时间解决。

王鹏介绍,阿里云基于400G以太网的智算集群2023年开始规模上线,支持千卡~十万卡GPU灵活部署;基于800G以太网的智算集群将于2026年开始规模上线,支持千卡~十万卡GPU灵活部署。

在演讲中,王鹏还介绍了阿里云的光模块演进路径。从2014年设计40G光模块,到2017年批量交付100G光模块,2021年和2022年,阿里云实现传统数据中心和智算中心的200G光模块批量交付。2023年,400G光模块批量交付。预计2025年在智算中心导入800G光模块,2026年开始导入1.6T光模块。

在光模块技术方案上,Q112 400G及以下速率,采用单多模混布策略,VCSEL/SiPh/EML为主,LPO小批量部署;OSFP 800G (单波100G),采用单多模混布策略,VCSEL/SiPh/EML为主,LPO/LRO技术储备;OSFP 1.6T(单波200G),预计单模技术为主流应用,SiPh和EML方案为主,LPO/LRO技术储备;3.2T光模块暂未启动预研,预计单模技术为主流应用,SiPh和EML方案为主,LPO/LRO/NPO/CPO技术储备。

王鹏最后总结说,近3年内,阿里云智算架构主要聚焦400G、800G、1.6T光模块的批量部署应用。可插拔光模块仍是短中期主力方案,NPO相比CPO可能落地更快,技术演进需循序渐进,避免“为了CPO而CPO”,在带宽、功耗、成本、可靠性之间找到最优解,才是业务发展的主流选择。只有产业协同,才能让光互联真正从“连接”走向“赋能”,支撑AI时代的算力革命。

 

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销