C114通信网  |  通信人家园

资讯
2025/5/12 15:13

新华三张鸿凌:多维技术创新深化端网协同构建开放多元智算生态

C114通信网  

AI热潮席卷全球的当下,大模型参数规模正以惊人的速度突破万亿级大关。这不仅驱动着算法创新的狂飙,更引发了对AI基础设施全面升级的迫切需求。业界掀起了大规模智算中心的建设浪潮,但多数目光聚焦于以GPU为代表的算力上,忽视了网络联接的价值。

作为网络产业的领军者,近日,新华三集团交换机产品线首席产品经理张鸿凌、新华三集团交换机产品管理部总监陈伯超在接受C114采访时指出,尽管网络投资占比相对较小,但其对整体算力效能和经济收益的影响至关重要,已成为推动智算中心升级的关键变量。相关数据显示,网络性能波动可导致训练效率下降30%,训练时长增加25%。

秉持“算力x联接”理念,新华三集团通过多维度技术创新深化端网协同,为多元智算发展构建开放、高效、智能的联接基础,助力百行百业智能化转型。从推出基于DDC(Diversity Dynamic-Connectivity,多元动态联接)架构的新一代无损网络解决方案,到传统RoCE领域的创新布局,再到全场景定制化智算方案的打造,新华三正以全栈技术能力与开放生态思维,全方位赋能智算发展。

DDC多元+动态联接:构建开放智算生态

当前,DeepSeek、Grok3等开源大模型的参数规模呈指数级跃升,其引发的算力集群通信压力正突破传统网络架构极限。张鸿凌表示,开源战略对网络提出支持多元算力挑战,流量模型对网络冲击加剧,端网协同能力将成为关键支撑。

新华三集团交换机产品线首席产品经理张鸿凌

新华三集团推出基于DDC(Diversity Dynamic-Connectivity,多元动态联接)架构的新一代无损网络解决方案,面万卡级算力互联场景需求,重塑智算中心网络架构。其聚焦“超大规模、极致性能、开放解耦、智能运维”四大技术突破,高效解决智算网络中流量拥塞与调度难题,全面提升智算网络效能。

张鸿凌介绍,DDC架构具备强大的多元算力承载能力,采用端到端调度机制,能根据网络变化迅速、无感知切换,动态联接适配能力出色,高度契合智算场景需求。实测数据显示,基于DDC架构的组网方案相比传统方案有效带宽提升达107%,带宽利用率可媲美InfiniBand网络,且可灵活适配1K至70K节点的多样化集群部署需求。

“对DDC架构的持续探索和升级,不仅代表了技术的革新,更是新华三对智算网络范式的全新定义。其开放解耦的架构突破了传统封闭系统的局限,支持多元算力生态的无缝接入,为AI产业提供可持续发展的联接基础。”张鸿凌表示。

在标准方面,新华三秉持开放共建的理念,携手业界生态伙伴基于OSF(人工智能网络开放调度架构)制定DDC核心框架标准,采用BGP协议发布隧道出口点(TEP),优化AI网络的流量调度能力,重点解决负载均衡、拥塞控制、网络可靠性三大核心问题。“不同设备只要遵循其标准即可实现互联互通,突破传统架构的束缚,构建开放智算生态。”陈伯超补充道。

多维度技术创新:端网协同破智算困局

除DDC架构外,新华三正以多点开花的探索实践,编织更完善的智算网络。张鸿凌提到,在传统RoCE领域,新华三多方面创新布局。在国产算力生态方面,基于多元芯片路线打造包含AI服务器、RoCE交换机及存储全生态的全国产化智算方案。

在端网流量有序协同方面,推出增强CBRC算法,并通过AD-DC智算版智能管控分析平台实现对于智算网络全生命周期运维管理。其核心理念是网络与网卡协同,整合全局信息,进行统一调度,实现更好的流量均衡效果,提高训练效率,减少通信拥塞,保障业务连续性,为智算网络提供更稳定、更智能、更高效的管理体验。

在“算力x联接”融合实践方面,基于端网协同的智算方案,采用新华三全国产智算平台,并结合AD-DC智算版,在实验室进行了测试验证。测试模型基于LIama370B,与传统网络相比,在All to All方面平均性能提升16%以上,效果跟IB网络非常接近。

除了集群内的无损传输外,跨域算力流动同样对网络稳定性提出更严苛挑战。例如,长距传输延迟大、降速周期长导致业务易出现波动等。对此,新华三推出长距RDMA优化方案,加速算力跨域流动。以交换机入口和出口处理为例,在Ingress方向建立RoCE会话流表,出现拥塞时代发拥塞通知报文(CNP);在Egress方向基于流表队列深度检测,发现拥塞事件触发CNP发送。测试表明,在500QP场景下,响应时间可提高超80%,吞吐量提升超10%。代发CNP机制实现了降速周期缩短,快速避免拥塞,且接收端无感知,不影响整体业务的开展。

全场景赋能:提供定制化智算方案矩阵

在百行百业的智能化转型进程中,应用场景的碎片化催生出对算力网络的差异化诉求。从百卡到万卡、从自建到租赁、从专业到入门,既要应对超大规模集群的精密调度,也要实现轻量化部署。这要求厂商具备全栈技术纵深与场景化横向贯通的“柔性能力”。

张鸿凌表示,新华三拥有广泛的客户基础,覆盖数字政府、教育、企业、医疗、互联网等多个行业,客户业务规模涵盖小型、中型及超万卡集群等大型组网场景。针对不同规模客户,新华三提供定制化解决方案:对于大规模客户,依托强大的网元设备能力、优化调优技术及运维管理软件,构建全流程管理机制与快速响应体系,助力高效运维,降低网络中断风险;对于小型客户,则配备专业化整体解决方案及交付团队,提供“交钥匙”式全栈服务,实现一站式高效交付。

同时,根据客户专业程度,新华三实现分级精准赋能。面向具备完整技术团队的专业级客户,提供网络控制平台与设备组合方案,实现网络配置与业务系统的自动化对接,打造“无感化”网络;对于拥有基础运维能力的准专业级客户,可在设备基础上叠加算力调度平台,实现算力与网络资源协同管理;针对入门级客户,提供分析器、基础网管软件及可选的智算版服务。除“自用型”客户,针对租赁型业务客户,新华三基于业务需求提供个性化网络配置,实现灵活的租户分配功能。

采访最后,张鸿凌表示,新华三会继续深耕全域智算产品研发,坚持多元芯片战略,致力于建设开放标准,为行业的智能演进构筑基石。未来,新华三将持续推动智算网络技术创新,加速AI赋能各行各业。

不难看出,当网络从数据通道蜕变为系统级调度中枢,端网协同成为解锁AI生产力的关键。新华三正以开放思维,凭借一系列技术创新与解决方案,不断践行着“算力x 联接”理念。不仅突破了传统技术局限,更构建起开放多元的智算生态,为百行百业的智能化转型铺就一条“无拥塞、无损耗”的智算高速路。

给作者点赞
0 VS 0
写得不太好

  免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2025 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141