移动平台
`
2025/9/5 17:40
对话新华三:以开放多元智算 为AI狂飙构建坚实底座
0
0

C114讯 9月5日专稿(艾斯)“网络已成为决定算力收益的重要因素,AI算力发展对下一代智算网络提出了关键挑战。”新华三集团高级副总裁、网络产品线总裁乔剡在近日于南京举行的第九届未来网络发展大会上提出,智算时代打破了过去“计算”与“网络”相对割裂的生态,网络性能对于实现算力业务能力提升的巨大撬动作用不容忽视。

在智算数据中心的整体投资中,网络投资占比仅为10%左右。但研究显示,网络性能波动可导致训练效率下降30%,训练时长增加25%。仅以千卡H100集群为例,每天的停机成本就高达30万元以上。

这是乔剡在接受C114等媒体采访时给出的一组直观数据,也是新华三从去年开始提出“算力×联接”技术理念的核心原因之一。在这当中,算力与联接不是简单的加法关系,而是倍增的乘法效应。网络性能的优化能够显著放大算力集群的整体输出效能,这正是新华三智算网络发展战略的理论基础。

图:新华三集团高级副总裁、网络产品线总裁乔剡

以网强算:算力与联接的乘法效应

2024年初,中国日均Token的消耗量为1000亿,截至今年6月底,我国日均Token消耗量已突破30万亿,一年半时间增长了300多倍。在中国AI应用规模快速增长的背后,依托的是国内算力规模的迅速飙升。根据IDC预测,2025年中国智能算力规模将达1037.3 EFLOPS,同比增长超40%,持续领跑全球。

需要看到的是,“智算网络正面临全新挑战:一方面,单集群规模跃升,要求网络在端口密度、带宽/径向与收敛时延上同步演进;另一方面,流量模型更加复杂多变,要求网络高效灵活,端网协同能力将成为关键支撑;此外,开源趋势加速生态扩展,算力类型愈加多样,网络需支持平滑接入。”乔剡在上述大会主论坛发表主旨演讲时指出。

如果我们将智算数据中心类比为一个庞大的交响乐团,那么投资占比最高的GPU便是一个个技艺超群的演奏家,而高速互联网络负责的则是指挥家和演奏家之间精准的意念传递与默契。切换到现实环境,纵使手握万卡GPU,但如果这些算力资源因网络带宽低、延迟高,通信时间远超计算时间,GPU大部分时间都在空闲等待,无法高效合理运作和配置,那么这无疑将是一种巨大的成本浪费。

在国内市场,新华三是少有的同时在“计算”与“网络”两个领域都非常擅长的企业之一,这也是其能够提出“算力×联接”理念,致力于通过多元异构、软硬协同的技术路径实现“以网强算”的底气。

“依托新华三多年来的技术积累与产品工程实践,以及与各个行业的深入合作经验,我们希望通过‘算力×联接’的方式,为客户提供端到端完整的多元异构基础设施解决方案,充分发挥技术和产品以及我们跨部门的协同算力优势。”乔剡称,业界已越来越意识到网络在AI基础设施里面的重要性。

据其介绍,面对多元化的国产算力卡发展环境,新华三正积极参与产业链当中,目前已完成与多家主流厂商算力卡的适配,并推出20多款不同形态和架构的服务器,通过部署实践一步步验证与打磨出适合国内多元异构的算力生态。新华三这种开放策略不仅降低了生态门槛,也有助于推动行业整体水平的提升。

工程经验:从一颗芯片变成好用的产品

本届未来网络发展大会,新华三重点展出了包括51.2T CPO硅光交换机、800G国芯智算交换机以及基于DDC(Diversified Dynamic-Connectivity,多元动态联接)架构的新一代无损网络解决方案等,这些产品所对应的正是该公司对其“算力×联接”技术理念的躬身践行。

尤其值得注意的是,新华三在此次活动期间正式发布了基于最新102.4T芯片研发的高性能800G AI交换机H3C S9828-128EP。该产品具备128个800G端口,为当前业内单机容量最高,可在两层Spine-Leaf架构下支持10K+800G端口,相比上一代产品节省70%的设备用量和50%的光模块用量。此外,H3C S9828-128EP全部端口均支持 LPO/LRO 光模块,不仅实现了超低时延传输,还大幅降低能耗,助力绿色节能。

“虽然我们不制造芯片,但是对于全球众多的先进芯片合作伙伴来说,我们的工程经验在产品化环节中具有重要价值。这是因为,从一颗芯片变成一个可用的产品,这中间有一条非常长的路要走,是一个非常复杂的系统工程,而这恰恰是我们新华三所擅长的。”当我们问及新华三如何能够站在技术发展最前沿,并将先进的技术理念转变为具体的产品方案实现落地时,乔剡给出了这样一个让人印象深刻的答案。

这一点也体现在该公司创新提出的DDC架构上——在InfiniBand和RoCE之外,DDC架构为行业提供了新的技术可能性。据了解,DDC架构依托信元转发技术将数据按512字节切片均匀喷洒,彻底消除HASH极化,实现100%负载均衡;在网络边缘侧完成切片重组,使网卡无需支持乱序重排,即可实现多元算力的平滑接入与免调优,实现算力与网络的彻底解耦。实测结果显示,DDC架构在有效带宽方面相比ECMP最高提升107%;在All-to-All场景下,传输性能较InfiniBand 方案平均提升2.5%,且在传输大消息数据时表现更佳。

新华三集团交换机产品线产品管理部部长陈伯超进一步补充了该公司利用“端网协同”释放算力潜能方面的成功实践。他谈到,新华三端网协同方案通过有序分配熵值与增强的CBRC算法,实现了更智能的网络调度。其AD-DC智算版智能管控分析平台可为集群提供全生命周期保障,将万卡集群上线周期从数周压缩至数天,并支持自动化性能验证与故障实时监控。该方案已在50余款新华三交换机及多家GPU、网卡厂商的联合验证中成功运行 Llama3模型,网络性能平均提升16%,防拥塞效果提升20%。

Scale-up:已确定的巨大商业机会

毫无疑问,AI领域的Scaling Law依然持续发挥着重要作用,2025年以来全球Hyperscale’s持续增加的资本开支便是明证。与此同时,随着摩尔定律逐渐失效,单芯片性能逼近极限,传统单机8卡服务器的GPU互联、适配、能耗等挑战日渐突出,难以满足参数规模不断扩大的模型训练和推理。

基于Scale-up的超节点技术可以实现单机柜更高密度GPU的直接互联通信,将充分提升算力卡的计算效能,减少GPU闲置,显著提升训推效率。因此,在基于网络互联的Scale-Out之外,Scale-up正愈发受到行业关注。

乔剡在采访中肯定了Scale-up超节点技术的发展趋势,并表示新华三在这方面已有相应规划。“从大的趋势上来看,未来一两年内,Scale-up将会快速增长,Scale-Out也会协同发展,两者不是此消彼长的关系。”他认为,对于一些中小型算力服务提供商或者构建私域本地化AI应用的大型企业来说,超节点将会是一种非常重要的高性能解决方案。

C114了解到,在不久前的WAIC 2025, 新华三已发布全新H3C UniPoD系列超节点产品——基于其在网络联接领域的深厚积累,新华三结合不同品牌GPU的性能与架构特点,开发了基于以太协议和PCIe协议的双技术路线超节点产品,可实现单机柜最高64卡GPU间的高速互联互通,从而大幅提升单节点计算效能,打造万亿级参数大模型训推的强劲算力引擎。

实际上,超节点不是网络、算力、存储的叠加,最终的工程化落地需要厂商具备端到端协同的解决方案能力。乔剡亦指出,Scale-up与Scale-Out在协同发展的同时,将会涌现出大量创新与部署实践,这当中涉及到计算、联接等一整套跨界的复杂技术体系,而这正是新华三的核心竞争力所在。

根据Light Counting相关报告数据,当前Scale-up交换机市场规模已超越以太网和InfiniBand总和,并且该研究公司指出,凭借更高的带宽密度和可靠性,CPO将成为Scale-up网络互连的最佳选择。显然,在面对Scale-up这一巨大商业机会之时,新华三已做好全面准备。

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销