在由上海电信主办的“云网启智,畅想未来”的分论坛上,华为数据通信产品线城域路由器首席架构师任广涛分享了题为“面向AI WAN的智算IP广域网助力企业高效用算”的演讲。任广涛指出,随着AI技术的普及和深入应用,数据和算力需求急剧增长,传统网络无法满足智算业务的需求。华为推出星河AI智算IP广域网解决方案,具备“极速”运力和“极高”安全的智算业务承载能力,支撑智算互联、用户一跳入算、数据高效流通等训练和推理等新业务场景,实现“算网边端”的高效协同,满足千行百业高效用算需求。
华为数据通信产品线城域路由器首席架构师任广涛发表演讲
Deepseek的出现进一步催生模型微调需求,为了满足训推业务带来的算力增长要求,企业通过自建加租用的方式,兼顾算力规模灵活扩展和减少企业成本投资。同时企业要求广域网络提供安全、可靠的传输方案满足存算拉远、分布式模型微调带来的隐私计算诉求。数据是人工智能的核心要素,样本传输、模型同步等业务场景催生大批数据传输,传统线下硬盘搬运模式效率低,风险高;广域网络需要提供弹性、高吞吐网络能力满足企业模型敏捷部署以及海量样本上传的需求。在跨DC协同训练场景中,算力卡之间的通讯距离扩展到几百甚至上千公里,数据丢包会直接带来训练效率的大幅下降,广域网络需要具备高可靠的传输方案。
任广涛指出,华为推出的面向AI WAN的智算IP广域网解决方案具备高运力、泛在灵活接入、长距无损和任务式服务的IP网络能力。通过部署华为星河AI路由器,可以为各行业提供高效、安全、无损的数据传输环境,为行业数智化转型提供网络支撑。在存算拉远场景中,数据安全是关键,通过部署星河路由器,解决RDMA流量在广域负载分担和无损传输的挑战,算效达到97%以上,达成数据不落盘目标;在分布式推理场景中,星河AI路由器通过提升网络吞吐率并保证智算业务的传输可靠性,确保推理体验不下降,达成推理数据不出域目标;在协同训练场景中,RDMA流量从DC内走向广域,面临广域时延和丢包的挑战,通过部署星河AI路由器,智算流量在传输过程中全程可视可管,保障流量在智算网络中高效传输和安全性,实现千公里0丢包和不同DC跨广域网的全局协同调度。面向AI WAN的智算IP广域网方案已经在上海电信城域智算POD完成了现网验证,该方案有效将网络整体运力提升7倍,并保障拉远训推算效不下降。
最后任广涛表示,华为将持续完善面向AI WAN的智算IP广域网方案内涵,加速算力资源在运营商和企业侧高效流转,并和运营商一起为行业数智化转型提供网络支撑,推动AI技术的普惠化进程。