C114通信网  |  通信人家园

资讯
2024/12/25 10:14

北京电信打造高品质智算广域网,百公里无损联算服务首都新发展

C114通信网  

在由中国信息通信研究院主办的智算IP广域网产业交流会上,中国电信股份有限公司北京分公司(以下简称“北京电信”)云网发展部规划总监姚凌分享了“打造高品质智算广域网,百公里无损联算服务首都新发展”的演讲。姚凌表示北京电信通过智算广域网将京津冀三地算力中心资源整合,探索多算力中心协同完成超大模型训练的多点共算新模式。采用新型流级拥塞控制,无损调度和深度负载均衡智算广域网技术,保证网络传输吞吐率95%以上,从而实现跨智算中心算效不下降,高效服务人工智能产业发展需求。

图片 1.png

算力需求每年增长10倍,运营商规划构建万卡集群,协同完成超大模型训练。受供电、机房环境等因素限制,单智算中心物理环境不满足万卡集群的建设需求。通过广域网络联接跨几百到上千公里的异地算力中心,会面临两个关键技术点挑战: 一是跨DC大模型训练极端情况流量瞬时并发达上千Tbps,需要考虑收敛比和训练效率之间平衡最优比。二是RDMA长距传输对于丢包十分敏感,千分之一丢包会导致网络吞吐率下降,影响算卡效率并造成资源浪费。

北京电信通过新一代智算路由器打造智算广域网,采用新型流级拥塞控制技术,可精准快速识别网络发生拥塞或故障,并基于流进行拥塞控制,确保拥塞不扩散到全网。同时采用路由器广域无损调度和负载均衡技术,避免数据丢包导致算卡计算效率下降,现网实际验证跨100公里长距算效仅降1%。

姚凌表示北京电信后续将持续探索多DC协同技术研究,目前正在联合云公司开展智算拉远四阶段验证。基于息壤慧聚智能模型服务平台,验证百川等真实客户模型拉远效果,逐步推进智算拉远方案走向商用。

给作者点赞
0 VS 0
写得不太好

  免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2025 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141