♦ 项目单位
中国电信股份有限公司北京分公司
♦ 项目背景
近一年企业算力需求年均增长率超过40%,尤其在AI融入核心生产后,训练和推理算力需求显著增长,但企业机房条件限制,自建算力难以满足长期算力需求。很多企业倾向于租用算力以降低初始投资和专业服务,以租代建成为企业首选。租赁算力时企业数据出域的安全性是需要考虑的关键因素。算力灵活扩容和数据安全是企业租用算力的TOP关注点。传统承载网络难以满足业务算力下沉带来的快速接入和东西向流量增长需求及不同业务差异化的SLA要求,网络丢包会直接导致算效显著下降,甚至造成训推业务中断、服务不可用。
♦ 技术方案
北京电信基于新城完成智算广域网基础设施承载,面对全市高新产业的用算诉求,通过云边协同分布式训推解决方案解决企业用算要求,解决用算企业/行业数据安全不出域、算力灵活扩展、海量数据快速传输等关键需求。方案有几大优势:(1)企业侧轻量化部署,算力扩容快:企业侧只要部署小算力如训推一体机,满足企业AI应用需求,基于业务算力灵活扩容,应对推理/训练算力需求。相比自建智算池综合成本更优。(2)广域RDMA无损网络:高吞吐高弹性的广域无损网络,可提供差异化SLA保障算网一体服务新模式。(3)训推数据安全,通过模型分层部署,云边协同,网络中只传递梯度值保护隐私。

♦ 创新点
在网络解决方案创新方面,升级的智算广域网具备原生算力业务高效承载的能力,通过Spine-Leaf的Full-Mesh组网优势以及SRv6和FlexE+Flex-Channel切片等IPv6+核心技术,实现了企业到智算中心的租户级小颗粒租户级切片,实现无阻塞快速转发和带宽的弹性调整。当网络中发生拥塞,智算路由器以租户级为粒度对拥塞报文进行缓存,超过缓存水线时以租户粒度向上一跳网络设备发生反压信号,直至到流量发送节点,从而保障租户级的网络拥塞不丢包,实现了超百公里RDMA无损传输。
在技术创新方面,融合了IPv6+与AI的前沿新技术,网络通过RDMA无损、SPFC拥塞控制以及量子加密等,配合智算创新将模型分层切割在智算广域网络上只传高维向量,保证原始数据不出域。

在算力模式创新方面,整合AI中台、网络运力、存储与算力资源,提供算力+网络的一体化服务,实现四个一落地:国内首个医疗行业 "边云协同分布式算网" 方案落地案例!卫健行业首个 三甲医院"AI中台+智能体平台" 落地 ,首个 "国家中心研究专病库+专病协作网络与国内首个"公立医院运行管理大模型" 。向上游延伸激活智能算力、新一代网络等技术创新,向下游拓展形成垂直行业算网一体服务。

♦ 应用效果及推广前景
在商业应用方面:北京电信将医院推理及训练模型训练任务拉远至240公里外的武清智算中心,通过分层部署与无损网络保障,实现算效损失小于5%。全程数据不出医院园区,实现三方算力出租最高等级安全和弹性扩展,有效降低企业用算初期成本。
改方案通过弹性机制降低企业用算的边际成本,北京电信依托成熟的网络基础设施,可为首都央国企、政教医工提供算力专网,让算力随取随用",全面提升数字经济时代产业核心竞争力。 








































