Deepseek加速行业推理应用,面向企业算力租用以及推理数据不出园区的用算需求,上海电信基于“智云上海”新型基础架构,部署华为星河路由器打造400GE IP智算城域POD,提供分布式云边协同推理方案,加速算力资源在运营商和企业侧高效流转,降低企业的AI使用门槛,推动AI技术的普惠化进程。
随着数字经济时代全面开启,算力正为各行各业的数字化转型注入新动能。各个企业加速行业推理应用,以央国企,政教医等多行业为代表,85%的训推算力需求通过租赁运营商的算力资源来满足。由于企业私有数据敏感,要求数据不出园区,越来越多的企业要求租赁的算力资源部署在园区内部。但受限于散热和供电等条件等限制,园区内部无法规模部署算力服务器,整体承载算力有限。上海电信打造的400GE IP智算城域POD成为联接企业园区和运营商智算中心的数字底座,云边协同训推方案为企业提供高品质算网一体服务,该方案具备如下亮点:
云边协同推理,分布式推理效率不下降: 为了匹配推理算力快速增长的需求,企业优化推理模型部署,将模型部分Prefill层部署在本地算力服务器,将Decode层部署在运营商智算中心的推理池内,本地算力和云端推理池通过智算广域网来传输不可还原的中间数据层,保护企业敏感数据不泄露。分布式推理模式一方面满足企业数据传输安全的诉求,另一方面企业可以灵活租赁运营商的推理算力资源来应对推理需求的变化。经现网测试验证,智算广域网络提供的RDMA无损传输技术实现基于DeepSeek跨240公里拉远推理效率不下降。
RDMA无损传输,模型拉远训练效率不下降:部分行业客户采用基础大模型叠加私有行业数据进行二次训练和模型微调,企业将私有行业数据部署在园区,租用运营商智算中心算力卡进行存算分离拉远训练。智算业务传输采用RDMA协议,协议本身对丢包率的敏感度提升了1个数量级,千分之一的丢包导致模型训练效率下降50%。智算IP城域POD里每台路由器能够深度识别RDMA报文,通过千万流秒级调度以及流级精准流控技术实现广域RDMA无损传输,跨百公里拉远算效不下降。
400GE弹性算网,模型快速部署:企业在运营商智算中心完成模型训练后,需要将模型快速部署在企业指定的推理池内。传统基于数据拷贝加硬盘快递的线下模式,模型搬运周期长,并且在运输过程中存在丢失损坏的风险。智算IP城域POD支持100M-100G弹性专线实现TB级数据分钟达,实现数据模型敏捷部署。
面向未来,上海电信携手华为继续完善云边训推一体的方案内涵,基于面向AI WAN的智算IP广域网方案,为企业内部以及各行业、各领域的数字化、智能化转型提供强大动力,在新时代的竞争中抢占先机,实现可持续发展。