C114通信网  |  通信人家园

专题
2024/5/7 17:28

智算中心高性能网络流量调度技术研究及实践

邮电设计技术  韩博文,徐博华,曹 畅,刘千仞

本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部

摘要:AI大模型训练、高性能存储等业务应用场景提出了海量规模的计算需求,与传统数据中心业务相比,在流量模型和网络需求方面有着显著区别,驱使传统的数据中心网络向智算中心和无损网络转型。从智算中心和无损网络的发展背景入手,分析了当前智算中心网络存在的问题,探索了智算中心网络流量调度的关键技术,并进行了流量调度平台的研发实践,为智算中心网络发展和应用提供思路。

关键词:智算中心;无损网络;大模型训练

doi:10.12045/j.issn.1007-3043.2024.04.003

概述

1.1 智算中心发展现状

智算中心与传统数据中心在建设目的、应用领域和主要特征方面存在显著差异。在建设目的方面,传统数据中心主要致力于提供 IT 资源支持,包括计算、存储和网络等基础设施服务。其设计核心在于支持企业日常运营、业务处理和信息系统托管,确保数据安全存储及业务连续性。相较之下,智算中心不仅提供基础数据存储和处理能力,更专注于智能计算领域,特别是针对人工智能算法的训练、推理和大数据分析等复杂计算任务。智算中心的目标是推动各行各业的数字化和智能化转型,促进产业 AI 化和 AI 产业化。在应用领域方面,传统数据中心广泛应用于各类企业和组织的信息系统,如企业资源规划(ERP)、客户关系管理(CRM)、数据库服务和内部办公系统等,覆盖范围广泛,但主要集中在传统行业。而智算中心主要服务于人工智能、机器学习、深度学习和自然语言处理等领域,满足新兴智能化应用的需求。在主要特征方面,传统数据中心主要提供基础设施即服务(IaaS)、软件即服务(SaaS)和平台即服务(PaaS),包含大量标准化的服务器、存储设备和网络设施,但通常不针对高性能或异构计算进行优化。其运维和管理相对独立且为静态的,资源扩展性受限,灵活性和自动化程度因技术和管理水平而异。相反,智算中心主要提供任务式服务(TaaS),强调计算性能和能效比的高度优化,以 GPU 为核心的智能算力,具备大规模存储和高速数据处理能力。智算中心在结构上更倾向于模块化和弹性扩展,同时需具备自动化和智能化的运维能力。

点击查看全文(PDF)>

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141