本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘要:随着人工智能的快速发展和应用,传统的数据存储方案在容量、性能和可扩展性方面难以满足智算数据中心的需求。分析了大规模智算数据中心训练推理各阶段对存储的需求,结合现网数据存储架构能力,提出一种新的数据存储解决方案,以满足智算场景对数据存储容量、性能和成本的要求。
关键字:人工智能;数据存储;并行文件系统
doi:10.12045/j.issn.1007-3043.2026.02.012
概述
近年来,人工智能快速发展,特别是以Sora为代表的大模型的出现,能够从文本、图片、音频、视频等多模态数据中进行训练学习,进而生成长时间高质量的视频,预计将带来几何倍增规模的人工智能算力需求。各种新兴应用场景和随之而来的海量数据对数据存储系统的容量、性能、可靠性和数据流动性等方面提出了更高的要求。为承接上述爆发式增长的算力需求,运营商正加速布局大规模智算中心。数据存储(即存力)作为与算力、运力并列的三大核心能力之究课题 。
研究智算中心数据存储方案是为了满足大规模智算中心算力对海量数据存储和处理的需求,同时提高数据存储方案的可靠性,进而降低智算训练中断的概率,保障智算训练服务器平稳高效运行,提高投资产出效益。
由于应用场景繁多,不同场景对数据存储解决方案的要求也存在差异,本文将从运营商智算数据中心大模型训练推理业务入手。分析数据存储面临的挑战。并提出可行的数据存储解决方案。








































