今日,在华为全联接大会2025期间举办的数据存储峰会上,华为公司副总裁、数据存储产品线总裁周跃峰博士发表主题演讲。他表示,Agentic AI正驱动存储范式改变,数据存储在AI时代将扮演更加重要的角色,在AI语料库、AI训练、AI推理等场景迎来全新发展机遇,推动未来新型AI Data Platform加速构建。
华为公司副总裁、数据存储产品线总裁周跃峰
当下,全球正处于存储产业发展的黄金时代。AI正在从Generative AI(生成式AI)迈向Agentic AI(智能体AI),数据升级为“语料库+知识库”。同时,AI行业化落地加速,AI已经进入医疗、科研等生产核心领域。
但与此同时,企业在AI落地过程中仍面临严峻挑战:数据留存率不足3%、数据共享率不足25%,大量数据被封闭于“孤岛”之中;AI模型训练中,算力有效利用率不足50%;AI推理中,长序列推理用户体验持续恶化。因此,数据存储作为AI时代的关键角色,需要从多个方面持续创新、不断进化:
建设AI语料库:数据从分散利用到多维融合,AI数据湖是必由之路
高质量语料库是AI大模型好用、易用的前提和“教材”。各行业需持续加大数据资源的汇聚和保存,推动数据底座从烟囱式向AI数据湖演进,以实现多模态语料高效汇聚、按需流动。崖州湾国家实验室通过整合基础语料库、大豆/玉米/生猪专题库等多个数据集,并依托数据湖存储、统一数据视图,打造精准育种技术体系,加速育种周期。
提升AI训练效率:从传统存储升级到超高性能AI存储,以存强算
AI训练中断频发是困扰行业的大难题。据统计,AI训练中心持续训练的时间最长仅为2.6天,导致GPU/NPU必须反复保存CheckPoint数据。科大讯飞通过部署华为OceanStor AI存储,集群最大提供TB级带宽,将断点续训恢复时长从15分钟缩短到1分钟。
优化AI推理体验:推理记忆池化存储管理,基于历史推理数据进行推理加速
正如人类依靠记忆快速反应,AI同样需要“记住”历史推理过程,来提升响应速度与准确性。华为UCM(Unified Cache Manager)推理记忆数据管理器,可将不同热度的记忆数据分层池化存储,并结合信息浓缩、智能联想等技术,在推理过程中动态调用历史数据,实现推理任务加速。该方案已在国内头部金融机构部署,可在10秒内精准识别客户高频问题,显著提升服务质量。
未来展望:Agentic AI驱动存储范式改变,构建新型的AI Data Platform
迈入Agentic AI时代,数据存储不再局限于存数据,而是升级为存知识和记忆,AI Data Platform作为企业走向智能Agent的数据平台应运而生。其中,存储可提供多样化新型服务语义与数据接口/框架,实现数据直通访问;通过Unified Cache多级缓存提升AI推理体验;构建多模态知识库与记忆库,支持实时知识生成和多模知识检索,全面提升Agent智能化水平。
过去三十年,数据存储始终是高价值数据的最佳底座,伴随数据应用的发展而不断进化。周跃峰表示,面向未来,数据存储将在AI时代承担更加关键的角色、与AI技术同频进化。华为愿与产业同仁携手,共迎AI时代数据存储产业新机遇。