C114通信网  |  通信人家园

 
2021/10/27 14:49

中国科学技术大学与华为联合发布基于Open MPI的在网计算联创成果

厂商供稿  

近日,在广东珠海举行的全国高性能计算学术年会(CCF HPC China 2021)上,中国科学技术大学与华为联合发布了基于Open MPI的在网计算联合创新成果。

图片1.jpg

基于Open MPI的在网计算联创成果发布现场

Open MPI是当前高性能计算领域广泛使用的一个消息传递接口(MPI: Message Passing Interface)库项目,用于高性能计算集群中服务器间通信,被广泛应用于天气预报、加密技术、流体力学、天体物理学、粒子动力学(交互作用计算)、模式匹配(DNA比较、图像处理)等各领域的计算任务,在业界具有广泛的使用基础。

传统的超算集群,网络仅用于计算节点之间互联,整个计算过程以计算节点为中心。当多个计算节点一起参与通信时,会有通信步骤多,通信效率低等问题。在网计算技术是当前高性能计算(HPC)和人工智能等领域的前沿课题之一,将部分计算卸载到网络中,实现计算时延与服务器数目无关,可以有效地降低时延,提高通信效率,从而缩短计算任务的完成时间。

中国科学技术大学与华为联合开展基于Open MPI的在网计算项目合作,联合研究针对高性能计算场景的应用加速技术,中国科学技术大学完成基于Open MPI的方案设计和开发,华为在网络设备端完成在网计算方案的设计和研发,联合研究成果基于Open MPI良好的应用生态,为高性能计算领域带来了一个针对时延敏感型计算任务性能提升的服务器端与网络端协同的方案,可有效提升计算业务性能。

本次联合研究成果在中国科学技术大学超级计算中心的高性能计算集群中使用,经过验证,运行OSU MPI Benchmark性能提高了30%。

中国科学技术大学是以前沿科学和高新技术为主的重点大学,华为是全球领先的信息与通信基础设施以及智能终端提供商,也是技术创新头部企业,双方的合作将对超算产业的发展发挥重要意义。双方领导肯定了这一突破性的合作成果,并将成果开源到社区,希望在先进的技术和开放的生态下,共同为企业和用户提供更加丰富的产品,实现产业合作共赢。

图片2.jpg

华为数据中心网络解决方案总监张磊

发表“超融合数据中心网络,新以太释放新算力”主题演讲

在此次HPC行业盛会的华为论坛上,华为数据中心网络解决方案总监张磊表示,当前云数据中心正在向算力中心迈进,业务驱动网络技术融合。”单位能效算力””算力的确定性供给”成为算力网络核心指标。华为超融合数据中心网络CloudFabric 3.0攻克了传统以太网易丢包难题,通过智能无损、在网计算等技术创新,基于全无损以太架构可打破传统通用计算、存储和高性能计算三套网络架构的限制,最大化实现数据的无障碍流动,有效提升算力能效比,并实现整网全生命周期自动化和智能运维。经权威第三方机构Tolly专业测评,华为超融合数据中心网络相比IB网络,性能最高可提升17%。

图片3.jpg

中国科学技术大学计算机学院教授、超级计算中心主任李京

发表“现代高性能计算的网络需求及开源MPI优化成果分享”主题演讲

中国科学技术大学计算机学院教授、超级计算中心主任李京认为,高性能计算网络目前的痛点是如何兼得低延迟和高带宽以及如何针对目标场景(高性能计算、存储网络、异构计算/AI网络)的特点进行网络优化。目前中国科学技术大学以VASP和OpenFOAM的典型算例为研究对象,针对流量特征,优化了开源的Open MPI软件。下一步中国科学技术大学将结合应用流量特征进一步对拥塞控制进行优化以及针对高性能计算网络的建设进一步研究,比如异构计算网络及针对多校区异地高性能组网的实现等。

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141