移动平台
`
2019/9/19 12:37
基于昇腾910:华为再发两款业界最强AI产品
0
0

C114讯 9月19日午间消息(蒋均牧)紧随第一天的全球最快AI训练集群Atlas 900,华为在其年度全联接大会(HC 2019)上再发两款基于昇腾910处理器的“最强”产品。

其一是业界最强AI训练卡Atlas 300,可提供256 TFLOPS的算力,是当前业界主流训练卡的2倍,每秒训练的图片数量从965张提升到1802张。它支持100G RoCE直出高速接口,可实现梯度参数和数据集并行传输,最高可降低70%的梯度同步时延,支撑集群训练时间缩短到秒级。

其二是业界最强AI训练服务器Atlas 800,4U空间集成了8颗昇腾910 AI处理器,可提供2 PFLOPS的超强算力,算力密度是业界同类产品的2.5倍。Atlas 800仅重75千克,重量不到业界同类产品的一半,内置32个硬件解码器,每秒可完成16384张1080P图片解码,是业界主流产品处理能力的25倍,而且可以与训练并行处理。它还支持风冷和液冷散热,可满足企业数据中心和集群高密部署两类场景,单机能效比为业界同类产品的1.8倍。在华为松山湖的数据中心中已经部署了采用全液冷散热的Atlas 800,单机柜的散热能力高达5万瓦。实际上Atlas 900就是基于Atlas 800组建的。

华为现已完成了Atlas全系列产品布局,覆盖云、边、端全场景,面向训练和推理提供强劲算力。基于统一的达芬奇架构和全场景AI计算框架,可实现云边端协同,加速全行业的智能化再造,华为公司高级副总裁、Cloud&AI产品与服务总裁侯金龙表示。

另据C114了解,华为8月23日正式发布了算力最强的昇腾910。这款芯片基于达芬奇架构,半精度(FP16)算力达到256 Tera-FLOPS、整数精度(INT8)算力达到512 Tera-OPS,达到规格算力所需功耗仅310W、明显低于设计规格的350W;在典型的ResNet50网络的训练中,昇腾910与MindSpore配合,与现有主流训练单卡配合TensorFlow相比显示出接近2倍的性能提升。

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销