C114通信网  |  通信人家园

新闻
2021/9/25 18:07

浪潮王昭峰:智能网卡选择FPGA+CPU架构

C114通信网  南山

C114讯 9月25日消息(南山)随着应用性能高要求和虚拟交换机性能限制的矛盾日益突出,使用智能网卡来代替传统网卡,成为ICT行业的研究热点。浪潮作为国内领先的服务器供应商,其对智能网卡的研究和应用值得业界关注。在今日举办的“2021中国智能网卡研讨会”上,浪潮数据中心网络市场总监王昭峰介绍该公司智能网卡产品的创新和实践。

王昭峰首先判断,云计算的两大特性是虚拟化和资源池化,智能网卡则加速了基础设施的虚拟化和资源池化。随着数据中心内部数据和带宽的爆炸式增长,传统软件实现虚拟化以及数据处理的方式遇到了一系列问题。智能网卡的出现,将网络、存储以及安全任务从CPU卸载到了硬件进行加速,解决了在大带宽场景下CPU的消耗以及延迟和抖动等问题。

目前,市场上主流的智能网卡硬件形式主要有四种,NP架构、通用ASIC架构(内嵌ARM)、FPGA+SoC架构、SoC和定制化ASIC架构,产品形态包括单卡、双卡、OCP卡。王昭峰认为,几种架构没有优劣势区分,差异在于性能可编程、功耗和成本之间的平衡,客户基于这几个方面的需求做选择。

浪潮在智能网卡解决方案上选择了FPGA+CPU架构。“为什么选择这个方案?一是高性能,FPGA提供了接近ASIC的处理能力。二是软硬件全可编程,产品设计更灵活,更能满足客户业务的实际演进。”王昭峰表示,浪潮将IO设备硬件虚拟化,在网络、存储、安全方面做到了硬件加速卸载,客户也可以基于智能网卡逐步去做管理平面卸载。

王昭峰说,虚拟设备硬件化带来两个问题,第一个如何管理虚拟化设备,二是热迁移。

浪潮一是SR-IOV引入了两种PCIe的Function,即PF和VF,通常对应着裸金属和虚拟机的应用场景。在虚拟机场景下,VF的配置和管理由VMM完成,Guest OS需要支持VF的动态热插拔;在裸金属场景下,PF的配置和管理由网卡SoC上管理程序负责,Host OS需要支持PF的动态热插拔。

二是基于VDPA的热迁移方案优化,在感知硬件设备状态上,VDPA控制和数据平面分离,在监控设备状态同时,提升转发性能。在迁移过程中跟踪脏页,采用网卡硬件监控DMA页的跟踪,避免Host软件处理引发迁移过程中的性能下降。

王昭峰还谈到了智能网卡与服务器的适配。智能网卡是大server的“小server”,拥有一套小系统,如何管理适配,体现在四个方面:供电、监控、管理、测试

供电方面,小于75W的智能网卡,采用金手指方式供电;大于75W的智能网卡,采用金手指+外接电源的方式供电。

监控方面,智能网卡是个独立运行的小系统,需要像管理服务器一样,监控整个网卡的硬件状态,记录异常日志、诊断分析故障、以及远程固件升级等。浪潮采用独立的BMC监管设计,既可以解决监控管理需求,又可以避免服务器侧的软硬件修改。

管理方面,智能网卡和服务器的管理拓扑分为两种:内部互联和外部互联。内部互联,通过UART、金手指的I2C以及NCSI,Host BMC与网卡BMC互联,两者为主从关系;外部互联,通过网卡和服务器的网口互联,Host BMC与网卡BMC相互独立,分开管理。

测试方面,浪潮开发服务器时会引入多品牌智能网卡,因此总结了一套完善的硬件功能测试和软件功能测试规范,包括基本功能、卸载功能、自定义扩展功能、应用测试、兼容性测试等。

最后,在智能网卡的应用实践上,浪潮一方面是配合浪潮云探索虚拟机和裸金属虚拟化方案,另一方面是在数据中心网络应用探索。王昭峰指出,带宽增长将在达到51.2T后逐步放缓,届时网络诉求会发生变化,从以带宽为中心到以延时为中心。浪潮结合智能网卡以及网络设备,通过状态可视收集实现数据中心可视化方案,包含了业务流量、虚拟网络以及物理网络,通过动态感知调整网络参数。

给作者点赞
0 VS 0
写得不太好

版权说明:C114刊载的内容,凡注明来源为“C114通信网”或“C114原创”皆属C114版权所有,未经允许禁止转载、摘编,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。编译类文章仅出于传递更多信息之目的,不代表证实其描述或赞同其观点;翻译质量问题请指正

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2021 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141